python时间重采样 大数据怎么入门学习好?

[更新]
·
·
分类:互联网
2490 阅读

python时间重采样

大数据怎么入门学习好?

大数据怎么入门学习好?

大数据入门首先要学习javase,掌握了javase之后,最好再学学javaee,如果不学的话,影响也不是特别大。接下来要学的东西就比较多了,主要是两块,一种是离线计算,以hadoop为主,一种是实时计算,以spark为主,当然大数据不是一两个技术的组合,而是一整套完整的生态系统,所以要学的东西还是很多的,大数据主要解决的是海量数据的存储和计算问题,建议还是把java学好,因为很多大数据的软件都是基于java编写的,所以入门大数据的话,建议先从java入门学习比较好!

应用统计专业是属于经济类还是数学类?

我们学校的统计专业是数学学院下属的专业,其实加不加上应用两个字都是一样的,就像大部分学校开设的所谓应用数学就是纯数学。那些专门开设统计学院的学校都是专业很强的学校啦,比如人大、华东师大。
从课程设置来讲,我们院统计专业在前五学期与应数或计算专业都是几乎一样的课程,主要就是数学专业基础课,数分、高代、常微分、复变、数值分析、信息论、概率论、实变、泛函之类的。学习的过程还是相当痛苦的,往往在啃数分高代的时候就有很多同学掉队了,就更不谈后面的实变泛函了。大三以后会接触专业课,比如数理统计、抽样技术、随机过程、时间序列、非参数统计、多元统计之类的。统计的专业课相比应数或计算要偏应用许多,跟微分几何拓扑抽象代数这样的课相比还是友好很多啦。
本科统计学的知识偏理论,但是还是浅尝辄止,大部分人还是会选择继续读书吧,因为三年的课程很少能对就业有帮助,如今读研也是大趋势。我们院每年大概有一半的人会选择读研或者出国,而绝大多数人会转行。但是转行并非容易的事,不仅要用大量的时间应付自己极难的专业课,还要用更多的时间精力、用非科班的方法去学习别人的专业课,是个不小的挑战。
这些年随着人工智能大热,应用统计开始也跟着热门。在机器学习与数据挖掘这些领域,应用统计专业的的确有很大优势,机器学习里的很多经典算法的理论都会在统计专业课学到,但劣势也很明显,编程能力以及计算机的理论知识会有明显不足。统计专业可能会学SAS,SPSS,Matlab,R这样的软件或编程语言,但是往往用得很少,也许学完一门课就不用了,但是编程能力,算法和计算机思维是需要长期的积累的。我周围有些成绩优秀的同学,面对一些简单的问题,比如模拟随机游走,实现某个书上现成的算法可能都有困难。所以,如果是应用统计专业,以后想走机器学习和数据挖掘方向的,建议要多编程练练手,比如实现书上的某个方法。说实话,自己用Python或R去实现聚类或者回归这样的算法,可比用SAS一个proc或者用SPSS这种傻瓜软件搞定有意思多了。