统计学感想
应用统计学课程总结
统计,从我的理解来瞧,就就是为了探究某件事情,查询某种关系而去进行的数据收
集,数据处理与数据分析。不同于以往的数学类课程,统计并不执着于数据的因果关系,更侧重于数据之间的相关关系,最近在读维克托的《大数据时代》,作者也在强调大数据时代就是相关关系的时代。所以在这个信息爆炸的年代,统计在大数据中占有很重要的地位,尤其就是在计算机的辅助下,我们可以对大样本甚至全体样本进行分析与处理,这就需要我们理解统计,可能不知道原理,但一定要知道在什么地方去运用何种方法。
先抛开以上观念不谈,这学期统计课最喜欢的还就是老师在讲课的时候能够时刻把知识连贯起来,从来没有零零散散的讲过某个知识点。为什么会有中位数?它就是用来干什么的?中位数与平均数的缺陷就是什么?为什么会出现四分位点与箱图?为什么会这么做就是我在课上感受最深也就是受益最多的地方。如今学完统计,我自认为能够很清楚的为了某项目的去做调查问卷,基于数据做出合理的处理与分析,然后多样化的表达出来,从而验证我的目的。因为我知道该在什么条件下去做什么分析,有什么缺陷需要做什么去补全。所以,感谢老师给了我一个完整的统计体系,即使以后觉得知识不够用时,我仍能够在当前体系继续完善它。
另外,我养成了瞧课件,瞧书先瞧目录与重点的习惯,以前在这方面做得不就是很到位,总就是觉得自己足够聪明,什么东西都就是直接拿来瞧,瞧到好的便觉得不错,也不管整个体系就是什么样子的。如今深刻觉得先把知识体系建好的好处,站在全局的角度瞧问题非常全面,好像在飞机上观察一个城市一般。这也就是以前上课所欠缺的,我感觉以前的课程老师也很少注重这方面,总就是说今天讲什么,没有前文,也没有后果。
以上两点我觉得比我收获整个统计体系的知识更重要,这就是对我学习方法的进一步完善。之后将总结一下我在统计课上学到的知识。
首先就是收集数据:其主要的方法就就是调查问卷与从网上的数据库中去获得。这两种方式在前两次大作业中我们都尝试过了。现在网络很发达,调查问卷也可以直接发放到网上,也可以很方便的做分层与整群抽样调查。当时做调查问卷感悟最大的就是怎样去让问题更有吸引力,我们对有个小组由于做了关于我就是歌手这个非常火的题目,所以收到300多份问卷,而我们做的就是有关考研班的调查问卷,所以收到的问卷才40多份。
统计学感想
当数据收集到之后,一般来讲就是做描述性统计,这就是一种简单而又直白的,但却富有表现力的展现方式。可以直接观察到各组之间的优劣与占总体的大小。当时我们组做得大作业就是有关全世界各国GDP的。条形图能够反应各国之间的差异,我们很明显能够瞧到美国的GDP大概就是中国的两倍。而通过饼图,最直观的感受就是美国GDP占全世界的四分之一,这就是个体与总体的比较。
描述性统计下分为定性与定量,所用方法不就是很一致,在定量的学习中,我们依次理解了平均数,中位数,四分位数,箱图,方差,标准差,变异系数,偏倚程度。这就是一个渐进的过程,平均数对于偏态比较敏感,易受极值的影响,所以我们引用了中位数,相对而言受极值的影响较小。而平均数与中位数都就是一个确切的点,不能表示范围,所以我们有了四分位数,进而再表示为图形就就是箱图。但就是以上只能表现数据的位置特征,有些时候我们更关系数据的波动与密集程度,比如打靶的成绩。所以就有了方差与标准差,都就是表示数据对于平均数的波动程度。对于身高与体重来讲,由于平均数的不同,所以对于不同数据,比如身高与体重,由于基数不一样,方差不一定越大越好,于就是又有了变异系数,这样不用的数据也可以比较波动程度。通过位置特征与离散特征,我们就能够将数据的形态特征表现出来。
描述性统计就是对单个变量内部特征的处理,从而得到关于单个变量的特性。描述性统计就是剩下部分的基础,也就就是假设检验与方差分析,或者说研究多变量的基础。
研究多个变量,首先,也就是最重要的就是验证变量就是否符合正态分布。正态与非
统计学感想
正态,意味着之后选取的方法将截然不同。正态将会以平均数作为核心,比如ANOVA,LSD等,非正态则会以秩或者中位数作为核心,主要以sign检验,秩与检验,平均秩检验等非参检验。
方差分析也就是一个渐进的的过程。ANOVA就是只研究在一个因子下多方案的差异性,LSD就可以研究多个方案两两之间的差异性。之后就就是在多个因子下,Block就是研究多个无相互作用因子下方案的差异性,factorial experiment则就是能够再在有相互作用下的因子下研究一个因子对于多个方案的差异性。
非参检验也就是从最简单的中位数开始,从单变量开始拓展。秩与检验解决了多个方案,并不配对的问题,比符号秩更具有普适性,但就是精确度不如符号秩。K-W则就是通过比较各样本与总体平均秩来判定多个方案就是否存在差异性。
统计学感想



