一、复杂数据统计方法怎么样
这是一本200+页薄书,但是介绍的内容却很多,很多书上一句话的东西,可能别的书上要用几页介绍。所以读该书需要参考其他书,遇到不懂的就去查。 顾名思义,该书介绍的复杂数据统计方法,作者当然假设你会“简单”数据的处理。最好会一些R语言的知识。会读的稍微轻松些。 作者先从一个例子开始,公路一氧化碳数据,先用普通最小二乘,然后用逐步回归,一步一步的介绍自己的研究思路,我觉得这是非常难得的,很少有作者在书中介绍自己的思路的,仿佛结果是“显然的”。 做完回归后,作者发现虽然残差的Shapiro-wilk检验不能拒绝残差来自正态总体,但是从QQ图上看,残差很难说是正态的。(不知道什么是Shapiro-wilk检验,QQ图的赶紧查其他书了)。 通过研究变量关系发现,CO和traffic可以认为有线性关系,CO和Hour有类似sin曲线的关系,CO和Wind关系更加复杂。 然后作者联想到可以通过谐波分析,用有穷Fourier级数来代表时间序列 并且把traffic 和 wind的二次和三次项都包含到模型中(这当然是一个偏大的模型)。通过一步步的分析,最终得到一个“合适”的模型。 后面都是介绍当某些假设不满足时(我刚看,还没看完呢),我们可以用某某方法来解决,也是一步一步的,发现问题,给出方法。我自己觉得,对我自己来说,知道什么时候用什么方法,我就觉得可以了,如果不满足,可以找找资料,看为什么这些方法是对的,更进一步,问问自己,这些方法是如何想到的,弄清楚后,会成大牛吧?
二、乱世佳人适合14~16岁的中学生看吗?
我觉得不是太适合,虽然那本书很经典,我也超级喜欢。因为中学生的世界观等都还没有成熟,可能不能更好的理解书中真正要表达的意思。我20岁的时候初次看都觉得难以认同斯佳丽,觉得其人为达目的,不择手段。而且书中对南北战争的描述并不一定符合历史的真实。
三、正态性检验哪些方法?
1、偏度检验
使用偏度检验时,总体具有仅在偏度方向上偏离正态的先验信息。因而备择假设为
检验统计量为
当总体服从正态分布时,
的极限分布是
因此水平为 α检验的拒绝域为
这里是标准正态分布的分位数。
2、峰度检验
使用峰度检验时,总体具有仅在峰度方向上偏离正态的先验信息。因而备择假设为
检验的统计量为
当总体服从正态分布时的极限分布是
因此水平为α检验的拒绝域为
或
3、偏度和峰度联合检验
使用联合检验的条件为: 总体具有在偏度和峰度方向上都偏离正态的先验信息,它的备择假设为
首先计算统计量
的值,然后根据该统计量的极限分布自由度是2 的
分布,所以水平为 α检验的拒绝域是
,其中
是自由度是2的
分布的
分位数。
扩展资料
正态性分布检验分类:
分为定性分析、定量检验,定性分析通过观察P-P图、Q-Q图以及箱线图和茎叶图;定量分析方法比较多,常用的有Shapiro-Wilk检验(W检验)、Kolmogorov-Smirnow检验(D检验)以及峰度和偏度检验。
正态性检验问题为:
H0:总体服从正态分布
H1 : 总体不服从正态分布。
在正态性检验中,偏度峰度正态性检验统计量原理清晰、计算简单,通常被首选用来作为正态性检验统计量。
参考资料来源:百度百科-正态性检验
四、如何用R语言将非正态分布数据,校正为正态分布
p>0.05为正态,反之非正态,可以用BOX-COX转换,路经:stat---control charts---box-cox,在options里的store transformed data in 那栏填入你想把转换后的数据存放的列。