写于 2018-11-21 11:08:00| 无需申请自动送彩金| 娱乐
昨天根据最近的美国国家科学院论文报告,杰夫卡明的文章认为,“零假设显着性检验”(NHST)是有缺陷的 - 他是正确的但他指责指责错误的方向NHST的问题有几个层次 - 第一个问题是,NHST的名字应该没有任何内容,英国生物学家和统计学家Ronald Fisher设计了一种称为“显着性检验”的方法,将数据提炼成一个统计数据,代表其程度。数据与零假设不一致(零假设通常没有影响)该统计数据是费希尔没有发明p值的p值,但是他1925年出版的“研究工作者统计方法”一书将p值推广为证据指数反对零假设仅在1933年,两位统计学家发明了“假设检验”:波兰人Jerzy Neyman和英国Egon P最初由许多人(包括费舍尔本人在短时间内,根据雷曼所说)认为,他们的框架是费舍尔重要性测试的发展,这一错误在今天仍然存在,也许是因为这两种方法共有几个行话术语令人困惑的是,巧妙地采取微妙或明显不同的含义这些方法的目的不同:Fisher的显着性检验的乘积是p值,Neyman-Pearson假设检验的结果是接受或拒绝假设的决定换句话说,当Neyman避免错误时,Fisher从证据中做出推论(Pearson最终撤回了对Neyman和Pearson框架的全有或全无版本的支持)。有人认为这些方法中使用最广泛的变体是两者的混合“ Null假设显着性检验“是这种混合体的完美名称尽管它的用途广泛,但是混合物功能失调它既不保留F的证据方面Ney的p值和Neyman的方法所承诺的错误率的控制德国心理学家Gerd Gigerenzer称之为“混杂”基本上,NHST不应存在下一级问题涉及对p值本身的有用性和可取性的看法许多论文对此提出质疑p值的效用及其作为证据指标的有效性,有些具有有趣和尖锐的标题,例如p值和证据的不可调和性,或者说不可能的:p值,证据和可能性他们的真理有一个真实的核心。参数,但这个事实是在Neyman-Pearson假设检验或混杂的P混合P值的范围内评估的论证可能不是证据的数值测量,但它们确实与它有关.p值越小从显着性检验来看,反对零假设的证据越强,证据越有利于参数值接近观察到的va lue实验中的样本量越大,观察到的参数值越接近任何给定p值的参数的真实值这两种关系都不会让任何有经验将其实验数据转换为p值的人感到惊讶显着性检验然而,还有更多,因为显着性检验中的每个p值指向似然函数。似然函数显示证据的强度以及该证据如何有利于感兴趣的参数的不同可能值p值之间的关系(以及它们的样本大小)和似然函数是一对一的,所以ap值作为似然函数的索引或数字摘要正如摘要总结了一篇研究论文而没有包括它的所有细节和丰富性,ap值代表证据,尽管只是一个总结p值和似然函数之间的联系并没有被广泛认可,鉴于可能性本身通常在统计文本中缺失,因为卡森的文章作者文章的作者瓦伦·约翰逊(Valen Johnson)基于嘲笑“贝叶斯因子”,这是数据集中证据量的指标。应该改变理性观察者对竞争假设的真实性的看法 他表明,p值与从相同数据中获得的贝叶斯因子之间的关系是非线性的,并得出结论p值通过大幅夸大它来歪曲证据,正如其他人之前所做的那样因为传统的p值截断用于声明混合NHST程序中的“统计显着性”代表了一种较低级别的证据,而不是他认为该方法的普通用户会认为是,Johnson总结说应该要求更严格的截止但是,Johnson使用的贝叶斯因子仅仅是似然函数中两点的比率,与p值索引的相似似然函数!整个似然函数比单点贝叶斯事实更具信息性,因为它比p值汇总更具信息性,重要的是,它支持效应大小的区间估计,以Geoff Cumming批准的方式更严格的标准声称“意义上的“在混杂的混合框架中并不是对科学推理更好的统计支持需求的合理回应我们不需要丢弃p值来开始使用我们数据的证据意义 - 我们只需要了解他们的属性需要改革是:最重要的是,我们需要测量推理与任何p值或似然函数一起使用:统计数据只能提供有关证据的原则论证的一部分进一步阅读:p值的问题:它们有多重要,真的吗?

作者:单于耢