P值及其计算方法 科研论文中p值和显著性水平的关系

我们常常在科研论文的数据分析部分或者某些科普文章引用的资料当中见到涉及P值的统计学报表以及相关的显著性判断 。
【P值及其计算方法 科研论文中p值和显著性水平的关系】非专业读者看到这些关于P值和"显著性"的描述往往是一头雾水(如下表),大多略过,但实际上这些统计结果才是一篇论文中最准确直接的定性结论 。
了解了P值的含义和显著性的判定,可以帮助我们快速掌握科研论文中第一手研究数据的指向和意义 。

P值及其计算方法 科研论文中p值和显著性水平的关系

文章插图
P值往往涉及统计结果显著性的判定,因此我们得从显著性的概念说起 。本文将用通俗的文字来简介相关的统计学概念,并附上P值的计算方法 。
统计显著性和置信度
任何理论(或认识)都没法保证其关于现实的推测是100%正确的,这归因于理论永远都只是对现实世界真相的大致概括和特征提取 。理论只能无限趋近于真实,但无法达到真实 。人类利用的仅仅是越来越接近真相的理论而已 。
所以对于任何说法,都有一个可信度问题 。而通过对于现实的重复测试,我们将能够了解某个说法究竟有多可信,不同的说法之间是存在着可信度的差异的 。
这就像是盲人摸象之后,每个盲人说出的有关大象外形的可信度是有差别的,而且只要让盲人们多摸几次,他们对大象长相的描述会越来越接近真实 。
了解不同观点的可信度,是统计的目的之一 。统计中所谓的"显著性"就是可信度的一种指标 。
具有统计显著性的结果反映的是经过严格的测试得到的结果达到了一定可信度——专业术语叫"置信度"(又叫“置信水平”),它表明我们在多大程度上相信结论不会因随机因素而发生偏差 。
更具体地说,置信度是我们所持理论预测出来的结果在指定区间出现的可能性 。
显著性跟置信度的内涵异曲同工,但它们的表述方法刚好相反,且在应用中描述方式略有差异:
· 对于置信度一般我们会说"……实验结果落在某个置信区间的可能性可以达到多高……"(这个可能性越大置信度就越高)
· 而对于显著性我们会说"……我们的理论假设被否定的可能性小于多少,我们的假设就可以被称为显著或者极显著……"(这个可能性越小显著性越高)
也就是说,置信度通常是正面描述(拒伪的),而且通常需要与一个置信区间关联起来 。而显著性则是反面描述(拒真的),而且通常需要与一个预设的判断门槛值联系起来 。

P值及其计算方法 科研论文中p值和显著性水平的关系

文章插图
P值和零假设
统计学使用P值来代表前面提到的"理论假设被否定的可能性" 。
科学研究往往会选取与理论提出的假设相对的情况作为"证伪对象"——即尝试证实"这种与我的观点相对的假设"不大可能发生 。
这种用来当"靶子"的假设在统计学中被称为"零假设"(又叫"原假设",或者"虚无假设",通常用H0表示,英文Null Hypothesis),通俗地说即:靶子被打倒,研究即成立 。
所以,P值通常被用于在假设检验中描述某理论假设的有效性,通常理论的反面会被设为"零假设" 。
例如:我认为"读者阅读完本文的耗时大于10分钟",其零假设便是"……读完本文的耗时小于10分钟" 。因此我们只需要证明零假设发生几率相当小,那就可以说明我的说法是可信的 。反之,只要证明我的说法的发生几率大到某个程度也可以证明我的理论 。
但统计学上往往采用否定零假设的方式来断言某个说法的可靠性,而不是倒过来 。因为概率论认为"小概率事件"在单次测试时几乎是不可能发生的 。

推荐阅读