星辰指挥官_原创分享：为什么有人说大部分发表的科学研究都是错的？

+A -A

“p≈ap;ap;lt;005”、“同行评审”、“影响因子”被不少科学家成为科研界的三大牛皮癣，大家对他们怨声载道。不过和另外两个不同，p≈ap;ap;lt;0005可是自1925年诞生之日起就饱受诟病，从2010年开始不停又科学家开始对这个统计学中重要指标发起攻击。2015年时心理学杂志basid applied cial psychology（basp）就直接宣布我们再也不发表带p值的文章啦！然后basp的编辑在接受自然采访时表示：如果假设检验从所有科研出版物上消失那我会很高兴，但是我们还不知道可以用什么来取代它那么这个让人又爱又恨的p值（p vae）到底是个什么东西呢？p值的计算可以向上追溯到18世纪，当时人们在统计出生时的男女比例，p值被用于计算男女出生概率相等零假设的统计学显著性。首先将p≈ap;ap;lt;0005进行推广的人是罗纳德·费雪（ sir ronald aylr fisher ，1890-1962），现代统计学与现代演化论的奠基者之一。（就是这位大哥证明了孟德尔的遗传定律和达尔文的理论并非互相矛盾而是相辅相成。）他在1925年所著的《研究工作者的统计方法（statistics thods for research workers ）》对后世影响力巨大。正是在这部著作中他提出将p=005作为统计显著性的极限，并将其应用于正态分布（作为量为检验），从而得出两个具有统计显著性的标准差的规则。话说这大哥真的是一拍脑门就想出来的005啊，005纯粹就是个人为设置的值。只不过后来成为了大家都公认了这个定值。加下来我们看一下统计学中的检验假设。（以下来自百度百科）假设检验(hypothesis testg)，又称统计假设检验，是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法，也是一种最基本的统计推断形式。1、提出检验假设又称无效假设，符号是h0；备择假设的符号是h1 。h0：样本与总体或样本与样本间的差异是由抽样误差引起的；h1：样本与总体或样本与样本间存在本质差异；预先设定的检验水准为005；当检验假设为真，但被错误地拒绝的概率，记作α，通常取α=005或α=001 。2、选定统计方法，由样本观察值按相应的公式计算出统计量的大小，如x2值、t值等。根据资料的类型和特点，可分别选用z检验，t检验，秩和检验和卡方检验等。3、根据统计量的大小及其分布确定检验假设成立的可能性p的大小并判断结果。若p≈ap;ap;gt;α，结论为按α所取水准不显著，不拒绝h0，即认为差别很可能是由于抽样误差造成的，在统计上不成立；如果p≤α，结论为按所取α水准显著，拒绝h0，接受h1，则认为此差别不大可能仅由抽样误差所致，很可能是实验因素不同造成的，故在统计上成立。p值的大小一般可通过查阅相应的界值表得到。p-vae就是用来判断h0假设是否成立的依据。因为期望值是基于h0假设得出的，如果观测值与期望值越一致，则说明检验现象与零假设越接近，则越没有理由拒绝零假设。如果观测值与期望值越偏离，说明零假设越站不住脚，则越有理由拒绝零假设，从而推出对立假设的成立。说了这么一大堆那么大家可以简单理解成什么呢？就是如果你的心理学（神经医学、医学等等）实验得到了p≈ap;ap;lt;005的检验结果那么大概率你就可以水啊不是写出一篇论文啦！（虽然远没有这么简单不同学科要求不同，但一般大家默认是005和001）那么为什么会说p值被很多人厌恶呢？相信曾经有不少人在ted上看过哈佛大学社会心理学家ay cuddy的演讲，演讲的内容是关于“身体语言对于心态的影响”。其中的内容主要来自于她在2010年发表的关于“调整身体姿态会显著提升自信”的研究。论文中提出非语言表达（膨胀、开放、占位姿态）可以影响人们的心情，行为以及激素水平。文章中还提到了在短短两分钟内采取支配性和力量相关的身体姿势可以增加激素，减少皮质醇，增加对风险的掌控并在工作面试中表现更好。她因为这篇研究以及后续的媒体报道而名声大噪，不但被纽约时报等大媒体关注采访她写的书也成功登上畅销榜。一举成为炙手可热、名利双收的美国明星社会心理学家。然而~在2014年，来自瑞典哥德堡大学的 eva ranehill。

她和其合作者在2015年发表了一篇名为“assessess :on horones and risk toleran a r saple of n and won ”看看这论文名字起得：评估力量姿态的鲁棒性：在大量男性和女性样本中激素和风险耐受性没有影响。这pia pia地打ay小姐姐的脸啊。eva ranehill在其实验中，在采取了更大样本的情况下，无法重现出cuddy的结果

【1】【2】