辛普森悖论 :统计学现象

更新时间:2024-09-21 16:11

辛普森悖论(Simpson’s 悖论)是统计学的一种现象,即在研究两种变量的相关性时,分别对其进行分组研究,在分组比较中占优势的一方,在总体评价中却并不占优势。辛普森悖论以英国统计学家爱德华·辛普森(Edward Simpson)的名字而命名。

辛普森悖论最早可追溯至英国统计学家卡尔·皮尔逊(Karl Pearson),他在1899年证明连续变量之间的边际关联和部分关联可能不同,从而产生虚假的相关性。1903年,英国统计学家乔治·乌德尼·尤尔(George Udny Yule)指出分类变量关联悖论的存在;1951年,爱德华·辛普森则在论文中正式解释这一悖论,因此辛普森悖论也被称为尤尔-辛普森效应(Yule-Simpson effect)。

辛普森悖论可以看作为分组不当造成理解混乱的典型案例。辛普森悖论表明因果推论在非实验研究中,可能存在不受控制甚至未观察到的变量,这些变量会消除或逆转在两个变量之间观察到的关联。

理论说明

实例

“校长,不好了,有很多男生在校门口抗议,他们说今年研究所女生录取率42%是男生21%的两倍,我们学校遴选学生有性别歧视”,校长满脸疑惑的问秘书:“我不是特别交代,今年要尽量提升男生录取率以免落人口实吗?”

秘书赶紧回答说:“确实有交代下去,我刚刚也查过,的确是有注意到,今年法学院录取率是男性75%,女性只有49%;而商学院录取率是男性10%,女性为5%。二个学院都是男生录取率比较高,校长这是我作的调查报告。”

“秘书,你知道为什么个别录取率男皆大于女,但是总体录取率男却远小于女吗?”

此例这就是统计上著名的辛普森悖论(Simpson's 悖论)

前提

上面例子说明,简单的将分组资料相加汇总,是不一定能反映真实情况的。就上述例子录取率与性别来说,导致辛普森悖论有两个前提。

(1) 两个分组的录取率相差很大,就是说法学院录取率9.2%很低,而商学院53.3%却很高,另一方面,两种性别的申请者分布比重却相反,女生偏爱申请商学院,故商学院女生申请比率占83.3%,相反男生偏爱申请法学院,因此法学院女生申请比率只占0.833%。结果在数量上来说,录取率低的法学院,因为女生申请为数少,所以不录取的女生相对很少。而录取率很高的商学院虽然录取了很多男生,但是申请者却不多。使得最后汇总的时候,女生在数量上反而占优势。

(2) 性别并非是录取率高低的唯一因素,甚至可能是毫无影响的,至于在湖北经济学院法商学院中出现的比率差可能是属于随机事件,又或者是其他因素作用,譬如学生入学成绩却刚好出现这种录取比例,使人牵强地误认为这是由性别差异而造成的。

管理应用

辛普森悖论就像是欲比赛100场篮球以总胜率评价好坏,于是有人专找高手挑战20 场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%,另一人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比 41%小很多,但仔细观察挑战对象,后者明显较有实力。

量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,而此数据却不是重要的。除了质与量的迷思之外,辛普森悖论的另外一个启示是:如果我们在人生的抉择上选择了一条比较难走的路,就得要有可能不被赏识的领悟,所以这算是怀才不遇这个成语在统计上的诠释。

参考资料

Simpson's paradox.Britannica.2023-12-22

..2023-12-22

..2023-12-22

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: