命理测试的分析结果：和普通人猜没有显著差异

很多命理大师声称自己可以通过一个人的生辰八字算出一个人的命运。为了验证他们到底靠不靠谱，我们设计了一个实验来检验所谓的八字算命法和普通人瞎猜到底有没有显著差异。

结果发现，基本和普通人猜没有显著差异。当然，结论也仅仅限制在本次实验的条件下~

1. 实验设计

我搜集了10个生辰八字，其中有一些是考上了清华北大的，有一些是上了普通高校（非985，211）有一些是没上大学（已经过了高考年龄）的。我们可以认为这三种人的学运有显著差别。

现在把10个人的性别，出生时间（精确到小时）和出生地（精确到县）列出来。针对每一个人，请命理大师们算他\她是上了清北，普通高校（非985,211）还是没上大学。

从大多数人理解的算命看，学运肯定是能算的，如果上不上清北，上不上大学都算不出来，那还叫啥算命。

问卷链接在此：命理测试（现在已经关闭）。题项如图0所示。每道题都有正确答案。问卷自2018年3月24日16点发布，公布问卷地址的平台是知乎。

图0. 问卷示例

2. 正确答案

4月7日我们公布了答案，10道题中有4个人是清华北大的，3个人是普通高校的，还有3个人是没上大学的，如下所示。

男，公历1995年3月5日晚22点，河北石家庄赵县——普通高校女，公历1996年9月12日上午9点30分，陕西渭南临渭——清华或北大女，公历1997年4月23日下午16点05分，山东淄博张店——普通高校女，公历1996年1月12日晚23点20分，天津北辰——没上大学女，公历1984年5月24日下午16点45分，河南安阳汤阴——清华或北大男，公历1993年7月30日上午10点，江苏丹阳——没上大学女，公历1997年11月28日中午11点30分，湖北荆州监利——没上大学女，公历1994年5月5日下午2点40分，北京市朝阳区——清华或北大女，公历1997年3月6日中午12点07分，江苏宿迁泗阳——普通高校男，公历1995年10月30日下午15点30分，江西赣州宁都——清华或北大

3. 统计分析结果

截止到4月7日中午11点，共收集到1155份有效答卷，其中身份为专业命理师or周易大师（以下简称大师）的38份，身份为业余命理爱好者or周易爱好者（以下简称爱好者）的120份，身份为普通人的997份。

3.1 整体分布

所有答卷的平均得分为3.487分（和瞎猜的期望3.33基本一样），最高分为8分（可怕的幸运值），最低分为0分（呃，这也算另一种幸运吧），各分数段统计和频率分布直方图如图1所示。

图1. 总体答题得分分布

从频率分布直方图来看，是符合二项分布B(10, 1/3)的概率密度分布的，即随机猜10道3选1单选题的结果。

3.2 普通人答题结果分布

普通人（共997人）的回答统计结果图2所示，平均得分为3.49。

图2. 普通人答题得分分布

因为普通人的样本占绝大多数，所以分布看起来和总体差不多。需要注意的是答对8题的3名幸运儿均为普通人。

3.3 爱好者答题结果分布

答题者汇报身份为爱好者（共120人）的问卷统计结果如图3所示，平均得分为3.43分（还是和3.33差别不大，但是居然落后普通人唉！）。

图3. 爱好者答题得分分布

整个图形看起来仍然比较符合二项分布B(10, 1/3)的概率密度分布，即随机猜10道3选1单选题的结果。爱好者最多答对7题，有4人。

3.4 大师答题结果分布

答题人汇报身份为大师的回答统计结果如图4所示，平均得分为3.55分（有提高！）。

图4. 大师答题得分分布

这个图形因为样本量较少，所以形状没有上两个图那么圆润，但整体上还是比较符合B(10, 1/3)的概率密度分布的，即随机猜10道3选1单选题的结果。大师最多答对7题，有2人。

3.5 高得分用户分析

如果答题人完全随机猜，每题猜对的概率都是1/3，那么10题猜对8题的概率为0.003。从假设检验的角度来看，答对8题可以拒绝原假设（瞎猜），即认为答对8题的人应该是有某种特别的方法的。

但是遗憾的是，答对8题的3位用户均为普通用户，用时分别为62秒，60秒和50秒。我只能说，建议近期可以买彩票。

猜对7题的概率为0.020，从假设检验的角度来看，也可以拒绝其为瞎猜，即认为答对7题的人应该是有某种特别的方法的。答对7题的用户共22人，其中普通用户16人，爱好者4人，大师2人。

答对7题的2名大师分别用时95秒和73秒，其中用时73秒的

@雾雨魔理沙（知乎id，同名者太多，不知道是哪一个，随便引了一个），ta允许我公布其身份（呃，这个用时太短了点把）。

答对7题的4名爱好者分别用时54秒，683秒，51秒和1171秒。其中用时1171秒的

@星沉羽萌（知乎id），她也允许我公布其身份（这位妹子是这里面最靠谱的，我已经加了）。

答对7题的16名普通人，平均用时108.25秒。其中15人用时在200秒之内，1人（@爱吃豆芽的熊猫，知乎id，但貌似已经改名）用时356秒，ta允许我公布其身份。

猜对6题的概率是0.06，大于一般统计分析设定的显著性水平0.05，所以就不进行报告了。但从我个人的角度来看，答对6题的朋友已经可以算是很棒的了！

3.6 大师、爱好者和普通人的得分差异

接下来我们对三类用户的得分均值进行独立样本t检验，即探究周易大师、爱好者和普通人在利用生辰八字预测学历层次这件事上有没有显著差异。

首先检验普通用户和大师的得分均值差异。先进行方差齐性检验，var.test方差齐性检验的结果，F = 1.22, p-value = 0.35>0.05，说明两独立样本数据方差齐性。再进行t检验，结果为t=0.234, p-value=0.8165。

可以认为两个样本的均值没有显著差异。

再检验普通用户和爱好者的得分均值差异。先进行方差齐性检验，var.test方差齐性检验的结果，F = 1.01,p-value = 0.93>0.05，说明两独立样本数据方差齐性。再进行t检验，结果为t=-0.384, p-value=0.7014。

可以认为两个样本的均值没有显著差异。

上述结果说明，声称自己是大师或者爱好者的答题者，根据一个人的生辰八字和出生地，预测ta的大学层次的准确率和普通人瞎猜，没有显著差别。

换句话说，从结果上看大家其实都是瞎猜的（其实有先验信息，下文会提到）......

3.7 有人冒充大师？

但我们也无法排除有人并不是大师或者爱好者，但假冒身份答题的情况出现。因此我们再考察大师或者爱好者中答题时间大于300秒（5分钟，平均每人半分钟）的结果。

当然，我们不能说答题时间短就是没认真算，但答题时间超过5分钟，我认为是经过了排盘的（一般人不会浪费自己宝贵的5分钟）。

在限定答题时间大于300秒后，大师还剩下6个样本，平均得分为3.33分，得分结果如图5所示。

图5. 大师并且答题时间超过300秒的答题得分分布

尽管样本少，但是形状很对称，也基本符合二项分布B(10, 1/3)。但得分最高只有5分，即答对5题。

在限定答题时间大于300秒后，爱好者还剩下31个样本，平均得分为3.57分，得分结果如图6所示。

图6. 爱好者并且答题时间超过300秒的答题得分分布

似乎有了一些差异，答对5题的人数比较多，但总体还是比较符合二项分布B(10, 1/3)的频率直方图的。

对用时在300秒以上的大师得分平均值和普通人得分平均值做t检验，结果没有显著差异；

对用时在300秒以上的爱好者得分平均值和普通人得分平均值做t检验，结果没有显著差异。

呃，看来认真排盘也不能挽救......

4. 先验信息

我们再关注先验信息。10道题中，先验信息比较明显的是第8题，即出生地为北京朝阳的女士。因为北京的高考录取率和清北招生人数显著高于其他出现的省份，因此很多人会认为该名女士是清北的（事实也正是如此）。

对于全部样本而言，答对第8题的数量为528，正确率为45.7%，比瞎猜的正确率33.3%高12个百分点。我们用二项分布检验该题的正确率，结果如图7所示。

图7. 对第8题的二项分布检验

由于p-value极小，可以认为在本题上，大家并不是三选一瞎猜的，而是依赖了先验信息，更多的相信该名北京出生的女士上了清华或者北大（幸运的是大家的先验知识也确实发挥了作用）。

在该题上，普通人的平均得分率为0.468，周易爱好者的平均得分率为0.317，大师的平均得分率为0.605。大师在此题上有较大的优势，但爱好者的又有明显的劣势，似乎难以解释。

但如果使用独立样本t检验，在第8题上，大师的在第8题的得分平均值和普通人并没有显著差异p-value=0.1025（主要是因为大师的样本量少）；倒是爱好者的得分平均值和普通人存在显著差异，并且是显著偏低（p-value=0.001）。

如果考虑答题时间。答题时间在300秒以上的大师在第8题的得分率为0.5；答题时间在300秒以上的爱好者在本题的得分率为0.216。

限制答题时间后，再使用独立样本t检验，大师的在第8题的得分平均值和普通人并没有显著差异（p-value=0.893）；倒是爱好者的得分平均值和普通人存在显著差异，并且是显著偏低（p-value=0.0009）。

截止到发稿时间，我没有想清楚其中的原理，就作为本研究的开放性问题，留给大家了。

5. 局限性

此外需要强调的是，很多大师和爱好者认为我设计的方法并不科学，他们在知乎的评论中强调，还需要更多的信息，特别是哪一年高考的相关信息。

对此，我只能表示很遗憾，我没有搜集到那么多信息。主要是因为我一直以为所谓算命就是命运在出生的时候就已经确定，不能更改了，所以哪一年高考应该不影响吧？看来我too simple了。

不过，我也要强调题目中并没有人考上985，211，除了清北就是普通高校或者没上大学，差异是很大的；学校都是本科学校，没有涉及博士和硕士的。

此外，本文的数据不是从妇产科拿到的，而是志愿者自己提供的（提供前我有让他们问妈妈），存在误差的可能；答题者自我报告的身份也可能存在错误，即使我们用了答题时间这一变量仍不能完全解决这个问题；以及由于作者本人统计学知识的局限，对结果的分析理解可能有误。

上述所有的错误都由作者本人负责。本文接受任何批评建议，但受制于时间精力，不能获取更多的信息来进行修改，也不打算投往同行评议的期刊，谢谢大家。

6. 总结

本着科学的精神严谨的对这次的研究进行总结，我们得到了这样的结论：即在给定生辰八字和出生地的情况下，声称自己是周易大师或周易爱好者的答题者对学历层次的预测和普通人的预测并没有统计意义上的显著差异。

附录：随机生成的二项分布和问卷结果比较

浅红色为随机生成1155个服从B(10,1/3) 分布的样本的频数直方图，淡蓝色为本次采集的全部样本的频数直方图，可以看出两者的差别很小。

我的态度是比较中立的，几位知乎命理圈的大v也参与了这个活动，可惜成绩不算特别理想，以后有机会我们可以再设计更客观的实验。在本次测试中声称自己用了命理方法，得分最高的（7分），且愿意公布身份的，有且只有

@星沉羽萌，据说是一位高学历的妹子。