第二千一百八十四章 :赚朝廷的钱

第一个是一张柱状图,宋应昌统计了各省每年田税收入与人口数量统计中从0到9各个数字的出现频率。

第二个仍然是一张柱状图,宋应昌统计了各省每年救灾与造反弹压的请求文本的文字,前二十名与后二十名文字的出现频率。

宋应昌本想认真解释一下,但高翰文一看就明白了过来。

这是后世识别数字与文本造假的两个统计方法,具体叫啥是忘记了,但是非常简单有效。

看着高翰文先是发笑,然后一连串对宋应昌的夸奖,李时珍有些没反应过来。

“你们别打哑谜了,到底是什么,快说说,我也听听。”

这时,高翰文才反应过来,李时珍还被蒙在鼓里。

高翰文先是拿起了第一张图,细细地解释起其用途与假设前提起来。

第一个,自然是要求自然产生的真实数据统计,不是人为编造的数据,并且最好跨三个位数的数量级,样本最好是一千以上。这里的自然,倒不是纯自然,而是数据本身几乎不受直接统计之外的额外加工。

有了这些前提范围,就可以依据相比于首位数是2的数据增长到3,首位数是1的数据更难以增长至2,并以此类推形成规律。当然次位数的数字规律也于此相同但有所放松,直到末尾数应当是0-9机会基本均等。如果有违反大概率就是造假了。