大明王朝1566之高翰文_第二千一百八十四章：赚朝廷的钱

第一个是一张柱状图，宋应昌统计了各省每年田税收入与人口数量统计中从0到9各个数字的出现频率。

第二个仍然是一张柱状图，宋应昌统计了各省每年救灾与造反弹压的请求文本的文字，前二十名与后二十名文字的出现频率。

宋应昌本想认真解释一下，但高翰文一看就明白了过来。

这是后世识别数字与文本造假的两个统计方法，具体叫啥是忘记了，但是非常简单有效。

看着高翰文先是发笑，然后一连串对宋应昌的夸奖，李时珍有些没反应过来。

“你们别打哑谜了，到底是什么，快说说，我也听听。”

这时，高翰文才反应过来，李时珍还被蒙在鼓里。

高翰文先是拿起了第一张图，细细地解释起其用途与假设前提起来。

第一个，自然是要求自然产生的真实数据统计，不是人为编造的数据，并且最好跨三个位数的数量级，样本最好是一千以上。这里的自然，倒不是纯自然，而是数据本身几乎不受直接统计之外的额外加工。

有了这些前提范围，就可以依据相比于首位数是2的数据增长到3，首位数是1的数据更难以增长至2，并以此类推形成规律。当然次位数的数字规律也于此相同但有所放松，直到末尾数应当是0-9机会基本均等。如果有违反大概率就是造假了。