人口死亡的线性模型和非正常死亡 由美国的人口统计学家科尔提出了一个人口死亡的线性模型和一种非正常死亡的统计计算方法。本文是打算用通俗的语言向大家介绍这线性的模型是什么意思,以及这个模型在计算非正常死亡时的不合理性。当然,不喜欢数学的人千万不要接着往下看。不过,我是尽量写成一个中学生也能看懂的方法
。
我还是用打比方的办法来介绍科尔的线性模型。 假设世界上有那么一块地区,人口学家要在那块地区统计人口死亡的问题。那么,首先人口学家要有一个统计的时间起点,也就是开始统计的时间。我们将这个时间称为0年。在0年,也就是在统计开始的时候,人口学家点数了这个地区的所有还活着的人数,并给他们编上号,而且,今后几十年内新出生的人口都不算在统计之列,只是对所有已经编上号的人统计,直到所有这些人死完为止。 假设在这0年,这个地区共有一万人。当然我这是举例,相同的方法也可以用于十万人,一亿人,等等。那么共有这一万人被编上了号。
再假设这个地区的生存环境比较稳定,而且人均寿命是五十岁,索性假定,每个人一到五十岁一定死,而不到五十岁一定不会死。当然,实际情况并非这样,实际情况是也有人活六十岁的,也有人只活二十岁的。但总的来说,大约摸来讲,就是这样。 此外,假设这个地区的生育情况是稳定的,这样,将这一万个人按年龄分组,相同年龄的人为一组,那么从一岁到五十岁共有五十组。我们相信这五十个组中,每组的人数基本上是一样的,当然,是基本上。那么,用一万除以五十,就是二百。就是说,三岁的人总共有二百人,四十岁的人也总共有二百人,什么岁数的人总共也都是二百人。
现在,人口学家每年来统计一下,这一万个人中已经有多少人死了,也就是计算那一年这一万个人中死亡了的总数。注意,并不是那一年死了多少人,而是从0年开始计算,总共死了多少人。比如第五年来统计,这时候如果一万人中只剩九千人了,那么,就已经死了一千人,将一千这个数字记下来,作为第五年死的累计总数。 当然,因为每年都有一组人的年龄到达五十岁,因此每年都有一个年龄组人死,也就是每年死亡一个年龄组的人数,就是二百人。到了第五十年的时候,最后一组人死完,这时候统计停止。 现在开始作图,在一个横向的坐标轴上标上时间,最左边是0年,往右依次为1年,2年,3年,等等,一直到50年。而纵坐标,俗称Y轴的,是标死亡累计数的。因此,第1年累计死了200人,于是在坐标点(1,200)处标上一个点。第2年累计死了400人,在坐标点(2,400)处标上一个点,这样一直标下去,直到在最后在第50年处人全部死完,在坐标点(50,10000)处标上最后一个点。 现在我们来观察已经标在图上的这50个点,就发现它们都处在一条直线上。而直线在数学上叫做“线性”,因此,我们相信人口的死亡是按线性增长的,这就叫做科尔的人口死亡的线性模型。
当然,实际情况并不象我举的例子那么好,并不总是每年正好死了200人,总有一些偏差,比如说这一年死了198人,下一年死了201人,等等。那么标在图上的各个点,就不会在一条直线上。但是是紧紧地围绕着一条直线,离着这直线总不会差得太远。但是照统计学的观点,只要偏差不太离谱,就算正常。 但是,如果偏差得太离谱了,就不正常了。比如说,某一年死了400人,那么这就太离谱了,就不正常了,那一年对应的点就远远超出直线了,那么,照科尔的观点,超出的部分,就叫做“超线性死亡人数”,而科尔又将这部分称作非正常死亡人数。因为,既然死多了,恐怕总是出了意外,不是被杀,就是活活饿死,等等。
I