江苏省淮安市教育部门新制定的教育改革政策,充斥着急功近利的味道,细细品味,就是典型的乱作为。教育要改革创新,从长远看或许是好事,无可厚非,民众是赞同的,但不能不留时限的制定政策,起码要留有2-3 年的缓冲期,让改革涉及的学校、学生有一个过渡适应的过程,不是政策一落地就急着马上实施,这是不对的,也是反常的,甚至是违规违法的,教育不同其他行业,他涉及那么多孩子的未来,不能拿孩子的成长作牺牲。我觉得老人老办法,新人新政策,是可以接受的。希望能引起足够重视这一容易激起矛盾的新政事件。
#“城”心诚意#[微风]田家少闲月,五月人倍忙。日前,我市环卫处环卫工人卢春燕荣获“江苏省劳动模范”荣誉称号。卢春燕作为如皋市环卫处的一名雾炮车驾驶员,虽是为数不多的“女司机”,却展现着巾帼不让须眉的风采。每到“双高季节”卢春燕总是自告奋勇驾驶垃圾车到各小区、街道清理垃圾桶,每天工作近12小时;新冠肺炎疫情爆发期间,卢春燕主动请缨,前往隔离区清理垃圾。她,只是万千城管人的一个缩影,近日如皋市总工会表彰了一批同她一样优秀的集体和个人,小编在这里致敬每一位努力奋斗着的劳动者![抱一抱]
5月11日国家统计局公布了第七次人口普查的汇总数据,总数为14.12亿,并且给出了三个年龄段的人口数量,0到14岁有2.533亿,15到59岁有8.944亿,60岁以上有2.640亿,而每个年龄的人口数量可能要等到下半年才会公布。对比六普和五普中分年龄的人口数据,以及最近25年国家统计局每年出布的出生人口和死亡人口,借助我建立的人口预测模型,我们可以得出很多有意义甚至令人惊叹的结论。
一, 0到14岁人口
六普中0到4岁人口为0.755亿,过去十年公布的出生人口总数为1.591亿(含2020年的1200万),合计只有2.346亿,比七普中0到14岁人口少了1800万。2006年到2010年公布的出生人口合计为0.799亿,比六普中的人数多了440万。我在七普公布前的预测是,七普中10到14岁人口应该会上调至0.80亿,增加450万人,因为六普时漏报户口的小孩到了上学年龄就报上户口了,但根据从三普到六普的经验,0到9岁的小孩仍然会有一部分在七普时漏掉,假设只每年公布的出生人数低3%,大约会少450万,二者相抵,那么0到14年人口还是2.346亿。
但七普公布的实际数据比我之前的估计多出1800万。在缺少更详细的信息下,我们只好假设每个年龄再多出120万人,那么10到14岁人口为0.86亿,而0到9岁人口1.67亿,比这十年每年出布的出生人口总数1.591亿还多800万,平均每年多80万。经过这个估算调整后,七普中0到5岁人口为9830万(每年公布的汇总数9350万加上调整的480万),所以6到14岁人口数大约为1.550亿(2.533-0.983),而这九年期间教育部公布的上小学一年级的学生总人数为1.586亿,上学人数略高2.3%(只需要上小学一年级的平均年龄每年下降八九天),这说明我的估算基本正确。
当然,我们也可以用另外一种更加简单方法来分析七普中0到14岁人口分布。过去十五年国家统计局公布的出生人口总数为2.390亿,比七普中的人数少1430万,平均每年少95万。如果我们在每年出生人口上加上95万,那么6到14岁总人数为1.541亿(这9年出布的出生人口为1.456亿),和以上的估计几乎一样。
人口普查在11月1日进行,两个月的时间差可以忽略不计,因为每年出生人口的变化较小。从零岁到15岁的累计死亡率约1.4%(近十年零岁婴儿的死亡率平均为0.55%),按平均经过时间算,现在0到14岁这群人在过去十年的总死亡率不超过0.8%(注意到11到14岁人群在2010年六普时已经一岁以上了),大约在200万人左右,可以忽略不计,也可以在这篇文章中将相关数据进行调整。
二, 15到59岁人口
六普中5到14岁人口只有1.458亿,而对应的这十年,国家统计局公布的出生人口合计为1.767亿,居然比人口普查多出了3090万人,平均每年差了300万,误差之大令人惊叹,特别是对在六普时已经到了上学年龄的儿童。除了六普时超生不敢报户口外,还有一个原因,六普是第一次将户籍人口统计改为常住人口统计,很多工作人员并不熟悉,漏掉或者重复计算都很普遍。七普时,我想超生不敢报户口的人应该比较少了,并且普查工作人员也熟悉了新的规则。所以我估计七普中20到24岁人口约1.75亿(对应的六年后上小学一年级总人数为1.77亿),基本上等于上述公布的1.767亿。为什么我们选择用每年公布的出生人口作为七普中的15到24岁的人口数据?这是受到两方面的约束,一是看15岁以下的人口,平均每年比公布的出生人口多95万,而国家统计局并没有说最近20年在统计方法上有什么变化,所以我们无法对15到24岁人口作出完全相反的调整;二是如果在每年公布的出生人口之上再加上几十万作为七普中的人口数,十年就多出了几百万,那么从下一段落中的计算可以看出,25到59岁人口比预期的要少四千几百万,这么大的误差也是难以想像的,所以我们决定不做任何调整了(少了170万可认为是死亡人数)。
因为七普中15到59岁人口为8.944亿,那么25到59岁人口应该为7.20亿。六普中,15到49岁人口为7.74亿,按照我的人口模型,这群人在六普到七普之间的死亡总人数为1400万(死亡人数的估计误差最多两三百万),那么到七普时,25岁到59岁人口应该为7.60亿,现在实际数据居然少了4000万,到底是什么原因?我认为主要原因是六普时多算了,当时很多外出打工的人被重复计算了,也就是说既在老家被算上了(五普口径),又在打工的地方被普查了。和五普相比中5到39岁人口7.67亿相比,六普中15到49岁人口应该为7.52亿左右,但六普普查结果为7.74亿,多出了2200万。当然七普普查有误差也是可能的,25到59岁的人也许被少统计了一两千万。
三,60岁以上人口
六普中50岁以上人口为3.377亿。最近十年,统计局出布的总死亡人数0.95亿。每年死亡人数中80%在60岁以上,85%在50岁以上,所以按平均水平算,六普中50岁以上人最近十年的死亡人数约占83%,大约0.79亿,所以直接推算出七普中60岁以上人口总数应该为2.59亿,而实际公布的数为2.64亿,多出了500万人。可能有三个原因产生误差,一是六普时这个年龄段的人口少算了,二是在七普中多算了,三是我模型中的死亡人数高估了这个年龄段实际死亡人数(每年可能有三四十万的误差)。
四,劳动力人口问题
从2012年开始,社科院人口所就预测,每年劳动力人口将减少300万左右,直至2019年,八年累计减少2400万,从2011年的9.18亿降到2019年的8.94亿。中国劳动力人口的定义是指16岁到59岁人口,这个预测100%是基于六普中各个年龄的人口数,现在看来这个结论是错的离谱,而几乎所有券商的宏观分析师都不动脑子地引用这个结论。
今年4月份我在微博上写文章批驳了这个观点,当时依据的就是统计局每年(1996到2003年)公布的出生人口数量。从以上第二部分的分析讨论可以看出,七普中15到24岁的人口数量和这期间每年公布的出生人口总数几乎一样,也就是说平均每个年龄比六普中对应的17到24岁人口(他们从2012年到2019年进入劳动力人口)多300万,也许有的年龄是多200万,有的多400万。所以从2012年到2019年的劳动力人口,每年应该几乎不变,可能会上下波动几十万人,八年累计的变化应该在三四百万之内。
六十年代的出生人口高峰是从1963年开始的,等到2023年他们开始退体(或者说不再计入现行口径下的劳动力人口了),中国的劳动力人口每年将下降800万左右,之后十二年累计减少一亿人,要到2035年以后下降趋势才会减缓。
五,和2019年底公布的人口数据比较
2019年底统计局公布的人口总数是14.00亿,去年出生人口宣称为1200万,而死亡约1040万,本来预计2020年人口应该有14.02亿。公布七普人口为14.12 亿,正好多出了1000万。
下图中0到15岁人口为2.494 亿,和2004到2019年公布的出生人口总数2.591亿相比,居然少了970万人。根据我的模型,这十年期间这组人的死亡总数应该为两三百万,统计局模型下的死亡人数居然是我的三到五倍。难道是卫健委明显低估了这十年期间婴儿和幼儿死亡率?实在想像不出统计局每年还会做其他向下的调整,因为最终七普的数据是多出了近两千万。
根据2019年底分年龄段的人口(注意到15岁的年龄分段不一样),我们先来预测2020年年龄段的人口。首先0到14岁人口应该为2.494亿加上2020年出生人口 1200万,减去2005和2006年出生人口3200万,等于2.29亿,比七普中的2.53亿少了2400万。
再推算2020年底60岁以上人口,应该等于2019年底的2.539亿加上2019年的59岁人口1410万,减去这个年龄段的死亡人数约800万,等于2.60亿,比七普中公布的2.64亿少了400万。
因为七普总人数比预期的多了1000万,所以15到59岁人口比预期多了1800万(=2400+400-1000)。七普中实施公布的数据为8.964亿,所以根据2019年底推算出来的人口只有8.78亿。
如果对15到24岁人口数量做同样的调整(第二部分第一段),那么0到24岁人口比2019年底的预期多了5400万,60岁以上人口多了400万,那么25岁到59岁人口少了4800万。
六,各省市人口变化的问题
最后我们看一下各省的人口数据。下图这个比较有点意思,广东,江苏和浙江分别比2019年底增加了1100万,400万和600万人口,主要原因是原来的外来务工人口少算了,但人口流出大省河南居然也增加了300万,主要原因是原来超生没有报户口的太多了,贵州的情况也类似,并且比例远超河南,贵州的出省打工的比例也应该低于河南,所以超生的比例应该更高。
过去十年,每年各省公布的人口等于上一年人口加上出生人口,减去死亡人口,几乎不考虑每年流动人口的变化和户口补报的情况。三个直辖市京津沪应该是个例外(重庆的情况因为超生不太清楚),因为每年流入的人口占总人口的比例较高,所以每年在年报中公布的常住人口数量,是估计了每年的净流入人数,但从下面的表格可以看出,北京和上海有所低估,而天津则是高估太多了。
大多数省份的人口都比2019年公布的数据减少了。令人惊叹的是,天津市居然减少了175万,比例超过11%,降幅仅次于黑龙江的15%,比其他省份都高,看来天津的经济发展真的不行了。
如果看省内各地市的人口流向,基本上都是向省会和发达城市流入。以吉林省为例,2010年长春市人口只占全省人口的31%,到2020年时已经占到了38%,我估计未来将占50%左右(因为现在省会的年轻人占比高于其他地级市),同时全省的人口会继续减少。再看江苏省,苏南各城市在七普中的人口比2019年的"官方人口"大幅提高,苏中城市如扬州和泰州变化很小,而苏北各城市普遍下降。
七,总结
中国七普中的人口年龄结构比原来预期的年轻很多。取以上两种不同估算方法的均值,0到24岁人口多了大约5000万,而25岁到59岁人口少了约4500万。比较六普和七普中的不同年龄人口数量,差异实在太大了,但每次官方都宣称普查的质量是最高的,甚至说抽样检测表明误差小于千分之三。虽然我感觉七普比六普靠谱多了,但仍然无法"合理估计"七普中各个年龄人口数量的误差(目前尚未公布),还要等八普和九普来验证。
一, 0到14岁人口
六普中0到4岁人口为0.755亿,过去十年公布的出生人口总数为1.591亿(含2020年的1200万),合计只有2.346亿,比七普中0到14岁人口少了1800万。2006年到2010年公布的出生人口合计为0.799亿,比六普中的人数多了440万。我在七普公布前的预测是,七普中10到14岁人口应该会上调至0.80亿,增加450万人,因为六普时漏报户口的小孩到了上学年龄就报上户口了,但根据从三普到六普的经验,0到9岁的小孩仍然会有一部分在七普时漏掉,假设只每年公布的出生人数低3%,大约会少450万,二者相抵,那么0到14年人口还是2.346亿。
但七普公布的实际数据比我之前的估计多出1800万。在缺少更详细的信息下,我们只好假设每个年龄再多出120万人,那么10到14岁人口为0.86亿,而0到9岁人口1.67亿,比这十年每年出布的出生人口总数1.591亿还多800万,平均每年多80万。经过这个估算调整后,七普中0到5岁人口为9830万(每年公布的汇总数9350万加上调整的480万),所以6到14岁人口数大约为1.550亿(2.533-0.983),而这九年期间教育部公布的上小学一年级的学生总人数为1.586亿,上学人数略高2.3%(只需要上小学一年级的平均年龄每年下降八九天),这说明我的估算基本正确。
当然,我们也可以用另外一种更加简单方法来分析七普中0到14岁人口分布。过去十五年国家统计局公布的出生人口总数为2.390亿,比七普中的人数少1430万,平均每年少95万。如果我们在每年出生人口上加上95万,那么6到14岁总人数为1.541亿(这9年出布的出生人口为1.456亿),和以上的估计几乎一样。
人口普查在11月1日进行,两个月的时间差可以忽略不计,因为每年出生人口的变化较小。从零岁到15岁的累计死亡率约1.4%(近十年零岁婴儿的死亡率平均为0.55%),按平均经过时间算,现在0到14岁这群人在过去十年的总死亡率不超过0.8%(注意到11到14岁人群在2010年六普时已经一岁以上了),大约在200万人左右,可以忽略不计,也可以在这篇文章中将相关数据进行调整。
二, 15到59岁人口
六普中5到14岁人口只有1.458亿,而对应的这十年,国家统计局公布的出生人口合计为1.767亿,居然比人口普查多出了3090万人,平均每年差了300万,误差之大令人惊叹,特别是对在六普时已经到了上学年龄的儿童。除了六普时超生不敢报户口外,还有一个原因,六普是第一次将户籍人口统计改为常住人口统计,很多工作人员并不熟悉,漏掉或者重复计算都很普遍。七普时,我想超生不敢报户口的人应该比较少了,并且普查工作人员也熟悉了新的规则。所以我估计七普中20到24岁人口约1.75亿(对应的六年后上小学一年级总人数为1.77亿),基本上等于上述公布的1.767亿。为什么我们选择用每年公布的出生人口作为七普中的15到24岁的人口数据?这是受到两方面的约束,一是看15岁以下的人口,平均每年比公布的出生人口多95万,而国家统计局并没有说最近20年在统计方法上有什么变化,所以我们无法对15到24岁人口作出完全相反的调整;二是如果在每年公布的出生人口之上再加上几十万作为七普中的人口数,十年就多出了几百万,那么从下一段落中的计算可以看出,25到59岁人口比预期的要少四千几百万,这么大的误差也是难以想像的,所以我们决定不做任何调整了(少了170万可认为是死亡人数)。
因为七普中15到59岁人口为8.944亿,那么25到59岁人口应该为7.20亿。六普中,15到49岁人口为7.74亿,按照我的人口模型,这群人在六普到七普之间的死亡总人数为1400万(死亡人数的估计误差最多两三百万),那么到七普时,25岁到59岁人口应该为7.60亿,现在实际数据居然少了4000万,到底是什么原因?我认为主要原因是六普时多算了,当时很多外出打工的人被重复计算了,也就是说既在老家被算上了(五普口径),又在打工的地方被普查了。和五普相比中5到39岁人口7.67亿相比,六普中15到49岁人口应该为7.52亿左右,但六普普查结果为7.74亿,多出了2200万。当然七普普查有误差也是可能的,25到59岁的人也许被少统计了一两千万。
三,60岁以上人口
六普中50岁以上人口为3.377亿。最近十年,统计局出布的总死亡人数0.95亿。每年死亡人数中80%在60岁以上,85%在50岁以上,所以按平均水平算,六普中50岁以上人最近十年的死亡人数约占83%,大约0.79亿,所以直接推算出七普中60岁以上人口总数应该为2.59亿,而实际公布的数为2.64亿,多出了500万人。可能有三个原因产生误差,一是六普时这个年龄段的人口少算了,二是在七普中多算了,三是我模型中的死亡人数高估了这个年龄段实际死亡人数(每年可能有三四十万的误差)。
四,劳动力人口问题
从2012年开始,社科院人口所就预测,每年劳动力人口将减少300万左右,直至2019年,八年累计减少2400万,从2011年的9.18亿降到2019年的8.94亿。中国劳动力人口的定义是指16岁到59岁人口,这个预测100%是基于六普中各个年龄的人口数,现在看来这个结论是错的离谱,而几乎所有券商的宏观分析师都不动脑子地引用这个结论。
今年4月份我在微博上写文章批驳了这个观点,当时依据的就是统计局每年(1996到2003年)公布的出生人口数量。从以上第二部分的分析讨论可以看出,七普中15到24岁的人口数量和这期间每年公布的出生人口总数几乎一样,也就是说平均每个年龄比六普中对应的17到24岁人口(他们从2012年到2019年进入劳动力人口)多300万,也许有的年龄是多200万,有的多400万。所以从2012年到2019年的劳动力人口,每年应该几乎不变,可能会上下波动几十万人,八年累计的变化应该在三四百万之内。
六十年代的出生人口高峰是从1963年开始的,等到2023年他们开始退体(或者说不再计入现行口径下的劳动力人口了),中国的劳动力人口每年将下降800万左右,之后十二年累计减少一亿人,要到2035年以后下降趋势才会减缓。
五,和2019年底公布的人口数据比较
2019年底统计局公布的人口总数是14.00亿,去年出生人口宣称为1200万,而死亡约1040万,本来预计2020年人口应该有14.02亿。公布七普人口为14.12 亿,正好多出了1000万。
下图中0到15岁人口为2.494 亿,和2004到2019年公布的出生人口总数2.591亿相比,居然少了970万人。根据我的模型,这十年期间这组人的死亡总数应该为两三百万,统计局模型下的死亡人数居然是我的三到五倍。难道是卫健委明显低估了这十年期间婴儿和幼儿死亡率?实在想像不出统计局每年还会做其他向下的调整,因为最终七普的数据是多出了近两千万。
根据2019年底分年龄段的人口(注意到15岁的年龄分段不一样),我们先来预测2020年年龄段的人口。首先0到14岁人口应该为2.494亿加上2020年出生人口 1200万,减去2005和2006年出生人口3200万,等于2.29亿,比七普中的2.53亿少了2400万。
再推算2020年底60岁以上人口,应该等于2019年底的2.539亿加上2019年的59岁人口1410万,减去这个年龄段的死亡人数约800万,等于2.60亿,比七普中公布的2.64亿少了400万。
因为七普总人数比预期的多了1000万,所以15到59岁人口比预期多了1800万(=2400+400-1000)。七普中实施公布的数据为8.964亿,所以根据2019年底推算出来的人口只有8.78亿。
如果对15到24岁人口数量做同样的调整(第二部分第一段),那么0到24岁人口比2019年底的预期多了5400万,60岁以上人口多了400万,那么25岁到59岁人口少了4800万。
六,各省市人口变化的问题
最后我们看一下各省的人口数据。下图这个比较有点意思,广东,江苏和浙江分别比2019年底增加了1100万,400万和600万人口,主要原因是原来的外来务工人口少算了,但人口流出大省河南居然也增加了300万,主要原因是原来超生没有报户口的太多了,贵州的情况也类似,并且比例远超河南,贵州的出省打工的比例也应该低于河南,所以超生的比例应该更高。
过去十年,每年各省公布的人口等于上一年人口加上出生人口,减去死亡人口,几乎不考虑每年流动人口的变化和户口补报的情况。三个直辖市京津沪应该是个例外(重庆的情况因为超生不太清楚),因为每年流入的人口占总人口的比例较高,所以每年在年报中公布的常住人口数量,是估计了每年的净流入人数,但从下面的表格可以看出,北京和上海有所低估,而天津则是高估太多了。
大多数省份的人口都比2019年公布的数据减少了。令人惊叹的是,天津市居然减少了175万,比例超过11%,降幅仅次于黑龙江的15%,比其他省份都高,看来天津的经济发展真的不行了。
如果看省内各地市的人口流向,基本上都是向省会和发达城市流入。以吉林省为例,2010年长春市人口只占全省人口的31%,到2020年时已经占到了38%,我估计未来将占50%左右(因为现在省会的年轻人占比高于其他地级市),同时全省的人口会继续减少。再看江苏省,苏南各城市在七普中的人口比2019年的"官方人口"大幅提高,苏中城市如扬州和泰州变化很小,而苏北各城市普遍下降。
七,总结
中国七普中的人口年龄结构比原来预期的年轻很多。取以上两种不同估算方法的均值,0到24岁人口多了大约5000万,而25岁到59岁人口少了约4500万。比较六普和七普中的不同年龄人口数量,差异实在太大了,但每次官方都宣称普查的质量是最高的,甚至说抽样检测表明误差小于千分之三。虽然我感觉七普比六普靠谱多了,但仍然无法"合理估计"七普中各个年龄人口数量的误差(目前尚未公布),还要等八普和九普来验证。
✋热门推荐