怎么用Python分析人口數(shù)據(jù)

本篇內(nèi)容介紹了“怎么用Python分析人口數(shù)據(jù)”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

創(chuàng)新互聯(lián)建站企業(yè)建站,10余年網(wǎng)站建設(shè)經(jīng)驗(yàn),專注于網(wǎng)站建設(shè)技術(shù),精于網(wǎng)頁設(shè)計(jì),有多年建站和網(wǎng)站代運(yùn)營經(jīng)驗(yàn),設(shè)計(jì)師為客戶打造網(wǎng)絡(luò)企業(yè)風(fēng)格,提供周到的建站售前咨詢和貼心的售后服務(wù)。對于成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)中不同領(lǐng)域進(jìn)行深入了解和探索,創(chuàng)新互聯(lián)在網(wǎng)站建設(shè)中充分了解客戶行業(yè)的需求,以靈動的思維在網(wǎng)頁中充分展現(xiàn),通過對客戶行業(yè)精準(zhǔn)市場調(diào)研,為客戶提供的解決方案。

一、分析目標(biāo)

新中國成立70,經(jīng)歷了許許多多的風(fēng)風(fēng)雨雨,政策、經(jīng)濟(jì)、文化也有很多的變化,人口也隨之變化。

人口變化對社會經(jīng)濟(jì)發(fā)展帶來巨大而深遠(yuǎn)的影響,所以今天我們從多角度來分析我國人口變化:

  1. 人口總數(shù)

  2. 男女比

  3. 城鎮(zhèn)化

  4. 增長率

  5. 人口結(jié)構(gòu)

二、爬取數(shù)據(jù)

關(guān)于我國人口的數(shù)據(jù)來源,可以從“國家數(shù)據(jù)”網(wǎng)站中獲取。這是一個(gè)由國家統(tǒng)計(jì)局提供的網(wǎng)站,里面有很多國家公開的數(shù)據(jù)信息!

怎么用Python分析人口數(shù)據(jù)

1.請求單頁數(shù)據(jù)

在國家數(shù)據(jù)網(wǎng)站中,有從新中國成立到2018年的人口相關(guān)數(shù)據(jù)。

怎么用Python分析人口數(shù)據(jù)

在人口數(shù)據(jù)中,有三項(xiàng)是我們需要的數(shù)據(jù):總?cè)丝?、增長率、人口結(jié)構(gòu)。

我們按F12查看一下請求的鏈接,然后復(fù)制鏈接使用requests請求數(shù)據(jù)。

怎么用Python分析人口數(shù)據(jù)

只使用一個(gè)簡單的get請求,就把數(shù)據(jù)獲取了,而且返回的直接是json數(shù)據(jù)!

怎么用Python分析人口數(shù)據(jù)

2.分頁數(shù)據(jù)

我們此次的目的是抓取從新中國至今的所有人口數(shù)據(jù),而頁面中最多可以獲取近20年的數(shù)據(jù),所以我們需要分析網(wǎng)頁請求中關(guān)于分頁的參數(shù)。

怎么用Python分析人口數(shù)據(jù)

分析請求參數(shù)豬哥發(fā)現(xiàn)主要有兩個(gè)參數(shù):zb、sj,分別表示指標(biāo)和時(shí)間。

怎么用Python分析人口數(shù)據(jù)
怎么用Python分析人口數(shù)據(jù)

參數(shù):sj=LAST10,表示近10年,于是豬哥猜想:sj=LAST70 是不是就可以獲取70年的數(shù)據(jù)呢?

怎么用Python分析人口數(shù)據(jù)

然后我們再將zb參數(shù)更換,獲取到所有的數(shù)據(jù)!

怎么用Python分析人口數(shù)據(jù)

3.保存Excel

獲取到數(shù)據(jù)之后,我們先將數(shù)據(jù)清洗,提取出我們需要的數(shù)據(jù),然后整理保存到Excel中,數(shù)據(jù)處理方面我們?nèi)匀皇褂?潘大師(pandas)。

怎么用Python分析人口數(shù)據(jù)

我們來看看保存的excel文件數(shù)據(jù)。

怎么用Python分析人口數(shù)據(jù)

4.2019年數(shù)據(jù)

目前數(shù)據(jù)唯一的不完整就是沒有2019年的數(shù)據(jù),因?yàn)?019年剛剛完結(jié)所以數(shù)據(jù)還沒有登記到網(wǎng)站上,我們只能自己算出來然后補(bǔ)齊。

怎么用Python分析人口數(shù)據(jù)

豬哥根據(jù)2020年1月17日,國家統(tǒng)計(jì)局發(fā)布了 2019年國民經(jīng)濟(jì)報(bào)告中關(guān)于人口的數(shù)據(jù)得出了2019年的相關(guān)數(shù)據(jù)。

怎么用Python分析人口數(shù)據(jù)

來看看完整的70年人口數(shù)據(jù)。

怎么用Python分析人口數(shù)據(jù)

三、數(shù)據(jù)分析

數(shù)據(jù)保存完畢后我們就可以開始數(shù)據(jù)分析步驟了,一般在我們數(shù)據(jù)分析之前我們需要有個(gè)思路:要分析什么?從哪些角度分析?選擇何種可視化圖形?得出了什么結(jié)論?(當(dāng)然實(shí)際工作時(shí)的分析報(bào)告需要更為嚴(yán)謹(jǐn),但大體思路類似。)

1.總?cè)丝?/strong>

首先我們提取Excel中的“年末總?cè)丝凇边@一列的數(shù)據(jù)進(jìn)行分析。

怎么用Python分析人口數(shù)據(jù)

直接上代碼,豬哥先使用潘大師讀取Excel,然后再獲取總?cè)丝诘牧袛?shù)據(jù)(完整代碼請查看源碼)。

怎么用Python分析人口數(shù)據(jù)

上面的代碼和之前畫曲線有點(diǎn)不同的是:添加了自定義曲線背景色和區(qū)域色的功能,下次有同學(xué)想自定義pyecharts曲線背景就可以參考這里的代碼。

在下圖中豬哥標(biāo)注了四個(gè)點(diǎn):

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 1949年:新中國成立,總?cè)丝?5.42億

  3. 1980年:計(jì)劃生育正式開始,總?cè)丝?9.87億

  4. 2016年:全面放開二胎,總?cè)丝?13.83億

  5. 2019年:總?cè)丝?14億

怎么用Python分析人口數(shù)據(jù)

通過觀察總?cè)丝谇€圖得知:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 人口總體在增加,但增長曲線慢慢放緩,據(jù)社科院預(yù)測:中國人口將在2029年達(dá)到峰值14.42億,往后逐步下降

  3. 新中國成立至今(2020年)唯一出現(xiàn)人口減少的是1960和1961年,這兩年是我國的自然災(zāi)害年。

怎么用Python分析人口數(shù)據(jù)

根據(jù)總?cè)丝跀?shù),我們再來分析一下 執(zhí)行計(jì)劃生育生育前31年與 后31年增長的人口分別是多少?

怎么用Python分析人口數(shù)據(jù)

根據(jù)上圖我們可以看出:計(jì)劃生育確實(shí)控制了人口的增長!

而放開二胎后并未迎來生育高峰期,聯(lián)合國相關(guān)機(jī)構(gòu)發(fā)布的《世界人口展望》2017修訂版給出了類似的預(yù)期。它傾向于認(rèn)定中國人口已經(jīng)開始了倒V型反轉(zhuǎn),在人口到達(dá)高峰后,2050年將會保持13億多,然后就會加速下滑(低、中、高三種生育率,來自聯(lián)合國人口基金)。

怎么用Python分析人口數(shù)據(jù)

2.男女人口比例

我們經(jīng)常會聽到別人說:“中國男女比例失衡,將有3000萬中國男性娶不到老婆”。

其實(shí)這是我國男女比例失衡造成的結(jié)果。

怎么用Python分析人口數(shù)據(jù)

下面豬哥就從以下4個(gè)角度來分析我國男女比例的關(guān)系:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 2019年男女比

  3. 男性占總?cè)丝诒壤?/p>

  4. 男女人口數(shù)曲線

  5. 男女人口數(shù)差值

怎么用Python分析人口數(shù)據(jù)

根據(jù)上面4圖我們可以得出一些結(jié)論:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 新中國成立以來男性人口一直比女性人口多,可能與我國重男輕女思想有一定關(guān)系。

  3. 男性占比最高是在新中國成立之初為51.96%,最低是在1996年為50.82%。下圖是來自快易數(shù)據(jù)提供的 中國、印度、日本、英國、美國  五國的男性占比圖,從圖中可以清晰看出中國與印度的男女比一直處于失衡狀態(tài)。

怎么用Python分析人口數(shù)據(jù)

    3.2000年我國男女人口差值最大為4131萬人,最小差值是在1965年為1718萬人。

    4.2006年以來我國男女比例失衡狀況逐年緩解

我國到底有多少男性同胞們會打光棍? 由于篇幅有限,我們下期做一個(gè)專題分析這個(gè)問題!

3.人口城鎮(zhèn)化

有很多同學(xué)不理解何為“人口城鎮(zhèn)化”,下面豬哥引用百度百科的介紹:

人口城鎮(zhèn)化是指農(nóng)村人口轉(zhuǎn)變?yōu)槌擎?zhèn)人口、農(nóng)業(yè)人口轉(zhuǎn)變?yōu)榉寝r(nóng)業(yè)人口的過程,它是社會生產(chǎn)力發(fā)展到一定階段的產(chǎn)物。

城鎮(zhèn)化是一個(gè)綜合指標(biāo),可以用來衡量當(dāng)?shù)亟?jīng)濟(jì)發(fā)展情況、基礎(chǔ)設(shè)施和人民生活水平。

同時(shí),城鎮(zhèn)化的進(jìn)程也是房地產(chǎn)市場在需求層面的重要支撐力量,下圖是一張人口城鎮(zhèn)化與社會發(fā)展關(guān)系的圖。

怎么用Python分析人口數(shù)據(jù)

根據(jù)美國地理學(xué)家諾瑟姆對世界各國城市化的研究,世界城市化分為三個(gè)階段:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 初期(人口城鎮(zhèn)化在30%以下):農(nóng)村人口占優(yōu)勢,工農(nóng)業(yè)生產(chǎn)力水平較低,工業(yè)提供就業(yè)機(jī)會少,農(nóng)業(yè)剩余勞動力得不到釋放。

  3. 中期(人口城鎮(zhèn)化30%~70%):工業(yè)基礎(chǔ)比較雄厚,經(jīng)濟(jì)實(shí)力明顯增強(qiáng),農(nóng)村勞動生產(chǎn)率提高,剩余勞動力轉(zhuǎn)向工業(yè),城市人口比重快速突破50%,而后上升到70%。

  4. 后期(人口城鎮(zhèn)化70%~90%):農(nóng)村人口向城鎮(zhèn)人口的轉(zhuǎn)化趨于停止,農(nóng)村人口占比穩(wěn)定在10%左右,城市人口可以達(dá)到90%左右,趨于飽和,這個(gè)過程的城市化不再是人口從農(nóng)村流向城市,而是城市人口在產(chǎn)業(yè)之間的結(jié)構(gòu)性轉(zhuǎn)移,主要是從第二產(chǎn)業(yè)向第三產(chǎn)業(yè)轉(zhuǎn)移。

來看看我國人口城鎮(zhèn)化數(shù)據(jù)分析:

怎么用Python分析人口數(shù)據(jù)

由上圖分析可知:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 2019年我國人口城鎮(zhèn)化達(dá)到60.6%,處于人口城鎮(zhèn)化的中期。

  3. 1995年我國鄉(xiāng)村人口達(dá)到峰值:8.59億。

  4. 1996年我國城鎮(zhèn)化步伐加快,同年城鎮(zhèn)化超過30%,進(jìn)入城鎮(zhèn)化的中期。

  5. 在2010年我國城市人口與鄉(xiāng)村人口持平約為6.7億,城鎮(zhèn)化為50%。

聯(lián)合國對中國人口城鎮(zhèn)化進(jìn)程進(jìn)行了預(yù)測:我國城鎮(zhèn)化初期是1949年~1995年,中期是1996年~2032年,后期是2033年以后。

怎么用Python分析人口數(shù)據(jù)

4.人口增長率

數(shù)據(jù)可視化的代碼豬哥就不放出來了,想看的同學(xué)直接取看源碼吧,我們直接看圖片。

怎么用Python分析人口數(shù)據(jù)

由上圖得知:

  1. 鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)

  2. 在自然災(zāi)害三年(1959、1960、1961)我國人口死亡率陡增,出生率也下降,人口出現(xiàn)新中國成立以來第一次負(fù)增長!

  3. 在自然災(zāi)害過后的兩年(1962、1963)迎來我國最大的一波生育潮,我們通過2010年人口第五次普查的數(shù)據(jù)也可以驗(yàn)證這個(gè)結(jié)論。

怎么用Python分析人口數(shù)據(jù)

    3.自然災(zāi)害三年過后我國的死亡率一直趨于穩(wěn)定,維持在6-7‰左右。

    4.我國出生率整體一直在下降,在計(jì)劃生育之前出生率就在下降。

    5.在2016年我國全面放開二胎之后的三年(2017-2019),出生率并沒有出現(xiàn)好轉(zhuǎn),反而持續(xù)走低。

目前的育齡婦女基本都是85-90后,受計(jì)劃生育(1980年)影響,育齡婦女人數(shù)比以前少了,生孩子的數(shù)量自然就比以前少了,這一情況會持續(xù)下去。

出生率降低,死亡率增加,人口增長就慢慢放緩,社科院預(yù)測在2029年左右我國人口達(dá)到峰值(14.42億)之后慢慢減少!

題外話:豬哥在爬取數(shù)據(jù)之后,發(fā)現(xiàn) 國家數(shù)據(jù)網(wǎng)站 提供的數(shù)據(jù)也是有誤的:1961年人口比1960年人口下降,而增長率卻為整數(shù)!

怎么用Python分析人口數(shù)據(jù)

5.年齡結(jié)構(gòu)

人口年齡結(jié)構(gòu)是衡量 老齡化 與 人口紅利 的指標(biāo)。

老齡化:指老年人口相對增多,在總?cè)丝谥兴急壤粩嗌仙倪^程,國際上通??捶ㄊ?,當(dāng)一個(gè)國家或地區(qū)60歲以上老年人口占人口總數(shù)的10%,或65歲以上老年人口占人口總數(shù)的7%,即意味著這個(gè)國家或地區(qū)的人口處于老齡化社會。  ——百度百科

老齡化是每個(gè)國家每個(gè)社會都會經(jīng)歷的階段,目前來講發(fā)達(dá)國家的老齡化問題比發(fā)展中國家更嚴(yán)重,據(jù)快易數(shù)據(jù)提供的一份  世界各國老齡化排名來看,中國只排到了65名,第一名是日本,而前幾名基本都是歐洲國家。

怎么用Python分析人口數(shù)據(jù)

人口紅利:經(jīng)濟(jì)學(xué)術(shù)語,是指一個(gè)國家的勞動年齡人口占總?cè)丝诒戎剌^大,撫養(yǎng)率比較低,為經(jīng)濟(jì)發(fā)展創(chuàng)造了有利的人口條件,整個(gè)國家的經(jīng)濟(jì)呈高儲蓄、高投資和高增長的局面。

人口紅利簡單來說就是 勞動力人口數(shù) 大于 非  勞動力人口,勞動人口比例較高,保證了經(jīng)濟(jì)增長中的勞動力需求,勞動力資源豐富和成本優(yōu)勢已經(jīng)使中國成為世界工廠和世界經(jīng)濟(jì)增長的引擎。

怎么用Python分析人口數(shù)據(jù)

從上面三圖分析我們可得:

  1. 1982年我國 0-14歲少兒占比33.59%,而2019年減至17.9%,比例減至近半。

  2. 2019年我國65歲以上人口占比為12.57%,已經(jīng)進(jìn)入老齡化社會。世界有92個(gè)國家進(jìn)入老齡化,中國排在65。

  3. 2010年我國總撫養(yǎng)比達(dá)到最低為:34.2%,意味著每3個(gè)勞動力需要養(yǎng)一個(gè)老人或小孩。

  4. 人口紅利在2010年達(dá)到頂峰,之后在慢慢降低。

2019年我國老年人口為1.76億,中國的老齡化即將進(jìn)入快速老齡化階段,目前我國多個(gè)省的養(yǎng)老金告急,我國養(yǎng)老金體系改革迫在眉睫。

“怎么用Python分析人口數(shù)據(jù)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

文章標(biāo)題:怎么用Python分析人口數(shù)據(jù)
標(biāo)題鏈接:http://bm7419.com/article0/geehoo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google企業(yè)網(wǎng)站制作、網(wǎng)站建設(shè)App設(shè)計(jì)、定制開發(fā)、網(wǎng)頁設(shè)計(jì)公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)