Python生成中文詞云-創(chuàng)新互聯(lián)

豆子無意中發(fā)現(xiàn)Python有個現(xiàn)成的模塊 word cloud可以根據(jù)文本文件生成詞云,很好很強大,簡單地玩了一把。

創(chuàng)新互聯(lián)服務(wù)項目包括耒陽網(wǎng)站建設(shè)、耒陽網(wǎng)站制作、耒陽網(wǎng)頁制作以及耒陽網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,耒陽網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到耒陽省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!

寫代碼之前,首先需要安裝3個依賴的Python模塊,分別是matplotlib, jieba和wordcloud。這三個模塊分別是用來作圖,中文分詞和生成詞云的。安裝方式可以直接通過 pip install實現(xiàn)。如果在線安裝出現(xiàn)報錯(很有可能的事情),那么可以去https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載對應(yīng)版本和位數(shù)的whl文件,然后依然可以通過pip install 來指定下載的文件安裝。

下面來看個簡單的實例:

首先給我的詞云下載一個背景圖,到時候生成的圖案甚至顏色就是和這個一樣的,我隨便下載了個小熊的圖片

Python 生成中文詞云

然后隨便從新浪網(wǎng)上下載了一條新聞,保存為txt文件

×××:深刻認(rèn)識建設(shè)現(xiàn)代化經(jīng)濟體系重要性
  新華社北京1月31日電中共中央政治局1月30日下午就建設(shè)現(xiàn)代化經(jīng)濟體系進行第三次集體學(xué)習(xí)。中共中央總書記×××在主持學(xué)習(xí)時強調(diào),建設(shè)現(xiàn)代化經(jīng)濟體系是一篇大文章,既是一個重大理論命題,更是一個重大實踐課題,需要從理論和實踐的結(jié)合上進行深入探討。建設(shè)現(xiàn)代化經(jīng)濟體系是我國發(fā)展的戰(zhàn)略目標(biāo),也是轉(zhuǎn)變經(jīng)濟發(fā)展方式、優(yōu)化經(jīng)濟結(jié)構(gòu)、轉(zhuǎn)換經(jīng)濟增長動力的迫切要求。全黨一定要深刻認(rèn)識建設(shè)現(xiàn)代化經(jīng)濟體系的重要性和艱巨性,科學(xué)把握建設(shè)現(xiàn)代化經(jīng)濟體系的目標(biāo)和重點,推動我國經(jīng)濟發(fā)展煥發(fā)新活力、邁上新臺階。

  這次中央政治局集體學(xué)習(xí),由中央政治局同志自學(xué)并交流體會,劉鶴、孫春蘭、李希、李強、李鴻忠、陳全國、陳敏爾、×××、蔡奇就這個問題作了重點發(fā)言,中央政治局各位同志聽取了他們的發(fā)言,并就有關(guān)問題進行了討論。

  ×××在主持學(xué)習(xí)時發(fā)表了講話。他指出,建設(shè)現(xiàn)代化經(jīng)濟體系,這是黨中央從黨和國家事業(yè)全局出發(fā),著眼于實現(xiàn)“兩個一百年”奮斗目標(biāo)、順應(yīng)中國特色社會主義進入新時代的新要求作出的重大決策部署。國家強,經(jīng)濟體系必須強。只有形成現(xiàn)代化經(jīng)濟體系,才能更好順應(yīng)現(xiàn)代化發(fā)展潮流和贏得國際競爭主動,也才能為其他領(lǐng)域現(xiàn)代化提供有力支撐。我們要按照建設(shè)社會主義現(xiàn)代化強國的要求,加快建設(shè)現(xiàn)代化經(jīng)濟體系,確保社會主義現(xiàn)代化強國目標(biāo)如期實現(xiàn)。

  ×××強調(diào),現(xiàn)代化經(jīng)濟體系,是由社會經(jīng)濟活動各個環(huán)節(jié)、各個層面、各個領(lǐng)域的相互關(guān)系和內(nèi)在聯(lián)系構(gòu)成的一個有機整體。要建設(shè)創(chuàng)新引領(lǐng)、協(xié)同發(fā)展的產(chǎn)業(yè)體系,實現(xiàn)實體經(jīng)濟、科技創(chuàng)新、現(xiàn)代金融、人力資源協(xié)同發(fā)展,使科技創(chuàng)新在實體經(jīng)濟發(fā)展中的貢獻份額不斷提高,現(xiàn)代金融服務(wù)實體經(jīng)濟的能力不斷增強,人力資源支撐實體經(jīng)濟發(fā)展的作用不斷優(yōu)化。要建設(shè)統(tǒng)一開放、競爭有序的市場體系,實現(xiàn)市場準(zhǔn)入暢通、市場開放有序、市場競爭充分、市場秩序規(guī)范,加快形成企業(yè)自主經(jīng)營公平競爭、消費者自由選擇自主消費、商品和要素自由流動平等交換的現(xiàn)代市場體系。要建設(shè)體現(xiàn)效率、促進公平的收入分配體系,實現(xiàn)收入分配合理、社會公平正義、全體人民共同富裕,推進基本公共服務(wù)均等化,逐步縮小收入分配差距。要建設(shè)彰顯優(yōu)勢、協(xié)調(diào)聯(lián)動的城鄉(xiāng)區(qū)域發(fā)展體系,實現(xiàn)區(qū)域良性互動、城鄉(xiāng)融合發(fā)展、陸海統(tǒng)籌整體優(yōu)化,培育和發(fā)揮區(qū)域比較優(yōu)勢,加強區(qū)域優(yōu)勢互補,塑造區(qū)域協(xié)調(diào)發(fā)展新格局。要建設(shè)資源節(jié)約、環(huán)境友好的綠色發(fā)展體系,實現(xiàn)綠色循環(huán)低碳發(fā)展、人與自然和諧共生,牢固樹立和踐行綠水青山就是金山銀山理念,形成人與自然和諧發(fā)展現(xiàn)代化建設(shè)新格局。要建設(shè)多元平衡、安全高效的全面開放體系,發(fā)展更高層次開放型經(jīng)濟,推動開放朝著優(yōu)化結(jié)構(gòu)、拓展深度、提高效益方向轉(zhuǎn)變。要建設(shè)充分發(fā)揮市場作用、更好發(fā)揮政府作用的經(jīng)濟體制,實現(xiàn)市場機制有效、微觀主體有活力、宏觀調(diào)控有度。以上幾個體系是統(tǒng)一整體,要一體建設(shè)、一體推進。我們建設(shè)的現(xiàn)代化經(jīng)濟體系,要借鑒發(fā)達國家有益做法,更要符合中國國情、具有中國特色。

  ×××指出,建設(shè)現(xiàn)代化經(jīng)濟體系,需要扎實管用的政策舉措和行動。要突出抓好以下幾方面工作。一是要大力發(fā)展實體經(jīng)濟,筑牢現(xiàn)代化經(jīng)濟體系的堅實基礎(chǔ)。實體經(jīng)濟是一國經(jīng)濟的立身之本,是財富創(chuàng)造的根本源泉,是國家強盛的重要支柱。要深化供給側(cè)結(jié)構(gòu)性改革,加快發(fā)展先進制造業(yè),推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能同實體經(jīng)濟深度融合,推動資源要素向?qū)嶓w經(jīng)濟集聚、政策措施向?qū)嶓w經(jīng)濟傾斜、工作力量向?qū)嶓w經(jīng)濟加強,營造腳踏實地、勤勞創(chuàng)業(yè)、實業(yè)致富的發(fā)展環(huán)境和社會氛圍。二是要加快實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,強化現(xiàn)代化經(jīng)濟體系的戰(zhàn)略支撐,加強國家創(chuàng)新體系建設(shè),強化戰(zhàn)略科技力量,推動科技創(chuàng)新和經(jīng)濟社會發(fā)展深度融合,塑造更多依靠創(chuàng)新驅(qū)動、更多發(fā)揮先發(fā)優(yōu)勢的引領(lǐng)型發(fā)展。三是要積極推動城鄉(xiāng)區(qū)域協(xié)調(diào)發(fā)展,優(yōu)化現(xiàn)代化經(jīng)濟體系的空間布局,實施好區(qū)域協(xié)調(diào)發(fā)展戰(zhàn)略,推動京津冀協(xié)同發(fā)展和長江經(jīng)濟帶發(fā)展,同時協(xié)調(diào)推進粵港澳大灣區(qū)發(fā)展。鄉(xiāng)村振興是一盤大棋,要把這盤大棋走好。四是要著力發(fā)展開放型經(jīng)濟,提高現(xiàn)代化經(jīng)濟體系的國際競爭力,更好利用全球資源和市場,繼續(xù)積極推進“一帶一路”框架下的國際交流合作。五是要深化經(jīng)濟體制改革,完善現(xiàn)代化經(jīng)濟體系的制度保障,加快完善社會主義市場經(jīng)濟體制,堅決破除各方面體制機制弊端,激發(fā)全社會創(chuàng)新創(chuàng)業(yè)活力。(完)

責(zé)任編輯:張建利

Python 代碼

from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

d = path.dirname(__file__)

# Read the whole text.
text = open(path.join(d, 'xidada.txt'),encoding='utf-8').read()

import jieba

# 結(jié)巴分詞
wordlist = jieba.cut(text, cut_all=True)
wl = " ".join(wordlist)
print(wl)#輸出分詞之后的txt

coloring = np.array(Image.open(path.join(d, "bear.jpg")))

# 設(shè)置停用詞
# stopwords = set(STOPWORDS)
# stopwords.add("said")

# 你可以通過 mask 參數(shù) 來設(shè)置詞云形狀
wc = WordCloud(background_color="white", max_words=2000, mask=coloring,
                max_font_size=50, random_state=42,font_path='fangsong_GB2312.ttf')

wc.generate(wl)

# create coloring from image
image_colors = ImageColorGenerator(coloring)

# show
# 在只設(shè)置mask的情況下,你將會得到一個擁有圖片形狀的詞云
plt.imshow(wc, interpolation="bilinear")
plt.axis("off")
plt.figure()
plt.show()

效果圖
Python 生成中文詞云

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

分享名稱:Python生成中文詞云-創(chuàng)新互聯(lián)
標(biāo)題URL:http://www.bm7419.com/article48/ceeohp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、品牌網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化、商城網(wǎng)站域名注冊、服務(wù)器托管

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)