Python如何解讀樂(lè)高

這篇文章主要介紹Python如何解讀樂(lè)高,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

從事達(dá)州電信機(jī)房,服務(wù)器租用,云主機(jī),雅安服務(wù)器托管,空間域名,CDN,網(wǎng)絡(luò)代維等服務(wù)。

【導(dǎo)語(yǔ)】:今天我們來(lái)聊聊小朋友和大朋友們都愛(ài)不釋手的樂(lè)高,Python技術(shù)部分請(qǐng)看第四部分。Show me data,用數(shù)據(jù)說(shuō)話!

六一兒童節(jié)到了,過(guò)節(jié)的不僅僅是兒童,還有很多不想長(zhǎng)大的成年人。然而,兒童游樂(lè)場(chǎng)不好意思去跟小朋友搶,幼兒園里已經(jīng)沒(méi)有容身之地。這時(shí),玩具可能是最后一件能讓成年人過(guò)把癮的方式了。

根據(jù)去年的天貓雙11數(shù)據(jù)統(tǒng)計(jì):雙11玩具/童車/益智/積木品牌TOP20榜單中,在玩具領(lǐng)域,樂(lè)高位居首位,占據(jù)了1/5的市場(chǎng)份額,銷售額超過(guò)1138萬(wàn)元,銷量達(dá)14712件,妥妥的玩具領(lǐng)域大佬。今天我們就用數(shù)據(jù)來(lái)聊一聊,小朋友和大朋友們都愛(ài)不釋手的樂(lè)高。

Python如何解讀樂(lè)高

01、老少皆宜 大IP聯(lián)名,玩具居然可以這么玩?!

1932年,樂(lè)高公司在丹麥成立。商標(biāo)“LEGO”是來(lái)自丹麥語(yǔ)“LEg GOdt”,意為“play well”。

Python如何解讀樂(lè)高

在10年前,樂(lè)高真是家庭水準(zhǔn)的體現(xiàn),小時(shí)候能有個(gè)樂(lè)高玩具,應(yīng)該是很多人的夢(mèng)想,但是長(zhǎng)大了發(fā)現(xiàn),現(xiàn)在擁有樂(lè)高玩具,也是夢(mèng)想。有多少人在疫情期間想在淘寶買樂(lè)高玩具,也來(lái)挑戰(zhàn)下千年隼75192,證明自己不再是手殘黨。

外國(guó)的樂(lè)高狂熱粉絲用樂(lè)高拼了一輛能開(kāi)的跑車,真的可以以每小時(shí)15公里的速度前進(jìn),這也算是人類創(chuàng)造能力的體現(xiàn),本身樂(lè)高提倡的就是自由組裝,play well。創(chuàng)造力才是他們的核心,這也就證明了樂(lè)高從小孩玩具到創(chuàng)造力檢測(cè)儀的進(jìn)化。

如今的樂(lè)高就像玩具界的Supreme,時(shí)不時(shí)就弄出套聯(lián)名款,即使你不是樂(lè)高粉絲,也忍不住趕緊送上錢包。

之前,樂(lè)高就和暴雪合作推出了《樂(lè)高守望先鋒系列》。

Python如何解讀樂(lè)高

《樂(lè)高星球大戰(zhàn)系列》,至今全球已經(jīng)熱銷超過(guò)兩千萬(wàn)套。其中“豪華千年隼”,更是被稱為“樂(lè)高史上最大套裝”。

Python如何解讀樂(lè)高

從DC的蝙蝠俠到漫威的鋼鐵俠,熱門電影的熱度“能蹭就蹭”。

Python如何解讀樂(lè)高

如果你是《哈利波特》迷,等不到送入學(xué)通知書的貓頭鷹?沒(méi)關(guān)系,樂(lè)高讓你直接把霍格沃茨買回家。

Python如何解讀樂(lè)高

02、都是哪些人在玩樂(lè)高?

那么都是哪些人在玩樂(lè)高呢?我們用Python獲取“樂(lè)高中國(guó)”最新的三條微博(5.06日、5.08日、5.15日發(fā)布)后的評(píng)論和粉絲信息,分析粉絲畫像,數(shù)據(jù)共4815條。

粉絲性別占比

首先看到樂(lè)高中國(guó)的微博粉絲性別占比,從數(shù)據(jù)可以看到,女性粉絲遠(yuǎn)超男性,占比高達(dá)到65.23%,男性占比34.77%

Python如何解讀樂(lè)高

粉絲數(shù)量地區(qū)分布

都是哪些地區(qū)的人最愛(ài)玩樂(lè)高呢?

Python如何解讀樂(lè)高

從圖中可以看到,北上廣位居前三,海外的粉絲也不少,位居第四。之后就是江蘇、山東分別為第五和第六。

Python如何解讀樂(lè)高

粉絲年齡分布

Python如何解讀樂(lè)高

18-25歲的粉絲最多占比高達(dá)38.69%,其次就是25-30歲的了,占比為24.01%,30-40歲的占比19.97%。總體來(lái)說(shuō),樂(lè)高在國(guó)內(nèi)的粉絲還是比較年輕化的,既有喜歡玩樂(lè)高的年輕玩家,也有熱衷給孩子買樂(lè)高玩的年輕父母。

微博評(píng)論詞云

Python如何解讀樂(lè)高

下面我們看到“樂(lè)高中國(guó)”微博下面的評(píng)論詞云,可以看到提到最多的就是"樂(lè)高"。同時(shí)"齊天大圣"、"忍者神龜"等都是被提及最多的熱門款。

03、哪款樂(lè)高賣的最好?

下面我們用Python進(jìn)一步分析樂(lè)高在天貓和淘寶全網(wǎng)的數(shù)據(jù),我們共搜集整理了樂(lè)高在淘寶的商品數(shù)據(jù),一共4404條商品信息。以及天貓樂(lè)高旗艦店一共392條的數(shù)據(jù)。

樂(lè)高銷量TOP10店鋪

首先看到淘寶全網(wǎng)樂(lè)高銷量店鋪的排名。不用說(shuō),樂(lè)高官方旗艦店是妥妥的第一位,其次天貓超市的位居第二。

Python如何解讀樂(lè)高

樂(lè)高產(chǎn)地排名TOP10

Python如何解讀樂(lè)高

樂(lè)高產(chǎn)地方面,我們可以看到,廣東和上海是大頭,位居第一和第二。北京位居第三。

不同價(jià)格區(qū)間商品數(shù)量

Python如何解讀樂(lè)高

樂(lè)高的定價(jià)如何呢?我們可以看到0-50元的樂(lè)高商品是最多的,達(dá)到895件。其次100-200元的也不少,以701件位居第二。1000元以上的資深玩家款最少,為260件。

不同價(jià)格區(qū)間的銷售額

Python如何解讀樂(lè)高

這里就比較有意思了,1000元以上的銷售額占比達(dá)到32.24%,果然是人民幣玩家的專選。其次500-1000元的商品銷售額占比15.91%。緊接著較為平價(jià)的100-200元款,銷售額占比15.76%。

淘寶樂(lè)高商品標(biāo)題詞云

Python如何解讀樂(lè)高

下面看到淘寶樂(lè)高相關(guān)標(biāo)題的詞云,"樂(lè)高"、"玩具"、"積木"都是提及最多的關(guān)鍵詞。同時(shí)"益智"、"系列"、"正品"等詞也是標(biāo)題中常有的詞。

我們?cè)倬唧w看看哪款樂(lè)高產(chǎn)品賣得最好。

樂(lè)高旗艦店商品銷量TOP10

讓我們?cè)倏吹綐?lè)高旗艦店的數(shù)據(jù):

Python如何解讀樂(lè)高

我們可以看到,孫悟空齊天大圣黃金機(jī)甲這款,以月銷量4765件位居榜首。

Python如何解讀樂(lè)高

其次第二位是R賽車成人送禮收藏車模,月銷量2750件。然后云霄戰(zhàn)機(jī)孫悟空齊天大圣位居第三,月銷量達(dá)到2453件。

不同價(jià)格區(qū)間商品數(shù)量

Python如何解讀樂(lè)高

在商品價(jià)格區(qū)間方面,可以看到數(shù)量最多的還是0-50元的平價(jià)款,共2082件商品,遠(yuǎn)遠(yuǎn)高于其他價(jià)格區(qū)間。其次50-100元的商品有495件。

不同價(jià)格區(qū)間銷售額

最后,我們?cè)倏吹讲煌瑑r(jià)格區(qū)間的銷售額:

Python如何解讀樂(lè)高

這里與淘寶全網(wǎng)數(shù)據(jù)不同,銷售額占比最高的是0-50元的商品,占比49.21%。其次是50-100元,占比16.13%。而1000元以上的銷售額占比最少,僅為2.94%。這也說(shuō)明,在購(gòu)買1000元以上的收藏款時(shí),大家更傾向于在其他渠道購(gòu)買,而不是官方旗艦店。

樂(lè)高旗艦店商品標(biāo)題詞云

Python如何解讀樂(lè)高

我們?cè)倏纯丛跇?lè)高旗艦店,商品標(biāo)題都有什么特點(diǎn)。可以看到標(biāo)題中,"積木"、"玩具"、"XX系列"都被常常提到。同時(shí)"送禮"、"創(chuàng)意"、"益智"、"收藏"等也常出現(xiàn)。

04、帶你用Python分析 樂(lè)高淘寶數(shù)據(jù)

我們使用Python分別獲取了淘寶上的樂(lè)高商品數(shù)據(jù)、樂(lè)高旗艦店的店鋪商品銷售數(shù)據(jù)和微博樂(lè)高中國(guó)的評(píng)論和粉絲數(shù)據(jù),進(jìn)行了數(shù)據(jù)分析分析。此處展示淘寶商品分析部分代碼。按照常規(guī)數(shù)據(jù)分析流程進(jìn)行:

01 數(shù)據(jù)讀入

首先導(dǎo)入所需的庫(kù),并讀入采集的數(shù)據(jù)集。其中pandas用于數(shù)據(jù)整理、jieba用于分詞、pyecharts和stylecloud用于繪制可視化圖形。

# 導(dǎo)入包import pandas as pd import time 
import jieba from pyecharts.charts 
import Bar, Line, Pie, Map, Pagefrom pyecharts 
import options as opts from pyecharts.globals 
import SymbolTypeimport stylecloud

獲取到的數(shù)據(jù)集如下所示:

# 讀入數(shù)據(jù)df_tb = pd.read_excel('../data/樂(lè)高淘寶數(shù)據(jù).xlsx')df_tb.head()

Python如何解讀樂(lè)高

查看一下數(shù)據(jù)框的大小,可以看到一共有4403個(gè)樣本。

df_tb.info()

<class 'pandas.core.frame.DataFrame'>RangeIndex: 4404 entries, 0 to 4403Data columns (total 5 columns):goods_name 4404 non-null objectshop_name 4404 non-null objectprice 4404 non-null float64purchase_num 4404 non-null objectlocation 4404 non-null objectdtypes: float64(1), object(4)memory usage: 172.1+ KB

02 數(shù)據(jù)處理

此處我們對(duì)各個(gè)字段進(jìn)行以下處理以方便后續(xù)的數(shù)據(jù)分析工作,經(jīng)過(guò)去重之后一共有3411個(gè)樣本:

去除重復(fù)值

goods_name:暫不處理

shop_name:暫不處理

price:暫不處理

purchase_num:提取人數(shù)

計(jì)算銷售額 = price * purchase_num

location:提取省份

# 去除重復(fù)值df_tb.drop_duplicates(inplace=True)# 刪除購(gòu)買人數(shù)為空的記錄df_tb = df_tb[df_tb['purchase_num'].str.contains('人付款')]# 重置索引df_tb = df_tb.reset_index(drop=True)df_tb.info()

<class 'pandas.core.frame.DataFrame'>RangeIndex: 3411 entries, 0 to 3410Data columns (total 5 columns):goods_name 3411 non-null objectshop_name 3411 non-null objectprice 3411 non-null float64purchase_num 3411 non-null objectlocation 3411 non-null objectdtypes: float64(1), object(4)memory usage: 133.3+ KB

# purchase_num處理df_tb['purchase_num'] = df_tb['purchase_num'].str.extract('(\d+)').astype('int')
# 計(jì)算銷售額df_tb['sales_volume'] = df_tb['price'] * df_tb['purchase_num']# locationdf_tb['province'] = 
df_tb['location'].str.split(' ').str[0]df_tb.head()

03 數(shù)據(jù)可視化

數(shù)據(jù)可視化部分主要對(duì)以下的信息進(jìn)行匯總和可視化分析,分析維度和使用圖形如下:

樂(lè)高銷量排名top10店鋪 - 條形圖

樂(lè)高產(chǎn)地?cái)?shù)量排名top10 - 條形圖

樂(lè)高產(chǎn)地國(guó)內(nèi)銷量分布 - 地圖

價(jià)格分布 - 餅圖

不同價(jià)格區(qū)間的銷量表現(xiàn) - 餅圖

商品標(biāo)題詞云圖 - 詞云圖

樂(lè)高銷量排名Top10淘寶店鋪 - 條形圖

shop_top10 = df_tb.groupby('shop_name')['purchase_num'].sum().sort_values(ascending=False).head(10)
# 條形圖bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) 
bar1.add_xaxis(shop_top10.index.tolist())bar1.add_yaxis('', shop_top10.values.tolist()) 
bar1.set_global_opts(title_opts=opts.TitleOpts(title='樂(lè)高銷量排名Top10淘寶店鋪'), 
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)), 
visualmap_opts=opts.VisualMapOpts(max_=28669) ) bar1.render()

樂(lè)高店鋪產(chǎn)地?cái)?shù)量排名top10

province_top10 = df_tb.province.value_counts()[:10]bar2 = Bar(init_opts=
opts.InitOpts(width='1350px', height='750px')) 
bar2.add_xaxis(province_top10.index.tolist())
bar2.add_yaxis('', province_top10.values.tolist()) 
bar2.set_global_opts(title_opts=opts.TitleOpts(title='樂(lè)高店鋪產(chǎn)地?cái)?shù)量排名top10'), 
visualmap_opts=opts.VisualMapOpts(max_=1000) ) bar2.render()

國(guó)內(nèi)各省份樂(lè)高銷量分布圖

province_num = df_tb.groupby('province')['purchase_num'].sum().sort_values(ascending=False) 
# 地圖map1 = Map(init_opts=opts.InitOpts(width='1350px', height='750px'))map1.add("", [list(z) 
for z in zip(province_num.index.tolist(), province_num.values.tolist())], maptype='china' ) 
map1.set_global_opts(title_opts=opts.TitleOpts(title='國(guó)內(nèi)各產(chǎn)地樂(lè)高銷量分布圖'), 
visualmap_opts=opts.VisualMapOpts(max_=172277), )map1.render()

天貓樂(lè)高價(jià)格分布

# 分箱cut_bins = [0,50,100,200,300,500,1000,8888] 
cut_labels = ['0~50元', '50~100元', '100~200元', '200~300元', '300~500元', '500~1000元', '1000元以上']
price_cut = pd.cut(df_tb['price'], bins=cut_bins, labels=cut_labels)
price_num = price_cut.value_counts()
# 餅圖bar3 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) 
bar3.add_xaxis(['0~50元', '50~100元', '100~200元', '200~300元', '300~500元', '500~1000元', '1000元以上'])
bar3.add_yaxis('', [895, 486, 701, 288, 370, 411, 260]) 
bar3.set_global_opts(title_opts=opts.TitleOpts(title='不同價(jià)格區(qū)間的商品數(shù)量'), 
visualmap_opts=opts.VisualMapOpts(max_=900)) bar3.render()

不同價(jià)格區(qū)間的銷售額整體表現(xiàn)

# 添加列df_tb['price_cut'] = price_cutcut_purchase = df_tb.groupby('price_cut')
['sales_volume'].sum()# 數(shù)據(jù)對(duì)data_pair = [list(z) for z in zip(cut_purchase.index.tolist(), 
cut_purchase.values.tolist())]
# 繪制餅圖pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px'))
pie1.add('', data_pair, radius=['35%', '60%'])pie1.
set_global_opts(title_opts=opts.TitleOpts(title='不同價(jià)格區(qū)間的銷售額整體表現(xiàn)'), 
legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%'))
pie1.set_series_opts(label_opts=opts.LabelOpts(formatter=":vkp9fxi%"))
pie1.set_colors(['#EF9050', '#3B7BA9', '#6FB27C', '#FFAF34', '#D8BFD8', '#00BFFF', '#7FFFAA'])
pie1.render()

商品標(biāo)題詞云圖

def get_cut_words(content_series): """ 功能:傳入Seires,獲取分詞后的結(jié)果,返回字符串。 """
 # 讀入停用詞表 stop_words = []
  # 讀入stop_words文件 with open(r"stop_words.txt", 'r', encoding='utf-8') 
  as f: lines = f.readlines() for line in lines: stop_words.append(line.strip())
   # 添加關(guān)鍵詞 my_words = ['樂(lè)高', '悟空小俠', '大顆粒', '小顆粒'] for i in my_words: jieba.add_word(i) 
   # 分詞 word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False) 
   # 條件篩選 word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2] return ' '.
   join(word_num_selected) # 生成分詞strtext = get_cut_words(content_series=df_tb['goods_name'])
   # 繪制詞云圖stylecloud.gen_stylecloud(text,
    # 繪圖文本 collocations=False, font_path=r'C:\Windows\Fonts\msyh.ttc',
     # 電腦字體路徑 icon_name='fas fa-heart', # 繪圖形狀 size=768, 
     # 繪圖尺寸 output_name='淘寶樂(lè)高標(biāo)題詞云圖.png' # 輸出png文件 )

以上是Python如何解讀樂(lè)高的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

網(wǎng)頁(yè)題目:Python如何解讀樂(lè)高
轉(zhuǎn)載源于:http://bm7419.com/article6/psciog.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作搜索引擎優(yōu)化、網(wǎng)站改版、營(yíng)銷型網(wǎng)站建設(shè)、云服務(wù)器、移動(dòng)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁(yè)設(shè)計(jì)公司