如何分析大數(shù)據(jù)中的dmp用戶畫像項目

這篇文章主要為大家分析了如何分析大數(shù)據(jù)中的dmp用戶畫像項目的相關(guān)知識點,內(nèi)容詳細易懂,操作細節(jié)合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學(xué)習(xí)“如何分析大數(shù)據(jù)中的dmp用戶畫像項目”的知識吧。

成都創(chuàng)新互聯(lián)2013年至今,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目網(wǎng)站設(shè)計制作、成都網(wǎng)站制作網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元光山做網(wǎng)站,已為上家服務(wù),為光山各地企業(yè)和個人服務(wù),聯(lián)系電話:028-86922220

一、互聯(lián)網(wǎng)廣告精準投放介紹

(1)dsp的展示原理:

如何分析大數(shù)據(jù)中的dmp用戶畫像項目
① 用戶瀏覽媒體網(wǎng)站,媒體網(wǎng)站通過添加的 SSP 代碼向 AdExchange 發(fā)起廣告請求。
② AdExchange 將這次請求的關(guān)鍵信息(如域名 URL、IP、Cookie 等)同時發(fā)送給多家 DSP,我們把這個請求稱為 Bid Request。
③ DSP 收到請求后通過 Cookie、IP、URL 等信息決策是否參與競價,DSP 可以通過 Cookie 來查詢此用戶在自己系統(tǒng)中的歷史行為來推算人口屬性和興趣愛好,如果DSP沒有這個能力,則可以通過第三方DMP的協(xié)助來判斷用戶特征,以便更合理地出價,如若出價,則向 AdExchange 返回價格、要展示的廣告、跳轉(zhuǎn)鏈接等信息,我們把這次信息返回稱為 Bid Response。
④ AdExchange 選出出價最高的 DSP,通知這個 DSP 贏得了競價,并告訴它此次展示的費用(由于在RTB中是采用二階定價,即第二高出價,所以DSP并不知道實際的費用,需要AdExchang 再通知一次),于此同時,AdExchange返回給媒體要展示廣告的html內(nèi)容。
⑤ 廣告的靜態(tài)資源(圖片、Flash 等文件)一般是存儲在 DSP 的服務(wù)器,所以在加載廣告代碼的時候需要去 DSP 請求靜態(tài)資源
⑥ DSP 返回靜態(tài)資源,完成廣告的渲染和展示。

(2)相關(guān)名詞解釋:

??DSP:DSP是一個系統(tǒng),也是一種在線廣告平臺。它服務(wù)于廣告主,幫助廣告主在互聯(lián)網(wǎng)或者移動互聯(lián)網(wǎng)上進行廣告投放,DSP可以使廣告主更簡單便捷地遵循統(tǒng)一的競價和反饋方式,對位于多家廣告交易平臺的在線廣告,以合理的價格實時購買高質(zhì)量的廣告庫存。
?Ad Exchange:Ad Exchange即互聯(lián)網(wǎng)廣告交易平臺,它聯(lián)系著DSP(買方平臺)和SSP(賣方平臺),通過接入SSP匯集大量媒體流量,從而收集處理屬于廣告目標客戶的數(shù)據(jù),Ad Exchange是實現(xiàn)精準營銷的交易場所。
?SSP:SSP(Suply Side Platform),供應(yīng)方平臺,即媒體方平臺,也就是消費者看到廣告的媒介。
?DMP:數(shù)據(jù)管理平臺能夠幫助所有涉及廣告庫存購買和出售的各方管理其數(shù)據(jù)、更方便地使用第三方數(shù)據(jù)、增強他們對所有這些數(shù)據(jù)的理解、傳回數(shù)據(jù)或?qū)⒍ㄖ茢?shù)據(jù)傳入某一平臺,以進行更好地定位。

(3)DMP詳細介紹:

?1)用戶數(shù)據(jù)分類:

???- 第一方數(shù)據(jù):需求方即廣告主自有用戶數(shù)據(jù),包括網(wǎng)站/APP監(jiān)測數(shù)據(jù)、 CRM(Custom Relation Management)數(shù)據(jù)、電商交易數(shù)據(jù)等。
??- 第二方數(shù)據(jù):需求方服務(wù)提供者在廣告投放過程中積累的業(yè)務(wù)數(shù)據(jù),如DSP平臺業(yè)務(wù)中積累的受眾瀏覽廣告、點擊廣告等相關(guān)數(shù)據(jù)。
??- 第三方數(shù)據(jù):非直接合作方擁有的數(shù)據(jù),如運營商數(shù)據(jù)等

?2)數(shù)據(jù)分析能力:

??其中用戶畫像是基礎(chǔ),即通過對用戶信息的標簽化,完美的抽象出一個用戶的信息全貌,并為進一步精準、快速地分析用戶行為習(xí)慣、消費習(xí)慣等重要信息提供足夠的數(shù)據(jù)基礎(chǔ)。顧名思義,用戶畫像的焦點工作就是為用戶打標簽,而一個標簽通常是認為規(guī)定的高度提煉的特征標識,例如年齡、性別、地域、用戶偏好等,最后將用戶的所有標簽綜合來看,就可以勾勒出該用戶的立體畫像了。

?3)DMP的作用:

??- 能快速查詢、反饋和快速呈現(xiàn)結(jié)果
?- 能幫助客戶更快進入到市場周期中
?- 能促成企業(yè)用戶和合作伙伴之間的合作
?- 能深入的預(yù)測分析并作出反應(yīng)
?- 能帶來各方面的競爭優(yōu)勢
?- 能降低信息獲取及人力成本

二、項目需求

(1)實現(xiàn)的需求:

- 模擬從文件中讀取數(shù)據(jù),使用spark將數(shù)據(jù)清洗之后分裝到dataframe,并且壓縮之后,輸出成parquet形式的文件。
- 讀取parquet文件,使用sparksql將其根據(jù)需求進行etl,并且輸出到MySQL中(報表)
- 讀取parquet文件,通過userid,根據(jù)每一個用戶,打相應(yīng)的標簽,最終放入hbase

(2)原始文件的字段介紹:


序號    屬性名稱  描述
1   Sessionid:String    會話標識
2   Advertisers:Int 廣告主id
3   Adorderid:Int   廣告id
4   Adcreativeid:Int    廣告創(chuàng)意id(>=200000:dsp)
5   Adplatformproviderid:Int    廣告平臺商id(>=100000:rtb)
6   Sdkversion:String   Sdk版本
7   Adplatformkey:String    平臺商key
8   Putinmodeltype:Int  根據(jù)廣告主的投放模式,1:顯示量投放,2:點擊量投放
9   Requesmode:Int  數(shù)據(jù)請求方式(1:請求,2:展示,3:點擊)
10  Adprice:Double  廣告價格
11  Adpprice:Double 平臺商價格
12  Requestdate:String  請求時間格式為:yyyy-m-dd hh:mm:ss
13  Ip:String   設(shè)備用戶的真實ip地址
14  Appid:String    應(yīng)用IP
15  Appname:String  應(yīng)用名稱
16  Uuid:String 設(shè)備唯一標識
17  Device:String   設(shè)備型號,如:htc,iphone
18  Client:Int  設(shè)備類型(如:1:Android,2:IOS,3:wp)
19  Osversion:String    設(shè)備操作系統(tǒng)版本
20  Density:String  設(shè)備屏幕密度
21  Pw:Int  設(shè)備屏幕寬度
22  Ph:Int  設(shè)備屏幕高度
23  Long:string 設(shè)備所在經(jīng)度
24  Lat:String  設(shè)備所在維度
25  Provincename:String 設(shè)備所在省份名稱
26  Cityname:String 設(shè)備所在城市名稱
27  Ispid:Int   運營商id
28  Ispname:String  運營商名稱
29  Networkmannerid:Int 聯(lián)網(wǎng)方式id
30  Networkmannername:String    聯(lián)網(wǎng)方式名稱
31  Iseffective:Int 有效標識(有效指可以正常計費的)(0:無效,1:有效)
32  Isbilling:Int   是否收費(0:未收費,1:收費)
33  Adspacestype:Int    廣告位類型(1:banner2:插屏3:全屏)
34  Adspacetypename:String  廣告位類型名稱(banner橫幅,插屏,全屏)
35  Devicetype:Int  設(shè)備類型(1:手機:2:平板)
36  Processnode:Int 流程節(jié)點(1:請求量ktp2:有效請求3:廣告請求)
37  Apptype:Int 應(yīng)用類型id
38  District:String 設(shè)備所在縣的名稱
39  Paymode:Int 針對平臺商的支付模式1:展示量投放(CPM)2:點擊(cpc)
40  Isbid:Int   是否rtp(1參與競價 0不參與競價)
41  Bidprice:Double Rtp競價價格
42  Winprice:Double Rtp競價成功價格
43  Iswin:Int   是否競價成功
44  Cur:String  Values:umd|rmb等
45  Rate:Double 匯率
46  Cnywinprice:Double  Rtp競價成功轉(zhuǎn)換成人民幣的價格
47  Imei:String Imei
48  Imac:string Mac
49  Idfa:String Idfa
50  Openudid:String Openudid
51  Androidid:String    Androidid
52  Rtbprovice:String   Rtb省
53  Rtbcity:String  Rtb市
54  Rtbdistrict:String  Rtb區(qū)
55  Rtbstreet:String    Rtb街道
56  Storeurl:String App的市場下載地址
57  Realip:String   真實ip
58  Isqualityapp:Int    優(yōu)選標識
59  Bidfloor:Double 低價
60  Aw:Int  廣告位的寬
61  Ah:Int  廣告位的高
62  Imeimd5:String  Imei_md5
63  Macmd5:String   Mac_md5
64  Idfamd5:String  Idfa_md5
65  Openudidmd5:String  Openudid_md5
66  Androididmd5:String Androidid_md5
67  Imeisha1:String Imei_sha1
68  Macsha1:String  Mac_sha1
69  Idfasha1:String Idfa_sha1
70  Openudidsha1:String Openudid_sha1
71  Androididsha1:String    Androidid_sha1
72  Uuidunknow:String   Uuid_unknow tanx密文
73  Decuuidunknow:String    解密的tanx明文
74  Userid:String   平臺用戶id
75  Reqdate:String  日期
76  Reqhour:String  小時
77  Iptype:Int  表示ip類型
78  Initbidprice:Double 初始出價
79  Adpayment:Double    轉(zhuǎn)換后的廣告消費
80  Agentrate:Double    代理商利潤率
81  Lomarkrate:Double   代理利潤率
82  Adxrate:Double  媒介利潤率
83  Title:String    標題
84  Keywords:String 關(guān)鍵字
85  Tagid:String    廣告位標識(當視頻流量時值為視頻得ID號)
86  Callbackdate:String 回調(diào)時間,格式為YYYY/mm/dd hh:mm:ss
87  Channeid:String 頻道ID
88  Megratype:Int   媒體類型1:長尾媒體2:視頻媒體3:獨立媒體,默認:1


如何分析大數(shù)據(jù)中的dmp用戶畫像項目

(3)報表:

地域分布
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
終端設(shè)備
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
操作系統(tǒng)
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
媒體分析
如何分析大數(shù)據(jù)中的dmp用戶畫像項目
渠道報表
如何分析大數(shù)據(jù)中的dmp用戶畫像項目

(4)用戶畫像:

標簽一:廣告位類型(標簽格式:LC03->1或者LC16->1)xx為數(shù)字,小于10 補0
標簽二:APP名稱(標簽格式:APPxxxx->1)xxxx為APP的名稱,使用緩存文件appname_dict進行名稱轉(zhuǎn)換
標簽三:渠道(標簽格式:CNxxxx->1)xxxx為渠道ID
標簽四:設(shè)備:操作系統(tǒng)|聯(lián)網(wǎng)方式|運營商
設(shè)備操作系統(tǒng)
1   Android D0001001
2   IOS D0001002
3   Winphone    D0001003
4   其他  D0001004
設(shè)備聯(lián)網(wǎng)方式
WIFI    D0002001
4G  D0002002
3G  D0002003
2G  D0002004
設(shè)備運營商方案
移動  D0003001
聯(lián)通  D0003002
電信  D0003003
OPERATOROTHER   D0003004

標簽五:關(guān)鍵詞(標簽格式:Kxxx->1)xxx為關(guān)鍵字。關(guān)鍵詞個數(shù)不能少于3個字符,且不能超過8個字符;關(guān)鍵字中如包含”|”,則分割成數(shù)組,轉(zhuǎn)化成多個關(guān)鍵字標簽
標簽六:地域標簽(省標簽格式:ZPxxx->1,地市標簽格式:ZCxxx->1)xxx為省或市名稱
標簽七:6)上下文標簽:將數(shù)據(jù)打上上述6類標簽,并根據(jù)【用戶ID】進行當前文件的合并,數(shù)據(jù)保存格式為:userid   K×××志:3 D00030002:1........

這篇文章主要為大家分析了如何分析大數(shù)據(jù)中的dmp用戶畫像項目的相關(guān)知識點,內(nèi)容詳細易懂,操作細節(jié)合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學(xué)習(xí)“如何分析大數(shù)據(jù)中的dmp用戶畫像項目”的知識吧。

文章標題:如何分析大數(shù)據(jù)中的dmp用戶畫像項目
本文網(wǎng)址:http://bm7419.com/article24/igicje.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供標簽優(yōu)化、網(wǎng)站建設(shè)品牌網(wǎng)站制作、品牌網(wǎng)站設(shè)計服務(wù)器托管、網(wǎng)站排名

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司