學(xué)習(xí)機(jī)器學(xué)習(xí)過(guò)程中,總是會(huì)遇到交叉熵這個(gè)名詞。通過(guò)交叉熵?fù)p失作為損失函數(shù)來(lái)優(yōu)化模型也是學(xué)習(xí)過(guò)程中必然會(huì)遇到的場(chǎng)景。但是,每次當(dāng)和同門(mén)或者其它人遇到或者討論什么是交叉熵的時(shí)候,總是無(wú)法從0到1講出來(lái),往往就是說(shuō)這句話:“衡量預(yù)測(cè)結(jié)果和標(biāo)簽之間的分布差異,從而優(yōu)化模型,使得我們的模型預(yù)測(cè)的結(jié)果能夠與真實(shí)結(jié)果同分布?!?/font>
本文出于此目的,想要把交叉熵從原理到機(jī)器學(xué)習(xí)中的應(yīng)用捋一遍,方便以后回顧以及和網(wǎng)上的你們進(jìn)行不斷的探討學(xué)習(xí)。
離散型隨機(jī)變量X的概率分布=分布律=概率函數(shù);
而離散型隨機(jī)變量的概率分布函數(shù)F(x)就是把概率函數(shù)累加,因此又稱之為累積概率函數(shù);
舉例加深對(duì)交叉熵的理解:
從例子中可以看出,給出的正確預(yù)測(cè)概率值越高的那個(gè)預(yù)測(cè),標(biāo)簽對(duì)預(yù)測(cè)結(jié)果的交叉熵其實(shí)是最小的。
補(bǔ)充:0*任何數(shù)都是零;真是標(biāo)簽使用one hot編碼的意義就是,表示的是隨機(jī)變量(樣本)的概率分布;交叉熵對(duì)于連續(xù)變化的信號(hào)(連續(xù)型隨機(jī)變量的信號(hào)的效果是很差的,連續(xù)的一般用均方差),離散型一般用交叉熵,效果也較好。
q
(
c
i
)
q(c_i)
q(ci?)代表預(yù)測(cè)為真實(shí)標(biāo)簽的概率。
補(bǔ)充:(源自深度之眼:Line講解)
其中l(wèi)g和log在計(jì)算機(jī)中默認(rèn)是以10為底。
其實(shí)就是像素級(jí)別的分類問(wèn)題,對(duì)每個(gè)像素分類結(jié)果求交叉熵之后,求和取平均。
參考內(nèi)容:pytorch語(yǔ)義分割中CrossEntropyLoss()損失函數(shù)的理解與分析
bilibili一個(gè)視頻徹底搞懂交叉熵、信息熵、相對(duì)熵、KL散度、交叉熵?fù)p失、交叉熵?fù)p失函數(shù)、softmax
【公開(kāi)課-85集全】可汗學(xué)院:統(tǒng)計(jì)學(xué)(強(qiáng)烈推薦)
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級(jí)服務(wù)器適合批量采購(gòu),新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧
新聞名稱:機(jī)器學(xué)習(xí)中的交叉熵-創(chuàng)新互聯(lián)
分享地址:http://www.bm7419.com/article16/dgcpdg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、關(guān)鍵詞優(yōu)化、做網(wǎng)站、搜索引擎優(yōu)化、定制網(wǎng)站、標(biāo)簽優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容
營(yíng)銷型網(wǎng)站建設(shè)知識(shí)