機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

這篇文章主要介紹“機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么”的相關(guān)知識(shí),小編通過實(shí)際案例向大家展示操作過程,操作方法簡單快捷,實(shí)用性強(qiáng),希望這篇“機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么”文章能幫助大家解決問題。

做網(wǎng)站、成都網(wǎng)站建設(shè)的關(guān)注點(diǎn)不是能為您做些什么網(wǎng)站,而是怎么做網(wǎng)站,有沒有做好網(wǎng)站,給成都創(chuàng)新互聯(lián)一個(gè)展示的機(jī)會(huì)來證明自己,這并不會(huì)花費(fèi)您太多時(shí)間,或許會(huì)給您帶來新的靈感和驚喜。面向用戶友好,注重用戶體驗(yàn),一切以用戶為中心。

背景介紹

什么是分類器?

分類器是一種機(jī)器學(xué)習(xí)模型,用于基于某些特征來區(qū)分不同的對(duì)象。

樸素貝葉斯分類器的原理:

樸素貝葉斯分類器是一種概率性機(jī)器學(xué)習(xí)模型,用于分類任務(wù)。分類器基于貝葉斯定理。

貝葉斯定理:

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

使用貝葉斯定理,我們可以找到已知B發(fā)生,A發(fā)生的可能性。在這里,B是證據(jù),A是假設(shè)。這里所做的假設(shè)是預(yù)測變量/特征是獨(dú)立的。也就是說,一個(gè)特定功能的存在不會(huì)影響其他功能。因此,它被稱為樸素。

例如:

讓我們以一個(gè)例子來獲得更好的直覺??紤]打高爾夫球的問題。數(shù)據(jù)集如下所示。

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

根據(jù)一天的特點(diǎn),我們對(duì)一天是否適合打高爾夫球進(jìn)行分類。列代表這些功能,行代表各個(gè)條目。如果我們?nèi)?shù)據(jù)集的第一行,則可以觀察到如果前景多雨,溫度高,濕度高且不大風(fēng),則不適合打高爾夫球。我們?cè)诖俗龀鰞蓚€(gè)假設(shè),如上所述,我們認(rèn)為這些預(yù)測變量是獨(dú)立的。即,如果溫度高,則不一定表示濕度高。這里所做的另一個(gè)假設(shè)是,所有預(yù)測變量對(duì)結(jié)果的影響均等。即,有風(fēng)的日子在決定是否打高爾夫球方面沒有更多的重要性。

根據(jù)此示例,貝葉斯定理可以重寫為:

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

變量y是類別變量(打高爾夫球),它表示是否適合打高爾夫球或沒有給定條件。變量X代表參數(shù)/特征。

X給出為:

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

這里的x_1,x_2….x_n代表這些特征,即可以將它們映射到外觀,溫度,濕度和大風(fēng)。通過替換X并使用鏈?zhǔn)揭?guī)則擴(kuò)展,我們得到:

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

現(xiàn)在,您可以通過查看數(shù)據(jù)集并將其替換為方程式來獲取每個(gè)值。對(duì)于數(shù)據(jù)集中的所有條目,分母不會(huì)更改,而是保持不變。因此,可以去除分母并且可以引入比例。

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

在我們的例子中,類變量(y)只有兩個(gè)結(jié)果,是或否。在某些情況下,分類可能是多元的。因此,我們需要找到概率最大的y類。

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

使用上面的函數(shù),我們可以得到給定預(yù)測變量的類。

樸素貝葉斯分類器的類型:
多項(xiàng)式樸素貝葉斯:
這主要用于文檔分類問題,即文檔是否屬于體育,政治,技術(shù)等類別。分類器使用的特征/預(yù)測詞是文檔中出現(xiàn)的單詞的頻率。
伯努利·樸素貝葉斯:
這類似于多項(xiàng)式樸素貝葉斯,但預(yù)測變量是布爾變量。 我們用于預(yù)測類變量的參數(shù)僅采用yes或no值,例如,是否在文本中出現(xiàn)單詞。
高斯樸素貝葉斯:
當(dāng)預(yù)測變量采用連續(xù)值并且不是離散值時(shí),我們假定這些值是從高斯分布中采樣的。

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

高斯分布(正態(tài)分布)

由于值在數(shù)據(jù)集中的顯示方式發(fā)生了變化,因此條件概率公式變?yōu)椋?/p>

機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么

結(jié)論:

樸素貝葉斯算法主要用于情感分析(NLP問題),垃圾郵件過濾,推薦系統(tǒng)等。它們快速,易于實(shí)現(xiàn),但最大的缺點(diǎn)是預(yù)測變量要求獨(dú)立。在大多數(shù)現(xiàn)實(shí)生活中,預(yù)測變量是相互依賴的,這會(huì)妨礙分類器的性能。

關(guān)于“機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí),可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,小編每天都會(huì)為大家更新不同的知識(shí)點(diǎn)。

網(wǎng)頁標(biāo)題:機(jī)器學(xué)習(xí)樸素貝葉斯分類器原理是什么
文章分享:http://bm7419.com/article14/jdghge.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營銷小程序開發(fā)、品牌網(wǎng)站建設(shè)、響應(yīng)式網(wǎng)站、網(wǎng)站策劃、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設(shè)