R語言怎樣做Logistic回歸

R語言怎樣做Logistic回歸,針對這個(gè)問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問題的小伙伴找到更簡單易行的方法。

創(chuàng)新互聯(lián)建站主營中衛(wèi)網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,重慶APP軟件開發(fā),中衛(wèi)h5微信平臺(tái)小程序開發(fā)搭建,中衛(wèi)網(wǎng)站營銷推廣歡迎中衛(wèi)等地區(qū)企業(yè)咨詢

 Logistic回歸的應(yīng)用場景

當(dāng)因變量為二值型結(jié)果變量,自變量包括連續(xù)型和類別型的數(shù)據(jù)時(shí),Logistic回歸是一個(gè)非常常用的工具。比如今天的例子中用到的婚外情數(shù)據(jù) “Fair's Affairs”。因變量是是否有過婚外情,自變量有8個(gè),分別是

  • 性別
  • 年齡
  • 婚齡
  • 是否有小孩
  • 宗教信仰程度 (5分制,1表示反對,5表示非常信仰)
  • 學(xué)歷
  • 職業(yè) (逆向編號(hào)的戈登7種分類)這個(gè)是啥意思?)
  • 對婚姻的自我評分

因變量y是出軌次數(shù),我們將其轉(zhuǎn)換成二值型,出軌次數(shù)大于等于1賦值為1,相反賦值為0

 

下面開始實(shí)際操作

這個(gè)數(shù)據(jù)集來自R語言包AER,如果要用這個(gè)數(shù)據(jù)集需要先安裝這個(gè)包

install.packages("AER")
 

然后使用data()函數(shù)獲取這個(gè)數(shù)據(jù)集

data(Affairs,package = "AER")
 

然后就可以在環(huán)境的窗口里看到如下R語言怎樣做Logistic回歸

這個(gè)數(shù)據(jù)集總共有601個(gè)觀察值,總共9個(gè)變量

 接下來是將變量y出軌次數(shù),轉(zhuǎn)換成二值型
df<-Affairs
df$ynaffairs<-ifelse(df$affairs>0,1,0)
table(df$ynaffairs)
df$ynaffairs<-factor(df$ynaffairs,
                     levels = c(0,1),
                     labels = c("No","Yes"))table
table(df$ynaffairs)
   接下來是擬合模型

擬合模型用到的是glm()函數(shù)

fit.full<-glm(ynaffairs~gender+age+yearsmarried+
                children+religiousness+education+occupation+rating,
              data=df,family = binomial())
 

通過summary()函數(shù)查看擬合結(jié)果

summary(fit.full)
 
R語言怎樣做Logistic回歸  
image.png

根據(jù)回歸系數(shù)的P值可以看到 性別、是否有孩子、學(xué)歷、職業(yè)對方程的貢獻(xiàn)都不顯著。去除這些變量重新擬合模型

fit.reduced<-glm(ynaffairs~age+yearsmarried+
                religiousness+rating,
              data=df,family = binomial())
   接下來是使用anova()函數(shù)對它們進(jìn)行比較,對于廣義線性回歸,可用卡方檢驗(yàn)
anova(fit.full,fit.reduced,test = "Chisq")
 
R語言怎樣做Logistic回歸  
image.png

可以看到結(jié)果中p值等于0.2108大于0.05,表明四個(gè)變量和9個(gè)變量的模型你和程度沒有差別

 接下來是評價(jià)變量對結(jié)果概率的影響

構(gòu)造一個(gè)測試集

testdata<-data.frame(rating=c(1,2,3,4,5),
                     age=mean(df$age),
                     yearsmarried=mean(df$yearsmarried),
                     religiousness=mean(df$religiousness)
 

預(yù)測概率

testdata$prob<-predict(fit.reduced,newdata = testdata,
                       type = "response")
   簡單的柱形圖對結(jié)果進(jìn)行展示
library(ggplot2)
ggplot(testdata,aes(x=rating,y=prob))+
  geom_col(aes(fill=factor(rating)),show.legend = F)+
  geom_label(aes(label=round(prob,2)))+
  theme_bw()
 
R語言怎樣做Logistic回歸  
image.png

從這些結(jié)果可以看到,當(dāng)婚姻評分從1(很不幸福)變?yōu)?(非常幸福)時(shí),婚外情概率從0.53降低到了0.15。模型的預(yù)測結(jié)果和我們的經(jīng)驗(yàn)還挺符合的

關(guān)于R語言怎樣做Logistic回歸問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

文章題目:R語言怎樣做Logistic回歸
標(biāo)題URL:http://bm7419.com/article18/gegogp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、App開發(fā)、搜索引擎優(yōu)化、響應(yīng)式網(wǎng)站、網(wǎng)站設(shè)計(jì)虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計(jì)