如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn)

本篇文章為大家展示了如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn),內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比臨河網(wǎng)站開(kāi)發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式臨河網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋臨河地區(qū)。費(fèi)用合理售后完善,十多年實(shí)體公司更值得信賴。

    相關(guān)系數(shù)可以用來(lái)描述定量變量之間的關(guān)系。結(jié)果的正負(fù)號(hào)分別表明正相關(guān)或負(fù)相關(guān),數(shù)值的大小則表示相關(guān)關(guān)系的強(qiáng)弱程度。

    R可以計(jì)算多種相關(guān)系數(shù),今天主要介紹常見(jiàn)的三種:Pearson相關(guān)系數(shù)、Spearman相關(guān)系數(shù) 和 Kendall相關(guān)系數(shù)。這三種相關(guān)系數(shù)均可以通過(guò)R語(yǔ)言的cor函數(shù)計(jì)算,method函數(shù)指定即可。

一 相關(guān)性分析

1.1 Pearson相關(guān)系數(shù)

       度量?jī)蓚€(gè)連續(xù)變量之間的線性相關(guān)程度,需要兩個(gè)變量的標(biāo)準(zhǔn)差都不為零。此外皮爾遜相關(guān)系數(shù)適用條件為:

1)變量之間為線性關(guān)系,且均為連續(xù)數(shù)據(jù)。

2)變量總體呈正態(tài)分布,或接近正態(tài)。

x<-mtcars[,c("disp","hp","drat")]y<-mtcars[,c("disp","hp","drat")]cor(x,y,method = "pearson")         disp         hp       dratdisp  1.0000000  0.7909486 -0.7102139hp    0.7909486  1.0000000 -0.4487591drat -0.7102139 -0.4487591  1.0000000

1.2 Spearman等級(jí)相關(guān)系數(shù)

       衡量非線性關(guān)系變量間的相關(guān)系數(shù),是一種非參數(shù)的統(tǒng)計(jì)方法。變量是成對(duì)的等級(jí)評(píng)定,或者是由連續(xù)變量觀測(cè)資料轉(zhuǎn)化得到的等級(jí)資料。

x<-mtcars[,c("cyl","gear","carb")]y<-mtcars[,c("cyl","gear","carb")]cor(x,y,method = "spearman")            cyl       gear     carbcyl   1.0000000 -0.5643105 0.580068gear -0.5643105  1.0000000 0.114887carb  0.5800680  0.1148870 1.000000

    Spearman等級(jí)相關(guān)系數(shù)是根據(jù)每個(gè)值所處的排列位置的差值,求相關(guān)性系數(shù)。可用于計(jì)算實(shí)驗(yàn)數(shù)據(jù)分析中的不同組學(xué)數(shù)據(jù)之間的相關(guān)性。

1.3 Kendall秩相關(guān)系數(shù)

       也是一種非參數(shù)的等級(jí)相關(guān)度量,類似Spearman相關(guān)系數(shù)。對(duì)象是分類變量。可以無(wú)序,性別(男、女)、血型(A、B、O、AB);可以有序,評(píng)分(優(yōu)、中、差)等。

X<- c(3,1,2,2,1,3)Y<- c(1,2,3,2,1,1)cor(X,Y,method="kendall")[1] -0.2611165

    假設(shè)X Y 分別為兩個(gè)裁判對(duì)選手的評(píng)級(jí)---3為優(yōu),2為中,1為差,結(jié)果可以看出兩位裁判對(duì)選手們的看法呈相反趨勢(shì),但相反程度不大。

二 相關(guān)性顯著性檢驗(yàn)

2.1 單次相關(guān)關(guān)系檢驗(yàn)

    使用cor.test()函數(shù),cor.test(x,y,alternative=,method=)。

其中的x和y為要檢驗(yàn)相關(guān)性的變量,alternative指定進(jìn)行雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn)(取值"two.side"、"less"或"greater"),method指定計(jì)算的相關(guān)類型("pearson"、 "kendall"或"spearman")。

cor.test(mtcars[,"disp"],mtcars[,"hp"])

如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn)

2.2 計(jì)算相關(guān)矩陣并進(jìn)行顯著性檢驗(yàn)

   psych包中 corr.test()函數(shù)。corr.test(x, y = NULL, use = "pairwise",method="pearson",adjust="holm",alpha=.05,ci=TRUE,minlength=5)

corr.test(mtcars[,1:10], adjust = "none", use = "complete")

如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn)

可得到矩陣數(shù)據(jù)集中兩兩變量之間得相關(guān)系數(shù)以及顯著性檢驗(yàn)得P值。

    OK, 注意要根據(jù)變量的實(shí)際情況選擇合適的相關(guān)系數(shù)以及顯著性檢驗(yàn)的計(jì)算方式。

    之前介紹了繪圖系列|R-corrplot相關(guān)圖進(jìn)行相關(guān)系數(shù)的可視化,后面也會(huì)再介紹一些其他的相關(guān)系數(shù)可視化的函數(shù)。

本文分享自微信公眾號(hào) - 生信補(bǔ)給站(Bioinfo_R_Python)。
如有侵權(quán),請(qǐng)聯(lián)系 support@oschina.cn 刪除。
本文參與“OSC源創(chuàng)計(jì)劃”,歡迎正在閱讀的你也加入,一起分享。

上述內(nèi)容就是如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn),你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

當(dāng)前文章:如何進(jìn)行大數(shù)據(jù)中R語(yǔ)言的相關(guān)性分析及檢驗(yàn)
鏈接分享:http://bm7419.com/article34/pssepe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供手機(jī)網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化網(wǎng)站設(shè)計(jì)公司、響應(yīng)式網(wǎng)站、移動(dòng)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)