亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > R > 正文

R語言利用loess如何去除某個變量對數(shù)據(jù)的影響詳解

2020-01-31 16:13:02
字體:
供稿:網(wǎng)友

R語言介紹

R語言是用于統(tǒng)計分析,圖形表示和報告的編程語言和軟件環(huán)境。 R語言由Ross Ihaka和Robert Gentleman在新西蘭奧克蘭大學(xué)創(chuàng)建,目前由R語言開發(fā)核心團隊開發(fā)。

R語言的核心是解釋計算機語言,其允許分支和循環(huán)以及使用函數(shù)的模塊化編程。 R語言允許與以C,C ++,.Net,Python或FORTRAN語言編寫的過程集成以提高效率。

R語言在GNU通用公共許可證下免費提供,并為各種操作系統(tǒng)(如Linux,Windows和Mac)提供預(yù)編譯的二進制版本。
R是一個在GNU風(fēng)格的副本左側(cè)的自由軟件,GNU項目的官方部分叫做GNU S.

R的演變

R語言最初是由新西蘭奧克蘭奧克蘭大學(xué)統(tǒng)計系的Ross Ihaka和Robert Gentleman寫的。 R語言于1993年首次亮相。
一大群人通過發(fā)送代碼和錯誤報告對R做出了貢獻(xiàn)。

自1997年年中以來,已經(jīng)有一個核心組(“R核心團隊”)可以修改R源代碼歸檔。

R的特點

如前所述,R語言是用于統(tǒng)計分析,圖形表示和報告的編程語言和軟件環(huán)境。 以下是R語言的重要特點:

  • R語言是一種開發(fā)良好,簡單有效的編程語言,包括條件,循環(huán),用戶定義的遞歸函數(shù)以及輸入和輸出設(shè)施。
  • R語言具有有效的數(shù)據(jù)處理和存儲設(shè)施,
  • R語言提供了一套用于數(shù)組,列表,向量和矩陣計算的運算符。
  • R語言為數(shù)據(jù)分析提供了大型,一致和集成的工具集合。
  • R語言提供直接在計算機上或在紙張上打印的圖形設(shè)施用于數(shù)據(jù)分析和顯示。

作為結(jié)論,R語言是世界上最廣泛使用的統(tǒng)計編程語言。 它是數(shù)據(jù)科學(xué)家的第一選擇,并由一個充滿活力和有才華的貢獻(xiàn)者社區(qū)支持。 R語言在大學(xué)教授并部署在關(guān)鍵業(yè)務(wù)應(yīng)用程序中。 本教程將教您R編程與適當(dāng)?shù)睦釉诤唵魏腿菀椎牟襟E。

前言

  當(dāng)我們想研究不同sample的某個變量A之間的差異時,往往會因為其它一些變量B對該變量的固有影響,而影響不同sample變量A的比較,這個時候需要對sample變量A進行標(biāo)準(zhǔn)化之后才能進行比較。標(biāo)準(zhǔn)化的方法是對sample 的 A變量和B變量進行l(wèi)oess回歸,擬合變量A關(guān)于變量B的函數(shù) f(b),f(b)則表示在B的影響下A的理論取值,A-f(B)(A對f(b)殘差)就可以去掉B變量對A變量的影響,此時殘差值就可以作為標(biāo)準(zhǔn)化的A值在不同sample之間進行比較。

Loess局部加權(quán)多項式回歸

  LOWESS最初由Cleveland 提出,后又被Cleveland&Devlin及其他許多人發(fā)展。在R中l(wèi)oess 函數(shù)是以lowess函數(shù)為基礎(chǔ)的更復(fù)雜功能更強大的函數(shù)。主要思想為:在數(shù)據(jù)集合的每一點用低維多項式擬合數(shù)據(jù)點的一個子集,并估計該點附近自變量數(shù)據(jù)點所對應(yīng)的因變量值,該多項式是用加權(quán)最小二乘法來擬合;離該點越遠(yuǎn),權(quán)重越小,該點的回歸函數(shù)值就是這個局部多項式來得到,而用于加權(quán)最小二乘回歸的數(shù)據(jù)子集是由最近鄰方法確定。

  最大優(yōu)點:不需要事先設(shè)定一個函數(shù)來對所有數(shù)據(jù)擬合一個模型。并且可以對同一數(shù)據(jù)進行多次不同的擬合,先對某個變量進行擬合,再對另一變量進行擬合,以探索數(shù)據(jù)中可能存在的某種關(guān)系,這是普通的回歸擬合無法做到的。

LOESS平滑方法

  1. 以x0為中心確定一個區(qū)間,區(qū)間的寬度可以靈活掌握。具體來說,區(qū)間的寬度取決于q=fn。其中q是參與局部回歸觀察值的個數(shù),f是參加局部回歸觀察值的個數(shù)占觀察值個數(shù)的比例,n是觀察值的個數(shù)。在實際應(yīng)用中,往往先選定f值,再根據(jù)f和n確定q的取值,一般情況下f的取值在1/3到2/3之間。q與f的取值一般沒有確定的準(zhǔn)則。增大q值或f值,會導(dǎo)致平滑值平滑程度增加,對于數(shù)據(jù)中前在的細(xì)微變化模式則分辨率低,但噪聲小,而對數(shù)據(jù)中大的變化模式的表現(xiàn)則比較好;小的q值或f值,曲線粗糙,分辨率高,但噪聲大。沒有一個標(biāo)準(zhǔn)的f值,比較明智的做法是不斷的調(diào)試比較。

  2. 定義區(qū)間內(nèi)所有點的權(quán)數(shù),權(quán)數(shù)由權(quán)數(shù)函數(shù)來確定,比如立方加權(quán)函數(shù)weight = (1 - (dist/maxdist)^3)^3),dist為距離x的距離,maxdist為區(qū)間內(nèi)距離x的最大距離。任一點(x0,y0)的權(quán)數(shù)是權(quán)數(shù)函數(shù)曲線的高度。權(quán)數(shù)函數(shù)應(yīng)包括以下三個方面特性:(1)加權(quán)函數(shù)上的點(x0,y0)具有最大權(quán)數(shù)。(2)當(dāng)x離開x0(時,權(quán)數(shù)逐漸減少。(3)加權(quán)函數(shù)以x0為中心對稱。

  3. 對區(qū)間內(nèi)的散點擬合一條曲線y=f(x)。擬合的直線反映直線關(guān)系,接近x0的點在直線的擬合中起到主要的作用,區(qū)間外的點它們的權(quán)數(shù)為零。

  4. x0的平滑點就是x0在擬合出來的直線上的擬合點(y0,f( x0))。

  5. 對所有的點求出平滑點,將平滑點連接就得到Loess回歸曲線。

R語言代碼

 loess(formula, data, weights, subset, na.action, model = FALSE,  span = 0.75, enp.target, degree = 2,  parametric = FALSE, drop.square = FALSE, normalize = TRUE,  family = c("gaussian", "symmetric"),  method = c("loess", "model.frame"),  control = loess.control(...), ...)

  formula是公式,比如y~x,可以輸入1到4個變量;

  data是放著變量的數(shù)據(jù)框,如果data為空,則在環(huán)境中尋找;

  na.action指定對NA數(shù)據(jù)的處理,默認(rèn)是getOption("na.action");

  model是否返回模型框;

  span是alpha參數(shù),可以控制平滑度,相當(dāng)于上面所述的f,對于alpha小于1的時候,區(qū)間包含alpha的點,加權(quán)函數(shù)為立方加權(quán),大于1時,使用所有的點,最大距離為alpha^(1/p),p 為解釋變量;

  anp.target,定義span的備選方法;

  normalize,對多變量normalize到同一scale;

  family,如果是gaussian則使用最小二乘法,如果是symmetric則使用雙權(quán)函數(shù)進行再下降的M估計;

  method,是適應(yīng)模型或者僅僅提取模型框架;

  control進一步更高級的控制,使用loess.control的參數(shù);

  其它參數(shù)請自己參見manual并且查找資料

loess.control(surface = c("interpolate", "direct"),   statistics = c("approximate", "exact"),   trace.hat = c("exact", "approximate"),   cell = 0.2, iterations = 4, ...)

  surface,擬合表面是從kd數(shù)進行插值還是進行精確計算;

  statistics,統(tǒng)計數(shù)據(jù)是精確計算還是近似,精確計算很慢

  trace.hat,要跟蹤的平滑的矩陣精確計算或近似?建議使用超過1000個數(shù)據(jù)點逼近,

  cell,如果通過kd樹最大的點進行插值的近似。大于cell floor(nspancell)的點被細(xì)分。

  robust fitting使用的迭代次數(shù)。

predict(object, newdata = NULL, se = FALSE, na.action = na.pass, ...)

  object,使用loess擬合出來的對象;

  newdata,可選數(shù)據(jù)框,在里面尋找變量并進行預(yù)測;

  se,是否計算標(biāo)準(zhǔn)誤差;

  對NA值的處理

實例

  生物數(shù)據(jù)分析中,我們想查看PCR擴增出來的擴增子的測序深度之間的差異,但不同的擴增子的擴增效率受到GC含量的影響,因此我們首先應(yīng)該排除掉GC含量對擴增子深度的影響。

數(shù)據(jù)

amplicon 測序數(shù)據(jù),處理后得到的每個amplicon的深度,每個amplicon的GC含量,每個amplicon的長度

先用loess進行曲線的擬合

gcCount.loess <- loess(log(RC+0.01)~GC,data=RC_DT,control = loess.control(surface = "direct"),degree=2)

畫出擬合出來的曲線

predictions1<- predict (gcCount.loess,RC_DT$GC)#plot scatter and line plot(RC_DT$GC,log(RC_DT$RC+0.01),cex=0.1,xlab="GC Content",ylab=expression(paste("log(NRC"["lib"],"+0.01)",sep="")))lines(RC_DT$GC,predictions1,col = "red")


取殘差,去除GC含量對深度的影響

#sustract the influence of GCresi <- log(RC_DT$RC+0.01)-predictions1RC_DT$RC <- resisetkey(RC_DT,GC)

此時RC_DT$RC就是normalize之后的RC

畫圖顯示nomalize之后的RC,并將擬合的loess曲線和normalize之后的數(shù)據(jù)保存

#plot scatter and line using Norm GC dataplot(RC_DT$GC,RC_DT$RC,cex=0.1,xlab="GC Content",ylab=expression("NRC"["GC"]))gcCount.loess <- loess(RC~GC,data=RC_DT,control = loess.control(surface = "direct"),degree=2)save(gcCount.loess,file="/home/ywliao/project/Gengyan/gcCount.loess.Robject")predictions2 <- predict(gcCount.loess,RC_DT$GC)lines(RC_DT$GC,predictions2,col="red")save(RC_DT,file="/home/ywliao/project/Gengyan/RC_DT.Rdata")


當(dāng)然,也想看一下amplicon 長度len 對RC的影響,不過影響不大


全部代碼如下(經(jīng)過修改,可能與上面完全匹配):

library(data.table)load("/home/ywliao/project/Gengyan/RC_DT.Rdata")RRC_DT <- RC_DT[Type=="WBC" & !is.na(RC),]lst <- list()for (Samp in unique(RC_DT$Sample)){RC_DT <- RRC_DT[Sample==Samp]####loess GC vs RC####gcCount.loess <- loess(log(RC+0.01)~GC,data=RC_DT,control = loess.control(surface = "direct"),degree=2)predictions1<- predict (gcCount.loess,RC_DT$GC)#plot scatter and line #plot(RC_DT$GC,log(RC_DT$RC+0.01),cex=0.1,xlab="GC Content",ylab=expression(paste("log(NRC"["lib"],"+0.01)",sep="")))#lines(RC_DT$GC,predictions1,col = "red")#sustract the influence of GCresi <- log(RC_DT$RC+0.01)-predictions1RC_DT$NRC <- resisetkey(RC_DT,GC)#plot scatter and line using Norm GC data#plot(RC_DT$GC,RC_DT$NRC,cex=0.1,xlab="GC Content",ylab=expression("NRC"["GC"]))gcCount.loess <- loess(NRC~GC,data=RC_DT,control = loess.control(surface = "direct"),degree=2)predictions2 <- predict(gcCount.loess,RC_DT$GC)#lines(RC_DT$GC,predictions2,col="red")lst[[Samp]] <- RC_DT}NRC_DT <- rbindlist(lst)save(RC_DT,file="/home/ywliao/project/Gengyan/NRC_DT.Rdata")####loess len vs RC###setkey(RC_DT,Len)len.loess <- loess(RC_DT$NRC~RC_DT$Len, control = loess.control(surface = "direct"),degree=2)predictions2<- predict (len.loess,RC_DT$Len)#plot scatter and line plot(RC_DT$Len,RC_DT$NRC,cex=0.1,xlab="Length",ylab=expression(paste("log(RC"["GC"],"+0.01)",sep="")))lines(RC_DT$Len,predictions2,col = "red")

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對武林網(wǎng)的支持。

上一篇:返回列表

下一篇:使用R語言繪制散點圖

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
国产精品久久久久久久久久新婚| 亚洲精品午夜国产va久久成人| 好吊色欧美一区二区三区四区| 99精品桃花视频在线观看| 亚洲最大的成人av| 九九九九热精品免费视频| 中文字幕人成乱码在线观看| 久久久久久久久久综合| 五月婷婷一区二区三区| 日韩高清国产一区在线观看| 女色窝人体色77777| 好吊视频一区二区三区| av不卡免费看| 亚洲精彩视频| 亚洲天天做日日做天天谢日日欢| 亚洲国产精品久久久男人的天堂| 日韩视频免费中文字幕| 夜夜精品视频一区二区| 欧美精品tushy高清| 亚洲视频在线观看免费视频| 亚洲国产电影在线观看| 欧美三级一区| 综合蜜桃精品| 欧美一区二区性| 最近中文字幕av免费高清| 99久久夜色精品国产网站| www日韩精品| 国产成人综合美国十次| 中文字幕人妻一区| 国产乱子伦精品无码码专区| 欧美日韩国产成人在线| 欧美精品久久久久久久| 日本一区二区免费高清视频| 超碰97人人干| 久久精品99久久久久久久久| 黄色一级视频播放| 成年丰满熟妇午夜免费视频| av网址在线| 日本黄色一级网站| 国产又黄又大久久| 欧美不卡福利| www.色五月| 久久久久久久久久免费视频| 日韩在线欧美| 亚洲午夜高清视频| 老司机精品视频一区二区| 艳女tv在线观看国产一区| 波多野在线播放| 污污视频在线| 久久视频在线| 天天插天天色| 国产真实乱人偷精品| 免费成年人高清视频| 男男做爰猛烈叫床爽爽小说| 日本免费在线精品| 国产精品色婷婷| 97一区二区国产好的精华液| 国产欧美最新羞羞视频在线观看| 国产·精品毛片| 欧美男男青年gay1069videost| 色999日韩国产欧美一区二区| 最近中文字幕2019第二页视频| 高清毛片aaaaaaaaa片| 精品美女久久久久| 国产欧美日韩一区二区三区在线观看| 后进极品白嫩翘臀在线视频| 欧美偷拍视频| 深夜福利av你懂的| 91久久精品国产91性色tv| 激情欧美日韩一区| 成人成人成人在线视频| 中文天堂在线一区| 成人av资源网址| 九色porny丨精品自拍视频| 亚洲av无码专区在线| 亚洲一二三级电影| 爱情电影社保片一区| 狂野欧美性猛交xxxxx视频| 欧美日韩一区综合| av色综合久久天堂av色综合在| 日韩电影免费观看高清完整版在线观看| 日韩中文字幕精品视频| 国产一区福利视频| 欧美激情15p| 国产精品国产三级国产专播品爱网| 最新电影电视剧在线观看免费观看| 国产乱子伦精品| 性xxxfreexxxx性欧美| 精品国精品国产尤物美女| 视频在线观看91| 成人在线免费观看黄色| 毛片av在线| 久久国产综合| 国产三级在线免费| 国产成人精品777777| 亚洲天堂2018av| 亚洲va欧美va人人爽| 中国一区二区视频| 欧美老女人性视频| 丁香婷婷综合激情| 成人性生活av| 日韩一本精品| www.爱久久| 丝袜+亚洲+另类+欧美+变态| 国产剧情在线视频| 欧美丰满熟妇bbbbbb| 天堂精品视频| 99中文字幕在线观看| 骚视频在线观看| 韩日在线播放| 视频在线观看一区二区| 国产91精品精华液一区二区三区| 亚洲jizzjizz日本少妇| 欧美日韩精品是欧美日韩精品| 欧美激情综合五月色丁香| 亚洲一区二区三区激情| 国产黄色av免费看| 国产在线1区| 美女精品一区最新中文字幕一区二区三区| 激情婷婷丁香| 成人在线观看免费完整| 亚洲国内精品| 粉嫩蜜臀av国产精品网站| 亚洲狠狠丁香婷婷综合久久久| 视频欧美精品| 欧美日韩中字一区| 亚洲精品一区二区三区樱花| 久久久成人av| 成人黄色毛片| 午夜精品一区二区三区在线| 美女久久精品| 成人成人成人在线视频| 国产精品白丝av嫩草影院| 亚洲精品一区二区三区网址| 91在线三级| 色综合成人av| 蜜桃av噜噜一区二区三区小说| 91精品黄色| 婷婷成人激情| 日韩成人在线观看视频| 久久亚洲国产成人精品无码区| 99久久夜色精品国产亚洲96| 91夜夜蜜桃臀一区二区三区| 天天操天天操天天干| 国产视频123区| 性猛交富婆╳xxx乱大交一| 欧美日韩另类字幕中文| 成人av综合一区| 欧美色手机在线观看| 免费精品一区二区| 成年人在线播放| 3d精品h动漫啪啪一区二区| hitomi一区二区三区精品| 少妇精品久久久一区二区三区| 亚洲成人av一区| 99视频超级精品| 日韩一区二区免费电影| 色婷婷综合中文久久一本| 久久国产精品系列| 日韩一区二区三区观看| 伊人国产在线观看| 亚洲综合在线五月| 粉嫩绯色av一区二区在线观看| 欧美午夜宅男影院| 色九视频91| 国产福利成人在线| 国产精品久久久久久久av| 久久亚洲精品国产亚洲老地址| 精品欧美一区免费观看α√| 日本一区二区三区四区高清视频| 亚洲精品综合网| 韩国精品主播一区二区在线观看| 久久精品国产99精品国产亚洲性色| 日韩欧美一二三区| 一本大道色婷婷在线| 久九九久频精品短视频| 亚洲大片av| 97久久综合精品久久久综合| 成人夜晚看av| 91偷拍一区二区三区精品| 91精品亚洲| 色戒汤唯在线观看| 国产精品一区二区在线观看不卡| 91亚洲视频在线观看| h片在线免费观看| 男同互操gay射视频在线看| 日本视频一区二区在线观看| 六月婷婷综合网| 亚洲麻豆一区二区三区| 精品国产福利| 成人在线视频免费| 97久久精品人人爽人人爽蜜臀| 久久精品aaaaaa毛片| 一区二区三区鲁丝不卡| 老司机午夜精品视频在线观看| 日韩在线观看av| 成年网站在线播放| 欧美另类中文字幕| 无码少妇一区二区三区| 美女999久久久精品视频| 欧美日韩国产一区二区三区地区| 麻豆传媒在线视频| 欧美精品色一区二区三区| 成人黄网18免费观看的网站| 欧美18免费视频| 性欧美xxx极品另类| 91九色porn蝌蚪| 神马影院一区二区| 伊人在线视频观看| 亚洲精品久久久久久一区二区| 蜜桃精品一区二区三区| 欧美日韩精品区别| aaa在线播放视频| xxxxx69·hd| 中文字幕精品无码亚| 四虎精品永久在线| 国产精品一区久久| 国产freexxxx性播放麻豆| 亚洲人metart人体| 国产精品186在线观看在线播放| 中文字幕在线视频精品| 国产一区二区三区精品久久久| 91在线看视频| 欧美性理论片在线观看片免费| 亚洲人挤奶视频| 五月综合网站| av在线最新| 老司机在线视频二区| 国产一级特黄视频| 99精品视频国产| caopor在线| 中文字幕一区二区三区免费视频| 欧美国产成人精品一区二区三区| 欧美激情一区二区三区在线视频| 视频免费1区二区三区| 久久毛片高清国产| 日本中文字幕一级片| 国产不卡一卡2卡三卡4卡5卡在线| 国产传媒国产传媒| 成年人视频网站| 激情欧美一区二区三区黑长吊| 精品一区二区三区四| 91亚洲国产成人精品一区二三| 亚洲国产一区二区三区四区| 日本免费高清不卡| 久久夜色精品亚洲噜噜国产mv| 成人久久18免费网站图片| 国产精品999久久久| 亚洲精品久久久蜜桃| 日韩欧美aaaaaa| 免费看的www视频网站视频| 九九视频九九热| aa级大片免费在线观看| 久草在线看片| 久久久一区二区三区不卡| 国产精品网址| 国产视频91在线| 欧美日本一区| 国产成人亚洲综合a∨婷婷图片| 黄色一级片一级片| 精品高清久久| 在线看污网站| 午夜精品美女自拍福到在线| 中文字幕色视频| 黄频网站在线观看| 乱精品一区字幕二区| 日韩一区二区三区四区五区| 久久久久狠狠高潮亚洲精品| 9191国产视频| 日韩欧美精品一区| 国产精品国产三级国产aⅴ9色| 在线免费观看国产精品| 国产超级va在线视频| 在线观看欧美亚洲| 成人动漫在线一区| 国产精品乱码一区二区| 欧美激情www| 网曝门事件国产精品二区| 日韩在线观看免费高清| 国产成人涩涩涩视频在线观看| 欧美一区二区少妇| 国产一级做a爰片久久毛片男| 男女羞羞视频网站| 精品国产三区在线| 亚洲精品色午夜无码专区日韩| 不卡视频一区二区三区| 明星国产一级毛片范冰冰视频| 午夜成年女人毛片免费观看| 欧美视频在线观看一区| 国产精品资源网| 国产三级中文字幕| 婷婷久久综合九色综合伊人色| 国产欧美第一页| 奇米888四色在线精品| 亚洲国产精品久久久| 精品国产伦一区二区三区观看说明| 精品久久国产97色综合| 国产在线精品视频| 精品亚洲二区| 一色屋成人免费精品网站| av中文字幕一区| 91高跟黑色丝袜呻吟在线观看| 亚洲精品在线视频免费| 国产真实乱子伦| 日本一区二区三区网站| 成人精品天堂一区二区三区| 国产一区二区播放| 欧美日韩精品免费观看视完整| 天堂中文字幕——hd| 日本中文字幕在线看| 91亚洲天堂| 日本福利一区| 一区二区视频免费完整版观看| 水蜜桃久久夜色精品一区的特点| 中文字幕一区二区不卡| 热re99久久国产精品| 老司机午夜福利视频| 亚洲色婷婷久久精品av蜜桃| 久久精品国产一区二区三区免费看| 人人澡人人澡人人看| 欧美激情极品| а√天堂中文在线资源8| 热99精品只有里视频精品| 国产偷倩在线播放| 午夜小视频免费| 国产二区精品| 椎名由奈jux491在线播放| 国产精品久久久久久久久久10秀|