蜜桃传播传媒|欧美精品久久久久久久一区二区|91干炮视频|国产高清自拍一区|麻豆映画在线观看视频传媒www|巨乳美乳影院|日日干夜夜拍|177.sk 163.sk黑料不打烊|小视频福利|91爱看视频,广州爱豆文化传媒,人人爱人人看,91传媒制片厂苹果下载

MENU

新聞中心

當(dāng)前位置: 首頁» 新聞中心» 科研進(jìn)展

基因組所王怡雯課題組開發(fā)新型批次效應(yīng)去除方法

2023-06-14 11:23:35來源:

【字體:

  


近日,,《生物信息學(xué)簡報(bào)(Briefings in Bioinformatics)》 在線發(fā)表了基因組所王怡雯課題組聯(lián)合墨爾本大學(xué)的研究論文,題為“PLSDA-batch:a multivariate framework to correct for batch effects in microbiome data(PLSDA-batch:校正微生物組數(shù)據(jù)中批次效應(yīng)的多變量框架)”,。該研究開發(fā)了一種基于偏最小二乘判別分析(PLSDA)的多元非參數(shù)批次效應(yīng)去除方法:PLSDA-batch,,該方法可用于校正微生物組數(shù)據(jù)中由非實(shí)驗(yàn)因素導(dǎo)致的結(jié)果差異(批次效應(yīng))。



研究微生物組成和表型(包括人類疾?。┲g的聯(lián)系是微生物組研究的主要目標(biāo),,例如,腸道微生物群落的破壞與多種疾病和亞健康狀態(tài)有關(guān),,從炎癥性腸病,、糖尿病、到肥胖和營養(yǎng)不良,。然而,,由于微生物群落是高度動態(tài)的,因此微生物組數(shù)據(jù)極易受到批次效應(yīng)的影響,,批次效應(yīng)通常掩蓋了研究人員所感興趣的生物學(xué)效應(yīng)?,F(xiàn)有的批次效應(yīng)校正方法主要是為基因表達(dá)量數(shù)據(jù)開發(fā)的,沒有考慮到微生物組數(shù)據(jù)的固有特征,,包括零膨脹,、過度離散和變量之間的相關(guān)性。即使存在一些針對微生物組數(shù)據(jù)的去除批次效應(yīng)的方法,,也都存在許多使用場景和條件上的限制,。


因此,研究人員開發(fā)了一種以多元方式去除批次效應(yīng),,同時(shí)保留實(shí)驗(yàn)組差異的方法,,稱之為PLSDA-batch(下載地址:https://github.com/EvaYiwenWang/PLSDAbatch)。在此基礎(chǔ)上,,還提出了兩種延伸方法:(1)加權(quán) PLSDA-batch(wPLSDA-batch)應(yīng)對不平衡的實(shí)驗(yàn)設(shè)計(jì),,(2)稀疏PLSDA-batch(sPLSDA-batch)應(yīng)對模型過擬合現(xiàn)象。同時(shí)在模擬數(shù)據(jù)集和實(shí)際數(shù)據(jù)集上驗(yàn)證了其與目前幾種常用的方法removeBatchEffect,、ComBat和SVA相比,,具有很強(qiáng)的競爭力,特別是在去除設(shè)計(jì)不平衡的實(shí)驗(yàn)中的批次效應(yīng)上。


圖1 | PLSDA-batch的框架


為了驗(yàn)證方法的有效性,,研究人員先在模擬數(shù)據(jù)集上測試了PLSDA-batch,,并與常用的removeBatchEffect、ComBat和SVA這三種方法進(jìn)行了比較,;然后在三個實(shí)際數(shù)據(jù)集上,,與removeBatchEffect、ComBat這兩種方法進(jìn)行了對比,。


通過模擬平衡和不平衡的實(shí)驗(yàn)數(shù)據(jù),使用pRDA,、R(2),、準(zhǔn)確性指數(shù)等評估手段,與非加權(quán)的PLSDA-batch相比,,加權(quán)的版本對于不平衡的實(shí)驗(yàn)設(shè)計(jì)是必要的,。雖然PLSDA-batch與其他批次效應(yīng)校正方法相比,保留的實(shí)驗(yàn)方差比例相似或略小,,但在實(shí)驗(yàn)設(shè)計(jì)不平衡的情況下,,PLSDA-batch獲得了更高的F1得分和AUC。當(dāng)模擬數(shù)據(jù)中沒有同時(shí)具有實(shí)驗(yàn)效應(yīng)和批次效應(yīng)的變量時(shí),,sPLSDA-batch和PLSDA-batch校正后的數(shù)據(jù)接近基準(zhǔn)數(shù)據(jù),。然而,當(dāng)模擬數(shù)據(jù)含有同時(shí)包括這兩種效應(yīng)的變量時(shí),,sPLSDA-batch的效果略差于PLSDA-batch,。此外,研究人員的結(jié)果還表明,,SVA有過擬合數(shù)據(jù)的傾向,,而ComBat無法完全消除批次差異,removeBatchEffect無法保留足夠的實(shí)驗(yàn)效應(yīng)以準(zhǔn)確識別變量,。


圖2 | 模擬數(shù)據(jù)中PLSDA-batch與其他方法的各項(xiàng)檢測指標(biāo)結(jié)果


研究分析了三個采用16s rRNA測序獲得的微生物組數(shù)據(jù)集(OTU級別),,分別為海綿組織(sponge,sponge A. aerophoba)數(shù)據(jù),、厭氧消化(AD,,Anaerobic Digestion)數(shù)據(jù)、高脂肪高糖飲食(HFHS,,High Fat High Sugar diet)數(shù)據(jù),。在分析之前,計(jì)數(shù)數(shù)據(jù)均通過了中心對數(shù)比轉(zhuǎn)換,。在sponge和AD數(shù)據(jù)中,,PLSDA-batch和sPLSDA-batch的表現(xiàn)相似。這兩個數(shù)據(jù)集都具有較強(qiáng)的批次效應(yīng),研究人員使用的所有測試指標(biāo)都表明PLSDA-batch和sPLSDA-batch優(yōu)于ComBat,,后者沒有充分地去除批次差異(sponge和AD數(shù)據(jù)中),,且沒有充分地保留實(shí)驗(yàn)組差異(AD數(shù)據(jù)中)。并且與本方法相比,,使用removeBatchEffect校正的數(shù)據(jù)能保留的實(shí)驗(yàn)方差比例普遍較小,。此外,該方法,,對于批次效應(yīng)較弱的HFHS數(shù)據(jù),,相較于PLSDA-batch,用sPLSDA-batch校正后的數(shù)據(jù)丟失了少量的實(shí)驗(yàn)方差,,因?yàn)樗鼮榱吮苊膺^度擬合,,估算實(shí)驗(yàn)組分時(shí)精度沒有那么高,表明sPLSDA-batch并不適合弱批次效應(yīng),。

圖3 | 實(shí)際數(shù)據(jù)中PLSDA-batch與其他方法的各項(xiàng)檢測指標(biāo)結(jié)果


基因組所副研究員王怡雯為該論文的第一作者,,墨爾本大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院Kim-Anh Lê Cao教授為通訊作者。

該研究得到了中國國家留學(xué)基金委,,中國博士后科學(xué)基金,,中國國家自然科學(xué)基金的資助。

原文鏈接:https://academic.oup.com/bib/article/24/2/bbac622/6991121



TOP TOP