蜜桃传播传媒|欧美精品久久久久久久一区二区|91干炮视频|国产高清自拍一区|麻豆映画在线观看视频传媒www|巨乳美乳影院|日日干夜夜拍|177.sk 163.sk黑料不打烊|小视频福利|91爱看视频,广州爱豆文化传媒,人人爱人人看,91传媒制片厂苹果下载

MENU

新聞中心

當(dāng)前位置: 首頁(yè)» 新聞中心» 科研進(jìn)展

Genome Research | 基因組組裝評(píng)估的新標(biāo)準(zhǔn)及11個(gè)HiFi組裝軟件評(píng)估

2024-03-08 11:37:38來(lái)源:

【字體:

  


近日,,中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實(shí)驗(yàn)室深圳分中心)潘瑋華課題組聯(lián)合美國(guó)加州大學(xué)河濱分校Stefano Lonardi課題組,、福建農(nóng)林大學(xué)魏秀清課題組在《基因組研究(Genome Research)》上發(fā)表了題為“Comprehensive assessment of 11 de novo HiFi assemblers on complex eukaryotic genomes and metagenomes”的研究論文,,研究提出了5個(gè)基于特異性字串的基因組組裝新指標(biāo)用于評(píng)價(jià)組裝結(jié)果的完整性和正確性,并在4個(gè)真實(shí)數(shù)據(jù)集和40個(gè)不同倍性,、測(cè)序覆蓋度、雜合度和測(cè)序錯(cuò)誤率的仿真數(shù)據(jù)集上,,利用這5個(gè)指標(biāo)對(duì)11個(gè)基于HiFi數(shù)據(jù)的基因組和宏基因組組裝工具進(jìn)行了系統(tǒng)性評(píng)估,。





在分子生物學(xué)和基因組學(xué)領(lǐng)域,,最新的單分子測(cè)序(SMS)技術(shù),如Pacific Biosciences(PacBio)HiFi和Oxford Nanopore Technologies(ONT),,顯著提高了基因組從頭組裝的質(zhì)量,。其中,PacBio HiFi技術(shù)可產(chǎn)生超過(guò)10 kbp的長(zhǎng)序列,,且錯(cuò)誤率低于0.01%,,在人類、植物,、動(dòng)物等眾多真核基因組的組裝中取得了重大進(jìn)展,。盡管如此,基因組從頭組裝在計(jì)算上仍面臨諸多挑戰(zhàn),,包括基因組的高重復(fù)性區(qū)域,、測(cè)序錯(cuò)誤、測(cè)序覆蓋度不均或不足以及嵌合序列等問(wèn)題,。


5個(gè)組裝新評(píng)價(jià)指標(biāo)介紹


該研究系統(tǒng)地評(píng)估了11種針對(duì)HiFi測(cè)序技術(shù)的組裝工具,。通過(guò)在三個(gè)真實(shí)真核基因組數(shù)據(jù)集、34個(gè)具有不同倍性,、測(cè)序覆蓋度,、雜合率和測(cè)序錯(cuò)誤率的仿真真核基因組數(shù)據(jù)集、一個(gè)真實(shí)的宏基因組數(shù)據(jù)集以及五個(gè)具有不同組成豐度和相似性的仿真宏基因組數(shù)據(jù)集上進(jìn)行比較實(shí)驗(yàn),,來(lái)評(píng)估各組裝軟件的性能,。研究使用了標(biāo)準(zhǔn)的評(píng)估工具QUAST和BUSCO獲取連續(xù)性、完整性,、正確性,、運(yùn)行時(shí)間和內(nèi)存使用等多個(gè)評(píng)價(jià)指標(biāo)。并首次提出了5個(gè)基于特異性字串的評(píng)價(jià)指標(biāo),,包括完成率,、單拷貝完成率、重復(fù)完成率,、最大類別平均比例,、平均距離差異,用于有參考基因組時(shí)評(píng)估組裝結(jié)果的完整性和準(zhǔn)確性,。相比于已有評(píng)價(jià)指標(biāo),,基于特異性字串的評(píng)價(jià)指標(biāo)更易于針對(duì)重復(fù)序列(包括各種串聯(lián)和散在重復(fù)區(qū)域、各同源染色體的同源區(qū)域,、宏基因組中近緣基因組等)準(zhǔn)確地進(jìn)行質(zhì)量評(píng)估,。


評(píng)估結(jié)果顯示,hifiasm和hifiasm-meta分別成為組裝真核基因組和宏基因組的優(yōu)選工具,。在真核生物基因組組裝中,,hifiasm在不同方法比較的組裝基因組均具有更高的連續(xù)性,、完整性和準(zhǔn)確性;HiCanu,、Verkko與LJA次之,,但Verkko與LJA具有組裝的contig較短等缺陷;NextDenovo僅對(duì)單倍體基因組具有更好的性能,。宏基因組組裝評(píng)估中,,hifiasm-meta以及metaflye的組裝錯(cuò)誤最少,但是在面對(duì)復(fù)雜宏基因組時(shí)hifiasm-meta的完整性及連續(xù)性明顯優(yōu)于metaflye,,但同時(shí)也會(huì)保留部分冗余的序列,。


該研究為研究人員提供了關(guān)于如何利用高精度長(zhǎng)序列數(shù)據(jù)高質(zhì)量組裝復(fù)雜真核基因組和宏基因組的明確指導(dǎo),不僅為相關(guān)組裝研究推薦了最合適的組裝工具,,還指出了組裝算法可能的改進(jìn)方向,。


基因組所博士后余文娟、訪問(wèn)學(xué)生羅浩輝,,聯(lián)合培養(yǎng)博士生楊金寶,、張晟鋮、科研助理蔣和靈為本文共同第一作者,?;蚪M所潘瑋華研究員、美國(guó)加州大學(xué)Stefano Lonardi教授,、福建農(nóng)林大學(xué)魏秀清教授為本文共同通訊作者,。該研究得到了國(guó)家自然科學(xué)基金、深圳市優(yōu)秀科技創(chuàng)新人才培養(yǎng)項(xiàng)目,、美國(guó)國(guó)家自然科學(xué)基金等資助,。


原文鏈接:https://genome.cshlp.org/content/early/2024/03/01/gr.278232.123.abstract




TOP TOP