蜜桃传播传媒|欧美精品久久久久久久一区二区|91干炮视频|国产高清自拍一区|麻豆映画在线观看视频传媒www|巨乳美乳影院|日日干夜夜拍|177.sk 163.sk黑料不打烊|小视频福利|91爱看视频,广州爱豆文化传媒,人人爱人人看,91传媒制片厂苹果下载

MENU

新聞中心

當(dāng)前位置: 首頁(yè)» 新聞中心» 科研進(jìn)展

Bioinformatics | 基因組所張興坦團(tuán)隊(duì)提出一種新穎的構(gòu)建系統(tǒng)發(fā)育樹的方法

2024-06-14 12:01:57

【字體:

  


近日,中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實(shí)驗(yàn)室深圳分中心)張興坦課題組在《生物信息學(xué)(Bioinformatics)》上發(fā)表了題為“MIKE:一種超快、免組裝和免比對(duì)的系統(tǒng)發(fā)育樹構(gòu)建方法(MIKE: an ultrafast, assembly-, and alignment-free approach for phylogenetic tree construction)”的論文,提出一種無(wú)需組裝基因組、不需要多序列比對(duì)即可快速準(zhǔn)確構(gòu)建系統(tǒng)發(fā)育樹的方法。



生物進(jìn)化關(guān)系的研究是生命科學(xué)領(lǐng)域的核心之一,它揭示了生物界中物種之間的親緣關(guān)系和演化歷程。而構(gòu)建系統(tǒng)發(fā)育樹則是理解和描述這些進(jìn)化關(guān)系的主要方法之一。然而,隨著高通量基因重測(cè)序技術(shù)的廣泛應(yīng)用,研究人員面臨著處理龐大測(cè)序數(shù)據(jù)并從中準(zhǔn)確推斷物種間關(guān)系的挑戰(zhàn)。


在這個(gè)背景下,一種名為MIKE(MinHash-based k-mer算法)的新算法被引入,旨在快速而準(zhǔn)確地構(gòu)建系統(tǒng)發(fā)育樹。與傳統(tǒng)方法相比,MIKE算法具有更高的速度和更可靠的準(zhǔn)確性,為研究人員提供了一種有效的工具來解決大規(guī)模基因重測(cè)序數(shù)據(jù)分析的問題。


MIKE算法的核心在于利用了MinHash和k-mer兩種技術(shù)。MinHash技術(shù)用于快速計(jì)算兩個(gè)數(shù)據(jù)集之間的Jaccard相似度,而k-mer技術(shù)則用于提取原始測(cè)序數(shù)據(jù)的特征,從而更好地反映生物學(xué)上的相似性,并且創(chuàng)新地將k-mer分為兩部分,一部分作為標(biāo)簽值用于分組,一部分作為特征值。通過這兩種技術(shù)的結(jié)合,MIKE算法能夠快速而精確地估計(jì)物種間的進(jìn)化距離,并基于這些距離構(gòu)建系統(tǒng)發(fā)育樹。


圖1 MIKE算法框架。原始測(cè)序數(shù)據(jù)reads被切割成k-mer,隨后將每個(gè)k-mer均分成兩部分,一部分作為標(biāo)簽值,一部分作為特征值。相同標(biāo)簽值的k-mer均分為同一組,通過隨機(jī)散列函數(shù)分別對(duì)每一組k-mer進(jìn)行散列,選擇每組中第一個(gè)最小的不為0的哈希值作為最小哈希簽名。


MIKE算法的性能已在多個(gè)物種群體上進(jìn)行了驗(yàn)證和評(píng)估。研究人員利用MIKE算法重建了包括酵母、玉米、榕樹、水稻和野生甘蔗等物種在內(nèi)的系統(tǒng)發(fā)育樹,并證明了其在不同演化尺度、生殖方式和多倍體水平下的準(zhǔn)確性和穩(wěn)健性。MIKE算法在構(gòu)建系統(tǒng)發(fā)育樹方面表現(xiàn)出色,為生物進(jìn)化研究提供了強(qiáng)大的工具。


圖2 MIKE構(gòu)建的303個(gè)玉米的系統(tǒng)發(fā)育樹


除了在系統(tǒng)發(fā)育樹構(gòu)建領(lǐng)域的應(yīng)用,MIKE算法還具有廣泛的應(yīng)用前景。例如,在物種鑒定、群體遺傳學(xué)、環(huán)境微生物組學(xué)等領(lǐng)域,MIKE算法都有著潛在的應(yīng)用價(jià)值。因此,MIKE算法的引入不僅提高了基因重測(cè)序數(shù)據(jù)分析的效率和準(zhǔn)確性,還為生命科學(xué)領(lǐng)域的研究和應(yīng)用帶來了新的可能性和機(jī)遇。


基因組所與太原理工大學(xué)聯(lián)培碩士王芳為論文第一作者,基因組所張興坦研究員、太原理工大學(xué)李東喜副教授為論文的共同通訊作者。該項(xiàng)目得到廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究計(jì)劃、國(guó)家重點(diǎn)研發(fā)計(jì)劃、山西省基礎(chǔ)研究任務(wù)、國(guó)家自然科學(xué)基因項(xiàng)目資助。


原文鏈接:https://doi.org/10.1093/bioinformatics/btae154



TOP TOP