蜜桃传播传媒|欧美精品久久久久久久一区二区|91干炮视频|国产高清自拍一区|麻豆映画在线观看视频传媒www|巨乳美乳影院|日日干夜夜拍|177.sk 163.sk黑料不打烊|小视频福利|91爱看视频,广州爱豆文化传媒,人人爱人人看,91传媒制片厂苹果下载

MENU

新聞中心

當前位置: 首頁» 新聞中心» 科研進展

Bioinformatics | 基因組所張興坦團隊提出一種新穎的構建系統(tǒng)發(fā)育樹的方法

2024-06-14 12:01:57來源:

【字體:

  


近日,,中國農業(yè)科學院深圳農業(yè)基因組研究所(嶺南現代農業(yè)科學與技術廣東省實驗室深圳分中心)張興坦課題組在《生物信息學(Bioinformatics)》上發(fā)表了題為“MIKE:一種超快,、免組裝和免比對的系統(tǒng)發(fā)育樹構建方法(MIKE: an ultrafast, assembly-, and alignment-free approach for phylogenetic tree construction)”的論文,,提出一種無需組裝基因組,、不需要多序列比對即可快速準確構建系統(tǒng)發(fā)育樹的方法,。



生物進化關系的研究是生命科學領域的核心之一,,它揭示了生物界中物種之間的親緣關系和演化歷程,。而構建系統(tǒng)發(fā)育樹則是理解和描述這些進化關系的主要方法之一。然而,,隨著高通量基因重測序技術的廣泛應用,,研究人員面臨著處理龐大測序數據并從中準確推斷物種間關系的挑戰(zhàn)。


在這個背景下,,一種名為MIKE(MinHash-based k-mer算法)的新算法被引入,,旨在快速而準確地構建系統(tǒng)發(fā)育樹,。與傳統(tǒng)方法相比,MIKE算法具有更高的速度和更可靠的準確性,,為研究人員提供了一種有效的工具來解決大規(guī)?;蛑販y序數據分析的問題。


MIKE算法的核心在于利用了MinHash和k-mer兩種技術,。MinHash技術用于快速計算兩個數據集之間的Jaccard相似度,而k-mer技術則用于提取原始測序數據的特征,,從而更好地反映生物學上的相似性,,并且創(chuàng)新地將k-mer分為兩部分,一部分作為標簽值用于分組,,一部分作為特征值,。通過這兩種技術的結合,MIKE算法能夠快速而精確地估計物種間的進化距離,,并基于這些距離構建系統(tǒng)發(fā)育樹,。


圖1 MIKE算法框架。原始測序數據reads被切割成k-mer,,隨后將每個k-mer均分成兩部分,,一部分作為標簽值,一部分作為特征值,。相同標簽值的k-mer均分為同一組,,通過隨機散列函數分別對每一組k-mer進行散列,選擇每組中第一個最小的不為0的哈希值作為最小哈希簽名,。


MIKE算法的性能已在多個物種群體上進行了驗證和評估,。研究人員利用MIKE算法重建了包括酵母、玉米,、榕樹,、水稻和野生甘蔗等物種在內的系統(tǒng)發(fā)育樹,并證明了其在不同演化尺度,、生殖方式和多倍體水平下的準確性和穩(wěn)健性,。MIKE算法在構建系統(tǒng)發(fā)育樹方面表現出色,為生物進化研究提供了強大的工具,。


圖2 MIKE構建的303個玉米的系統(tǒng)發(fā)育樹


除了在系統(tǒng)發(fā)育樹構建領域的應用,,MIKE算法還具有廣泛的應用前景。例如,,在物種鑒定,、群體遺傳學、環(huán)境微生物組學等領域,,MIKE算法都有著潛在的應用價值,。因此,,MIKE算法的引入不僅提高了基因重測序數據分析的效率和準確性,還為生命科學領域的研究和應用帶來了新的可能性和機遇,。


基因組所與太原理工大學聯(lián)培碩士王芳為論文第一作者,,基因組所張興坦研究員、太原理工大學李東喜副教授為論文的共同通訊作者,。該項目得到廣東省基礎與應用基礎研究計劃,、國家重點研發(fā)計劃、山西省基礎研究任務,、國家自然科學基因項目資助,。


原文鏈接:https://doi.org/10.1093/bioinformatics/btae154



TOP TOP