• <table id="caaaa"><source id="caaaa"></source></table>
  • <td id="caaaa"><rt id="caaaa"></rt></td>
  • <table id="caaaa"></table><noscript id="caaaa"><kbd id="caaaa"></kbd></noscript>
    <td id="caaaa"><option id="caaaa"></option></td>
  • <noscript id="caaaa"></noscript>
  • <td id="caaaa"><option id="caaaa"></option></td>
    <td id="caaaa"></td>

  •   想象一下,科學家們用手電筒探索一個黑暗的房間,卻只能清楚地辨認出光束范圍內的東西。說到微生物群落,他們歷來無法看到光束之外的東西---更糟糕的是,他們甚至不知道這個房間有多大。

      在一項新的研究中,來自美國勞倫斯伯克利國家實驗室和加州大學伯克利分校等研究機構的研究人員通過研究微生物群落中的蛋白功能,以一種新穎的方法更好地了解微生物群落,從而凸顯了微生物大量的功能多樣性。相關研究結果于2023年10月11日在線發表在Nature期刊上,論文標題為“Unraveling the functional dark matter through global metagenomics”。

      "論文第一作者 Georgios Pavlopoulos 現為亞歷山大-弗萊明生物醫學科學研究中心的研究主任。"這是用大規模并行計算對13億個蛋白質進行的大規模分析"。

      論文共同通訊作者Georgios Pavlopoulos說,“到目前為止,我們已將已知的蛋白家族數量增加了一倍以上,并確定了許多新的結構預測。這是對13億個蛋白進行大規模并行計算的大規模分析。”

      在美國能源部聯合基因組研究所(JGI)的科學家們的指導下,這些作者開始了揭開隱藏在“黑暗”功能領域的神秘面紗的任務。他們的重點是破譯錯綜復雜的蛋白功能多樣性世界:尚未揭開面紗的微生物中的新蛋白家族和新功能。他們利用 26000 多個微生物組數據集的集體力量,成功編制了新型宏基因組蛋白家族(Novel Metagenome Protein Families, NMPF)目錄。

      論文共同通訊作者Nikos Kyrpides說,“我們如今可以通過與這些蛋白家族進行比較來分析新的數據集,或者進一步分析這些蛋白家族,以預測新的功能。”

      揭示功能性“暗物質”

      微生物群落無處不在,從土壤和胃部到深海,當涉及到能量循環時,它們能夠做很多獨特的事情---將生物量(biomass)轉化為乙醇或氫,或將太陽能轉化為氫。

      微生物群落也非常難以研究。其中的許多微生物無法在實驗室環境中培養。由于每個微生物群落都有自己獨特的微生物組成和功能,因此不可能人為地復制整個群落。

      宏基因組測序使得人們能夠通過對樣本進行全基因組測序來研究這些微生物群落中的完整基因構成,而無法區分哪個基因屬于微生物群落中的每個微生物物種。因此,這一過程需要參考現有的基因組序列。

      其中的一些蛋白被科學家們稱為“已知的已知(known knowns)”,即它們與具有已知功能的基因相似。另一些則被稱為“已知的未知(known unknowns)”,也就是說,它們與以前從分離出的有機體中獲得的已知基因相似,但我們仍不確定它們的功能。

      然而,如果微生物群落中的某個基因與以前從分離出的有機體中獲得的已知基因不匹配,科學家們就無法得知其功能或來源。因此,這些基因通常被當作無用信息而從任何分析中剔除。這些基因代表著“未知的未知(unknown unknowns)”,因為它們與我們已經確定的任何基因都不相似。

      序列聚類分析概述。圖片來自Nature, 2023, doi:10.1038/s41586-023-06583-7。

      Kyrpides說,“在我們目前已知的蛋白家族中,有很大一部分---大約30%~50%---仍然沒有任何已知功能,但我們知道這些蛋白家族。然而,將近20年的宏基因組數據和宏基因組分析,仍然沒有對來自宏基因組本身的蛋白家族進行真正的分析。”

      最近,其他的研究團隊利用人工智能的力量解碼了蛋白序列的語言,并獲得了關于它們的可能功能的提示。然而,這些研究工作僅限于已知的蛋白序列領域。

      Pavlopoulos說,“在這項的研究中,我們不僅涉足了未知領域來了解功能多樣性的廣闊前景,而且還通過應用人工智能方法來揭示它們的作用,從而突破了界限。因此,我們積累了大量開創性的見解,極大地拓展了各類蛋白潛在功能的視野,包括那些在生物技術領域有著關鍵應用的蛋白,如DNA編輯酶。”

      以全新方式利用蛋白家族

      近年來,新蛋白家族的發現開始趨于平穩,這或許表明科學家們已經“捕捉”到了大量的多樣性,盡管還沒有確定它們的具體功能。但是,這些“未知的未知”可能蘊藏著怎樣的多樣性呢?

      這些作者從來自IMG (Integrated Microbial Genomes & Microbiomes)數據庫的80億個宏基因組基因開始(還參考了來自JGI的地球微生物組基因組數據)。然后,他們剔除了任何與之前已知基因有一點相似的基因,剩下大約 12 億個新基因。他們將剩下的這些基因聚類成族。在此基礎上,他們將重點放在至少有 100 個成員的家族上。

      Kyrpides解釋說,“如果你有100個序列,那么這種聚類分析的質量就會大大提高,因為很難有100個來自不同地點或棲息地的序列能夠很好地隨機對齊。重現100 次幾乎是不可能的。”

      當這些作者完成這一階段的研究工作后,他們發現在這個宏基因組空間(“未知的未知”)中,蛋白家族的多樣性遠遠超過參考基因組,至少是參考基因組的兩倍。

      Kyrpides說,“隨著我們不斷增加樣本,我們得到了更多的蛋白家族。再過幾年,隨著我們繼續對更多的宏基因組進行測序,一些目前只有50個或更多成員的家族也將增加到100個或更多成員。因此,我們說多樣性增加了一倍,但實際上可能會增加三倍、四倍、五倍或十倍。”

      進一步挖掘多樣性

      雖然這些作者沒有深入研究功能,但是他們能夠進一步描述這些家族的特征。他們按照環境將這些蛋白家族進行分類,發現只有7%的蛋白家族在所有八個環境類別中共享。相反,蛋白家族偏愛特定的環境---無論是土壤、動物宿主還是海洋生態系統等。

      Pavlopoulos解釋說,“因此,它們一定是在為那個棲息地做一些有趣或重要的事情。這絕對是科學界如今可以進一步利用的材料。比方說,有人正在研究土壤環境或人體---他們可能會選擇其中的一些蛋白科學,并嘗試從功能上描述它們的特征,因為它們對該棲息地來說非常特殊。”

      分類分析發現這些蛋白家族大部分屬于細菌和病毒,不過有600萬個序列無法加以分類。這些作者還試圖通過三維建模來確定這些基因的功能,并將未知基因的結構與已知基因的結構進行比較---相似的結構意味著相似功能的可能性很高。他們還發現了具有全新結構的蛋白家族。

      這是首次利用蛋白結構來幫助描述大量微生物暗物質的特征。這項研究耗時約兩年完成,當時只測序了約2萬個宏基因組。如今,這個數字接近 6 萬。

      Kyrpides說,“在已知的微生物多樣性中,仍有70%~80%的基因組尚未被捕獲。因此,在功能多樣性方面,這種多樣性肯定也蘊藏著許多新的秘密。”(生物谷 Bioon.com)

      參考資料:

      1. Georgios A. Pavlopoulos et al. Unraveling the functional dark matter through global metagenomics. Nature, 2023, doi:10.1038/s41586-023-06583-7.

      2. Doubling Down on Known Protein Families

      https://newscenter.lbl.gov/2023/10/11/doubling-down-on-known-protein-families/


    相關文章

    蛋白冠調控納米酶活性研究獲新進展

    近日,國家納米科學中心陳春英院士、吳曉春研究員和中國科學院高能物理研究所王黎明研究員團隊合作,在蛋白冠調控納米酶活性研究領域獲新進展,相關研究已在《美國化學會志》發表。納米酶表面吸附蛋白的形狀影響催化......

    我所發展可實現靶蛋白結構穩定性分析的時間分辨紫外激光解離質譜法

    我所發展可實現靶蛋白結構穩定性分析的時間分辨紫外激光解離質譜法發布時間:2024-04-08  |  供稿部門:1822組  | ......

    年度盤點:2023年阿爾茨海默病研究初現曙光

    阿爾茨海默病(AD)又稱老年癡呆,起病隱匿,病程緩慢且不可逆,以智能障礙為主。隨著人口老齡化的進展,全球AD患者數量逐年增加,嚴重危害中老年人的健康,也給家庭和社會帶來沉重的負擔。回望2023年,AD......

    研究揭示葉綠體蛋白轉運馬達新功能

    葉綠體是植物進行光合作用的細胞器。正常發育過程受到核基因組和葉綠體基因組在多個層次的協同調控。核質互作的分子機理是葉綠體生物發生的核心科學問題之一。光合膜蛋白復合體的反應中心亞基通常由葉綠體基因編碼,......

    復旦大學650萬元采購一套超高分辨率蛋白生物藥質譜

    復旦大學超高分辨率蛋白生物藥質譜分析系統采購國際招標招標項目的潛在投標人應在通過復旦大學采購與招標管理系統(以下簡稱電子采購平臺,網址為:https://czzx.fudan.edu.cn)在線獲取招......

    揭示新的藥物靶點:KRAS蛋白的構象控制位點

    控制KRAS:揭示關鍵癌癥蛋白的變構位點研究人員在基因組調控中心和威康薩克研究所利用深度突變掃描技術全面識別了蛋白質KRAS中的變構控制位點,該蛋白質是許多類型的癌癥中最常見的突變基因之一。科學家們使......

    揭示帕金森病中蛋白聚集的秘密:NEMO蛋白的關鍵作用

    神經退行性疾病,如帕金森病或阿爾茨海默病,與大腦中蛋白質聚集的沉積有關。當細胞廢物清除系統存在缺陷或超負荷時,這些聚集物會積累。一種主要與免疫系統信號傳導過程相關的蛋白質NEMO可以防止帕金森病中發生......

    學者同聚北師大,Urimarker2023共討新發展

    ——第三屆尿液生物標志物學術研討會(Urimarker2023)順利召開11月4日-11月5日,第三屆尿液生物標志物學術研討會(Urimarker2023)于北京師范大學圓滿落幕。本次研討會采用線上線......

    Nature:通過全球宏基因組分析,將已知的蛋白家族數量翻倍

    想象一下,科學家們用手電筒探索一個黑暗的房間,卻只能清楚地辨認出光束范圍內的東西。說到微生物群落,他們歷來無法看到光束之外的東西---更糟糕的是,他們甚至不知道這個房間有多大。在一項新的研究中,來自美......

    Nature:通過全球宏基因組分析,將已知的蛋白家族數量翻倍

    想象一下,科學家們用手電筒探索一個黑暗的房間,卻只能清楚地辨認出光束范圍內的東西。說到微生物群落,他們歷來無法看到光束之外的東西---更糟糕的是,他們甚至不知道這個房間有多大。在一項新的研究中,來自美......

    人体艺术视频