“然而它還沒有達到模糊病毒與細菌概念的程度,,”劉軍持不同觀點,,病毒與細菌的界限并不是用大小來定義的。
病毒的生命活動嚴重依賴宿主細胞,,它通過特異的受體結(jié)合蛋白,,讓細胞受體“接受”自己,,促使病毒的囊膜與細胞膜融合,病毒借機把遺傳物質(zhì)注入宿主細胞,,借由宿主細胞內(nèi)的“原料”開始自我復(fù)制,,裝配新病毒而后釋放。而目前發(fā)現(xiàn)的“大”病毒并未跳出這個范圍,。
在生命活動方面,,病毒甚至還不及線粒體更“像”單獨的生命。線粒體是一種細胞器,,內(nèi)涵獨立的DNA遺傳分子,,并能夠通過生物化學(xué)反應(yīng),產(chǎn)生生命活動需要的能量,。
因此,,測定基因序列僅僅是研究的第一步,了解新病毒的關(guān)鍵,,是要確定其表達了多少蛋白以及蛋白的功能,。由于病毒只有在宿主細胞中才會進行基因表達、基因組復(fù)制和病毒粒子的裝配,,因此研究病毒的活動需要借助于特異性宿主細胞,。
而目前,人類能夠用特異性宿主細胞分離的病毒,,相對于自然界存在的病毒庫來講,,可以說是少之又少。因此,,近年來科學(xué)家們借助于快速發(fā)展的深度測序技術(shù)和人工智能技術(shù)發(fā)現(xiàn)新病毒,,并對其特征進行研究。
人類認識病毒的能力大幅提升
2016年11月,,《自然》雜志發(fā)表中國疾病預(yù)防控制中心傳染病預(yù)防控制所張永振研究員團隊論文《無脊椎動物RNA病毒圈的重新界定》,,通過深度轉(zhuǎn)錄組測序在220種無脊椎動物中共計發(fā)現(xiàn)超過1445種全新的病毒,其中一些病毒與現(xiàn)有已知病毒的差異性足以把它們定義為新的病毒科,。
RNA病毒圈的重新界定,,就是在原有已知RNA病毒種類基礎(chǔ)之上,發(fā)現(xiàn)大量新的RNA病毒,,展現(xiàn)給人類一個連貫的,、模塊化的病毒基因組進化模式,而不是一個支離破碎的病毒分類體系,。
RNA病毒是一大類以RNA而不是DNA作為遺傳物質(zhì)的重要病毒,,與人類健康息息相關(guān),包括艾滋病病毒,、重癥急性呼吸綜合癥(SARS)冠狀病毒,、埃博拉病毒、流感病毒等,,這類病毒變異相對較快,。更值得關(guān)注的是,RNA病毒也經(jīng)常從細胞生物中獲取基因,,包括RNA解旋酶、甲基轉(zhuǎn)移酶基因等,。
大量新RNA病毒的發(fā)現(xiàn)及其特征研究為完整地了解病毒與宿主的的相互作用和共進化史研究提供了堅實的基礎(chǔ),。
而在《自然》雜志近日發(fā)布的一則消息中,研究人員利用人工智能(AI)發(fā)現(xiàn)了近6000種未知的病毒,。
研究人員通過對來自不同環(huán)境的樣本進行深度測序,,通過匹配“特定序列”來尋找未知的病毒。但需要特定序列作為“檢索詞”,,更多時候檢索詞未知,,就難以尋找。而機器學(xué)習通過算法解析數(shù)據(jù),,從中學(xué)習,,然后自主分類信息,,可以解決“檢索詞”未知的問題。
美國能源部聯(lián)合基因組研究所(JGI)的計算生物學(xué)家 Simon Roux 訓(xùn)練計算機識別不常見的 Inoviridae 病毒科的基因序列,。Roux提出了一種機器學(xué)習算法,,其中包含兩組數(shù)據(jù):其中一組含有來自已知的Inoviridae的805個基因組序列,另一個含有來自細菌和其他類型病毒的約2000個序列,。該算法可以幫助找到區(qū)分這兩種序列的方法,。
接下來,Roux向模型上傳大量宏基因組學(xué)數(shù)據(jù),,通過該模型的計算,,發(fā)現(xiàn)了該數(shù)據(jù)中包含超過10000個Inoviridae基因組,并可將其分成不同的病毒種,,并且,,其中一些病毒種類之間的差異如此之大,以至于可能定義新的病毒科,。
“隨著人類認識病毒和研究病毒的技術(shù)不斷發(fā)展,,更多新奇的病毒形態(tài)正在發(fā)現(xiàn)的路上,”劉軍說,,“這些發(fā)現(xiàn)將有助于人們構(gòu)建病毒的檢測與監(jiān)測體系,,也有助于提高對由未知病原體引起的傳染病或者說近期世界衛(wèi)生組織提到的X疾病的認識,從而做到針對性的預(yù)防和控制,?!?/p>