“然而它还没有达到模糊病毒与细菌概念的程度,”刘军持不同观点,病毒与细菌的界限并不是用大小来定义的。
病毒的生命活动严重依赖宿主细胞,它通过特异的受体结合蛋白,让细胞受体“接受”自己,促使病毒的囊膜与细胞膜融合,病毒借机把遗传物质注入宿主细胞,借由宿主细胞内的“原料”开始自我复制,装配新病毒而后释放。而目前发现的“大”病毒并未跳出这个范围。
在生命活动方面,病毒甚至还不及线粒体更“像”单独的生命。线粒体是一种细胞器,内涵独立的DNA遗传分子,并能够通过生物化学反应,产生生命活动需要的能量。
因此,测定基因序列仅仅是研究的第一步,了解新病毒的关键,是要确定其表达了多少蛋白以及蛋白的功能。由于病毒只有在宿主细胞中才会进行基因表达、基因组复制和病毒粒子的装配,因此研究病毒的活动需要借助于特异性宿主细胞。
而目前,人类能够用特异性宿主细胞分离的病毒,相对于自然界存在的病毒库来讲,可以说是少之又少。因此,近年来科学家们借助于快速发展的深度测序技术和人工智能技术发现新病毒,并对其特征进行研究。
人类认识病毒的能力大幅提升
2016年11月,《自然》杂志发表中国疾病预防控制中心传染病预防控制所张永振研究员团队论文《无脊椎动物RNA病毒圈的重新界定》,通过深度转录组测序在220种无脊椎动物中共计发现超过1445种全新的病毒,其中一些病毒与现有已知病毒的差异性足以把它们定义为新的病毒科。
RNA病毒圈的重新界定,就是在原有已知RNA病毒种类基础之上,发现大量新的RNA病毒,展现给人类一个连贯的、模块化的病毒基因组进化模式,而不是一个支离破碎的病毒分类体系。
RNA病毒是一大类以RNA而不是DNA作为遗传物质的重要病毒,与人类健康息息相关,包括艾滋病病毒、重症急性呼吸综合症(SARS)冠状病毒、埃博拉病毒、流感病毒等,这类病毒变异相对较快。更值得关注的是,RNA病毒也经常从细胞生物中获取基因,包括RNA解旋酶、甲基转移酶基因等。
大量新RNA病毒的发现及其特征研究为完整地了解病毒与宿主的的相互作用和共进化史研究提供了坚实的基础。
而在《自然》杂志近日发布的一则消息中,研究人员利用人工智能(AI)发现了近6000种未知的病毒。
研究人员通过对来自不同环境的样本进行深度测序,通过匹配“特定序列”来寻找未知的病毒。但需要特定序列作为“检索词”,更多时候检索词未知,就难以寻找。而机器学习通过算法解析数据,从中学习,然后自主分类信息,可以解决“检索词”未知的问题。
美国能源部联合基因组研究所(JGI)的计算生物学家 Simon Roux 训练计算机识别不常见的 Inoviridae 病毒科的基因序列。Roux提出了一种机器学习算法,其中包含两组数据:其中一组含有来自已知的Inoviridae的805个基因组序列,另一个含有来自细菌和其他类型病毒的约2000个序列。该算法可以帮助找到区分这两种序列的方法。
接下来,Roux向模型上传大量宏基因组学数据,通过该模型的计算,发现了该数据中包含超过10000个Inoviridae基因组,并可将其分成不同的病毒种,并且,其中一些病毒种类之间的差异如此之大,以至于可能定义新的病毒科。
“随着人类认识病毒和研究病毒的技术不断发展,更多新奇的病毒形态正在发现的路上,”刘军说,“这些发现将有助于人们构建病毒的检测与监测体系,也有助于提高对由未知病原体引起的传染病或者说近期世界卫生组织提到的X疾病的认识,从而做到针对性的预防和控制。”