在过去的十年里,科学家们一直在研究微生物对人类健康的影响。为什么一些微生物会让我们生病,而另一些可以保护我们免受病原体的侵害?

研究人员采用了一种更经济的方法,而不是试图在实验室中培养每一种微生物并读取其DNA序列来测量完整的基因组:从一个地方(如肠道)采集样本,切割所有的DNA,然后读取短片段。结果是一个“宏基因组”,一个来自整个微生物群落的遗传物质的集合。

宏基因组分析方法可以低成本生成大量数据。人类微生物项目的第一阶段耗资1.7亿美元,从五个地方(口、鼻、皮肤、泌尿生殖道和胃肠道)的242名美国成年人身上采集了微生物样本。除了揭示已知微生物的秘密之外,对宏基因组信息的深入挖掘还能使我们发现未知微生物,例如这种新发现的叫做crAssphage的病毒。

粗糙噬菌体病毒是一种能感染杆菌的噬菌体。大多数人类肠道菌群都是类杆菌,这有优点也有缺点。大多数时候,人类和类杆菌之间的关系是互利的:我们为它们提供栖息地,它们帮助我们消化食物。但它们也可能造成伤害,并与糖尿病和肥胖症等身体疾病有关。产生肠毒素的脆弱类杆菌与结肠直肠癌有关。因此,以类杆菌为食的厚壳噬菌体可能有助于我们保持健康。

克拉斯噬菌体是由荷兰拉德鲍德大学医学中心的生物信息学专家巴斯·杜蒂尔博士发现的,他根据排泄物中的DNA片段重建了病毒的基因组。命名时,通常的做法是将单词组合在一起,并将第一个字母大写,而由Douthier开发的用于组装病毒基因组的计算机工具被称为cross Assembly。在接受《福布斯》采访时,他说病毒的命名并不是源于它的起源。

“起初,我们没有给它命名,只是称它为一种新病毒。”杜瓦说。他补充说,一位科学家在审阅他的研究论文时建议给这种病毒命名。“所以我想,哦,好吧,也许我可以利用这个机会推广我的电脑工具。这基本上就是克拉斯法奇这个名字的由来。”

重建粗糙噬菌体的基因组并不容易,因为宏基因组包含了整个微生物群落的DNA片段。把元基因组想象成一个装满数百个不同谜题的盒子。一种已知微生物的基因组可以用它的相关物种作为向导来组装,就像看拼图盒子上的图片来“跟随模式”,但是如何处理未知微生物呢?

杜蒂尔的计算机工具通过检测在同一元基因组中具有相同富集度的DNA片段来拼接和恢复特定的基因组。例如,您在不同的盒子中发现了具有相同特定形状的拼图块,但是盒子a中有10块,盒子b中有100块。因为这些特定的碎片具有“联合富集”,所以它们可能是同一个拼图的一部分。

杜·瓦与圣地亚哥州立大学的研究人员合作,用他的crAss软件分析了12个人类排泄物中的元基因组,发现了一组可以组合成基因组的特定DNA片段。后来,研究人员对12个粪便样本中的一个进行了DNA测试,证实了粗糙噬菌体的存在。

然后,研究人员搜索了公共DNA数据库,发现来自美国、欧洲和韩国的466个粪便基因组中有73%带有病毒。这种广泛的分布表明,粗糙噬菌体存在于世界四分之三的人口中,这意味着现在可能有数万亿种病毒生活在你的肠道中。

我们对克拉斯法奇了解不多。它非常小,在光学显微镜下看不到,但它无疑有角状的头、尾和“脚”,这是噬菌体的典型特征。它的基因组长度是97,000个碱基对。DNA图谱显示病毒有80个基因,其中只有一半是已知的基因序列。一些基因编码能够操纵宿主DNA生产机制的结构蛋白和分子,一些基因被期望编码附着于类杆菌的蛋白。