迄今为止最大的合成基因组已经诞生。这个只有部分氨基酸编码密码子的基因组使得将来编码含有非天然氨基酸残基的蛋白质成为可能。

在过去的十年中,随着DNA化学合成成本的不断降低,DNA片段的组装方法日益完善,合成生物学进入了一个合成整个染色体和基因组的新阶段。到目前为止,研究人员已经能够构建具有多达100万个碱基对的合成DNA,例如酿酒酵母的一组染色体和支原体的各种合成基因组。现在,Fredens等人在《自然》杂志上发表了一篇论文,称该团队已经合成了一个含有400万个碱基对的大肠杆菌基因组。这项研究是合成基因组学新兴领域的里程碑事件,也是合成基因组学技术在这种“勤奋”细菌中的首次应用。

来源:pixabay

合成基因组学给了我们一种全新的理解生命规律的方式,它也将合成生物学推向基因组编辑和设计的方向。这一领域的先驱是来自克雷格·文特尔研究所(J. Craig Venter Institute)的研究人员,为了确定独立活细胞所需的最小基因数量,选择了这种方法让计算机重新设计基因组片段,然后化学合成这些片段,最后完成组装。有了这项技术,这些研究人员成功地将丝状支原体的基因组大小减少了约50%。切换到基因组编辑工具将大大增加工作量,这已经被以前的大肠杆菌实验所证实——基因删除方法只能去除15%的基因组。

Fredens和他的同事使用简化的大肠杆菌基因组作为合成基因组的模板,但是他们认为还有另一种方法可以将它最小化——减少密码子。遗传密码本身具有冗余性:总共64个密码子(碱基三联体)编码20个氨基酸,以及代表蛋白质编码序列起点和终点的“起点”和“终点”。这种冗余意味着有6个编码丝氨酸的密码子和3个可能的终止密码子。大肠杆菌蛋白质编码序列中有64个可用密码子。Fredens等人通过设计、合成和组装构建了只有61个密码子的大肠杆菌基因组。他们的方法是用同义密码子替换两个丝氨酸密码子和一个终止密码子——同义密码子是指具有不同“拼写”但相同说明的密码子。以前使用基因组编辑工具的研究已经成功地合成了具有63个密码子的大肠杆菌,但是它只需要用另一个终止密码子替换具有TAG序列(基因组中的321)的终止密码子。然而,减少到61个密码子需要改变18214个密码子,所以必须采用基因组合成。

Fredens和他的同事通过一种大规模的DNA装配和基因组整合方法合成了大肠杆菌基因组,这种方法以前是为了研究大肠杆菌的密码子使用限制而开发的。他们首先在计算机上设计了DNA,然后在酿酒酵母载体中化学合成和组装了100千碱基的片段,然后被大肠杆菌摄取并直接整合到基因组的相应天然区域中(见图1)。如果这个过程重复5次,500千碱基的DNA片段可以被合成的DNA完全取代。研究小组用这种方法产生了8株大肠杆菌,每株携带覆盖不同基因组区域的合成DNA片段。后来,研究人员通过“拼接”将这些片段拼接在一起,合成了一个完整的基因组。

图1|重新编码基因组的设计和构建。

A.Fredens等人对大肠杆菌基因组的3碱基三联体(密码子)进行了重新编程,用具有相同功能的密码子AGC、AGT和TAA取代了编码丝氨酸和TAG的TCG和TCA,所述丝氨酸和TAG代表蛋白质编码序列的终止。

在基因组的某些位点,开放阅读框(即蛋白质编码区)将会重叠,对某个开放阅读框密码子的改变可能会导致重叠区发生意想不到的变化。Fredens等人通过“重构”这些ORF来分离它们,如ORF1和ORF2所示(左边两个ORF的“读取”方向相同,右边两个读取方向相反)。

C、重新设计的DNA可以在酿酒酵母中合成并组装成100千碱基的片段;这些片段被重组成片段并整合到大肠杆菌的基因组中。结合这些片段可以获得完整的功能性合成基因组。

这个大型建设项目取得了惊人的成功。缺失突变率很低,但仍存在一些挑战。大肠杆菌基因组中的许多基因将与其他基因部分重叠。研究人员发现91个重叠区域包含需要改变的密码子。这很复杂,因为蛋白质编码序列中的同义替换可能会改变由重叠序列编码的氨基酸。为了解决这个问题,研究小组“重建”了基因组中的79个位点。通过复制这个序列,他们将重叠的编码序列分成一个单独的记录序列(见图1)。虽然这种方法基本上是成功的,但有些地方需要仔细检查错误,因为重建可能改变了基因调控。

最终获得的菌株被证明是可行的,并且可以在各种典型的实验室环境中生长,但是比天然菌株生长稍慢。新菌株不再需要终止密码子TAG和丝氨酸密码子TCG和TCA,因此识别这些密码子的细胞机器也可以被移除或重新使用来补充“非标准”氨基酸——除了大多数活细胞所需的20种常见氨基酸之外的氨基酸。研究人员证实了用只有63个密码子的大肠杆菌来补充非标准氨基酸的有效性。对于生物技术项目,非标准氨基酸可以被写入理想的序列位置,以提供可以参与天然蛋白质不能参与的化学反应的残基。此外,由于支持合成大肠杆菌细胞操作的遗传密码与自然界中的其他细胞略有不同,合成大肠杆菌可读的DNA编码信息的输入和输出将变得有限,从而带来生物安全方面的好处。所有上述应用将在新的61密码子大肠杆菌中进一步扩展。这种新菌株有潜力编码一种以上的非标准氨基酸,并建立更严格的基因防火墙(因为64个密码子中有3个不再被识别)。

400万碱基对基因组的合成和遗传密码减少到61个密码子创造了合成基因组学的最新记录,但这一记录可能不会持续太久。国际Sc2.0联盟正试图合成1200万碱基对的酿酒酵母基因组的全部16条染色体,这也是第一个真核生物(包括植物、动物和真菌)的合成基因组。与此同时,该联盟还试图合成只有57个密码子的大肠杆菌基因组和比天然鼠伤寒沙门氏菌少2个密码子的合成基因组。如果成功,具有合成基因组的细菌有望在未来作为基于细胞的技术应用于人类肠道。

从纯技术的角度来看,这些不同研究中最值得注意的一点是,它们构建合成基因组的过程非常相似。它们都在酵母细胞中将合成DNA的千碱基片段(通过同源重组)组装成50-100千碱基片段,然后用这些片段(通过选择性重组)替换目标生物体中的天然序列。方法的标准化有利于某些步骤的自动化,允许更多的团队加入研究团队。基因组最小化和密码子减少只是这项技术的最初应用。未来,这项技术可能会产生功能性重组基因组或“定制”基因组,指导细胞完成特定任务。