为合成化学设计有效合成路线的软件一直依赖于研究者的规则输入。现在有报道称人工智能程序系统可以自己学习相关规则。

合成有机化学是一门从简单分子构建所需化学结构的科学。研究人员的知识和经验一直是成功合成路线的关键。然而,在《自然》杂志上发表的一篇论文中,赛格勒等人报道说,人工智能程序可以设计合成路线,其效果至少与人类在理论上设计的一样好。

在设计合成路线时,有机化学家经常需要使用逆向思维。20世纪60年代,e. J .科里提出了反向合成的概念,并获得了1990年诺贝尔化学奖。逆向合成为化学家提供了一种特殊的思维方式(图1)。当观察目标分子时,他们会问:“这种化合物可以由什么原料制成?要形成哪些键?哪些原子或化学基团可以被添加或转化?”然后重复该过程,直到获得前体分子。这样做的目的是通过反推法获得容易获得的起始化合物,同时平衡构成良好合成路线的各种因素,包括反应的步骤数、预期产率和所涉及的化学品的易用性。有机化学家经常不得不处理这些问题,例如准备大量化合物用于药物发现项目的测试。

图1|逆合成分析。化学家使用一种叫做反向合成的策略来设计有机分子合成的路线。首先,设计一条理论路线,将目标分子依次转化为易于制备或可购买的中间体。在这个例子中,目标分子中的红色键和原子可以从中间分子中的红色双键获得。接下来,中间体的红色双键和蓝色键可以通过两种直接可用的原料(Et是乙基的缩写)一步获得。B、然后选择将原料转化为目标分子的反应:在上述实施例中,使用Diels-Alder反应获得中间体,然后通过金属催化氧化获得目标分子。Segler等人报道的人工智能程序可以通过推断设计规则为分子设计合理的合成路线。

自19世纪中叶合成有机化学诞生以来,已经报道了大量的合成有机反应,而且数量还在不断增加。在20世纪80年代之前,许多化学家通过收集记录文献中有用反应的交叉引用手写索引卡来指导合成路线的设计。随着计算机技术的普及,这些索引卡自然会转移到数字数据库中。

近年来,当化学家们想知道将官能团X转化为官能团Y的各种方法时,他们会先用计算机程序画出感兴趣的分子结构,然后在线搜索相关的反应。这几乎总是会产生一长串问题,研究人员需要根据他们的知识和经验选择最合适的答案。很长一段时间以来,把这些反应串联成一种有用的合成方法被认为是只有人类才能做到的。

但是必须这样做吗?有没有一个程序可以基于一个足够大的、精心制作的化学反应数据库,不仅可以发现反应,还可以将它们组织成合理的合成路径?自从科里在20世纪60年代提出反向合成以来,人们一直试图找到这样一个程序,但几乎没有取得进展(直到最近)。

两个基本问题挫败了这个梦想。首先,计算机硬件无法应对如此巨大的挑战。其次,很难用软件程序能够理解的术语来定义化学文档:对于给定的反应,它们在大多数情况下适用于特定的化合物类型,但仅在特定的条件下适用。例如,官能团X将变成官能团Y,除非官能团Z存在于反应物分子的其它地方。当官能团Z存在时,如果官能团Q在同一分子附近,反应可能仍然有效,但只有当酸碱度低于一定值或温度足够高或无水时,这些反应才有效。

有许多方法可以克服第二个问题。第一个是为程序提供一个预期化学转化反应的人工详细列表,考虑所有的限制和条件。该程序然后结合这些反应,以一种类似于评估棋步组合的方式获得一条合成路线。这种方法已经取得了一定的效果,市场上有几种竞争性的商业软件产品。

赛格勒等人研究了另一种方法:我们可以设计一个程序,学习研究人员自己知道的东西,而不是研究人员将专业知识加载到机器上的过程吗?这个概念已经产生了惊人的结果。现有的程序可以自己学习玩围棋之类的游戏,而不是用人类的策略来训练它们。

作者设计了一个计算程序,可以从一个大型商业数据库中自动提取化学转化反应,并仔细使用那些已经报道过多次的反应。他们的系统认为这些选定的反应是有机合成中“可行的步骤”。当系统被要求设计目标分子的合成路线时,它将像人类一样从目标分子开始逆向工作,根据学习到的设计规则选择最有前途的前体分子,然后评估合成这些分子的可行性。作者将三种人工神经网络与随机蒙特卡罗树搜索(计算机在一些决策过程中使用的搜索算法)相结合,以缩小最有希望的合成路线的范围,并且不会很快陷入特定路线。

更重要的是,给出的路线不仅要通过程序的评分系统来评估,还要由受过训练的有机化学家对其可行性进行盲目评估。面对机器产生的目标分子的合成路线和研究文献中报道的合成路线,这些化学家对同事们研究的合成路线没有表现出任何偏好。换句话说,他们认为这个程序所提出的化学反应和研究人员所提出的一样合理。

这并不一定意味着机器建议的所有路线都能在实验室里得到预期的结果。然而,正如有机化学家遗憾的那样,许多人类设计将会失败。未来进一步的程序开发应包括这些实际结果,以确定机器提出的路线是否比人类设计的路线更好(或至少不差)。今年,值得注意的是,有一项研究评估更传统和人工管理的反向合成程序,这项研究包括一个类似的实验室测试部分。就segler和他的同事所做的程序而言,与研究人员所做的相比,Segler设计的合成路线“没有区别”是一个重大的胜利,因为它花费的时间更少,覆盖的文档更多。

如果这些项目符合预期——没有什么理由认为它们做不到——那么合成化学家的主要任务之一将会消失。技术创新在过去也有类似的效果,但它通常会取代没人会错过的繁重体力劳动。令人不安的是,日益增长的人工智能正在将其“触角”延伸到脑力劳动。尽管总会有软件无法处理的复杂、不寻常和前所未有的结构,但在解决更传统的合成问题时,研究人员将被人工智能所取代。

说智力活动可以被归类为可以被自动化取代的繁重体力工作,可能会冒犯许多化学家,让他们感到受到威胁。然而,人工智能的应用实际上将为化学家们释放更多的时间来思考更深刻的问题,如应该合成哪些分子以及为什么,而不是专注于如何制备分子的细节。并非所有研究人员都欢迎这一变化。然而,这似乎是不可避免的。