靠方程来描述复杂的真实世界，科学家是不是太天真了？

奇怪的吸引子可以帮助研究人员预测混沌系统中会发生什么

有时候，生态数据是如此的不合理。不列颠哥伦比亚省弗雷泽河上产卵的鲑鱼就是一个例子。自1948年以来，科学家们开始跟踪和调查该地区的渔业。从那以后，鱼的数量经历了几个回合的起伏。起初，人口似乎与海水温度呈负相关:每隔几十年，北太平洋的表面温度就会经历一个先变暖后变冷的过程。在跟踪调查的头几年，当海面温度下降时，鱼类数量似乎会上升。对生物学家来说，这似乎是合理的，因为鲑鱼适合在低温水域繁殖。描述种群数量和温度之间关系的方程可以为渔业管理者设置捕捞限制提供依据，从而避免过度捕捞。

然而，在20世纪70年代中期，奇怪的事情发生了:海洋温度和鱼类数量的变化不再同步。科学家们曾经认为，这两个变量之间的密切关联似乎是一种错觉，鲑鱼数量只是随机波动。

斯克里普斯海洋学研究所的生态学家乔治·杉原认为，试图用对鱼类生物习性的肤浅理解来管理重要的鲑鱼渔业是荒谬的。然而，他和他的同事们相信他们已经解开了弗雷泽河鲑鱼之谜。他们的主要灵感是放弃等式。

斯克里普斯海洋学研究所的生态学家乔治·杉原认为，用方程来模拟许多自然系统是愚蠢的。

杉原的团队开发了一种基于混沌理论的方法，他们称之为“经验动态建模”。该方法没有对鲑鱼的生物习性做任何假设，只使用原始数据作为输入信息。在设计这种方法的过程中，科学家发现海面温度的确有助于预测鲑鱼数量的波动，即使这两者之间没有简单的联系。杉原说，经验动态建模可以揭示自然界普遍存在的复杂系统中隐藏的因果关系。

现在杉原和他的同事正在将他们的想法付诸实践。他们的方法在预测2014年弗雷泽河鲑鱼迁徙方面比任何其他方法都更准确，这一点在今年早些时候的《美国国家科学院院刊》(PNAS)上有报道。杉原的方法预测迁移量为450万至910万，而太平洋鲑鱼委员会的模型预测迁移量为690万至2000万——这个预测范围太广，不足以指导想知道下一个捕鱼季节应该部署多少船只的渔民。最终实际数字约为880万。

这项成功是基于杉原和他的同事对太平洋沙丁鱼的研究结果。他们和美国国家海洋和大气管理局的科学家一起，将这种方法应用于墨西哥湾和大西洋的鲱鱼。领导这项研究的生态学家希望杉原的方法将在这一领域提供急需的预测能力，不仅对于海洋渔业，而且对于许多其他生态系统。美国地质调查局的生态学家唐·迪恩格里斯称之为“一个重大的理论突破”

杉原和其他研究人员开始将这种方法的应用从生态学扩展到金融、神经科学甚至遗传学。这些领域都涉及复杂多变的现象，通过统治科学界近300年的方程模型很难甚至不可能预测它们。迪恩格里斯说，对于这样一个系统，经验动态建模“很可能是未来的方向”。

蝴蝶效应

经验动态建模可以追溯到30多年前。20世纪70年代末，荷兰数学家芙罗莉丝·塔肯斯正在研究混沌理论。20世纪60年代，随着科学家们意识到自然界中许多复杂的现象难以预测，混沌理论逐渐出现。在混沌系统中，小扰动会导致巨大的、看似不可预测的结果。一个典型的例子是，一只蝴蝶扇动翅膀会影响几千英里以外的天气。

塔肯斯努力从混乱中寻找规律。他和物理学家大卫·鲁埃一起提出了“奇怪吸引子”的概念——坐标系中的一组点集构成影响整个系统的变量。系统状态曲线围绕着吸引子的时变曲线，就像一个纱线球。

然而，在许多自然系统中，构成坐标系的相关变量的数量非常大。几乎有无数的因素决定着特定时间和地点的天气状况，有些因素很难测量——例如，北极上空3英里处的气压。

然而，我们可以假设你可以连续准确地测量一个变量，比如纽约的温度。塔肯斯找到了一种方法，通过使用变量的当前和过去的测量值来获得系统的所有信息。该方法需要使用过去的测量来创建另一个坐标系；换句话说，一个坐标轴可以是今天时代广场的温度，第二个坐标轴可以是昨天的温度，第三个坐标轴可以是两天前的温度，依此类推。塔肯斯证明了混沌系统的整个状态至少在理论上可以嵌入到单变量时间序列中。他在1981年发表了他的“嵌入定理”。

乔治梅森大学的数学家蒂莫西·索伊尔说，这个定理“有着巨大的反响”，他扩展了原来的定理，使其得到更广泛的应用。

科学家的下一步是将它应用于现实世界，但是自然的无序与塔肯斯数学理论的纯粹性相冲突。尽管天气为混沌理论的研究提供了最初的动力，但仍然不可能准确地预测天气，因为有太多的因素在不断变化，没有一个变量能真正获得所有的信息。索尔说，只有当影响因素很少时，塔肯斯定理才能产生一定的效果。

当杉原还是普林斯顿大学的研究生时，他对塔肯斯定理有所了解。他和罗伯特·梅一起工作，罗伯特·梅是一名训练有素的物理学家，在20世纪70年代早期转向生态研究。梅擅长简单优雅的理论研究。他的一项研究证明了单一物种的数量也是随机波动的。杉原对根据五月的进展进一步使用真实世界的数据很感兴趣。1986年，在获得博士学位几年后，杉原转到斯克里普斯研究所，开始分析一名研究人员在20世纪20年代和30年代收集的浮游生物数据。杉原说:“这是一个非常好的数据集。"我知道一定有办法从它那里获得好的信息。"

基于对浮游生物数据的分析和其他研究者对麻疹和水痘的研究，杉原和梅于1990年在《自然》杂志上发表了一篇论文，描述了塔肯斯定理如何在一些非线性系统中进行短期预测。这种方法的本质在于从系统的吸引子图中找出能够代表系统当前状态的点。通过一个或两个步骤，可以预测该系统将以与过去相似的模式发展。这篇文章被许多学科的科学家引用了1000多次。这篇文章还促使杉原在职业生涯中期进入金融领域，因为许多公司对使用类似方法进行股票预测感兴趣。

杉原在2002年回归科学。他还有未完成的工作:向全世界证明，尽管生态系统复杂而混乱，但它仍然是可预测的，管理者可以利用这些预测来改进他们的工作。“我觉得我有很大的责任，”他说，“让人们理解这个原因——拥抱自然系统，尽管它们与我们的预期大相径庭。”

对数据的渴望

生态建模始于近100年前。它从一开始就深受物理学和工程学的影响。在过去的200年里，物理学和工程学都用微分方程来描述动态系统。例如，最广泛使用的捕鱼模型是里克模型，它是由加拿大生物学家威廉·里克在20世纪50年代提出的。目的是预测在未来的一年里，现有鱼群能产生多少新的成鱼。里克的原始方程包含两个参数:给定鱼群的繁殖率和环境能支持的鱼类总量，即“承载能力”。

渔业管理者仍然严重依赖里克模型，并使用包括温度在内的变量来估计渔民在不消耗鱼类资源的情况下可以获得的“最大可持续产量”。杉原说这个估计太天真了，因为他们假设鱼类数量和环境因素以简单的静态方式联系在一起。"写下一个猜测温度会以某种方式影响的等式，确实有点自大。"气候、海洋环流和人类影响等环境因素在不断变化，但由于时间限制，这些参数化模型无法适应这些变化。很难将多个因素结合起来使模型更加精确。"即使获得了更多的数据，也不一定能改进那些模型."杉原说。

相比之下，经验动态建模可以无缝地结合新数据，并且数据量的增加将总是优化模型结果。当数据量大到足以形成稠密吸引子时，塔肯斯定理效果最好，并且更容易找到系统当前状态接近前一状态的时间点。任何新的数据点都可以帮助用户观察系统的变化趋势。杉原说:“这种方法可以从数据中揭示出内在的相关性。”。他说，当这种方法付诸实践时，它确实成功了。换句话说，得到了一个好的预测结果，而不仅仅是一个美丽的拟合曲线。

杉原的工作不仅仅是纸上的数学:许多渔业科学家渴望更好的预测，美国国家海洋与大气管理局和加拿大渔业与海洋部(DFO)的研究人员已经与杉原和她的学生共同签署并发表了一些文章。然而，迄今为止，还没有一个渔业委员会真正将这些方法引入管理实践。DFO的退休分析师乔恩·施努特(Jon Schnute)表示，一个困难是，目前只有杉原和他的同事能够访问底层算法，这意味着渔业生物学家必须将他们的数据发送到斯克里普斯研究所，等待预测结果。相比之下，所有的渔业生态学家都有使用里克模型的软件。施努特说，经验动态建模“还不够成熟”。

这种情况正在逐渐改变。研究人员现在可以使用杉原的软件，他的学生也建立了一些工作室来教授软件的使用。迪安杰利斯曾经使用参数方程，现在他希望使用杉原的方法来预测湿地鱼类种群的动态。

等式结束

迪安杰利斯做了进一步的工作。2015年，杉原的团队发表了一篇关于PNAS的文章，认为经验动态建模可能参与一场巨大的变革，将长期统治科学界的方程式从神坛上移走。迪安杰利斯对此发表了评论。包括迪安杰利斯在内的许多评论家已经注意到，方程在生态学和物理学上没有取得同样的成功，这意味着需要开发新的方法。

杉原同意。他说，静态平衡方程在桥梁建设中可能非常有用，但现在是放弃在自然界复杂的非线性系统中寻找平衡的时候了。他观察到吸引人的简单联想可能会出现一段时间，但在混乱的系统中，这种联想不允许我们辨别真相。“并不是世界神秘，”他说，“而是我们观察世界的方式让它看起来神秘。”

生态学家受到新方法的启发，但他们没有忘记杉原面临的挑战。缺乏数据仍然是一个大问题。尽管医学和神经科学等领域已经能够快速产生大量数据集，而且数据产生的速度甚至比科学家处理数据的速度还要快，但生态学仍在大数据革命的道路上蹒跚前行。

索尔说，一个更困难的问题可能是时间序列的稳定性——一个测量值在今天和明天、今年和明年、几十年和几十年后是否有同样的意义。稳定性是实验科学的一个重要特征:蛋白质分子或酵母细胞在今天和100年前是同一种东西。然而，2015年弗雷泽河鲑鱼的数量记录是否与1950年同一物种的鲑鱼有相同的含义？恐怕这不太清楚。在此期间，DFO改变了对鲑鱼种群的定义，甚至鱼类本身也可能进化了。

迪恩格里斯补充说，经验动态建模还有另一个局限性:这种方法只能进行短期预测。这归结为混沌系统的根本问题:两个系统初始状态的极小差异将导致完全不同的发展道路。实际上，这意味着即使这种方法能够准确地预测下一年的鲑鱼数量，它也不能可靠地预测未来几年的数量。

由于这些和其他原因，杉原开始将他的方法扩展到生态学之外。几年前，杉原收到一封杰拉尔德·鲍的电子邮件，他是索尔克生物研究所英德尔·维尔马实验室的分子生物学家，该实验室与斯克里普斯在同一条街上。鲍确信杉原的方法可以用来解释基因表达数据。杉原起初持怀疑态度，但当他意识到鲍数据量有多大时——每小时测量人类染色体上25000多个基因的表达以形成一个协调的时间序列——他意识到自己错了。杉原、鲍和维尔马从酵母和小鼠模型开始，希望尽快发表一篇文章，展示基因网络如何在表达谱不相关时产生因果关系。

类似于经验动态建模的想法也出现在神经科学中。神经科学家非常希望预测癫痫等严重症状的发作，其他人则使用塔肯斯定理来模拟神经网络的放电模式。Sauer说，在将这一理论付诸实践方面，神经科学家可能比生态学家走得更远。然而，他说，“真正的杀手还没有出现。”

杉原也同意这一评估。“塔肯斯定理是惊人的，”他说。"显然，它的应用潜力还没有完全实现."他补充道，“我认为这种变化才刚刚开始...我认为我们正开始克服理解这些理论所需的“活化能”