澳大利亚悉尼大学人工智能科学家陶大成教授(右)在接受《全球科学》采访时,澳大利亚悉尼大学人工智能科学家陶大成认为,深度学习算法在基础理论方面仍有许多问题需要回答。此外,澳大利亚悉尼大学的人工智能科学家陶大成在接受《全球科学》采访时表示,在深度学习算法的基础理论方面,仍有许多问题需要回答。此外,由于自然智能的知识有限,人工智能很难在短时间内真正超越人类。

澳大利亚悉尼大学人工智能科学家陶大成教授(右)

当我和我的同事在约定的时间到达陶大成的酒店时,他刚刚开完一个电话会议。看到我们后,他迅速走出房间,热情地和我们握手,然后叫我们在接待室的沙发上坐下。这是2018年12月初的一天。陶大成应邀到北京参加由全球科学和中国数字科学博物馆联合主办的“科学联系”。本次活动的目的是邀请世界著名科学家通过现场直播或视频连接与中国公众分享各个科学领域的最新进展。我们见面的前一天晚上,他刚从澳大利亚乘飞机到达北京,住在鸟巢附近的一家酒店里。

在这家酒店,我第一次见到了陶大成。他年轻、沉稳、真诚、睿智。这是他对我的第一印象。虽然是第一次见面,但早在两三年前,陶大成这个名字就通过同事、同事和一些合作伙伴多次介绍给我。

陶大成于2002年毕业于中国科技大学,之后分别在香港中文大学和伦敦大学获得硕士和博士学位。毕业后,他在香港理工大学、新加坡南洋理工大学和澳大利亚悉尼科技大学任教。目前,他在悉尼大学工作,是工程和信息技术学院的教授。他也是人工智能的首席科学家,并领导悉尼大学人工智能研究中心。

10年来,陶大成在机器学习、机器视觉等领域,特别是在表征学习领域取得了巨大成就,做出了突出贡献。到目前为止,陶大成的论文被引用超过3万次,使他成为人工智能领域被引用最多的中国科学家之一。他的学术成就也给他带来了许多“星环”:2015年,他获得了澳大利亚最高科学奖——尤里卡奖;2016年,他被选为欧洲科学院的外籍成员;2018年,他被选为澳大利亚科学院的成员。2017年,他还和吴恩达、李菲菲等科学家一起被选为“中国人工智能英雄风云榜的技术创新者”。

那天,当我坐在陶大成对面,希望从他的过去中挖掘出更多的故事,让读者更多地了解这位明星科学家的生活经历时,他谦虚地说,“我的个人经历和大多数海外老师一样常见”,所以我们的谈话很快又回到了人工智能。

全球科学:你的代表性贡献之一是代表性学习。你能介绍什么是具象学习吗?

陶大成:我们可以很容易地理解真实的场景,识别场景中的人和各种物体。然而,同样的任务对计算机来说充满了挑战,因为计算机并不知道摄像机捕获的图像和视频中的每个像素代表什么。这需要我们有一个非常有效的表示学习算法来有效地表达这些像素,以帮助理解图像和视频。

表征学习不是一个新概念。例如,传统的机器学习和统计分析中常用的主成分分析和判别分析都是对原始数据(或原始特征数据)进行变换,以找到一种有效的数据表示方式来完成以下任务,如检测和分类。令牌学习的目的是从原始数据中学习更准确和健壮的特征,同时尽可能地去除或减少数据中的冗余信息和噪声。

全球科学:近年来,深度学习得到了广泛应用。基于深度学习的表示学习算法有哪些优点?

陶大成:与为特定任务设计的传统特征相比,基于深度学习的表征学习能够从原始输入数据中自动提取更适合目标任务的特征表达式。近年来,随着计算能力的提高和深度学习技术的快速发展,基于深度学习的令牌学习取得了巨大的成功。目前,最好的表示学习模型能够从数据中提取高度抽象的语义信息,从而有效地完成识别和推理等任务。即使在高数据噪声和强环境干扰的情况下,基于深度学习的特征学习方法也能获得稳健的结果。特别是,借助先进的表征学习方法,计算机已经能够在各种视觉识别任务中实现甚至超过人类的表现,例如识别、检测、分割等。

全球科学:除了象征性学习,你对哪些研究方向感兴趣?

陶大成:人类的智力可以分为四个方面:感知、学习、推理和行为。我们研究人工智能的原因是让机器尽可能多地模拟人类智能,让机器帮助我们做一些事情。因此,我们希望机器也具备这四种能力。在悉尼大学人工智能研究中心的最佳选择中,我们的研究主要集中在这四个方面。

全球科学:你认为人工智能的哪些领域将在未来3-5年内实现重大突破?

陶大成:我对两个方向都有很大的期望。

首先是机器视觉。在未来3-5年内,生成的对抗网络(GAN)将生成更接近真实场景的数据。例如,自动驾驶模拟平台可以生成逼真的道路、交通标志、建筑物、天气变化、时间变化等。生成的对抗网络的快速发展将进一步提高感知模型在目标检测、识别、分割等任务中的性能。此外,机器视觉感知时域信息的能力将进一步提高。基于视频的感知模型将在行为识别、姿态估计、场景理解和重建等任务中更有效地执行,并为安全视频分析、机器人定位和导航、虚拟现实、增强现实等应用提供更强大的技术支持。

第二是自然语言理解。在接下来的几年中,如何更好地将检索和生成结合起来,更好地利用知识地图(先验知识),更好地利用预训练模型来增强对话任务中的数据,这些都有待改进。就翻译任务而言,由于端到端架构在短期内仍然难以替代,因此需要更多的增量工作和工作来提高模型的效率,例如改进模型以使其易于部署和训练,将统计机器翻译的思想和特性引入转换器,多语言翻译,低资源甚至零资源翻译,包含更多语义特征等。在基本的词汇和句法任务上,如何更好地表现和解释将是非常重要的。

全球科学:如果你做一个类比,人工智能能达到人类智能的什么年龄水平?

陶大成:在某些方面,人工智能的表现完全压倒了人类,或者说达到了人类的最高水平,比如玩围棋,在一定的环境中识别人和物体。然而,人工智能在许多方面可能不如五、六岁的孩子,如加减法(基于固定计算规则的计算器不是人工智能)、图像的语义理解等。人类进化了这么多年,达到了今天的状态。虽然人工智能的目标是模拟人类智能,但事实上,它只是一种期望,甚至是一种奢望。目前的机器仍然很难达到人类智能的水平。

首先,人们具有很强的泛化能力(即使训练数据和测试数据来自不同的地方)。然而,为了获得高性能的人工智能算法(特别是机器学习算法或深度学习算法),训练和测试数据需要是具有相同分布的独立样本。例如,我记得当我的孩子2-3岁的时候,我给他看了很多卡通图片来帮助他了解各种动物,比如大象和长颈鹿。后来,我带他去了动物园,他立刻认出了现实生活中栩栩如生的大象和长颈鹿。然而,如果我们使用卡通动物图像来训练机器学习算法,然后在真实的动物照片上测试它们,结果会很差。即使我们考虑迁移学习,虽然有了相当大的进步,但与人相比差距仍然非常明显。

其次,人是“复杂的”,而目前大多数算法只能执行特定的功能。尽管研究者们为实现多任务学习做出了巨大的努力并取得了显著的进步,但是仍然存在许多困难。因为任务之间的关系可能是相辅相成的,也可能是矛盾的。如何有效地组织不同类型的任务仍然是一个难题。

此外,我们对创造力、想象力和意识的理解仍然非常有限。著名物理学家、诺贝尔奖获得者费曼教授曾经说过,“我不能创造什么,我不理解什么”(我不能创造我不理解的东西)。这句话在人工智能领域也很恰当:为了赋予机器相关的能力,我们必须首先深刻理解什么是人类的自然智能。

全球科学:然而,随着人工智能的增强,每个人都在谈论“奇点理论”。有些人仍然担心人工智能会超越人类,甚至威胁人类的生存。

陶大成:与“奇点理论”相比,我认为事物的发展是渐进有序的,人工智能技术将遵循这样的基本规律。刚才我们谈到了人工智能的四个基本方面:感知、学习、推理和行为。从这四个方面来看,悲观地说,目前没有一种算法能够达到人类的水平。然而,说到具体的例子,有许多智能算法达到甚至超过了人类的水平。例如,AlphaGo和AlphaZero比世界冠军玩得更好。我们应该听过很多类似的例子。

总的来说,目前的人工智能算法还存在很多缺陷,不能真正达到人类自然智能的水平。目前,所谓的超越是在特定的条件下和特定的任务中实现的,需要通过大量的数据训练或大量的搜索来实现。到目前为止,目前开发的智能系统还不具备自学习和自进化的能力,甚至一些相对复杂的功能,如无人驾驶,还有很长的路要走。

此外,目前所谓的人工智能与人们的思维方式和思维能力完全不同。它也离所谓的“奇点”很远。然而,这些技术已经在改善我们的生活、工作环境和工作效率。在未来的五年里,我们还可以期待更多、更好、更成熟的技术出现,以进一步提高生产力,帮助我们更好地了解世界,改善我们的生活环境。我相信,人工智能作为一种通用工具,将使每个人在各个方面受益,并给我们更多的机会来更好地实现我们的自我价值和挖掘我们的潜力。

全球科学:在基础研究层面,人工智能科学家会考虑道德监督的问题吗?

陶大成:虽然目前的人工智能技术还存在很多缺陷,甚至可以说还很薄弱,远远达不到我们的期望,但是它的发展速度非常快,所以有必要考虑人工智能的伦理道德问题。目前,在国际舞台上,这一领域的伦理道德研究已经开展到一定程度,涵盖了广泛的科学研究人员,涉及基础技术、社会科学、法律、艺术、工业应用等诸多领域。

值得注意的是,我们需要在不同阶段考虑不同层次人工智能理论的道德问题,而不是一开始就封锁所有方面。如果是这样,技术就无法发展。从算法的角度来看,我们必须首先找出为什么我们的算法可以运行,它是如何工作的,在什么条件下它可以运行,以及它的局限性在哪里。然后,我们必须考虑它已经达到的阶段和我们应该如何监督它。

总的来说,人工智能的伦理和道德问题非常重要。我们应该尽快了解人工智能在未来会发展到什么样的状态,以及如何在每个国家的伦理道德层面上对其进行监督。只有这样,我们才能确保我们的算法在每个阶段对人类都是安全的,并能让大多数人受益。

全球科学:那么,理想的人工智能应该是什么样子?

陶大成:我们期待的人工智能首先是稳定和强大的,其次是普遍和受欢迎的,惠及所有人,而不仅仅是一小群人。我们也希望人工智能能够与人类和谐共处,增强人类能力,而不是对人类构成威胁。

此外,我们也希望人工智能能够得到解释。目前,我们总是说人工智能是黑箱理论,深层神经网络是黑箱理论。如果总是这样,未来相关技术的应用将面临许多障碍。这就像人与人之间的交流。只有当每个人都相互理解时,他们才能最容易达成协议。人和机器都是如此。如果我们不能解释机器在做什么,那么人们就不能理解它的行为。在这个时候,人们很难相信机器会做这件事。因为我们永远不知道接下来会发生什么。因此,谈到人工智能的本质,仍然存在许多问题。在基础理论等方面还有很长的路要走。

全球科学:我们离一般人工智能还有多远?

陶大成:据我所知,一般的人工智能可以和人类一样聪明。它不需要基于大量数据的复杂训练,或者经过快速训练后,具有很好的泛化能力,能够有效地完成不同类型的任务。然而,今天人工智能的主要能力是记忆和搜索,其推理能力仍然非常有限,更不用说应用、分析和创造了。因此,在人工智能的基础技术研究方面,我们还有很多事情要做,这与一般的人工智能相差甚远。一句话概括了人工智能技术的现状:它仍在发展中。