问一个AlphaGo总工程师

时间：2024-04-24

大卫·席尔瓦：渴望通过技术建立一种深邃而完美的智慧

人物＝P

大卫·席尔瓦=S

P：为了完成AlphaGo在乌镇和柯洁的三局对弈，你们做了哪些准备？

S：我们没有为了特定的对手而做任何特殊准备，AlphaGo的伟大之处在于它是通过自我博弈来训练的，我们相信算法已经发现了最佳策略。不管怎样，我们不是足够强大的围棋棋手，去给出特定的调整，因为我们有可能最终会导致程序变弱。

P：从伦敦出发到中国前心情？

S：我曾经观看AlphaGo打了几百场比赛，但是它和柯洁对弈还是很特别的。跟世界冠军打比赛，你永远不可能有百分百的把握。更何况是在那么多人的注视下比赛，这是很让人伤脑筋的。不过，也会感觉人们的期望与首尔的人机大战有了极大的不同——这一次，人们期待AlphaGo能够获胜。

P：乌镇的围棋峰会给你留下怎样的印象？

S：AlphaGo能够去中国是一件非常有意义的事，因为中国是围棋的诞生之地，能够感受到观众们的兴奋是实实在在的。在乌镇围棋峰会上，我们也尝试了不同的比赛形式，包括团队赛和组合赛（编者注：乌镇围棋峰会的团队赛，即五位棋手组队与AlphaGo对弈。配对赛，即对弈双方各由一位人类棋手加AlphaGo组成，交替落子），让我觉得最棒的是，人类棋手在与AlphaGo合作过程中所创造的价值。能够看到人和机器这种合作形式为围棋带来的创造性，并且由此为这项游戏创造出新的乐趣，这是相当了不起的。

P：与人类围棋世界冠军的两次公开对弈中，给你印象最深的一件事是什么？

S：我们在首尔与李世石对弈时，一位观赛的围棋棋手向我靠近，我观察到他一直在哭，当时我很担心他是因为AlphaGo击败了一位顶级的人类棋手而难过。但事实上，他告诉我，没想到AlphaGo的落子竟能如此美妙，让他忍不住落泪。这一瞬间深深地触动了我。我希望这是一个我们有朝一日能够在其他领域复现的时刻——通过技术，建立一种非常深邃而完美的智慧，将美带进这个世界。

P：哈萨比斯（Demis Hassbis，DeepMind的创始人兼CEO、戴维·席尔瓦在剑桥大学时的同学）在接受英国卫报采访时曾讲述在剑桥时教你下围棋的故事，对你个人而言，用人工智能下围棋的想法产生于何时？

S：实际上，我第一次学习下围棋是小时候和我父亲学的，他在上世纪80年代学习人工智能。后来我在剑桥认识了Demis，我们一起创办了一家电脑游戏公司，那时会经常讨论将人工智能应用到围棋的想法——当然了，偶尔也会一起杀一盘。后来我离开了创业公司去追寻这个梦想。2004年，我在阿尔伯塔大学攻读博士学位，主攻“围棋游戏中的强化学习”，彼时的一些想法应用起来，在12年之后塑造了AlphaGo。

P：对你来说，参与开发AlphaGo最大的乐趣是什么？

S：我喜欢参与AlphaGo这个项目的每一刻。我年轻的时候，总是盼望着能成功开发出一套围棋程序——如今，现实已经远超我的想象！像在首尔和乌镇的两次人机大战，当然也还是会令人非常兴奋的，但是我最大的喜悦还是源于见证AlphaGo项目研发的进展。设计出一套算法，看着它发展到神级水平，这种感觉真的是太棒了！

P：AlphaGo Zero做到了“不借鉴任何人类经验去下围棋”，当时是怎样产生这样一个大胆的想法的？

S：我一直相信，要想在人工智能上取得进步，必须去发现它的核心原则，使系统能够自我学习。每一次去给AI加入人类的知识经验，都有可能限制系统的学习能力。因此只有通过移除这些知识与经验，才能“解放”系统，使之更“自由地”学习。

P：与你的预期相比，AlphaGo Zero真正的到来是早了还是迟了？

S：与其他研究人员相比，我对电脑围棋程序的进步速度一直持乐观态度。2006年，我还曾与一位同事打赌说，围棋程序将在10年内击败世界冠军。幸运的是，AlphaGo来得刚刚好！

P：AlphaGo Zero的出现是否意味着有关AlphaGo的项目彻底告一段落？

S：AlphaGo已经打完了它的最后一场比赛，但是我们的研究仍在持续进行，并取得进展。我一直都在寻找机器自我学习系统的新想法和算法，我很高兴它们将会被应用到新的领域，比如《星际争霸2》。

P：AlphaGo开发团队目前的工作状态?

S：AlphaGo团队目前正在致力于将他们的经验和专业知识应用到一系列不同的项目中，以解决之后将面对的更大的挑战！

P：现在来看，AlphaGo Zero的到来对于AI的发展意味着什么？

S：AlphaGo Zero的出现证明了，一套算法在不需要专业人工数据的情况下，能够在围棋这样具有挑战性的领域里达到神级水平。AlphaGo Zero所使用的技术，远比之前各个版本的AlphaGo都更为强大，因为它不再受人类知识的限制。AlphaGo Zero颠覆了人们所普遍认为的，数据和计算是人工智能进步的驱动力的想法，在这一点上，它也很重要。

P：开发AlphaGo所获得的经验中，哪些可以在未来有更具延展性的应用？

S：AlphaGo zero所采用的方法可以应用于广泛的结构化问题，包括去计划一些任务或解决某些问题，这些问题与围棋问题具备一定相似特质，它们都是需要依照正确的顺序去采取一系列行动来实现目标的。这类问题的例子包括蛋白质折叠，减少能源消耗或者寻找某种新型材料。

P：对于“警惕人工智能”的言论，你的态度是怎样的？

S：人工智能是一个强大的工具，但这并不意味着人类应该害怕它。如果它能够以伦理的和负责任的方式被使用，它有可能对世界产生非常积极的影响。

P：2017年最令你感觉兴奋的一件事？

S：当一个领域产生如此多令人兴奋的进步时，是很难做到只选出来一件最兴奋的事的。但毫无疑问，团队在AlphaGo上取得的进步是我今年一个明确的亮点！

P：如果2018年每天有25小时，多出来的1小时会用来干什么？

S：多读一篇科研论文！