当前位置:首页 期刊杂志

谷歌:人工智能引领未来

时间:2024-05-18

□ 文Google全球技术总监、上海研发院院长 陈 晓

谷歌:人工智能引领未来

□ 文Google全球技术总监、上海研发院院长 陈 晓

说到人工智能领域,经常用到的专业用语是机器学习。人工智能起源于上世纪中期,自人工智能鼻祖图灵教授发明图灵机之后,一些科学家们就开始梦想机器是否可以在某个时刻能有人类的感知,能像人类这么聪慧智能,能够完成人类才能够完成的任务。机器学习则是实现人工智能的一种手段。在近十年里发展特别迅猛,特别是2012年以来,机器(深度)学习成为人工智能领域中最主要也最成功的方法。

大家应该会注意到最近在互联网上的新闻,从去年底到今年年初,在围棋界有一位“大师”(网上注册名为”master“)在网络上和围棋界的高手交手,连赢60场,而它就是去年3月份和韩国围棋冠军李世石在人机大战对弈的AlphaGo。有一千年历史的围棋是人类发明最智慧、最玄妙的游戏,一开始很难想象,一个人类发明的机器可以在围棋上战胜人类的大脑。人工智能原本似乎是高深尖的科技手段,因为这个事件的发生和广为传播,就把人工智能的概念推到了广大公众的视野中。

这几年机器学习和人工智能有一些井喷式的发展,为什么会这样?机器学习的概念是什么?机器学习其实是建造一些能够有一定智慧的机器,通过事例学习去训练去“琢磨”怎么完成某项任务,而不是人类用一些硬式的逻辑、固定的指示和程序让机器做到某项任务,因为有限的指令是没有办法应对非常浑沌、混乱的世界的。比如说简单的交通标志,不管是停止、让路还是禁止通行的标志,其实是有具体和标准的规则。但是在现实生活中,可能会被雾霾雨水迷糊了,会被积雪遮挡了,标志牌被撞歪了,于是有了千变万化的不可测,这时候人工智能就能起很大的作用,让机器自己学习怎么解决问题,而不是依赖人类的固定程序。

Google为什么在人工智能方面特别在乎?为什么站在这个前沿上致力于研究开发、应用和推广?Google本身的使命就是能够整合全球各种各样的信息(包括语音、图片、地图等)而且希望能够让人人使用并从中收益。而人工智能和机器学习起到最大的作用就是能够“读懂”海量的信息,帮助人们消化吸收,并提供建议。我们公司的总裁Sundar Pichai高瞻远瞩,指引公司从2012年开始投入了很多的人力物力专注于人工智能,几年来在各个方面有了一些突破性的技术革新,在应用上也有很多喜人的成果。去年他提出,“人工智能这一具有颠覆性作用的核心技术,使我们开始重新审视我们的所有产品。Google公司从移动优先将会转向人工智能优先、人工智能为先的时代。”

说到机器学习,最近更常见或者其中最主要的技术手段就是神经网络(深度学习)。机器神经网络受启发于人类自己的生物学神经网络系统,因为生物大脑里的神经元基本功能就是对外界进行感知、采集、处理并做出判断,并和其他神经元在近距离传递信息。模拟了这样的系统,机器神经网络也有大量机器神经元,每个神经元有自己的责任和义务去处理一件事,传递到最后一层做出总的判断。比如说超大的一个图片可以分成大量的小图,每一个机器神经元去处理、认知这个图片,并给出自己的结论和可能性的权重。神经网络系统最终在大量神经元的采集信息中得出一个结论,“认为”这张图片94.7%的可能性是一只狗,3%的可能性是一只猫或者其他的东西等等,尽管这张图片可能是非常混乱的,但最后能相当准确地做出最终判断。当然生物的脑神经更复杂更聪明,可以任意方向进行信息互换,而机器的神经元是一层层从输入到输出的单项传播,还没能模拟到那么复杂。深度学习的“深度”得以实现要感谢于我们所生活的这个时代正在发生着计算机计算能力、信息存贮容量和网络上数字信息的爆炸性增长。有了网络之后,人人都可以采集数据、产生数据放到云端和网络,而现在的存储能量似乎也是无限的,没有人会担心没有地方存储,总可以找到存储空间。因为存储空间的无限增长,计算能力(CPU、GPU)也能较容易地获取,加上大量的视频、音频、图片资料的产生,便促成了这两年人工智能机器学习井喷式的进步。

>> 谷歌全球技术总监、中国上海研发院院长 陈晓

一个简单的例子,比如Google有一个平台YouTube,上面有很多的视频,通过几百万张图片的截取获得图片的训练集,丢进这样一个神经网络系统(深层学习机器)进行训练,成功的关键就是要有大量的例子能够输送进去,系统有运算能力,能在这一大堆的数据中进行挖掘和训练,最后能够产生一种模型来“理解”、“辨别”图片。而现在的有些模型已经有了很大的进步,开始产生一种通用的“智能”,一个地方一种形式训练出来的模型还可以扩展到其他的应用。这个“深层”的机器学习系统,可以在最后的几层做一些适当的设置和改变,输送你自己的采样,“调教”出适合不同领域和功能的运算模型来。

Google在过去几年中,尤其是近四五年来在人工智能方面做了大量的研究,那么有哪些效果呢?翻译是我们Google的拳头产品,对人工智能的运用非常深刻。说起人工自动翻译,我在二十多年前上海交大图像所读研究生的时候做了中英翻译的语言处理方面的尝试,当时还是发展初期,我本人的能量也非常渺小肤浅,认为这个几乎不可能。虽然大家乍一想这也许是个相对简单的事,因为每种语言的词汇量有限,人类对每种语言之间的翻译有足够的认知,似乎可以一对一翻译。可是让机器翻译真的简单吗?我在国内一个一流的游乐园游玩的时候捕捉到很多让人忍俊不禁的翻译,比如一个警告牌“小心滑倒”,中国人一看都明白其实是小心不要滑倒,而牌子上英文翻译基本意思就是让人们小小心心地滑倒,这就闹笑话了。

Google翻译目前支持103种语言,每天处理的词语数量达到1400亿,92%的用户是美国以外的,现在网络上50%的页面是英语或者非英语的。翻译的需求量和大家在谷歌上所用的服务量是相当惊人的。我们最近用人工智能或者深度学习的手段可以做到这样一件事,谷歌翻译在手机上的一个应用,可以对一个物件,比方说盒装牛奶进行拍照采集图片,并截取其中文字翻译成你懂的语言,比方从英文的“milk”到“牛奶”,然后还原图片展现给你。对于热爱旅游的人们,可以通过Google翻译这一应用功能克服语言障碍,给旅游带来更多的便利和享受。

去年我们推出基于神经网络的翻译体系,替代了我们原来的基于词组的翻译系统。当时的改变是惊人的,有一个飞跃的质量提升。可能大家对具体的质量评估量化数字没有什么概念,但是做个比较,这个提升的跨度比近十年来在原来系统中所有的质量优化所提高的总和还要多,也看到某些语言已经达到了人工翻译的水平,相当喜人。很高兴地和大家分享,中文和英文对的翻译也第一批享受到了这一改变带来的进步,现在大家用的谷歌翻译(translate.google.cn)有关中英文互译全面使用了新的神经网络翻译系统。谷歌将进一步把神经网络翻译系统推广到所有103种语言。

为什么神经网络翻译可以做到更好、更自然的效果?原来的基于词组的翻译就像把一幅图分解成一小块一小块翻译然后原序拼接而成,就容易造成我们最初看到的问题,词和词的翻译是正确的,但是摆在一块儿的意义就不对了,甚至是相反的。而神经网络机器翻译系统则是整句或者整段结合上下文进行翻译,并真正了解和符合目标语言的习惯,最后再把语序进行一些调整,最终的语句更通畅、更自然、更准确,更符合目标人群“说”的话。

就像Sundar Pichai所说,我们在全面审视所有的核心产品,已经或者正在或者将要用人工智能的办法做各种尝试和优化。比如Google的搜索,其实机器学习对搜索的改变也是近两年里质量提升飞跃最大的一次改变。比如说邮件系统,垃圾邮件的诊断就一直是用人工智能机器学习的办法来处理。Google邮箱(Gmail)去年推出了一项功能,即自动回复。随着手机的广泛应用,人们更多地在用手机查邮件,因为手机的文字输入比较不便,我们就开始通过大量的邮件和机器学习训练出自动回复功能。现在手机邮件10%是通过自动回复来完成的。

在Google现有的核心产品上我们花了大量的精力推广应用人工智能,我们也在一些新兴的衍生的产品方向,通过人工智能的应用来对人类的生活和文化起到更多的推动。2011年我们推出了Google文化学院,随后2012年在中国推出,旨在记录保存人类的文化遗产并通过文化学院这个平台分享给身处世界各地的人们。目前有70多个国家的1000多个文化艺术机构跟我们合作,把他们收藏的文化遗产、人类文化和艺术的结晶数字化,在线跟大家分享。中国很多传统文化通过这个形式,让全球的文化和艺术爱好者得以接触和欣赏。而Google里就有这么一些文化艺术爱好者,又有一些技术背景,他们希望有一些新的方式去诠释和解读这些艺术作品,于是考虑到了人工智能。他们做了一个尝试,叫X-degree of Seperation,我自己把它翻成“几步之遥”,就是能否在任何的两个艺术品中,找到一种关联?提供一条视觉通道把似乎不相关的两件艺术品通过一些相似艺术品最终联系起来?对于艺术我是门外汉,但是有艺术背景的人对此功能还是感到很震撼的。

Google也在医疗健康方面有很多应用人工智能的尝试,而且取得了非常喜人的进步。比如说全球糖尿病的患者有4亿多,视网膜病变如果及时发现是可以制止和治疗的,如果没有及时治疗,会导致不可逆的失明。诊断办法其实就是有专业技能的专家们去看视网膜的眼后部的拍片。大家都知道,病人多、医生少,或者一些不发达的地方,设备和人才不能够涵盖到,这个时候人工智能和机器可以起到很大的作用。我们和印度、美国的一些医疗机构合作,利用他们所提供的医疗图片采集(大概20多万张)进行调试和训练,集成了一个模型。目前经专家评断,已经达到专家的水平。我们很高兴有这样的成果,也希望在更多的健康领域和医疗领域中,能够帮助到人类的进步。

人工智能是计算机科学的新翘楚。Google的所有核心产品和新兴领域都已经开始进行人工智能或机器学习的探索、研究和应用。我们也开源了Google机器学习系统TensorFlow供大家一起探究。我们相信人类在人工智能的技术中会受益更多,人类一直是也终将是最后的赢家!

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!