当前位置:首页 期刊杂志

数据及平台驱动的AI创新 微软智能云和智能边缘

时间:2024-05-20

崔宏禹

随着智能设备的发展,预计在2020年,全球的物联网设备所产生的数据将达到20B。那么这些设备所产生的数据应当如何处理?这是一个非常棘手的问题。

微软的世界观将我们的智能云平台的某些能力,延伸到边缘设备中,形成我们所倡导的智能云业务。因为如果将所有数据处理都放到云端,那么云端的计算将无法承受。所以我们尽可能将云端的计算能力与人工智能迁移到边缘。

我们将这一观点分为三个层面:第一,AI开发者。针对AI开发者我们运用的方法非常简单,只需要开发者运用人工智能和数据背后的能力即可。第二,AI数据科学家。目前每个企业都存储了大量数据,而数据科学家掌握数据算法,所以我们将数据科学家所掌握的算法,运用到我们的数据中。第三,AI公司。目前,运用深度学习技术的成本较高,所以我们建立了基于数据的开源平台,来深入到某些特定的行业中,来解决成本问题。

如何打造云计算的智能平台?我们将其分为三个阶段:第一,认知;第二,开放的机器学习与深度学习平台;第三,边缘计算。

在第一个部分,我们把与认知相关的服务开放出来,包括人脸识别、情绪识别、年龄识别等,我们在三年前就已经将认知服务开放出来并形成认知图谱,如今该图谱已积累了100万个使用者。

如果有些服务无法满足用户需求,那么客户可以自行制定机器所需要学习的场景,包括图片、视频、语音、CV等。此外,该图谱的所有能力,都可以部署到公有云与私有云平台,以及移动和物联网设备中。

什么是对话式人工智能?当语音数据产生时,我们可能会利用知识图谱或者人机对话以及工具等方式将其展现。

为什么我们会强调对话式人工智能服务?因为我们想赋予机器与人交流的能力。怎么样构建简单的对话式人工智能服务?我们在两年前开发了Bot Services,目前全球有30万开发者在使用该项技术。

Bot Services具备规划、部署和体验以及端到端的能力。现今要打造机器人客服,可直接使用知识图谱和人机交互技术,便可以迅速构建。

介绍一下我们的Azure平臺,微软如何构建机器学习和深度学习?

第一,最佳数据资产。目前,微软已经将自己用来进行机器训练的数据,全部贡献出来与大家共享,用户可以直接将这些数据下载后加以利用。

第二,我们提供大量的工具链。人们在运用机器学习时,需要分析数据背后的规律,而寻找数据规律最重要的环节就是算法,算法的编写十分困难,而且开发该项技术的人工成本也相对较高,所以我们就要降低人工使用机器学习算法的难度。

我们的平台是一个开放的平台,所以解决这一问题我们运用了托拉拽的方式来实现机器学习,包括参数调整、算法选择和训练集与教练集的分类等。

第三,最优算法。什么是最优算法?因为在大多数机器学习算法中,在开源的算法社区里,总会找到适合的场景算法。而在我们的平台中,微软的工程师已经将业界最优的算法放置在平台中,用户可以自行选择是否使用该算法。通过拖拉拽的方式实现机器学习过程后,便可以实现分布式部署,最终形成规律和算法。

为什么我们要在开源中开放数据?微软已经将业界最新型的深度学习算法整合到我们的平台中,并建立了开放的人工智能模型,可提高微软云计算平台的计算能力。

通过计算,用户可以将算法部署到任何想部署的环节当中。同时我们也提供高效的算力平台,该平台可以解决GPU的硬件设备算法和GPU的调度问题,并提供完整的端到端的解决方案。

我说过不能将所有工作放到平台的后端,因为大量数据处理需要在后端完成,在数据处理后就需要将它们迁移到前移的边缘设备中。微软有一个IoT Hub平台,在这个系统中所有操作系统的传感器全部是开源的。该系统可以通过我们最典型的安全协议,每秒可向云端上传1000万的数据量。

目前有很多汽车企业与共享单车企业,都在利用IoT Hub快速收集数据的能力。比如当一辆共享单车要解锁时,如果没有网络,用户的解锁请求就无法传递到后端。但当我们把云端的处理能力迁移到设备端时,共享单车就可以不需要网络进行解锁。

IoT Hub也是一个开源的平台,用户可以把程序运行放入在设备端,并在后台进行训练。无论是人脸识别模型、声音识别模型,还是设备开关的处理能力,都可以在这个平台中进行使用。

从最简单的AI能力,一直到机器学习和深度学习平台以及边缘设备上的智能能力,就形成了微软的云平台,与此同时,微软也希望与更多的合作伙伴进行合作,共同扩展云与人工智能的能力。

(根据演讲内容整理,未经本人审核)

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!