时间:2024-04-24
许欢
识别图片,似乎从前只有人的视觉才能做到。随着人工智能的发展,一项新的技术ProductAI,可以充当人的视觉,不但能够自动识图,还能以图搜图,精准找到图片,听起来是不是方便多了?但这在以前是不可想象的。现在,它已开始在纺织服装领域大展拳脚。此外,它还有很多其他用途,是不是很想知道?近日,《中国纤检》记者采访了人工智能图像识别技术ProductAI的联合创始人、CEO深圳码隆科技有限公司黄鼎隆博士。
人工智能变身时尚助手
过去,我们搜索具有抽象图案的面料时,需要通过搜索引擎输入文字描述才行,但有些图案却很难用语言描述。或者也可以到面料市场比对寻找,但却耗时耗力,事倍功半;过去,如果为某个图片打标签,让客户方便搜索和购买,需要平台依据很多维度将图片进行分类,一张图片甚至有上万个关键词去描述,平均下来每张图片都要打上10个标签,因此平台需要长期雇佣一个几百人的外包团队,来专门给图片打标签。
如今,这一切将会变得简单,轻而易举便可实现,这些都要得益于人工智能在商品识别领域的实现。据了解,能使这些得以实现的是码隆科技的人工智能图像识别技术ProductAI。它有两个功能:一是企业可根据自有数据库自主搭建“以图搜图”引擎,最短几分钟内即可完成;二是自动识别图片内容,并根据内容给图片打标签。
黄鼎隆向记者介绍,它的本质是让计算机能够像人或者服装设计师那样去理解一件衣服或一块面料。我们所提供的解决方案是:把面料的花纹拍张照片,通过以图搜图的方式,就能马上找到相应花纹的面料。但我们没有面料图片的数据,而是把技术提供给企业,能否找到面料,也要看企业有没有这款花型的面料,如果有,就能在它的数据库里面找到一模一样的,如果没有,也会得到风格和色彩等方面接近的面料。当然,也可以用这项技术找服装。我们目前服务的B2B客户,就是用这项技术,让消费者在数据库中找相应的服装。
此外,这项技术还有识别时尚属性的功能。无论面料、图案、色彩、风格,还是材质,包括各种细节,如袖型、领型及其他一些属性,都能识别出来。而此前,识别这些属性是需要经过训练的服装设计师才能做到,而人工智能已具备了超越服装设计师的能力。黄鼎隆透露,机器自动打标签能够比人还准,精准度提高8%左右,而打标签的成本却降到原来的几十分之一,把人力成本减少到原来的七十分之一。
据悉,码隆科技已经和中国纺织信息中心、国家纺织产业中心结成了战略合作伙伴,用人工智能去实现流行色彩报告发布。通过时尚大数据积累分析,ProductAI人工智能已称得上是专家级时尚助手。每上传一张时尚图片,ProductAI便会自动提取出该时装所用颜色及色彩体系,并分析出每种颜色占比。对互联网或生活中海量的时尚图片,ProductAI都能够进行全面色彩分析,生成独特的分析报表。
“过去是用人在看了大量图片后去感官描述,有了这项技术能实时量化地把T台秀里衣服的相关数据提取出来,瞬间得出结论,这只是关于颜色属性的应用。但其实每个属性都可以延伸出许多应用。比如想要了解北京街头流行的外套,只要从微博等渠道获取一些街拍图,进行实时分析,就能基于大数据得出结论。”黄鼎隆说。
据了解,码隆科技的这项技术,目前还只面向企业,普通人群需要通过企业平台才能够使用。但黄鼎隆表示,也不排除ProductAI以后会发展成像百度一样方便使用的搜索引擎,但那时的交互设备也可能会改变。他举个例子:10年前我们都是通过电脑上网,10年后都转移到手机客户端,因此,他认为,在手机之后很快会出现另外一种交互设备,如,可穿戴设备、机器人或无人机,而且都有摄像头。新一代交互设备的一个趋势是以视觉为主要交互,而不是以文本为主要交互,那时用视觉寻找信息的方式会超过用文本寻找信息的方式。
攻克技术是最大挑战
据介绍,人工智能有若干应用领域,有技术相对成熟的人脸识别、车辆识别等领域,而黄鼎隆却选择了相对冷门的商品识别领域,而且是从技术门槛最高的服装识别切入。
“商品分为两类,一种是刚性的,比如桌子、书,这类商品结构相对固定;另一种是柔性物体,最典型的就是衣服,衣服会扭曲、折疊和遮挡。而我们的研发重点就是让计算机能够准确识别出各种形态的柔性商品。当一件衣服摆到面前,人眼能够迅速判断出它的颜色与材质,经验丰富的时尚编辑甚至能够说出品牌。这种判断的基础在于,见过的衣服数量和种类足够多。
因此,让计算机像人类一样做出判断,也是同样的道理。首先,要让计算机看懂商品,看懂以后,就要用海量数据来“喂养”它,不断提升它的时尚品位。“计算机一旦能看懂服装,它的识别能力将远超任何一位时尚编辑。即使最资深的时尚人士,一辈子所能见到的服装也是有限的,而计算机却可以在很短的时间内看一亿张,甚至几亿张图片,成为一个巨大的时装库。”黄鼎隆说。
但黄鼎隆也不否认,这项技术目前还处在开始阶段,刚达到可用状态,还会有巨大的提升空间。而且商品识别技术概念目前也没有广泛认知,还需要时间培养,但它的需求一直都存在。“百度刚推出时,也没那么完善,但当时至少可以使用,而不是无工具可用,再经过10多年的更新,它已经达到比较完善的程度。我们现在也一样,而且我们的客户也很愿意付费使用,像中国纺织信息中心这种国家级部门,对选择合作伙伴会很谨慎,也和我们达成了战略合作伙伴。”
虽然以图搜图的需求一直都有,但真正把这项需求变成现实,也是最近才实现,究其原因,黄鼎隆坦言,这还是得益于这几年兴起的深度学习技术,这方面中国一直走在世界前列,并且和美国并驾齐驱。在中国的科技领域中,也是和美国差距最小的一个领域,所以一开始我们就站在了巨人的肩膀上。
“另外,我们的团队成员,之前也是在微软的相关领域积累了很多经验,使得我们有这样的能力,而且我们选择的是不那么被人关注的领域。即便是深度学习技术,也有谷歌、百度这些巨头在关注,但他们要做的是一个无所不能的识别系统,难度非常大,因此,到现在还没实现可用状态。而我们选择的是商品识别里的服装领域,那些巨头并不会专门关注。”黄鼎隆说。
“况且,我们现在又找到很好的合作伙伴——中国纺织信息中心、国家纺织产品中心。因为要想解决服装领域的问题,必须要借助这个领域的专业知识,这方面我们有所欠缺。而中國纺织信息中心、国家纺织产品中心是这个行业的权威,与他们结成战略合作,把我们这方面的欠缺弥补了。当然我们的融资也很顺利,保证了运营资金的充足。这几点加起来,才使得这项创新技术得以实现。”
在人工智能这项新兴领域的创业,一路过来需要攻克的难关无数。正如黄鼎隆所说,开始时处在一片黑暗之中,你不知道这个问题有没有答案。在他看来,创业过程中,最大的挑战还是对技术的攻克。“我们在研发初期,都是在做各种各样的技术方案,它本身是科学问题,需要去研究,我们也是解决了非常多的技术问题,才走到今天这一步。”那段时间,黄鼎隆表面看起来非常正常,其实,无论在公司还是家里,不管是吃饭、洗澡,还是上厕所,他的大脑都在飞速运转,技术于他来说,才是创业过程中的最大挑战。
商业变现水到渠成
对创业公司来说,实现商业变现,是最终目的,而黄鼎隆在当初选择创业领域时,也有意选择了离商业更近的领域去做研究,他认为,一个产品必须要实现商业价值,能赚到钱的产品才是有价值的产品。而黄鼎隆的变现之路并不崎岖,在没有任何商业宣传的情况下,很多客户都来付费使用,需求一直都有,这也是他不断强调的一点。
在码隆科技提供了图像识别人工智能技术之后,视觉中国,作为国内最大视觉创意门户,图片版权维权成本大幅度下降,借助AI,视觉中国实现了全网以图搜图、图片标注,即便盗版者对图片进行修改、裁剪、涂改,还是能精准地发现盗版侵权行为,在过去人工筛查的基础上准确率提高了将近60%。在保护了设计师的版权和创意、打击盗版侵权的同时,也挽回了数千万损失。
国内面料交易平台优料宝在与码隆科技合作后,在其平台中加入了人工智能面料图像引擎,用户可以通过直接拍照面料上传到优料宝的App或网站,人工智能在对大量面料图片深度学习结果进行细化分析后,自动匹配相同或相似面料。以往,优料宝客户搜索面料时需输入文字描述,而现在,简单一步就解决了客户面料寻找难、体验差、效率低等问题,而且人工智能面料图像引擎,只用三天就上线使用了。
“现在这项技术收到的反馈非常好,这并非自我感觉良好,而是基于数字的判断,其标准就是客户愿不愿意付费使用这项技术。现在我们客户数量增长很快,当行业内有人率先使用后,很快就会有其他人快速跟进,这全是需求的导向,我认为它在商业上的空间还非常大。
比如我们到商场去买一条裙子,可能我们所能了解到的信息并不多,除了价格、外观,其实一条裙子还有很多其他信息,如是否有明星穿过这条裙子、可以搭配什么穿、裙子的款型在哪一年时装周出现的、裙子的风格是什么、适合哪些场合穿着等等。如果这些信息都能掌握,做购物决策时会容易得多。”黄鼎隆说。
有种说法是,“人工智能有一天会取代人的作用,让很多人失去工作。”对此,黄鼎隆的看法是:真正的人工智能不在于自己有多智能,而是在于让其他产品变得更智能。
“很多人对人工智能有种恐惧,认为是取代于人的,但我认为人工智能它不是取代人,而是用于延展人的能力。比如汽车延展了交通的能力,互联网延展了获取信息的能力,所以它能帮助人变得更智能,所以人工智能要走向成熟,一定要帮助别人变得更智能,而不是向谁炫耀我很智能。”
“比如一个小孩子很聪明,考试成绩很好,但他长大后的价值不是他本身有多聪明,而是能不能用聪明帮到别人。人工智能也是这样,它现阶段就像一个小孩子,在展示它有多聪明,但它如果要真正成熟起来,它的价值要体现在能够帮助别人变得更聪明。”
2016年,亚太经合组织(APEC)工商领导人峰会在秘鲁首都利马召开。码隆科技作为中国唯一一家人工智能科技企业,应邀出席峰会。APEC会议结束后,黄鼎隆的感触是,虽然各国差异很大,但很多问题却有共性,有不少可以用人工智能技术去解决。
据悉,目前,ProductAI人工智能平台面向所有商业客户开放,应用于纺织面料、时尚、可穿戴设备、电商、零售、视频、版权、安防、市场营销、艺术创作、药品识别等多个领域。码隆科技获得A轮融资后,也将加大研发力度,继续专注于计算机视觉的深度学习和技术突破,为产业提供前沿、定制化的图像识别和视觉搜索解决方案。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!