让人工智能“看”得更清楚

时间：2024-04-25

张友发

据美国媒体报道，5月4日，在美国亚利桑那州钱德勒市的公路上，谷歌旗下自动驾驶公司Waymo的一辆自动驾驶汽车遭遇车祸。而在此之前的3月18日，亚利桑那州因为一起驾驶事故禁止了优步的自动驾驶实验，该事故导致了一位横穿马路女子的死亡。安全问题成为公众对自动驾驶最大的质疑。

眼擎科技公司在今年4月20号发布了国内首个车规级自动驾驶视觉成像方案eyemoreDX120，为解决自动驾驶的困局提出了自己的方案。方案建立在公司的成像芯片eyemoreX42基础上。这款芯片致力于解决复杂光线成像问题。

在交流中，眼擎科技CEO（首席执行官）朱继志措辞谨慎：“我们的方案还需要和设备商磨合，要经过车厂测试。我只能说这比现有方案前进了一大步，但能否在成像方面解决自动驾驶的安全问题，还需要观察。”

除了自动驾驶，朱继志还谈到了眼擎科技在人工智能和芯片领域的布局与野心。过程中，朱继志经常提到两个词：一是“专注”，即公司对某一个细分领域的专注；二是“机会”，包括大的技术变革给中国成像芯片产业带来的机遇。

用人工智能的思路做成像芯片

创业过程中，眼擎科技经历了4年的科技沉淀，积累了能应用于人工智能（AI）领域的复杂成像技术。眼擎科技成像芯片的核心技术是复杂光线下的稳定成像。朱继志介绍，目前人工智能的图像识别率已经很高，在实验室中能达到98%甚至99%，但来到现实场景时，图像识别率就会大大下降。

“这就像我们在淘宝上买东西，看到的都是卖家秀，拿到手的却是买家秀。这其中最大的差别，就是光线环境的问题。”朱继志认为眼擎科技研发的成像芯片能很好地解决行业痛点：“实验室与现实环境的差别是光线差异，这是最大的落地难点。我们研发的这款成像芯片就像我们的眼睛一样，能把实验室99%（的识别率）变成现场99%（的识别率）。”

这是人工智能带来的挑战与机遇。在成像芯片领域，之前芯片厂商的思路是服务于相机，研发的出发点是看镜头的人；人工智能给成像芯片带来了新的课题，研究思路从给人看转向给AI看。

朱继志说：“在传统成像芯片时代，复杂环境下的成像问题不是刚需，因为环境光线不好可以补光，甚至可以不拍。但在自动驾驶时代，这就成了刚需。”

适应新的时代需要变革原有的技术框架，但在朱继志看来，传统公司很难完成转型：“传统的架构不能解决复杂光线下成像的问题。为了解决这个问题，我们从芯片架构到算法，再到场景测试，做了很多工作，我们在复杂光线的适应情况上和传统公司不是一个层级，包括索尼。”

“过去30年，以ISP（图像信号处理器）为代表的传统成像架构一直统治着成像能力的表现，即使现在AI发展了，效果也不可能有很大的提升。原因很简单：30年前的技术架构，人们不可能考虑未来人工智能有什么需求。以前图像只考虑给人看，现在的图像是给机器看，但传统架构成形多年，积重难返。这就是技术架构的弊端。久而久之，大家没看到视觉能够突破，就会形成一种观念——认为视觉能力是不可能突破的，这也是激光雷达日后被叫好的一个原因。其实本质上，我们应该回到问题的源头，视觉能力不够，就研发新的成像引擎架构，做视觉成像专用的芯片，以此来提升汽车的视觉能力。这件事不好干，我们为此专注了4年。”

朱继志觉得这是人工智能的发展给中国芯片企业带来的机遇：“在AI芯片领域，美国比中国领先得不多，也就是几年的优势；而在传统的芯片领域领先了我们几十年。AI给中国公司带来了机会，这是一个新兴市场，我们起点相仿。”

成像技术的第一个应用场景

朱继志的思路是循序渐进，先通过4年积累掌握成像引擎核心技术，第二阶段再推出产品，也就是成像芯片。今年朱继志的目标是完成第三阶段任务，让产品在应用场景中进一步落地。目前发布的产品eyemoreDX120通过配置汽车外围接口做成适应自动驾驶的模组，将芯片产品发展为情景化的自动驾驶解决方案。

eyemoreDX120解决方案的优势在于具备较强的场景适应性，在不同场景下都能够稳定成像，解决了自动驾驶面临的复杂光线成像不稳定的问题。eyemoreDX120的镜头传感器符合接口的行业规范，能解决120dB动态范围内的自动驾驶成像问题。

朱继志将自己的方案看作自动驾驶技术的重要一环：“AI落地的时候是一个接力赛，我们前面是镜头和传感器，我们做的视觉成像处在第三棒，我们后面是成像识别。很多现在的明星芯片公司，比如地平线，都在做这个。”

眼擎科技今年打算让成像芯片在多个行业落地，而之所以选择自动驾驶作为起点，朱继志有着自己的考量：“自动驾驶对人工智能领域的技术要求很高，可以说是最高的。其次，我们的产品在自动驾驶（领域）是刚需，痛点最大。我们判断切入的标准，首先是看这个市场的容量够不够大，其次是看痛点多不多。自动驾驶恰好在这两点上都符合。”

“人工智能的应用场景很多，其中自动驾驶的应用很容易推广到其他领域，成熟的技术可以迁移到AI其他产品中。”朱继志这样解释自动驾驶对于人工智能发展的推动作用。

对于自动驾驶的未来发展，朱继志觉得问题很复杂：“自动驾驶系统相比机器人，挑战更大。自动驾驶需要人工智能不同系统的协调合作。我们只解决成像这一个点，但如果有十几个像我们这样专注的公司，那人工智能自动驾驶问题会得到很好的解决。”

眼擎科技的关键一年

对朱继志来说，今年是人工智能和眼擎科技的关键一年：“2018年是人工智能落地的一年，去年大家主要在做试点。我们公司在未来3年内会有大规模的部署，预计在各个领域开发约60个客户，让方案在不同行业落地，丰富产品线。今年是重要的布局年。”

朱继志未来打算重点在汽车、安防、工业检测和机器人等方面发力：“人工智能进入的领域越多越好，需要和更多产业去磨合试错，然后才能从小到大得到发展。而视觉是人工智能的关键点，我们需要把技术和芯片产品赋能到传统行业。”

对于未来的人工智能大局，朱继志觉得眼擎科技需要坚持好技术导向：“我希望公司能看到技术痛点，解决（痛点）后形成产品，再去寻找潜在的市场。”

至于成像芯片的对手，朱继志半开玩笑地说：“成像芯片目前的综合能力和眼睛差别还很大，我们的对手应该是人眼而不是传统公司。AI最终就是要颠覆原有格局，让机器做得比人更好，这是我们最终要解决的问题。”

链接：新的千亿级市场诞生

视觉技术分为两种：成像（imaging）和图像处理（image processing）。前端成像技术负责生成视觉图像，后端图像处理负责分析、识别、处理视觉图像。换句话说，成像相当于人的眼睛，图像处理相当于人的大脑。

目前人工智能领域的明星公司，包括商汤、旷世、地平线、云从、依图、深鉴等，都是基于图像处理算法为核心技术的公司。在过去的3年里，受深度学习技术的驱动，图像处理获得了飞速的发展，但前端的成像技术，仍然停留在20年前的水平，成为AI视觉未来发展以及商业应用落地的严重瓶颈，也是当前各大AI公司的下一个必争之地。

和数码时代相比，AI时代的成像在成像架构、算法模型、评判标准、光线适应性等诸多关键环节都发生了本质的变化。传统的数码成像技术架构已不能满足AI视觉的需求，面临迅速被淘汰的窘境。未来5年，成像技术将有望完成从“图像”到“視觉”的划时代升级，视觉成像芯片和AI处理芯片一样，成为人工智能的核心部件，由此衍生的产业升级需求，将在未来5年催生出成像领域千亿级别的新增量市场。