| CNCC 2019 | 雷峰网
0
本文作者: camel | 2019-11-02 21:58 | 专题:CNCC 2019 |
雷锋网 AI 科技评论按:由 CCF 主办的 CNCC 2019 学术会议于10.17—10.19 日在苏州成功举办。本届大会以“智能+引领社会发展”为主题,进行了15场特邀报告,3场大会主题论坛、78场技术论坛、22场特色活动,1000家机构代表、8000余人参展参会。
在大会第三天举办的“计算机视觉技术赋能智慧城市”分论坛中商汤科技副总裁劳世竑发表了主题为《中日计算机视觉技术:从人脸识别到自动驾驶的产业化历程》的演讲。
劳世竑:汤科技副总裁,车载事业总经理兼日本公司CEO,他在人脸识别技术产业应用上有着突出贡献,在国际会议和期刊上共发表论文90多篇,并拥有多项国际专利。
以下为劳世竑演讲的全文,雷锋网AI科技评论进行了不改变原意的编辑,内容未经本人确认。
本次报告重点讲两个阶段。第一个阶段讲我们是怎么样把美国的技术拿来用上,第二个阶段讲我们中国的技术是怎么超越美国的技术,日本和中国的合作,亦或是中国和日本的合作,次序不一样,含义完全不同。
首先我要讲一个例子,我们当时把CMU的人脸检测的技术做了一个产业应用。我们有一个客户,他的公司在世界范围内没有那么有名,但是在日本也是一个非常著名的公司。这个公司只做一件产品,主要就是给柯达做洗照片的机器。这个机器当时是完成由冲胶卷到印刷一系列的工作,完全可以用一台机器进行全部流程的自动化操作,这台机器需要具备一个功能,就是在印刷照片的时候能尽可能把照片印得好一点,当照片是在背光拍摄的情况下,能够调整照片的曝光时间,然后把照片印得更漂亮。
当时他们找到了我们,说能不能帮忙做这个工作。正好我们当时刚刚拿到了神经网络的识别器,然后我们把这个识别器进行改进,大概加速了10倍到50倍这样的速度,将这个功能提交给了这个公司,成为了一个产品。
后来我们就发现原始速度还是赶不上当前应用的需求,我们在想怎么办?分析我们在上一个事例中成功的原因,我后来思考了一下,上一次成功的原因并不是说在我们的公司里面有很多的能人,恰恰是因为我们的公司里面没有能人,没有博士,所以我们只能到全世界各地去找,能够帮助我们解决问题的合作对象。在这个过程中,我们就找到了清华的艾海舟老师,他在我们行业里面做出了非常大的贡献。我和他开始了多年的合作,这是我们在2003年,当时主要的一个成员是艾海舟老师的一个四年级学生黄畅,他和我们一块把芯片开发出来了。
注:
艾海舟老师:清华大学计算机系教授,主要从事与人脸人体相关的计算机视觉方面的研究,在人脸及人体图像理解领域提出了一系列性能优越的算法,具有重要的学术价值和明显的应用价值。发表论文80余篇,授权国际专利1项,国际专利申请4项。
黄畅:地平线机器人技术联合创始人以及算法副总裁,深度学习专家、前百度主任架构师(T10),长期从事计算机视觉、机器学习、模式识别和信息检索方面的研究。创立地平线机器人,致力于提供高性能、低功耗、低成本、完整开放的嵌入式人工智能解决方案。
当时大概是35万注册了一个芯片,这个芯片后来被日本的各个照相机厂商采用,直到现在为止,依然是世界上占用率最大的一个人脸检测的芯片。这个芯片可以帮助照相机在对焦的时候,实现准确的把焦点聚焦到人上,而不是到后面的背景上。
在我们完成了人脸检测的芯片以后,我们把一些精力放在人脸识别上面,当时应该是世界上第一款商用的手机,上面使用了人脸识别的功能,用户可以通过人脸识别技术直接解锁手机。后来因为这种手机也在市场上消失了,所以从商业角度来讲这是一个失败的案例。现在来讲人脸识别已经变得非常普及了,苹果的手机、安卓的手机上都有这样的功能,在当时在一个非常小的手机上面想要把人脸识别的功能做上去,遇到了非常多的困难,“怎么来减少使用量,怎么样加快速度”,在这个方面耗费了很多的精力。
具体我想讲一下,在这些技术的实际应用中我们究竟做了哪些工作。我们在做人脸识别、人脸检测的时候,我们需要验证角度的变化和识别性能的变化有什么关系,我们就设计了一个人脸数据采集的装置,这个装置由80台摄像头,这些摄像头能够采集同期人脸的图像。依次的采集,就可以得到各种各样角度的人脸图像,通过这样一个装置,我们就可以搜集到很多不同角度的人脸图像。虽然看上去是很基础的工作,但是给我们带来了后面能把性能做到极致的效果。在日本工程师是非常善于做很小的改进,然后把一个工作做到极致,,这一点就很值得我们学习。
在之后,我们做了一些其它的应用,当时也是一直在想,虽然人脸检测能够用在摄像头上面,能够做在数码相机的上面,但是人脸识别对我们来讲依然是很大的挑战。因为在日本也没有监控的市场,当时我们想要在手机设置人脸识系统没有成功。当然这有可能也与当时的时代和环境有关系,当时如果能够做成的话,那么到现在人脸检测技术可能会发展的更不一样。
我们后来回头去想人脸的技术究竟还能用在哪些地方,当时我们想到能够给汽车行业提供这样的一个技术,它能够监控驾驶员的状态,使得驾驶的行为能够更安全。这个理念也是非常先进的,如果能够做成我想这应该是世界第一个驾驶监控体系。在当时还没有DMS这个概念,我们就自己开发出了芯片,把芯片装到一个盒子里面,这个盒子还能做很多的工作,可以解决怎么能把图像拍得更好的问题。
其实现在国内有很多人在做DMS的工作,在做的时候你会发现大家所做的工作都差不多,都是先用一个红外的照明,然后用一个摄像头来拍。当遇到戴眼镜的拍摄者的时候,眼镜片会呈现出一定的反射,而且在不同的照明情况下性能也会降低,这些问题该怎么来解决?我们就在盒子里面做了非常多的改进,得到好图像,把效果做的更好。
这个工作当时在2007年已经得到了车厂的单子,很不幸的是发生了经济危机,汽车行业就把新的项目全部砍掉了,我们这个项目虽然成了一个失败的项目。但是这个大概过了十年,沉睡了十年以后我们又重新启动了这个项目,尽管它的技术看上去已经被其它的公司超越。
接下来我要讲的是,我后来到了商汤,原来我在那里做的的工作,准确的说应该是在日本的公司所作的工作主要是向中国、美国一些大学的研究机构提一些合作的方案,然后把这些成果带回去进行产品化。离开了之后,我的工作转变成了把一个中国公司的技术拿到日本进行产业化,这是一个中国跟日本,或者说中国跟先进国家之间的一个位置的转换,我觉得还是一个非常有意义的工作。
在这里,我做的一个比较能够引以自豪的工作,就是把商汤的人工智能技术配给本田,促成了自动驾驶的研发合作项目,这个项目如果说我们当时和清华老师合作是第一次把中国的高科技介绍给日本的公司,这次我们是把中国的高科技的企业介绍给日本的企业,促成了一个平等的合作关系,这个是在中国的科技发展历程中,也是一个比较少有的例子。
后来我在商汤成立了商汤(日本)公司,主要的业务就是现在和本田一起做的自动驾驶的研发工作,当前的研究工作,与百度或其它的一些公司的自动驾驶会有一些不太一样,我们更
注重的用摄像头来实现非常廉价的,能够提供给一般的用户乘用车上面使用的自动驾驶的技术。
右图是我们在日本建了一个自动驾驶的学校,原来是一个驾校,教人的驾校,现在变成了一个教计算机学习的一个自动驾驶的学校。
我们和本田主要是做基于视觉的自动驾驶技术,这里包含了车道线的监测,在各种各样的环境问题下监测出车道线。我们会挑战各种各样的环境,下雨天、晴天、早上、晚上,也在很多极端情況下检测自动驾驶,做一些道路的区分的学习和汽车的监测,这些功能是一些基础的功能,我们可能会花很多的精力,追求将技术的可靠性做到极致。
我经常被问到,你们的自动驾驶什么时候能够用?什么时候能够推向市场?
我觉得这个道路还是有一点漫长的,我们现在的目标是在2025年前后能够将自动驾驶技术推向市场。我觉得还有一点值得我们引起注意,日本的车厂在研发新的产品的时候会更注重验证技术的可靠性,以保证不出事故,这个是比较重要的,是一个更高的优先级的工作。
将来我们在商汤科技也是这样的,希望能够用AI来促进自动驾驶的研发,在这个过程里,不光是物体的识别,还需要做一些行为的预测,还包括车内外环境的理解。另一方面还有一个比较重要的,需要把你做出来的系统,它的一些判断的结果,不光是得到一个结果,而是要能够知道这个结果为什么是这个结果,深度学习的可说明性这方面我们觉得是一个非常重要的研究课题。
雷锋网报道。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。