| 雷峰网
1
本文作者: 金红 | 2016-09-19 18:51 |
“有着圆脸、胖身子、 两个尖尖的耳朵,还有一条长尾巴的东西,就是猫。”——计算机识别猫的逻辑
关于计算机读懂照片,相信很多人对于李飞飞在一年前的TED演讲记忆犹新,演讲中展示的一张关于猫的照片,对于人类来说很容易分辨,即使是三岁的小孩儿也只需一眼就能做出定义,而对于计算机来说,却需要经过无数次的学习才能完成。
这是因为,在三岁的小孩儿的眼中,世界已经不是简简单单的物体集合,而是一个个具体的个体,他们已经对这个世界形成了自己的理解。而计算机,则没有。想要计算机也能快速对图片做出理解,最好的方式是让它模拟人脑的学习方式。李飞飞一手创建的ImageNet,便是为计算机喂下的学习养分。利用互联网,ImageNet提供了一个庞大的图片数据库,让计算机系统能够在1500万张照片里认识22000种物品。机器学习也因此有了突飞猛进的进展。
从全球范围内来看,目前机器学习常用“在线学习”(online learning),即按照顺序、循序的学习,不断的去修正模型,进行优化。已有多家公司尝到“在线学习”的甜头,在视觉、声音、大数据等领域人工智能均有突破。
与此同时,研究人员也未停止对“片上学习”(On-Chip Learning)研究,因为只要实现这一技术,就能直接在硬件上完成学习与测试,进而让基础算法的研发迭代,产品的升级有着更短的周期和更高的效率,并且消耗更少的能源。不过“片上学习”在严苛的硬件环境中研究进展缓慢,并没有一个成型的应用于实际问题的演示,一直停留在理论研究阶段。现阶段,在硬件中部署机器算法更多还是“在线学习”,即用大规模高性能计算平台进行模型训练,然后将训练好的模型再直接部署在硬件中。谷歌的AlphaGo就是“在线学习”的典型,在今年与李世石比赛时,AlphaGo的服务器在美国中西部,通过谷歌云服务连接到韩国首尔的对局室,谷歌总部团队必须确保AlphaGo与谷歌的服务器连接顺利。
日前,中国类脑强人工智能初创公司西井科技在2016PSPE上海国际科普产品博览会上正式宣布,该团队在全球范围内首次实现“片上学习”。这意味着机器学习能在硬件端直接完成,通过硬件层面的不断“自我学习”和“自我提高”,实现高效率、低功耗。今年5月,该团队曾宣布研发出一种完全跳脱于冯诺依曼结构的神经形态的芯片结构——即模拟人脑神经元工作原理而制造出的芯片,它既具备人脑的学习能力,又具备强大的特定运算能力,仅需一块邮票大小的芯片,就能模仿人类大脑在短时间内处理海量的感官信息。
在发布会上,西井科技正式对外演示了其WIKI系统“片上学习”过程,包括识别随机生成的数字以及对油画进行画风画派的分类。结果显示,机器能在短短 1 秒内自动完成数百张图片的分类,正确率接近100%。
油画画风分类完成
油画画派分类完成
为了让参会者更容易理解“片上学习”,西井科技用学生的学习方式来做类比,“打个比方来说,‘片上学习’就好像学生身边时刻跟随着一位‘私教’,直接在芯片上边学习边测试训练成果,最大的优势是真正实现‘无网络’情况下的‘自我学习、自我实时提高’。而‘在线学习’则好比学生定期去‘学校’上课,回家后做作业来测试学习效果,再将优化过的模型灌输在硬件中,每一次新的学习都需通过网络、云端等手段重新进行传输、迁移。”
片上学习训练中(红线代表CHIP)
西井科技表示,期间,芯片可随时中断学习,以测试学习效果。结果发现,随着芯片学习进度的推进,油画识别与分类的正确率将逐步上升,直至经过8至10秒的一段完整学习后,识别的正确率接近100%。
同时,因为“片上学习”可以实现本地化学习,从而帮助机器大幅度提升效率,提高运算速度。在网络环境相对严苛或有限的情况下,“片上学习”的芯片消耗的带宽和流量更少,大幅降低云端服务器的通讯成本,且耗时更少。毕竟“在线学习”需要更高质量的网络环境,在数据传输时会造成延迟。
西井科技此次实现的“片上学习”将在多个领域得到突破性的应用,比如提升大数据挖掘、视频流处理的质量与效率、节省基因测序的时间以及帮助机器人外形更为灵巧,依靠“自身智力”去不断学习提高能力等。
发布会上,西井科技同时宣布已开发出基于神经形态工程的类脑智能软硬件一体化智慧港口系统——WellOcean,并已在全球排名前十的一家港口码头上线试运营。通过模拟人脑神经“高效低能”的工作机制,从而使系统能够像人脑一样飞速识别集装箱号码。有别于传统OCR识别,WellOcean最明显的优势就在于速度和准确率,能自动捕获进、出港口的任一尺寸集装箱,识别速度不到0.1秒,比OCR技术快了50倍。
WellOcean夜间双箱快速准确识别
发布会结束后,很多参会者与雷锋网都非常关心一个问题,此次展示的数据相对于ImageNet上千万的图片库相比实在毫无比对度,那么所谓100%的准确度的含金量有多大。对此,西井科技的工作人员表示,数据不是问题,未来会在实际应用中不断地积累,而其芯片在实现“片上学习”后通过不断学习,准确率也自然会不断提高。因此,或许未来计算机不仅能轻易识别出一只猫,还能识别出这是什么种类的猫。
西井科技展示其Deep South类脑神经元芯片
雷峰网原创文章,未经授权禁止转载。详情见转载须知。