资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

作者:杨文 编辑:郭奕欣
2017/10/31 14:52

雷锋网AI科技评论消息:10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 ICCV 2017的 “Joint COCO and Places Recognition Challenge” 专题会上公布了COCO +Places 2017挑战赛的排名情况。

COCO and Places Recognition Challenge共包括 COCO Challenge和Places Challenge两部分。

关于COCO Challenge

COCO挑战赛偏重对物体的理解。COCO Challenge ( Common Objects in Context,常见物体图像识别挑战) 和 ImageNet挑战赛有相似之处,不过与关注整体图像的 ImageNet 图像分类任务相比,COCO 中的物体检测任务更关注的是场景理解中的物体识别,需要对图像中出现的每个物体的个体(如各种小物体,各种遮挡物体)进行识别,因此要求算法对图像细节有更好的理解。

COCO是一个图像数据集,是用来推动物体检测研究,特别是检测上下文中的物体。其中提供的注释包括80个分类的物体像素级分割,人体实例的关键点注释,91个类别的背景语义分割,每张图片中5条图像标注。

具体分为四类任务:COCO物体检测挑战(Detection Challenge),COCO物体分割挑战(Segmentation Challenge),COCO关键点挑战(Keypoint Challenge),COCO背景语义分割挑战(Stuff Segmentation Challenge )。

COCO物体检测/分割挑战

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

COCO物体检测\分割有四支参赛队伍,旷视科技(face++)夺的物体检测第一;由北京大学和香港中文大学组成的研究团队(Team UCenter)夺得物体分割挑战第一。

COCO人体关键点挑战

鼓励团队参与两种物体检测挑战中的一种(或两种)竞争:使用包围盒输出或对象分割输出。

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

人体关键点检测有两支参赛队,旷视科技(face++)夺得第一;第二名由商汤科技(Beihang University & Sense Time)团队获得。

COCO背景语义分割挑战

要求在不受外界控制的条件下,对人体关键点定位。挑战的难点是同时检测人的位置以及定位他们的关键点(测试中不提供人体位置)。鉴于COCO检测挑战主要检测图片中的“物”(如人,汽车,大象),这个挑战的重点放在图片中的背景(如草,墙,天空)。

国际权威CV领域挑战赛,中国队又一次几乎包揽前三


关于Places Challenge

“Places挑战"偏重对场景的理解。“Places挑战"的数据,是一个像素级标注的图像数据及ADE20K。这个数据集中有2万张图像用于训练,2千张用于验证,3千张用于测试。

“Places挑战”有三项任务:场景解析( scene parsing);实例分割(instance segmentation);语义边界检测(semantic boundary detection)。共有四支队伍参加,除了旷视科技,还有以下三支队伍:

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

在场景解析任务中,冠军由中科院自动化所和京东联合建立的CASIA_IVA_JD团队摘得,第二名是今日头条的WinterIsComing团队。

场景解析也叫场景语义分割,是将图像分割成物体和物类的方法。任务是在Pascal上像素的分类,类似语义分割任务,但不同的是,要把每一个测试图像的每个像素分若干语义范畴概念,“填充对象”如天空,草地,道路或离散对象,如人,车,建筑。共有150个语义类别,占所有图像像素的89%。具体来说,挑战数据分为训练两万张图像,两千张图像进行验证,和三千张图像测试。对于每个图像,分割算法将产生一个语义分割掩模,预测图像中每个像素的语义类别。算法性能将根据在这150个语义类别中的像素精度平均值来评定。

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

在实例分割任务中,冠军由旷视科技(face++)摘得,第二名为G-RMI (Google Research and Machine Intelligence)谷歌团队获得。

场景实例分割是将图像分割为物体实例。该任务是类似于任务1的像素级分类,但它也要求该算法从图像中提取每个物体实例。这项工作的动机有两个方面:1)将语义分割的研究推向实例分割。2)让物体检测、语义分割和场景分析之间有更多的协同作用。语义类别会和任务1中共享数据,但有100类对象实例注释。评价指标是所有100个语义类别的平均精度(AP)。

语义边界检测是检测图像中每一个物体实例的边界。边界检测与边缘检测有关,但更多地关注边界及物体实例的关联。以前在ade20k数据图像的所有像素的注释对象实例可以作为语义边界检测的基准,这是比以前更大的bsds500。此任务的数据与任务1和任务2中使用的图像相同,共有150个语义类别。提交的模型将在优化数据规模使用F-measure评价(f-ods)。

雷锋网AI科技评论小结:继ImageNet之后,计算机视觉领域最具有含金量的挑战赛COCO +Places 2017几乎又被华人拿下所有最高奖。其中表现最为出色当属中国的几家AI企业,将国际巨头微软,谷歌,Facebook都甩在了后面。雷锋网为中国科技业取得的成绩感到无比骄傲,也祝愿中国AI技术今后能持续领跑全球。

长按图片保存图片,分享给好友或朋友圈

国际权威CV领域挑战赛,中国队又一次几乎包揽前三

扫码查看文章

正在生成分享图...

取消
相关文章
Baidu
map