| MaskGAN;深度人脸识别;人体姿态估计;妆容迁移等 | 雷峰网
0
本文作者: AI研习社 | 2020-04-14 10:20 |
CurricularFace: 深度人脸识别的适应性课程学习损失
MaskGAN:多样和交互的面部图像操作
结合检测和跟踪的视频人体姿态估计
通过解纠缠表示的局部面部妆容迁移
基于自动生成的训练数据进行大规模事件抽取学习
论文名称:CurricularFace: Adaptive Curriculum Learning Loss for Deep Face Recognition
作者:Huang Yuge /Wang Yuhan /Tai Ying /Liu Xiaoming /Shen Pengcheng /Li Shaoxin /Li Jilin /Huang Feiyue
发表时间:2020/4/1
论文链接:https://paper.yanxishe.com/review/15951?from=leiphonecolumn_paperreview0414
推荐原因
这是腾讯优图入选CVPR 2020的论文,考虑的是人脸识别的问题。
在人脸识别中,设计基于边际的损失函数可以增加不同类别之间的特征边界,以增强可分辨性。这篇论文提出了一种新的自适应课程学习损失(Adaptive Curriculum Learning Loss,CurricularFace)策略,将课程学习的思想嵌入到损失函数中,从而实现一种用于深层人脸识别的新训练策略,该策略主要针对早期训练阶段中的简单样本和困难样本。CurricularFace在不同的训练阶段自适应地调整了简单样本和硬样本的相对权重。在每个阶段,根据不同难度将不同样本分配给不同重要性,从而在实验中优于其他方法。
论文名称:MaskGAN: Towards Diverse and Interactive Facial Image Manipulation
作者:Lee Cheng-Han /Liu Ziwei /Wu Lingyun /Luo Ping
发表时间:2019/7/27
论文链接:https://paper.yanxishe.com/review/15950?from=leiphonecolumn_paperreview0414
推荐原因
这篇论文被CVPR 2020接收,处理的是面部图像操作。
这篇论文提出了一个支持多样化和交互式面部操作的新的框架,称为MaskGAN。MaskGAN主要由两部分组成:密集映射网络(DMN)和编辑行为模拟训练(EBST),其中DMN学习自由形式的用户修改的MASK和目标图像之间的样式映射,从而支持不同的生成结果。EBST可以对源MASK上的用户编辑行为建模,使整个框架对各种操作输入更加健壮。这篇论文还构建了一个大规模的高分辨率人脸数据集,并使用了名为CelebAMask-HQ的细粒度MASK标注规则。评估结果显示MaskGAN在属性迁移和样式复制这两个任务上优于其他方法。
论文名称:Combining detection and tracking for human pose estimation in videos
作者:Wang Manchen /Tighe Joseph /Modolo Davide
发表时间:2020/3/30
论文链接:https://paper.yanxishe.com/review/15949?from=leiphonecolumn_paperreview0414
推荐原因
这篇论文被CVPR 2020接收,要解决的是人体姿态估计的问题。
与现有方法相比,这篇论文提出的新方法通过在时间上向前和向后传播已知人员的位置并在这些区域中搜索姿势,来预测未定位的人员实例。新方法包括三个部分:1)一个剪辑跟踪网络,对小型视频剪辑执行人体关节检测和跟踪;2)视频跟踪管道,将剪辑跟踪网络产生的固定长度的小轨道合并到任意长度轨道中;3)时空融合过程,根据空间和时间平滑项精炼关节位置。得益于剪辑跟踪网络和合并程序的精确性,新方法可以产生非常准确的联合预测,且可解决棘手场景(如纠缠不清的人)的常见错误。
论文名称:Local Facial Makeup Transfer via Disentangled Representation
作者:Sun Zhaoyang /Liu Wenxuan /Liu Feng /Liu Ryan Wen /Xiong Shengwu
发表时间:2020/3/27
论文链接:https://paper.yanxishe.com/review/15948?from=leiphonecolumn_paperreview0414
推荐原因
这篇论文考虑的是面部妆容迁移的问题。
面部妆容迁移的目的是在任意给定的化妆图像中呈现非化妆的面部图像,同时保留面部特征。当前最佳方法是将化妆风格信息从人脸图像中分离出来,实现化妆效果的传递。然而,化妆风格包含了几种语义清晰的局部风格表示,而这些表示通常纠缠在一起。这篇论文提出了一种新的统一对抗解纠缠网络,将人脸图像进一步分解为四个独立分量(包括个人身份、唇妆风格、眼妆风格、脸妆风格)。由于化妆风格的进一步分解,新方法不仅可以控制全局化妆风格的程度,还可以灵活地调节局部化妆风格的程度。同时这篇论文将化妆迁移与卸妆整合成一个统一的框架,从而得到了多个卸妆效果。大量的实验证明,相比于当前最先进的方法,新提出的方法可以产生更真实和准确的化妆迁移结果。
论文名称:Scale Up Event Extraction Learning via Automatic Training Data Generation
作者:Ying Zeng; Yansong Feng; Rong Ma; Zheng Wang ; Rui Yan ; Chongde Shi ; Dongyan Zhao
发表时间:2017/11/11
论文链接:https://paper.yanxishe.com/review/14885?from=leiphonecolumn_paperreview0414
推荐原因
作者针对当时事件抽取任务中专业性强、需要人工定义trigger word、标注数据不足等问题,提出了一种基于Distant supervise的一般性事件抽取数据集,并且设计了一种基于关键论元的事件抽取模型,利用样本中的关键论元来推断出事件类型,进一步补充其他论元生成完成的事件表信息。
本文提出的基于关键论元的模型,不需要人工定义trigger word,同时结合以维基百科为基础生成的数据集,对人工标注的样本进行训练,得到了更好的效果。
尽管现在有一些新的端到端的神经网络模型的出现,并且也有了较之本文sentence-level更进一步的document-level,corpus-level的事件抽取,但是本文依然很值得一读。本文详细的讲述了基于Distant supervise数据集以及关键论元的设计思路和生成方法,有助于理解一个好的事件抽取模型应该抽取什么样的信息。
雷锋网雷锋网雷锋网
相关文章:
今日 Paper | 人脸旋转;BiLSTM-CRF;神经注意模型;Abigail等
雷峰网原创文章,未经授权禁止转载。详情见转载须知。