| 雷峰网
0
雷锋网按:为了让你在聊天斗图中立于不败之地,谷歌使用机器学习技术,最新开发了一个可以让你用自拍生成个人专属表情包的工具,更新在自家聊天软件Allo上。
拍照、分享、再查看——自拍已经成为很多人的日常习惯,我们和香车自拍、美装自拍、旅行自拍,还有“早晨,我醒了~”诸如此类的自拍。自拍已经成为人类社会行为的一部分,长久以来被用来展示自我。对于一些人,自拍展示的是外貌;另一些人,自拍展示的是他们想要别人认为的样子。还有一些人,两方面都想展示。自拍是基于现实的直观表达,而用漫画表现自我,相比现实更加温馨而轻松。
Google推出的Allo内置机器学习驱动聊天程序。是网络和艺术家合作的产品,想象一下,你的表情回复栏中,有一个按键——“自拍一键变表情”,它可以飞速自动生成你的“漫画版”。触动按键,程序会提示你自拍。接着,谷歌的图像识别将会识别你的脸,将你的特征扫描到由Lamar Abrams绘制的工具包里,Lamar Abrams是一位故事板画家兼作家,代表作是广受好评的网络卡通Steven Universe系列。该工具包储存成百上千的眼睛、鼻子、脸型、发型和眼镜元素。谷歌称,工具包可以生成563,000,000亿张不同的脸。系统生成最初漫画,你还可以做出调整:换一个发型,或者换不同的眼镜。最后,机器会自动生成22个你的表情。
该工具起源于一项内部研究项目,目的是想看看机器学习是否能用一张自拍照来生成一个即时的卡通人物。但正如谷歌用户体验项目的负责人,Jason Cornwell所指出的那样,制作某一个人的卡通画并不是最终的目标。“如何做一些不只能表现你自己的外貌颜值,还能投射你的个性的东西?”Cornwell谈到,“这个问题很有趣。它既能呈现机器学习和电脑的视觉感,也能表达人的表情。这就是Jennifer加入的原因,为你提供艺术的自我表现方式。
Cornwell提到的Jennifer Daniel,著名的艺术总监,她是首位在Richard Turley时代为《Bloomberg Businessweek》创作出名声大噪的视图的设计师,后来她又为《the New York Times》做了一系列视觉专栏。Daniel指出,“插图能传递自拍不能表达的情绪状态。”自拍是你的理想状态。相比之下,表情则是对你的感受的一种升华和夸张化。因此,表情设计得很搞笑滑稽:你可以拿块披萨,或者变成流着口水的僵尸。Cornwell表示:“我们的目标不是一个确切的东西,我们是为了让用户创造出自己喜欢的东西。”因此,用户测试尊重人们的感受,会提出问题:你在这张图片中看到自己了吗?你的朋友能认出你吗?
谷歌把这个项目列为长期运作的项目,以期探索出新的方法,让机器学习越来越广泛地应用。按谷歌的说法,谷歌的机器学习水平领先世界,如果它能让机器学习成为应用程序和网站的必备功能,那么它的产品将碾压竞争对手。顺着Google的计划,目前Allo已经成为各种新型机器学习应用程序的试验台。Cornwell称:“我们在Allo平台的试验,目的是找出机器学习更好地传递信息的方法,从在确切时间表述确切事件,跃升到在确切时间表达准确感情。”
这听起来有点吓人,好像Allo正试图取代我们本人,成为对话的必需品?然而在实践中,应用程序几乎是不可避免的。当有人给你发信息时,Allo会根据你们的谈话记录给出快速的回复。例如,如果你的朋友发给你一张她跳伞的照片,系统就会回复:“太棒了!”。或者,你正在群组里聊天,Allo会使用机器学习弹出一系列定制的搞笑动图来回复。这个想法是,即便你本人不在,也能增强你的表达能力,像是你本人亲临一样。Cornwell表示:“我们在很多其他方面都在思考同一个的问题,艺术和机器学习会以怎样的方式相遇?”不过他拒绝透露谷歌的研究方向。于此同时,Daniel承认了会有新的表情图符推出,分别由不同的艺术家来完成,有着全新的风格。雷锋网觉得,如果真将有这样一个新的表情包,能把自己幻化成一只可爱的狗狗?拜托,让这一天早日来到吧!
Daniel指出,这个项目代表了艺术和工程新的交集。毕竟,我们才刚刚开始触及机器学习对艺术的作用。如果达芬奇还活着,我们很难相信蒙娜丽莎会是怎样一幅画。相反,也许这将是一个用户专属的形象,可以为自己重新塑造出一个表情神秘的女性形象,还可以跨越不同的文化和时代。但是目前我们在惠特尼双年展上还没有发现什么酷炫的东西,也许需要由谷歌这样的公司来打破僵局。Daniel,作为胜利解决了美国技术设计场景的人,一向直言不讳。对于与谷歌的合作,她评价道:“我感兴趣的是工程与艺术合作的交集,还有这个合作平台。在这个平台上,我们创造的不仅仅是内容,还有产品本身。
传统的计算机把自拍照艺术化转换,是通过分析图像的像素,通过算法来确定属性值,再通过像素值来评估颜色、形状或纹理。然而,如今人们的自拍在不同背景光下,有各种姿势。虽然人们很容易辨别一些定性特征,比如不管光照如何,都可以辨别出眼睛的颜色。但这对计算机来说是一项非常复杂的任务。这是因为,当人们辨别眼睛颜色时,不仅观察眼睛的像素值,还会结合周围的环境考虑。
为了解决这个问题,我们研究了类似人眼选择特征的算法,而不是传统的编码方法,去解释每种照明条件下眼睛的颜色。同时我们可以从头开始创造一个大型神经网络,也许可以做到这一点。我们想得到更有效的方式达到目的,因为要将人脸转化成漫画将是一个反复漫长的过程。
为了给你的朋友们塑造一个你所期待的形象,我们和艺术团队一起创作了各种各样的元素。例如,艺术家最初设计的发型,用于实验在人工介入下,训练网络为自拍匹配相应的漫画。之后,人工评判输出的表情和输入照片的匹配程度,以了解工具的表现。在某些情况下,评估者认为有些风格并没有很好的表现,所以艺术家们创造了更多神经网络可以识别的元素。
评估者对发型进行分类,越左边的图标代表越接近的。达成共识之后,常驻艺术家Lamar Abrams就根据图片的共同之处创作出表情。
在美学研究中,有一个著名的问题 “恐怖谷效应”——这一假说认为,如果人类的复制品几乎就像真人一样,就会让人感到厌恶。在机器学习中,如果遇到计算机对你的看法,比对你对自己的看法,这可能会变得更加复杂。
相比准确复制一个人的外表,得到一个低分辨率模型,比如表情和贴纸,让团队探索通过返送图像增强表达,这与其说是重现现实,更多的是打破规则。
团队与艺术家Lamar Abrams合作设计的组合超过563,000,000亿
计算机如何感知你,和你如何看待你自己以及你想怎么展示自己,协调这两者的关系是一种艺术实践。这是一个定制功能,包括不同的发型、皮肤色调和鼻子形状,这是至关重要的。毕竟,漫画的定义是主观的。美学是由种族、文化和阶级定义的,它会引导人们不自觉地因异排外。因此,我们努力创造的空间拥有不同种族、年龄、男性、女性和雌雄同体。我们的团队将继续对研究结果进行评估,以防止在训练系统时产生偏见。
没有所谓的“普遍的审美”或“单调的你”。人们与父母交谈的方式不同于与朋友交谈的方式,也与同事交谈的方式不同。当你有很多社会角色的时候,制作一个虚拟的化身是不够的。为了解决这一问题,Allo团队正在研究一系列的艺术声音,以帮助其他人扩展自己的声音。目前发布的第一款风格,可能是一种自黑风格,下一款用于那些真诚时刻,可能会更可爱。在那之后,也许他们会把你变成一只狗。如果表情符号扩大了交流的世界,最兴奋的点不是这种技术和语言是如何演变的,而是人们对工具本身功能的看法。
雷锋网获知,Allo目前已Android系统中推出,并将很快在iOS系统上推出。
via CO.DESIGN
雷峰网版权文章,未经授权禁止转载。详情见转载须知。