在今年UCAN大会开场,阿里巴巴集团UED委员会委员长杨光发布的智能18luck新利全站 平台——鲁班,便出自乐乘的团队。此平台是通过人工智能算法和大量数据训练机器学习18luck新利全站 。通过一段时间的学习,此平台从去年“双十一”前就已经在阿里内部大规模投入使用,目前其18luck新利全站 水平已经非常接近专业18luck新利全站 师18luck新利全站 的效果。在大会上,乐乘介绍了阿里智能18luck新利全站 实验室的实践全过程。

用AI做18luck新利全站
我们团队现在叫人工智能18luck新利全站 实验室,做的事情很简单,用AI做18luck新利全站 。人工智能现在这个概念太火了,有一个数据证明它有多火:去年人工智能这个领域的创业公司开业速度超过了肯德基的开店速度。不可否认,这里一定有泡沫成分,也有很多概念的炒作。我们先抛开高大上的词,把这个事情拆解一下。
现在讲的人工智能都是通过算法、数据和强大的计算能力来完善服务场景,这是人工智能的四个要素。今天我们团队做的就是用算法、数据、计算、场景来解决商业领域的事情,这样使得这件事情看起来比较靠谱、容易落地。

为什么我们团队会想要做这个事情呢,这不是YY出来的想法,而是从广泛的业务场景里找到的一个机会。以一个广告Banner为例,我们把它归类为“大量低质易耗”的18luck新利全站 ,这样的18luck新利全站 ,18luck新利全站 师花一天做出来,在线上投放时间也只有一天。而且是重复的,改改字就可以了,非常适合被机器所取代。
今年UCAN的主题是新18luck新利全站 x新商业,新商业里非常大的概念,是要通过新的技术、互联网的手段,完成人、货、场的重构,人是消费者,货是商品的服务,场景就是连接人和商品之间的手段。在新的时期下,需要找到一种新的方式做18luck新利全站 。
我们团队的使命是基于算法数据和前台业务需求,打造一个商业18luck新利全站 大脑。这个大脑能理解18luck新利全站 ,能为商业的产品去服务,做出合理的18luck新利全站 。
商业18luck新利全站 大脑的三大挑战
在开始做事情之前,我们遇到了三个比较严峻的挑战。
第一个挑战,缺少标注数据。今天所有的人工智能都基于大量的结构化标注数据,18luck新利全站 这件事情连数据都没有完成在线化,更别说标准化、结构化的数据了。
第二个挑战,18luck新利全站
不确定性。18luck新利全站
是个很不确定的东西,比如今天你让机器18luck新利全站
一个高端大气的Banner广告,它就蒙圈了。
第三个挑战,无先例可循。在整个行业里过去一年做下来发现,没有一些现成的技术或者框架可以参考。比如AlphaGo把围棋AI论文发完之后,全世界围棋AI照这个方法都可以做到先进的水平。我们过去一年来都是自己一路摸索中走过来的,这一年走来我们给人工智能做的定义是,我们做的是可控的视觉生成。可控,就是根据商业的需求、业务的需求,智能地进行控制。它解决的是视觉从无到有的问题。
可控的视觉生成过程
这是机器人从诞生的第一版到最近一版的发展历程。2016年9月,勉强完成一张图片的拼合,没有什么美感可言。第二张是去年圣诞节前做的广告,稍微看起来精致一点,整个18luck新利全站 还是非常简单。第三张是两个月前的进展,基本上可以根据这个商品输入主体的氛围,找到最符合的背景氛围,整个18luck新利全站 细节和结构,看起来更稳定一点。

我们现在大概学会几百种常规的18luck新利全站 手法,并且每天都在学习中。这是我们目前的18luck新利全站 能力和18luck新利全站 效果,青云给它定的评级是P4,意味着它还只是个助理18luck新利全站 师。我们今年目标是做到P5,还有很长的路要走。
机器如何学习18luck新利全站
下面和大家详细解释一下这个机器背后的学习18luck新利全站 逻辑。
我们要让机器学习18luck新利全站 ,首先必须要让机器理解感知18luck新利全站 是什么。以这样一张非常常见的广告为例,在机器的眼里是有一堆像素点组成的。如果今天以像素为单位让机器去理解18luck新利全站 ,对18luck新利全站 的可控性非常弱,所以在前期技术方案选择中没有走像素级生产,而是走向了元素级生产。

四个组成部分:18luck新利全站 框架、元素中心、行动器、评估网络
组成一,18luck新利全站 框架。还是以这个广告为例,首先通过人工标注的方式,让机器理解这张18luck新利全站 有哪些元素组成,比如它的商品主体,花的背景,蒙版。往上一层,我们通过18luck新利全站 的经验知识,定义一些18luck新利全站 的手法和风格。手法指的是这些元素为什么可以这么构成,这个知识在18luck新利全站 脑子里机器是不知道的,所以会有手法这一层做输入。最上面这一层是风格,当这些元素构成之后,它从美学或者视觉角度看是一个什么感受。让机器知道它是用什么组成的,为什么可以这么组成,以及它组成后的效果。这个过程将一个18luck新利全站 问题转化成数据问题,这就是18luck新利全站 数据化。
下一步是准备18luck新利全站 的原始文件,比如一系列花朵和18luck新利全站 方法,输入到深度学习系列网络。这个网络有一个很大特点:具备一定记忆功能。因为18luck新利全站 是个步骤很复杂的过程,经常有好几十步才能完成一个18luck新利全站 。
经过这层神经网络学习之后,我们会得到一个18luck新利全站 框架。从技术上理解,它是一堆空间特征和视觉特征构成的模型。18luck新利全站 师的视角来理解的话,它相当于18luck新利全站 师脑子里面在做一组18luck新利全站 之前大概的框架印象,比如今天你接到一个任务要做一个花朵风格,思考这个18luck新利全站 大概会怎么做,然后从一堆文件里提取出了特征模型出来。

组成二,元素中心。因为我们做的是元素级生成,所以必须准备一个元素的库。我们会通过收集一些版权图库,以及自己造18luck新利全站 元素的方式,输入到一个元素的分类器。这个分类器会把这些元素分布到各个类型里,比如背景、主体、修饰,也会完成图片库的提取。

组成三,行动器。接下来,就是18luck新利全站 的具体过程。比如今天我们接到一个18luck新利全站 任务,要为这样一件衣服18luck新利全站 一个花朵风格的广告。这时候会有一个行动器,负责把前面准备好的底料放到18luck新利全站 框架里。这个过程和下围棋很像,左边是棋盘,右边是下围棋的棋子。行动器就是把元素放到棋盘里,这是整个行动器的生成原理。
它很像18luck新利全站 师实际在做18luck新利全站 的过程,如18luck新利全站 师要做一个花朵的时候,也在软件里面会不断去调每个位置、每个像素、每个角度。同时,整个过程也是一个强化学习的过程,行动器会在不断试错中更智能。

组成四,评估网络。18luck新利全站 成品出来之后,我们要告诉机器人,从18luck新利全站 的角度是好还是不好。我们有一个18luck新利全站 评估网络,最终实现的效果就是给它输入任何一个18luck新利全站 成品,它能打个分。技术原理是,我们通过人工输入大量历史上投放过的一些18luck新利全站 图评分,它从这里训练出一个打分的模型出来。同时,专家也会人工干预打分,完成双向反馈。

这套框架并不是只能做Banner广告,Banner广告是我们找到的第一个最适合落地的业务场景。我们把它定义为是一个通用的18luck新利全站 智能,理论上,它可以18luck新利全站 一切的数字内容。只要是通过元素或者像素组成的图像,理论上都是可以完成的。
预告一下我们最新的实践。前两张图是机器完成的服饰搭配,根据用户输入的服饰商品进行组合搭配,生成类似杂志的搭配效果图。另外,我们也正在训练机器完成页面模块的18luck新利全站 ,比如大量的营销活动页面,我们现在正在训练它完成复杂的排版18luck新利全站 。

正在攻克的三个难题
目前,我们已经完成了框架搭建,以及数据的自我学习成长。接下来我们决心攻克的三个难题,也是让机器变得更加强大的关键突破点。
第一,让机器能够自主生成元素。我们目前的元素是靠18luck新利全站 师来提供,一方面是为了保证版权,另一方面,保证它的质量足够高。我们希望能做到,要求机器造一个花朵时,它自己能生成出来,这也是目前计算机视觉生成的一个非常火的话题。
第二,提高认知理解。现在机器还不太理解语义,只能根据需求或者任务生成一个结果,并不了解其中的关系。我们下一步要做的事情是,当用户输入了“清凉一夏”的文案时,机器人能理解“清凉”这个词代表了什么意思,并且理解这张照片代表了“清凉一夏”的理念,图文之间有一定的关系。
最后一个,18luck新利全站 的迁移。比如今天通过大量专家数据训练了几百种常规数据手法之后,它能够完成主流的18luck新利全站 要求了。当这些手法很相似时,就可以完成风格迁移。我们会进一步探索AI,不再根据需求完成使命,而是通过自我学习和演化之后有新的东西出来。
AI+Design 拥抱新时代
今天人工智能18luck新利全站 真的来了,它不以任何意志为转移的趋势走来了,它离我们很近。当一个新的浪潮打过来的时候,我们应该学会的是拥抱它,而不是掉头就跑,边跑边骂不靠谱。
视觉18luck新利全站 的四个层次

最基础的是临摹拓展。给你一个东西,照着它拓展一份出来,很明显这一定是机器第一步取代的工作。而且目前已经做到一大半了,证明这是一个没法回避的问题。

第二层,场景表达。今天你给它一个东西,它能理解,能表达对。比如今天你根据情人节,这些品牌能够找到一种合适的18luck新利全站 手段,去表达出情人节的温馨,这种手绘的方式会稍微难一点,也就是我们前面讲到的语义这一层。

第三层,创意洞见。它能够有一些启发性的东西出来。天猫品牌里面经常有把猫头和品牌创意做联合的事情,这是机器不可能做到的事情,或者在我有生之年没有指望它能做到的。

最后一层,创造趋势。这一般是18luck新利全站 大师做的事情。它能定义明年、未来几年的18luck新利全站 趋势走向,这是更高的18luck新利全站 能力。比如今年“三八”女王节,天猫用了一种全新的18luck新利全站 手段,用这种很轻的质感、很细腻的方式来表达商品。它能够代表一个新的趋势和未来,代表一个新的手段,这件事情一定是人来做的。

回到今天机器和人之间的差异和对比,如果今天我们搞18luck新利全站 人机大战的话,机器最擅长的是数据、计算、学习。数据上,可以完成巨量素材库,训练成长速度,不断地完成闭环。它的学习速度之快,一个晚上可以完成几十万次的学习训练,是人不吃不喝也赶不上的。而人类18luck新利全站 师的特征,首先在情感层面,我们理解共情,情绪上有表达,这是机器很难做到的。另外两层,创意和创造,18luck新利全站 师能够创造出一些新的东西,做组合迁移,组合创意,美学趋势。如果真正人机对战的话,18luck新利全站 师还是应回归创造、创意,以及理解用户的层面。

拥抱这个AI时代,对我们来说有没有什么新的工作方式呢。比如今天有顾客让你做一个18luck新利全站 ,以前是一对一的给他一个成品,一对一的完成一个18luck新利全站 任务。有了18luck新利全站 AI之后,就可以将一个18luck新利全站 手段输入给机器,教会机器做执行和生成。这样,你就可以不止为一个客户服务,而是为成千上万的客户服务。
人工智能18luck新利全站 是个不可阻挡的时代,是未来。但是它也刚刚来,我们也刚刚走出第一步。我们还有大量的时间,希望接下来和18luck新利全站 同行一起努力,继续把这件事情做好。
[关于UCAN]
UCAN是阿里巴巴的年度18luck新利全站 盛会,聚焦用户体验18luck新利全站 。4月27—28日,由阿里巴巴用户体验18luck新利全站 委员会举办的UCAN2017用户体验18luck新利全站 论坛在阿里巴巴西溪园区举行,本届主题是“新18luck新利全站 ×新商业”。围绕“无界、融通、超距、生长”等概念,重新定义用户体验在新商业环境中的蜕变和价值,不断把18luck新利全站 领域、18luck新利全站 概念向外延展,与技术、能源和商业产生新的化学反应。





全部评论