Get“模型设计”新技能:AI能操控自己的进化?

2017年11月20日09:15  来源:科技日报
 
原标题:Get“模型设计”新技能:AI能操控自己的进化?

  get“模型设计” 新技能AI自我进化了?

  “仅需几行代码就能构建一个回归模型。”程序员认可谷歌AutoML的工作表现,认为AutoML设计的模型和机器学习专家设计的不相上下。日前,谷歌工程师分别在中国和硅谷重点推介谷歌AutoML项目。

  不明就里的疑惑紧跟着纷至沓来——AI又进化了?!已经会自开发了?能操控自己的进化了?是要摆脱人类吗?

  进化分几步

  AI确实进化了,它能做的事情越来越多,成绩斐然。它的背后是AI实现路径的“三级跳”——

  国家超级计算济南中心大数据研发部研究员赵志刚说:“起初我们用数学公式和‘if……then’等语句告诉计算机第一步做什么、第二步做什么,手把手地教,后来给机器n组输入和输出,中间的规则或规律由它自己学会。”

  “之前,很多聪明的头脑花一辈子时间研究:如何抽取有效的特征。”专注于智能导购对话机器人的智能一点公司CTO莫瑜解释道,“神经网络算法的发明、深度学习技术的出现,使得AI进化到2.0,抽取特征的工作由AI自己进行,我们的工作也随之发生了变化。”

  用数学函数的模式很容易解释“1.0”到“2.0”的转变:如果把识别图像、语义理解、下棋等任务的达成都看成是不同的Y=f(X),即输入的“猫”的图片、声音或棋招是“X”,输出的“猫”、回答、棋高一招是“Y”。深度学习之前,人通过自己的分析寻找函数f对应的公式,告诉给AI。而深度学习之后,人输入大量的X与Y的对应,AI自己发现函数f对应的公式。

  “AI找到的函数f的具体内容,可能比人找到的更好,但是人类并不知道,就像一个黑匣子。”莫瑜说,“但是f的形式是AI研究员通过研究设计出来的,如果使用深度神经网络,网络中的模块以及模块之间的组织方式也是提前设计的。”

  随着深度学习技术的成熟和普遍化,模型构建出现了特定可追寻的经验。“各种共性神经网络的发布,使得从业门槛越来越低。一些普通的模型构建与优化,刚毕业的学生在网上学学教程就能上手。”赵志刚说。

  当构建模型成为可习得的技能,AutoML就出现了。它能做的正是AI研究员的模型设计工作。“将帮助不同公司建立人工智能系统,即使他们没有广泛的专业知识。”谷歌工程师这样推介。AI成功进化到3.0。

  事实上,AutoML替代的仍旧是人类能够提炼出经验的工作。“如果说之前人描绘一套寻找函数f的‘路网’,在深度学习的技术辅助下,机器能最快找到优化路径;那么AI现在可以自己设计路网了。”赵志刚言简意赅。

  可以看出,不论是深度学习、还是AutoML,都只替代人类的一部分群体已经钻研透了的工作。“机器能做的事情,尽量不要手工劳动”,这是很多程序员的人生信条,这个信条催生了AutoML。本着同样的信条,微软开发了DeepCoder。“它可以用来生成满足给定输入输出的程序。”莫瑜说,但它的表现目前还不尽如人意,只能编写一些简单的程序。

  谁是“上帝”

  答案毫无疑问,人类。

  既然AI在进化中走向了更高一阶的模型设计,那么“上帝之手”又发生了哪些变化呢?

  “炼丹”,莫瑜用两个字形象地说起自己的工作,“智能一点是专业做智能客服的,研发人员的工作主要集中于问题建模(如何将实际问题转化为人工智能技术解决的问题)和算法优化(如何提升人工智能算法的效果)。”

  “炼”意味着不断地调试和完善。“针对特定的人,越投脾气越好,回答越精准越好。”莫瑜说,“我们的X是客户的问话,Y是机器人客服的回复,中间的函数f需要训练。”

  这是个不容易的任务。如果把人类社会的经验分为3类:有公式的确定规则、可言传的知识、只可意会不可言传的感觉。最后一类最难琢磨。

  “因此,我们想办法构建完善的闭环反馈,了解特定用户的喜好,通过情感、趣味的表达,最终做到投其所好。”莫瑜说,“目前处于人机协同的工作阶段,但是越来越多样本的获取,将帮助我们的智能客服给出精准的、讨喜的回答。”

  可见,并不是所有领域都适合交给AI自开发去做,比如问题建模方面,如何将实际问题抽象转换为机器学习问题, AI还无法自主完成。在AI2.0阶段,研发人员还需要人工设计函数f的形式。

  那么,AutoML普及的未来会是什么样?

  “人类被从低一级的工作中解放出来。”赵志刚说,“如果模型设计可以由AI来做,那么AI研究员将更多地探寻构成模型的基础模块的设计。”

  “用AutoML开发AI模型类似于孩子玩‘乐高’玩具。”赵志刚深入浅出,“乐高”设计者把完整的世界拆解成细致的模块,万物可用,进而组合成复杂的模型。而人类更高一级的工作就是针对不同领域为AI找到基础单元,也就是模块。如在图像识别领域,人类已设计出卷积、池化等多种模块。“AutoML才可以以此为依据进行模型构建,不停地调整模块组合,获得更符合常理的输出。模块越精细、越能解决通用性问题,自开发AI越能施展开拳脚。”赵志刚说。

  延伸阅读

  产业需要的人才在哪儿

  缓解人才短缺问题是AutoML的主力卖点。“AI系统正在遍地开花,AI人才却远远跟不上。”谷歌方面这样解释AutoML为啥不可或缺。目前的AI人才现状如何?

  2017年,《全球AI领域人才报告》《BAT人工智能领域人才发展报告》等相继发布。“AI人才短缺是真实存在的。”盛世投资集团副总裁徐文娟说,“初创期和发展期企业人才短缺的问题尤其严重。从目前世界范围看,美国拥有数量最多的AI人才,我国AI人才无论从人数还是从业经验上都无法与之比拟。”

  赵志刚有相同的感触:“我国AI领域现在缺老手、缺高手、缺多面手及顶级大师。”模型的优化调试需要经验,模型的精巧设计需要高超技艺,把AI应用于各个行业需要复合型人才,此外,目前引领AI发展方向的顶级人才屈指可数,且多在国外。

  徐文娟介绍,中国的AI人才在BAT(百度、阿里、腾讯)中最多。一般这类人才的背景经历有几种,海归、BAT工作经验,或是来自高校或科研院所。

  “AI自开发短期内应该无法替代人的工作,还有很长的路要走。”徐文娟说。赵志刚从学术角度分析道:“只有当人类把不同应用领域的AI模型设计出来,并进一步分解出一系列通用模块,如同化学中的元素周期表、生物中的DNA、RNA,这种自开发才能有更多的应用。”(记者 张佳星)

(责编:朱红霞、徐前)