人工智能的技术方向有哪些?

大家普遍关心的一个问题是,人工智能技术在哪些方向可能会有大的突破。
深度学习
深度学习会继续发展。这里的发展不仅包括层次的增加,还包括深度学习的可解释性以及对深度学习所获得的结论的自我因果表达。例如,如何把非结构化数据作为原始数据,训练出一个统计模型,再把这个模型变成某种知识的表达—这是一种表示学习。这种技术对于非结构化数据,尤其对于自然语言里面的知识学习,是很有帮助的。另外,深度学习模型的结构设计是深度学习的一个难点。这些结构都是需要由人来设计的。如何让逻辑推理和深度学习一起工作,来增加深度学习的可解释性也是需要研究的问题。比如,建立一个贝叶斯模型需要设计者具有丰富的经验,到现在为止,基本上都是由人来设计的。如果我们能从深度学习的学习过程中衍生出一个贝叶斯模型,那么,学习、解释和推理就可以统一起来了。
迁移学习
迁移学习是给定一个深度学习网络,比如一个encoder网络和个decoder网络,观察它学习和迁移的过程,作为新的数据来训练另外一个可解释的模型,也可以作为一个新的迁移学习算法的输出。这就好比一个学生A在观察另外一个学生B学习,A的目的是学习B的学习方法,B不断地学习新的领域,每换一个领域就为A提供一个新的数据样本,A利用这些新的样本就能学会在领域之间做迁移。这种过程叫做观察网络。有了这种一边学习、一边学习学习方法的算法,就可以在机器学习的过程中学会迁移的方法。
自然语言的表示学习与机器阅读
表示学习是当数据和任务没有直接相关时也可以学,一个重要的例子叫做自学习(self-taught learning),即我们通过很多监督的数据和图像,可以学出一种最好的表达。用这个表达加上任务就可以很快地学会这种知识表示。这时非结构化数据就相当有用了。比如,给出一段话让机器去阅读,机器学习可以自动地发现一些值得关注的点。再比如,给定一个文章中的实体和一个未知变量的关系,用户可以问你这个未知变量是什么。能够达到这样的效果是因为深度模型已经具有了一种关注,这种关注可以通过观众的学习来表达。其结果就好像我们读了一本书,把关键词和它们的关系抓取出来。这实际上是利用类似人的一种直觉来进行学习。
人机对话系统
有一个领域已经发展到了临界点,就是人机对话系统领域。在这个领域,某些相对垂直的方面已经获得了足够多的数据,比如客服和汽车(车内的人车对话)方面;还有一种是特定场景的特定任务,比如Amazon Echo,你可以和它讲话,可以说“你给我放首歌吧”或者“你播放一下新闻”,Amazon echo里面有多个麦克风形成的阵列,围成圈,这个阵列可以探测到人是否在和它说话,比如我把脸转过去和别人说话的时候,它就不会有反应,并且大规模地降低噪音。利用了硬件的优势,在家庭这个场景中,这种“唤醒功能”是非常准确的。它的另外一个功能是当你的双手无法控制手机的时候,可以用语音来控制,案例场景是客厅和厨房,在美国Amazon echo特别受家庭主妇的欢迎。虽然它现在只有一问一答的形式,但有了准确的唤醒功能以后,给人的印象就好像它可以进行多轮问答的复杂对话。所以,当有了人工智能应用的特定场景,如果收集了足够多足够好的数据,是可以训练出强大的对话系统来的。
深度、强化迁移学习
在未来,我们把深度学习、强化学习和迁移学习相结合,可以实现几个突破——反馈可以延迟,通用的模型可以个性化,可以解决冷启动的问题等。这样一个复合模型叫做深度、强化迁移学习模型。
人工智能的可靠性模型
人工智能系统的鲁棒性,或“ AI as Reliable Services,”是AAAI前主席托马斯(Thomas Dietterich)在AAAI2016上给出的一个主题。人工智能只能作为一些例证证明能够做哪些事情,比如下棋、无人驾驶,但很多时候它还是不可靠的。人工智能不像商用软件,能让人放心地使用,保证错误率不会高于很小的比例。相反,人工智能在犯错的时候可能会错得非常厉害,所以用平均值来代表一个准确率是不恰当的,应该更多地考虑它的置信区间。换言之,“小白”用户用一些人工智能模块搭建一个系统,这个系统就应该能被搭建出来,而且它的效果应该在一个固定的范围以内,所以人工智能应该像软件工程一样做出来。第四范式公司的核心产品“先知平台”就直朝着“可靠性”这个方向发展,把人工智能的模块工程化,并在一定程度上保证了可靠性,从而让普通用户来搭建自己的人工智能系统。
(来源: 我是天边飘过一朵云 )

发表评论