百度的智能音响、搜狗的录音翻译笔、商汤的AI超算和3D人脸重建……在今年的高交会上,人工智能是毫无疑问的热点。
“现在,人工智能究竟发展到了什么程度?我们下一步该怎么办?”2018年11月14日上午,中国科学院院士、清华大学人工智能研究院院长张钹出席了第20届高交会中国高新技术论坛。
据高交会组委会副主任兼秘书长、深圳市副市长王立新介绍,张钹于1978年开始从事人工智能研究,是国内该领域最早的研究者之一。“近年来,张钹教授带领的团队在深度学习和大规模概率建模及其在视觉信息处理的应用方面进行了深入研究,成果卓著。”
作为一位行业内的权威学者,张钹深入浅出地介绍了人工智能的前世与今生,剖析了人工智能的未来前景与局限性。
前世:缓慢量变,困水溃堤
“从1956年开始到本世纪初,基本上人工智能的发展是比较缓慢的。”张钹介绍说,当时人工智能主要提出了两个模型:“一个叫作以知识和经验为基础的符号推理模型;第二个是现在讲的机器学习或者叫作神经网络。”
前者主要是用来解决人类理性的智能。在最初的许多年里,这个工作的进展很慢,主要原因是“这些知识必须来源于人工的输入”。在当时的环境下,用人工的方式将知识输入机器是很困难的。“很多知识是难以准确描述出来的。”
一直到2011年,“以知识和经验为基础的符号推理模型”才取得一定的进展,IBM做的watson系统在人机竞赛上打败了人类,这也是这一模型首次战胜了人类。
为什么2011年是一个关键节点?
因为互联网的发展。“互联网中的大众知识,无需经过人工就可以直接输入进系统。而且这些知识中相当一部分属于数据。”张钹表示,正因为有了大数据,在特定的环境和条件下,这一模型使得人机对话可以达到一定的水平。
“机器学习/神经网络”与前一个模型相似,在很长一段时间里进展缓慢。“主要的原因是当时神经网络输入要靠人工来设计,或者来编制特征。”
这一困境也是到本世纪初有了转折。“这个转折就是我们说的深度学习。”张钹表示,一方面,这基于神经元网络层次的增加;另一方面,如今的深度学习只需要投喂数据,不必人工干预,“这样就使得深度学习变成一个大众化的的工具,无需专业知识。”
“如今我们在图像识别、语音识别和围棋三个方面的成就都来自于深度学习。”张钹说。
今生:质变之后,泄洪成泽
2015年以前,人工智能的围棋水平智能达到业余五段。“在两年间,通过深度学习,实现了三级跳。现在已经远远超过了世界冠军。”张钹解释说,其中最重要的原因就是利用了大量的数据。
这些数据有一个特点,它是自己产生的,“它自己跟自己下的过程中产生的数据”,而不是人工投喂。人工智能可以做到自己与自己下上亿盘棋局,但一个人的一生只能下几万盘而已。
“在这15年间,深度学习技术在各国领域得到了很大的发展。”张钹举例了许多知名企业,它们涉及了包括医疗、自动驾驶、图像识别等多个领域。
“但是我们必须看到深度学习的局限性。”张钹表示,虽然深度学习可以在很多领域得到应用,但这些应用必须要受到五个条件的限制:必须要有丰富的知识和数据;必须是完全信息的;必须是确定性的;必须限定领域;必须是单任务的。
深度学习基于知识和数据,目前也只能处理知识和数据。如果信息存在模糊性、不规律,计算机处理就会产生困难。譬如说,下象棋的深度学习成果只能用来下象棋,这个领域和任务都是单向的、不开放的。
此外,建立在大数据基础上的识别系统虽然在某个指标上超过了人类,但在很多领域与人类相比差距仍然很大。譬如计算机的图像识别率可以达到人的程度,但并不意味着计算机便认识了它所识别的图像。
“我们扔给计算机一个模糊的照片,它可以识别成任何东西。”“人工智能的语音识别在一定条件下能够超过人,但抗干扰能力非常弱。”张钹表示,这说明人工智能目前还面临着安全性的问题,人工智能系统非常容易受到攻击,非常容易被欺骗。
人工智能在经过质变后,再次遇到了瓶颈。张钹介绍说,现在主要有三种方法来尝试突破:第一,与脑科学结合寻找新的模型;第二,把知识驱动与数据驱动结合起来;第三,尝试进行常识推理、不确定性处理,这样才能把人工智能从单纯的工具变成人类真正的伙伴。
【见习记者】何雪峰
【作者】 何雪峰
【来源】 南方报业传媒集团南方+客户端
评论留言