对话清华大学孙茂松:第三代人工智能要处理好“可解释性”的问题

就像人类会综合利用视觉、听觉、触觉、语言等信息一样,让人工智能(AI)多角度、多模式、多学科地学习自然语言,也是清华大学人工智能研究院的目标和任务。

2065438+2009年7月1日,清华大学人工智能研究院第八研究中心:自然语言处理与社会人文计算研究中心(以下简称中心)在学校本部FIT大楼举行成立仪式。该中心主任为清华大学人工智能研究院常务副院长、国家重点基础研究发展计划(973计划)首席科学家孙茂松教授。

7月3日,本报记者(www.thepaper.cn)走进清华校园,与孙茂松教授聊起了这个格外长的中心成立的背景、使命,以及人工智能的发展现状、困境和解决方案。

AI诗人,人工智能助理评委,未来诺贝尔经济学奖得主

语言是人类智慧的重要标志,在人类文明中的地位和作用毋庸置疑。自然语言处理,通俗点说就是“让计算机学习人类语言”。清华大学新成立的中心旨在通过加强人工智能的基础研究及其与人文社会科学的交叉合作,为机器建立更强大的知识库,以增强人工智能在语言学习和处理方面的能力。

孙茂松认为,人工智能和社会科学、人文科学之间主要有两个桥梁。一种是狭义数据,比如金融市场中的数据,可以根据数据预测市场行为;另一类是语言形成的文本,如新闻、消息、用户在社交网络上反映自己观点和情绪的各种“短信”等等。

基于人类语言和文字的桥梁,从2015年底开始,他指导了一个以两个本科生为主体的课题组,通过深度神经网络的方法,让机器能够“读”和“懂”所有的古诗。在此基础上,他又推出了会写诗的AI——《九歌》,让人工智能“跨界”进入文学创作领域。由于大众的关注和参与,《九歌》至今已经产生了差不多400万首诗。“从古至今流传下来的诗歌总数估计不到400万首。如果你这么想,效果还不错。”目前,该小组正在研究现代诗歌的产生,以满足公众日益多样化的“诗歌要求”。

社会人文是一个非常宽泛的概念。除了文学,今年,人工智能研究所正在与清华大学法学院合作,在原有法律的基础上增加更多计算和人工智能的元素。法学院越来越意识到,“计算法学”是未来法学研究的一个发展趋势。孙茂松还提到,近年来由最高人民法院牵头的档案数字化、公开化是计算法学发展的重要基础。

当本报(www.thepaper.cn)记者问未来是否会有“人工智能法官”时,孙茂松说,“应该会有“人工智能助理法官”。虽然机器的能力在本质上肯定是优于好法官的,但是机器也确实有它的优势。例如,它可以快速读取大量文件。人有时候会判断片面,情绪会波动,判断的水平会参差不齐,但机器不会。”

孙茂松指出,基于大数据的人工智能深度神经网络方法(也叫深度学习方法,见下文)可能会带来一些社会人文领域研究范式的改变。虽然清华人工智能研究院刚刚开始外汇汇率预测的研究,但他认为人工智能与金融、经济的深度融合有望带来极其强大的成果。深度学习方法一旦被创造性地、系统地应用到这个领域,甚至可能“在国际上获得一个诺贝尔经济学奖”。

鉴于金融经济系统的高度复杂性,孙茂松认为,当各种相关信息被覆盖,并且有高超的手段对这些信息进行有效处理时,这个复杂系统的可预测性就会显著增加。他举了一个例子,“蚂蚁王国有自己的一套运行规则,但这个规则有时候会变得非常脆弱,因为它可能会突然来一个人,猛地一脚,给这个王国带来灾难。只是从蚂蚁的世界来看,这种突发事件是无法预料的。但是,如果我们把人的因素包括进去,仔细了解这个人的本性,比如他是不是一个有爱心的人,是不是一个佛教徒,他的行为的可预测性就会大大提高,蚂蚁王国的不可预测性就会大大降低。”

在孙茂松看来,古典金融学或经济学的研究范式主要依靠人的理性思考和求解方程(无论是线性还是非线性)。然而,复杂庞大的金融经济系统充满了不确定性,很多现象很难用方程来明确描述。然而,深度学习方法是高度非线性的。在大数据的驱动下,理论上可以隐式模拟任何复杂的方程,更有效地处理系统的不确定性。这使得产生一种全新的金融学或经济学的研究范式成为可能。

把“黑箱”变成“灰箱”

“当代人工智能教父”、2018图灵奖获得者Yoshua Bengio认为,人工智能领域近年来的巨大变革归功于“深度学习”的出现。他在一篇题为《深度学习:人工智能的复兴》的署名文章中说,“近年来,深度学习已成为推动人工智能发展的最重要力量,各大信息技术公司已在这方面投入数十亿美元。”

本吉奥在接受该报(www.thepaper.cn)专访时表示,现有的自然语言处理系统已经掌握了大量的词汇和语言转换技巧,但它并不理解句子的真正含义。机器“会犯一些非常愚蠢的错误,甚至没有两岁孩子的理解能力”。同时,他认为模拟人脑的神经网络,以实现类似人工智能的机器学习技术,对新时代具有重要意义。

尽管意义重大,但目前的深度神经网络系统有一个重大不足:给定一个输入,系统给出相应结果的深刻原因对人来说是不透明的,从这个意义上说,它基本上是一个“黑箱”。这将大大降低系统的鲁棒性,缩小系统的适用范围。当我们深究机器为什么会出错时(比如为什么机器翻译系统会把一句话翻译成这样而不是那样),机器无法给出解释。“反正我翻译成这样,你就用吧。”

此外,深度学习最擅长处理关联性:输入“鸡鸣”一词,会自动联想到“太阳已经升起”这句话。这反映了一种相关性,但显然前者不是后者的原因。深度学习现在基本没有因果推理能力。孙茂松说,深度学习只是“感觉”到两件事在统计意义上有关联,并不知道它们之间是否有逻辑关系。

孙茂松进一步解释说,自然语言处理的研究也面临同样的问题。事实上,“可解释性”是整个人工智能领域面临的困境,也是国际学术研究的前沿。研究人员试图让这个人工智能“黑匣子”至少变成一个“灰匣子”。孙茂松认为,知识库的构建可能是自然语言处理中的一个解决方案。以古诗词写作为例:“灞桥”,其次是“刘哲”。深度学习应该可以从诗歌数据库中捕捉到这种知识关联,但其他很多知识关联能否学习到就不好说了。但是,如果我们有意识地把所有和灞桥有关的东西都提前列出来,比如“巴水、驿站、销魂、断肠、长安、关中八景、李白、李商隐、孟浩然等。”,并建立知识图谱,那么机器就可以有意识地根据这个知识图谱写诗,更有针对性,更有针对性。

据人工智能研究所所长张越院士介绍,人工智能在其发展历史中经历了理性主义和经验主义。第三代人工智能应该是两者的完美结合。解决可解释性问题是其核心研究任务之一。

因为知识是自然可解释的,知识库是可解释的。

“虽然通识课程和专业课程都要考虑,但重点应该是通识课程而不是专业课程。”

在以人工智能和大数据为标志的第四次工业革命到来之际,国内多所高校开始布局人工智能教育。2065438+2007年5月,中国科学院大学成立人工智能技术学院,成为中国人工智能技术领域第一个全面开展教学科研的新型学院;2018年,上海交通大学、南京大学相继成立了人工智能学院和人工智能学院,南京大学也招收了第一批人工智能专业本科生。

清华大学作为中国顶尖的高等学府,一直非常重视顶尖人才的培养。成立于2005年的计算机科学实验班(因其创始人姚期智是图灵奖唯一华人获得者而得名“姚班”),是中国乃至世界顶尖计算机人才培养的摇篮。一流的高等教育有责任帮助计算机科学和人工智能达到下一个令人鼓舞的高度,应该能够给这个时代带来颠覆性的影响。

那么,是否有必要设置人工智能本科专业呢?人工智能在本科阶段是否应该成为一个独立的系?

“在清华最主要的是稳定。如果没有特殊需求,是不会改变的。如果改变了,就会变得混乱。两个群体可能会无序竞争。”整体稳定,积极探索,是清华大学对人工智能本科教育的方针。

今年,清华大学在“姚班”之外新设了一个“智能班”,名为“清华学堂人工智能班”。在计算机教育结构基本不变的前提下,本次小规模实验班将对人工智能人才尤其是顶尖人才的培养进行深入探索。人工智能研究院的工作主要定位在研究生阶段,尤其是博士生的培养。

在这个中心之前,清华大学先后成立了人工智能研究院基础理论研究中心、智能机器人研究中心等7个研究机构。

孙茂松表示,这八个中心的核心力量主要对应的是人工智能研究的“初心”,即对人类感知和认知的研究。感知最重要的通道是视觉和听觉,所以建立了视觉智能和听觉智能的中心;认知反映了人的语言、推理、逻辑和学习能力,因此设置了基础理论中心、知识智能中心和自然语言处理中心。进一步探索的是智能人机交互、智能多模态信息交互乃至机器人的相关研究。这些中心密切相关,相互合作。

刚满一周岁的清华人工智能研究院,基本实现了“整合力量,统筹安排”的目标。孙茂松表示,未来两个中心将分别以“社交网络大数据”和“人工智能芯片”为关键词。