本篇内容主要来自于清华大学人工智能研究院名誉院长、中国科学院院士张钹7月6日下午在世界人工智能大会昇腾人工智能产业高峰论坛上的演讲,演讲全文经作者编辑,做了不改变原意的整理),内容略有删改。
(资料图片)
张钹院士是中国人工智能领域泰斗级专家,早在40多年前,张钹就开始投身人工智能领域研究,发表了中国第一篇人工智能领域的学术论文、获得中国在人工智能领域的第一个国际重要奖项、领衔成立国内首个智能机器人实验室、培养了本土第一位人工智能领域博士毕业生,组建中国第一个人工智能国家重点实验室……这些“第一”树立了中国人工智能发展的一个个里程碑,推动中国在此领域大踏步前进。
作为中国人工智能主要奠基者和发展推动者,40多年来,张钹矢志不渝致力于中国人工智能领域的创新,发表或共同发表了数百篇学术论文,出版系列专著。他获得了诸多奖项,其中包括ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖、国家教委科技进步一、二等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖。
一年前,中国科学院院士、清华大学人工智能研究院名誉院长张钹询问了还处于实验室阶段的ChatGPT一个简单的问题:清华大学校歌歌词是什么?
ChatGPT没有回答正确,反而开始胡说八道,张钹当场指正并输入了正确的校歌歌词。但退出后再度进入,ChatGPT的答案依旧是错的,此后张钹数度询问,ChatGPT依旧无法给出清华大学校歌的正确回答。
他通过这个案例,指出了ChatGPT三个不可避免的缺点,他认为,这些情况说明Chat GPT的输出往往不会符合我们道德、伦理、政治的要求。所以ChatGPT出现以后,人工智能的治理不可避免。
他在2023世界人工智能大会上表示,只有彻底把以ChatGPT为代表的大模型与生成式人工智能的内部工作原理搞清楚,才能找到人工智能发展的“金钥匙”。
1.ChatGPT向通用人工智能迈出了一步
为什么说ChatGPT的出现是一个关键节点?目前行业有观点认为,ChatGPT是通用人工智能,也有相反的观点指出ChatGPT不是通用人工智能。张院士认为这两个说法都不全面,他比较赞同微软提出的,ChatGPT是通用人工智能的火花。
张钹认为,最恰当的评价是,ChatGPT向通用人工智能迈出了一步。
ChatGPT具有通用人工智能的两个特征,第一个特征是,在对话和聊天这个领域,它达到了人工智能的目标,或者是达到了行为主义主张的人工智能的目标,即使得机器的行为跟人类的行为相似,与ChatGPT 对话和人类的对话很相近;
第二个特征,ChatGPT 是开领域、多任务的,在对话这个问题里跟领域无关,这是一个重大的突破。大家知道人工智能经历过第一代知识驱动,第二代数据驱动,都只能在限定领域里面完成单个任务。所以ChatGPT就变成开领域, 走向通用。
基于“达到人类水平”、“突破限定领域”这两个通用人工智能最重要的特征,所以可以说它是通用人工智能。但因为它只是在对话,或者讲得宽一点,是在语言处理这个领域里面达到这个目标, 所以还不能把它称作通用人工智能,因为在别的智能领域里面,它能否通用现在还说不清楚。
2.ChatGPT达到现在的水平背后经过了行业六七十年的努力
为什么ChatGPT 为什么能够达到现在这样的水平,张钹解释,主要由于人工智能经过六七十年的努力实现了三个关键技术的突破。
第一个技术,基于词嵌入的文本语意表示。
第二个技术,是基于注意机制的转换器,就是刚刚高院士谈的大模型,我们现在说的大模型就是大转换器。
第三个技术,是基于预测下一个词的自监督学习。
他认为,ChatGPT 是经过人工智能领域或其他领域大量科学家和工程师六七十年共同努力的结果,以上三个问题的突破,使得机器在处理文本上起到了本质的变化。
过去我们在处理文本的时候,往往把它称作处理数据,到现在为止,大家还是用的这个词,但是这个词在ChatGPT不成立,因为ChatGPT是在我们找到了文本语意表示这个条件下再处理文本,所以它处理的不是文本的形式,不是把文本当成数据来处理,而是把文本当成知识来处理。
所以他认为,ChatGPT成功并不是仅仅归功于三个要素,也就是数据、算力和算法,我觉得应该强调四个要素,分别是知识、数据、算法和算力。“也就是说,我们有三个关键技术的突破,就使得我们能够从大量的文本这里我们叫做数据,从大量的数据中间可以获取到知识,只有出现这个转变才有现在的ChatGPT,不然我们还是停留在那个认识上肯定是错的。”
3.人工智能发展到ChatGPT以前不能说是科学
张钹判断,这个突破可能带来三件事情是不可阻挡的:
第一件事就是必然带来科技的革命,首先会带来人工智能本身的革命。
张钹解释称,人工智能发展到ChatGPT以前,不能说它是一个科学,因为它没有理论。
人工智能为什么理论建立不起来?非常重要的原因是,第一代人工智能做的知识驱动也好,第二代人工智能做的数据驱动也好,都是在限定领域中完成单个任务,而在单领域单任务里面不可能建立一个通用理论,ChatGPT扫除了这个障碍,至少在自然语言处理上扫除了这个障碍,因为它跟领域无关。一旦跟领域脱钩了,才有可能建立起来它的通用理论。
所以,现在去建立人工智能理论是有可能的,在ChatGPT没出现以前,这种可能性不存在。
“所以这对我们来讲是一个激励,突破口就是ChatGPT,如果我们没有把ChatGPT内部的工作原理搞清楚,我们就找不到进入人工智能理论的钥匙。”
ChatGPT里面很多现象,我们说不清楚,但是一方面它能够生成一个非常出人意料非常好的结果,它同时又会胡说八道。为什么会出现这个现象根本不清楚。
所以头一个必然会迎来的科技的革命,首先这个革命会从 AI 本身开始。
第二个事情,就是产业的变革。首先是人工智能产业本身的产业变革。
人工智能产业的发展跟信息技术的产业发展是非常不一 样的,信息科技的发展,我们可以用 4 个字来形容“高速持续”,但是人工智能产业的发展是“缓慢曲折”。
什么原因呢?一个最重要的原因就是信息科技从一开始理论就建立起来了,计算机的理论是 1936 年建立的,通讯理论是 1948 年建立的,所以它在理论指导下,技术和它的产业发展都非常顺利。
而人工智能只有算法和模型,而且这些算法和模型都是领域限定和任务限定的, 所以你开发出来的所有人工智能的硬件或软件全是专用的,跟信息产业完全不同,
信息产业的所有硬件和软件全是通用的,市场非常之大,而信息产业的硬件或软 件通常是专用的,都是跟领域紧密结合的,信息产业不跟领域结合根本不可能有 这个产业,但是拿计算机来讲,完全不跟应用结合,它生产出来的计算机什么地方都能用。
但是有了ChatGPT之后,人工智能有可能建立一个跟领域无关的模型和算法,只有这个算法和模型摆脱了领域的限制,将来生产出来的硬件和软件才会是通用的,或者是一定范围里头通用的,才有很大的市场。这就是今后信息产业革命的一个方向。
第三个事情,人工智能治理。
回到“清华校歌”这个例子,他认为,这些情况说明ChatGPT的输出往往不会符合我们道德、伦理、政治的要求。所以ChatGPT出现以后,人工智能的治理是不可避免的。
张钹主张要发展第三代人工智能。
一是要建立可解释鲁棒的人工智能理论。ChatGPT出现以后建立这个理论才成为可能,过去实际上是不可能建立的。
第二个内容,发展安全、可信、可控、可靠、可拓展的人工智能技术,只有建立了这个理论之后,我们才有可能得到一个安全的人工智能技术。
“换句话说, 现在的人工智能技术是不安全的,不可靠的,也是不可信的。特别是利用大数据的机器学习,结果一定是这样的。”
我们必须建立人工智能的理论,这才能开发出可信、可靠、可信及可扩展的人工智能技术,最后,才能推动产业化的创新应用和产业发展。
以下为演讲全文:
各位专家、各位嘉宾、大家好!非常高兴被聘请为昇腾 AI 的荣誉顾 问,这可能是对人工智能工作者的一种鼓励。我觉得人工智能工作者需要鼓励, 因为人工智能是闯无人区非常艰难,大家不要认为人工智能取得的每一个进步都是那么容易的,都是非常困难的。
首先我想谈一个问题,怎么评估ChatGPT?现在有两种说法,一种说法是,ChatGPT是通用人工智能,还有一种说法,它不是通用人工智能,我的观点是,这两个说法都不对,也都对。
我认为最恰当的是说法是,ChatGPT向通用人工智能迈出了一步。按照微软的说法,ChatGPT是通用人工智能的火花,我赞成这种观点。
为什么呢? ChatGPT具有通用人工智能的两个特征,一个特征是,在对话或者聊天这个领域,它达到了人工智能的目标,或者达到了行为主义所主张的人工智能的目标。
行为主义人工智能现在是人工智能主流,它背后的哲学是唯物主义、实用主义的,其追求的人工智能目标是使得机器的行为跟人类的行为相似。
为什么说ChatGPT达到了这个指标,因为我们跟ChatGPT对话的时候,就和人类的对话很相近,因此它达到了头一个通用人工智能的特征。
第二个特征是,ChatGPT是开领域多任务,也就是说,在对话这个领域,问题跟领域无关,这是一个重大的突破。
大家知道,人工智能经历过第一代知识驱动,第二代数据驱动,都只能在限定领域里头完成单个任务,所以ChatGPT的出现变成一个开局,开始走向通用。
在通用人工智能最重要的两个特征上,达到人类水平,跟领域有关,所以我们可以说它是通用的。但是因为它只是在对话或者说只是在语言处理这个领域里达到这个目标,所以我们还不能把它称作通用人工智能。因为在别的智能领域是不是能通用,现在还说不清楚。
所以我觉得,这样的估计是非常恰当的,我们只有在这样的估计情况下才能讨论下面的问题。
首先一个问题,ChatGPT为什么能够达到现代质量水平?甚至很多地方使大家感到非常惊奇,这主要由于人工智能经过六七十年的努力,实现了三个关键技术的突破。
第一个技术,基于词嵌入的文本语意表示。
第二个技术,是基于注意机制的转换器,就是刚刚高院士谈的大模型,我们现在说的大模型就是大转换器。
第三个技术,是基于预测下一个词的自监督学习。
所以我们应该说,ChatGPT是经过人工智能领域里头或者其他领域里头大量的科学家和工程师,经过六七十年共同努力的结果,因为经过六七十年,这三个问题才得到成果。
这三个关键问题的突破,使得机器在处理文本上起了本质的变化。
过去我们在处理文本的时候,我们往往把它称作处理数据,到现在为止大家还是用的这个词儿,但是这个词儿在ChatGPT 里不成立,因为ChatGPT是在我们找到了文本语义考试条件下在处理文本,所以它处理的不是文本的形式,不是把文本当成数据来处理,而是把文本当成知识来做,所以ChatGPT的成功并不是归根于三个要素,我觉得应该强调4个要素,知识、数据、算法和算力。
也就是说我们有三个关键技术突破,就使得我们能够从大量的文本,我们把它叫做数据,从大量的数据中间能够获取到知识点,因为只有实现这个转变,才有现在的成绩,不染我们还是停留在那个认识上肯定是错的。
那么这个突破,可能带来三件事情是不可阻挡的,头一件事必然带来科技的革命,首先会带来人工智能本身的能力。
人工智能发展到ChatGPT以前,我们不能说它是一个科学,为什么?他没有理论。
人工智能为什么理论建立不起来?非常重要的原因是在历代人工智能做的知识驱动也好,第二代做的数据驱动也好,我们都是在限定领域里完成单个任务,在单领域单任务里头不可能来建立一个通用理论,ChatGPT扫除了这个障碍,至少在自然语言处理上扫除了这个障碍,因为它这个领域无关,一旦跟领域脱钩了,才有可能建立起来通用的理论。
所以现在去研究,去建立人工智能理论是有可能的,在ChatGPT没出现以前这种可能性不存在,所以这对我们来讲是一个激励。
什么是突破口?突破口就在ChatGPT,如果我们把ChatGPT内部的工作原理搞清楚,我们就能找到进入人工智能理论的钥匙。
ChatGPT里很多现象我们说不清楚,一方面它能够生成一个非常出人意料的结果,他同时又会产生所谓幻觉,胡说八道,为什么会出现这个现象,这个根本不清楚?
所以头一个必然会迎来一个科技的革命,首先这个革命会从 AI 本身开始。
第二个事情,大家讨论得非常多,就是产业的变革。首先是人工智能产业本身的产业变革。
人工智能产业的发展,跟信息科技产业发展是非常不一样的。信息科技的发展,我们可以用4个字来形容,高速持续,可是人工智能技术产业的发展缓慢曲折,什么原因?
一个最重要的原因,信息科技从一开始,理论就建立了起来,计算机的理论是1936年建立,通讯理论1948年建立,所以在理论指导下,它的技术、它的产业发展都非常顺利,
信息产业的所有硬件和软件全是通用,市场非常之大,信息产业不跟领域结合,根本就不可能有这个产业。而人工智能都是跟领域紧密结合,只有算法和模型,而且这些算法方面都是领域限定,任务限制的,开发出来的所有人工智能的硬件和软件全是专用,跟信息产业完全不同。
拿计算机来讲,完全不跟应用结合,它生产出来的计算机什么地方都没有用,但是有了ChatGPT之后就告诉大家,人工智能有可能建立一个跟领域无关的模型。
只有算法和模型摆脱了领域的限制,将来生产出来硬件和软件才会是通用,或者一定范围里头通用,你才有一个很大的市场,这就是今后信息产业革命的一个方向。
第三个事情,人工智能治理。ChatGPT 大家看正面得比较多,其实它反面也是很成问题的,因为我们用的方法是叫的预测下一个词,这种模式的学习,必然带来两个大问题:
首先,它的结果不确定,受提示词的影响极大,这就引起了ChatGPT输出有三个不可避免的缺点。
第一个缺点,错误是必然的,所以我们说胡说八道是必然的。
第二个它的输出,非常受输入的影响,受提示词的影响,我可以改变我的输入,问同样的问题,改变他的输入就会得到一个完全不同的问题。
第三个,他不知道自己错了,也改不了,必须依靠后面,刚才高文院士也提过了,AI对齐等等,为什么要靠我们来弄呢?他自己改不改?
我就举个非常简单例子,到现在为止,我问ChatGPT清华大学的校歌的歌词,他自己编了一套,我1年多以前就这么问他,到现在还是这样,我就告诉他说不对,清华大学校歌不是你说的,应该是西山苍苍东海茫茫,我把这歌词抄给他,他马上回对不起,我说错了,你应该跟清华大学歌词,我退出来再进去,问他清华大学校歌是什么,他又自己编了一套,就说明他不知道自己犯错了,而且是我告诉他错误,他也改不过来。
这些情况就说明ChatGPT的输出往往不会符合我们的要求,我们的道德要求,我们的伦理要求,我们政治的要求,所以人工智能的,这就是 ChatGPT出现以后,人工智能的治理是不可避免的,我是认为三个趋势一定是这样的。
那么我们怎么办?
我觉得我们主张,要发展第三代的人工智能,第三代人实际上是包含了三个内容,一个内容就是要建立可解释、鲁棒的人工智能理论。刚才我们提过千亿出现投资这种建立这个理论,才成为可能。过去实际上你不可能建立。
二是发展安全、可信、可控、可靠可扩展的人工智能技术。
也就是说只有建立了这个理论之后,我们才有可能得到一个安全的人工智能技术。换句话讲,现在的人工智能技术是不安全的,不可靠和不可信的,特别是利用大数据的机器学习,它的结果一定是这样的。我们必须建立人工智能的理论,这才能开发出可信、可靠、可信及可扩展的人工智能技术,从而推动产业化的产业创新应用和产业发展。
我相信,通过我们国家全国的规划,通过产学研的结合,我觉得我们这个目标一定会达到的,谢谢大家。