各位老师、同学们,大家下午好!我是来自中国科学院计算机网络信息中心的祝恒书。
今天非常开心能够来到这里和大家分享现在非常火的人工智能大模型的话题。为此,我还专门请我的女儿给今天的演讲起了一个题目,叫 《大模型来了,阁下又该如何应对?》。
今天这个报告,主要想跟大家探讨一下,在像大模型这样的新一代人工智能的浪潮下,我们每个人能够做些什么,以及我们未来还需要做些什么?
在今天的报告开始之前,我给大家提一个问题:你心目中的人工智能是什么样的?
大家不用急着回答我的问题,我希望大家带着这个问题,来听今天的演讲。我相信在最后,你们每个人应该都会有新的思考。
那么接下来就进入今天的演讲了。
从单一到通用
我从最近我们全家都在玩的一个游戏说起。这款游戏叫 《原神》,是非常好的国产开放世界游戏,我们全家都在玩。这款游戏的音乐也非常好听,还有很多富有哲学思考的内容。
在这个游戏的最新章节中,有一个非常重要的人物,叫阿贝多,就是下图右边这个金发的 「少年」。
阿贝多是个什么人物呢?他是蒙德西风骑士团调查小队的队长,还是一个非常厉害的炼金术师。另外,他还有一个不为人知的身份——他是一个人造人。
什么叫人造人?就是由人所制造出来的人类。
这件事情听起来特别玄幻。但是用机器制造一个人造人,其实是每一个做人工智能的研究者的终极梦想。
人工智能是什么?人工智能的英文叫 「Artificial Intelligence」,所以大家简称 「AI」。从 AI 诞生到现在,它的定义一直在变。我自己最喜欢的定义,就是人工智能是人所创造出来的机器智能。它的关键是让机器像人一样,用智能的方式去思考并解决问题。但是,直接造出像阿贝多这样的人造人,让他解决所有问题,是一件非常困难的事情。
人工智能的科学家在过去的 70 年里做了大量的工作,选择了逐步击破。所以传统的人工智能,通常只是解决某一个领域的单一问题。比如说,科学家们制造出了可以切菜、可以做手术的机械臂;制造出了可以空翻的机器人;今年 (2025 年)春晚上扭秧歌、扔手帕的机器人;还有各种各样的自动驾驶、无人车……这些其实都是人工智能。
但是这些人工智能,通常只能解决某一个单一领域的问题。那么,让一个机器去解决通用领域的问题,这就是人工智能科学家一直所追求的梦想。
人工智能是从 1956 年的达特茅斯会议上提出来的,距今已经有将近 70 年的历史了。我相信大家肯定也听过很多人工智能的讲座。那些老教授们经常会讲,这 70 年里发生了几次浪潮、几次革命。
但是很遗憾,我是一个 85 后。在人工智能发展的前 30 年,我还没有出生。人工智能前 30 年发生的事情,我也是道听途说,所以没有办法跟大家准确地分享。我重点讲讲我出生以后的 30 年,人工智能领域发生了什么事。
在我出生之后的这 30 年里,我觉得人工智能领域有三件非常值得铭记的大事。
第一件事,是 1997 年,IBM 公司研发了一个超级计算机,叫深蓝 (Deep Blue)。这个计算机在国际象棋上战胜了世界冠军卡斯帕罗夫。这件事在我小学的时候引起了很大轰动,都写到了考试卷里。
为什么引起这么大的轰动呢?因为国际象棋是一个智力运动,以前大家觉得让机器在智力运动上战胜人类,几乎是不可能的。但是 IBM 通过超级计算制造出一个人工智能,战胜了人类的冠军,这非常厉害。
第二件事是过了 20 年之后,在 2016 年,谷歌投资了一个英国公司——DeepMind。这家公司开发了一个人工智能,叫 AlphaGo,中文是阿尔法狗。这是一个下围棋的人工智能,它在围棋上战胜了当时的世界冠军李世石。后来它的改进版本,还战胜了中国的世界冠军柯洁。
这件事在当时引起了非常巨大的轰动,甚至开启了一个全新的人工智能深度学习的时代。为什么?因为围棋的复杂度非常高,空间复杂度高达 10360,这超过了宇宙所有原子的数量。所以大家一直认为,围棋是人类智力运动皇冠上的明珠,是绝对不可能被人工智能战胜的。最后,一个 AI 通过很精妙深度设计的算法,战胜了人类。
据说当时在中国棋院流传着一个段子:以前你形容一个人下棋下得 「臭」,就说你棋下得就跟 AI 一样。现在你说下得跟 AI 一样,那人会说太荣幸了,这是在夸我。这虽然是个段子,但确实是这样。
第三件事是,2022 年 10 月 30 日,美国的一家名为 OpenAI 的公司发布了一个生成式人工智能大模型,叫 ChatGPT,它真正地开启了大模型时代。
之后全球出现了百模大战,中国出现了 DeepSeek、豆包、文心一言、ChatGLM(智谱清言)等一大堆的模型,让我们看到了通用人工智能的曙光。
通用人工智能的曙光
为什么说大模型是通用人工智能的曙光呢?我相信大家都用过大模型。首先,你可以用自然语言跟它交互,问它各种问题。你可以问它,能不能帮我写一首藏头诗,里头要有人大附中这四个字,它能给你写一首诗。
你还可以说,请用中学生能够听得懂语言,解释一下什么叫相对论,它也可以告诉你。
它还可以帮你画画。你说,请帮我用中国水墨画的风格,画一个人工智能的一个宣传图。大家用了可能觉得还不稀奇。
其实对我来说,大模型是读懂年轻人梗的一个特别好的东西。我现在发现,我跟我女儿交流的时候,经常不知道她在说什么。我加她微信,她有时候给我发一张图,说:「呵呵呵,自己吓自己。」 我问女儿这是什么意思,她呵呵呵不讲。
于是我就把这张图发给了大模型,大模型就告诉我,这是现在年轻人里流传的一个段子,是一个短视频里的梗图。所以我就把这张图加到我的表情包里了。现在,我女儿有时候晚上发:「天黑了怎么办?」 我就给她发:「呵呵呵,自己吓自己。」
大模型除了可以问答以外,还可以干什么?它还可以理解我们物理世界,去创造一个虚拟的世界。这个视频来自在去年 (2024 年)年初 OpenAI 发布的一个文生视频大模型 Sora。
这个视频是什么意思呢?我写一段文字,比如东京街头上,一个时髦的女性在走。Sora 就可以生成一个短视频,这是非常厉害的事。从人工智能科学家角度来说,这件事是跨时代意义的,因为它代表大模型能真正地理解人类的物理世界,而且能创造一个虚拟的世界。比如它知道了什么叫做时髦、什么叫做东京的街头,它们的特点是什么,而且知道人在街头走,而不是在飞。这是非常厉害的事情。
当然,大家说这些可能都还不厉害。我们现在在上学,人工智能如果真的厉害,它去高考会怎么样?其实这件事,在两年前,国内外的科学家们就去做了实验。
首先是美国的科学家让人工智能去考美国的高考 SAT 和美国的研究生考试 GRE。考完的结果是什么呢?大模型在语文上超过了 90% 的真人考生,在数学上超过了 80% 的考生,综合成绩能考进美国排名前 30 到 50 的学校。这至少相当于我们 C9 高校,是非常厉害的。
大家可能会说美国的高考不行,因为美国的题太简单,那如果换成中国高考会怎么样?去年 (2024 年)就有中国的媒体做了一个实验,用大模型去考去年 (2024 年)全国高考新课标一卷的文科考试,最后发现有四款大模型在河南省考进了一本线。
▲左:GPT-4 的 SAT/GRE 成绩大致相当于能申请上美国 Top 30~50 的大学和研究生项目;右:四个 AI 大模型成功 「冲上一本线」,理科普遍不及格,大模型更像文科生
从这里,我们还可以看到很好玩的事——大模型在中国的高考上,数学、物理这些理科普遍不及格。它在美国能超过 80% 的人,在中国就不及格,这说明什么?中国的题太难了,美国的题太简单了。所以经常大家说,中国的初中生去美国,是碾压美国的高中生的。
听完这些以后,大家知道大模型非常厉害了。它能够理解世界的知识,还创造了虚拟世界。
那么,我们回到一开始的人造人。我们能不能通过大模型,去制造一个虚拟的世界?制造一群人造人来帮我们工作呢?这是我去年 (2024 年)给团队的研究员们提的一个问题。于是,我们花了一点时间制造了一个人工智能科学家组成的实验室。这个实验室里有 12 个形态各异、能力各异、学科领域各不相同的 AI 科学家。
我们给了这些 AI 科学家一个任务,就是每天去帮我们读论文,帮我们讨论研究点,以及帮我们写一些新的科研建议。
我们做出来的这个虚拟实验室,一共有 12 个人造人,每天大家会自主上班,居然还有 AI 差点儿迟到了。它们每天会自己组织在一起开会、讨论。我们还很人性,中午可以让 AI 去吃个午饭休息一下。它们每天还会下班。
这里的每一个小人儿,都不是我们写的规则,而是完全通过大模型让它自主地去从事任务。
我们给这些 AI 每天布置任务,比如帮我读一些最新的论文,帮我讨论人工智能领域还有什么新的学科交叉结合点。它们就会自主地去行动,自主地去工作,效率非常好。
而且,我们发现了非常好玩的社会化现象,不同的人工智能会互相聚在一起形成不同的社交群体,而且每一个不同的群体中,会出现一些小的领袖,跟我们人类社会非常接近。这告诉我们一个道理,领袖都是从群众中凭能力成长起来的,人工智能也是一样的。
训练大模型,跟训练人很像
讲完这些以后,我们来点干货。跟大家讲讲大模型这么厉害,它是怎么被造出来的。当然这个在我们领域,不叫制造,叫训练 (training)。因为我们训练一个人工智能,就是给它各种历史数据,让它拟合,最后让它去预测未来,跟训练人是很像的。
那么刚才介绍的像 ChatGPT 这样的大语言模型,是怎么被训练出来的呢?它的核心本质是什么?其实就是这个公式。
这个公式是什么意思呢?其实就是给定前 N 个单词或者前 N 个字母,去预测第 N+1 个单词或字母的概率是多少。举个例子,比如说前三个字是 「人大附」,那么第四个字到底是人大附中的 「中」,还是人大附小的 「小」 呢?大模型就会根据全文的情况去推测、预测,给一个概率,这个就是人工智能。
怎么去做这件事?我以大语言模型的训练为例,给大家讲讲,我们是怎么把它给训练出来的。
为了训练一个超级人工智能,我们有三个步骤。第一个步骤叫预训练,就是给它读万卷书,把我们看过的所有书、所有材料都给人工智能,让它去学、去读。经过这个阶段大模型,能够理解很多世界的知识,但是还不会说话。
第二个步骤,就让它阅读范文。这个在专业领域,叫做有监督的微调。比如说写一个关于河北的作文,这时候我们给人工智能一个范文,让它跟着这个去学。经过这个训练,大模型会说话了,也会写作文了,但是写得还不够好。
最后一个阶段,就是让它实战演练。人工智能写完了,我们去打分,我跟它说写得不好、不及格,重写。那么经过这样的反复迭代、循环,我们也称为基于人类反馈的强化学习的阶段以后,大模型就会写得很好了。最后,经过这三个阶段,就产生了我们现在的大模型。
其实这个过程,跟我们学习非常像,同时跟我们每一个人学习语言的过程也非常像。不知道大家记不记得自己当年是怎么学会说话的,但我观察了我们家小孩长大的过程,觉得很像。一开始大人老跟她说,她就模仿,那时候她还不太会说话,但是会模仿。后来她上了幼儿园,去跟大家,跟老师、同学做交互,她就会说话了。在这个过程中,语言出现了涌现。
在这个过程中,我们还发现了一个非常有趣的现象:国外的大模型大量的训练数据是英文,但是它的中文却能说得很好。相反,中国的大模型主要的训练数据是中文,但它的英文也能说得很好。这说明,人类的语言可能在基础语法上是相通的。这个也印证了美国著名语言学家诺姆·乔姆斯基,在著作中提到的先天语法树理论。
这给大家一个什么启示呢?如果各位觉得自己英语学得不好,大概率是语文也没有学好。如果你们语文学得很好,英语肯定也不会差。
大模型重塑工作和创新
大模型这么厉害,那会不会对我们人类社会产生影响?会不会抢我们人类的饭碗?
现在媒体上已经有很多报道了,比如说因为 AI 很多公司裁员了,很多人要抵制 AI。这个事变成了一个很好玩的研究课题。国外的 OpenAI 在 《科学》(Science)杂志上发表了一篇论文。他们得到一个很有趣的结论,说未来有 80% 美国劳动力的工作会受到人工智能的影响。
中国的一家科研机构预测,未来 5 年会有超过 73% 的工作,要求使用大语言模型。同时还得到了一个非常有趣的结论,那些知识密集型的、白领型的工作最容易受到影响。而那些劳动密集型的、蓝领的工作受到影响更小。
所以说 「卷」 到最后,居然蓝领才是 「铁饭碗」。这件事跟我们从小学习到的是反的。因为老师都跟我们说,你们不好好学习未来只能去刷碗,只能去当保安,最后蓝领被机器替代了。但现在有可能学到最后,学得最好,却最有可能被替代。
为什么会出现这样一个反常识的结论?其实并不是这样。因为大模型时代,它替代的实际上是 「脑力劳动」 中的 「体力劳动」。
可能每个同学都觉得,做作业都是脑力劳动。但你们认真地想一下,做作业的时候真的都是脑力劳动吗?很多时候很多题都做十遍二十遍了,家长说再复习复习 。你们累的根本不是脑,而是手、是胳膊。那其实大模型替代的,就是 「脑力劳动」 中的 「体力劳动」,那些事务性、繁琐的、常规的事情。
为什么感觉蓝领的工作,好像被影响较小呢?那是因为蓝领的工作,早在一个多世纪之前的工业革命时期,基本该替代的就被替代了。那时候在英国甚至发生了工人因为怕机器抢他们工作,去打砸机器的卢德运动。
▲左:卢德运动,1811 (Luddite Movement);右:汽车替代马车的时代启示
事实上一个新技术的出现,不光会颠覆现有的一些工作,也会产生很多的创新,会创造一些新的工作机会。比如说汽车替代了马车,但它也创造了司机,创造了道路养护,创造了汽车维修这些新的工作。所以汽车替代的永远不是马车夫,而是那些不愿意改变,不愿意创新的马车夫。
因此,我们团队做了一个研究工作,得到一个结论:大模型正在重塑我们工作和创新的边界。
到底什么叫创新?有人说我会画画,我会写作文,我会写小说这是不是就是创新呢?创作不等于创新。
大家可以看到,下面的两张图,都是以动物园为主题的两幅画,大家觉得哪一幅才是创新?
很多人可能觉得左边很漂亮,其实左边我是用大模型生成的。我给它写了句话,请以梵高 《星空》 的风格帮我画一幅动物园,大模型画出来了。这里的动物都是历史上真实存在的,画风也是模仿梵高的,它其实是一种模仿。
右间这幅是我在网上找的一个小学生的画作。大家看这幅图里头,有红色的天、红色的云,还有不知道什么动物,这其实创造了一个新的物种,这可能才是真正的创新。
所以,创新的核心是打破现有知识的边界。大模型时代,我们每个人一定要去 「卷」 的是创新。只有 「卷」 创新,才能让我们躲开那些 「脑力劳动」 中的 「体力劳动」 陷阱。
在最后,我再跟大家分享一下,在大模型时代我们每个人要做些什么?要做好哪些准备?我在这里给大家提两点建议。
第一个建议叫知己知彼,百战不殆。
我们现在已经进入了大模型时代,这是一个人智协同的时代。我们对这个东西不能避而不见了。比如说家长、老师说,大模型这么厉害,会不会让学生变得懒惰,会不会让学生以后就抄作业了,所以不能用大模型。
我个人认为这是不对的。每个人一定要坚持用,积极地去用。因为只有你多用,才能知道大模型的边界在哪里,才能更好地批判性地去使用它。大模型确实有幻觉,但是它也能够提升我们效率,是帮助我们创新的一个利器。
这里最重要一点,是我们要知道大模型的能力边界到底在哪里。因此我们团队针对大模型在科学领域的应用,开发了一个平台,叫 「科学地平线」。
我们去看一下大模型在数理化天地生各个不同领域的学科能力到底怎么样。那么有了这样一个平台,我们就知道以后在做不同的研究时,要用什么样的人工智能了。
第二个建议,是要坚持终身学习。
现在我们是知识经济时代,对于每个人来说,不变的就是要去学习,要去坚持地学习。有非常多新的知识、技能要我们去学习。
怎么学习呢?我们团队三年前在 《自然》(Nature)子刊上发了一个工作,给了三条建议。
第一条建议叫学习要跨界,要敢于打破你自己的学习舒适区。比如说你数学学得好,要多学语文;语文学得好,英语应该就学得好;英语学得好,就要学学物理,一定要学会跨界。
第二个建议,学习不要盲目地去追逐热门,要去做那些难而正确的事。从小老师说,学好数理化,走遍天下也不怕。当然学好语文、英语也很重要。那么关键就是,我们要找到那些最基础的东西,把基础打好。
最重要是第三个建议,学习要学会长期的投资。我们的这篇文章中,提出了一个结论:10 年的学习投入,能让你的身价翻 2.5 倍。
这是非常有趣的一个结论,大家还记得在开场的时候,我问大家的那个问题吗?
在你心目中,人工智能是什么?
事实上,我觉得人工智能现在是什么样,以前是什么样不重要。我们更关心的是,人工智能的未来是什么样。
在我的眼里,人工智能未来不仅会更强大,还会更温暖,将是一个负责任的人工智能,叫 Responsible AI。因为我们社会上有非常多的事情要解决,就像 《蜘蛛侠》 里说的,能力越大责任越重。我们的医疗健康、教育、社会治理,有很多问题都需要去解决,那么人工智能就会成为大的帮助。这个工具,我们好的一个帮手,去帮助我们解决这个问题。
最后跟大家讲一下,我从事人工智能这个领域研究的一个初衷和我的理想,就是 AI For A Better World,人工智能让世界更美好,谢谢大家。
本文来自微信公众号:格致论道讲坛,作者:祝恒书