生成式 AI 不仅在重塑千行百业,也从根本上改变着人类写作、认知与思考的方式。在 ChatGPT3.5 发布后,一种乐观的预期广为流传:AI 将带来 「工作平权」。
2023 年,两位麻省理工学院的经济学博士,在 《Science》 期刊上发表实证研究,为此论调提供了佐证:即生成式 AI 能显著提升低绩效员工的表现,有望弥补其与高绩效员工的差距,从而减少不平等。
Science 期刊的编辑对此总结道,「技能较弱的参与者从 ChatGPT 中获益最多,这一点对于未来旨在通过 AI 来减少生产力不平等的政策具有重要启示。」
然而,两年过去,现实似乎并未完全遵循这一理想路径。
2025 年,两位哈佛大学的经济学博士,通过分析 2015 至 2025 年间覆盖超 6200 万员工、超 1.5 亿次的招聘就业数据,揭示了一个冷酷的真相:生成式 AI 正以一种 「资历偏向」 的方式重塑劳动力市场。
数据显示,2015 到 2022 年间,初级和高级岗位的就业增长曲线基本保持一致,但从 2023 年开始,两者开始出现分叉:高级岗位继续向上增长,初级岗位则开始掉头向下。
对于深度拥抱 AI 的企业,其初级岗位数量在六个季度内相对下降了 7.7%,而高级岗位则基本不受影响,甚至略有增长。这一现象的主因是招聘大幅减少,而非大规模裁员。
AI 非但没有带来普惠的平权,反而让 「强者更强」 的马太效应愈发凸显。携程 CEO 梁建章对此论文评价道 「AI 会取代初级的智力劳动,加剧年轻人在教育、结婚生育和职业初期等阶段所遭遇的困境。」
劳动力市场的结构变化只是冰山一角。一个更深层次的问题随之浮现:当 AI 大规模融入我们的工作流,它对人类的创造力本身,正在产生何种影响?AI 带来的效率提升,是否真的是个人能力的内化?它是否正在以一种我们尚未察觉的方式,塑造甚至 「统一」 我们的思想?当个体过度依赖 AI 之后,他们独立的、原创的思考能力是增强了,还是在不知不觉中被削弱了?
近期,北京大学李圭泉课题组在社会学顶刊 Technology in Society 发表的论文,正是对这一系列关键问题的正面回应。
研究的核心由两部分构成。研究一是一项大规模的自然实验,通过分析 ChatGPT3.5 发布前后,横跨全部 21 个学科门类的超 41 万篇学术论文,剖析 AI 对全球知识生产的真实影响;研究二则是一场持续追踪数月的纵向行为实验,在实验室环境中,探究 AI 对个人认知能力的长期因果效应。
研究团队结合断点回归设计与机器学习等技术,为我们揭示了生成式 AI 对个人创造力与群体同质性的长期且真实的影响。
该期刊为 JCR 一区 top,影响因子 12.5,在 socialscience,Interdisciplinary 分类下 271 本期刊中排名第 2
一、41 万篇论文的 「集体无意识」
最可怕的不是噪音,而是众声一词。
研究一是一项大规模的自然实验。
研究团队从权威的 Web of Science 核心数据库中,抽取了横跨物理科学、生命科学与生物医药、应用科学、社会科学、艺术与人文等全部 21 个学科门类的学术产出。通过对超过 17000 名学者的随机抽样,团队最终汇集了这些学者在 ChatGPT-3.5 发布前后的全部 419344 篇论文,构建了一个庞大的数据集,以此剖析 AI 对全球知识生产的真实影响。
生成式 AI 发布前后学术界论文同质性和创造力结果示意图
如上图所示,在 2022 年之前,全球学术产出的创造力 (红/蓝线)与同质性 (灰线)均在平稳增长。但在 ChatGPT3.5 发布之后,两条曲线的斜率均出现了急剧的拉升。
即 GPT3.5 发布后,学术界在显著加速知识产出 (创造力)的同时,也以更快的速度加剧了其内容的同质化,清晰地展示了生成式 AI 对知识生产的 「双刃剑」 效应。
为了证明观察到的变化是由 AI 引起的,而非巧合,研究团队采用了一种名为 「断点回归设计」(RDD)的因果推断方法。
1. 如何做
他们将 2022 年 12 月 ChatGPT-3.5 的发布作为一个天然的 「时间断点」。一篇论文发表在该日期之前还是之后,对于单个学者而言,存在着诸多其无法控制的偶然因素 (如审稿周期),这就近似构成了一个随机分配的 「实验组」(有机会使用 AI)和 「对照组」(无法使用 AI)。
2. 为何可靠
这种 「准随机」 的特性,使得研究者可以有效剥离其他长期因素的干扰,精准识别出 AI 带来的因果效应。为确保该方法的严谨性,团队还进行了一系列专门的统计检验,证实学者们并未在 「断点」 前后进行大规模的 「憋稿」 或 「抢发」 等策略性行为,从而保证研究结果的可靠性。
3. 如何量化 「创造力」 与 「同质性」 指标?
在确认了因果关系之后,研究团队从 「创造力」 和 「同质性」 两个维度对这 40 多万篇论文进行了量化分析。
创造力,由论文发表的 「数量」 和发表期刊的 「质量」(JCR 分区)进行评估。
-
数量:学者发表论文的总数。
-
质量:论文发表期刊的 JCR 分区 (JournalCitationReportsQuartiles)。这是一个权威的期刊评级体系,Q1 代表该领域影响力排名前 25% 的顶级期刊,Q4 则为末位的 25%。
同质性:通过内容相似度和语言风格相似度进行评估。
-
内容相似度:采用 SBERT 深度学习模型,将论文摘要的语义转化为数字 「向量」,再通过计算向量间的 「余弦相似度」,来判断其在核心意思上的相似程度。
-
语言风格相似度:通过字符级匹配算法,扫描并计算论文摘要之间重复出现的短语和句式,以此衡量写作风格的相似性。
4. 冰冷的双刃剑:更高效,也更单调
如图所示,分析结果清晰地揭示了一个 「双刃剑」 效应。
一方面,AI 的出现确实成为了学术产出的强大 「加速器」:学者的人均年发表量增加了 0.9 篇,发表期刊的质量平均提升了 6%,这一效应在技术和物理科学等领域尤为突出。
但另一方面,效率的提升正以思想和表达的多样性为代价。数据显示,论文的语言风格相似度平均每年惊人地增加了 79%,同时论文的内容主题也出现了显著的趋同,其中物理科学、艺术与人文学科的同质化现象最为严重。
断点回归结果图
北大研究团队的这项大规模自然实验,为我们提供了真实世界的宏观证据:生成式 AI 确实是学术产出的强大 「加速器」,它帮助学者更快地产出、并发表在更好的期刊上。然而,这种效率的提升,正以思想和表达的多样性为代价。
全球的知识生产,似乎正在这场 「大交换」 中,变得更高效,也更 「单调」。
与此同时,研究一也留下了一个更深层次的问题:这种宏观趋势,对每一个身处其中的个体,究竟意味着什么?AI 带来的创造力提升是真实的个人能力成长吗?
为了回答这个问题,研究团队在研究二中进行了一场持续追踪数月的纵向行为实验,在可控的实验室环境中探究 AI 对个人认知能力的长期因果效应。
二、AI 留下的创造力伤痕
思想一旦屈从于习惯,便失去了创造的可能。
事实上,已经有不少实验室用小样本的实证研究,从不同角度印证了宏观数据所揭示的趋势。例如,康奈尔大学的研究发现,AI 写作助手会牺牲文化独特性,使用户的表达趋向 「西方范式」;圣塔克拉拉大学的研究也表明,使用 ChatGPT 的个体,其创意在语义上更为雷同。
尤其值得一提的是,麻省理工学院的研究团队通过脑电图 (EEG)技术直接观测了个体的大脑,发现使用 ChatGPT 的学生组,其大脑活动水平远低于仅靠自己思考或使用搜索引擎的小组。
这些研究共同指向一个结论:AI 正以降低认知投入和牺牲多样性为代价来提升效率。
EEG 实验过程中的参与者示意图
然而,大部分研究都聚焦于使用 AI 的即时影响,鲜有探究当 AI「离场」 后,其效果能否持续,以及其长期的负面影响是否会消退。
北大的这项研究在此方面做出了新的尝试:
它不仅在为期七天的实验中观察 AI 的即时作用,更通过实验结束后的第 30 天和第 60 天两次独立的追踪测试,系统性地检验了 AI 依赖所带来的长期后果。这使得我们能够真正看清,AI 带来的究竟是可迁移的 「能力」,还是一种短暂的、无法内化的 「幻觉」。
具体而言,北大研究团队在研究二中将 61 名大学生随机分为两组:「AI 实验组」(可使用 ChatGPT-4)与 「纯脑力对照组」。
实验设计分为三个关键阶段:首先,所有参与者在第一天均不使用 AI,完成创造力基线测试;随后,在第二至第六天,「AI 实验组」 在 AI 辅助下完成每日的创造力任务,「纯脑力对照组」 则在没有辅助的条件下完成任务;最后,也是最关键的,在第七天、第三十天和第六十天,所有参与者都必须在无 AI 辅助的情况下,完成最终的追踪测试。
实验设计示意图
为了全面地评估 「创造力」,研究采用了复合的任务模式,涵盖了多个维度。这些任务包括:
-
发散思维测试:经典的 「替代用途任务」(AUT),要求参与者为日常物品 (如 「一支钢笔」)想出尽可能多的新颖用途。
-
创意问题解决:更贴近真实世界的商业场景题,例如要求参与者为一款 「智能单车」 设计创新功能。
-
聚合思维测试:在追踪阶段加入的 「远距联想测验」(RAT),要求参与者找到一个能同时连接三个不相关词语的关联词。
-
洞察力问题:经典的 「蜡烛问题」,要求参与者用一盒图钉、一根蜡烛和一盒火柴,将蜡烛固定在墙上,并且不能让蜡滴到桌上。
为确保评估的科学性,研究采用了该领域的 「黄金标准」——专家共识评估法(CAT)。多位专家评委在对分组情况和研究目的毫不知情的 「双盲」 条件下,独立地对数千份创意产出 (包括发散性思维任务和复杂问题解决方案)的新颖性、实用性、灵活性等多个维度进行打分。极高的数据一致性 (评分者信度 ICCs>0.90)确保了评估结果的科学与公正。
研究二中同质性的测量方法,采用了与研究一完全相同的技术方法,确保了两个研究之间评估标准的一致性。
创造力:ChatGPT 对 AUT 和解决问题两类创新任务的影响
同质性:ChatGPT 对 AUT 的内容同质性和语言风格同质性的影响
实验结果清晰地揭示了一个残酷的不对称性:
-
创造力的提升是短暂、不可持续的:在使用 AI 的阶段 (第 2—6 天),「AI 实验组」 的各项创造力指标确实远超 「纯脑力组」。然而,一旦 AI 被撤走,这种优势便瞬间消失。从第 7 天开始直到第 60 天,两组的创造力表现再无显著差异。更令人警醒的是,在第 60 天的聚合思维测试中,实验组的参与者表现甚至显著差于从未用过 AI 的对照组,AI 带来的,并非可迁移的 「能力」,更像是一种无法内化的 「幻觉」。
-
思想的同质化却是长期的,会留下 「创造性伤痕」:与稍纵即逝的创造力提升相反,思想的同质化却表现出了惊人的 「粘性」。即便在停止使用 AI 两个月后,「AI 实验组」 的产出内容,无论在语义上还是语言风格上,依然比对照组表现出显著更高的相似度。
这项纵向追踪研究用直接的因果证据,证实了 AI 对个人创造力的长期影响。AI 带来的可能只是一种无法内化的 「创造力幻觉」,而它留下的思想趋同,却可能成为一道难以消除的 「创意伤痕」,长期存在于我们的认知与表达习惯之中。
三、如果世界没有了新创意
这是最好的时代,也是最坏的时代。
北大这项研究的结论,并非是让我们因噎废食,在 AI 时代里彻底放弃 AI。恰恰相反,它旨在提醒我们,必须有意识地去理解和应对,长期依赖 AI 对个体思维与认知习惯的深远影响。
研究中揭示的 「同质化」 趋势,其背后有着深刻的认知科学原理:AI 的输出很容易对使用者产生强大的 「锚定效应」。当 AI 迅速生成一个 「看起来还不错」 的答案或框架时,我们的思维就会被这个初始方案 「锚定」,后续的思考和创造便很难再大幅偏离,从而在群体层面导致了思想的收敛。
今年 7 月当黄仁勋在接受 CNN 的专访时,抛出了一个冷静的判断:「如果世界没有了新创意,那么 AI 带来的生产力提升就会转化为失业。」
当生成式 AI 被不断使用,互联网的信息、人类的知识库正以前所未有的速度变得更加同质。北大的研究用冰冷的数据证实,这种趋势真实存在。若社会能够不断涌现新的创意,AI 会转化为更多元的就业机会;若只重复旧任务,AI 在几秒内即可完成。
AI 放大了创意,也加速了 「思路枯竭」 者出局。
四、在 AI 时代,如何保持思考的锋利
AI 减轻了我们的工作负担,但我们需要建立一个能深度思考的思维体系,能和 AI 进行交互,描述想要让 AI 解决的问题,也要对问题进行推理,同时判断 AI 是否正确回答了问题,我们要有辨证思维。
——黄仁勋
作为身处 AI 时代的个体,我们该如何自处?如何在享受 AI 便利的同时,避免陷入创造力荒漠?结合研究的启示,以下是一些具体的行动建议:
-
把 AI 当 「思想陪练」:把它当成一个不知疲倦、能提供无限视角的 「思想陪练」。用它来进行头脑风暴,生成多种可能性,挑战你的固有假设。但最终的筛选、深化、决策和对结果负责的,必须是你自己。
-
刻意练习 「认知摩擦」:对抗 「锚定效应」 最有效的方法,就是主动制造 「认知摩擦」。不要轻易接受 AI 给出的第一个答案。刻意地去反驳它、寻找它的逻辑漏洞、质疑它未考虑到的方面,这种批判性思维的练习,正是保持我们独立思考能力的关键。
-
设置 「无 AI 时间」:正如我们需要定期锻炼身体以防肌肉萎缩,我们也需要定期让大脑进行无 AI 辅助的锻炼。每周定期划定出一段 「无 AI 时间」,用最原始的纸笔或空白文档进行思考、规划和创作。这种刻意的 「认知断舍离」,能确保我们大脑的核心创造与推理能力不会在安逸中退化。
参考资料
Noy,S.,&Zhang,W.(2023).Experimental evidence on the productivity effects of generative artificial intelligence.Science,381(6654),187-192.
Zhou,Y.,Liu,Q.,Huang,J.,&Li,G.(2025).Creative scar without generative AI:Individual creativity fails to sustain while homogeneity keeps climbing.Technology in Society,103087.
Lichtinger,G.,&Hosseini Maasoum,S.M.(2025).Generative AI as Seniority-Biased Technological Change:Evidence from US Resume and Job Posting Data.Available at SSRN.
Kosmyna,N.,Hauptmann,E.,Yuan,Y.T.,Situ,J.,Liao,X.H.,Beresnitzky,A.V.,...&Maes,P.(2025).Your brain on chatgpt:Accumulation of cognitive debt when using an ai assistant for essay writing task.arXiv preprint arXiv:2506.08872,4.
Nvidia』s Jensen Huang says AI could lead to job losses『if the world runs out of ideas』—By Auzinea Bacon,CNN,2025
黄仁勋:羡慕年轻人可以当 AI 原住民,鼓励大家当 AI 指挥家|世界观
本文来自微信公众号:腾讯科技 (ID:qqtech),作者:涵清,编辑:郑可君