大模型时代的范式变革——“新工科下午茶·学科交叉沙龙”第七期活动举行

5月17日下午，“新工科下午茶·学科交叉沙龙”第七期活动在百周年纪念讲堂四季庭院内举行。本期沙龙由新工科建设办公室、社会科学学部办公室主办，学科建设办公室协办，聚焦“大模型时代的范式变革”主题进行研讨。沙龙由政府管理学院副院长、教授黄璜主持，来自计算机学院、工学院、人工智能研究院、社会学系、外国语学院、哲学系、心理与认知科学学院、经济学院、医学部及学校相关职能部门共40余个单位的70余名师生现场参与研讨。

活动现场

活动视频花絮

学科建设办公室副主任王志恒在致辞中表示，近期以ChatGPT为代表的大模型技术应用引起了广泛关注。北京大学依托学科交叉优势，由多学科视角入手，从组织机构、人才队伍、人才培养等方面布局人工智能领域发展，并将“数字化智能化+”作为新一轮“双一流”建设布局的重大交叉学科项目之一。在此背景下，我们需要着重探索如何通过学科交叉促进“从0到1”的模式转变与原创性成果的产生。

计算机学院教授黄铁军以“通用人工智能”为题，介绍了大模型技术的产生背景、发展历程、基本原理、智能能力及发展方向。通用人工智能（Artificial General Intelligence，AGI）是指在人类智能所有方面都达到人类水平，能够自适应地应对外界环境挑战，完成人类能完成的所有任务的人工智能。OpenAI公司于2015年成立，以AGI为最终目标，2019年起聚焦大模型，并于2022年11月发布ChatGPT，引发轰动。ChatGPT的基本原理是无监督预训练，通过海量数据“刷题”，用前K个单词预测第K+1个单词，自监督地训练深度神经网络。它是人类语言能力的投射，可以说“有多少人工，就有多少智能”，当参数规模达到数百亿时，出现了“融会贯通”的“涌现现象”。同时，它在认知能力上前进了一大步，具备跨学科整合、想象、编程、数学、辨别、交互等通用智能能力，也表现出了误导和操纵等负面能力。他表示，大模型是在无标注大数据上产生的“文化智能”，是发展AGI的路径之一，此外还有从未知环境中学习的“具身智能”和复制生物神经系统先天结构的“类脑智能”两条发展路线。未来，AGI将从信息智能拓展到实体智能，从“静态融通”到“动态涌现”，能力将更加强大。他预测，到2045年，真正的AGI——超人“电子大脑”有望实现。

计算机学院教授、计算语言学教育部重点实验室主任穗志方以“数据驱动与知识驱动融合的人工智能方法”为题作报告。GPT系列经历了从预训练模型（GPT，GPT-2）、超大规模基础模型（GPT-3）再到超大规模“通用”模型（ChatGPT，GPT-4）的发展阶段。她指出，当前阶段的大模型仍然存在着三大局限性，一是以解释性差、可信性差和过程难以干预为特征的黑匣模式，二是需要数据驱动、泛化性不足和难以适应环境的知识鸿沟，三是测试难度、测试信度和测试效度不足造成评测失真。前两者导致大模型出现幻觉现象、社会偏见、内容毒性等缺陷。如何将人类语言知识、世界知识与神经网络模型内在的隐式知识等多源异构知识相融合，有效提升神经网络模型的准确性、安全性、可靠性？课题组着力研究数据驱动与知识驱动融合的人工智能方法，形成基于知识神经元的预训练语言模型知识建模与分析、基于神经知识库的可解释隐式知识增强、基于精准需求理解的显式知识增强、数据驱动与知识驱动融合的大型语言模型幻觉消除等研究成果。针对评测失真问题，课题组发展类人机器语言能力评测体系，并组织了空间认知语义理解任务和基于前提认知的跨模态推理评测任务。

社会学系教授邱泽奇以“数字化与文科范式革命”为题，分析了文科三次范式革命的演化历程及人工智能技术的推动作用。他指称的文科包括“对精神的挖掘”的人文学科和“对规律发现”的社会科学。他指出，判断文科范式变革有三个必要条件：一是资源/素材，二是处理素材/资源的技术/方法，三是从前两者获得的知识创造/积累，即视角/理论。文科的第一轮范式革命是人类有了文本、图像等可记载知识的载体后发生的变革，是人类整体性知识创造和积累的开始，可被称为“学术革命”，本质上是知识精英个性化地对人文和社会属性进行非计量的刻画与解释，此时，人文学科与社会科学还没有分离，甚至与自然科学也没有分离。第二轮范式革命是从素材的计量化开始的，可以称之为“计量革命”，本质上是科学家群体个性化地对人文和社会属性进行基于计量的刻画与解释。精确计量把自然科学从整体性学术中分离出来，统计技术的引入和发展把社会科学从人文学科中分离出来，形成了学科化的知识创造与积累格局。但是，学科化的人文与社会科学不过是对整体性人类社会的一幅幅认知拼图，与自然现象不同，社会始终是一个互动的整体。数字化提供了把人文和社会属性转化为数值数据的机会，也提供了一个重新以整体方式认识人类社会的机会，让人文学科和社会科学走向新的综合，催生着第三轮范式革命——“智能革命”。他认为，智能革命包含素材像素化、像素数据化、数据理论化、理论智能化四个阶段，后三个阶段甚或四个阶段的发展可能与人工智能技术之间形成深度互构，并基于人机互动形成智能的知识体系，即“理论智能化”，人在这个进程中的贡献会越来越变成理论智能化的供体，而不是综合体。

艺术学院院长、教授彭锋以“关于智慧剧场的设想”为题，展望了在人工智能技术的赋能下未来剧场的可能形态。在传统剧场中，观众与舞台的距离及观看角度的局限影响了观剧体验。而人工智能技术的发展，使多摄像头特写、360度任意视点观看等技术成为可能，为智慧剧场克服上述局限性提供了解决方案。同时，智慧剧场还可以利用人工智能技术增强观众的参与感。古典美学认为艺术和日常生活之间存在“第四堵墙”，艺术被看作是特别的事，艺术体制将审美与生活隔离开来。但现代艺术一直在尝试将艺术与生活结合，艺术家们一直在努力冲破“第四堵墙”，让艺术接入社会；而全息投影卡拉OK等技术创新也让社会接入艺术成为可能。未来，智慧剧场可以通过AI视频抠像等技术实现角色扮演，满足普通人与明星同台演出的梦想；也能够像演戏一样玩剧本杀、像写小说一样拍电影，并最终实现“一句话就能拍大片、人人都能当导演”的终极目标。

国家发展研究院助理院长、长聘副教授黄卓以“AI大模型在金融中的应用前景”为题作报告。他认为，ChatGPT标志着人工智能应用跨越奇点，进入智能涌现阶段。在智能化成为金融机构数字化转型趋势的背景下，以AI大模型为代表的人工智能技术引领我国金融科技从应用创新驱动阶段进入技术创新驱动阶段，金融行业也为AI大模型提供了人机交互、逻辑推理、大数据分析、内容自动生成等丰富的应用场景。他介绍，AI大模型在金融中的应用包括智能化运营、量化投资和智能投顾以及智能风险管理三大方面。在智能化运营方面，能够借助AI大模型实现智能营销、智能客服、智能运营和投资者教育。在量化投资和智能投顾方面，AI大模型一方面可以帮助分析师和基金经理研判市场趋势、生成研究报告，提升计算机编程和大数据分析能力；另一方面可以辅助金融机构开展资产管理和财富管理业务，对长尾投资者进行快速财富画像，并为投资者自动实现个性化的最优资产配置。在智能风险管理方面，AI大模型不仅能够运用于反欺诈，还能够通过降低普惠用户的融资成本、降低金融机构的风控和合规性成本以及对接监管科技实现风险控制与风险管理。

报告分享环节（从左到右、从上到下依次为：黄铁军、穗志方、邱泽奇、彭锋、黄卓）

在交流讨论环节中，嘉宾们围绕大模型的研究路径、伦理风险和能力评估，艺术未来的发展形态等问题展开热烈讨论。大家认为，大模型最终将成为服务于所有用户的基础设施，个体研究者虽不具备超大规模的算力和人力资源，但其针对具体科学问题的探索对推动大模型发展也具有重要意义；伦理问题具有特殊性和复杂性，但科技向善始终是处理好技术发展与人类关系的国际共识；需要针对大模型形成更加类人的、关注模型内部机理和聚焦人类认识的评估方法；在人工智能生产能力的无限性和人的需要的有限性的双重作用下，不同的学科视角对艺术家和艺术作品的前景持有不同的观点。