张志华:关于我国人工智能发展现状的分析和体会

OpenAI开发的ChatGPT产品一经发布便震动了整个人工智能界,同时由于其将可能给普通大众的生活带来深刻的影响,也引起了社会各界的广泛关注和讨论。以大语言模型为基座的通用人工智能技术成为现实的趋势越来越大。我们对现状需要有清醒的认识,寻找差距和问题,积极应对这种趋势带来的挑战。我们同时需要对大语言模型之后人工智能的下一轮潜在技术突破口做预判和探索,早做人力资源和技术储备。

人工智能发展有五个主要要素:算法、算力、工程、数据、市场。我国人工智能具有巨大的市场优势。算力由于芯片所限则是短期难以弥补的短板,这个问题的教训已经非常惨重不在这里赘述。我们具有丰富的数据资源,而且我们也有丰富的人力资源来从事数据清洗、标注工作,所以这个问题我们是可以解决的。我国发展通用人工智能目前面临的主要问题是同时精通算法和工程实现的顶级人才稀缺。

简单地说,现代人工智能技术是通过机器学习及由其驱动而发展起来的计算机视觉、自然语言处理和语音识别技术来实现多模态数据融合的现实交互。因此,算法层面目前主要牵涉机器学习、计算机视觉、自然语言处理、语音识别等。机器学习是核心,后三者则是应用场景驱动。机器学习对人工智能起关键作用的领域目前主要包括深度学习、强化学习、因果学习。下面仅就这些领域根据自己个人的体会进行讨论。当然肯定还存在或将涌现其他潜在应用场景和方法领域。

我国人工智能力量主要集中于计算机视觉和深度学习,而在自然语言处理和强化学习领域相对薄弱些。这主要是因为计算机视觉研究的对象没有地域问题,发展水平一直紧跟在国际前列。而深度学习的突破源于计算机视觉,这也使得深度学习在我国的发展和国际水平相差不大。相应的视觉产业市场明晰,所以数据标注布局也比较充足。

自然语言处理的任务原要比计算机视觉丰富和复杂,其发展一直要落后于计算机视觉。而且,语言具有特异性,即中文与英文存在不同,所以直接借用基于英文开发的语言模型到中文处理任务中不一定非常适宜。此外,由于自然语言处理难度问题使得市场潜力没被充分重视,而且中文互联网各自为政,中文互联网数据质量也较差,现在中文数据反而成为了制约其发展的一个主要障碍。我国在机器翻译和信息检索等应用发展还是不错的,但总体来说和计算机视觉的国际影响力不能比。

强化学习的成功主要体现在棋类游戏这类具有明确规则的应用场景,在其他领域应用落地一直不那么成功。强化学习对概率统计背景知识要求相对比较高,我国大学基本上开不出高水平的强化学习课程,所以该领域人才储备无论数量还是质量都不够。ChatGPT可以视为深度强化学习在自然语言处理领域的落地取得巨大成功。

因果学习和概率图模型一直是人工智能的重要方向,经济学诺贝尔奖和图灵奖都曾颁授给该领域,但是目前它面临着大规模数据的可扩展性问题,所以还没有像深度学习和强化学习一样在实际场景问题取得成功,但前景仍赋遐想。可能将引领大语言模型之后的下一代人工智能技术。我国因果学习以北大统计学科为代表积累了较强的学术实力,主要问题是和计算机科学的结合相对要滞后些。

好的算法需要好的工程实现才能发挥其最大的效果。特别是人工智能技术基于深度学习和强化学习,且依赖于大规模数据,所以工程实现变得尤为关键。深度学习在计算机视觉中以及强化学习在大语言模型中取得的成功都是算法和工程完美结合之作。机器学习系统已成为了一门重要的领域。虽然大学培养了大量计算机人才,但他们的工程能力提升极大得益于开源社区。“高手在民间”,民间力量一直是一股不可忽视创新的力量。然而通用人工智能对算力和数据要求高,这会堵塞民间发展,因为他们会觉得有心无力,难以有机会积累实战工程经验。算法可以通过各种途径自我学习,但工程经验一定得需要借助社会平台,个人力量无法企及。

人工智能的主要支柱学科是计算机科学和统计学。比如,机器学习和统计学密不可分,而统计方法是研究计算机视觉、自然语言处理和语音识别的主流方向。由于我国学科发展是由资源分配所驱动,计算机科学和统计学存在严重的学科壁垒,制约了两个学科的发展和人才培养。此外,我国统计学的发展也极其不平衡,统计学科主要建在一些财经和师范类大学,综合性和理工类大学则对统计学科发展重视不够。这种不平衡导致了统计学不能很好地支撑我国人工智能的发展。在计算机科学,由于理论和系统领域难度大、产出周期长,对这些领域的投入热情不高,更热衷于从事出成果快的领域。这些因素致使我国在算法和工程领域顶级人才的培养和储备不够。但重大创新性成果往往取决于最优秀的人才。

发展人工智能技术需要高度的想象力、创造力和执行力,需要务实、理性、严谨的求是态度。人工智能是一门年轻人的学科。我们需要创造一个良好的环境和机制,让有才华的年轻人有机会脱颖而出。因此,建议,1)加强和升华计算机科学和统计学的本科生培养,并深度融合两个学科的培养体系以适应现代发展需求;2)博士生培养以做项目完成指标为导向和以做论文为研究驱动的模式已经不能很好地服务科技的创新,我们需要以解决重要问题为激励的培养模式;3)国家层面构建一个公用的大型算力和数据平台,使得民间力量有施展的机会,从而让民间创新的活力保持健康发展,国家也得以积蓄人力资源。无论如何,我们这样的大国总要有实实在在做通用人工智能模型的人。

作者简介

张志华

北京大学数学科学学院统计学教授,大数据分析与应用技术国家工程实验室机器学习中心主任。主要从事机器学习、随机优化、统计推断和自然语言处理等领域的研究。研究范围涉及理论、模型、算法和应用等多个层面。曾在IJCAI、AAAI、UAI、NeurIPS、ICML、ICLR、COLT、AISTATS、MLSys、KDD、CVPR、ACL、EMNLP、COLING等人工智能、机器学习、计算机视觉和自然语言的国际会议上发表100多篇文章。出版著作《深度强化学习》,组织学生翻译经典书籍《深度学习》和《人工智能:现代方法》。


转载本网文章请注明出处