2025/10/24 信息来源: 外国语学院
文字:方晏| 编辑:青苗 | 责编:山石10月17日,2025年“数据要素X”大赛北京分赛颁奖仪式举行。本次大赛设立教育教学赛道,紧密结合教育改革与发展方向,聚焦智慧教育、教育公平、教学质量评估与提升、在线教育效果分析等领域,旨在推动教育领域数据驱动的创新发展。经过初赛评选和现场决赛,北京大学外国语学院团队项目“千亿语言学习语料库数据集YULK的生态与应用”从全国285个优秀项目中脱颖而出,荣获教育教学赛道一等奖。

颁奖现场
“千亿语言学习语料库数据集YULK的生态与应用”项目响应国家教育数字化战略与“四新”建设,针对语言教学精准化不足与学生数据素养薄弱的核心痛点,依托千亿级YULK语料库,构建数据驱动的语言学习体系与服务生态。项目专注于教育领域,通过YULK语料库及相关平台,为教师、研究人员和学生提供数据驱动的语言教学、科研赋能,推动语言学习与数字素养的深度融合。该项目的核心优势在于:高质量的语料库数据资源、面向教育场景自主研发的垂类大模型以及通过SQL编程语言有效培养学生的数据思维与编程能力,切实推动“语言+数据”复合型人才培养与教育数字化转型。
千亿语言学习语料库数据集覆盖新闻、学术、教育等17个领域,通过SQL查询、K值检索等轻量化工具,为智能翻译、语音助手等场景提供高质量数据支撑。目前已形成“数据生产-模型训练-应用落地”生态闭环,成为语言学习AI研发的核心基础设施。
该项目由北京大学牵头,联合贵州语料酷科技有限公司共同完成,充分彰显了校企协同创新的力量。未来,北京大学外国语学院将积极推进人工智能与语言学习的深度融合,构建“因能施教、以评促学”的智慧学习新场景,利用学习行为深度挖掘技术,解决传统教育中知识机械记忆主导、分层学习路径缺失、思维训练可视化不足等问题,为全国语言学习教育数字化提供可复制的解决方案。
延伸阅读:
“数据要素X”大赛是由国家数据局等部门举办的首个聚焦数据要素开发应用的全国性大赛,北京分赛由国家数据局、北京市人民政府指导,北京市政务服务和数据管理局会同34家市级部门及各区人民政府联合办赛。本届北京分赛围绕北京数据“一区三中心”战略目标和定位,突出北京特色和实际,设置科技创新、金融服务、医疗健康、教育教学、城市治理、政务服务、区域协同、社区服务等17个行业赛道。
自5月28日北京分赛启动以来,赛事共吸引来自全国各地的1173家市场主体报名,历经3个半月的参赛报名和初赛评选,285支队伍通过层层筛选顺利晋级决赛。
转载本网文章请注明出处