为进一步探索AI时代语料库语言学的理论与方法创新,促进语料库在语言学及相关学科的应用与发展,推动多学科交叉融合的新文科建设,11月14日至16日,由西安交通大学外国语学院、中国英汉语比较研究会语料库语言学专业委员会主办,《外语教学》《西安外国语大学学报》编辑部协办的第二届“基于语料库的跨学科前沿研究国际会议”在西安交通大学成功举办。
本次会议聚焦“AI时代语料库的跨学科融合”,邀请了10位国内外语料库领域的专家学者做主旨报告,吸引了来自英国、美国、日本、德国、法国、新西兰、马来西亚等国内外高校近200位师生参会。

14日下午,会前工作坊如期举行。英国兰卡斯特大学Paul Rayson教授、Vaclav Brezina教授、Paul Baker教授分别围绕“使用PyMUSAS与Wmatrix7进行多语种语义标注”、“AI时代的数据驱动学习:#LancsBox X实操入门 ”、“患者反馈中的性别差异 ”与参会人员互动交流。当晚举行了两场线上工作坊。早稻田大学Laurence Anthony教授在线讲解了语料库方法与AI融合的优势互补实践,演示了借助LMStudio、Ollama与Llamafile个人AI模型的语料库实操方法并解答了参会代表们的疑问。本次工作坊构建了从语义标注工具实操到个人AI模型部署的完整能力链,通过“理论—工具—实践”三重赋能,推动语料库研究者从工具使用者向技术驱动者转型,为AI时代的语言学创新研究奠定了方法论基础。参会人员热情高涨,收获满满,为此次大会的成功举办拉开了序幕。



15日上午,会议正式开幕,西安交通大学党委副书记孙早,英国社会科学院士、国际著名语料库语言学专家、英国兰卡斯特大学杰出教授Tony McEnery出席开幕式并致辞。
在大会主旨发言环节,Tony McEnery教授介绍了人工智能与生成式人工智能在应用语言学中的最新应用;Vaclav Brezina教授探讨了人工智能的兴起对传统人类语言发起的挑战,揭示了AI技术与传统语料库研究方法深度融合的潜力与边界;北京航空航天大学梁茂成教授提出借助大语言模型(LLMs)构建自动化系统KWICWise,通过BERT模型的语境嵌入、聚类等技术实现索引行的高效分类,提升研究的可重复性与扩展性,体现了大语言模型对语料库语言学研究的变革价值;西安外国语大学黄立波教授用机器学习方法定量分析了《四世同堂》原文与5个回译本的风格趋同度,为文学翻译风格、回译及计算文体学提供了新视角与方法论参考。
上海外国语大学胡开宝教授对比了铁凝小说《大浴女》与《笨花》的创作风格,展示了语料库在宏观把握作家风格上的成熟应用,其多维特征体系可为训练AI进行文学风格分析与创作提供数据标注范式;德国埃尔朗根—纽伦堡大学Michaela Mahlberg教授指出,在新的AI时代,语料库语言学需要从“数字化发展”转向“人工智能时代的语料库语言学”,呼吁构建宏观理论以保持学科相关性,避免在技术浪潮中被边缘化;英国兰卡斯特大学Paul Baker教授介绍了三项AI与语料库语言学融合研究项目:优化慈善机构AI聊天机器人、分析ChatGPT完成语料库任务的能力、借助AI图像标注做多模态语料分析,探索了从优化应用、批判评估到多模态分析等融合研究的可行路径;西安交通大学桑仲刚教授分享了通过统计译文被引频次、分析译本中人称代词规律等语料库辅助分析“敦煌写本英译的可接受性与翻译决策”的探索,为评估与优化AI在文化遗产翻译中的表现设立了人文标准。
本次会议的主旨报告从伦理哲学、方法辩证与技术实践三个维度,共同构建了AI时代语料库语言学的“批判性融合”范式,展现了语料库研究从文学文本分析到文化遗产翻译的跨学科张力,在深化方法论自觉的同时,更触及AI时代语言学的本质命题:如何通过语料库智慧为人工智能注入人文洞察,彰显了语言学在数字人文领域的核心价值与话语权。







15日下午,会议分论坛在西安交通大学兴庆校区外文楼举行。本次会议共设12场分论坛,参会代表分别就语料库与AI、语料库与语言数据、语料库与语言研究、语言数据与媒体、语言数据与语言教学等跨学科领域的研究与应用展开广泛交流和深入探讨。
本次会议16日上午闭幕,闭幕式由外国语学院副院长程冰主持,她向远道而来拨冗参会的所有嘉宾、向本次会议的所有协办方、所有工作人员以及志愿者们致以诚挚的谢意,并通过视频短片简要回顾了参会代表们与会期间互动交流的精彩瞬间。

16日上午闭幕式
本次会议是西安交大外国语学院继2023年成功举行首届会议后,又一次举办语料库跨学科研究的学术盛会,前沿思想激烈交锋,学术观点碰撞融合,充分展现了智能时代语料库研究领域的前沿视野与跨学科活力。会议为国内外学界搭建了高水平的学术对话平台,对促进学界在智能时代的国际交流、推动学科交叉融合、助力新文科建设向智能化升级具有十分重要的意义。
