
地理空间智能(Geospatial Artificial Intelligence, GeoAI)通过融合地理空间科学与人工智能技术,致力于理解、建模和推理复杂的地理环境与人类活动过程。近来,大语言模型(Large Language Models, LLMs)已成为GeoAI的关键支撑工具。凭借其强大的知识表征能力、便捷的交互方式以及对多样化任务的通用适应性,LLMs正推动一场具有全球影响力且不可逆的智能化转型。以ChatGPT为代表的系统,截至2025年7月已拥有约7亿周活跃用户,其中大量交互发生在非英语语境下。在GeoAI应用中,多语言能力尤为关键,因为城市感知、空间认知与地方知识高度依赖本地语言与文化背景。随着LLMs深度参与空间信息解读、城市分析与人类行为建模,如何在多语言环境中保障其公平性与一致性,已成为亟需系统性探讨的核心议题。

图1. 研究背景及语言不平等性的分析维度
现有关于大模型语言能力不平等的研究多聚焦于LLMs在不同语言下静态知识覆盖的差异,而对不平等性如何体现在模型学习新知识的动态过程中关注不足。随着LLMs持续发展并不断通过外部信息更新自身知识体系,这一问题愈发重要(图 1)。一方面,通用型LLMs基于发布前的静态语料预训练,知识容易随时间过时;另一方面,其在特定专业领域仍普遍存在知识深度不足的问题,亟需通过新知识学习加以弥补。目前,新知识学习主要通过两条路径实现:一是上下文学习,在无需参数更新的情况下从示例、指令或外部检索中获取新信息;二是通过微调,使模型获得面向特定任务的定制化知识。本文旨在系统分析和揭示LLMs在这两条路径下新知识学习过程中的语言能力不平等问题,并提出缓解策略,为多语言环境下的GeoAI应用提供更公平、可靠的基础支撑。
大模型语言能力的不平等性:新知识学习的四个维度
从新知识学习这一动态视角出发,本文将大模型语言能力的不平等性概括为四个相互关联的维度:有效性、可迁移性、优先性和鲁棒性,用以刻画LLMs在新知识引入、跨语言传播、冲突信息取舍、噪声干扰应对等关键过程中,对不同语言所呈现的系统性差异。

图2. 新知识学习的有效性不平等现象
有效性不平等(图 2)指模型在不同语言中学习新知识的效率与最终准确性存在显著差异。在相同学习内容与设置下,LLMs 往往在高资源语言中收敛更快、性能更高,而在低资源语言中学习缓慢、上限受限。这表明新知识并非以语言中立的方式被吸收,低资源语言用户因此在获取最新知识时持续处于不利地位。

图3. 新知识学习的可迁移性不平等现象
可迁移性不平等(图 3)关注模型在某一语言中学到的新知识,能否在其他语言中被同等有效地访问和复用。研究发现,新知识在跨语言调用时呈现出系统性的"向高资源语言汇聚"倾向,而在低资源语言中的可访问性显著受限。这种不对称的知识流动进一步扩大了使用不同语言的群体在知识可见性与实际受益程度上的差距。

图4. 新知识学习的优先性不平等现象
优先性不平等(图 4)体现在知识冲突情境中。当模型同时接触到来自不同语言、但内容相互矛盾且质量相当的新知识时,其输出更倾向于采纳高资源语言版本。这种隐性的语言权威偏置可能削弱低资源语言在知识生产与表达中的合法性,并强化既有的语言资源高低等级结构。

图5. 新知识学习的鲁棒性不平等现象
鲁棒性不平等(图 5)指模型在面对错误或误导性信息时,不同语言环境下的受影响程度存在差异。相比高资源语言,LLMs 在低资源语言中更容易受到错误知识的干扰,输出质量下降更为明显,使相关用户面临更高的信息风险。
潜在成因:大模型语言能力不平等的结构性根源
大模型在新知识学习中的四重语言能力不平等源于语言本身的多重属性与大模型内在机制的共同作用(图 6)。不同语言在地理分布邻近关系、谱系关系、句法结构等方面的差异影响了模型的跨语言泛化能力。预训练阶段,高资源语言在数据规模与工程优化上的优势,使大模型在这些语言上形成更稳定、丰富的表示基础,从而在后续新知识学习中占据系统性优势。分词器设计进一步放大了上述差异。此外,从大模型内部表示来看,语言之间共享的神经元重叠程度与新知识的跨语言迁移能力密切相关,神经元重叠越高,知识越容易在语言之间传播。

图6. 语言能力不平等性潜在成因的分析框架
干预措施:缓解大模型语言能力不平等的潜在路径
缓解大模型在新知识学习中的语言能力不平等,需要从模型设计与知识注入机制两方面入手。在模型构建方面,平衡多语言预训练数据比例、减少对高资源语言的过度依赖,并提升分词器在低资源语言上的压缩效率与对齐质量,是提升公平性的基础路径。在知识注入阶段,应避免默认以高资源语言作为主要知识载体,以降低跨语言迁移和知识冲突中的系统性偏置。从GeoAI视角出发,可将语言的地理邻近性与多渠道传播的空间交互结构作为知识注入的先验约束,引导新知识沿低阻抗的跨语言路径传播,从而在不牺牲整体性能的前提下,缓解低资源语言在新知识学习中的系统性劣势。此外,通过识别并调节不同语言之间共享的神经元,可以在一定程度上影响新知识的跨语言传播方式(图 7)。

图7. 基于语言神经元的不平等性缓解策略
该研究成果以"Uncovering inequalities in new knowledge learning by large language models across different languages"为题,于 2025 年12月19日在线发表在Proceedings of the National Academy of Sciences (PNAS)期刊上。城市规划与设计学院硕士生王成龙为第一作者,宫兆亚为通讯作者,其他共同通讯作者还有城市规划与设计学院赵鹏军、微软亚洲研究院吴方照、普林斯顿大学谢悦琪等。该研究得到深圳市"孔雀团队"项目等资助。宫兆亚为北京大学城市规划与设计学院助理教授、研究员,自然资源部陆表系统与人地关系重点实验室"地理空间智能与大模型工作室"主任。
论文链接(点击阅读原文查看):https://www.pnas.org/doi/10.1073/pnas.2514626122