中国海洋大学学报社会科学版  2026  Issue (2): 153-162  DOI: 10.16497/j.cnki.1672-335X.202602011

引用本文  

方小兵. 数智时代的语言安全[J]. 中国海洋大学学报(社会科学版), 2026, (2): 153-162.
Fang Xiaobing. Language Security in the Digital-Intelligent Era[J]. Journal of Ocean University of China (Social Sciences), 2026, (2): 153-162.

基金项目

国家社会科学基金重点项目“联合国语言政策的历史演进与当代实践研究”(23AYY015);国家语委重大项目“新文科背景下的语言学学科建设研究”(ZDA145-7)

作者简介

方小兵(1968-),男,江苏南京人,南京大学文学院教授,中国语言战略研究中心研究员,主要从事语言战略、术语政策研究

文章历史

收稿日期:2025-09-12
数智时代的语言安全
方小兵1,2     
1. 南京大学 文学院,江苏 南京 210023;
2. 南京大学 中国语言战略研究中心,江苏 南京 210023
摘要:语言安全是语言及其使用者免受社会、文化与技术等多重风险侵害的状态与过程。随着人工智能与生成式语言模型广泛嵌入人类生活,语言的生成与传播机制发生深刻转型。为回应如何在数智技术背景下重新界定语言安全内涵并识别其风险,本研究提出,语言安全已演变为一个涵盖“内生安全”(语言本体与数据)、“关系安全”(社会信任与舆论生态)和“功能安全”(技术应用与系统可靠)的三维复合体。该框架为我们系统地识别数据污染、算法偏见、舆论操纵等新型风险提供了分析图谱。研究发现,语言安全呈现出区别于传统安全的新特征与新矛盾。其新特征不仅体现在泛在性与技术强关联性上,而且体现为风险主体的“去中心化”与传导的“跨域化”;其新矛盾则突出表现为技术创新的“开放性”与语言资源的“防护性”、全球算法的“同质化”与语言文化“多样性”之间的深刻张力。构建兼顾发展与安全的治理理念并探索实践路径,应树立“安全与发展并重”的敏捷治理理念。其路径在于:在内生层面,夯实高质量国家语言数据战略资源;在关系层面,提升全民数字素养与平台治理能力;在功能层面,建立人工智能伦理规范与关键语言技术的自主创新体系。语言安全已不再是边缘化的学术议题,而是关乎国家治理能力和全球数字秩序塑造的战略核心。
关键词数智时代    语言安全    数字主权    数字文明    技术向善    
Language Security in the Digital-Intelligent Era
Fang Xiaobing1,2     
1. School of Liberal Arts, Nanjing University, Nanjing 210023, China;
2. China Center for Linguistic and Strategic Studies, Nanjing 210023, China
Abstract: Language security is a key challenge in the digital-intelligent era, reflecting both technological risks and global governance dilemmas. The rise of AI, big data, and generative models reshapes language mechanisms, producing new security traits—ubiquity, technological entanglement, and risk complexity. Threats such as disinformation, algorithmic bias, and data breaches undermine digital sovereignty, social trust, and global order. This paper traces the evolution of language security and proposes a three-dimensional framework—endogenous, relational, and functional—to examine its cultural, social, and institutional dimensions. Based on digital-intelligent scenarios, it outlines new security characteristics and advances a four-pronged governance strategy: technology for good, resource optimization, precision governance, and discourse defense. Language security is thus a strategic imperative for national governance and digital civilization, offering both theoretical foundations and practical guidance for sustainable development.
Key words: digital-intelligent era    language security    digital sovereignty    digital civilization    technology for good    
一、引言

语言作为人类文明的基因和认知世界的符号载体,其演变始终与技术革新相互作用。从甲骨文的出现到活字印刷,从无线通信到社交媒体,每一次技术跃迁都深刻重塑了语言形态与功能。这些变革不仅催生了新的语言表达方式与传播范式,更推动人类思维模式与社会组织形态发生深刻转型。进入数智时代,人工智能与大数据深度融合,使语言超越传统交流的边界,演变为算法驱动的核心生产要素。语言已然成为数智时代技术创新与社会变革的枢纽,在潜移默化中重新定义着社会认知边界、文化传播路径与国家安全版图。

然而,技术的双刃剑效应在语言领域日益突出。生成式人工智能催生的深度伪造内容正在动摇信息真实性的根基;算法推荐固化语言偏见,加剧群体间的认知隔阂;跨国科技巨头对语言数据的垄断威胁国家数字主权;濒危语言在数字化浪潮中的失语,为人类语言多样性敲响警钟。这些风险相互交织,形成了超越传统语言学范畴的复杂安全图景,将语言安全问题推向国家战略与全球治理的前沿。语言安全不仅关乎个体的表达自由、社会的信任生态,更成为数智时代国家主权维护、文明传承创新与全球秩序构建的关键命题。

基于此,本研究围绕以下三个核心问题展开:第一,在数智技术深度渗透的背景下,如何重新界定语言安全的内涵,并准确识别其多维风险图谱;第二,在人工智能与大数据重塑的语言生态中,语言安全呈现出哪些区别于传统安全的新特征与新矛盾;第三,在保障语言安全与推动技术创新的双重目标下,如何构建兼顾发展与安全的治理理念,并探索切实可行的实践路径。

为回应上述问题,本研究提出“内生安全—关系安全—功能安全”的三维度分析框架:内生安全关注语言系统的稳定性与文化延续;关系安全强调语言主体间的权力互动与价值冲突;功能安全聚焦语言在社会运行与治理中的效能。通过该框架,可以系统剖析数智时代语言安全的内在结构,并归纳其风险演化的新趋势与规律。在此基础上,本研究进一步提出“技术向善—资源规划—精准治理—话语防御”的综合治理体系,旨在深化对语言安全本质的理论认识,并为政策制定、国际合作和技术治理提供可操作的参考路径,从而在学术研究与现实需求之间搭建起有力的桥梁。

二、语言安全的内涵、维度与价值 (一) 语言安全的概念演进

语言安全(language security)概念源于20世纪末学界对语言濒危和冲突的生态性关切, [1][2][3]强调语言多样性的存续价值。“9·11事件”是其转向的标志,美国将外语能力上升为国家安全战略,其“关键语言”项目深刻影响了国际学界。[4]国内研究随之深化,从语言秩序、国家能力、边境安全等维度拓展了语言安全的研究范畴。[5][6][7][8]此外,众多学者积极尝试将语言安全研究纳入“总体国家安全观”框架,[9][10][11][12]为语言安全领域的理论体系构建与政策制定提供了坚实的学理支撑,推动语言安全从单一学科走向跨学科融合,研究范围从语言本体扩展到语言与国家安全的广泛领域。

进入数智时代,语言的功能与角色发生根本转变:它既是信息载体,也是算法处理的核心对象;既是个体表达的方式,也是国家治理的战略资源。与此同时,语言安全面临的风险来源更加多元且复杂。一方面,人类在语言使用过程中的不当行为,如虚假信息传播、恶意语言操控等,可能误导公众认知、煽动社会情绪;另一方面,算法偏差、数据垄断等技术问题,会导致语言信息的错误解读、不公平分配,造成结构性风险。多重风险按危害程度分为核心风险(如国家机密泄露、大规模虚假信息)、一般风险(如网络语言使用混乱)、潜在风险(如低资源语言数字化滞后)。

传统语境下的语言安全与数智时代的语言安全存在诸多差异。前者更多关注语言的存续、民族身份与社会冲突(如语言消亡、语言冲突导致的社会动荡等),其风险主体与干预手段主要集中于语言规划、教育保护和法律保障层面。数智时代的语言安全在此基础上发生了质的扩展:语言不仅是文化与身份的载体,亦成为算法处理的“数据燃料”,被用于生成、推荐与自动化决策,从而引入了技术性风险(如算法偏见、生成式伪造、多语境误信息跨语传播)、数据主权风险(语料权属与外部技术依赖)以及生态性风险(低资源语言在数字生态中被边缘化)。因此,应把数智时代的语言安全定义为:在数字化与智能化环境中,语言及其使用者免受由信息技术、数据治理与社会政治交互所产生的系统性风险侵害的状态与过程。

为此,本研究将语言安全界定为:语言及其使用者免受社会、文化与技术等多重风险侵害的状态与过程。这一定义凸显了以下三个关键特征:其一,安全主体具有多层次性,不仅涵盖语言系统本身,还包括使用语言的个人、群体以及国家,不同主体在语言安全中面临的风险与需求各不相同;其二,风险来源呈现复合性,技术缺陷、社会操控与文化冲击相互交织,形成复杂的风险网络;其三,语言安全是一个动态的过程,而非静态的结果,需要持续的治理与维护,通过不断调整策略、完善机制,应对新出现的语言安全挑战。

(二) 语言安全的三个维度

在重新界定概念的基础上,深入理解语言安全需要兼顾文化、社会与制度功能。为此,本研究提出“内生安全—关系安全—功能安全”三维框架,旨在全面揭示语言安全的多层次结构体系。这三个维度并非彼此孤立、相互割裂的存在,而是相互作用、层层嵌套的有机整体,共同构成语言安全的复杂系统。

内生安全关注语言的存续能力与文化承载功能,是语言安全的基础。在数智时代,网络语体与人工智能生成文本的盛行不断冲击传统规范,降低语言的表意精准度与文化深度;同时,大量低资源语言陷入“数字失语”困境,难以进入智能应用生态,生存空间被进一步压缩。

关系安全强调语言在社会信任与跨文化交流中的作用。然而,在算法驱动的社交平台中,极端化与情绪化内容被推送,信息茧房效应的日益加剧,虚假叙事和仇恨言论易于扩散。例如,在缅甸罗兴亚危机中,社交媒体算法放大了仇恨言论,最终导致族群冲突。联合国人权理事会(UNHRC)的调查明确指出,Facebook等社交媒体在缅甸冲突中扮演了“决定性角色”,加速了矛盾从线上向线下的转化。[13]

功能安全聚焦语言在治理与社会运行中的可靠性。语言的精准表述直接影响外交、经济和公共安全。例如,在新冠疫情中,一些国家未能及时发布多语防疫信息,导致外籍群体难以及时获取关键信息,公共安全因此受损。

本研究提出的“内生安全—关系安全—功能安全”三个维度存在以下逻辑关系:内生是语言自身,关系是语言之间,功能是语言之外(即语言应用)。这个三维框架既承接语言保护与社会语言学的传统论述,又回应数智时代新出现的“技术—数据—治理”问题:内生安全强调语言系统本体的数字化生存能力;关系安全聚焦语言在社会信任与权力分配中的中介角色;功能安全关注语言在公共治理与应急管理中的实际效能。三维呈嵌套与反馈关系:内生为基,关系为中介,功能为外延。三者互为因果并可通过观测指标量化检验(表 1)。

表 1 语言安全三个维度之间的关系

“内生安全—关系安全—功能安全”三者相互作用,共同构成语言安全的动态网络。以云南省濒危语言记录与研究创新团队打造的“石榴籽”AI智能体为例,该项目依托DeepSeek大语言模型,以国家标准哈尼文为基准,既实现汉语与哈尼语双向互译、文本创作功能,又覆盖日常交流、政务咨询、应急语言服务等多场景应用,同时构建包含哈尼语、彝语、拉祜语等多民族语言的语料库,不仅保护了哈尼语等濒危语言(内生安全),也赋能跨境贸易(功能安全),并促进民族地区交流(关系安全),展现了技术与语言安全融合的实践价值。

(三) 语言安全的时代价值

内生安全奠定基础,关系安全维系社会纽带,功能安全保障治理效能:三者共同构成语言安全的支撑结构。这一结构决定了语言安全在数智时代不仅关乎语言存续,而且深刻影响国家数字主权与全球数字文明秩序。

在国家层面,语言安全是数字主权的重要支撑。掌握语料采集、处理和应用的自主权,等同于在数字空间掌握了制度性话语权,直接关系到国家在国际数字治理体系中的地位。以爱沙尼亚为例,该国率先构建“国家语言云”平台,通过整合全国范围内的语言数据资源,建立起涵盖官方语言、少数民族语言及方言的数字化语料库。据爱沙尼亚司法与数字事务部报告显示,该平台不仅保障了语言数字存续,也提升了该国在电子政务、数字教育等领域的语言自主性和竞争力。[14]

从全球视角看,语言安全是构建公平、包容数字文明秩序的关键。若虚假信息、算法偏见与语言多样性锐减得不到遏制,数字空间将被少数语言和文化主导。相反,营造可信、多元的语言生态有助于弥合文化差异,促进跨文化理解与协作。联合国教科文组织推出的媒介与信息素养教育框架,将语言安全纳入全球数字文明建设议程,旨在通过提升公众的语言信息辨别能力,抵制虚假信息传播,保护语言多样性。[15]该框架已在全球120多个国家推广实施,有效促进了不同文化间的平等对话与协作。

总之,提出“内生安全—关系安全—功能安全”分析框架,是因为传统单维视角已无法应对算法、大模型等新型技术行动者带来的复杂风险。该框架是对多学科理论在数智新语境下的整合与发展。语言生态学为其“关系”维度提供核心视角,强调语言在数字环境中的权力博弈与社群互动;系统论与复杂性理论揭示了三维度间的非线性互动与传导效应,是其整体性思维的基石;安全化理论解释了语言议题向安全议题转化的动因与过程;而行动者网络理论则突破人类中心主义,将算法、平台等“非人”要素纳入分析网络,深刻契合数智时代语言与技术深度交缠的本质特征。三者从“本体—生态—应用”逐层递进,构成一个完整、立体的分析体系。

从操作层面看,该框架通过三步分析法将抽象风险转化为具体对策。第一步为风险定位,针对语言安全事件,用三维框架分析其冲击的维度,是功能安全、关系安全还是内生安全,以精准识别问题核心。第二步是跨维传导分析,探究风险在三维度间的传导放大路径,如内生安全问题如何演变为功能安全问题,再外溢为关系安全问题,明晰风险链条与症结。第三步为整合性对策与系统治理,基于前两步制定三维协同的治理策略,形成治理闭环。

三、数智时代语言安全的新特点

“内生安全—关系安全—功能安全”分析框架揭示了语言安全的基本结构,但在数智时代,这一结构呈现出新的特征。人工智能、大数据和云计算的渗透打破了传统边界,使语言安全风险更广泛、更复杂地嵌入日常生活和全球治理。当前,语言安全主要表现为泛在性、技术强关联性和风险复合性三大特征。这些特征相互交织,共同构成新的风险生态。

(一) 泛在性:从高风险场景到全场景渗透

过去,语言安全风险多集中在外交谈判、法律文书等高风险场景。在数智时代,语言技术深度嵌入数字化服务,使风险扩展到社会生活的方方面面。在家庭场景中,语音助手时刻监听用户指令,一旦语音识别系统存在漏洞,用户隐私信息便面临泄露风险;在教育场景中,AI助教生成的学习资料若未经严格审查,带有偏见或虚假信息的内容将快速扩散至青少年群体,影响其认知发展;在商业场景里,电商平台多语言信息的翻译误差可能导致消费者误解产品说明,引发交易纠纷;在公共安全领域,城市应急预警系统的语言表述若不准确,可能延误救援时机。

更为严峻的是,语言已从“生活世界”延伸到“认知空间”。例如,俄乌冲突爆发后,大量经过精心编造的多语言虚假新闻通过社交媒体平台快速传播。这些信息利用语言技巧操控公众认知,煽动对立情绪,使语言成为思想操控和舆论引导的危险武器。有学者通过对200多万条涉及95种语言的事实核查条目研究发现,32%的重复谣言跨越语言边界传播。[16]这种全方位、无死角的渗透态势,迫使语言安全治理必须从局部防护转向全场景覆盖,构建多层次、立体化的防护体系。

(二) 技术强关联性:“攻防同源”下的治理挑战

数智时代,语言安全与技术发展呈现出前所未有的紧密关联。

一方面,技术成为语言安全风险的放大器。生成式人工智能能够以极低的成本批量生产高度逼真的虚假新闻、伪造文书,普通用户难以辨别真伪;推荐算法基于用户偏好推送信息,不断强化信息茧房效应,加剧社会群体间的认知隔阂与对立情绪。以美国2020年总统选举为例,当时社交媒体平台上大量经过AI生成的虚假竞选信息,通过算法精准推送给目标用户,严重干扰了选举的公正性与透明度。

另一方面,技术为语言安全治理提供了有力工具。自然语言处理技术可应用于自动化事实核查,快速识别文本中的虚假信息;基于AI的监测模型能够实时分析舆论场的情绪波动与传播趋势,及时预警潜在风险;区块链技术则可为跨境语料共享提供可信的溯源机制,确保语言数据的真实性与安全性。然而,语言安全领域“攻防同源”的特性,使治理工作面临巨大挑战。治理者与风险制造者使用相同的技术资源,单纯依赖技术手段遏制风险远远不够,所以必须在制度设计与伦理规范层面提前布局,将“技术向善”的理念深度融入技术研发、应用的全流程,才能实现技术从风险助推器向治理赋能器的转变。

(三) 风险复合性:跨维度传导与系统危机

数智时代的语言安全风险不再孤立存在,而是呈现出显著的复合性特征。内生安全、关系安全与功能安全三个维度的风险相互关联、叠加、传导,形成复杂的风险网络。一个看似微小的翻译失误,可能从功能安全问题升级为国际间的关系安全危机;某种语言因缺乏数字化资源而产生的“数字失语”,不仅威胁内生安全,还可能加剧不同语言群体间的社会隔阂;社交媒体上的仇恨言论经过发酵,甚至可能引发现实中的暴力事件,危及社会稳定与国家安全。

以印度为例,自2017年起,WhatsApp平台上大量传播的关于儿童被绑架、器官贩卖等虚假信息,结合当地低识字率、民众易恐慌等社会因素,多次引发地区性群体恐慌和私刑事件。[17]这一事件充分展现了语言安全风险的复合性:平台的功能安全缺陷,经技术放大,迅速演变为破坏社会信任的关系安全危机,最终导致治理功能恶化。

这些分析回应了本研究的第二个核心问题:数智时代的语言安全呈现出风险主体“去中心化”、传导“跨域化”与后果“隐蔽化”等新特征,其核心矛盾则突出表现为技术创新的“开放性”与语言资源“防护性”、全球算法的“同质化”与语言文化“多样性”之间的深刻张力。

综上,数智时代的语言安全已演变为覆盖生活、认知和治理的复杂系统。面对这种复杂态势,传统的单点治理已难奏效,迫切需要跨部门、跨领域、跨学科的系统性协同治理机制。泛在性要求全场景覆盖,技术强关联性呼唤前瞻治理与伦理约束,风险复合性则需要系统化协同治理。这些新特点凸显了语言安全的战略价值,也为构建科学有效的治理体系提供了现实依据。

四、数智时代语言安全保障体系

面对语言安全的泛在性、技术强关联性与风险复合性,单一化、碎片化的治理手段已难奏效。治理必须从被动的事后补救转向系统、前瞻的综合路径。为此,本研究提出“技术向善—资源规划—精准治理—话语防御”四维保障体系,从风险源头防控到舆论空间建构,形成覆盖语言安全全链条的治理闭环。

(一) 技术向善:筑牢语言安全的源头防线

数智时代的语言安全攻防深度绑定于技术体系,无论是风险生成还是安全防护,都依赖于语言技术的底层逻辑。因此,将伦理价值嵌入技术研发与应用全流程,实现技术向善,是语言安全保障的首要环节与源头根基。

技术向善既要倡导研发端伦理,也要重视应用端伦理。前者重心是大型语言模型的算法去偏与多元语料构建,后者表现为低资源语言的技术普惠和公益推广。

在研发端,语言技术的风险隐患往往源于设计初期的价值偏差。以大型语言模型(LLM)为例,若训练语料过度依赖某一文化圈层、语言体系的文本,模型输出内容则极易携带文化偏见与语言歧视,如对少数族裔语言的边缘化呈现、对特定文化习俗的误读等。对此,需建立“技术伦理前置审查”机制:一方面,通过引入多语种、跨文化的多元化语料库,平衡不同语言群体、文化背景的文本占比,从数据源头减少偏见积累;另一方面,开发并应用“去偏算法”,对训练数据中的歧视性表述、刻板印象进行识别与修正,同时建立跨学科的价值审查委员会(涵盖语言学、伦理学、社会学专家),对模型输出内容进行合规性与公平性校验。

在应用端,低资源语言与弱势群体的数字化失语问题,难以单纯依靠市场逻辑解决,原因是用户基数小、商业价值有限,市场主体缺乏投入动力,导致这些群体在智能翻译、语音交互等语言技术应用中持续处于“技术洼地”。这就需要政策层面的主动干预:一方面,政府可设立“低资源语言技术专项基金”,扶持高校、科研机构开展针对性研发,如为少数民族语言、濒危语言开发轻量化语音识别模型、低成本机器翻译工具;另一方面,推动“公益技术联盟”建设,引导科技企业开放核心技术接口、共享基础算法框架,降低低资源语言技术研发的门槛,通过政策引导与公益协作弥补技术普惠的结构性缺口。唯有将技术向善理念深度融入技术底层,后续的资源配置与制度治理才能建立在可靠的价值基础之上。

(二) 资源规划:夯实语言安全的基础支撑

语言安全的长效保障,离不开坚实的资源体系支撑。这里的“资源”既包括作为语言技术核心“燃料”的语料数据,也涵盖保障技术自主可控的关键技术,还包括衔接技术与治理的复合型人才,三者共同构成语言安全的“基础设施”,是实现安全保障的物质与能力根基。

在语料层面,语言数据已成为国家数字主权的重要组成部分,其采集、管理与应用直接关系到语言安全的战略主动权。亟须建立“国家语言资源统筹管理体系”:一是明确语言数据的战略属性,将重要领域(如国防、外交、公共卫生)的多语种语料、濒危语言数字化文本纳入国家战略资源库,通过立法规范语料采集的范围、权限与存储标准,防止核心语言数据泄露或被境外势力掌控;二是建立“语料权属清晰化”机制,明确不同主体(政府、企业、科研机构、个人)在语言数据采集、使用中的权利与义务,避免因数据权属模糊引发的滥用、盗用问题,同时探索“语料共享共建”模式,在保障数据安全的前提下,推动政府部门、科研机构间的语料开放共享,提升资源利用效率。

在关键技术层面,核心语言技术的自主可控是抵御外部技术风险、维护语言安全的关键。当前,部分国家在多语种处理、低资源语言建模等领域仍掌握技术垄断优势,若过度依赖外部技术,可能面临“技术卡脖子”风险。对此,需加大核心技术自主研发投入:一是聚焦多语种大语言模型、智能语音安全识别、跨语言虚假信息检测等关键技术领域,设立国家级研发专项,突破算法壁垒与技术瓶颈;二是借鉴欧盟“多语种开源大语言模型BLOOM”的实践经验——该模型由BigScience Workshop联合全球科研机构开发,支持46种人类语言与13种编程语言的深度处理,强化了欧盟多语言技术自主权;[18]三是支持那些在自然语言处理领域中缺乏大量标注数据、语言资源和相关处理工具的低资源语言,可以利用社区贡献等方式获取基础数据,同时运用数据增强技术扩展训练集规模,或者将高资源语言的语义知识迁移到低资源语言任务中,以增强数据的多样性和丰富性。[19]

在人才培养层面,语言安全治理需要兼具语言、技术、治理与法律素养的复合型人才。传统单一学科培养模式难以满足需求,需要构建“跨学科人才培养体系”:一是在高校开设“语言安全与智能治理”交叉学科方向,课程设置涵盖语言学(语言多样性保护、话语分析)、人工智能(自然语言处理、算法原理)、传播学(虚假信息传播机制)、法学(数据安全法、语言权益保护)等领域;二是建立“政企研学”协同培养机制,鼓励高校与科技企业、政府治理部门合作设立实践基地,让学生参与真实语言安全治理项目(如虚假信息检测、多语种应急信息处理),培养解决实际问题的综合能力,为语言安全治理提供可持续的人才支撑。

(三) 精准治理:增强语言安全的过程效能

数智环境下的语言风险呈现高度差异化特征,其既有危害国家安全、公共安全的极端话语(如煽动暴力、恐怖主义宣传),也有兼具创造性与娱乐性的语言创新(如网络流行语、社群专属用语);既有明确违法的虚假信息,也有边界模糊的主观误导性表述。若采取“一刀切”的治理模式,易陷入治理失度的双重困境:要么因治理不足导致风险蔓延,要么因过度治理抑制语言活力、增加社会成本。因此,“精准治理”是平衡安全与活力、提升治理效能的核心环节。

所以,我们的首要任务是建立“语言风险分类分级体系”。核心风险需要通过法律、行政与平台审核形成刚性治理;低风险场景则应采取柔性治理,以引导、教育和社群自治替代过度干预,避免因过度干预导致“寒蝉效应”,保障语言生态的多样性与活力。可运用大语言模型校验多语信息,通过事实核查识别风险等级。[20]例如,欧盟《通用数据保护条例》(GDPR)要求以24种官方语言提供“清晰易懂”的隐私政策,但因忽视了语言成本与各国对“清晰”的理解差异,不仅给中小企业带来巨大合规负担,而且催生了对外部标准化软件的依赖,削弱了欧盟自身的技术自主性,与其保护数据安全的初衷相悖。[21]

近年来东南亚跨境电信诈骗等复杂问题,凸显了精准治理的必要性。犯罪团伙利用多语团队和翻译工具,针对不同文化群体“定制”诈骗话术,使语言成为犯罪的核心工具,并引发社会信任侵蚀与治理失灵。此类风险具有跨语言、跨国界的特征,单一语种监控和传统司法协作难以应对。因此,精准治理必须整合技术、制度与社会动员力量,通过建立多语种诈骗话术数据库、推动区域情报共享等方式,实现精细化、跨国界的协同打击。

语言安全在此案例中凸显出以下挑战:诈骗信息往往呈现跨语混合特征,单一语种的监控系统难以精准捕捉;在跨境环境下,不同语言证据的解读标准与法律效力亟待统一,相关规范的缺失直接削弱司法追责的有效性与执行力。精准治理的提出,正是针对这类复杂跨境问题:通过多语种监测、跨部门协作、跨国合作和社区参与等措施,在有限资源下实现定点突破和精细化应对。精准治理并非单纯依赖技术,而是技术、制度与社会动员的有机结合。过度依赖外部平台可能带来治理脆弱性,必须提升自主的语言监测与治理能力。在实践层面,应该建立多语种诈骗话术数据库,并通过机器学习模型进行跨语识别与比对,从而在社交媒体和电信网络中提前发现可疑模式。同时,推动区域国家间的情报交换与诈骗话术样本资源共享,以便快速锁定诈骗团伙的语言特征,缩短办案周期。[22]

(四) 话语防御:从风险管控到构建语言安全韧性

在数智时代,语言安全的保障正经历一场深刻的范式转型:从被动应对信息风险的“管控模式”,转向主动构建社会整体免疫力的“韧性模式”。这一转型的核心,便是“话语防御”体系的构建。它并非追求一个无菌的、杜绝所有负面信息的真空环境,而是致力于塑造一个健康、可信、包容的数字舆论生态,增强其在面对恶意信息冲击时的自我修复与适应能力。这种防御的最高境界,不是拥有最快的辟谣机器,而是建立一个对谎言和操纵具有天然免疫力的社会。

传统的话语安全治理常陷入“删帖—辟谣”的被动循环,这种方式虽能解一时之困,却可能因“信息真空”助长阴谋论的蔓延,为谣言的二次传播创造条件。瑞典的国家安全战略为此提供了“由内而外、预防为主”的战略范本,其“总体防御”理念认为,未来的冲突将是对整个社会肌体的攻击,民众的信任和意志是关键防线。因此,话语防御的重心必须从逐条驳斥虚假信息,转向主动强化社会心理的韧性。[23]这一主动免疫体系的构建,依赖于三大支柱的协同作用。

一是以“积极话语供给”构建信任锚点。社会韧性的首要前提是民众与权威信息源之间稳固的信任关系。当民众习惯于从权威渠道获取可靠信息时,虚假信息的生存空间自然会被压缩。这正是瑞典将政府信息公开透明视为对抗阴谋论最有力武器的原因。同样,北京冬奥会的成功多语种传播实践也印证了这一点。通过主动设置“冰雪科普”“运动员故事讲述”等,北京冬奥会以10余种语言向世界展现了一个包容且具有科技感的中国形象。这不仅有效对冲了外部的片面解读,更在全球舆论场中建立起强大的“可信信息锚点”,从源头上挤压了虚假信息的传播空间。[24]

二是以“反叙事对冲”实现风险软着陆。在一个开放的舆论场中,有害信息的出现难以避免。此时,单纯的封禁并非最优解。欧盟在反恐舆论治理中采用的“反叙事”策略,提供了一种更为精妙的应对方式。他们并非简单删除极端主义宣传内容,而是联合智库与媒体,制作基于真实案例的“反叙事内容”。例如,通过恐怖袭击受害者的亲身经历揭露极端思想的危害,或以多元文化共存的成功案例消解其排他性叙事。[25]这种“以叙事对抗叙事”的方法,避免了因粗暴封禁可能引发的舆论反弹,实现了风险治理的“软着陆”,是维护舆论生态平衡的必要战术。

话语防御的最终防线,是每一位信息时代的公民。瑞典政府向全国家庭发放《如果危机或战争来临》手册,阐述如何识别虚假信息。这本身是一次成功的国家级叙事建构与公民赋能。同时,瑞典公民应急署与心理防御局协同合作,不仅在危机时刻确保政府以“一个声音”对外发布权威信息,而且长期通过图书馆、学校等公共机构,为记者、公务员,乃至普通民众(特别是青少年和老年群体)提供系统性的媒介素养培训,从而加固了民主流程的每一个关键环节。[23]

总之,话语防御作为语言安全保障的新范式,超越了传统的“堵”“删”管控逻辑,转向“建”“替”“育”三位一体的韧性构建:以积极话语“建”立可信叙事,以反叙事“替”代有害话语,以媒介素养“育”成社会免疫。换言之,在数智时代的语言安全领域,最好的防御并非构建密不透风的防火墙,而是提高每一位公民的认知。唯有当社会整体具备对虚假与操纵的辨识力、抵抗力与修复力,语言生态才能在复杂信息环境中保持健康与稳定——这既是话语防御的终极目标,也是数字时代国家软实力的核心体现。

本研究提出的“技术向善—资源规划—精准治理—话语防御”四维保障体系,其根本依据在于它精准回应了“内生安全—关系安全—功能安全”三维风险分析框架所揭示的挑战,构成了一个“诊断—应对”的逻辑闭环。

具体而言,技术向善是应对功能安全风险的“伦理罗盘”,它要求将公平、透明的价值观嵌入技术研发全链条,为算法和AI应用设定“道德导航”,防范技术滥用。资源规划是应对内生安全风险的物质基础,高质量语言数据是驱动AI发展的“战略石油”,对其进行顶层规划,旨在从源头夯实语言活力根基。精准治理是应对功能与关系双重安全风险的制度基石,它通过敏捷、差异化的立法与政策,为技术应用划定法律红线,为健康的社会互动提供规则保障。话语防御是应对关系安全风险的认知屏障,旨在通过提升数字素养和主动建构正面叙事,抵御信息战与意识形态渗透,维护社会信任与国家认同。这四个维度相互支撑,形成语言安全全链条闭环(图 1):技术向善是源头,资源规划是基础,精准治理是过程,话语防御是目标。它们共同构建立体化的保障体系,平衡技术创新与语言安全。

图 1 语言安全全链条治理闭环
五、结语

在数智时代,社会运行逻辑正经历深刻重塑,语言安全也相应地由边缘议题转变为关乎国家治理与全球秩序的核心议题。语言安全影响深远,关乎文化传承、社会信任、治理效能与数字文明建设。特别是人工智能与大数据的广泛应用,使语言安全风险突破了传统边界,呈现出泛在性、技术强关联性与风险复合性等新特征,对全球治理提出了系统性挑战。

传统碎片化、被动式的治理模式已无法应对当前复杂的局面,所以语言安全的治理亟须向系统化与前瞻性转型。展望未来,该领域的研究深化可循两条路径:其一,强化科际整合,融合社会语言学、信息科学、国际关系与公共政策学,以形成更具解释力的理论范式;其二,深化实证研究,通过跨国制度与语言实践的比较分析,为全球治理提供有效经验。在此基础上,一个核心且紧迫的议题是:如何在最大化人工智能效益的同时,根本性地解决算法歧视与数字不平等问题。此问题已然成为关乎全球福祉的共同课题。

参考文献
[1]
Crystal D. Language death[M]. Cambridge: Cambridge University Press, 2002. (0)
[2]
Fishman J A. Reversing language shift: theoretical and empirical foundations of assistance to threatened languages[M]. Cleveton: Multilingual Matters, 1991. (0)
[3]
Nelde P H. Language Conflict[A]. Coulmas F(Ed.). The handbook of sociolinguistics[C]. Oxford: Blackwell, 1997.285-300. (0)
[4]
方小兵. 语言安全的内涵、特征及评价指标[J]. 辞书研究, 2018, (6): 33-41. (0)
[5]
戴庆厦. 语言关系与国家安全[J]. 云南师范大学学报(哲学社会科学版), 2010, 42(2): 1-6. (0)
[6]
文秋芳, 张天伟. 美国国家外语能力建设模式分析[J]. 外语教学与研究, 2013, 45(6): 854-864. (0)
[7]
张四红. 尼泊尔的语言国情及中国西藏边境地带语言安全构建[J]. 南亚研究, 2020, (3): 39-58. (0)
[8]
彭文钊, 朱辉. 语言安全视域下的国家语言主权和语言治理问题[J]. 外语与外语教学, 2024, (5): 34-45. (0)
[9]
张日培. 国家安全语言规划: 总体国家安全观下的范式建构[J]. 新疆师范大学学报(哲学社会科学版), 2018, 39(6): 33-44. (0)
[10]
方小兵. "总体国家安全观"视域下的语言安全研究[J]. 语言政策与规划研究, 2019, (1): 46-55. (0)
[11]
沈骑. 语言安全与语言规划研究[M]. 上海: 复旦大学出版社, 2022. (0)
[12]
刘佳妮, 王月禾. 总体国家安全观视域下大语言模型的语言安全风险逻辑[J]. 外语与外语教学, 2024, (5): 46-54. (0)
[13]
United Nations Human Rights Council. Report of the independent international fact-finding mission on Myanmar (A/HRC/39/64)[R]. New York: United Nations, 2018. (0)
[14]
Torstenberg B. Meta is interested in using the open data of the Estonian language corpus[EB]. https://www.justdigi.ee/en/news/meta-interested-using-open-data-esto-nian-language-corpus?utm_source=chatgpt.Com, 2025-02-06/2025-09-01. (0)
[15]
UNESCO. Media and information literacy: policy and strategy guidelines[R]. Paris: UNESCO, 2013. (0)
[16]
Quelle D, Cheng C, Bovet A, et al. Lost in translation: using global fact-checks to measure multilingual misinformation prevalence, spread, and evolution[J]. EPJ Data Science, 2025, 14(22): 1-24. (0)
[17]
Arun C. On WhatsApp, rumours, lynchings, and the Indiangovernment[J]. Economic & Political Weekly, 2019, 54(6): 30-32. (0)
[18]
Scao T L, Fan A, Akiki C et al. BLOOM: a 176B-parameter open-access multilingual language model[EB]. https://arxiv.org/abs/2211.05100, 2022-11-09/2025-09-01. (0)
[19]
Pakray P, Gelbukh A, Bandyopadhyay S, et al. Natural language processing applications for low-resource languages[J]. Natural Language Processing, 2025, 31(2): 183-197. DOI:10.1017/nlp.2024.33 (0)
[20]
Singhal A, Law T, Kassner C, et al. Multilingual fact-checking using LLMs[A]. Proceedings of the third workshop on NLP for positive impact[C]. Association for Computational Linguistics, 2024.13-31. (0)
[21]
Hjerppe K, Ruohonen, J, Leppänen V. The general data protection regulation: requirements, architectures, and constraints[C]. 2019 IEEE 27th International Requirements Engineering Conference (RE). IEEE, 2019.265-275. (0)
[22]
Xu M, Zhao Y. Multilingual communication and online fraud: a sociolinguistic perspective on cross-border scamming in Southeast Asia[J]. Journal of Language and Politics, 2021, 20(4): 512-530. (0)
[23]
Sundelius B, Eldeblad J. Societalsecurity and total defense[J]. PRISM, 2023, 10(2): 92-111. (0)
[24]
Cui M. The discursive construction of national image: a case study of people's daily online reports on Beijing Winter Olympics[J]. Frontiers in Educational Research, 2023, 6(13): 37-44. (0)
[25]
Preda A, Chiriac D. Strategic communication process in the European Union[J]. Strategies XXI-Security and Defense Faculty, 2021, 17(1): 128-139. DOI:10.53477/2668-2001-21-15 (0)