高书生:大语言模型无处不在,无时不在,意识形态管理该关注什么

高书生| 文化数字化头脑风暴| 2026-06-15

【流媒体网】摘要：人工智能时代，文化领域须主动防范，守护文化、意识形态及文化基因数据安全。

　　最该关注的，当然是安全，包括国家文化安全、意识形态安全，也包括文化基因数据安全。

　　安全需要防范，防范有主动防范和被动防范之分，在人工智能时代，当大语言模型无处不在、无时不在时，放在首位的应该是主动防范。

　　如何主动防范？

　　1、“幻觉”治理。当下备受青睐的生成式人工智能，最让人伤透脑筋的就算是“幻觉”。所谓“幻觉”，就是生成了与事实不符或文化背景错位的虚构内容，也就是俗话说的认认真真胡说八道。在历史文化问题上的“幻觉”，这是意识形态管理不能容忍的，也是生成式人工智能落地应用的“一道坎”。怎么治理？OpenAI内部评估显示，约40%的幻觉可追溯至语料问题。很显然，单靠算力和算法，“幻觉”问题不会被根治，语料的来源是数据，治理“幻觉”，数据是一支不可忽视的重要力量。

　　哪个宣传文化机构手里没有数据，治理“幻觉”，必须发动和组织宣传思想文化全战线主动参与。

　　2、价值观认同。2022年，中办、国办印发的《关于推进实施国家文化数字化战略的意见》确定的第一项重点任务，就是关联形成中华文化数据库，要求贯通已建或在建文化专题数据库，聚焦社会主义先进文化、革命文化、中华优秀传统文化，提取具有历史传承价值的中华文化元素、符号和标识，丰富中华民族文化基因的当代表达，增强对伟大祖国、中华民族、中华文化、中国共产党、中国特色社会主义的认同。

　　这是文化数字化的战略意义之所在。令人心碎的是，两办文件印发4年多了，至今还有人说“没想明白”。等想明白了，“幻觉”的缺口怕是堵不上了；当“幻觉”决堤，对意识形态意味着什么，后果不堪设想。

　　3、中华文明赓续。当下大语言模型的训练数据，主要来源于互联网。众所周知，中文数据在互联网数据中的占比不高，通常的说法是占比5%左右，其中中国历史文化数据占比就更低。用这样的大语言模型进行推理，很可能产生与主流意识形态相冲突的结论。当大语言模型无处不在、无时不在，AI跟手机一样，青少年学习、生活、工作都“机不离手”，长此以往，岂不都变成了“香蕉人”，即皮肤是黄的，价值观却是西方化的。

　　主动防范离不开数据，数据恰恰是宣传思想文化战线的“杀手锏”，主动权、主导权都牢牢掌握在意识形态管理部门手中。

　　2022年，中办、国办印发的《关于推进实施国家文化数字化战略的意见》已经做出了部署——统筹利用文化领域已建或在建数字化工程和数据库所形成的成果，全面梳理中华文化资源，推动文化资源科学分类和规范标识，按照统一标准关联零散的文化资源数据，关联思想理论、文化旅游、文物、新闻出版、电影、广播电视、网络文化文艺等不同领域的文化资源数据，关联文字、音频、视频等不同形态的文化资源数据，关联文化数据源和文化实体，形成中华文化数据库。

　　统一标准的标准，就是我国提案创建、国际标准化组织2015年发布的关联标识符国际标准。只要广电网络公司部署一套提供标识编码注册登记和解析服务的技术系统，宣传文化机构部署一套底层关联服务引擎和应用软件，按照物理分布、逻辑关联原则，中华文化数据库就可以关联形成。

　　顶层设计已经完成，“一分部署九分落实”，再犹豫，就会贻误战机，对主流意识形态的冲击将是不可估量的。

责任编辑：赵莹

分享到：