首页:>> 基金会动态 >>
  • “早期中华文明多模态大模型”发布
  • 日前,在WAIC2025星河启智·科学智能开放合作论坛上,“早期中华文明多模态大模型”发布。这也是全球首个聚焦早期中华文明的多模态大模型。 

    作为全球首个聚焦早期中华文明议题的人工智能模型,该模型由复旦大学、上海科学智能研究院(下称上智院)、上海创智学院联合研发。它涵盖100TB专业语料、SFT数据及评测集,首创文明时空数据跨模态智能对齐,推动“二重证据法”向文本、图像、音频、视频、时空五维互证跃迁。同时,模型架构支撑中华文明AI Agent平台,具备多步骤推理与复杂任务规划能力,跨学科赋能教育、科研与大文化产业。

    传统文化研究方法论上的一次变革

    复旦大学校长助理、上智院理事长、上海创智学院副院长吴力波说,这次的实践是中国传统文化研究方法论上的一次变革。该模型系统覆盖考古学、文物、中国古代史、历史地理学、历史文献学、中国古典文献学、汉语言文字学、中国古代文学、中国少数民族语言文学等学科,整合甲骨金文、方志舆图等珍稀史料,形成超大数据规模的早期中华文明知识体系,奠定多维度研究的数字根基。

    “今天的我们很难理解一些传统文化,但是这又是十分有价值的。我们希望通过人工智能的模型,展现出其背后千丝万缕的关联,让我们更好地去理解和传承优秀中国传统文化。”复旦大学人工智能创新与产业研究院研究员、上智院AI科学家朱思语说。

    据介绍,该模型具备高效检索、精准翻译、智能识读、事实呈现、特征描述、史料信度考据及深层分析推理功能,并通过部署在星河启智科学智能开放平台上以方便易上手的方式服务学者研究需求。

    一场技术理性与人文精神的碰撞

    在身为AI科学家的朱思语看来,“早期中华文明多模态大模型”是一种技术理性与人文精神的碰撞。

    “从2016年开始,复旦大学就在推动人文领域史料的数字化,AI参与到人文社科的研究中,这也是全新的领域,过去是单纯以考古材料和古籍材料去考证,我们希望通过各种学科各种模态的大数据去辅助考证。”朱思语说。

    吴力波说:“中华文明在世界史上是一个十分特别的存在,它是唯一没有断裂过的文明,中华民族还有很强包容性,它不是一种单一的文化。我们希望通过这个大模型来探究中华民族从哪里来,也希望知道它是如何演进的。这对于我们讲好中国故事和传承中华文明具有很强的支撑作用。”

    值得一提的是,该模型构建了一个评测体系,它采用“学科领域×问题难度×研究场景”的三维度分层框架,汇聚超10000个高质量问题,确保评测既系统全面又精准有效,能够真实反映人文研究的多元场景与复杂需求。 

    希望将中华文明的遗珠穿珠成串

    “事实上,中华文明早期的源流目前还有很多疑点,很多甲骨文也没有被识别出来,很多出土文物和古籍并没有在时间和空间尺度上进行更加深入的挖掘和对齐。”吴力波说,希望通过“早期中华文明多模态大模型”,将中华文明的遗珠穿珠成串,形成一个完整的中华文明的故事。

    朱思语介绍了目前正在进行的一些数字化的项目:“首先是通过一些考古报告生成一些成果,原本这些考古报告都有几千多页,里面包括一些器形的形成时间,还有各种标注的信息。比如复旦大学出土文献与古文字研究中心主任刘钊教授汇总了马王堆考古报告,形成了《长沙马王堆汉墓简帛集成》。我们希望以后通过考古报告自动化去生成,专家只要在此基础上进行修改和完善就好,报告撰写效率可以大大提升。”

    朱思语表示,目前已完成黄河流域500余处新石器时代遗址的时空标注,模型通过分析数据,发现了仰韶文化晚期聚落分布与气候变化的相关性规律。希望通过早期中华文明多模态大模型,帮助发现之前没有发现的规律性的成果。


    (来源:上海市科学技术协会网站)