中国第二批获批备案的 11个AI大模型详解

caihua • AI 应用 • 2023年11月9日下午12:41 • 阅读 1663

09

好未来（MathGPT大模型）

8月24日，好未来集团首席技术官田密在20周年直播活动中宣布，该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。

今年5月，好未来曾公布正在进行自研数学大模型的研发，由CTO田密牵头，命名为MathGPT。主要面向全球数学爱好者和科研机构，以解题和讲题算法为核心。

MathGPT官网显示，MathGPT的数学计算能力已覆盖小学、初中、高中的数学题，题型涵盖计算题、应用题、代数题等多个类型，还可以针对题目进行追问，暂未开放数学之外的问答互动。

用户使用MathGPT时，用文字或图片方式上传数学题，即可得到对话式的解答反馈，答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮，随机生成数学题目并由系统给出解答。目前，MathGPT支持中文、英文版本的PC端和移动端。

多个大模型在六个公开数学评测集合的正确率表现。图源:好未来

据好未来提供的MathGPT技术报告显示，在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中，MathGPT的表现不差。

10

蚂蚁集团百灵大模型

11月6日消息，蚂蚁集团宣布，根据国家《生成式人工智能服务管理暂行办法》指导要求，蚂蚁百灵大模型已完成备案。

本次通过备案的是蚂蚁百灵语言大模型，该大模型采用Transfromer架构，基于万亿级Token语料训练而成，支持窗口长度达32K，推理能力领先，在主流推理类榜单中排名前列。

据了解，蚂蚁大模型坚持自主研发、全栈布局，目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

得益于在大模型基础设施上的坚决投入，蚂蚁百灵在算力、安全力和知识力上表现突出。

算力上，蚂蚁建设了万卡异构集群，其中硬件算力效率（HFU）超过60%，集群有效训练时长占比90%以上，RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍，推理性能相较于业界方案提升约2倍，处于业界先进水平。

安全力方面，蚂蚁研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具，支持50万/天饱和式攻击，全面覆盖生成内容数百类风险;“天鉴”平台可在大模型运行时，覆盖8大类风险，采用大模型对抗大模型的方式，使得风险召回率大于99%，其Guardrails前置护栏功能，能精确召回20多类提问风险意图。

知识力上，蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化，形成了完备的知识处理能力。其中，集评测数据集与评测框架一体化的大模型评测平台—EVE，能支持语言大模型和多模态大模型一站式自动化评测。

据悉，在基础大模型层面，除了本次通过备案的百灵语言大模型，蚂蚁集团也在研发百灵多模态大模型，并已内测。

11

360“奇元大模型”

11月4日，三六零（下称“360”）大模型“奇元大模型”通过备案落地。今年9月，“360智脑大模型”已获批面向公众开放。至此，360也成为国内首家两个大模型均通过备案的科技企业。

从大模型定位和应用角度来看，奇元大模型具备充足的灵活性和可扩展性，商业化和产品定位以B端用户为主，后期将会聚焦更多的商业化应用和垂直领域，帮助用户提升工作效率。

此前，360智脑大模型已于今年9月首批获得备案开放，并全面接入360搜索、360浏览器等互联网全端应用。据悉，360智脑上线首周即获300万用户超5000万次互动。360智脑大模型集成了360GPT大模型、360多模态大模型技术能力，具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能，覆盖大模型全部应用场景。