中国第二批获批备案的 11个AI大模型详解

09

好未来(MathGPT大模型)

8月24日,好未来集团首席技术官田密在20周年直播活动中宣布,该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。

今年5月,好未来曾公布正在进行自研数学大模型的研发,由CTO田密牵头,命名为MathGPT。主要面向全球数学爱好者和科研机构,以解题和讲题算法为核心。

MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。

用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端。

中国第二批获批备案的 11个AI大模型详解

多个大模型在六个公开数学评测集合的正确率表现。图源:好未来

据好未来提供的MathGPT技术报告显示,在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中,MathGPT的表现不差。

10

蚂蚁集团百灵大模型

11月6日消息,蚂蚁集团宣布,根据国家《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案。

本次通过备案的是蚂蚁百灵语言大模型,该大模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度达32K,推理能力领先,在主流推理类榜单中排名前列。

据了解,蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

得益于在大模型基础设施上的坚决投入,蚂蚁百灵在算力、安全力和知识力上表现突出。

算力上,蚂蚁建设了万卡异构集群,其中硬件算力效率(HFU)超过60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。

安全力方面,蚂蚁研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具,支持50万/天饱和式攻击,全面覆盖生成内容数百类风险;“天鉴”平台可在大模型运行时,覆盖8大类风险,采用大模型对抗大模型的方式,使得风险召回率大于99%,其Guardrails前置护栏功能,能精确召回20多类提问风险意图。

知识力上,蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化,形成了完备的知识处理能力。其中,集评测数据集与评测框架一体化的大模型评测平台—EVE,能支持语言大模型和多模态大模型一站式自动化评测。

据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。

11

360“奇元大模型”

11月4日,三六零(下称“360”)大模型“奇元大模型”通过备案落地。今年9月,“360智脑大模型”已获批面向公众开放。至此,360也成为国内首家两个大模型均通过备案的科技企业。

中国第二批获批备案的 11个AI大模型详解

从大模型定位和应用角度来看,奇元大模型具备充足的灵活性和可扩展性,商业化和产品定位以B端用户为主,后期将会聚焦更多的商业化应用和垂直领域,帮助用户提升工作效率。

此前,360智脑大模型已于今年9月首批获得备案开放,并全面接入360搜索、360浏览器等互联网全端应用。据悉,360智脑上线首周即获300万用户超5000万次互动。360智脑大模型集成了360GPT大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2023年11月9日 下午12:07
下一篇 2023年11月9日 下午12:57

热点文章

分享本页
返回顶部