第三是“AI孙悟空”的多模态交互能力。
大模型的能力已经从单一模态向多模态融合演进,具备图片、视频、音频等生成能力的大模型层出不穷。去年4月,讯飞首发长文本、长图文、长语音“三合一”的星火多模态交互大模型,直接跨模态实现文字、图像、语音交互。
通过深度融合多模态交互能力与超拟人数字人技术,“AI孙悟空”能依据和游客语音对话的内容,生成丰富的动作和表情,让每一个动作、每一个神态都与语言表达完美契合;同时,依托讯飞星火大模型的视觉处理图像理解与创作能力,能够基于语义需求生成高质量视觉内容,从而打造出这个能“写诗作画”的AI孙悟空。最后,对各种问题都能应对自如的“AI孙悟空”,离不开科大讯飞“奇思妙问”这款产品多年的技术积累。
在世博会上,“AI孙悟空”饱读诗书,能够轻松应对观众关于中国传统文化、人文风情的各类问题,这一丰富的知识储备,以及让AI大模型达到类科学家的自由对话、问题准确理解、海量科普知识、逻辑推理能力,也是科大讯飞在教育场景不断积累的成果。
科大讯飞科学教育产品线总经理刘君谈道,奇思妙问产品的研发初衷是,在入校调研中发现的一个矛盾:学生的奇思妙想是无限的,但老师的知识储备存在边界。当孩子提出跨学科甚至“天马行空”的问题时,有时被老师敷衍、忽视甚至斥责。因此,科大讯飞决心用技术“接住”每一个问题,做一个“随时满足孩子‘十万个为什么’”的产品。她补充说,依托讯飞星火大模型及数字人技术,科大讯飞为学生构建爱因斯坦(科学)、李白(人文)等10位中外科学巨匠与文化名人的AI虚拟形象。通过深度语义理解与多模态对话能力,实时解答孩子的问题并通过启发式问答引导逻辑推理。截至2025年4月,“奇思妙问”已累计为18万中小学生解答超362万个问题,98.7%的孩子获得了满意答案。
这4项关键的技术密码,以及多年的数据积累、实践经验沉淀,构成了大阪世博会上生动的“AI孙悟空”,凭借过硬的实力在这一届世博会上火出了圈。
三、基于全国产化算力底座训练,科大讯飞展现中国科技实力
此次,“AI孙悟空”作为世博会中国馆唯一大模型展项,不仅折射出科大讯飞在AI领域的长足积累,更是体现了中国科技发展的底气。
2022年底大模型风起,科大讯飞迅速布局,并率先瞄准了“全国产”布局。去年10月,讯飞星火4.0 Turbo发布,彼时实现了七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o;今年1月,发布业界首个基于全国产算力平台训练的深度推理大模型讯飞星火X1。
可以看到,讯飞星火大模型正一步步从追赶国际先进模型到对标甚至赶超。
此外,AI行业的发展瞬息万变,但其中的一大隐忧是算力生态的布局。因此率先洞察到这一产业趋势的同时,科大讯飞将训练基座模型和构建国产算力生态同步推进。
2023年7月,讯飞星火大模型与华为昇腾自主创新算力平台结合拉开了构建全国产算力平台的序幕,3个月后,其联手打造的首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”启用。24年10月,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
这也使得讯飞星火大模型成为国内唯一全栈国产算力训练、推理双实现的大模型。
在AI发展日益激烈的当下,科大讯飞此前的技术布局与积累,正在实现交叉融合,其语音技术和大模型的结合进一步扩宽了业务场景,并逐步转化到真实场景的软硬件业务落地之上,在教育、办公、医疗等诸多场景落地。以数字人为例,科大讯飞不断探索AI与数字人形象相结合,将场景从传统的电话客服、企业营销等领域,逐渐扩展到面向大众的文化传播赛道,能够让AI大模型技术在丰富的工作、生活场景中落地,也是这次科大讯飞能够赋能“AI孙悟空”,成为本届世博会上唯一大模型展项的关键。
同时,这也是厚积薄发的科大讯飞在当下交出的一张满分答卷。
结语:科大讯飞亮剑全球AI竞技场
在大阪世博会上,”AI孙悟空”的身影,也是中国人工智能发展的一个生动缩影。它向世界证明,基于全国产化算力底座训练的国产大模型,同样能突破技术边界,展现出令人惊叹的交互能力和文化创造力。
这不仅标志着中国AI产业已构建起从芯片、框架到应用的完整生态链,更象征着在全球人工智能竞赛中,中国正以自主创新的姿态,成长为与全球顶尖水平并驾齐驱的”第二极”。AI的发展,不仅赋予了一个传统动画角色的新生,更是代表了一个科技大国在智能浪潮中的崛起宣言。
4月21日,讯飞星火深度推理模型X1将再次升级,讯飞星火将在全国产算力平台上持续训练,以对标世界领先的技术水平。

微信扫一扫 