当前位置:首页 > 生活 > 正文

讯飞星火发布深度推理模型X1,全国产算力平台训练有多大含金量?

  • 生活
  • 2025-01-16 03:30:06
  • 3

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

1月15日,科大讯飞发布深度推理大模型讯飞星火X1,其表现最为突出的是中文数学能力,目前已应用于教育和医疗场景。

在科大讯飞研究员的演示中,讯飞星火X1展现出了对复杂问题多步拆解的“思维链”能力,自我反思能力,并能够针对答案正确与否等反馈信息进行强化训练。

小初高/大学(含竞赛)、AIME、MATH 500等多项测试中,讯飞星火X1得分高于多个同样强调多步思维能力的模型,其中包括月之暗面的K1。

值得注意的是,讯飞星火X1是国内目前全量开放可下载大模型中,唯一在全国产算力平台上训练完成的。 

此次训练任务是由科大讯飞与华为合作完成。2023年10月,科大讯飞就曾联合华为推出国产万卡规模大模型算力平台“飞星一号”,并于去年10月再次宣布启动国产超大规模智算平台“飞星二号”。 

事实上,科大讯飞对于算力平台的搭建一直围绕国产算力。科大讯飞研究院院长刘聪曾在接受采访时坦言,讯飞的算力规模不及头部大厂,并且使用国产算力平台,也需要花费不少额外精力进行适配等工作。

他表示,在国内芯片和算力集群相较于国外领先水平有一定差距的情况下,讯飞的坚持仍然做出了可观的效果。

算力成本是国内通用大模型坚持迭代升级的一个重要门槛。随着Scaling Law的技术曲线放缓,更大算力投入与所获性能提升的比例开始缩小,这意味着算力的“性价比”开始下跌,除非不顾成本,否则很难有大模型公司能够继续攻坚大参数模型的预训练。

日前,作为大模型“六小虎”之一的零一万物就公开表示放弃超大模型的预训练,转向务实的、小而快的,以商业性价比来评估的模型。

如此可见,面对海外AI芯片高企的价格成本,以及日趋严格的购买限制,国产超大规模算力平台很可能是未来大多数通用模型及产业模型的主要选择之一。不过,缺乏生态支持、单卡算力有限等依然是国产算力长期面临的问题,就超大智算平台的搭建而言,行业还需要通信传输技术等AI基础设施层面的能力提升。

在这场发布会上,科大讯飞还发布了讯飞星火4.0 Turbo的更新版本,重点在于图文、数学和长文本能力,在多模态能力水平上进一步接近GPT-4o。

图文识别能力方面,该模型对通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了60%。模型还加入了混域知识搜索技术,可以更准确分析不同领域的文本内容,提高一次性提问的信息搜索效率。

此外,科大讯飞还推出了星火语音同传大模型,具备端到端语音到语音同传能力,最快实现5秒同传时延,接近人类专家译员水平。

无论是深度推理大模型讯飞星火X1,新版讯飞星火4.0 Turbo,还是星火语音同传大模型,科大讯飞都在强调其落地应用的实际场景与价值。 

目前,讯飞星火X1已应用于教育和医疗场景。除了讯飞自己所拥有的核心业务对应的行业资源,还有其智能硬件终端AI学习机。星火语音同传大模型也明确计划应用于讯飞录音笔、讯飞翻译机、讯飞办公本。

这是相较于其他创业公司,科大讯飞大力投入AI大模型的差异化之处,这家公司自身拥有大量的落地场景,包括ToB(企业端)业务资源,以及智能硬件终端场景。

据科大讯飞此前披露,2024年1-9月,公司在中国大模型招投标市场成功中标38个项目,披露的中标金额为2.16亿元,在项目数量和金额上均为行业第一。

作为上市公司,科大讯飞在AI大模型上的投入也将受到投资人们的持续关注与质疑。

2024上半年,科大讯飞亏损4亿元,上年同期则盈利7357万,这是其上市以来首份亏损的半年报。其中,2024上半年围绕大模型相关的总投入超过13亿,包括围绕大模型新增1.2亿营销推广费用。上半年的研发总投入高达21.9亿,同比增长32.32%。

彼时,公司董事长刘庆峰明确表示,要剔除不盈利的小业务,把战略业务做得更大。

随后,亏损情况到去年第三季度有所好转。财报显示,公司2024年前三季度实现净亏损约3.44亿元,同比下降445.91%。第三季度实现净利润5696.14万元,同比增长120.87%,相比于前两季度,单季度净利润与增速都实现了转正。

其中,公司前三季度教育业务收入同比增长22%,学习机销量增长超过100%,开放平台与消费者业务中的智能硬件收入增长41%。

当前,科大讯飞对于AI大模型商业化路径已规划明确。首先是在消费者、教育、医疗、汽车等已有场景中加快规模化落地,其次是通过大模型与运营商、金融、能源、交通等行业与央国企战略合作,第三是以会议、文档、翻译等标准化产品实行企业级销售。

这家公司在AI大模型的训练及应用方向选择上都极为务实。

科大讯飞研究院院长刘聪曾表示,讯飞的大语言模型会坚持迭代,o1大模型、多模态交互、语音端到端等方向均在计划内。

科大讯飞高级副总裁江涛则表示,未来几年公司不会在经营上额外大幅增加算力带来的重资本投资。同时,公司探索AGI过程中各个阶段的大模型成果,会通过蒸馏裁剪等各种技术手段沿途产出,落地到讯飞星火各个尺寸的大模型中,提高讯飞星火的商业化竞争力。

有话要说...