滚球app(中国)官网下载
你的位置:滚球app(中国)官网下载 > 滚球盘口 >
滚球app(中国)官网 MiniMax新模子并列国外头部,国产大模子开启“月更”
发布日期:2026-04-02 23:35    点击次数:143

滚球app(中国)官网 MiniMax新模子并列国外头部,国产大模子开启“月更”

2月13日,MiniMax加入国产大模子的春节档“上新”阵营。其最新发布的M2.5模子晋升了智能体任务照顾速率,比好意思国外头部模子,而调用价钱却远低于同等第家具。

官方数据浮现,M2.5优化了模子对复杂任务的拆解智力和想考过程中token的破钞,比上一个版块M2.1完成任务的速率快了37%,从平均31.3分钟裁汰至22.8分钟。这一耗时情况与Anthropic于2月初发布的Claude Opus 4.6模子的22.9分钟基本捏平。

在第三方评测中,M2.5相同展现出竞争力。把柄BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价钱惟一Opus 4.6的1/8。

MiniMax公布的价钱浮现,在每秒输出100个token的情况下,纠合责任一小时只需要1好意思元,而在每秒输出50个token的情况下,只需要0.3好意思元。也便是说,1万好意思元不错让4个智能体(Agent)纠合责任一年。“M2.5提供了经济上真实无适度地构建和运营Agent的可能性。”MiniMax在官网上写说念。

M2.5上线后,在AI模子API团聚平台OpenRouter上日调用量杰出1000亿token,踏进榜单前十。

国外市集也赶快赐与反应。硅谷风险投资公司Menlo Ventures联合东说念主Deedy Das评价称:“MiniMax M2.5超低廉,至极适当编程。”面向云表编程智能体的通达平台OpenHands在唐突平台上写说念:“当今,在可通过API使用的模子中,实质上是两强争霸Opus代表最高智力上限,M2.5则以更低资本提供较高智力。”OpenHands至极提到,M2.5在需要万古期运行的任务上默契尤为出色,滚球app(中国)官网下载举例从零启动构建运用关节。

除编程智力外,M2.5在 Word、PPT、Excel金融建模等办公高阶场景中,也赢得显赫的智力晋升。据先容,MiniMax前期与金融、法律、社会科学等领域的资深从业者伸开了深度联接,由他们提倡需求、反应问题、参与圭臬界说,并径直构建数据,将行业的隐性学问带入到模子的本质经由之中。

往日100多天的时期内,MiniMax保捏近乎“每月一更”的节拍,不时推出M2、M2.1和M2.5版块。从编程领域代表性基准测试SWE-Bench Verified的收货来看,比较Claude、GPT和Gemini等模子系列的进步速率,M2系列模子的性能晋升速率更为显赫。

谈及模子智力捏续跃升的弱点成分,MiniMax将其归因于大领域强化学习。团队围绕着 Agent RL(智能体强化学习)的框架和算法,搭建起完好的时期体系。

M2.5的发布,也成为国产大模子公司春节前夜不甘人后“交卷”的最新一例。此前2月12日,字节逾越最新视频生成模子Seedance2.0文书接入旗下AI家具豆包和即梦,智谱则上线了旗舰级新模子GLM-5,相同主打编程等方面的智力。而DeepSeek则被发现已启动测试最高100万Token的高下文长度,支撑照顾超长文本,进一步引发外界对传说中DeepSeek V4的期待。

DeepSeek在上一个春节引发群众震憾,一年之后,国产大模子以集体“上新”的样子引爆“AI春节档”,无疑令群众AI竞赛愈加尖锐化。

 

文/南齐N视频记者 杨柳滚球app(中国)官网

易游官方网站APP下载