欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车
新智元报道
编辑:编辑部 HNZ
【新智元导读】法国初创Mistral,刚刚推出定价碾压DeepSeek V3的模型,而模型性能,却超过Claude Sonnet 3.7的90%。不过在网友们的实测中,它却翻车了?有人建议:不必下载浪费流量和硬盘空间。
就在刚刚, Mistral AI发布了他们最新多模态模型Mistral Medium 3。
Mistral兴奋地宣称Mistral Medium 3的性能接近甚至达到了Claude Sonnet 3.7的水平,但成本却比DeepSeek V3还低。
性价比拉满!
在Mistral官方的博客中,列出了Mistral Medium 3的核心亮点:
1. Mistral Medium 3平衡了:
顶尖性能
成本降低至原来的八分之一
更易于部署,从而加速企业应用
2. 模型在代码编写和多模态理解等专业应用场景中表现出色。
3. 模型提供一系列企业功能,包括:
支持混合云部署、本地部署以及在VPC内部署
定制化后训练
集成到企业工具和系统中
Mistral Medium 3 API,现已在Mistral La Plateforme和Amazon Sagemaker上线,并将很快登陆IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex。
完美平衡
Mistral Medium 3在提供前沿性能的同时,成本却降低了一个数量级。
例如,在各项基准测试中,Mistral Medium 3的性能达到甚至超过了Claude Sonnet 3.7的90%,但成本却显著降低(每百万Token的输入成本为0.4美元,输出成本为2美元)。
Mistral Medium 3的性能也超越了领先的开源模型,如Llama 4 Maverick和Cohere Command A等企业模型。
无论是API还是自主部署,Mistral Medium 3的成本都要比DeepSeek V3还低。
此外,Mistral Medium 3还可以部署在任何云上,包括四个GPU及以上的自托管环境。
顶级性能
Mistral表示,Mistral Medium 3的目标是成为一款性能顶尖的模型,尤其是在编码和STEM任务中表现突出,性能直逼那些规模更大、速度更慢的竞争对手。
从Mistral给出的表中可以看出Mistral Medium 3性能已经基本上超越Llama 4 Maverick和GPT-4o,接近Claude Sonnet 3.7以及DeepSeek 3.1的水平。
人工评估结果
除了学术基准之外,Mistral还公布了第三方人工评估,后者更能代表真实世界的用例。
可以看到,Mistral Medium 3在编码领域表现出色,并且在各个方面都比其他竞争对手提供了更好的性能。
专为企业级应用打造
Mistral Medium 3在适应企业环境的能力方面优于其他SOTA模型。
在企业面临通过API进行微调,或从零开始自部署并定制模型行为的艰难选择时,Mistral Medium 3提供了一条将智能全面集成到企业系统中的途径。
Mistral还推出了由Mistral Medium 3模型驱动的Le Chat Enterprise,一款面向企业的聊天机器人服务。
它提供了一个AI智能体构建工具,并将Mistral的模型与Gmail、Google Drive和SharePoint等第三方服务整合。
这就可以解决企业面临的AI挑战,如工具碎片化、不安全的知识集成、僵化的模型以及缓慢的投资回报率等,为所有组织工作提供统一的AI平台。
Le Chat Enterprise很快将支持MCP协议,这是Anthropic提出的连接AI与数据系统和软件的标准。
One more thing…
Mistral还在博客中透露,虽然Mistral Small和Mistral Medium都已经发布,但在未来几周内,他们有一个「大」计划,也就是Mistral Large。
他们表示刚发布的Mistral Medium性能已经远胜Llama 4 Maverick等顶尖开源模型,Mistral Large的性能更加值得期待。
网友实测:就这?
号称超越Claude Sonnet 3.7的90%,Medium 3果然有这么强吗?
媒体和网友们立刻展开了实测。
在基于《纽约时报》Connections栏目词汇分类题的评测中,Medium 3处于倒数的位置,几乎找不到它。
在全新的100题测评中,它在前排模型中也排不上号。
有人测试Medium 3后表示,它的写作能力还是老样子,没啥进步。不过在LLM评测中,它倒是处在帕累托前沿。
而Zhu Liang测试后发现,模型在代码编写和文本生成方面表现都很扎实,在这两项评测中都跻身前五。
在简单编码任务(Next.js TODO应用)中:
它生成了简洁明了的回复
评分和Gemini 2.5 Pro、Claude 3.5 Sonnet差不多
逊于DeepSeek V3 (新) 和GPT-4.1
在复杂编码任务(基准测试可视化)中:
产生的平均结果与Gemini 2.5 Pro和DeepSeek V3(新)相似
不如GPT-4.1、o3和Claude 3.7 Sonnet
在写作上:
它的内容覆盖了大部分要点,但格式不正确
评分与DeepSeek V3 (新) 和Claude 3.7 Sonnet相近
不如GPT-4.1和Gemini 2.5 Pro
知名大佬「karminski-牙医」实测后发现,它的性能并不像官方吹得那么强。
建议我们不必下载,浪费流量和硬盘空间了。
参考资料:
https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/
https://venturebeat.com/ai/mistral-comes-out-swinging-for-enterprise-ai-customers-with-new-le-chat-enterprise-medium-3-model/
https://mistral.ai/news/mistral-medium-3
相关推荐:德国艳妇VidaSO灌满 刘涛做爰全过程 贾主任的微博号
美杜莎自己扒开屁股让男人桶
国产高潮白浆
扒开赵露思❌狂揉❌视频在酒店裡
赵露思嗯灬啊灬把腿张开灬
动漫美女裸体被❌涩涩动漫
高芳高洁姐妹俩最新章节更新时间
脱美女内衣㊙️免费跳舞视频
法国啄木鸟医院三部
会议桌下添花蒂
空钟离被空c到高潮
女学生被❌c🐻扒衣服www
!中国老太做性令A片
女学生20岁一级毛片
邪恶道※琉璃社ACG
动漫男做㊙️视频
拉拉讲讲你们第一感受
未满十八18禁止免费视频
成人🔞p站在线观看
原神芙宁娜裸体❌开腿
成人无码AV—37399
日本吮乳吃奶头XXⅩ视频下载
裸体初音未来被❌H漫画
爱床sex❌❌⭕️⭕️A片
国产⭐浪潮AV四季
成人福利网站导航㊙️涩涩屋
女性裸体被❌羞羞漫画
成人黄❌免费视频酒店监控网站
迪士尼公主婬乱版
羞羞漫画歪歪漫画
男女那个视频
PORNO日本XXX老师HD
小舞3D动漫被❌磨蘑菇视频
田中宁宁
野原琳同人18❌AV黄漫网站
美女裸体羞羞❌免费网站
甘雨爆乳被秘
男女无套免费视频网站动漫
FreePorno💋👙6D
国产18无套国语对白
学生小12清纯裸体脱内衣网站
XXXmmm💋🍌🍆🍑男
美女张开腿露出尿口让我喝尿
被主人打屁股调教 撅高
女教师大荫蒂被男人添
麻豆精品一区二区三区av沈娜娜
秘密研究所永久入口导航
二次元裸体㊙️无遮挡胸-百度
国产⭐浪潮AV性色Av美妇大乳
Free GAY XXXX video网站
《致讨厌我的x第二季》
女人张开腿桶进牛鞭
在线观看视频无🈚码www
莎莉娜洗澡后被c高潮了
女学生喷浆动漫男打屁股
精灵宝可梦狂桶露莎米奈
九幺❌❌羞羞网站
裸体cosplay18禁网站www
男生的放男生的游戏
国产美女被爆❌羞羞视频打屁屁
云樱被吸乳被❌羞羞漫画
雏田被鸣人❌❌黄动漫
FerrPorno💋👙60
v61在线无码精品秘入口九色
女帝❌路飞18禁同人漫画
快手星野大战光头哥原版视频
黑蝴蝶熟女AV导航
阿米娅病狂❌喷水自慰
自由性别西元汇编
女性向成人片
莎莉娜扒开腿做❌同人本子免费
好爽⋯好紧⋯再深一点小说
上课突然硬了女同桌帮我自慰
欧美性猛交XXXX免费看蚧贝
八重神子被❌到爽羞羞漫画
少妇被🈲🈲流白浆❌❌水
沙奈朵开腿做❌同人漫画
体育生白袜出精🔞网站
打屁股sp调教网站
胡桃吃旅行者胡萝卜视频
赵云把貂蝉弄到高潮漫画
㊙️成片免费网址APP绿巨人
网友评论 查看所有评论>>