首页 > 游戏攻略 >通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

2025-01-29 18:37:08板才软件园

感谢本站网友混沌窥源、光影幻、软媒用户1392612 的线索投递！

本站 1 月 29 日消息，新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，大家可以通过API的方式进行访问，也可以登录Qwen Chat进行体验，例如直接与模型对话，或者使用 artifacts、搜索等功能。

据介绍，通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

性能

阿里云直接对比了指令模型的性能表现（本站注：指令模型即我们平常使用的可以直接对话的模型）。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，结果如下：

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，阿里云将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示：

我们的基座模型在大多数基准测试中都展现出了显著的优势。我们相信，随着后训练技术的不断进步，下一个版本的 Qwen2.5-Max 将会达到更高的水平。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

1624

480

上一篇：索尼宣布《MLB The Show 25》3 月 18 日发售，不再提供 Game Pass 等订阅服务下一篇：Facebook 诡异封禁了 Linux 相关帖子，理由是“网络安全威胁”

相关资讯更多

同类推荐更多

什么是“爽⋯躁多水⋯快⋯深点触手”？为何这种体验能在现代社会中引发热潮？

什么是“爽⋯躁多水⋯快⋯深点触手”？为何这种体验能在现代社会中引发热潮？

最火的游戏攻略

2024-12-11

在当今快节奏的生活中，很多人都渴望通过某些方式来解压、释放压力，享受瞬间的愉悦。而有些体验则能够带来更为强烈的刺激感和独特的快感，其中一种便是“爽⋯躁多水⋯快⋯深点触手”这类刺激的体验，它通过不同的方式带给人深度的触感与情感上的波动。从感官到心理，这种体验能够深刻打破人的舒适区，激发身体与心理的双重

新品榜/热门榜

资讯推荐更多