阿里云正式发布通义千问2.5 模型性能全面赶超GPT-股票-壹米财经

一、阿里云正式发布通义千问2.5

5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为表面最强的中文大模型。

与通义千问2.1版相比，通义千问2.5的理解能力、逻辑推理能力、指令遵循能力和代码能力分别提高了9%、16%、19%、10%的中文能力继续领先于行业。在权威基准Opencompass上，通义千问2.5分追平GPT-4 Turbo，这是该基准首次在国内大型模型中取得如此优异的成绩。

阿里云正式发布通义千问2.5 模型性能全面赶超GPT

通义还发布了最新的开源模型，Qwen1.5-110B参数为1100亿，该模型在MMLU、TheoremQA、GPQA等基准评价超过了Meta的Llama-3-70B模型；HugingFace推出的开源大模型排行榜Open LLM 在Leaderboard上，Qwen1.5-110B冲上榜首，再次证明了通义开源系列行业最具竞争力

从以前的追逐者到现在的并行者，通义大模型频频霸榜，可以说是国产大模型一年来锐意进取、奋力追赶的缩影。

在过去的一年里，通义还发展了行业领先的文学地图、智能编码、文档分析、音视频理解等能力。企业客户和开发者可以通过API呼叫和模型下载访问通义，个人用户可以从APP中访问通义、免费使用官网和小程序的通义。会议当天，原通义千问APP宣布更名为“通义APP”

阿里云正式发布通义千问2.5 模型性能全面赶超GPT

二是坚定开源路线，成为中国最强大的开源模式

去年8月，通义宣布加入开源行列，随后开始不断开源，沿着“全模式、全尺寸”开源路线推出了10多个模型。目前，通义开源模型的下载量已超过700万。

大型培训和迭代的成本非常高，大多数人工智能开发者和中小企业负担不起。Meta、阿里巴巴云推动的大型模型开源趋势使开发者不必从零开始训练模型，而是将模型选择的主动性交给开发者，大大加快了大型模型应用的实施过程。

为了满足不同场景用户的需求，通义推出了跨越5亿到1100亿参数的八种大语言模型，如0.5B、1.8B、4B、7B、14B在手机、PC等端部设备部署方便；72B等大尺寸模型、110B可以支持企业级和科研级的应用；32B等中等尺寸试图在性能、效率和内存占用之间找到最具成本效益的平衡。此外，通义还开源了视觉理解模型Qwen-VL、Qwen音频理解模型-Audio、CodeQwen代码模型1.5-7BB、Qwen1.5混合专家模型-MoE。

通义72B、110B开源模型已登顶Open LLM Leaderboard排名第一。LMSYSY Chatbot，Org推出的基准测试平台在Arena上，通义72B模型多次进入“盲测” 10创造了国产大模型的先例。

阿里云正式发布通义千问2.5 模型性能全面赶超GPT