阿里云正式发布通义千问2.5 模型性能全面赶超GPT
2024-05-10 10:11:38
描述
一、阿里云正式发布通义千问2.55月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为表面最强的中文大模型。与通义千问2.1版相比,通义千问2.5的理解能力、逻辑推理能力、指令遵循能力和代码能力分别提高
[本文共字,阅读完需要分钟]

一、阿里云正式发布通义千问2.5

5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为表面最强的中文大模型。

与通义千问2.1版相比,通义千问2.5的理解能力、逻辑推理能力、指令遵循能力和代码能力分别提高了9%、16%、19%、10%的中文能力继续领先于行业。在权威基准Opencompass上,通义千问2.5分追平GPT-4 Turbo,这是该基准首次在国内大型模型中取得如此优异的成绩。

阿里云正式发布通义千问2.5 模型性能全面赶超GPT

通义还发布了最新的开源模型,Qwen1.5-110B参数为1100亿,该模型在MMLU、TheoremQA、GPQA等基准评价超过了Meta的Llama-3-70B模型;HugingFace推出的开源大模型排行榜Open LLM 在Leaderboard上,Qwen1.5-110B冲上榜首,再次证明了通义开源系列行业最具竞争力

从以前的追逐者到现在的并行者,通义大模型频频霸榜,可以说是国产大模型一年来锐意进取、奋力追赶的缩影。

在过去的一年里,通义还发展了行业领先的文学地图、智能编码、文档分析、音视频理解等能力。企业客户和开发者可以通过API呼叫和模型下载访问通义,个人用户可以从APP中访问通义、免费使用官网和小程序的通义。会议当天,原通义千问APP宣布更名为“通义APP”

阿里云正式发布通义千问2.5 模型性能全面赶超GPT

二是坚定开源路线,成为中国最强大的开源模式

去年8月,通义宣布加入开源行列,随后开始不断开源,沿着“全模式、全尺寸”开源路线推出了10多个模型。目前,通义开源模型的下载量已超过700万。

大型培训和迭代的成本非常高,大多数人工智能开发者和中小企业负担不起。Meta、阿里巴巴云推动的大型模型开源趋势使开发者不必从零开始训练模型,而是将模型选择的主动性交给开发者,大大加快了大型模型应用的实施过程。

为了满足不同场景用户的需求,通义推出了跨越5亿到1100亿参数的八种大语言模型,如0.5B、1.8B、4B、7B、14B在手机、PC等端部设备部署方便;72B等大尺寸模型、110B可以支持企业级和科研级的应用;32B等中等尺寸试图在性能、效率和内存占用之间找到最具成本效益的平衡。此外,通义还开源了视觉理解模型Qwen-VL、Qwen音频理解模型-Audio、CodeQwen代码模型1.5-7BB、Qwen1.5混合专家模型-MoE。

通义72B、110B开源模型已登顶Open LLM Leaderboard排名第一。LMSYSY Chatbot,Org推出的基准测试平台 在Arena上,通义72B模型多次进入“盲测” 10创造了国产大模型的先例。

阿里云正式发布通义千问2.5 模型性能全面赶超GPT

长期沉淀的良好声誉为通义开源模型赢得了许多铁粉丝。每一个开源行动都会早早被开发者“蹲下”,并总是得到生态合作伙伴的第一次支持。”开发者的反馈和开源社区的生态支持是通义大型模型技术进步的重要动力。”阿里巴巴云首席技术官周景仁透露,通义大型模型将在未来继续开源。海涵金融

三、国内大模型热度再次上升,带动a股相关概念股大幅上涨

阿里系大模型生态链梳理:

阿里大模型+金融:恒生电子

阿里大模型+交通:千方科技

阿里大模型+政务:南威软件

阿里大模型+教育:新开普

阿里大模型+电商:光云科技

阿里大模型+网安:安恒信息

阿里大模型+法律:金桥信息

阿里大模型+税务:税友股份

阿里大模型+设计:超图软件

阿里大模型+医疗:卫宁健康