Anthropic推出三款AI模型
2024-03-10 09:33:01
描述
3月5日凌晨,主要由谷歌和亚马逊投资的Anthropic推出了三款新的AI模型,按照智能水平和成本由低到高依次推出Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。点评性能显著提高,模型性能超过GPT-4①Claude 每个模型都有
[本文共字,阅读完需要分钟]

3月5日凌晨,主要由谷歌和亚马逊投资的Anthropic推出了三款新的AI模型,按照智能水平和成本由低到高依次推出Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

点评

性能显著提高,模型性能超过GPT-4

①Claude 每个模型都有自己的特点:Opus性能领先三者,在Anthropic发布的测试结果中,MMLU、GPQA、GSM8K等8项测试得分均压GPT-4,表现出接近人类的理解和流畅性;作为中间选择,Sonnet巧妙地平衡了处理速度和计算效率,并考虑了经济性,在需要大规模部署的企业级应用场景中具有优势;Haiku是三者中最快、体积最小的模型。Haiku只需3秒就可以阅读arxiv网站上信息和数据密度高的论文(约1000token)。

②对比来看,Claude 3 Opus模型的性能完全优于GPT-4和Geminini 1.0 Ultra。Claude 3 在某些基准上,如GSM8K,Sonnet超过了GPT-4。Claude 3 Haiku可以和Gemini一起使用 1.0 Pro对抗。这让我们看到了大模型迭代的速度,并继续在性能上取得突破。同时,我们认为这也更期待GPT-5的动态及其性能的提高。

③Claude 3模型的指令遵循能力大大提高,拒绝回答系统护栏附近提示的可能性显著降低,对请求有更详细的理解,能够识别真正违反内容政策的问题,拒绝回答无害提示的频率显著降低。

④为了减少模型的“幻觉”,即提供错误的信息输出,Claude 3 Opus可以超过GPT-4 Turbo。相较于 Claude 2.1,Claude 3 Opus 在给出正确答案和减少错误答案方面的表现翻了一番。

⑤Claude 3模型家族提供了200K的上下文窗口,可以处理100多万token的输入,有助于更好地理解和记忆长文本信息。

多模态处理能力先进,c端实用性升级;专业领域性能飙升,b端适用性领先

Claude 3具有与其他行业领先型号相当复杂的视觉功能。它可以处理视觉格式,包括照片、图表、图形和技术图表,具有增强的视觉能力,类似于 GPT-4V 和谷歌的 Gemini。目前向企业客户开放多模态功能,部分客户高达 50% 以各种格式编码的知识库,如 PDF、流程图或演示幻灯片。

同时,Claude 与Claudee相比,发布了金融、医学、哲学等特定领域专家基准测试的性能表现 2.1等早期版本都有了显著的进步。

人工智能模型的进展不断蓬勃发展,对人工智能算力核心目标持乐观态度

近期人工智能不断进步。在海外,多模态继续催化,Sora、Stable Diffusion 3.包括谷歌世界模型Genie相继推出,AI模型百花齐放。我们认为,多模态模型的不断演变和AI模型的不断迭代升级,作为AI模型的基础,计算能力有望在AI模型的竞争下带动计算能力的军备竞争,计算能力的需求有望继续火爆。重视AI硬科技的核心受益目标,如光模块和服务器交换机的迭代升级,有望进一步加快。同时,积极期待人工智能应用的发展,继续关注人工智能方向的核心受益品种。

投资建议

①光模块&光器件:中际旭创、天府通信、新易盛、源杰科技(电子组联合覆盖)、博创科技、仕佳光子等;②服务器交换机和PCB:沪电股份(电子组联合覆盖)、ZTE、紫光股份(计算机组联合覆盖)等。③智算:润泽科技(机械组联合覆盖)、润建股份等。

风险提示

人工智能进展低于预期,计算能力建设低于预期,竞争风险加剧

推荐关键目标

Anthropic推出三款AI模型