未来已来：Claude 3.5 Sonnet引领AI新纪元！直接免费使用

AI快讯 2024-06-24

如今，大模型领域更卷了！

前脚 OpenAI 发布 GPT4o，硬控全场，后脚就被最大的竞争对手 Anthropic 超越了。

近日，Claude 3.5 Sonnet 正式发布了，号称是迄今为止最智能的模型，同时这也是 Claude 3.5 模型系列中的首个版本。据介绍，该模型提高了整个领域的智能水平，在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时，运行速度、成本与自家前代 Claude 3 Sonnet 相当。

现在，Claude 3.5 Sonnet 可以在 Claude.ai 和 Claude iOS 应用上免费使用，而 Claude Pro 和 Team 计划的订阅者可以享受显著更高的使用速率限制。该模型还可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。费用为每百万输入 tokens 3 美元和每百万输出 tokens 15 美元，具备 200K tokens 的上下文窗口大小。

卓越于研究生级推理与本科生级知识

在当今日新月异的AI领域，Claude 3.5 Sonnet凭借其卓越的研究生级别推理（GPQA）、本科生级别知识（MMLU）以及令人瞩目的编码熟练度（HumanEval），成功树立了新的行业标杆。它不仅在理解复杂指令、捕捉微妙差异和幽默感方面展现出显著进步，更能以流畅自然、易于理解的语言输出高质量内容。

值得一提的是，Claude 3.5 Sonnet的运行速度相较于其前身Claude 3 Opus有了显著的提升，达到了后者的两倍之多。这种性能上的飞跃，结合其高性价比的定价策略，使得Claude 3.5 Sonnet成为处理各种复杂任务的理想之选。无论是上下文敏感的客户支持，还是多步骤工作流程的协调，它都能轻松应对，展现出卓越的性能和效率。

在最近的一次内部智能体编码评估中，Claude 3.5 Sonnet更是展现出了惊人的实力。它成功解决了64%的问题，相较于Claude 3 Opus的38%有了显著的提升。这一评估主要测试了模型在接收到自然语言描述的改进要求后，修复错误或添加功能的能力。在得到相关指示和工具后，Claude 3.5 Sonnet能够独立进行代码编写、编辑和执行，展现出了复杂的推理和故障排除能力。此外，它在处理代码翻译、更新旧应用程序以及迁移代码库等方面也表现出了卓越的性能。

突破视觉极限：Claude 3.5 Sonnet刷新视觉模型标准

Anthropic公司近日宣布，其最新研发的Claude 3.5 Sonnet视觉模型已跃居行业之巅，全面超越了前代Claude 3 Opus，并在所有标准视觉基准测试中均取得了显著优势。特别是在视觉推理任务中，如解释图表、图形或从不完美的图像中提取文本，Claude 3.5 Sonnet展现了超凡的实力。这些功能对于零售、物流和金融服务等行业至关重要，因为它们能够从图像、图形或插图中提取比纯文本更为丰富的信息。

为了更直观地展示Claude 3.5 Sonnet的实力，Anthropic公司提供了与Claude 3 Opus、GPT-4o以及Gemini 1.5 Pro在视觉数学推理、科学图表解读、视觉问答、图表QA以及文件视觉QA等任务中的性能对比图。结果显示，Claude 3.5 Sonnet在各项指标上均领先于其他模型。

Artifacts：与Claude互动的全新维度

除了强大的视觉模型外，Anthropic还在Claude.ai平台上推出了Artifacts功能，为用户提供了一种全新的与Claude交互的方式。当用户要求Claude生成代码片段、文本文档或网站设计等内容时，这些Artifacts将实时呈现在对话旁边的专用窗口中。这一创新设计为用户创造了一个动态的工作空间，使他们能够实时查看、编辑和构建Claude的创作，从而轻松将AI生成的内容融入他们的项目和工作流程中。

Artifacts预览功能的推出标志着Claude从单纯的对话式AI向协作工作环境的转变，并将很快支持团队协作。在不远的将来，团队成员将能够在一个共享空间中安全地共享他们的知识、文档和正在进行的工作，而Claude将作为他们可靠的队友，按需提供支持和协助。

安全至上：Anthropic对Claude 3.5 Sonnet的严格把控

在确保模型性能的同时，Anthropic对Claude 3.5 Sonnet的安全性同样给予了高度关注。Anthropic安全团队对模型在化学、生物、放射性和核（CBRN）风险、网络安全和自主能力等领域进行了全面评估，最终将其分类为AI安全等级2（ASL-2）模型，意味着它不会构成灾难性风险。

为了进一步提升模型的安全性和透明度，Anthropic还与外部专家合作，对Claude 3.5 Sonnet中的安全机制进行了测试和完善。这一举措旨在确保模型在为用户提供优质服务的同时，也能够保障用户数据的安全和隐私。