未来已来:Claude 3.5 Sonnet引领AI新纪元!直接免费使用
如今,大模型领域更卷了!
前脚 OpenAI 发布 GPT4o,硬控全场,后脚就被最大的竞争对手 Anthropic 超越了。
近日,Claude 3.5 Sonnet 正式发布了,号称是迄今为止最智能的模型,同时这也是 Claude 3.5 模型系列中的首个版本。据介绍,该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 Sonnet 相当。
现在,Claude 3.5 Sonnet 可以在 Claude.ai 和 Claude iOS 应用上免费使用,而 Claude Pro 和 Team 计划的订阅者可以享受显著更高的使用速率限制。该模型还可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。费用为每百万输入 tokens 3 美元和每百万输出 tokens 15 美元,具备 200K tokens 的上下文窗口大小。
卓越于研究生级推理与本科生级知识
在当今日新月异的AI领域,Claude 3.5 Sonnet凭借其卓越的研究生级别推理(GPQA)、本科生级别知识(MMLU)以及令人瞩目的编码熟练度(HumanEval),成功树立了新的行业标杆。它不仅在理解复杂指令、捕捉微妙差异和幽默感方面展现出显著进步,更能以流畅自然、易于理解的语言输出高质量内容。
值得一提的是,Claude 3.5 Sonnet的运行速度相较于其前身Claude 3 Opus有了显著的提升,达到了后者的两倍之多。这种性能上的飞跃,结合其高性价比的定价策略,使得Claude 3.5 Sonnet成为处理各种复杂任务的理想之选。无论是上下文敏感的客户支持,还是多步骤工作流程的协调,它都能轻松应对,展现出卓越的性能和效率。
在最近的一次内部智能体编码评估中,Claude 3.5 Sonnet更是展现出了惊人的实力。它成功解决了64%的问题,相较于Claude 3 Opus的38%有了显著的提升。这一评估主要测试了模型在接收到自然语言描述的改进要求后,修复错误或添加功能的能力。在得到相关指示和工具后,Claude 3.5 Sonnet能够独立进行代码编写、编辑和执行,展现出了复杂的推理和故障排除能力。此外,它在处理代码翻译、更新旧应用程序以及迁移代码库等方面也表现出了卓越的性能。
突破视觉极限:Claude 3.5 Sonnet刷新视觉模型标准
Anthropic公司近日宣布,其最新研发的Claude 3.5 Sonnet视觉模型已跃居行业之巅,全面超越了前代Claude 3 Opus,并在所有标准视觉基准测试中均取得了显著优势。特别是在视觉推理任务中,如解释图表、图形或从不完美的图像中提取文本,Claude 3.5 Sonnet展现了超凡的实力。这些功能对于零售、物流和金融服务等行业至关重要,因为它们能够从图像、图形或插图中提取比纯文本更为丰富的信息。
为了更直观地展示Claude 3.5 Sonnet的实力,Anthropic公司提供了与Claude 3 Opus、GPT-4o以及Gemini 1.5 Pro在视觉数学推理、科学图表解读、视觉问答、图表QA以及文件视觉QA等任务中的性能对比图。结果显示,Claude 3.5 Sonnet在各项指标上均领先于其他模型。
Artifacts:与Claude互动的全新维度
除了强大的视觉模型外,Anthropic还在Claude.ai平台上推出了Artifacts功能,为用户提供了一种全新的与Claude交互的方式。当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些Artifacts将实时呈现在对话旁边的专用窗口中。这一创新设计为用户创造了一个动态的工作空间,使他们能够实时查看、编辑和构建Claude的创作,从而轻松将AI生成的内容融入他们的项目和工作流程中。
Artifacts预览功能的推出标志着Claude从单纯的对话式AI向协作工作环境的转变,并将很快支持团队协作。在不远的将来,团队成员将能够在一个共享空间中安全地共享他们的知识、文档和正在进行的工作,而Claude将作为他们可靠的队友,按需提供支持和协助。
安全至上:Anthropic对Claude 3.5 Sonnet的严格把控
在确保模型性能的同时,Anthropic对Claude 3.5 Sonnet的安全性同样给予了高度关注。Anthropic安全团队对模型在化学、生物、放射性和核(CBRN)风险、网络安全和自主能力等领域进行了全面评估,最终将其分类为AI安全等级2(ASL-2)模型,意味着它不会构成灾难性风险。
为了进一步提升模型的安全性和透明度,Anthropic还与外部专家合作,对Claude 3.5 Sonnet中的安全机制进行了测试和完善。这一举措旨在确保模型在为用户提供优质服务的同时,也能够保障用户数据的安全和隐私。