ChatGPT全面进入 4 时代!替换老将GPT-3.5,GPT-4o mini免费发布

AI快讯 2024-07-19

ChatGPT 全面进入 4 时代!

近日,OpenAI 发布了更经济实惠的 AI 模型 GPT-4o mini,性能超越 GPT-3.5 Turbo,并提供免费使用!API 定价更是降价 60%,而老将 GPT-3.5 即将退役。

这也意味着OpenAI从 GPT-4o mini替换现有 GPT-3.5 Turbo的那刻起,ChatGPT就 将全面进入 4 时代!

GPT-4o mini 作为 ChatGPT 中最智能最实惠的小型模型,比 GPT-3.5 Turbo 更便宜,更智能。同时,这也是OpenAI首个使用"指令层级"(instruction hierarchy)安全策略的AI模型,旨在使系统优先考虑某些指令(如来自公司的指令)

image.png

GPT-4o mini 作为 ChatGPT 中最智能最实惠的小型模型,比 GPT-3.5 Turbo 更便宜,更智能。

而且由于 OpenAI 致力于解决潜在的安全问题,其中一些功能的发布被推迟。GPT-4o mini 提供了一些相同的功能,OpenAI 计划随着时间的推移添加更多功能。

光说不练假把式,GPT-4o mini 的性能究竟如何呢?根据 OpenAI 官方公布的数据, 在多个关键基准测试中GPT-4o mini 表现出色,比如在文本智能和多模态推理方面GPT-4o mini 就全面超越了 GPT-3.5 Turbo 和其他小型模型。

推理任务:GPT-4o mini 在涉及文本和视觉的推理任务中优于其他小模型,在 MMLU(文本智能和推理基准测试)中的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%

数学和编码能力:GPT-4o mini 在数学推理和编码任务中表现出色,超过了市场上以前的小模型。在 MGSM(测量数学推理能力)中,GPT-4o mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在 HumanEval(测量编码性能)中,GPT-4o mini 得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%

多模态推理:GPT-4o mini 在 MMMU(多模态推理评估)中也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

image.png

更令人惊喜的是,GPT-4o mini 的定价策略极具吸引力,比 OpenAI 之前的模型(包括 GPT-3.5 Turbo)便宜得多。具体来说,GPT-4o mini 的定价为每百万输入 token 15 美分,每百万输出 token 60 美分,相当于 降价了 60% 以上!

image.png

此外,OpenAI 还表示,GPT-4o mini 是首个使用其开发的新安全策略(称为“指令层次结构”)的 AI 模型,这种方法的目的是让 AI 系统优先执行某些指令(例如来自公司的指令),从而使人们更难让该工具做不该做的事情。

据介绍,GPT-4o mini 拥有与 GPT-4o 相同的安全缓解措施,来自社会心理学和错误信息等领域的 70 多名外部专家测试了 GPT-4o,以识别潜在风险,更为重要的是现在已经解决了这些风险,这些专家评估的见解帮助改进了 GPT-4o 和 GPT-4o mini 的安全性

更是基于这些经验教训,通过不断研究指导的新技术改进了 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用我们的指令层次结构方法的模型,该方法有助于提高模型抵御越狱、提示注入和系统提示提取的能力。这使模型的响应更加可靠,并有助于在大规模应用中更安全地使用。

GPT-4o mini 的推出,标志着 OpenAI 在 AI 普及之路上迈出了重要一步。更低的成本、更强的性能、更便捷的使用方式,将吸引更多开发者和用户加入 AI 应用的浪潮。

未来,OpenAI 将继续致力于 AI 技术的研发和推广,让 AI 真正成为触手可及的工具,为人类社会创造更多价值。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章