ChatGPT全面进入 4 时代！替换老将GPT-3.5，GPT-4o mini免费发布

AI快讯 2024-07-19

ChatGPT 全面进入 4 时代！

近日，OpenAI 发布了更经济实惠的 AI 模型 GPT-4o mini，性能超越 GPT-3.5 Turbo，并提供免费使用！API 定价更是降价 60%，而老将 GPT-3.5 即将退役。

这也意味着OpenAI从 GPT-4o mini替换现有 GPT-3.5 Turbo的那刻起，ChatGPT就将全面进入 4 时代！

GPT-4o mini 作为 ChatGPT 中最智能最实惠的小型模型，比 GPT-3.5 Turbo 更便宜，更智能。同时，这也是OpenAI首个使用"指令层级"(instruction hierarchy)安全策略的AI模型,旨在使系统优先考虑某些指令(如来自公司的指令)

GPT-4o mini 作为 ChatGPT 中最智能最实惠的小型模型，比 GPT-3.5 Turbo 更便宜，更智能。

而且由于 OpenAI 致力于解决潜在的安全问题，其中一些功能的发布被推迟。GPT-4o mini 提供了一些相同的功能，OpenAI 计划随着时间的推移添加更多功能。

光说不练假把式，GPT-4o mini 的性能究竟如何呢？根据 OpenAI 官方公布的数据，在多个关键基准测试中GPT-4o mini 表现出色，比如在文本智能和多模态推理方面GPT-4o mini 就全面超越了 GPT-3.5 Turbo 和其他小型模型。

推理任务：GPT-4o mini 在涉及文本和视觉的推理任务中优于其他小模型，在 MMLU（文本智能和推理基准测试）中的得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%

数学和编码能力：GPT-4o mini 在数学推理和编码任务中表现出色，超过了市场上以前的小模型。在 MGSM（测量数学推理能力）中，GPT-4o mini 得分为 87.0%，而 Gemini Flash 为 75.5%，Claude Haiku 为 71.7%。在 HumanEval（测量编码性能）中，GPT-4o mini 得分为 87.2%，而 Gemini Flash 为 71.5%，Claude Haiku 为 75.9%

多模态推理：GPT-4o mini 在 MMMU（多模态推理评估）中也表现出色，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。