OpenAI新策略：限时免费GPT-4o mini微调服务

AI快讯 2024-07-25

OpenAI宣布了一项重大举措，从即日起至9月23日，将为4级和5级用户免费提供GPT-4o mini微调服务，旨在助力开发者打造贴合特定业务需求的生成式AI应用。

在此期间，每日将限制使用200万tokens的数据量，超出部分则按每10万tokens收取3美元的费用。而自9月24日起，每100万tokens的微调服务将统一收费3美元，这一价格几乎等同于无限使用的程度，极为亲民。

显然，OpenAI此举意在掀起一场价格战，这无疑给其他大型模型平台带来了不小的挑战。

部分开发者已经收到了OpenAI的官方通知，对此表示了极大的兴趣。有网友评论称，即便是未来每100万tokens收取3美元，这样的价格也是相当惊人的，几乎可以媲美电话的无限套餐价格。

回顾过去，GPT-3.5时代的价格是每100万tokens收费8美元，而GPT-4o mini的价格几乎便宜了两倍。同时，其输入和输出的推理价格也降低了约60%，这种大幅度的降价策略无疑将对其他竞争对手产生巨大冲击。

有人曾使用GPT-4o进行微调，一次就花费了高达2000美元，与现在的GPT-4o mini相比，价格差异显著。

OpenAI此次免费提供微调服务，另一重要目的是为了应对Meta最新开源的Llama3.1系列模型。有用户分享了微调后的Llama3.18B与GPT-4o mini的性能对比，结果显示在打造聊天机器人、摘要和数据提取等方面，GPT-4o mini的表现略显逊色。

尽管如此，OpenAI的这一策略仍获得了不少认可，被视为是对Meta最新开源模型的有力回应。

GPT-4o mini是OpenAI上周发布的小参数模型，在MMLU、GPQA、DROP、MGSM等多个测试平台中，其性能均大幅超越了GPT-3.5Turbo，接近GPT-4o的80%性能。而其API价格却大幅下降了60%，性价比极高。

值得一提的是，GPT-4o mini还是OpenAI首个采用指令层级结构的模型。目前，大多数大型模型在处理输入时，会接收包括系统消息、用户消息、模型输出和工具输出等多种类型的文本。然而，这些模型往往缺乏对这些消息进行区分处理的能力，导致可能受到提示攻击而覆盖更高级别的指令。而指令层级结构正是为了解决这一问题而设计的。

在这种结构中，当模型接收到多个指令时，低优先级的指令可能与高优先级的指令对齐或错位。对齐的指令应遵循更高层次的指令的约束、规则或目标。例如，高级指令设定为“你是一个金融顾问机器人”，那么对齐的指令可以是关于制定投资计划的合理请求。而错位的指令，如要求扮演私人厨师或提出不切实际的要求，则不应被模型遵循。

OpenAI在GPT-3.5Turbo上进行了微调查看指令层级的性能，结果显示其防御提示攻击的能力提高了63%，越狱鲁棒性也提升了30%以上。

此外，OpenAI已经用GPT-4o mini取代了之前的GPT-3.5Turbo，为ChatGPT提供免费服务。