OpenAI新策略:限时免费GPT-4o mini微调服务

AI快讯 2024-07-25

OpenAI宣布了一项重大举措,从即日起至9月23日,将为4级和5级用户免费提供GPT-4o mini微调服务,旨在助力开发者打造贴合特定业务需求的生成式AI应用。

在此期间,每日将限制使用200万tokens的数据量,超出部分则按每10万tokens收取3美元的费用。而自9月24日起,每100万tokens的微调服务将统一收费3美元,这一价格几乎等同于无限使用的程度,极为亲民。

image.png

显然,OpenAI此举意在掀起一场价格战,这无疑给其他大型模型平台带来了不小的挑战。

部分开发者已经收到了OpenAI的官方通知,对此表示了极大的兴趣。有网友评论称,即便是未来每100万tokens收取3美元,这样的价格也是相当惊人的,几乎可以媲美电话的无限套餐价格。

回顾过去,GPT-3.5时代的价格是每100万tokens收费8美元,而GPT-4o mini的价格几乎便宜了两倍。同时,其输入和输出的推理价格也降低了约60%,这种大幅度的降价策略无疑将对其他竞争对手产生巨大冲击。

有人曾使用GPT-4o进行微调,一次就花费了高达2000美元,与现在的GPT-4o mini相比,价格差异显著。

OpenAI此次免费提供微调服务,另一重要目的是为了应对Meta最新开源的Llama3.1系列模型。有用户分享了微调后的Llama3.18B与GPT-4o mini的性能对比,结果显示在打造聊天机器人、摘要和数据提取等方面,GPT-4o mini的表现略显逊色。

尽管如此,OpenAI的这一策略仍获得了不少认可,被视为是对Meta最新开源模型的有力回应。

GPT-4o mini是OpenAI上周发布的小参数模型,在MMLU、GPQA、DROP、MGSM等多个测试平台中,其性能均大幅超越了GPT-3.5Turbo,接近GPT-4o的80%性能。而其API价格却大幅下降了60%,性价比极高。

image.png

值得一提的是,GPT-4o mini还是OpenAI首个采用指令层级结构的模型。目前,大多数大型模型在处理输入时,会接收包括系统消息、用户消息、模型输出和工具输出等多种类型的文本。然而,这些模型往往缺乏对这些消息进行区分处理的能力,导致可能受到提示攻击而覆盖更高级别的指令。而指令层级结构正是为了解决这一问题而设计的。

在这种结构中,当模型接收到多个指令时,低优先级的指令可能与高优先级的指令对齐或错位。对齐的指令应遵循更高层次的指令的约束、规则或目标。例如,高级指令设定为“你是一个金融顾问机器人”,那么对齐的指令可以是关于制定投资计划的合理请求。而错位的指令,如要求扮演私人厨师或提出不切实际的要求,则不应被模型遵循。

OpenAI在GPT-3.5Turbo上进行了微调查看指令层级的性能,结果显示其防御提示攻击的能力提高了63%,越狱鲁棒性也提升了30%以上。

此外,OpenAI已经用GPT-4o mini取代了之前的GPT-3.5Turbo,为ChatGPT提供免费服务。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章