零一万物发布千亿参数Yi-Large模型,李开复“现身说法”

AI快讯 2024-05-14

5月13日消息,零一万物创始人兼CEO李开复今日发布千亿参数Yi-Large闭源模型。李开复透露,闭源大模型Yi-Large评测超越ChatGPT4。当被问及大模型爆发是否会带来中国创业公司的大规模洗牌时,李开复表示,现在对中国大模型创业公司的盖棺定论为时过早,中国的创业者永远超出想象力。李开复同时表示,ofo式的补贴逻辑不再适用于AI 2.0,希望大模型赛道的竞争聚焦于达成TC-PMF(产品市场匹配)。

一年前,李开复提出了“AI2.0”的概念,后招兵买马,宣布要做”中文ChatGPT”,零一万物应运而生。一年后,零一万物官宣了从应用到生态的产品线:聚焦C端的生产力应用 “万知”,以及赋能 B端生态的 “API 开放平台”。除此之外,零一万物将早先发布的 Yi-34B、Yi-9B/6B 中小尺寸开源模型版本升级为了Yi-1.5 系列。

在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。

与前序模型相比,Yi-1.5 系列模型进一步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出,Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B,几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。

据了解,Yi-1.5 是 Yi-1.0 的持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。

其实不止Yi-1.5,同时零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。

其中,千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景,每百万 token 的价格是 20 元,是 GPT-4-turbo 的三分之一。

image.png

Yi-Large-Turbo API 则根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景。Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读 20 万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。

其中特别要提到的是发布会现场正式亮相的千亿参数 Yi-Large 闭源大模型。Yi-Large 面世的同时即正式进军全球 SOTA 顶级大模型之首。可以看到,与 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等当前顶级模型的较量中,Yi-Large 在绝大多数情况下取得了优势。

同时,在斯坦福大模型排行榜 AlpacaEval 的英语评测中,Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中,Yi-Large 一跃成为国产大模型 No. 1。

中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 也位列国产大模型之首,Yi-Large 的综合中英双语能力皆展现了卓越的性能。

此外,借一周年发布会,低调许久的李开复也首度现身说法,亲自拆解发展蓝图背后的战略思路。他提出,在中国大模型进入第二年之际,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到 “TC-PMF”(技术成本X产品市场契合度)。

据了解,在移动互联网的鼎盛时期,PMF(产品市场契合)曾是众多初创企业追求的核心目标。但李开复认为,PMF 这一概念已经不能完整定义以大模型为基础的 AI-First(AI优先)创业,应当引入 Technology(技术)与 Cost(成本)组成四维概念,即TC-PMF。“做技术成本X产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统PMF难上一百倍。” 李开复表示。

“大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的ofo式流血烧钱打法,让大模型能够用健康良性的ROI(投资回报率)蓄能长跑,奔赴属于中国的 AI 2.0 变革。”李开复说。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章