0延迟演示全网沸腾，秒杀GPT-4o，Moshi要成为AI圈顶流？

AI快讯 2024-07-04

尽管业界翘首以盼的GPT-4o尚未正式对外开放，但法国的一支8人精英团队已悄然崛起，他们打造的Moshi原生多模态AI模型，在性能上几乎与GPT-4o并驾齐驱，现场演示更是实现了近乎零延迟的惊人效果，一时间在AI圈内引发了热烈讨论与转发狂潮。

Moshi是一款多模态大模型，具备听、说能力，未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试，展现了开源精神。用户体验方面，响应速度快，语言支持有待提高，使用便捷。Moshi的拟人化语气让对话更自然流畅，未来的迭代优化将提升回答准确度。对教育行业将产生深远影响，为学生提供循环讲解。期待更多类似产品出现，支持更多地方语言，让AI技术贴近人们生活。

Moshi还处在实验原型阶段，设计初衷是为了理解和表达情感，能够支持听、说、看，可以用70种不同情绪和风格说话，甚至随时打断。

它最为突出的一个能力是，能够同时处理两个音频流，即「听」和「说」是同时进行的。

这种实时互动的实现，是基于文本和音频混合的联合预训练，用Helium中合成的文本数据，训出的70亿参数的模型。

Moshi可以实现最低160ms端到端延迟。

而且，最小版本的Moshi还可以在笔记本电脑，或者消费级GPU上可跑。

许多人都说这是最接近GPT-4o的模型，Moshi各种炸裂演得到了LeCun、Karpathy等AI大佬的转发。

Pytorch之父称赞道，太令人惊叹了，Kyutai实验室在实时语音助手领域处于领先地位，作为真正的非营利性开放科学组织，它将在稍后发布代码。

而现在，想要体验的小伙伴们，现在可以直接加入候补名单体验了，每次对话限时5分钟。

传送门:https://moshi.chat/?queue_id=talktomoshi

GPT

@版权声明:部分内容从网络收集整理，如有侵权，请联系删除!

相关文章

每天免费100万token！OpenAI GPT-4o数据微调功能发布：打造个性化ChatGPT新纪元

2024-08-21

30

6步写出GPT提示词，让你文案更精准

2024-08-01

27

OpenAI放大招！GPT-4o高级语音模式测试正式启动

2024-07-31

5

SearchGPT炸场！OpenAI开卷AI搜索，网友灵魂拷问：谷歌你慌了吗

2024-07-26

6

OpenAI新策略：限时免费GPT-4o mini微调服务

2024-07-25

6

GPT-4o瑟瑟发抖！开源模型Llama 3.1泄密，附下载链接

2024-07-23

23

AI569工具箱收录了国内外当下流行的数百款 ai工具，定期检查更新最新的好用工具，工具包含了ai文本模型、ai绘画模型、ai 视频模型、ai声音模型等各种类型!Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

AI工具箱导航关于我们免责声明

Copyright © AI569工具导航站-ai工具大全京ICP备16027678号-17