OpenAI放大招!GPT-4o高级语音模式测试正式启动

AI快讯 2024-07-31

OpenAI正式迈出了新的一步,宣布对少数精选的ChatGPT Plus用户开放GPT-4o的高级语音模式测试之旅。此次测试的核心目标聚焦于收集关于安全性和功能完善性的宝贵用户反馈,预计将在八月伊始,向公众呈现一份详尽的GPT-4o性能评估报告。紧接着,一系列令人期待的视频与屏幕共享新功能也将逐一揭晓。

image.png

有幸获得测试资格的用户,将通过OpenAI精心设计的邮件得知这一喜讯,其中一位深耕AI领域的专栏作家更是迫不及待地加入了探索的行列。

这位作家怀抱憧憬,期望GPT-4o能化身为足球场上的金牌解说,用其独特的激情嗓音点燃每一场赛事的激情,尤其是在那决定胜负的关键进球时刻,能爆发出如同黄健翔般令人热血沸腾的呐喊,重现德国世界杯的经典解说风采。遗憾的是,初次尝试似乎并未完全契合他的期待,但经过微调后的GPT-4o,其解说风格竟意外地接近了那份记忆中的激情,背景音效的巧妙融入更是增添了几分现场感,令人赞叹不已。

GPT-4o的语音功能还展现出了在教育领域的巨大潜力,成为口语练习的得力助手。它不仅能陪伴用户进行日常对话练习,还能精准地评估发音质量,为那些无法负担高昂私教费用的家庭提供了公平享受高质量教育的机会。

多语言支持的强大功能更是GPT-4o的一大亮点,用户测试表明,无论是优雅的法语、热情的西班牙语,还是独特的乌尔都语,GPT-4o都能以流畅自然的方式进行表达,仿佛为每个人配备了一位随身翻译官。这一特性不仅预示着未来国际交流的无限可能,也让传统翻译行业感受到了前所未有的挑战。

更令人感动的是,GPT-4o的语音模式还承载着情感慰藉的功能。有网友通过这一功能“复活”了逝去的朋友,通过自定义对话重拾往日的温馨与陪伴,展现了科技背后的人文关怀与温度。

image.png

尽管测试范围有限,但OpenAI已明确表示,经过本轮测试后,GPT-4o的语音模式将于今年秋季全面开放给所有ChatGPT Plus用户。这一消息让众多期待已久的用户看到了希望的曙光,纷纷表示迫不及待想要体验这一前沿科技带来的便利与乐趣。

回顾今年5月14日的盛况,OpenAI震撼发布了其跨视频、音频、文本实时推理的旗舰模型GPT-4o,其强大的语音推理功能迅速在全球范围内引发了广泛关注。然而,为了确保产品的安全、性能和算力达到最佳状态,OpenAI推迟了测试计划,经过两个月的精心准备,终于迎来了这一激动人心的时刻。

对于国内用户而言,虽然ChatGPT Plus的访问存在一定门槛,但商汤科技在WAIC2024大会上推出的“日日新5o”大模型无疑是一个值得关注的替代品。这款被誉为“国产版GPT-4o”的智能产品,在文本、图像乃至视频的多模态处理上展现出了非凡的能力,为全球用户提供了更多样化的选择。此外,日日新5o还采用了先进的混合端边云协同架构,基于海量高质量数据训练而成,确保了高性能与低成本的完美结合。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章