紧盯OpenAI不放,谷歌强势反击!万年老二能“翻身”吗

AI快讯 2024-05-15

在OpenAI昨日率先发布新技术后,谷歌不甘示弱,今日一口气发布了一系列创新技术,其中包括引人注目的Project Astra、先进的文生视频模型Veo,以及将彻底改变搜索体验的Gemini 1.5 Pro等。

image.png

与OpenAI那短短半小时的发布会相比,谷歌此次准备得更为充分,时间也更长。首先,让我们来看看Gemini 1.5 Pro。这款升级版模型的最大亮点是其惊人的200万token上下文长度,这无疑是业界的一个里程碑。

面对OpenAI GPT-4o的挑战,谷歌毫不示弱地推出了Project Astra,其视觉识别和语音交互效果与GPT-4o不相上下,甚至在某些方面更胜一筹。

紧接着,谷歌又展示了其强大的文生视频模型Veo,该模型的效果炫酷且时长超过1分钟,打破了Sora的纪录。

而最令人期待的重磅消息是,谷歌搜索将被Gemini重塑,彻底改变我们搜索信息的方式。用户不再需要自己点击搜索结果,而是由多步骤推理的AI Overview来代办一切。这一功能无疑将大大提高搜索效率和准确性。

发布会结束后,谷歌CEO更是用Gemini算了一下,整个发布会共提到了121次AI,足以看出谷歌对AI技术的重视和投入。

现在,我们正式进入了Gemini时代。CEO在发布会上表示:“我们完全处于Gemini时代。”并透露目前全世界使用Gemini的开发者已达到150万人。

Gemini 1.5 Pro的超长上下文窗口是其最大亮点之一,达到了200万token的级别,远超目前所有大语言模型。这意味着用户可以输入长达2小时的视频、22小时的音频、超过6万行代码或140多万单词的内容,为各种复杂任务提供了强大的支持。

在Gemini的加持下,谷歌搜索推出了AI Overview新功能,实现了AI搜索。用户只需在搜索框中输入问题,AI就会立即给出总结性的答案和相关链接。而且AI Overview还支持处理超长问题,如查找波士顿最好的瑜伽或普拉提工作室,并提供详细的入门优惠详情和步行时间等。

此外,谷歌还将Gemini带到了安卓系统中。通过内置的Circle to Search功能,用户只需简单的手势就能搜索手机上的任何内容。同时,用户还可以随时调出Gemini助手层,使用各种便捷功能。例如,用户可以直接将Gemini生成的图片拖到Gmail等应用中,询问视频中的具体信息或PDF中的某个内容。

在这些跟OpenAI叫板的“肌肉”展示之外,谷歌对大模型应用的看重,也在此次I/O大会中尽显,就是不知道这个万年老二能不能打翻身仗?

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章