不愧是AI猛兽!谷歌放大招,将发布 Imagen3、定制GPT等五大功能

AI快讯 2024-07-17

近期,谷歌计划为其尖端AI巨擘Gemini增添一系列前沿功能,旨在进一步推动人工智能技术的边界。通过深入解析前端代码的微妙变化与行业内流传的线索,我们可以窥见Gemini即将解锁的诸多新能力,包括但不限于:下一代Imagen3的预览版、Gemini专属GPT(即GEMs)的深度定制、以及个性化与预定式交互的革新体验,此外还融合了录音功能与Google Photos的无缝对接,并暗藏即时优化与Chrome浏览器扩展的潜力。

image.png

Imagen3的前瞻展望

Imagen3,作为图像生成领域的又一力作,预计将在有限的范围内率先向AI Labs的精英测试者开放,未来亦有望惠及Gemini Advanced计划的尊贵用户。鉴于Imagen系列的卓越表现与市场对高质量图像生成工具的迫切需求,特别是考虑到欧洲地区对于此类功能的空白,Imagen3的发布无疑将引发广泛期待。据传,首批体验资格将优先授予AI Labs Discord社区的活跃成员及高级订阅用户。

GEMs:Gemini GPT的深度个性化

GEMs,即Gemini Enhanced Models,前身为“Bot”,自I/O大会前便已进入紧锣密鼓的开发阶段。用户将能够直观地浏览、编辑乃至复制这些个性化GPT模型,一切操作皆通过GEMs Manager这一便捷界面完成。鉴于其漫长的筹备周期与深厚的技术积淀,GEMs有望成为Gemini发展历程中的一座重要里程碑,尽管其正式亮相或需克服一些时间上的挑战。

image.png

记忆与个性化回应的升级体验

Gemini引入的记忆/个性化回应功能,通过侧边栏的专属区域直观呈现,紧随响应图标之后。该功能允许用户设定定时提醒,例如每日新闻摘要的自动推送,与GEMs的智能化结合,将极大提升用户体验的个性化与便捷性。

预设提示词的智能优化

在Gemini的设置中,用户将发现一处名为“个性化回复”的特别区域,它实质上是预设提示词功能的升级版。这一特性虽与ChatGPT的记忆功能有所相似,但预计将在细节上做出更多创新调整,以满足用户对于高效、精准对话体验的追求。

录音与Google Photos的深度融合

Gemini还计划推出录音功能与Google Photos的直接集成,为用户带来前所未有的交互体验。录音功能虽尚处于开发初期,但已展现出将语音信息转化为.wav文件的潜力;而Google Photos的集成则近乎完成,用户将能直接从云端相册中挑选照片发送,遗憾的是,目前尚不支持批量上传功能。

image.png

即时提示词增强的神秘面纱

界面中的隐藏按钮预示着即时提示词增强功能的存在,其具体效果虽未完全揭晓,但仅凭其外观与命名,已足以激发用户对智能化、动态化交互的无限遐想。

此外,Gemini在Android平台上的持续深耕与iOS版本Beta测试的招募,预示着跨平台体验的全面升级。同时,未来版本的Gemini还可能引入实时响应的开关选项,赋予用户更多控制权。

综上所述,Gemini作为谷歌AI技术的集大成者,正以前所未有的速度拓展其功能边界与应用场景,引领人工智能领域的新一轮变革。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章