ITCOW牛新网 4月9日消息,近日,谷歌在Google Next大会上宣布,将通过其AI应用平台Vertex AI向公众开放Gemini 1.5 Pro的公共预览版。这一新版本不仅赋予了Gemini“耳朵”,以帮助用户处理音频内容,更在性能上超越了谷歌自家更大的模型——Gemini Ultra。

谷歌推出Gemini 1.5 Pro公共预览版

Gemini 1.5 Pro现在可以直接上传音频文件进行分析,或者上传财报电话会议录音或视频来进行总结。这一功能将大大方便用户处理和理解大量音频信息。

谷歌推出Gemini 1.5 Pro公共预览版

尽管Gemini Ultra功能更为丰富且能理解长指令,但Gemini 1.5 Pro在处理速度上更胜一筹。此外,Gemini 1.5 Pro还可以理解复杂的指令,并且无需对模型进行微调,进一步提升了用户体验。

谷歌推出Gemini 1.5 Pro公共预览版

与此同时,谷歌的辅助Gemini生成图像的文生图模型Imagen 2也进行了更新,新增了图片修复和扩充功能。这使用户可以轻松地添加或移除图像元素,满足更多样化的图像处理需求。

谷歌推出Gemini 1.5 Pro公共预览版

为了保障图像的来源和真实性,谷歌还为Imagen模型的所有图片提供了数字水印功能“SynthID”。这一功能在图像中添加了一个用户不可见的防伪标识,但可以通过检测工具来确认其来源。

值得注意的是,谷歌还计划在公开预览中尝试将AI响应与谷歌搜索结果结合。这将有助于利用最新的情报进行解答,进一步提升AI的实用性和准确性。