2月2日 消息:谷歌正在推出一系列关于生成人工智能的更新,包括一个新的文本到图像工具。ImageFX的不同之处在于它有一个具有“表达芯片”功能的界面。
谷歌表示,除了 ImageFX 的首次亮相之外,它还改进了 MusicFX 和 TextFX。该公司声称,它对 MusicLM 模型进行了升级,包括更快地生成音乐和更高质量的音频,以及新功能。生成的歌曲现在可以持续长达70秒。至于TextFX,Google 推出了可用性更新,旨在改善导航和整体用户体验。
ImageFX 生成的图像和使用 MusicFX 制作的音频都带有 SynthID 标记,这是一种数字水印,旨在表明这些图像和音频是使用 AI 伪造的,尤其是当它们出现在搜索或 Chrome 中时。 ImageFX 创建的内容还将包含 IPTC 元数据。据谷歌称,这将为“人们在遇到我们的人工智能生成的图像时提供更多信息”
目前,美国、肯尼亚、新西兰和澳大利亚的人们可以在人工智能测试厨房中尝试这些新的和改进的工具。目前仅提供英文版本。
Imagen2模型为 ImageFX 的新图像生成功能提供支持。它还推动了 Bard、Search、Ads、Workspace 中的 Duet AI 和 Vertex AI 中新的生成式 AI 选项的发展。谷歌表示,Imagen2有助于提供迄今为止最高质量的人工智能生成图像。该公司指出,该模型有助于保持图像无伪影,并改进了此类工具迄今为止一直在努力解决的图像生成领域。
此外,谷歌表示,它已在 Imagen2训练数据安全方面进行了“重大投资”,同时添加了防护栏,以“限制暴力、攻击性或露骨内容等有问题的输出,并应用过滤器来降低生成指定个人图像的风险。”“这是由于模型生成逼真图像的能力得到了升级。该公司声称还进行了“广泛的对抗性测试”,以检测和打击潜在的问题和有害内容。
从今天开始,Bard 中的 Gemini Pro将得到更广泛的使用。现在可以在230个国家和地区以北的40多种语言使用。谷歌表示大多数国家的人们都可以免费用Bard生成英文图像,这些图像将包含 SynthID 水印。