亚马逊推出从文本生成图像的工具
亚马逊宣布进军人工智能领域 ,旨在根据文本描述生成图像。在 AWS re:Invent 大会期间,该公司推出了 Titan Image Generator。
值得注意的是,与公众可访问的平台(例如 OpenAI 的 DALL-E 或 Midjourney)不同,Titan Image Generator 并不是作为可在网络上立即使用的应用程序呈现的,它被定位为一个旨在用于开发人员。,通过 Amazon Bedrock 进行预定访问。
正如该公司官方博客所言,Amazon Titan Image Generator是广告、电子商务、媒体和娱乐等各个行业客户的宝贵工具。
这种创新的解决方案可以轻松创建逼真的工作室品质图像或使用自然语言提示增强现有图像。通过这种方式,它可以在大量图像中进行快速构思和版本控制,同时降低成本。
面向不同行业,更多可能
这种新型人工智能的一个令人着迷的特点是它能够通过文本命令生成图像。然而,它的范围更进一步:一旦创建了主要对象,用户可以灵活地继续编辑材质,而不会影响原始创建。
在AWS会议期间,展示了一个令人印象深刻的例子:在纯色背景上人工创造一只鬣蜥。随后,人工智能面临的挑战是去除现有背景并用森林环境取而代之。
Titan 图像生成器能够上传照片并请求各种变体、修改其大小,甚至根据用户偏好添加或删除特定部分中的详细信息。
独家英语预赛阶段
在AWS网络平台上,值得注意的是,Titan Image Generator仍处于初步阶段,至少到目前为止,生成图像的文本命令必须用英文输入。
目前尚未透露亚马逊是否计划为这种人工智能启用理解其他语言方向的能力。这项新提案的值得注意之处在于它不是作为可公开访问的应用程序或网站,而是作为人工智能模型。
亚马逊希望开发人员利用这个工具来创建自己的基于文本的图像生成器。该公司强调,除了用于训练人工智能的数据之外,程序员还可以自由地在他们的项目中使用自定义数据集。
版权声明:本文由用户上传,如有侵权请联系删除!