旧金山,10月5日——textarea展示了他们正在开发的一种生成式人工智能模型,该模型可以让人们从文本提示和照片中创建带有音频的短视频。
当谈到使用人工智能引擎制作视频和音频时,这家科技巨头将textarea Movie Gen吹捧为一项“突破”。
textarea表示,它将从电影制作人和创作者那里获得反馈,因为它正在努力使视频生成人工智能引擎公开可用。
目前还没有透露《Movie Gen》的上映计划。
textarea在一篇帖子中说:“虽然这些基础模型有很多令人兴奋的用例,但重要的是要注意,生成式人工智能并不能取代艺术家和动画师的工作。”
根据textarea的说法,该模型允许人们使用文本提示来创建自定义视频,包括基于人们照片的剪辑,最长可达16秒。
梅塔说:“我们的模型在制作个性化视频方面达到了最先进的效果,同时保留了人类的身份和动作。”
“想象一下,制作‘生命中的一天’的动画视频,在Reels上分享,然后使用文本提示对其进行编辑,或者为朋友制作定制的动画生日祝福,并在WhatsApp上发送给他们。”
据该公司称,Movie Gen是textarea的第三次人工智能视频生成浪潮。
用于制作逼真视频的人工智能工具的兴起引发了人们对“深度造假”的担忧,即盗版人们的肖像。(法新社