OpenAI周一正式推出了人工智能(AI)视频生成模型Sora,这距离OpenAI首次公开预览这款产品已过去了10个月时间。AI视频生成模型Sora可以根据文本提示生成逼真的视频。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。根据OpenAI的介绍,Sora将于周一开始向美国及其他市场的ChatGPT付费用户开放。
Sora的发布是OpenAI为期12天的产品直播活动的一部分。该公司上周推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。
在周一的演示中,OpenAI展示了Sora的新功能。该公司表示,该工具不仅可以通过文本提示生成视频,还能够基于静态图片和已有视频创建新的内容。例如,用户可以上传一段视频剪辑,Sora会生成扩展这个片段的后续画面,使视频变得更长、更完整。
与此同时,Sora还包含一个名为Storyboard的选项,允许用户通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成。Sora还提供了一个功能,让用户可以浏览其他人创作的视频集锦。
OpenAI表示,Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。自今年2月首次预告Sora以来,OpenAI便开始向电影制片厂、媒体高管以及经纪公司示好,OpenAI还允许一些艺术家、知名演员和导演试用该服务。
不过,Sora在早期测试中显示出明显的局限性。据悉,在早期测试中,Sora存在“多余肢体”的问题,并对物理现象的理解不够准确。此外,与图像生成器或聊天机器人相比,Sora生成每个视频所需的时间和算力明显更多。
OpenAI首席执行官奥尔特曼表示,初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,ChatGPT Pro订阅用户可以无限制的“较慢”生成高分辨率视频,以及500个快速生成的视频。除了视频生成的数量和速度会有限制之外,Sora在欧洲大部分地区也无法使用,因为欧洲的科技监管更严格。
尽管Sora是世界上第一个视频生成模型,但自它问世以来已有多个同类产品与之竞争,比如Google的Veo、快手可灵、Runway的Gen-3、字节跳动PixelDance等。而这些可以快速地制作视频的工具正在颠覆影视行业,人们已经开始探索如何将这项技术应用于电影制作。