美国人工智能领军企业OpenAI的首席技术官米拉·穆拉蒂日前接受了《华尔街日报》的独家专访,详细披露了公司即将发布的文本转视频人工智能工具——Sora。这款令人瞩目的技术产品预计将于今年年底与公众见面,并因其革命性的视频生成能力而备受关注。
Sora在展示中表现出了非凡的实力,仅需几分钟就能从文本提示转化为一段20秒、720P分辨率的高质量视频,其高效和逼真程度令人叹为观止。穆拉蒂透露,未来版本的Sora还将集成语音功能,以实现更为完整的视听内容创作。
在训练数据方面,穆拉蒂强调OpenAI使用了公开可用的数据和授权数据来培养Sora模型,使其能够识别并理解多种物体和动作,进而根据输入的文本指令构建出连贯且细节丰富的视频场景。
对于安全性和可靠性问题,OpenAI正在通过红队测试手段严格把关,确保Sora不会产生潜在漏洞、偏见或其他不良后果。同时,为了应对版权和伦理争议,公司正积极探讨如何在视频输出中标记元数据来源,以便用户鉴别视频的真实性。
在谈及Sora对电影行业的潜在影响时,穆拉蒂指出,这项技术有望大幅削减布景和拍摄成本,已引起包括著名制片人泰勒·佩里在内的业界人士的强烈关注。尽管如此,OpenAI也十分注重与艺术家及行业内部专家合作,在推动技术创新的同时设置合理的规范与限制,以保障创造性工作的价值和人类角色的重要性。
访谈中,穆拉蒂多次重申,OpenAI将以极其谨慎的态度部署Sora,旨在确保这一强大工具能在促进艺术创作与维护社会利益之间取得平衡,引领视频制作行业步入一个全新的时代。随着Sora的发布临近,一场由人工智能驱动的视频制作革命已然蓄势待发。