外媒体验Sora:猴子长出鹦鹉尾巴 OpenAI称还有很长路要走

最新信息

外媒体验Sora:猴子长出鹦鹉尾巴 OpenAI称还有很长路要走
2024-02-23 19:32:00
有关文生视频模型Sora是否能理解人类物理世界,近期一直是讨论的热点,一段由Sora生成的视频,似乎可以作为参考。
  2月23日,有外媒体验后报道称,由记者提供提示词后,OpenAI帮助生成的演示视频中可以看到明显的局限性。该段视频的提示词为:“俯视图,一只鹦鹉飞过青翠的哥斯达黎加丛林,然后降落在树枝上,与一群猴子一起吃一块水果。黄金时刻,35毫米胶片。”
  在10秒的视频中,一只鹦鹉飞过丛林,乍看起来没有明显异常。但再看一遍时,却能发现很多问题——鹦鹉飞过猴子时翅膀扭曲了;虽然提示词写的是一只,但却生成了多只鹦鹉;一只猴子在最后的画面中似乎有着鹦鹉的尾巴。
  视频生成能力有了明显飞跃,但仍有很长的路要走
  “你会在该片段的不同阶段发现一些奇怪的动作,”OpenAI Sora团队研发负责人Bill Peeble表示,“但Sora能够对如此复杂的场景进行建模这一事实表明,视频生成能力有了明显的飞跃。”
  OpenAI表示,Sora距离黄金时期还有很长的路要走。
  在Sora亮相之时,OpenAI就表示,目前Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
  Meta首席科学家杨立昆(Yann LeCun)、AI科学家马库斯(Gary Marcus)等近期也都指出Sora并不能理解人类物理世界。杨立昆认为,仅仅根据提示词生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同, “这里存在‘巨大’的误导”。
  马库斯对于Sora则表示:“如果你只看一秒钟(的视频片段),你会觉得它太神奇了。但如果你仔细看看,就会发现(这个人工智能系统)仍然不太懂常识。”
  Sora视频并非即时生成,何时公众发布仍未知
  与文生图相比,Sora需要更长的时间和计算来生成每段视频。
  OpenAI没有给出Sora处理每个请求需要多长时间,但Peebles表示“绝对不是即时的”,“在等待这些东西运行时,你可以去吃点东西”。
  OpenAI目前仅向评估关键的危害或风险的红队成员(red teamers),以及一些视觉艺术家、设计师和电影制作人提供访问权限,以获取有关如何改进该模型以对创意专业人士最有帮助的反馈。OpenAI也没有公布训练Sora的数据等基础细节以及向公众发布的日期。
  OpenAI发言人Natalie Summers表示,Sora没有设定发布时间表,是因为公司希望确保它能降低与选举相关的安全风险。2024年世界上很多地区都将进行选举,许多政治家、虚假信息研究人员和技术专家,都担心超现实人工智能的深度伪造技术被用来欺骗选民。因此,现在推出功能强大的新型视频生成工具时机并不是很好。
(文章来源:澎湃新闻)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

外媒体验Sora:猴子长出鹦鹉尾巴 OpenAI称还有很长路要走

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml