- 7 月 5 日,2024 世界人工智能大会的视频生成前沿技术论坛现场。图:世界人工智能大会公众号
【黑马财经】「如果类比语言模型,目前的视频生成有点像 GPT-3 左右的时代,距离到 GPT-3.5 版本的爆发点可能还有半年左右的时间,但应该不远了。」7 月 5 日,新加坡南洋理工大学助理教授刘子纬在 2024 世界人工智能大会的视频生成前沿技术论坛上表示。
刘子纬主要研究计算机视觉、计算机图形学等,领导搭建了数个国际知名的基准数据库,例如 CelebA 和 DeepFashion 等。
2022 年 11 月,OpenAI 推出基于 GPT-3.5 模型的聊天应用 ChatGPT,掀起全球新一波 AI 浪潮。2024 年 2 月,OpenAI 展示了名为 Sora 的文生视频模型,让视频生成领域迅速爆火。不过,半年过去,Sora 依旧没有对外开放使用,其展示的视频被艺术团队披露包含大量人类后期特效,也让其惹上夸大宣传的争议。