【旭才科技】4 月 16 日消息,在今日举办的第三届中国 AIGC 产业峰会上,生数科技产品副总裁、Vidu 产品负责人廖谦透露,下周将全球发布即新的 Vidu Q1 模型,该大模型优化旨在大幅提升内容创作的可控性,尤其在位置控制、运动布局和音频生成上,以更贴近人类审美和自然法则。
廖谦表示,Vidu Q1 模型将推动多模态大模型时代的变革,将极大增强个性化内容生成能力,对社交、游戏、VR/AR 等领域产生深远影响。

生数科技 (北京生数科技有限公司) 成立于 2023 年 3 月,是一家专注于多模态生成式大模型与应用产品开发的高科技企业,核心团队来自清华大学人工智能研究院。
生数科技首创了基于 Transformer 的 U-ViT 架构,融合了 Diffusion 模型与 Transformer 的优势,支持多模态任务的统一建模。该架构在 2023 年开源的 UniDiffuser 模型中首次应用,成为全球首个基于 Diffusion Transformer 的多模态扩散模型,比 Stable Diffusion 3 采用的 DiT 架构领先一年。
基于 U-ViT 架构,生数科技 2024 年 4 月发布的视频大模型 Vidu 可一键生成 16 秒 1080P 高清视频,具备多镜头切换、高时空一致性和物理世界模拟能力,性能对标 OpenAI 的 Sora。