视频大模型Vidu全面开放使用:30秒生成,支持动漫风格
视频大模型Vidu全球上线:30秒生成动漫风格视频
7月30日,国产纯自研视频大模型Vidu(www.vidu.studio)正式全球上线,向用户开放文生视频、图生视频两大核心功能。Vidu提供4秒和8秒两种时长选择,分辨率最高可达1080P,用户仅需30秒即可生成一段4秒片段。生数科技推出了Vidu免费版和标准版,免费版支持生成4秒视频,标准版每月7.99美元,可生成4秒和8秒视频,并支持超清、商用、超清后去除水印等功能。
Vidu不仅能够实现常见的写实风格,还新增了动漫风格选项。这一功能不仅保持了动漫风格的一致性,还显著提高了画面的稳定性,解决了其他视频生成工具在“动漫化”过程中常见的画面跳变和风格突变问题。无论是科幻、西部、浪漫还是动画类型的电影,Vidu都能生成符合对应风格的画面片段。此外,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。
在“图生视频”板块中,Vidu上线了角色一致性功能,用户可以上传人像图或自定义的角色图,并通过文字描述指定该角色在任意场景中做出任意动作。这一功能简化了视频制作流程,节省了设计和调整角色形象的时间,同时提供了高度的创作自由度。Vidu还能理解和生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可提高视频的可控性。
生数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究院,首席科学家朱军为清华大学教授。朱军表示,Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。
Vidu的上线标志着视频生成技术的新突破,将为用户提供更加便捷、高效的视频制作体验。