7月30日,作为Sora全球首个挑战者,且是国内首个纯自研的视频大模型Vidu(www.vidu.studio)正式上线。生数科技宣布,目前Vidu无需申请,用户直接用邮箱注册即可上手体验。
生数科技作为国内最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。自4月底首次亮相以来,Vidu凭借媲美Sora的文生长视频能力,迅速在国内外引起广泛关注。此次Vidu全面开放了文生视频、图生视频两大功能,提供4s和8s两种时长选择,分辨率最高达1080P。
在效果上,Vidu不仅延续了四月份展示的高动态性、高逼真度、高一致性等优势,还在上线版本中新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等特色能力。同时,在影响用户体验的推理速度层面,Vidu实现了业界最快的实测推理速度,生成一段4秒片段只需30秒。而市面上的主流AI视频工具在生成4秒左右的视频片段时,用户通常需要等待1到5分钟,甚至更长。 Vidu的高效推理不仅为用户带来了接近于无缝的创作体验,更短的处理时间还意味着它能够轻松应对大量用户的需求,提供个性化的服务。
众所周知,视频生成产品的开发周期长且费用高昂。而从发布到上线仅仅三个月,生数科技就完成了对Vidu的快速迭代,实现了高质量的视频生成效果,这离不开Vidu研发团队在模型高效训练方面积累的工程化经验。密集而快节奏的模型训练任务,不仅需要大规模的算力,还需要从数据准备到模型训练、再到模型推理的全链路保障。