快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。
该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。
年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。
而“视界一粟YiSu”则是基于团队自研的视频生成大模型技术,并没有止步于DiT。该团队融合LLM和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到优化,打造视频生成的方案。