国内AI技术再突破Vidu视频大模型一键生成高清内容

  • 数码
  • 2024年09月23日
  • 4月28日消息,随着Sora在全球掀起AI视频生成热潮,国内科技界也迎来了新的突破。近日,一段由国内AI技术生成的视频短片受到了广泛关注,该视频源自生数科技与清华大合发布的最新视频大模型Vidu。 据官方介绍,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令

国内AI技术再突破Vidu视频大模型一键生成高清内容

4月28日消息,随着Sora在全球掀起AI视频生成热潮,国内科技界也迎来了新的突破。近日,一段由国内AI技术生成的视频短片受到了广泛关注,该视频源自生数科技与清华大合发布的最新视频大模型Vidu。

据官方介绍,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令,如“画室里的一艘船驶向镜头”,Vidu便能生成效果逼真、镜头连贯的高清视频。其整体质感足以与全球领先的Sora模型相媲美。

除了能生成复杂且细节丰富的场景外,Vidu还具备虚构场景及想象超现实主义画面的能力,同时能更好地理解和生成熊猫、龙等富有中国文化特色的形象。这一创新功能的引入,使得Vidu在国内外AI视频生成领域中脱颖而出。

了解到,生数科技团队在机器学习和多模态大模型领域有着深厚的积累。正是基于这些长期的技术沉淀,团队在短短两个月内便突破了长视频表示与处理的多项关键技术,成功研发并推出了Vidu视频大模型。

公开资料显示,生数科技成立于2023年3月,其核心团队来自清华大学人工智能研究院,并汇聚了来自北京大学及阿里巴巴、腾讯、字节跳动等知名科技公司的技术精英。截至2024年3月,公司员工总数已超过70人,其中研发人员占比近90%,彰显了公司强大的研发实力。

生数科技自成立以来,便致力于打造可控多模态通用大模型。去年3月,公司开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser,进一步巩固了其在行业内的领先地位。同时,公司在短短一年时间内完成了三轮融资,总计数亿元人民币,估值迅速攀升,已成为目前国内多模态大模型中估值最高的初创公司之一。

生数科技的快速发展和Vidu模型的成功发布,不仅展示了国内AI技术的创新实力,也为全球AI视频生成领域注入了新的活力。未来,随着技术的不断进步和应用场景的拓展,我们有理由相信AI将在视频创作领域发挥更加重要的作用。

猜你喜欢