【电报解读】阿里巴巴将开源旗下文生视频模型万相2.1！机构称高质量数据集和训练数...

股票王 · 发表于 2025-02-26 00:36:05

阿里巴巴将开源旗下文生视频模型万相2.1！机构称高质量数据集和训练数据版权得到重视下，优质语料库产业链价值凸显，相关公司或创造新的营收增长点，这家公司在该细分领域版权储备业内领先

电报内容

【阿里巴巴将开源旗下文生视频模型万相2.1】财联社2月25日电，从知情人士处获悉，阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月，阿里旗下万相刚宣布推出2.1版本模型升级，视频生成、图像生成两大能力均获得提升。在视频生成方面，万相 2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力，支持无限长1080P视频的高效编解码，首次实现了中文文字视频生成功能，登上VBench榜单第一。 (新浪科技)

电报解读

一、视频生成赛道重要参与者先后发布重磅产品

近期，视频生成赛道重要参与者先后发布重磅产品，持续点燃AI视频热潮。2024年12月3日，腾讯混元大模型正式上线视频生成功能并实现开源，参数量达130亿，并在综合评测中呈领先趋势。

2024年12月10日，OpenAI正式发布Sora视频生成系列产品。同日，字节跳动视频生成模型PixelDance已在豆包电脑版正式开启内测，部分用户已开通体验入口。内测页面显示，用户每日可免费生成十支视频。PixelDance视频生成模型于9月底首次发布，最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测。

12月14日，PikaLabs正式发布了2.0版本视频生成工具。12月17日，Google发布Veo2视频生成模型，理论支持生成4K高清视频。12月19日，快手可灵AI宣布基座模型再升级，视频生成推出可灵1.6模型，效果大幅提升。据介绍，新模型将在多维度实现提升：提示词响应大幅提升，画面更稳定、更生动。

二、出版公司有望通过版权出海的方式开辟新业务增长点

据智谱工程副总裁介绍，当前国内文生视频大模型的突破关键主要有两点。技术路线上，仍有诸多技术问题需要解决和通过大量实验试错，包括如何在满足高分辨率的同时实现高一致性的长序列生成，如何获取高质量数据泛化到更多更细节的真实场景等。数据集上，此前Sora被评价模型对摄影术语（跟拍、平移、镜头切换）的理解有限，所生成的视频后期还需要对视频素材进行超分处理，因此，更全面的优质数据版权与使用，成为高质量的文生视频模型的关键点。

银河证券认为，当前AI政策密集出台，高质量数据集和训练数据版权问题得到重视，未来优质训练数据库的价值将得到凸显。出版行业公司大多拥有丰富的电子化的图文资源，这可以作为国内外大模型训练的重要数据集。出版行业公司在版权和IP上的资源优势有望助力其作为海内外AI大模型研发的重点助力。

三、相关上市公司：掌阅科技、视觉中国

掌阅科技在文学和阅读领域的版权储备业内领先，这些中文语料可以用于网文行业垂类模型训练。公司与字节目前主要在数字阅读的版权、内容生产、广告商业化等多方面开展了深度合作。

视觉中国拥有数以亿计的专业级且获版权许可的优质图片、视频音乐素材，是市场上少有的高质量素材的图像库之一。公司将充分发挥海量、高质量、版权合规的数据集价值，与算力、算法战略合作伙伴一起合作打造专有的垂类AIGC视觉图像模型，共同探索全新的商业模式。

帐号		自动登录	找回密码
密码			立即注册

【电报解读】阿里巴巴将开源旗下文生视频模型万相2.1！机构称高质量数据集和训练数...

浏览过的版块