股民大家庭

 找回密码
 立即注册

扫一扫,访问微社区

搜索
查看: 6490|回复: 0
打印 上一主题 下一主题

【电报解读】阿里巴巴将开源旗下文生视频模型万相2.1!机构称高质量数据集和训练数...

[复制链接]
跳转到指定楼层
1
发表于 2025-02-26 00:36:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
阿里巴巴将开源旗下文生视频模型万相2.1!机构称高质量数据集和训练数据版权得到重视下,优质语料库产业链价值凸显,相关公司或创造新的营收增长点,这家公司在该细分领域版权储备业内领先

电报内容

【阿里巴巴将开源旗下文生视频模型万相2.1】财联社2月25日电,从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。在视频生成方面,万相 2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。 (新浪科技)

电报解读

一、视频生成赛道重要参与者先后发布重磅产品

近期,视频生成赛道重要参与者先后发布重磅产品,持续点燃AI视频热潮。2024年12月3日,腾讯混元大模型正式上线视频生成功能并实现开源,参数量达130亿,并在综合评测中呈领先趋势。

2024年12月10日,OpenAI正式发布Sora视频生成系列产品。同日,字节跳动视频生成模型PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。PixelDance视频生成模型于9月底首次发布,最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测。

12月14日,PikaLabs正式发布了2.0版本视频生成工具。12月17日,Google发布Veo2视频生成模型,理论支持生成4K高清视频。12月19日,快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型,效果大幅提升。据介绍,新模型将在多维度实现提升:提示词响应大幅提升,画面更稳定、更生动。

二、出版公司有望通过版权出海的方式开辟新业务增长点

据智谱工程副总裁介绍,当前国内文生视频大模型的突破关键主要有两点。技术路线上,仍有诸多技术问题需要解决和通过大量实验试错,包括如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景等。数据集上,此前Sora被评价模型对摄影术语(跟拍、平移、镜头切换)的理解有限,所生成的视频后期还需要对视频素材进行超分处理,因此,更全面的优质数据版权与使用,成为高质量的文生视频模型的关键点。

银河证券认为,当前AI政策密集出台,高质量数据集和训练数据版权问题得到重视,未来优质训练数据库的价值将得到凸显。出版行业公司大多拥有丰富的电子化的图文资源,这可以作为国内外大模型训练的重要数据集。出版行业公司在版权和IP上的资源优势有望助力其作为海内外AI大模型研发的重点助力。

三、相关上市公司:掌阅科技、视觉中国

掌阅科技在文学和阅读领域的版权储备业内领先,这些中文语料可以用于网文行业垂类模型训练。公司与字节目前主要在数字阅读的版权、内容生产、广告商业化等多方面开展了深度合作。

视觉中国拥有数以亿计的专业级且获版权许可的优质图片、视频音乐素材,是市场上少有的高质量素材的图像库之一。公司将充分发挥海量、高质量、版权合规的数据集价值,与算力、算法战略合作伙伴一起合作打造专有的垂类AIGC视觉图像模型,共同探索全新的商业模式。



上一篇:2025-02-26 上证早知道 (星期三)
下一篇:【电报解读】算法升级后,宇树科技又有新动作!机构称万台级别的量产将带动人形机...
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

今日股市|网站地图|股民学校|手机版|小黑屋|股民大家庭 |网站地图24小时在线客服

GMT+8, 2025-4-30 06:16 , Processed in 8.189281 second(s), 23 queries , Gzip On.

Powered by 股民大家庭

© 2007-2019 www.gupiao168.com


快速回复 返回顶部 返回列表