2024-05-06 11:46 雷小军

智谱AI正在研发对标OpenAI Sora的国产文生视频大模型,预计年内发布

以下文章节选自丨钛媒体


5月6日消息,钛媒体AGI获悉,估值超200亿的国内 AI 大模型独角兽公司「智谱AI」正在研发对标美国Sora的高质量文生视频模型,预计最快年内发布。

“文生视频目前处于一个快速发展的阶段,预计今年将是文生视频大模型的爆发期。国内公司在文生视频技术方面的客户需求非常多样,从电影拍摄到短视频、游戏制作等。智谱也将通过使用更高质量的数据和更大的参数,开发高质量的文生视频产品。”一位智谱 AI 内部人士表示。

智谱 AI 是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。钛媒体AGI了解到,对于智谱AI 当前的综合能力水平,内部人士称“性能接近海外顶级模型”。

智谱 AI 内部人士坦言,对标Sora的文生视频模型发展突破的关键主要包括技术路线选择、训练所用的高质量视频素材语料两个方面。

“技术路线上,Transformer与Diffusion的结合架构如何在效率和效果上进行优化,如何解决连续帧之间的抖动问题,如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景,都是技术上需要解决和通过大量实验试错的问题;数据集方面,此前 Sora 被评价模型对摄影术语(跟拍、平移、镜头切换)的理解有限,所生成的视频后期还需要对视频素材进行超分处理。公司会注重更全面的优质数据版权与使用。”上述人士称。

2023年3月,智谱AI推出千亿开源基座对话模型ChatGLM系列,并在过去一年内完成4次升级,于2024年1月推出GLM4系列。

同时,基于全自研基座大模型的能力,智谱AI亦已构建了AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

“最新基座大模型GLM-4,整体性能相比上一代大幅提升,逼近 GPT-4。如果做一个比较量化的对比,我们当时对标的对象是GPT-4,其性能的对比可以在很多方面上做到 95%左右。在比如中文对齐的任务下,我们甚至可以略微超过它。根据最新的海外伯克利Arena Hard 基准测试,GLM排名仅次于GPT-4 Turbo 和Claude 3 Opus,在国内外模型中均处于领先地位。”智谱内部人士称。

张鹏在今年3月透露,截至2023年底,智谱 AI 已拥有超2000家生态合作伙伴、超1000个大模型规模化应用,另有200多家企业跟智谱AI进行了深度共创,覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。

智谱ChatGLM-6B开源大模型目前全球累计下载量已经超过了1300万,GitHub Star星数达到5万,整个量级超过了Meta Llama两个版本的总和。智谱AI已获得全球最受欢迎的开源机构的第五名,是全球唯一一家上榜的中国机构和组织,“力压了包括OpenAI、谷歌,还有微软”。

截至目前,智谱AI估值超过200亿元人民币,是国内AI领域独角兽唯一超过了10亿美元的企业。截止目前,智谱AI以产业型投资方式,已经投资、入股超过13家 AI 产业链初创公司。

雷小军 工作人员

AI奇点网打杂的