首页 > 新车性能 > 新车性能 > 美团LongCat-Video正式发布并开源,支持高效长视频生成

美团LongCat-Video正式发布并开源,支持高效长视频生成

发布时间:2025-10-27 16:00:41
10月27日,美团 LongCat 团队发布并开源视频生成模型 LongCat-Video。团队称,该模型在统一架构下同时支持文本生成视频(Text-to-Video)、图像生成视频(Image-to-Video)与视频续写等基础任务,并在内部与公开基准(含 VBench)测试中取得开源范围内的领先结果。
 
图片
图片
▲LongCat-Video视频生成模型在文生、图生视频基础任务上达到开源SOTA(资料图)
技术报告显示,LongCat-Video基于 Diffusion Transformer(DiT)架构,采用以“条件帧数量”区分任务的方式:文本生成视频不输入条件帧,图像生成视频输入1帧参考图,视频续写依托多帧前序内容,无需额外模型改造即可覆盖三类任务。
为提升长时序生成能力,模型在预训练阶段引入原生的视频续写任务。团队表示,模型可稳定生成分钟级长视频,并在跨帧时序一致性与物理运动合理性方面做了针对性优化,以减少色彩漂移、画质衰减与动作断裂等问题。
在效率方面,模型结合块稀疏注意力(BSA)与条件 token 缓存机制,以降低长序列推理冗余;据称在处理93帧及以上序列时,能够在效率与生成质量间保持稳定平衡。针对高分辨率、高帧率场景,模型采用“二阶段粗到精(C2F)+ BSA + 蒸馏”的组合策略,报告称推理速度较基线提升至约10.1倍。
参数规模方面,LongCat-Video基座模型约136亿参数。评测覆盖文本对齐、图像对齐、视觉质量、运动质量与整体质量等维度;团队称在文本对齐与运动连贯等指标上表现突出,并在公开基准 VBench 等测试中取得较好成绩。
 
图片
LongCat 团队将此次发布定位为其“世界模型(World Model)”方向探索的一步,相关代码与模型已对外开源。上述结论与性能表述均引自团队技术报告与发布材料。

新车性能更多>>

铭凡MS-S1 MAX桌面AI超算中心测评 国补叠加限时直降,这篇华为平板上车攻略不容错过 苹果M系列芯片只用五年便逼近AMD在笔记本市场的占有率 2025年度国内旗舰销量排名出炉,苹果才是真正赢家 一加Nord 6手机跑分曝光:骁龙8s Gen 4芯片、12GB内存 荣耀Magic8 Pro Air评测:Pro在前 Air在后 淘宝天猫将上线售后AI假图识别模型,治理AI造假骗退款 天猫超市联手菜鸟年货节再提速,杭州成为全国首个全城闪购4小时达城市 谷歌前CEO:欧洲不投钱,就用中国的喽 Meta新模型要来了,Llama 4锅谁来接?1300多位作者联合报告来了 249元起的工业级风扇,有多强? 苹果在iOS 26.3测试新的App Store广告样式,用户更难以分辨 荣耀方飞透露Magic8 Pro Air青海湖电池有黑科技 用户猛增、估值暴涨,一款App爆火又消失的120小时 马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训 来伊份年度预亏1.7亿元,拟用不超10亿元买理财 专家称零食品牌业绩分化明显 马斯克称特斯拉基本完成AI5芯片设计 已开始开发下一代AI6 迟到了16年,利比亚商人收到2010年订购的一批诺基亚手机 2025年Q4中国手机市场出货量苹果第一 全年海外手机市场荣耀增速第一 苹果连续三年稳居全球第一!iPhone 17系列创下历史记录 矩阵营销是什么?为什么越来越多品牌选择矩阵营销? 仅用10天?Anthropic最新智能体Cowork的代码竟然都是Claude写的 一加Turbo 6搭载9000mAh巨量电池 2699元起!荣耀Power2登场:超强防水、两天续航、电梯信号满格 摩托罗拉新设备曝光:AI感知伴侣造型亮眼,手机赛道要变了? 苹果2026年首款新品!AirPods Pro 3马年特别款发布 1899元 一周手机畅销榜更新:华为Nova15排名第九,第一名继续遥遥领先 2019-2025年埃安维修手册埃安UT 埃安V 埃安RT 埃安S MAX 埃安Y 埃安S 噪音大油耗高,为何我还推荐领克01? 2026款雷克萨斯LX美哭!白色车身太绝,气场全开谁能拒绝?