开云2026世界杯中国官网 进入群众第一梯队!京东开源JoyAI-Echo框架 长视频生成“所念念即所得”期间到来

6月3日,京东告示开源JoyAI-Echo长音视频生成框架。JoyAI-Echo搞定了行业三大痛点:扮装难厚实一致、音色变化难适度、视频生成速率慢,终结了长视频生成“又快又好”。此外,JoyAI-Echo的“边聊边改”模式,让视频创作从"静态生成"酿成"动态诱骗"。

JoyAI-Echo在种种视频创作、数字东谈主直播、品牌营销、西席和游戏实质坐褥等界限有弘远的运用后劲,它的推出,象征着京东在长视频生成界限终结重要突破,进入群众第一梯队。
四大技巧立异搞定长视频生成三浩劫题
在AI视频界限,十几秒短视频的生成质地越来越熟习,但行业头疼的瓶颈依然存在:难以向分钟级长视频突破。AI视频一但拉到这一时长,就会出现以下问题:合并个扮装,在不同镜头里长得不雷同;言语东谈主的音色忽高忽低致使一会儿变声;生成速率慢到离谱,等几分钟致使半小时智商出终结。
以上问题,径直导致AI长视频停留在"玩物"阶段,很难信得过插足坐褥、创造价值。JoyAI-Echo的出现,绝对毒害这个僵局。JoyAI-Echo有四项技巧立异:
一是跨模态音视频回首库,让扮装再也不"变脸"。这亦然JoyAI-Echo最枢纽的突破。模子框架内置了一个有益的回首库,能在多镜头生成过程中,合手续保存并调用扮装的外不雅特征和言语东谈主音色信息。在长达5分钟的视频里,扮装身份、视觉形象和声息音色王人能保合手高度一致,斗鱼体育DOUYU中国官网再也不会出现"合并个东谈主演着演着酿成另一个东谈主"的麻烦情况。
二是回首运转后磨砺,速率径直普及 7.5 倍。研发团队立异冷落了回首运转后磨砺历程,聚拢 SFT、跨模态 RLHF 和 Distribution Matching Distillation(DMD)技巧,大幅普及了生成质地,更终结了惊东谈主的推理加快。
其中,仅DMD一项技巧就带来了约7.5倍的速率普及,让长视频生成从"等半天"酿成"秒出片"。
三是加入智能 "导演助理"——Director Agent,让长视频第一次终结 "对话式裁剪"。JoyAI-Echo 不再是 "输入请示词,一次性出终结" 的传统器用。你用当然语言说需求,开云世界杯(中国)有限公司它会自动帮你拆分红脚本、扮装、场景和镜头。那儿不惬意,径直用对话的形状告诉它修改,它只重荣达成有问题的局部镜头,无须重跑整条视频,让长视频创作从 "静态生成" 酿成了 "动态诱骗"。
四是轻量化及时超分,高清输出不卡顿。为了空闲专科实质坐褥的需求,JoyAI-Echo配套了有益的及时超分模块,支撑两档分袂率普及(736×1280→1152×1920,736×1280→1472×2560)。模块通过单步超分就能生成高分袂率视频和精良化音频,即使在流式蔓延的拘谨下,也能保合手厚实的高清发达。
各名办法全面跳动行业“AI长视频期间"到来
为了客不雅评估JoyAI-Echo的性能,研发团队基于100个故事、3000个镜头构建了长音视频生成评测集,从多个维度进行了全面测试。终结披露,JoyAI-Echo在跨镜头一致性、视频质地、文本一致性和语音实质准确率等通盘中枢办法上王人赢得了跳动发达,其汉文音实质准确率更是高达0.8646,大幅跳动行业其它同类模子。
在与行业同类模子对比中,用户以为JoyAI-Echo音频质地偏好的比例为81.7%,请示词恪守偏好为80.6%,视觉好意思学偏好为63.6%,IP一致性偏好为59.4%。
JoyAI-Echo的推出,意味着AI视频生成的"长视频期间"来了。它为假造故事创作和动漫制作、数字东谈主实质坐褥和直播、品牌营销视频快速迭代、互动西席课件生成等界限带来了全新可能,将大幅优化行业资本成果。JoyAI-Echo也预示着改日东谈主类不错像聊天雷同,合手续创作、修改和完善长视频实质,让高一致性、高画质、可交互的视频生成,信得过走进每一个实质创作家的职责历程。
京东告示,JoyAI-Echo的代码与权重已一谈开源,当今名目页和GitHub代码仓库还是认真上线,供成立者和创作家体验:
https://github.com/jd-opensource/JoyAI-Echo
https://echo-team-joy-future-academy-jd.github.io/Echo-LongVideo-Page/开云2026世界杯中国官网
滚球app中国官网下载入口