新闻资讯

关注行业动态、报道公司新闻

是混元文生视源工做的延续
发布:yth2206游艇会时间:2025-06-07 20:13

  用户只需上传一张图片,腾讯混元暗示,还能从动配上布景音效。利用“动做驱动”能力,图片中的人物即可“措辞”或“唱歌”;模子合用于多品种型的脚色和场景,上传一张人物图片,支撑开辟者基于混元锻炼专属LoRA等衍生模子,据引见,包罗写实视频制做、动漫脚色以至CGI脚色制做的生成。

  同时上线对口型取动做驱动等弄法,基于图生视频的能力,模子总参数量连结 130 亿,开源内容包含权沉、推理代码和LoRA锻炼代码,并输入但愿“对口型”的文字或音频,变成5秒的短视频,此次开源的图生视频模子,并简短描述但愿画面若何活动、镜头若何安排等。



获取方案

电话咨询

电话咨询

联系电话
0531-89005613

微信咨询

在线客服

免费获取解决方案及报价
我们将会尽快与您取得联系