当前位置: 杭州网 - > - 杭网原创 - > - 原创新闻
国内首个角色扮演视频模型落地 杭州AI产业迎新突破
发布时间:2025-12-16 16:57:55 Tue  来源:杭州网杭州通客户端

12月16日,阿里发布新一代视频生成模型——通义万相2.6系列,面向专业影视制作和图像创作场景实现全面升级。该模型是国内首个支持角色扮演功能的视频生成模型,在音画同步、多镜头生成、声音驱动等方面实现突破,被业内认为是目前全球功能最为齐全的视频生成模型之一。

作为杭州AI产业的重要代表,今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,在权威大模型评测集LMArena上,其图生视频能力位居国内第一。此次升级发布的万相2.6在画质、音效和指令遵循等方面进一步提升,单次视频生成时长达到国内最高的15秒,并新增角色扮演和分镜控制能力,可一键生成单人、多人及人与物合拍的视频,自动完成多镜头切换,满足专业影视级创作需求。

在技术层面,万相2.6通过多模态联合建模,对输入参考视频中的主体情绪、姿态、视觉特征以及音色、语速等声学信息进行联合学习,在生成阶段实现从画面到声音的高度一致性。目前,该模型已支持单人和多人的角色表演,并可将用户的简单提示词自动转化为多分镜脚本,生成叙事连贯、镜头切换流畅的视频内容。

在应用场景上,万相2.6不仅面向影视制作、广告设计和短剧创作等专业领域,也显著降低了普通用户的创作门槛。用户上传个人视频并输入提示词后,模型可自动完成分镜设计、角色演绎和画面配音,短时间内生成具有电影质感的短片,实现“人人都能当导演”。

在开放与落地方面,即日起,所有用户均可直接在万相官网体验万相2.6,企业用户还可通过阿里云百炼调用模型API,将能力快速集成至业务系统中。据悉,千问App也将于近期上线该模型,并提供更丰富的玩法,进一步拓展视频生成模型在学习、创作等场景中的应用边界。

值得一提的是,千问App近日宣布将学习、文档等核心能力向用户免费开放,在高校学生群体中引发广泛关注。PPT制作、写作润色、翻译和资料检索等高频功能的免费化,被视为对“会员墙”模式的一次突破,进一步体现了杭州AI企业在推动技术普惠方面的探索。

作者:记者 陈文婧  编辑:颉月娇
杭州网·杭州新闻门户网站