国内首个角色扮演视频模型落地杭州AI产业迎新突破

当前位置：杭州网 - > - 杭网原创 - > - 原创新闻

发布时间：2025-12-16 16:57:55 Tue 来源：杭州网、杭州通客户端

12月16日，阿里发布新一代视频生成模型——通义万相2.6系列，面向专业影视制作和图像创作场景实现全面升级。该模型是国内首个支持角色扮演功能的视频生成模型，在音画同步、多镜头生成、声音驱动等方面实现突破，被业内认为是目前全球功能最为齐全的视频生成模型之一。

作为杭州AI产业的重要代表，今年9月，阿里率先在国内发布音画同步的视频生成模型万相2.5，在权威大模型评测集LMArena上，其图生视频能力位居国内第一。此次升级发布的万相2.6在画质、音效和指令遵循等方面进一步提升，单次视频生成时长达到国内最高的15秒，并新增角色扮演和分镜控制能力，可一键生成单人、多人及人与物合拍的视频，自动完成多镜头切换，满足专业影视级创作需求。

在技术层面，万相2.6通过多模态联合建模，对输入参考视频中的主体情绪、姿态、视觉特征以及音色、语速等声学信息进行联合学习，在生成阶段实现从画面到声音的高度一致性。目前，该模型已支持单人和多人的角色表演，并可将用户的简单提示词自动转化为多分镜脚本，生成叙事连贯、镜头切换流畅的视频内容。

在应用场景上，万相2.6不仅面向影视制作、广告设计和短剧创作等专业领域，也显著降低了普通用户的创作门槛。用户上传个人视频并输入提示词后，模型可自动完成分镜设计、角色演绎和画面配音，短时间内生成具有电影质感的短片，实现“人人都能当导演”。

在开放与落地方面，即日起，所有用户均可直接在万相官网体验万相2.6，企业用户还可通过阿里云百炼调用模型API，将能力快速集成至业务系统中。据悉，千问App也将于近期上线该模型，并提供更丰富的玩法，进一步拓展视频生成模型在学习、创作等场景中的应用边界。

值得一提的是，千问App近日宣布将学习、文档等核心能力向用户免费开放，在高校学生群体中引发广泛关注。PPT制作、写作润色、翻译和资料检索等高频功能的免费化，被视为对“会员墙”模式的一次突破，进一步体现了杭州AI企业在推动技术普惠方面的探索。

作者：记者陈文婧编辑：颉月娇