通义万相

2个月前更新 219 0 0

通义万相是阿里云通义大模型旗下的 AI 视觉生成模型，具备文生图、图生图、文生视频、图生视频等功能，支持多种艺术风格和比例选择，拥有自研架构、性能卓越，在权威评测中表现出色，于 2025 年 2 月 25 日全面开源，适用于影视、广告、设计等多个领域。

所在地：

中国

语言：

zh

收录时间：

2025-03-07

打开网站手机查看

AI绘画工具 AI视频工具 # 图生图 # 图生提示词 # 图生视频 # 文生图 # 文生视频

通义万相

通义万相

通义万相是阿里云通义大模型旗下的 AI 视觉生成模型，具备文生图、图生图、文生视频、图生视频等功能，支持多种艺术风格和比例选择，拥有自研架构、性能卓越，在权威评测中表现出色，于 2025 年 2 月 25 日全面开源，适用于影视、广告、设计等多个领域。

通义万相

功能特点

图像生成
- 文生图：用户输入文字描述，能生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等多种风格图像。
- 图生图：基于用户上传图片，进行二次创作或风格迁移。
- 涂鸦作画：用户简单涂鸦，AI 可将其转化为完整艺术作品。
- 虚拟模特与写真：能生成各种风格和姿态的虚拟人物模特图像，还可将用户照片转换为不同风格艺术写真。
视频生成
- - 文生视频：输入文本描述，如复杂的场景、人物动作、情节等，可生成 720P/30 帧的高清视频，支持中英文多语言输入。
  - 图生视频：可将任意图片转化为动态视频，按照上传图像比例或预设比例生成，通过提示词控制视频运动。

技术优势

架构创新：采用自研 3D 因果 VAE 和时空全注意力 DiT 架构，全新的时空全注意机制让模型能更准确模拟现实世界复杂动态，还引入参数共享机制，提升性能同时降低训练成本。
性能卓越：在权威评测 VBench 中以 86.22% 总分登顶，超越 Sora、Pika 等模型，在运动幅度、多对象生成、空间关系等关键能力表现出色。
显存优化：设计创新的视频编解码方案，通过拆分视频并缓存中间特征，实现显存使用与原始视频长度无关，支持无限长 1080P 视频的高效编解码。

应用场景

个人创作：普通用户可快速生成个性化头像、壁纸或社交媒体配图。
设计领域：为平面设计师、插画师提供创意灵感和素材参考。
营销推广：企业能生成独特的营销图片、视频，提升品牌视觉效果。
教育领域：在美术教育中作为辅助工具，帮助学生理解不同艺术风格和创作技巧。
影视动画：在影视创作、动画制作中，可用于生成角色原型、创意短片等。

网站上的服务均为第三方提供，与本站无关。请用户注意自行甄别服务。

©️版权声明：若无特殊声明，本站所有文章版权均归阿饼AI原创和所有，未经许可，任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容，或在非我站所属的服务器上建立镜像。否则，我站将依法保留追究相关法律责任的权利。

数据统计

相关导航

Pika

Pika 是由热门 AI 初创公司 PiaLabs 推出的革命性视频生成和编辑工具，可根据字幕和静态图像生成和编辑各种风格的视频，如 3D 动画、动漫、卡通和电影等。2024 年因 “捏爆人物” 风格动画受到关注。

海螺AI

海螺AI是一款功能全面的AI对话工具，支持多模态交互、快速阅读长文本、智能搜索与数据查询等，能为用户提供高效、便捷的智能化服务。

Upscayl

免费开源的跨平台 AI 图像放大增强工具，它利用先进的人工智能算法（如 Real-ESRGAN 等）和 Vulkan 架构，可将低分辨率的图片进行高质量的放大、锐化、降噪、超分辨率重建等处理，且支持批量操作，能满足摄影后期、数字艺术、历史图像修复等多种场景的需求。

声动视界SoundView

声动视界（SoundView AI）是讯飞旗下的 AI 平台，具备多语种翻译与配音、字幕编辑、短视频脚本生成等功能，具有高效便捷、多语言支持、音色丰富等优势，可应用于跨境电商、国际营销等多个领域。

牛学长

牛学长是一个基于 AI 技术的智能多媒体处理软件平台，提供视频修复、图片处理、智能抠像、AI 数字人等多种功能，具有操作便捷、跨平台使用等特点，广泛应用于自媒体、电商、培训等领域。

ReRoom

ReRoom AI 是一个 AI 驱动的室内设计平台，用户上传房间相关图像后，能利用其多种功能探索超 20 种设计风格，快速生成逼真渲染图以实现空间定制和创作。

XCole

XCole 是一款集AI问答写作和AI绘图于一体的创作工具，它提供AI学术文章生成、AI智能写作、AI论文、公文写作等文字和AI绘图、AI绘画、AI动画生成的创作服务，助您快速生成优质文章和精彩绘画作品。

Raphael AI

世界首个免费无限制AI图像生成器,Raphael AI 是一款以 FLUX.1 - Dev 为驱动，具备多样生成能力、高级文本理解、快速生成速度等特点，有着适用场景广泛、完全免费无注册及使用限制且无水印等优势，但也存在中文理解、图像分辨率和作品保存等局限性的 AI 图像生成工具。

暂无评论

none

暂无评论...