跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

通义万相 2.1 文生视频技术解析与多显卡性能测试

综述由AI生成通义万相 2.1 文生视频模型的技术升级,包括 VAE 和 DiT 架构优化及中文文字生成能力。提供了开源仓库获取方式,并对比了 RTX3090 与 RTX4090 在相同参数下的生成耗时,结果显示 4090 速度更快。适合自媒体创作及视频生成需求。

二进制发布于 2026/4/6更新于 2026/5/2327 浏览
通义万相 2.1 文生视频技术解析与多显卡性能测试

什么是文生视频?

文生视频(Text-to-Video)是利用人工智能技术,通过文本描述生成视频内容的一种创新技术。类似于图像生成技术,文生视频允许用户通过输入简单的文本描述,AI 模型会自动将其转化为动态视频。这种技术广泛应用于创作、广告、教育等领域,为内容创作者提供了新的创作方式和灵感。

通义万相 2.1 文生视频

阿里旗下通义万相宣布推出 2.1 版本模型升级,视频生成、图像生成两大能力均有显著提升。

在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。

图片描述

开源仓库代码

图片描述

开发者可通过 GitHub(https://github.com/Wan-Video/Wan2.1)、HuggingFace(https://huggingface.co/Wan-AI )平台直接下载并进行体验测试。

图片描述

对于没有特殊手段或者懒得下载的用户,也可以选择使用云服务平台进行一键部署。

部署与使用

进入应用市场找到对应的文生视频服务,查看部署详情。

图片描述

图片描述

点击部署按钮,选择配置并启动应用。

图片描述

选择配置后等待实例创建完成。

图片描述

图片描述

启动应用后,界面布局与文生图类似。

图片描述

性能测试

分别使用 RTX3090 和 RTX4090 进行测试。

RTX3090

Prompt:Create a short video of a peaceful park scene during the golden hour. The sun is setting behind large, lush trees. The camera slowly pans through the park, capturing people walking, jogging, and sitting on benches. Birds are chirping, and there's a gentle breeze rustling through the leaves. The atmosphere is calm, serene, and warm, with soft golden light filtering through the branches.

Negative Prompt: Avoid any dark or eerie elements, such as stormy weather, gloomy skies, or ominous shadows. Do not include any loud or chaotic activities, like running or aggressive movements. The scene should remain calm and pleasant without any distractions, such as animals or people involved in unsettling behavior.

参数默认。

图片描述

RTX4090

Prompt: Create a lively street market scene during the daytime. The market is busy with people walking around, vendors selling fresh produce, flowers, and handmade goods. There's colorful signage, and the air is filled with the sounds of lively chatter, distant music, and the rustle of fabric. The sunlight is bright and warm, creating a vibrant atmosphere. People are smiling, interacting, and enjoying the lively energy of the market.

Negative Prompt: Do not include any empty spaces or desolate areas. Avoid gloomy or rainy weather, and keep the environment full of life and color. There should be no dark or deserted streets, and no aggressive or unsettling behavior. The scene should remain friendly and welcoming, with no negative or chaotic energy.

参数默认。

图片描述

虽然上面没有具体的时间显示,但是从开机时长来看,4090 要比 3090 至少快 5-10min,这里推荐使用 4090 进行创作。

总结

本文介绍了阿里旗下的通义万相 2.1 文生视频,视频生成效果十分优质。若想要测试部署可以选择云服务平台,显卡选择 4090 最佳。文生视频在自媒体创作中往往起到了一个不可忽视的作用,适当的应用获取可以提高短视频流量。

目录

  1. 什么是文生视频?
  2. 通义万相 2.1 文生视频
  3. 开源仓库代码
  4. 部署与使用
  5. 性能测试
  6. RTX3090
  7. RTX4090
  8. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Mac Mini M4 本地部署大模型实战:Ollama 与 Llama 环境搭建
  • Cogito-v1-preview-llama-3B 开源模型部署与特性介绍
  • DREAM 数据库:脑电与梦境配对研究的新里程碑
  • 昇腾 NPU 部署 Llama 2 模型:性能测试与优化实战
  • TrendRadar 本地部署指南:构建个人 AI 热点情报系统
  • VR 音游音符轨道系统开发实录与原理解析
  • 豆包与国产 AI 工具实战推荐:四本提升应用能力的书籍
  • Spring AI MCP Server 集成与使用指南
  • 使用XML-Agent构建智能决策系统快速入门指南
  • MySQL 事务详解:ACID 特性、引擎支持与提交方式
  • Topaz Photo AI v1.3.3 汉化便携版:图片降噪与无损放大工具
  • Claude Code 教程:从安装部署到 SpringBoot 项目实战
  • 基于 Unity 2022 与 UXR SDK 的 AR 消消乐游戏开发实践
  • ComfyUI Manager:AI 绘画工作流的高效管理工具
  • OpenClaw Zero Token 基于浏览器自动化实现大模型免 Token 调用
  • 使用文心一言为智能体设计稳定调用工作流的提示词
  • 基于 Python 的外卖餐饮平台可视化数据分析系统
  • Android 从基础到架构进阶全方面面试题解析
  • 通达信主力建仓指标源码
  • 飞算 JavaAI 核心功能与多场景应用解析

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online