Midjourney轻松实现高质量图片和视频生成

优质文章学习记录

10 Apr 2026 — 6 min read

上周六，我在Midjourney平台上批量生成了大量图片。它的生成能力远超国内主流的同类工具，无论是效率还是画面质量都让人惊叹。在商业应用方面，Midjourney已经展现出强大的落地价值。不论是电商产品摄影、平面设计，还是表情包、服装电商图片的制作，它都能轻松胜任，效果非常出色。
Midjourney有两种好用的，一个是midjourney(图片更写实)，另外一个是niji(图片偏向二次元)。

提示词基础设计
人物+在干什么+在哪里+动作+色彩、灯光、氛围、质感、艺术风格(王家卫、皮克斯风格)。

分享一下Midjourney命令
–ar 设置图片宽高比（aspect ratio） --ar 16:9 (电影画面，如果是手机竖屏就是9:16)
–s 风格化程度（stylize），数值越高风格越强，默认100，范围0-1000（V5） --s 250
–v 选择模型版本（version），如V5、V4等 --v 5
–q 质量（quality），影响生成速度和消耗，常用0.25、0.5、1、2 --q 2
–seed 随机种子，控制生成的随机性，便于复现 --seed 12345 （用作垫图，固定人物形象）
–no 排除某些元素 --no text
–chaos 混乱度，数值越高结果越不可预测，范围0-100 --chaos 50
–iw 图片权重（image weight），用于混合图片和文字时调整图片影响力 --iw 2
–style 选择风格（如4a、4b、4c，V4模型专用） --style 4b
–uplight 使用轻度放大算法（upscale light） --uplight
–upbeta 使用beta放大算法（upscale beta） --upbeta
–tile 生成可平铺的无缝纹理 --tile
–niji 使用Niji动漫风格模型 --niji
–weird 增加奇异度，数值越高越怪异，范围0-3000 --weird 500
–video 生成过程视频（仅部分版本支持） --video
–hd 高清模式（部分老版本支持） --hd

我的生图示例

提示词

Real photo shot,a corner on the bathroomcabinet,green,the background is the lkea bathroom minimalism and light background, by conducting professional photography, this photo featres ashallow depth of field,focused on the middleground, shot with a Nikon camera, the overalcolor is a champagne tone, window light,2:00noon,very strong light atmosphere, the overallsoft and bright, multi-angle, 16k HD photography --ar 3:4 --s 500

真正的照片拍摄，在浴室橱柜的一角，绿色，背景是lkea浴室极简主义和灯光背景，通过专业摄影，这张照片具有足够的景深，聚焦于中间地带，用尼康相机拍摄，整体颜色为琥珀色，窗光，中午2:00，光线非常强烈，整体柔和明亮，多角度，16k高清摄影

视频生成可以使用pika + runway，pika的可调整性更高(镜头上下左右移动、画面的人物移动、运动)，但稳定性较差(也就是说它生成的视频细节不太稳定，比如一艘船上面的货物可能在镜头移动时不稳定，而船体的运动是没有太大问题)，runway生成的视频稳定性更高。

视频生成流程

先写大纲，再拆分故事，分段出每个镜头，使用Midjourney生成各个镜头使用的图片素材，再使用pika + runway，也可以使用国内的即梦、可灵或者豆包生成各个镜头的视频，最后使用剪映或万星喵影连接视频。

我的一个例子

大纲（故事内容）

下午两点，天气阴沉即将大雨，一个20岁做旗袍的男孩，他名叫徐天，他去了一家小卖部，购买了一盒饼干、一个面包、一瓶可乐，当这个男孩购买完商品后推开小卖部的玻璃门走出了小卖部，走向了一道居民小巷子，然后他来到了家门口，脱掉了被雨淋湿的衣服，用毛巾擦了几下淋湿的头发，当他回头看下窗户时看见一个背着大包的一位摄影的同龄男孩，这位同龄男孩正在窗外避雨，而且这位男孩的外貌和徐天长得一模一样，此时徐天感到非常诧异，当他推开家门时，发现这位避雨的男孩已经不见了，他奔跑出去找这位避雨的男孩，跑了几段路来到的一个十字路口仍然没有找到避雨的男孩，最后他满是疑惑的回到家里。

镜头1：

真正的照片拍摄，下午两点，天气阴沉即将大雨，一个20岁的男孩，留着平头短发，身形偏瘦，穿着蓝色短袖和黑色短裤，他名叫徐天，他走向一家玻璃门小卖部，背影，16k高清摄影,王家卫导演风格

The real photo was taken at 2pm, with gloomy weather and imminent heavy rain. A 20-year-old boy with short, flat hair and a slim figure, wearing a blue jacket and black pants, named Xu Tian, walked towards a glass door convenience store with a back view, 16k high-definition photography, and Wong Kar wai directing style

镜头2：

真正的照片拍摄，一个20岁的男孩，留着平头短发，身形偏瘦，穿着蓝色短袖和黑色短裤，在小卖部购买了一盒饼干、一个面包、一瓶可乐，16k高清摄影,王家卫导演风格

The real photo shoot is of a 20-year-old boy with short hair and a slim figure, wearing blue short sleeved shirts and black shorts. He purchased a box of cookies, a bread, and a bottle of cola from a convenience store, filmed in 16k high-definition, in the style of director Wong Kar wai -ar 16:9 --seed 3246270350

…
@500佰

VS Code+GitHub Copilot避坑指南：从安装配置到最佳实践的完整手册

VS Code + GitHub Copilot 深度驾驭手册：从避坑到精通的实战心法如果你是一名 Visual Studio Code 的用户，并且对那个传说中能“读懂你心思”的 AI 编程伙伴 GitHub Copilot 感到好奇，甚至已经跃跃欲试，那么这篇文章就是为你准备的。我们不再重复那些泛泛而谈的“AI 将改变编程”的论调，而是直接切入核心：如何在你最熟悉的 VS Code 环境中，真正驯服 Copilot，让它从一个偶尔“胡言乱语”的助手，变成你编码流中如臂使指的高效组件。我们将聚焦于从安装配置的第一分钟开始，到融入你日常工作流的每一个细节，过程中你会遇到哪些真实的“坑”，以及如何优雅地跨过它们。这不是一篇简单的功能罗列，而是一份融合了配置技巧、心智模型和实战策略的深度指南。 1. 环境搭建与初始配置：奠定高效协作的基石在兴奋地敲下第一行代码之前，一个稳固且经过优化的起点至关重要。许多初次使用者遇到的挫折，

Llama-3.2-3B开箱体验：Ollama部署+多语言对话实测

Llama-3.2-3B开箱体验：Ollama部署+多语言对话实测 1. 快速了解Llama-3.2-3B Llama-3.2-3B是Meta最新推出的轻量级多语言大模型，专门针对对话场景进行了优化。这个3B参数的模型在保持较小体积的同时，提供了相当不错的文本生成能力，特别适合本地部署和快速响应场景。与之前版本相比，Llama-3.2-3B有几个明显优势： * 多语言支持更好：在中文、英文、法文、德文等多种语言上都有不错的表现 * 对话优化：专门针对聊天场景进行了指令微调，回答更加自然 * 部署简单：通过Ollama可以一键部署，无需复杂配置 * 资源友好：3B参数规模在消费级硬件上也能流畅运行 2. 环境准备与快速部署 2.1 准备工作部署Llama-3.2-3B前，确保你的设备满足以下要求： * 内存：至少8GB RAM（推荐16GB） * 存储：需要约2GB空间存放模型文件 * 系统：支持Windows、macOS、Linux主流系统 2.2 一键部署步骤

本地离线部署whisper模型进行话音转写，亲测可用

在本地搭建 Whisper 语音转写环境比较简单，以下是详细步骤，适用于 Windows、macOS 和 Linux 系统，其中windows系统亲测可用：一、基础环境准备 1. 安装 Python 确保安装 Python 3.8+： * 下载地址：python.org/downloads * 安装时勾选 "Add Python to PATH"（关键步骤） 2. 验证 Python 安装打开命令行（CMD/PowerShell/ 终端），输入：python --version # 或 python3 --version（macOS/Linux），显示版本号即表示安装成功。二、

LLaMA Factory 核心原理讲解

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了LLaMA Factory 核心原理讲解，希望能对学习大模型的同学们有所帮助。文章目录 * 1. 前言 * 2. 核心模块讲解 * 3. SFT流程讲解 1. 前言在之前的文章主要介绍了LLaMA Factory的操作方法，其中包括： * LLaMA Factory多卡微调的实战教程 * 基于华为昇腾910B和LLaMA Factory多卡微调的实战教程 * LLaMA Factory添加新模型template的实战解析 * LLaMA Factory在预测阶段时添加原有问题的实战代码 * 详解大模型多轮对话的数据组织形式但也有同学提出疑问

Read more

VS Code+GitHub Copilot避坑指南：从安装配置到最佳实践的完整手册

Llama-3.2-3B开箱体验：Ollama部署+多语言对话实测

本地离线部署whisper模型进行话音转写，亲测可用

LLaMA Factory 核心原理讲解