【hacker送书第15期】AI绘画精讲与AIGC时代游戏美术设计:从入门到精通

【hacker送书第15期】AI绘画精讲与AIGC时代游戏美术设计:从入门到精通

文章目录

😊前言

随着人工智能技术的飞速发展,AI绘画已经成为了一个备受瞩目的领域。在这个背景下,北京大学出版社推出了一系列关于AI绘画的优秀图书,其中就包括了《AI绘画精讲:Stable Diffusion从入门到精通》和《AIGC时代:游戏美术设计与AI绘画应用从入门到精通》。这两本书都是为了帮助读者全面了解和掌握AI绘画的精髓,推动人工智能技术在艺术领域的应用发展。

AI绘画精讲:Stable Diffusion从入门到精通💕

内容简介

Stable Diffusion是一款非常受欢迎的 AI 绘画与设计软件。AI绘画和传统绘画有什么不同、AI 绘画的基本逻辑是什么、如何让 AI 绘画软件为我们工作、如何生成符合要求的作品,本书将一一进行解析。
本书共 13 章内容。首先循序渐进地介绍了 AI 绘画的主要工具,Stable Diffusion 的部署和 安装,五种AI绘画模型解析,文生图、图生图等基础功能及插件 Controlnet 的使用;然后通过实战案例详细介绍了 Stable Diffusion 在各个行业中的使用,包括游戏、电商、插画、建筑等;最后对 AI 绘画与设计的问题和未来展望进行了思考。
本书将为读者打开AI艺术革命的大门,发掘其在艺术领域中的无限可能性。通过阅读本书,读者不仅可以深入了解 AI 绘画工具 Stable Diffusion 的创新魅力,还可以了解其技术原理、使用技巧和应用方法。无论是艺术家、设计师、技术爱好者还是相关领域的专业人士,都能从本书中获得启发与指导,从而将 AI 与绘画的结合推向更高的境界。
在这里插入图片描述

获取方式

Read more

文心一言是什么?这款百度推出的AI助手都有什么功能?

文心一言是什么?这款百度推出的AI助手都有什么功能?

文章首发于:AI产品库AIProductHub ;作者:陌路遥 1 文心一言是什么? 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,于2023年3月16日正式发布,同年8月31日向全社会全面开放。作为文心大模型家族的新成员,它能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。 文心一言的技术基础源于百度在人工智能领域20多年的深耕。它从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强三大技术优势。在人工智能"芯片-框架-模型-应用"四层结构中,百度是全球为数不多进行全栈布局的公司,而文心一言正处于模型层这一核心位置。 截至2024年11月,文心一言用户规模已达到4.3亿,文心大模型日均调用量超过15亿次,较2023年增长超30倍。这一数据充分证明了其在市场上的广泛接受度和影响力。 2 文心一言的主要功能和特点 2.1 核心功能概述 文心一言具备五大核心能力:文学创作、商业文案创作、数理逻辑推算、中文理解、

GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法

GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法

GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法 前言 GitHub Copilot 作为 AI 编程助手,正在彻底改变开发者的编码体验。本文将针对中文开发者,深度解析如何在 VS Code 中高效使用 Copilot,涵盖基础设置、中文优化、核心功能详解,并提供多个实战场景配置模板。 一、安装与配置全流程 1. 完整安装步骤 1. 扩展安装 * 打开 VS Code → 点击左侧活动栏的 Extensions 图标(或按 Ctrl+Shift+X) * 搜索框输入 GitHub Copilot → 点击安装按钮 2. 账号授权 * 安装完成后右下角弹出通知 → 点击 Sign in

Youtu-VL-4B-Instruct基础教程:llama.cpp backend日志分析定位推理瓶颈

Youtu-VL-4B-Instruct基础教程:llama.cpp backend日志分析定位推理瓶颈 1. 引言 当你兴致勃勃地部署好Youtu-VL-4B-Instruct,准备体验这个轻量级多模态模型的强大能力时,有没有遇到过这样的情况:上传一张图片,问个简单问题,结果等了半天才出结果,甚至直接超时了? 这可能是很多开发者第一次使用这个模型时会遇到的困惑。明明硬件配置不低,模型也只有4B参数,为什么推理速度这么慢?问题到底出在哪里? 今天,我就带你深入Youtu-VL-4B-Instruct的推理引擎内部,通过分析llama.cpp backend的日志,一步步定位推理瓶颈。这不是一篇枯燥的技术文档,而是一个实战指南,我会用最直白的方式告诉你: * 怎么看懂那些复杂的日志信息 * 怎么判断是CPU、GPU还是内存的问题 * 怎么找到拖慢速度的“罪魁祸首” * 怎么根据日志信息调整配置,让推理速度飞起来 无论你是刚接触这个模型的新手,还是已经部署但遇到性能问题的开发者,这篇文章都能给你实实在在的帮助。我们直接进入正题。 2. 理解Youtu-VL-4B-

【2024最全Seedance 2.0解析】:基于17篇顶会论文+3家AIGC大厂内部技术文档的架构逆向推演

第一章:Seedance 2.0 双分支扩散变换器架构解析 Seedance 2.0 是面向高保真视频生成任务设计的新型双分支扩散变换器(Dual-Branch Diffusion Transformer),其核心创新在于解耦时空建模路径:一条分支专注帧内空间语义重建,另一条分支显式建模跨帧时序动态。该架构摒弃了传统单流Transformer对时空维度的粗粒度联合编码,转而通过协同门控机制实现分支间细粒度特征对齐。 双分支协同机制 空间分支采用分层ViT结构,以16×16 patch嵌入输入,逐级下采样并保留局部细节;时间分支则将同一空间位置在多帧中的token沿时间轴堆叠,经轻量级时序注意力模块处理。两分支输出通过Cross-Gating Fusion(CGF)模块融合,其门控权重由共享的上下文感知投影器动态生成。 关键组件实现 class CrossGatingFusion(nn.Module): def __init__(self, dim): super().__init__() self.proj_s = nn.Linear(dim, dim) # 空间分支门控投影