一次性搞懂 AIGC:22 个核心概念解析
梳理了人工智能领域的 22 个基础概念,涵盖 AI 工作原理、大模型、开源、自然语言处理等理论基础;介绍了 ChatGPT、Midjourney、文心一言等常用工具;分析了 AIGC 在文本、图片、视频及市场分析中的营销应用;探讨了多模态 AI、AGI 的未来趋势以及提示词工程师等新职业。旨在帮助读者快速理解 AIGC 术语及其在行业中的实际价值。

梳理了人工智能领域的 22 个基础概念,涵盖 AI 工作原理、大模型、开源、自然语言处理等理论基础;介绍了 ChatGPT、Midjourney、文心一言等常用工具;分析了 AIGC 在文本、图片、视频及市场分析中的营销应用;探讨了多模态 AI、AGI 的未来趋势以及提示词工程师等新职业。旨在帮助读者快速理解 AIGC 术语及其在行业中的实际价值。


AIGC(Artificial Intelligence Generative Content,即人工智能生成内容)正在重塑内容创作生态。随着常识能被机器识别、艺术被重新定义,广告营销等行业正迎来生产变革。本文梳理 22 个 AI 基础概念,结合案例帮你理清常见术语。
以 ChatGPT、Midjourney 为首的 AIGC 软件出现至今,不过短短半年时间,已经从方方面面浸入到人们的生活里,与此同时,大量专业术语涌入我们视野。
AI、AIGC、AGI、Bing AI,ChatGPT……这些字母缩写到底是什么?有什么区别?和广告营销有什么关系?
AI,全称 Artificial Intelligence,人工智能。顾名思义,让机器发展出像人一样的智能,可以看到、听到、思考、判断,然后根据经验作出决策。
而 AI 之所以能够走向现实生活,影响到多个行业领域的生产工作,离不开三个重要技术的支撑:深度学习、神经网络以及生成式对抗网络(GAN)。
神经网络是一种模拟人脑神经元连接的算法模型。你可以把神经网络想象成一个大脑。就像大脑由许多神经元相互连接构成,神经网络也由许多'节点'或'神经元'通过'链接'相互连接。这些链接就像我们大脑中的神经连接,可以传递和处理信息。
如果说神经网络像一个普通大脑,深度学习则是一个更加'聪明'的大脑。在这个'大脑'里,神经元被组织成许多层,这就像大脑的不同区域处理不同的任务一样。每一层都在学习和处理数据的不同特征或部分。这就使得深度学习能够处理非常复杂的问题,比如识别图像或理解自然语言。
GAN 技术可以说是推动这次 AIGC 热潮的关键技术,有了它,AI 才能够生成逼真的图像、音频和文本。
你可以把 GAN 的工作原理想象成是一个艺术家和艺术评论家的竞赛。艺术家(生成器)的工作是创造看起来真实的艺术作品,而艺术评论家(判别器)的任务是判断这个作品是否真的来自真正的艺术家,还是来自我们的 AI 艺术家。
艺术家(生成器)开始时可能不太擅长制作逼真的作品,而评论家(判别器)也可能并不擅长识别真伪。但是,随着他们不断的竞争,艺术家的作品变得越来越逼真,评论家的判断能力也越来越强。
在这个不断生成和对抗的过程中,AI 逐渐学会了如何创作看起来非常真实的作品。
AI 大模型是一种机器学习模型。它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手和图像识别软件都会用到 AI 大模型。
这里的「预训练」,可以理解为像学生学习知识一样,机器也需要通过学习和训练来获取相关的知识和技能,来完成各种任务。AI 预训练大模型可以通过不同领域的大量训练,掌握知识和技能。
由 OpenAI 公司开发的模型 GPT 就是一种大型语言模型,也是预训练模型的一种,它能够自动生成各类文本,比如新闻报道、小说,也可以回答问题、写文章、进行对话。GPT 是目前自然语言处理领域最为先进的自然语言生成模型之一。
开源可以被理解为分享和合作的一种方式。在计算机编程中,当一个项目是开源的,意味着它的源代码是公开的,任何人都可以查看,修改和分享。
想象你正在做一份蛋糕,如果你将蛋糕的配方公开,让所有人都可以制作这个蛋糕,甚至可以根据自己的口味对配方进行修改和优化,那么这个蛋糕的配方就可以被认为是'开源'。
自然语言处理 (NLP) 就像是教计算机理解和使用人类语言的一种技术。举个例子,当你对手机说:'打开天气应用,查看明天的天气。'这就涉及到了自然语言处理。你的手机需要理解你的指令——这是什么意思,你想做什么,然后才能执行正确的动作。
自然语言处理需要用到很多开源的工具和软件,它们能够帮助研究员处理语言数据,大大降低开发的门槛,让自然语言处理技术的进步的速度变快。
是指由 AI 自动创作生成的内容(AI Generated Content),即 AI 接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。
打个通俗点的比方,AIGC 就像一支马良神笔,拥有的无尽创造力。这支笔的特别之处在于,是由 AI 打造的。来自 AI 的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。AIGC 的出现,就像是打开了一个全新的创作世界,为人们提供了无尽的可能性。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。
AIGC 是 AI 大模型,特别是自然语言处理模型的一种重要应用;ChatGPT 则是 AIGC 在聊天对话场景的一个具体应用。
可以把 AIGC 看作是一个大的范畴,而 ChatGPT 是其中一个类别的小应用。
AIGC 可以生成的内容很多,具体的种类和范围可能随着技术的发展而不断扩大。目前,一些常见的 AIGC 内容包括:
ChatGPT 是由 OpenAI 开发的一款大型预训练语言模型,就像一个会聊天的机器人。
它可以理解你说的话,并给出回答。这个机器人在互联网上读了很多书、文章,学到了很多知识,所以可以回答各种问题,甚至进行深入的讨论。不过,ChatGPT 的理解与人类不同,人类理解事物时,有意识、经验和情感等多个层次的参与,而 ChatGPT 只是通过分析和模拟大量的文本数据来'学习'如何合理地回应。

Midjourney 是由美国旧金山的一家独立研究实验室创立的图片类 AIGC 应用程序,我们可以通过语言描述来生成图片。比如,输入一个苹果,它就会为你生成出一张苹果的图片。

图片生成类 AI 大模型,可以在给定的任何提示词下生成图像,并支持根据关键词和图片检索。与 Midjourney 相比,生成图像的结果更可控。

Bing AI 就是搭载了 GPT-4 的 Bing 浏览器,它能够更好地理解用户意图,提供更加智能化、个性化的搜索和服务体验。

文心一言是百度全新一代知识增强大语言模型,能够与人对话互动、回答问题、协助创作,具备更强的中文理解能力。

文心一格是百度基于文心大模型的文生图系统,搭建的图片生成类 AI 大模型,可以根据用户输入的指令提示,生成相应的图片。

随着 AIGC 的浪潮在现实中涌动,多个行业迎来了自我更迭的新机遇,广告行业也开始拥抱 AIGC。我们可以从文本应用、图片应用、视频应用、市场分析的四个层面,探寻与 AI 共事的进击之路。
当 ChatGPT 走进大众视野时,我们看到不少人感叹它强大的表达能力和迅猛的反应能力,无论向它抛出什么样的问题,它都能对答如流,甚至对于同一命题,也能给出许多不同的答案。这样蓬勃的新力量,正被更多品牌看见。
今年 4 月,户外运动品牌 The North Face 以重回山野为主题,对 ChatGPT 进行了发问,令人惊喜的是,ChatGPT 给予了 10000 个答案。
AIGC 的出现,不仅提速人们在绘图工作中的效率,更解锁了绘画创作的更多可能性,带来一些在艺术审美上的灵感。不得不说,AI 的想象力、审美力和创作力,已然被更多人所见。今年 4 月,飞猪旅行就使用了 AI 技术生成了一组世界风景图,并将画面投放至地铁广告里,来往的人都能一睹 AI 眼里的世界。
飞猪旅行《玩得比想象更酷》:用 AI 生成的世界风景图

以往,制作广告的工作流是贯穿线上线下,线上对接脚本,线下注重执行,尤其是现场拍摄,一些不可抗力的因素会影响到计划进度。
如今,随着 AIGC 的横空出世,内容生产的工作流正发生着不小的改变,创作者可以选择纯在线上完成广告任务。即向 AI 发生任务指令,再通过线上的一些调试,便能形成一支广告片。就在最近,飞书发布了一支广告片《探》,便是纯由 AI 完成的。
AI 不仅仅能够提供创意内容,还能帮助品牌与商家优化媒介投放和客户管理系统。事实上,国内许多 To B 企业早就应用了 AI 技术,辅助客户优化营销效果。
比如,阿里妈妈发布的序列化智能投放技术,就是借助 AI 技术帮助商家实现合理投放;巨量引擎则使用了与 GPT 相同的 transformer 技术,帮助客户高效提升 ROI。
在许多专家领袖对于 AI 的预言中,多模态 AI 是一个高频关键词。
多模态 AI,即能够处理和理解多种类型数据(例如图像、文本、音频等)的人工智能。目前的 AI 技术大多只能处理文字数据,而多模态能够理解更多类型的信息。
比如,你在看一部没有字幕的外语电影,而你并不懂这种语言。如果有一个多模态 AI,它可以同时理解电影中的视觉和听觉信息,然后把这些信息转化为你能理解的语言,为你提供实时的字幕。这就是多模态 AI 的应用场景之一,它可以处理并理解多种类型的信息,以帮助我们更好地获取和理解信息。
Artificial General Intelligence,即'人工通用智能',这是另一个与 AI 未来相关的高频词汇。
它指 AI 能够在所有领域中,像人类一样学习各种知识,完成各种任务。AGI 是人工智能的一种理想状态,也可以说是 AI 研究的终极目标,即让机器拥有与人类等同的智能。
现在的 AI 技术,虽然在特定任务上表现出超越人类的能力(如围棋、图像识别等),但它们仍然只是'窄'AI,仅限于特定任务。虽然研究者们对实现 AGI 的未来充满了希望,但这是否能在未来的某个时刻实现,以及何时能够实现,现在还不得而知。
提示词工程师像是 AI 模型的导演,负责设计和优化指导 AI 行动的语言提示。
他们了解 AI 模型的工作原理,并使用这些知识来优化语言提示,从而引导 AI 模型产生更好的结果。他们的工作可以涵盖多种任务,比如提升 AI 对问题的理解,优化 AI 的回答,甚至引导 AI 生成全新的内容。这项工作更偏向语言艺术和人工智能的交叉领域。
提示词艺术家是 AI 的艺术合作者,用创意和技巧指引 AI 创建出吸引人的艺术作品。
他们可能会使用像 Midjourney 这样的图片生成模型,通过提供特定的提示词或语句,来生成新奇和独特的文本或图像内容。他们需要有深厚的艺术素养,同时也需要对 AI 模型的工作原理有一定的理解,以便能够精确地指导模型产生预期的艺术作品。
人工智能训练师就像是 AI 模型的教师,他们主要关注如何训练和优化 AI 模型。
他们为 AI 模型提供训练数据,监督学习过程,并调整模型参数以改善其性能。这些工作主要涉及到机器学习和深度学习的知识,需要对 AI 技术有深入的理解。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML 转 Markdown 互为补充。 在线工具,Markdown 转 HTML在线工具,online