一、基本概念/理论
1、AI 工作原理
AI,全称 Artificial Intelligence,人工智能。顾名思义,让机器发展出像人一样的智能,可以看到、听到、思考、判断,然后根据经验作出决策。
而 AI 之所以能够走向现实生活,影响到多个行业领域的生产工作,离不开三个重要技术的支撑:深度学习、神经网络以及生成式对抗网络(GAN)。
1)神经网络
神经网络是一种模拟人脑神经元连接的算法模型。你可以把神经网络想象成一个大脑。就像大脑由许多神经元相互连接构成,神经网络也由许多"节点"或"神经元"通过"链接"相互连接。这些链接就像我们大脑中的神经连接,可以传递和处理信息。
2)深度学习
如果说神经网络像一个普通大脑,深度学习则是一个更加'聪明'的大脑。在这个'大脑'里,神经元被组织成许多层,这就像大脑的不同区域处理不同的任务一样。每一层都在学习和处理数据的不同特征或部分。这就使得深度学习能够处理非常复杂的问题,比如识别图像或理解自然语言。
3)生成式对抗网络(GAN)
GAN 技术可以说是推动这次 AIGC 热潮的关键技术,有了它,AI 才能够生成逼真的图像、音频和文本。
你可以把 GAN 的工作原理想象成是一个艺术家和艺术评论家的竞赛。艺术家(生成器)的工作是创造看起来真实的艺术作品,而艺术评论家(判别器)的任务是判断这个作品是否真的来自真正的艺术家,还是来自我们的 AI 艺术家。
艺术家(生成器)开始时可能不太擅长制作逼真的作品,而评论家(判别器)也可能并不擅长识别真伪。但是,随着他们不断的竞争,艺术家的作品变得越来越逼真,评论家的判断能力也越来越强。
在这个不断生成和对抗的过程中,AI 逐渐学会了如何创作看起来非常真实的作品。
2、AI 大模型/预训练大模型
AI 大模型是一种机器学习模型。它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手和图像识别软件都会用到 AI 大模型。
这里的「预训练」,可以理解为像学生学习知识一样,机器也需要通过学习和训练来获取相关的知识和技能,来完成各种任务。AI 预训练大模型可以通过不同领域的大量训练,掌握知识和技能。
由 OpenAI 公司开发的模型 GPT 就是一种大型语言模型,也是预训练模型的一种,它能够自动生成各类文本,比如新闻报道、小说,也可以回答问题、写文章、进行对话。GPT 是目前自然语言处理领域最为先进的自然语言生成模型之一。
3、开源
开源可以被理解为分享和合作的一种方式。在计算机编程中,当一个项目是开源的,意味着它的源代码是公开的,任何人都可以查看,修改和分享。
想象你正在做一份蛋糕,如果你将蛋糕的配方公开,让所有人都可以制作这个蛋糕,甚至可以根据自己的口味对配方进行修改和优化,那么这个蛋糕的配方就可以被认为是"开源"。
4、自然语言处理(NLP)
自然语言处理 (NLP) 就像是教计算机理解和使用人类语言的一种技术。举个例子,当你对手机说:'打开天气应用,查看明天的天气。'这就涉及到了自然语言处理。你的手机需要理解你的指令——这是什么意思,你想做什么,然后才能执行正确的动作。
自然语言处理需要用到很多开源的工具和软件,它们能够帮助研究员处理语言数据,大大降低开发的门槛,让自然语言处理技术的进步的速度变快。
5、AIGC
是指由 AI 自动创作生成的内容(AI Generated Content),即 AI 接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。
打个通俗点的比方,AIGC 就像一支马良神笔,拥有的无尽创造力。这支笔的特别之处在于,是由 AI 打造的。来自 AI 的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。AIGC 的出现,就像是打开了一个全新的创作世界,为人们提供了无尽的可能性。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。
6、AIGC 和 Chat GPT 的关系
AIGC 是 AI 大模型,特别是自然语言处理模型的一种重要应用;ChatGPT 则是 AIGC 在聊天对话场景的一个具体应用。
可以把 AIGC 看作是一个大的范畴,而 ChatGPT 是其中一个类别的小应用。
7、AIGC 可以生成的内容
AIGC 可以生成的内容很多,具体的种类和范围可能随着技术的发展而不断扩大。目前,一些常见的 AIGC 内容包括:
- 文字: 最基本的 AIGC 内容,可以与人类进行实时对话,生成不同风格的文字,诗歌、故事,甚至计算机代码等。
- 可以由文字或者图片,直接生成各种类型的图片。可以辅助人类进行绘画设计和发散想象力,大致可以分为图像自主生成工具和图像编辑工具两类。


