AIGC 技术发展与应用实践
系统介绍了 AIGC(人工智能生成内容)的技术概念、应用场景及实践案例。内容涵盖 AIGC 定义、与大模型关系、对行业及职业的影响,并详细演示了文本、图片、语音、视频类 AIGC 工具的使用,如 DeepSeek、文心一言、讯飞智文、文心一格、豆包及通义万相等。此外,还探讨了 AIGC 在辅助编程、AI 搜索及智能办公领域的应用,旨在帮助读者全面理解 AIGC 技术生态并提供实操指南。

系统介绍了 AIGC(人工智能生成内容)的技术概念、应用场景及实践案例。内容涵盖 AIGC 定义、与大模型关系、对行业及职业的影响,并详细演示了文本、图片、语音、视频类 AIGC 工具的使用,如 DeepSeek、文心一言、讯飞智文、文心一格、豆包及通义万相等。此外,还探讨了 AIGC 在辅助编程、AI 搜索及智能办公领域的应用,旨在帮助读者全面理解 AIGC 技术生态并提供实操指南。

AIGC,即'Artificial Intelligence Generated Content',中文译为'人工智能生成内容',是一种极具创新性的创作方式。它借助人工智能技术,能够生成文字、音乐、图像、视频等丰富多样的内容形式,标志着人工智能步入了全新的发展阶段。
AIGC 的核心技术涵盖生成对抗网络(GAN,Generative Adversarial Networks)、大型预训练模型以及多模态技术等。其核心思想在于运用人工智能算法,生成兼具创意与质量的内容。通过对模型进行训练,并让其学习海量数据,AIGC 能够依据输入的条件或指导,生成与之紧密相关的内容。比如,只需输入关键词、描述或样本,它就能创作出与之匹配的文章、图像、音频等。
AIGC 技术的优势显著,它不仅能大幅提升内容生产的效率与质量,还能为创作者提供源源不断的灵感与有力支持。在文学创作、艺术设计、游戏开发等领域,AIGC 可以自动创作出高质量的文本、图像和音频等内容,减轻创作者的负担。此外,它还能广泛应用于媒体、教育、娱乐、营销、科研等多个领域,为用户提供高质量、高效率且极具个性化的内容服务,推动各行业的创新与发展。
大模型与 AIGC 之间的关系可以说是相辅相成、相互促进的。大模型为 AIGC 提供了强大的技术基础和支撑,而 AIGC 则进一步推动了大模型的发展和应用,具体如下:
AIGC 可以应用于各行各业,主要包括但不限于生成文字、图像、音频、视频等,具体如下:
表 1 常见的 AIGC 应用场景
| 应用场景 | 描述 |
|---|---|
| 电商 | 生成商品标题、描述、广告文案和广告图。 |
| 办公 | 写周报日报,写方案,写运营活动,制作 PPT,写读后感,写代码。 |
| 游戏 | 生成场景原画,生成角色形象,生成世界观,生成数值,生成 3D 模型,生成 NPC 对话,音效生成。 |
| 娱乐 | 头像生成,照片修复,图像生成,音乐生成。 |
| 影视 | 生成分镜头脚本,生成剧本脚本,台词润色,生成推广宣传物料,音乐生成。 |
| 动漫 | 原画绘制,动画生成,分镜生成,音乐生成。 |
| 艺术 | 写诗,写小说,生成艺术创作品,草图生成,艺术风格转换,音乐创作。 |
| 教育 | 批改试卷,试卷创建,搜题答题,课程设计,课程总结,虚拟讲师。 |
| 设计 | UI 设计,美术设计,插画设计,建筑设计。 |
| 媒体 | 软文撰写,大纲提炼,热点撰写。 |
| 生活 | 制定学习计划,做旅游规划。 |
AIGC 技术对行业发展的影响广泛而深远,在多个维度上重塑着产业格局。主要体现在以下几个方面:
AIGC 技术对职业发展产生了深远的影响,主要体现在以下几个方面:
常见的 AIGC 大模型工具琳琅满目,如 OpenAI 的 ChatGPT、DeepSeek、科大讯飞的讯飞星火、阿里的通义千问、百度文心一言、字节跳动豆包以及 Kimi 等。它们皆以大规模语言模型技术为基石,拥有文本生成、语言理解、知识问答、逻辑推理等多元能力。无论是写作辅助、内容创作,还是智能客服等领域,这些工具都能大显身手。而且,它们持续迭代优化,紧跟时代步伐,不断打磨自身性能,致力于为用户提供更为智能、高效的内容生成解决方案,助力各行业实现高效创新发展。
AIGC 大模型的提示词(Prompt)是指用户向大模型输入的文本内容,用于触发大模型的响应并指导其如何生成或回应。这些提示词可以是一个问题、一段描述、一个指令,甚至是一个带有详细参数的文字描述。它们为大模型提供了生成对应文本、图片、音频、视频等内容的基础信息和指导方向。
提示词的重要作用如下:引导生成、提高准确性、增强交互性。
使用提示词需要注意一些技巧,这样可以从大模型获得更加符合我们预期要求的结果,主要技巧如下:简洁明确、考虑受众、分解复杂任务、使用肯定性指令、示例驱动、明确角色、遵守规则、自然语言回答。
访问 DeepSeek 官网,会出现如图 1 所示对话界面,在提示词输入框的底部,有两个按钮,即'深度思考 (R1)'和'联网搜索',可以用鼠标点击来选中或取消,默认情况下,'深度思考 (R1)'按钮是处于选中状态,'联网搜索'则处于未选中状态。两个按钮的功能如下:
图 1 DeepSeek 对话界面
在提示词输入框中输入'请模仿李白的《望庐山瀑布》做一首诗,题目是《望连云港花果山》',然后回车,或者用鼠标点击提示词输入框右侧的箭头按钮,向 DeepSeek 发起提问。DeepSeek 给出的回答如图 2 所示,需要注意的是,大模型属于概率模型,每次生成的回答内容可能不完全相同。
图 2 DeepSeek 生成《望连云港花果山》
(1)基本原则:简单直接,自然表达。 ① 无需复杂结构。直接描述需求即可,无需添加'角色扮演'(如'假设你是专家')或复杂指令(如'用学术语言分三点回答')。比如,你可以直接向 DeepSeek 提问'什么是光合作用?'、'如何用 Python 写一个计算器程序?',而不建议使用提示词'请以生物学教授的身份,用三个段落解释光合作用,每段不超过 100 字'。 ② 多轮对话优化结果。如果首次回答不完整,可通过追问补充细节,无需一次性给出完美提示。比如,第一轮提问'写一首关于秋天的诗',第二轮提问'加入一些悲伤的情绪',第三轮提问'把'落叶'换成比喻句'。
(2)不同场景的提问技巧(非必需,但可提升效率)。虽然简单提问即可满足大多数需求,但在复杂任务中,适当提供背景信息或明确需求会让结果更精准,具体技巧包括: ① 知识类问题。比如,基础提问是'量子力学的基本原理是什么?',优化后的提问是'用通俗易懂的语言解释量子纠缠,适合高中生理解'。 ② 创作类任务(写作、编程等)。比如,基础提问是'写一个关于人工智能的科幻短篇故事',优化后的提问是'写一个反乌托邦主题的科幻故事,主角是女性工程师,结局有反转'。 ③ 实用建议(学习、工作等)。比如,基础提问是'如何提高英语听力?',优化后的提问是'我每天只有 30 分钟学习时间,有哪些高效的英语听力练习方法?'。 ④ 复杂任务(数据分析、代码调试)。比如,基础提问是'这段 Python 代码报错了,帮我看看问题',优化后的提问是'我的代码目标是爬取网页数据,但遇到 SSL 证书错误。报错信息如下:[粘贴代码]'。
作为初学者,DeepSeek 的一些'魔法'指令也很有用,比如,你可以输入'/步骤 如何用手机拍摄旅游照片',DeepSeek 返回的回答结果就会按照步骤详细给出拍摄旅游照片的说明,再比如,你可以输入'请解释量子计算,然后/简化',它就会返回比较简明扼要的回答。
表 2 DeepSeek 的"魔法"指令
| 指令 | 功能 |
|---|---|
| /续写 | 当回答中断时⾃动继续⽣成 |
| /简化 | 将复杂内容转换成⼤⽩话 |
| /⽰例 | 要求展示实际案例(特别是写代码时) |
| /步骤 | 让 AI 分步骤指导操作流程 |
| /检查 | 帮你发现⽂档中的错误 |
点击 DeepSeek 界面中的「回形针」图标上传⽂件,支持的文件类型包括文本类(PDF、DOCX、TXT、Markdown)、数据类(CSV、XLSX)和图像类(JPG、PNG)。然后,就可以在对话框中输入提示词,比如,可以输入'总结这份年报的三个核⼼要点'、'提取合同中的责任条款制成表格'、'对⽐⽂档 A 和⽂档 B 的市场策略差异'、'从实验报告中整理所有温度数据'、'请识别图片中的文字'等。也可以使用一些指令来处理文档,如表 3 所示。
表 3 用于文档处理的 DeepSeek 指令
| 功能 | 指令模板 | 应用场景 |
|---|---|---|
| 内容摘要 | /总结 [文件名] 生成 500 字摘要 | 快速把握长篇文档核心内容 |
| 问答提取 | /问答 [文件名] 第三章提到的技术参数是? | 精准定位特定信息 |
| 数据可视化 | /可视化 [文件名] 将销售数据生成折线图 | 转化表格数据为图形分析 |
| 跨文档对比 | /对比 文件 A vs 文件 B 的政策差异 | 合同/论文查重对比 |
还可以要求 DeepSeek 对回答结果进行结构化输出,比如,可以输入如下提示词:
/解析文件 年度报告.docx 输出要求:
(1)按"营收/利润/成本"分类
(2)用 Markdown 表格对比近三年数据
(3)关键增长点用✅标注
访问文心一言官网,在输入提示词时,明确指定你希望生成的文本内容的风格。这样,文心一言在理解并处理你的请求时,会更有针对性地调整其生成内容的风格,以满足你的具体需求。比如,可以使用提示词:
请按照要求写一篇 200 字左右关于云计算的介绍。注意事项:文章的受众是中学生,需要通俗易懂,语言风格需要幽默、风趣一些
想要生成不同语气风格的文字,可以在问题描述中加入你想要的语气风格作为限定条件,提示文心一言按照你的要求去输出。比如,如果你需要正式语气,可以在提示词中加入'请采用正式的词汇和语法结构,使内容显得庄重、严肃和专业';如果你需要抒情语气,请在提示词中加入'请使用富有感情和表达感情的词汇,使内容产生共鸣和情绪共振';如果你需要口语化语气,请在提示词中加入'请运用口语化的表达方式,例如俚语、俗语和口头禅,使内容更加轻松和亲切'。
在构建提示词时,应明确指定期望的输出结构。比如,如果是要求生成一篇文章,可以在提示词中明确指出'请按照引言 - 正文 - 结论的结构来撰写'。这样,文心一言在生成内容时,会遵循这一结构框架,使得输出更加条理清晰、逻辑严密。再比如,如果要撰写给上级领导的方案、报告、总结时,可以使用提示词:
请按照【现状/问题/解决方案,数据洞察/问题概览/调研方向,数据/亮点/问题/经验】这个结构撰写一份关于我国芯片行业的总结报告
在提示词中可以设定具体的角色或视角。例如,在要求创作故事时,可以明确指定'以一位勇敢探险家的视角讲述这段经历'。这样的提示能引导文心一言在生成内容时,从特定角色的角度出发,赋予文本独特的情感色彩和叙事风格。此技巧有助于增强生成内容的代入感和故事性,使内容更加丰富和引人入胜。下面是一段提示词实例:
请你作为一个小红书文案撰写高手,为我生成一篇爆款小红书文案,要求:突出酒店的特色,包括海景房、豪华单间、最新装修、免费早餐、无线上网等
下面是另一段提示词实例:
我希望你能扮演记者的角色,按照我的要求撰写一份新闻调查,要求:调查油罐车不清洗直接运送食用油的事情,不要出现具体企业名称,要给出政府部门的处理态度
可以通过详细具体的提示词明确表达内容要求。无论是希望生成的文章主题、关键词汇,还是期望涵盖的信息点、情感倾向,都应在提示词中清晰呈现。这样做能让文心一言更准确地理解用户需求,生成更符合期望的内容。比如,可以通过如下提示词表达自己的内容要求:
在 6G 专利申请方面,中国已经遥遥领先。2021 年的数据显示,中国的 6G 专利申请量占比高达 40.3%,稳坐世界第一的宝座。请把上面的数据更新到目前最新的数据
如果对输出的内容有比较多的要求或限制,不妨在输入框中将这些内容要求一条一条明确告诉文心一言,比如,可以采用类似如下的提示词:
请以小红书的风格,按照以下要求帮我为'海景美食餐厅'写一篇小红书种草文案;
内容要求:
(1)要有标题、正文
(2)标题字数:不超过 20 个字;尽量简短精炼,要足够吸引眼球,用词浮夸
(3)正文分段,层次分明,每段最少 100 字
(4)要用'首先、其次、最后'这种模式
(5)整篇文案不要超过 1000 个字
明确指定文体,如散文、小说、诗歌、科技文等,让大模型理解并模拟该文体的语言特点、结构安排和表达习惯,从而输出更具针对性的文本。比如,可以采用提示词'请写一段 [中秋赏月] 的朋友圈文案,需要采用藏头诗的形式'。
图 3 文心一言生成 [中秋赏月] 藏头诗
将复杂问题拆解成多个简单、具体的步骤,作为提示词输入给文心一言。这样不仅能降低问题的处理难度,使文心一言更容易理解和响应,还能确保解决问题的过程更加系统、有条理。通过逐步引导,可以逐步逼近问题的解决方案,提高答案的准确性和实用性。比如,如果想让文心一言帮你制定一份旅行规划,可以使用类似如下的提示词:
请为我规划一次为期一周的连云港自由行;
(1)第 1 步:列出必去的景点,如江苏海洋大学、花果山、连岛景区、云台山、桃花涧风景区、海州古城;
(2)第 2 步:根据景点位置安排每日行程,确保交通便利;
(3)第 3 步:推荐几家当地的特色餐厅,包括早餐、午餐和晚餐;
(4)第 4 步:提供一家性价比高的酒店住宿建议,并考虑其位置是否便于游览。
明确沟通意图,通过具体示例引导大模型理解你的需求。这有助于文心一言更准确地捕捉你的思维框架和期望结果,减少误解。比如,可以使用类似如下的提示词:
我是一位高校学生,请帮我写一份实习周报,内容尽量简洁精炼,下面是我本周的实习内容:
(1)完成了 3 个项目书的修改
(2)撰写了一篇博客'AIGC 应用与实践'
输出要求示例:
【本周实习周报】
【本周实习进展】本周做了哪些事,产生了哪些结果
【下周实习安排】基于本周的结果下周要推进哪些事
【思考总结】简要说说本周的收获和反思
在输入提示词时,应明确描述所需的上下文或环境背景,如'在科幻电影中描述一个未来城市的景象'或'请撰写一封给朋友的生日祝福信,场景设定在海边日落时'。这样做有助于文心一言更好地理解你的需求,生成更符合场景氛围和情境的内容,从而提升输出内容的贴切性和情感共鸣。
图 4 文心一言描述未来城市
讯飞智文是科大讯飞公司旗下的 AI 一键生成 PPT/WORD 的网站平台,是基于科大讯飞星火认知大模型技术基础上开发的一个具体应用,主要功能有文档一键生成、AI 撰写助手、多语种文档生成、AI 自动配图、模板图示切换功能。这里介绍如何使用讯飞智文快速生成 PPT。
请首先准备一个包含文本内容的 PDF 文件,比如,可以从网络新闻报道中复制一段关于 2024 年 7 月 19 日微软蓝屏事件的内容保存到一个 WORD 文档中,命名为'微软蓝屏.docx',然后,使用 WPS 软件打开'微软蓝屏.docx',把该 WORD 文档保存成 PDF 格式,生成'微软蓝屏.pdf'。
访问讯飞智文官网,在首页(如图 5 所示)中点击'免费使用',然后按照网页提示完成注册(推荐使用手机号注册)。
图 5 讯飞智文官网
在页面中(如图 6 所示)选择 AI PPT 的'文档创建'。然后,在出现的页面中(如图 7 所示),点击'点击上传',把本地文件'微软蓝屏.pdf'文件上传上去(当然,也可以上传'微软蓝屏.docx')。
然后,在出现的页面中(如图 8 所示),点击'开始解析文档'。之后,页面会显示提示文字'好的,已收到您的要求,让我先为您生成 PPT 标题和大纲'。过一会儿,就会显示自动生成的 PPT 标题和大纲,如果你不满意,可以点击页面底部的'重新生成',如果满意,可以直接点击'下一步'。
图 6 选择 AI PPT 中的'文档创建'
图 7 上传文件
图 8 开始解析文档
在出现的页面中(如图 9 所示),选择你想要的模板配色,然后点击页面顶部的'开始生成'。经过一段时间以后,页面就会显示自动生成的 PPT(如图 10 所示),点击页面右上角的'下载',就可以把 PPT 保存到本地电脑中,然后,可以根据自己的需求,自己对 PPT 继续进行修改和完善。在本地电脑中打开自动生成的 PPT,可以看出,AI 制作 PPT 的水平非常专业,逻辑清晰,配图精美,超过了很多 PPT 初级者的制作水平,可以大大提高普通用户制作 PPT 的效率和质量。
图 9 选择模板配色
图 10 下载生成的 PPT
图片类 AIGC 是一种基于人工智能技术生成图片的方法,它利用深度学习、生成对抗网络(GAN)等先进算法,通过学习和模仿大量图像数据,能够自动创作出高度真实和艺术化的图片。AIGC 在图像生成、修复、风格转换、艺术创作等领域展现出强大能力,为数字艺术、设计、游戏、电影等多个行业带来创新解决方案。其优势包括高效性、多样性和自动化,能够快速生成大量高质量的图像内容,满足各种复杂需求。
图 11 AIGC 作品图
图片类 AIGC 的应用场景非常广泛,主要包括图像生成、图像修复、图像增强和图像识别等方面:
图片类 AIGC 大模型主要包括 Midjourney、Stable Diffusion SDXL、百度文心一格等。这里以百度文心一格为例介绍图片类 AIGC 的使用方法。文心一格是一款由百度公司研发的 AI 绘画工具,为用户提供了丰富的创意空间。使用文心一格进行 AI 绘画的步骤包括注册账户、选择创作模式、输入提示词、设置画面类型、设置比例、设置数量以及生成图片等,具体如下:
图 12 文心一格操作界面
文心一格提供了丰富的 AI 编辑功能,可以对图片进行各种智能化处理,包括图片扩展、图片变高清、涂抹消除、智能抠图、涂抹编辑、图片叠加等。
图 13 文心一格生成图片结果
语音类 AIGC 是一种利用人工智能技术(特别是语音识别、自然语言处理和语音合成技术),自动生成和处理语音内容的技术。它能够模拟人类语音,实现语音到文本的转换、文本到语音的合成,以及语音情感分析等功能,广泛应用于智能语音助手、智能客服、语音翻译等多个领域。
语音类 AIGC 的应用场景非常丰富,涵盖了多个领域,从日常生活到专业应用,都展现出了其独特的价值和潜力,以下是一些主要的语音类 AIGC 应用场景:智能语音助手,智能客服,语音合成与转换,虚拟人物与数字人,语音翻译,语音分析与情感识别,智能驾驶舱与车载语音助手。
一般情况下,普通用户在手机上使用语音类 AIGC 大模型的场景比较多,因此,这里介绍手机版豆包的使用方法。
在智能手机上下载并安装'豆包 APP'。启动进入豆包 APP,会出现如图所示的对话界面,按住'语音按钮'(图中箭头指向的位置)不要松开,然后就可以对着手机说话,把自己的需求说出来,比如,可以说'请介绍一下苏州大学',然后松开'语音按钮',豆包就可以立即开始回答你提出的问题。豆包可以支持实时翻译,你可以语音输入'苏州大学的英文名称是什么',豆包会马上给出翻译结果。
图 14 豆包的对话界面
豆包不仅支持语音输入,也可以支持文字输入,只要在文字输入框内输入提示词,豆包就会给出回答。豆包也支持 AI 绘图功能,你可以用手指点击界面上的'图片生成'按钮,然后输入提示词,比如通过文字或者语音输入'请帮我绘制一张图片,一个 9 岁的小女孩在海边沙滩上玩沙子',然后,豆包就会自动绘制生成满足你要求的图片。
图 15 小女孩在海边沙滩上玩沙子
豆包还有一个很实用的功能,就是可以帮助你进行英语口语对话练习。在豆包的操作界面的底部,用手指点击'对话',在出现的功能选择界面中,选择'英语口语聊天搭子'就可以进入英语口语聊天界面(如图 16 所示),按住界面右下角的'语音按钮',就可以开始用英语语音聊天了,你说完一句英语,松开语音按钮,豆包就会自动用英语语音回答你,然后你可以继续输入语音进行后续对话。
图 16 豆包的功能选择界面和英语口语聊天界面
视频类 AIGC 是指利用人工智能技术,特别是深度学习、机器学习等算法,自动创建或处理视频内容的技术。它能根据给定的文本、图像或其他数据,自动生成符合描述的视频内容,涵盖文生视频、图生视频、视频风格化、人物动态化等多个方向。这一技术在创意设计、影视制作等领域潜力巨大,极大地提升了视频内容的生产效率和质量。
视频类 AIGC 在多个领域拥有广泛的应用场景,以下是一些主要的应用方向:
图 17 视频类 AIGC 的应用场景
视频类 AIGC 大模型发端于 Sora。2024 年 2 月,美国的 Open AI 发布了全球第一款文生视频大模型 Sora(这里的'文生视频'是指由输入的文本内容生成相应的视频),迅速引起了业界的广泛关注和讨论,因其能够快速生成高质量的广告宣传视频及商品演示视频,从而大幅降低广告相关内容的制作成本及时间。我国的视频类 AIGC 大模型主要包括:
由于视频类 AIGC 大模型在使用时,会消耗大量的算力资源,使用成本很高,所以,目前国内的视频类 AIGC 大模型大多数没有免费开放给大众使用,即使是免费使用,也只能生成很短时间长度的视频。
下面,我们使用通义万相 2.1 大模型演示文生视频的过程。
图 18 通义万相官网主页
在页面左侧输入提示词。点击'生成视频'按钮,几分钟后在页面右侧生成视频。提示词如下:
视频以低角度仰拍开始,展现一名身穿银白色太空服的宇航员在月球表面行走的壮丽景象,四周是荒凉但神秘的月球地形,布满坑洞与崎岖不平的地貌。随着镜头缓慢推进,可以看到宇航员的手轻轻触摸到一颗悬浮在空中的星星,背景中,深邃的宇宙星河缓缓流转,星星闪烁,构成一幅令人惊叹的星际画卷。整个视频通过慢镜头和精心设计的镜头运动,营造出一种梦幻般的科幻氛围,引领观众一同踏上这场月球探索之旅。
图 19 通义万相 2.1 文生视频
这样,视频就生成好了,我们可以点击'下载'图标,将视频另存到本地。
图 20 通义万相 2.1 文生视频结果
AIGC 技术在辅助编程中的应用日益广泛,它能够自动生成高质量的代码,从而显著提高开发效率,主要包括以下几种应用场景:代码自动生成,代码优化与重构,代码补全与提示,代码风格统一。
能够提供辅助编程服务的 AIGC 大模型包括 Codex、GitHub Copilot、CodeGeeX、aiXcoder、豆包、通义灵码等。这里以我国的字节跳动公司研发的豆包大模型为例介绍使用方法。
编程工作一般是在电脑上进行,所以这里使用电脑端的豆包大模型(手机端的豆包 APP 也提供了编程辅助功能)。
访问豆包大模型官网,注册用户以后,进入大模型操作首页,点击'我的智能体',再点击'编程助理',然后,在页面中输入提示词,比如输入'请编写一段 Python 代码,使用 turtle 库,绘制一个五角星',然后,豆包就会自动生成一段 Python 代码(如图 21 所示)。在 Python 中运行这段代码,就可以成功绘制一个五角星。
图 21 豆包自动生成的 Python 代码
AI 搜索,即人工智能搜索引擎,是一种利用先进的人工智能技术,特别是深度学习和自然语言处理(NLP),来理解和响应用户的查询需求的新型搜索工具。它不仅仅是传统搜索引擎(比如百度)的简单升级,而是通过模拟人类的思维方式和行为模式,为用户提供更加精准、个性化且高效的信息检索服务。AI 搜索通过收集和分析用户的历史搜索数据和行为模式,构建用户画像,从而实现更加精准的个性化搜索服务。这种数据驱动的智能决策机制,使得 AI 搜索能够不断自我优化,提升用户体验。
纳米 AI 搜索(https://so.n.cn/)是 360 公司在 2024 年 12 月推出的全新 AI 搜索应用,结合了自然语言处理、机器学习以及专家协同技术,致力于打破传统搜索引擎的局限,提供智能化、多样化的搜索体验。其核心特点包括: (1)多模态搜索:支持文字、语音、拍照、视频等多种输入方式,满足不同场景下的需求,实现'一切皆可搜索'。 (2)智能工具集成:内置 16 款顶尖大模型,如豆包、文心一言等,为用户提供一站式 AI 智慧体验。 (3)慢思考模式:通过专家协同和多模型协作,深入分析复杂问题,提供更专业、更全面的答案。
图 22 纳米 AI 搜索入口
在人工智能时代,AI 智能办公正以前所未有的态势重塑我们的工作模式与体验,成为推动办公效率提升和办公方式变革的核心力量。AI 智能办公将人工智能技术深度融入办公场景的各个环节,例如文档处理、数据分析、演示制作等。
在文档处理领域,AI 智能办公带来了前所未有的变革。以往需要人工手动输入文字、排版以及校对纠错等工作需要耗费大量时间和精力,如今 AI 文档处理技术极大地提升了这些任务的效率与质量。具体如下: (1)生成式文本。通过对大量文本数据的学习,AI 能够根据用户提供的提示词、主题或简单描述,快速生成内容完整、逻辑连贯的文档初稿。无论是新闻稿件、公告通知还是学术论文,都能借助这一功能节省撰写时间。例如,市场调研公司在需要撰写季度报告时,AI 可以迅速整合数据和市场趋势信息,生成报告框架与初步内容,供使用者进一步完善。 (2)文档智能排版。AI 能够自动识别文档内容的结构,如标题、段落、列表等,并根据用户预设的格式模板进行快速排版。这不仅提高了排版效率,还确保了文档格式的一致性和规范性。对于需要处理大量文档的办公人员来说,这一功能大大减轻了工作负担。
数据分析是办公场景中的重要环节。传统的数据分析需要人工进行数据收集、清洗、分析和可视化,过程烦琐且容易出错。而借助人工智能技术,这些工作可以更加高效、精准地完成。通过大模型算法,AI 能够从海量数据中发现潜在的模式、趋势和关联关系。例如,电商企业可以利用 AI 分析用户的购买行为、浏览记录和搜索关键词,挖掘出用户的潜在需求和消费偏好,从而制定精准的营销策略。自动数据可视化功能让数据分析结果的呈现更加直观、清晰。AI 能够根据数据分析结果自动生成各种类型的表格图表和图形,如柱状图、折线图、饼图等,并进行合理的布局和配色。办公人员无需花费大量时间手动制作图表,就能快速将数据转化为易于理解的可视化信息,为决策提供有力支持。
WPS 提供以下 AI 助手功能:
图 23 WPS AI 功能
本文系统梳理了人工智能生成内容(AIGC)的技术框架与实践路径,构建了'理论认知 - 场景应用 - 行业影响'的三维知识体系。在理论层面,开篇明确定义了 AIGC 作为新型内容生产范式的技术内涵,揭示其依托大模型突破传统 AI 任务边界的技术特征,通过列举文本生成、图像创作等六大典型应用场景,展现技术落地的广度与深度。更从产业变革角度,深入剖析 AIGC 对传统行业运作模式的重构逻辑,以及由此催生的新型职业机遇与技能转型需求。
实践维度则以'模态融合'为轴线,分设文本、图像、语音、视频四大应用板块,构建从基础对话到复杂创作的阶梯式案例矩阵。通过 DeepSeek 对话系统、讯飞智文 PPT 自动生成等具体案例,演示不同技术工具在办公场景中的协同应用。特别在跨模态创作领域,系统解构了 Stable Diffusion 等代表性模型的运作机理,呈现从文字描述到视觉表达的转化逻辑。
最后篇章聚焦 AI 搜索与智能办公的前沿融合,预示下一代人机协作的新图景。全文贯穿'工具理性与人文思考'的双重视角,既提供 Prompt 工程等实用技巧,也辩证分析技术应用中的伦理边界。通过构建'认知 - 操作 - 反思'的完整学习路径,为不同层次的读者搭建理解 AIGC 技术生态的认知框架,为数字化转型中的组织与个人提供可操作的实践指南。这种结构化知识体系,既可作为 AIGC 应用的入门导航,也可作为深度开发的技术图谱,展现人工智能时代内容生产革命的完整图景。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML 转 Markdown 互为补充。 在线工具,Markdown 转 HTML在线工具,online