跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

AI 生成海贼王漫画、苹果限制员工用 ChatGPT、李彦宏谈大模型与就业

AIGC 领域近期动态涵盖技术、企业与政策三方面。技术上,研究团队利用 ChatGPT 与 Stable Diffusion 生成海贼王风格漫画,FastComposer 提升多主体图像生成效率。企业方面,iOS 版 ChatGPT 上线,苹果限制员工使用外部 AI 工具,Meta 建设液冷数据中心,腾讯音乐推出 AI 产品,WPS AI 接入办公组件,智谱开源 VisualGLM-6B。政策上,北京、上海出台支持措施,纽约市公立学校解除 ChatGPT 禁令。专家观点中,Sam Altman 称 AI 处于早期,李彦宏表示不担心大模型导致失业,高盛预测 AI 十年内提升标普 500 利润 30%。

无尘发布于 2025/2/7更新于 2026/5/2921 浏览
AI 生成海贼王漫画、苹果限制员工用 ChatGPT、李彦宏谈大模型与就业

AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作。

'新晋流量'ChatGPT 的背后,AIGC 是'昙花一现'?还是将引领人工智能进入新的时代?「AIGC 周报」将从【技术前瞻】【企业动态】【政策法规】【专家观点】带你快速跟进 AIGC 世界。

01 技术前瞻

让 AI 画一画《海贼王》

如今,随着大型语言模型和扩散模型的快速发展,人们有能力生成具有有趣故事情节的漫画,同时保持艺术家的艺术风格。

在该研究中,研究团队使用 ChatGPT 来生成《海贼王》的故事情节,然后使用 Stable Diffusion 生成漫画。

此外,他们引入了一种新的方法来评估 AI 生成的故事,通过使用 LoRA、ControlNet 等微调 Stable Diffusion,在人物保真度和艺术风格上达到了 SOTA 表现。

AIGC 周报相关示意图

论文链接:

https://arxiv.org/abs/2305.11067

收藏!一篇关于 GPT 的全面回顾

这是一篇关于 GPT 的综述文章,由一个多国联合团队联合发表。该综述详细介绍了 GPT 的结构、工作过程、训练程序、使能技术,以及它对各种应用的影响。

在这篇综述中,他们还探讨了 GPT 的潜在挑战和局限,并讨论了潜在的解决方案和未来方向。

AIGC 周报相关示意图

论文链接:

https://arxiv.org/abs/2305.10435

快 300-2500 倍,高效、个性化和高质量多主体图像生成模型

扩散模型在文生图方面表现出色,但仍然存在因微调而效率低下、因计算密集而难以部署等问题,而且常常在多主体生成方面表现不佳。

该研究提出了 FastComposer,它能实现高效、个性化、多主题的文本 - 图像生成,而无需进行微调。实验表明,其可以生成具有不同风格、动作和背景的多个未见过的人物图像,比如爱因斯坦和牛顿坐在一起、同被誉为'深度学习三巨头'之一的 Yoshua Bengio 和 Geoffrey Hinton 在海滩等。

与基于微调的方法相比,FastComposer 的速度提高了 300-2500 倍,为高效、个性化和高质量的多主体图像生成打下了坚实的基础。

AIGC 周报相关示意图

论文链接:

https://arxiv.org/abs/2305.10431

02 企业动态

iOS 版 ChatGPT 上线

5 月 19 日凌晨,OpenAI 官方推出了 iOS 版 ChatGPT。

据官方博客介绍,iOS 版 ChatGPT 供用户免费使用,并在不同设备(移动端和网页端)上同步聊天历史。同时,它还集成了开源语音识别系统 Whisper,可以语音输入。另外,ChatGPT Plus 用户能在 iOS 版 ChatGPT 上继续享受 GPT-4 的服务,提前获得各种功能和更快的响应时间。

然而,遗憾的是,目前只有 iOS 用户(美区)可以使用 iOS 版 ChatGPT,安卓用户还要再等一等了。值得注意的是,iOS 版 ChatGPT 依然会生成存在事实性错误的内容。官方也提醒,用户最好不要在 app 内分享任何敏感数据。

苹果出手了,限制员工在公司内使用 ChatGPT

据《华尔街日报》消息,苹果已限制员工在公司内使用 ChatGPT 和其他外部 AI 工具,目前苹果正开发自家的类似技术。文件指出,苹果担心使用外部程序的员工'可能会泄露机密数据'。据悉,苹果还告知员工不要使用微软的 GitHub Copilot。

Meta 将建设一个新的 AI 数据中心

扎克伯格表示,Meta 将建设一个新的 AI 数据中心,该数据中心将配备支持液冷硬件的设备,以处理大规模的训练和推理;Meta 设计了'Meta 训练和推理加速器'首代定制芯片,为 AI 推荐系统提供动力;此外,Meta 也开发了名为'CODECOMPOSE'的生成式 AI 编码助手,帮助工程师在编写代码时提高效率。

Hippocratic AI 获得 5000 万美元融资,聚焦医疗教学领域

5 月 17 日,生成式 AI 平台 Hippocratic AI 宣布获得 5000 万美元(约 3.5 亿元)种子轮融资,由 General Catalyst 和 Andreessen Horowitz 共同领投。Hippocratic AI 基于大语言模型开发的 AI 聊天机器人主要聚焦在医疗教学领域,提供类 ChatGPT 问答服务。Hippocratic AI 能模拟各种类型的病人、语气、性格与医生对话,帮助医生提升医学知识。

腾讯音乐:正探索大语言模型应用 已推出两款 AI 音乐制作产品

近日,在腾讯音乐今晚 2023 年第一季度业绩会上,腾讯音乐 CEO 梁柱表示,本季度,腾讯音乐探索了大语言模型在 AIGC 领域落地的多元应用,推出了'TME Studio 音乐创作助手'与'音色制作人'两款产品,协助音乐人在作词、作曲、音乐内容分析与剪辑等制作环节的效率提升。

WPS AI 接入文字、表格、PPT、PDF 四大组件

生成式 AI 应用 WPS AI 对外展示了类微软 Copilot 的能力,接入了文字、海外版表格、PPT 演示文稿、PDF 四大日常办公组件。未来几个月,WPS 产品将逐渐上线这些功能,国内和海外版有所区别,海外版直接使用 OpenAI 的接口,而国内在知识库构建上可能会更快一点。

智谱 AI、清华大学 KEG 实验室开源多模态对话模型 VisualGLM-6B

近日,智谱 AI 和清华大学 KEG 实验室开源了基于 ChatGLM-6B 的多模态对话模型 VisualGLM-6B。

据介绍,VisualGLM-6B 是一个开源的、支持图像、中文和英文的多模态对话语言模型,不仅可以进行图像的描述及相关知识的问答,也能结合常识或提出有趣的观点。

值得关注的是,结合模型量化技术,用户可以在消费级的显卡上进行本地部署该模型(INT4 量化级别下最低只需 8.7G 显存)。

03 政策法规

北京就促进通用人工智能发展若干措施征集意见

近日,北京市科委、中关村管委会就《北京市促进通用人工智能创新发展的若干措施(2023-2025 年)(征求意见稿)》公开征集意见。

《征求意见稿》在'加强算力资源统筹供给能力''提升高质量数据要素供给能力''系统布局大模型技术体系,持续探索通用人工智能路径''推动通用人工智能技术创新场景应用''探索营造包容审慎的监管环境'5 个方面提出了 21 项具体措施。

上海:支持中小企业购买智能工厂诊断咨询及 AI 算力等服务

近日,上海市服务企业联席会议办公室印发《上海市助力中小微企业稳增长调结构强能力若干措施》,提出加大数字能力供给。支持中小企业使用线上会议软件、工业软件等'小快轻准'数字化解决方案和产品。实施智评券、算力券等,支持中小企业购买智能工厂诊断咨询及 AI 算力等服务。对在上海数据交易所首次挂牌数据产品、优秀数据品牌和数商给予资金补助,培育不少于 300 家中小数商企业,形成不少于 30 个品牌数据产品。

教育部:培养一大批具有创新能力和合作精神的 AI 高端人才

近日,教育部部长怀进鹏在第七届世界智能大会开幕式上表示,非常愿意与世界各国以及产业界、科技界积极合作,共同推进教育数字化、教育智能化,推进学习型社会和终身学习,不断加强教育改革与创新,面对未来我们将研判 AI 发展态势,聚焦 AI 前沿问题,持续加强 AI 相关学科专业和平台载体建设,培养一大批具有创新能力和合作精神的 AI 高端人才,以支撑智能科技和产业发展。

科技部:加大 AI 基础理论和前沿技术研发布局

近日,科技部部长王志刚在第七届世界智能大会开幕式上表示,将紧紧把握全球 AI 发展的新机遇,尊重科技创新和 AI 发展的规律,加大 AI 基础理论和前沿技术研发布局,打造一批 AI 区域高地和技术平台,深化企业牵头的产学研用融合,推动 AI 赋能经济社会发展。

美国纽约市公立学校取消了 ChatGPT 禁令

近日,美国纽约市公立学校在最初禁止使用 ChatGPT 后,解除了对该技术的禁令。'纽约市公立学校将鼓励和支持我们的教育工作者和学生学习和探索这种改变游戏规则的技术,同时创建一个存储库和社区,在我们的学校分享他们的发现,'纽约市教育部长大卫·班克斯在教育网站 Chalkbeat 的一篇专栏文章中说。班克斯为他早些时候禁止这项技术的决定辩护,称最初的谨慎是必要的,但他承认,这种反应是一种'下意识的恐惧',没有认识到生成式 AI 的可能性及其支持学生和教育工作者的能力。

04 专家观点

Sam Altman:AI 仍处于早期阶段,仍会犯错

OpenAI 首席执行官 Sam Altman 表示,AI 技术仍然处于早期阶段,仍然会犯错;ChatGPT-4 将使一些工作实现自动化,同时将带来新的工作机会;最担心的是科技会带来重大的伤害;'一些监管将是非常明智的'。

Satya Nadella:AI 将创造新机会,或出现 10 亿技术开发者

近日,微软首席执行官 Satya Nadella 表示,关于对 AI 的担忧,'整个社会'必须团结起来,'最大限度地利用这项技术带来的机会并降低危险'。Nadella 说,每当一项新的颠覆性技术出现时,就业市场都可能出现很大的变化。不过他也相信,AI 能创造出新的就业机会,可能会出现 10 亿技术开发者。

DeepMind 联合创始人:传统搜索引擎将在 10 年内消失

日前,DeepMind 联合创始人 Mustafa Suleyman 表示,互联网即将发生根本性变革,传统搜索引擎将在 10 年内消失,对话式互动产品将引发新一轮技术浪潮。另外,Suleyman 预计,每个人都将在未来几年中拥有自己的个人 AI,包括商业 AI、非营利性 AI、网红 AI 和品牌 AI 等。

李彦宏:不担心大模型会让工作消失

近日,百度创始人、董事长兼首席执行官李彦宏表示,AI 不会让工作机会减少,会带来全球经济的下一个增长奇迹。每一次科技革命,都会让一部分工作消失,同时创造更多新工作岗位。他举例说,汽车取代马车,的确让马车夫的工作消失了,但在今天,汽车产业成为了全球最大的工业体系之一,创造了数以亿计的就业岗位。'我不担心大模型会让工作消失,我认为,未来会有更多的工作产生。'

曾毅:算力底座是下一阶段最需要解决的一个重大问题

在第七届世界智能大会上,中国电子董事长曾毅在演讲中表示,AI 离不开三个东西(算力、算法、模型)。'我的观点是,算法的问题应该会得到比较妥善的解决,模型的问题有难度,从全球资源来看,英文为主体的数据资源仍然占 80%、90% 以上,但我们也能解决。现在,我觉得最卡脖子、最难受的是算力底座的问题,算力底座可能是我们下一阶段最需要解决的一个重大问题。'

高盛分析师:AI 可以在未来十年内将标普 500 企业的利润提高 30%

日前,高盛资深分析师 Ben Snider 在接受 CNBC 采访时提到,'未来 10 年,每年 AI 生产力将增长 1.5%,这意味着可能会使标普 500 企业的利润在未来十年内增加 30% 或更多。'他还表示,'许多推升标普 500 企业获利的有利因素可能正在逆转,但真正可以保持乐观的原因,在于 AI 将提高生产力。'

刘庆峰:讯飞星火大模型会在 10 月实现中文超越 ChatGPT

科大讯飞董事长刘庆峰表示,认知大模型已经成为通用人工智能的曙光,目前纯大模型仍存在缺陷,包括无法及时更新知识、事实类问答容易'张冠李戴'、对传统典籍容易出现编造情节等。他还表示,现在讯飞星火离 ChatGPT 只有一步之遥,与 100 分相比只差两分,在今年 10 月份之前就会超越它。

目录

  1. 01 技术前瞻
  2. 02 企业动态
  3. 03 政策法规
  4. 04 专家观点
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 无人机路径规划算法详解
  • C++ IO 流与类型转换核心解析
  • 企业微信群机器人 Webhook 配置与消息发送指南
  • ComfyUI 与 Hugging Face 模型共享快速上手指南
  • Flutter for OpenHarmony 实战:使用 money2 实现高精度金融计算
  • 前端实战:如何让用户回到上次阅读的位置?
  • OpenAI 集成 LangChain 操作实战详解
  • 5 款免费股票数据 API 实测对比:从 AkShare 到 BaoStock
  • 智能梯控系统设计方案:跨品牌群控与 AI 调度架构解析
  • 宇树 G1 机器人 SDK2 开发指南:环境搭建至 Demo 测试
  • 前端 JS 资源加载失败怎么办?重试与多源容灾方案实战
  • 文心一言 4.5 开源模型深度解析:性能优化与中文场景应用
  • Python Django 在线音乐播放平台项目实战
  • CCF-CSP 第 38 次认证第二题:机器人复健指南
  • MCP 教程:将 Figma 设计稿转化为前端代码
  • Python 最新版安装指南:Windows、macOS 与 Linux 全系统适配
  • 【AI】谷歌TurboQuant算法:内存占用减少至少6倍
  • GitHub 教育认证通过后如何领取 Copilot Pro
  • Android 陀螺仪开发:从传感器数据到角度积分实战
  • 2026 高校论文 AI 率新规与 AIGC 检测要求汇总

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online