一周科技热点：苏姿丰谈芯片多元化，Gartner 预测 GenAI 趋势

01 企业动态

OpenAI 计划从非营利组织向营利组织转型

日前，路透社报道称，OpenAI 正在制定一项计划，将其核心业务重组为一家营利性公司，摆脱非营利性董事会的控制。营利性公司是一种法律结构，允许公司同时追求财务利润和社会或环境目标，表面上是在股东利益和造福社会的更广泛使命之间取得平衡。根据新计划，OpenAI 首席执行官 Sam Altman 将首次获得营利性公司的股权。

传奇电影制片人詹姆斯·卡梅隆加入 Stability AI 董事会

日前，生成式人工智能公司 Stability AI 宣布，传奇电影制片人、技术创新者和视觉特效先驱 James Cameron 已加入其董事会。James Cameron 一直是将尖端技术与富有远见的故事讲述相结合的推动力。作为导演、编剧和制片人，他突破了电影的界限，将一些最具标志性、技术最先进的电影呈现在观众面前，其中包括《终结者》、《异形》、《泰坦尼克号》和《阿凡达》等电影。Cameron 的加盟标志着 Stability AI 在改变视觉媒体方面迈出了重要一步。

Google DeepMind 发布两款更新 Gemini 模型

日前，Google DeepMind 发布了两款更新的可用于生产的 Gemini 模型：Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相较 1.5 Pro 降价超 50%，提高了费率限制，且更新了默认过滤器设置。这些新模型以最新发布的实验模型为基础，并对 5 月份发布的 Gemini 1.5 模型进行了重大改进。开发人员可通过 Google AI Studio 和 Gemini API 免费访问最新模型。

OpenAI 学院启动中：利用 AI 解决困难问题，促进经济增长

OpenAI 正在启动 OpenAI 学院，该学院将投资于利用人工智能帮助解决棘手问题并促进社区经济增长的开发人员和组织。该学院将确保人工智能的变革潜力能够为全球不同社区所利用和受益，首先从中低收入国家开始。获得人工智能等尖端技术有助于加强推动可持续发展的努力。投资培养当地的人工智能人才，可以推动医疗、农业、教育和金融等领域的经济增长和创新。

收购传闻四起，英特尔推出全新 AI 芯片

日前，英特尔发布了两款人工智能芯片，试图改善其数据中心业务，并从竞争对手 AMD 和英伟达手中抢夺市场份额。这两款新芯片——Xeon 6 CPU 和 Gaudi 3 人工智能加速器——有望提高性能和能效，英特尔正试图证明自己有能力成为人工智能领域的主要参与者。此前，《华尔街日报》报道称，高通公司（QCOM）可能收购英特尔，以加强自己的芯片业务。

Meta 发布全新开放模型系列 Llama 3.2

日前，Meta 发布了 Llama 3.2，其中包括适用于边缘和移动设备的中小型视觉 LLM（11B 和 90B）以及轻量级纯文本模型（1B 和 3B），包括预训练和指令微调版本。Llama 3.2 1B 和 3B 模型支持 128K token 的上下文长度，在边缘本地运行的设备用例（如摘要、指令跟随和改写任务）中处于同类产品的领先水平。

OpenAI 对 ChatGPT Plus 和 Team 用户开放高级语音功能

日前，OpenAI 官宣，正式对 ChatGPT Plus 和 Team 用户开放高级语音功能，并在一周内逐步全量推送。同时，高级语音功能还新增了自定义指令、记忆、五种新语音和改进的口音。据介绍，用户可以通过自定义指令让模型以某种口音发音、记住事件以及如何被称呼等。

02 技术前瞻

Meta 团队推出个性化图像生成模型 Imagine Yourself

在这项工作中，Meta 团队推出了 Imagine Yourself ——一种专为个性化图像生成而设计的 SOTA 模型。与传统的基于微调的个性化技术不同，Imagine Yourself 是一种无需额外微调模型，它使所有用户都能利用共享框架，而无需进行个性化微调。

之前的工作在平衡身份保护、遵循复杂提示和保持良好视觉质量方面遇到了挑战，导致模型具有很强的参考图像复制粘贴效果，很难根据需要对参考图像进行重大改变的提示生成图像，如改变面部表情、头部和身体姿势，而且生成图像的多样性很低。

为了解决这些局限性，他们提出的方法引入了：

1）一种新的合成配对数据生成机制，以鼓励图像多样性；

2）一种完全并行的注意力架构，包含三个文本编码器和一个完全可训练的视觉编码器，以提高文本的忠实度；

3）一种新颖的从粗到细的多级微调方法，逐步推进视觉质量的边界。

研究表明，Imagine Yourself 超越了其他 SOTA 的个性化模型，在身份保护、视觉质量和文本对齐方面表现出卓越的能力。该模型为各种个性化应用奠定了坚实的基础。与之前的个性化模型相比，人类评估结果验证了该模型在身份保持、文本忠实性和视觉吸引力都达到了 SOTA。

一周科技热点：苏姿丰谈芯片多元化，Gartner 预测 GenAI 趋势

01 企业动态

OpenAI 计划从非营利组织向营利组织转型

传奇电影制片人詹姆斯·卡梅隆加入 Stability AI 董事会

Google DeepMind 发布两款更新 Gemini 模型

OpenAI 学院启动中：利用 AI 解决困难问题，促进经济增长

收购传闻四起，英特尔推出全新 AI 芯片

Meta 发布全新开放模型系列 Llama 3.2

OpenAI 对 ChatGPT Plus 和 Team 用户开放高级语音功能

02 技术前瞻

Meta 团队推出个性化图像生成模型 Imagine Yourself

更多推荐文章

相关免费在线工具

清华团队推出多模态科学推理能力评估基准 VisScience

OpenAI o1 医学初步研究：我们离 AI 医生更近了吗？

Time-MoE：十亿级规模时间序列基础模型

视觉大语言模型的视觉提示新技术

Google DeepMind 推出鲁棒奖励模型 RRM

HyperAgent：解决大规模编码任务的通用软件工程智能体

语言智能体帮助大语言模型更好、更便宜地'思考'

03 政策法规

好莱坞大力支持加州人工智能安全法案

美国劳工部发布人工智能和包容性招聘框架，避免招聘歧视

OpenAI、微软、谷歌等签署欧盟《人工智能公约》

04 专家观点

苏姿丰：芯片行业不能只盯着 GPU

贝恩公司：AI 相关产品市场有望在 2027 年达到 9900 亿美元

Gartner 发布 2024 年新兴技术成熟度曲线：GenAI 即将越过期望膨胀期

05 其他

Hugging Face 上诞生了 100 万个人工智能模型

微软亚洲研究院牵手'600 号'，用 AI 干预阿尔茨海默症治疗

AI 模型会比人类研究员产生更多原创性想法吗？

黑客在 ChatGPT 中植入虚假记忆，永久窃取用户数据

罕见基因变异如何影响健康？人工智能提供更准确的预测

AI 可以更好地预测乳腺癌风险

AI 帮助考古学家发现 303 个未知地画

更多推荐文章

相关免费在线工具

一周科技热点：苏姿丰谈芯片多元化，Gartner 预测 GenAI 趋势

01 企业动态

OpenAI 计划从非营利组织向营利组织转型

传奇电影制片人詹姆斯·卡梅隆加入 Stability AI 董事会

Google DeepMind 发布两款更新 Gemini 模型

OpenAI 学院启动中：利用 AI 解决困难问题，促进经济增长

收购传闻四起，英特尔推出全新 AI 芯片

Meta 发布全新开放模型系列 Llama 3.2

OpenAI 对 ChatGPT Plus 和 Team 用户开放高级语音功能

02 技术前瞻

Meta 团队推出个性化图像生成模型 Imagine Yourself

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

清华团队推出多模态科学推理能力评估基准 VisScience

OpenAI o1 医学初步研究：我们离 AI 医生更近了吗？

Time-MoE：十亿级规模时间序列基础模型

视觉大语言模型的视觉提示新技术

Google DeepMind 推出鲁棒奖励模型 RRM

HyperAgent：解决大规模编码任务的通用软件工程智能体

语言智能体帮助大语言模型更好、更便宜地'思考'

03 政策法规

好莱坞大力支持加州人工智能安全法案

美国劳工部发布人工智能和包容性招聘框架，避免招聘歧视

OpenAI、微软、谷歌等签署欧盟《人工智能公约》

04 专家观点

苏姿丰：芯片行业不能只盯着 GPU

贝恩公司：AI 相关产品市场有望在 2027 年达到 9900 亿美元

Gartner 发布 2024 年新兴技术成熟度曲线：GenAI 即将越过期望膨胀期

05 其他

Hugging Face 上诞生了 100 万个人工智能模型

微软亚洲研究院牵手'600 号'，用 AI 干预阿尔茨海默症治疗

AI 模型会比人类研究员产生更多原创性想法吗？

黑客在 ChatGPT 中植入虚假记忆，永久窃取用户数据

罕见基因变异如何影响健康？人工智能提供更准确的预测

AI 可以更好地预测乳腺癌风险

AI 帮助考古学家发现 303 个未知地画

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具