
生成式 AI 对企业的影响、应用场景及实现路径解析
生成式 AI 通过学习大量原始内容生成新数据,为企业带来创新机会与自动化潜力。2023 年是中国大模型发展元年,通用大模型快速迭代推动市场发展。企业重点转向投资回报率用例,从低风险内部场景向核心业务场景部署。生成式 AI 将在内容消费、生成及技术创造领域产生颠覆模式。大模型趋势包括模型瘦身、开源挑战闭源、领域垂直化、商业化、监管加强、多模态拓展及 AI Ag…
博客作者
这位作者暂未填写个人简介。
187
已发布文章
3.6K
博客获赞
50K
博客浏览
第 9 页

生成式 AI 通过学习大量原始内容生成新数据,为企业带来创新机会与自动化潜力。2023 年是中国大模型发展元年,通用大模型快速迭代推动市场发展。企业重点转向投资回报率用例,从低风险内部场景向核心业务场景部署。生成式 AI 将在内容消费、生成及技术创造领域产生颠覆模式。大模型趋势包括模型瘦身、开源挑战闭源、领域垂直化、商业化、监管加强、多模态拓展及 AI Ag…

从零构建大型语言模型(LLM)的核心流程与技术细节。内容涵盖 Transformer 架构解析、数据预处理与分词策略、预训练与微调方法、以及模型评估与部署。通过理论讲解与代码示例,帮助读者深入理解 LLM 的工作原理,掌握从设计到落地的关键技术步骤,适用于希望深入了解人工智能底层机制的开发者。

详细讲解了 Kotlin 中类继承结构的核心概念。内容包括接口的定义、多接口实现及默认方法冲突解决;open、final、abstract 等修饰符的使用机制及其与 Java 的区别;可见性修饰符 public、internal、protected、private 的作用范围及编译差异;嵌套类与内部类的区别及序列化注意事项;以及密封类 sealed 如何限制…

Token 是自然语言处理中处理文本的最小单元,可以是单词、子词或字符。解析了 Token 的定义、拆分机制及 Token/s 性能指标,对比了不同模型对 Token 的处理差异,并介绍了常见的分词算法如 BPE 和 WordPiece,最后通过 Python 代码示例演示了如何计算文本的 Token 数量。

中科大等团队发现现有大模型在视觉基准测试中表现优异可能源于数据泄露或题目本身无需看图。研究指出评估样本缺乏视觉依赖性及训练数据泄露是两大主因。为此团队提出 MMStar 新基准,包含 1500 个高视觉依赖性样本,并引入多模态增益与泄露指标。实测显示 GPT-4V 等新模型在精细感知、逻辑推理等维度仍未及格,揭示了当前多模态评估的不足及改进方向。

微软研究院在论文《Instruction Tuning with GPT-4》中首次采用 GPT-4 作为教师模型进行指令微调。研究构建了包含 52k 中英文指令遵循数据及比较反馈数据的集合,基于 LLaMA 7B 训练了 LLaMA-GPT4 和 LLaMA-GPT4-CN 模型,并开发了奖励模型。实验通过人类评估、GPT-4 自动评估及非自然指令测试验证…

AI 大模型是人工智能领域的重大突破,基于海量数据预训练,具备强大的语言理解和生成能力。解析大模型的核心技术原理、应用场景及产业价值,并提供了从零开始的学习路径,涵盖数学基础、Transformer 架构、提示词工程、RAG 检索增强生成、微调技术及部署优化等内容,帮助读者系统掌握大模型开发技能,应对行业变革。

20 道产品经理常见面试题,涵盖自我介绍、职业规划、核心能力、项目经验及竞品分析等维度。针对每道题提供回答思路与范例,帮助求职者梳理逻辑,展现用户思维、数据驱动及跨部门协作能力。内容包含从 0 到 1 的项目复盘、优势匹配及劣势应对策略,适用于电商、SaaS 等领域产品岗位的面试准备。文章还补充了需求变更处理、路线图制定、技术冲突解决等实战场景问题,旨在全面…

如何利用 Ollama 和 AnythingLLM 搭建本地 RAG 知识库。首先阐述了 RAG 技术的原理及其相对于传统 LLM 的优势,随后详细演示了 Ollama 环境的安装、Qwen2.5 模型的拉取与运行,以及 AnythingLLM 的部署与配置流程。文章涵盖了服务器模式启动、嵌入模型与向量数据库的选择、知识库文件的上传与管理,并补充了进阶优化建…

Python 编程语言的主要应用场景、核心特点及语言生态地位。重点详细讲解了 Python 的标量数据类型,包括 NoneType、字符串、数值类型和布尔值的特性与用法,并通过代码示例展示了类型转换和常见操作。文章还补充了学习建议和最佳实践,旨在帮助读者建立系统的 Python 基础知识框架,适用于初学者入门及进阶参考。

探讨了角色扮演大模型的产品设计核心与训练实战经验。产品设计需注重角色一致性与沉浸感,区分通用助手与拟人化角色的差异,针对年轻女性及二次元用户群体优化交互体验。训练方面强调数据质量优于数量,通过丰富人设卡、小说语料及导演式生成对话来构建数据集,警惕合成数据的偏见。微调阶段建议采用全参数微调以提升用词高级感,合理配比通用与专有数据,并建立人工评估集结合线上指标进…

国内主流大模型平台(包括 DeepSeek、智普 AI、Kimi、字节豆包、讯飞星火、通义千问)的 Python API 接入方法。内容涵盖环境配置、SDK 安装、代码实现示例(含流式与非流式调用)、参数调优建议及安全规范。文章还总结了 API 调用的通用模式,提供了错误处理策略,并规划了从基础认知到应用开发的学习路径,旨在帮助开发者快速上手大模型开发并进行…

2025 年人工智能发展迅速,梳理了相关趋势并提供了详细的大模型学习路径。内容涵盖系统设计、提示词工程、平台应用、知识库开发(RAG/LangChain)、微调技术、多模态应用及行业落地七大阶段。旨在帮助开发者掌握全栈工程能力,利用大模型解决实际问题,包括数据处理、垂直训练及部署,最终提升编码与分析能力以适应行业需求。

Flutter 跨平台开发框架的学习路径与核心技术点。内容涵盖 Flutter 的应用场景、Dart 语言基础(包括异步编程、Stream、FFI)、Flutter 核心组件(布局、容器、动画、自定义绘制)、状态管理策略、网络请求处理以及项目架构设计。文章旨在帮助开发者从零开始掌握 Flutter,通过实战案例理解 Widget 树、渲染管线及国际化等关键概…

Python 爬虫数据分析的核心概念、技术流程及常用工具库。内容涵盖爬虫工作原理、数据清洗与分析方法,以及 requests、BeautifulSoup、pandas 和 matplotlib 等库的实战代码示例。通过解析网页、提取数据、存储处理到可视化展示的全链路讲解,帮助读者掌握利用 Python 进行数据采集与分析的基础技能,适用于数据挖掘与商业智能场…

详细阐述了信息系统安全等级保护(等保)的定级概念、核心意义及实施流程。内容涵盖从确定定级对象到公安机关备案的五个关键步骤,对比了自上而下与自下而上的定级方法,并强调了客观性、适用性等原则。此外,文章补充了不同安全等级的具体技术要求与管理要求,指出了动态复核、协同建设及常见误区等注意事项,旨在帮助读者全面理解等保合规工作,构建完善的网络安全防护体系。

详细解析了网络安全行业的核心岗位,包括安全产品、运营分析、攻防应急三大方向及其所需技能。内容涵盖网络基础、操作系统、数据库及编程语言的学习顺序,提供了从零基础到进阶的系统化学习路线,旨在帮助初学者明确职业定位并掌握关键安全技术。

梳理了网络安全从业者可考的四大类证书体系,包括国家职业技能等级认定、软考、NISP、CISP、CISAW 及 CCSS。详细介绍了各证书的颁发机构、适用人群、效用及报考建议。旨在帮助从业者根据自身发展阶段选择合适的认证,提升职业竞争力,满足企业合规及项目投标需求。

网络安全挖洞的实战流程,涵盖工具准备、常见漏洞挖掘方法及提交规范。内容包括 FOFA、鹰图等测绘引擎的语法使用,弱口令、XSS、SQL 注入及文件上传漏洞的检测技巧。文章还阐述了漏洞提交平台的利弊分析、报告撰写标准及修复建议,并强调了法律边界与伦理原则,旨在帮助安全从业者建立规范的渗透测试工作流。

Pandas 作为 Python 数据分析的核心工具,掌握其基础操作至关重要。内容涵盖 DataFrame 创建、数据探索、切片选取及常用函数应用。通过字典构建数据框、读取本地文件、查看统计信息、布尔索引筛选以及分组聚合等操作,帮助初学者快速上手数据处理流程,提升分析效率。重点讲解了条件筛选中的符号规范、字符串处理方法以及分组统计的实际应用场景。