Ambari-Web-3.0.0本地启动与二开环境搭建

Ambari-Web-3.0.0本地启动与二开环境搭建

目前 Kerberos 章节已经推出 FreeIPA 方案,欢迎有需要的查阅,本站也将完成内容迁移。Ttbigdata——Ambari Kerberos 大全

在这里插入图片描述

一、开发环境与工具说明

本文以 Ambari 3.0.0 为目标版本,介绍 Ambari-Web 的本地启动流程。

1、IDE 与开发方式选择

这里使用 WebStorm 作为 Ambari-Web 二次开发的主要 IDE,原因如下:

  • Node / Yarn / NVM 支持完善
  • 对前端项目运行配置友好
  • 日志、断点、控制台集成度高
说明
Ambari-Web 本质是一个 Ember.js 前端工程,与 ambari-server 后端解耦,
本地启动不依赖 Java、Maven 或 Ambari Server。

二、获取 Ambari-Web 源码

1、源码仓库说明

Ambari 官方仓库地址:

https://github.com/apache/ambari 

本文不再赘述 Git Clone 的基础操作。

2、选择 3.0.0 Release 版本

优先选择 Release 包,而非 master 分支:

https://github.com/apache/ambari/releases/tag/release-3.0.0 
image-20260128102705128

三、打开 Ambari-Web 子工程

1、目录选择原则

下载并解压完成后,不要直接打开 Ambari 根目录

在 WebStorm 中,只需要选择:

ambari/ambari-web 
image-20260128102522583
原因说明
Ambari 根目录同时包含:ambari-server(Java)ambari-agent(Python)ambari-web(前端)

前端二开只需要 ambari-web,避免 IDE 索引大量无关内容。

四、Node 与 Yarn 环境准备

1、Node 版本选择

这里使用 nvm 管理 Node 版本。

nvm install18 nvm use 18
注意
Ambari-Web 对 Node 版本较敏感,Node 20+ 在部分依赖场景下会触发构建异常,
建议直接使用 Node 18 LTS

2、启用 corepack 与 Yarn

corepack enablenpminstallyarn -g 

3、配置国内镜像(强烈建议)

yarn config set registry https://registry.npmmirror.com npm config set registry https://registry.npmmirror.com 

4、清理历史依赖并安装

rm -rf node_modules rm -f yarn.lock yarninstall --ignore-engines yarn config set ignore-engines true
说明
Ambari-Web 的部分依赖声明较老,
--ignore-engines必要操作,否则极易卡在依赖校验阶段。

五、WebStorm 启动配置

1、运行配置参数

在 WebStorm 的 Run / Debug Configuration 中新增 Node.js 配置:

  • Commandrun
  • Scriptsstart
  • Node runtime:选择 nvm 中的 Node 18
  • Package manager:选择 nvm 安装的 yarn
image-20260128103145720

2、启动 Ambari-Web

配置完成后,直接点击运行。

image-20260128103547065

六、访问本地 Ambari-Web

启动成功后,默认监听端口为:

http://localhost:3333 
到这里说明
Ambari-Web 已经可以:正常编译本地热更新断点调试 Ember 逻辑

Read more

whisper学习QA

一、“whisper-large-v3采用了更多的数据,达到了惊人的500万小时(一年=8765.81277 小时),其中100万小时是弱标签,400万小时是v2生成的。” 什么是弱标签? “弱标签”(weak labels)在机器学习和语音识别领域中,通常指的是不完全准确、不精细或由自动化方法生成的标签,而不是由人工专家仔细标注的“强标签”(strong labels)。 在 Whisper-large-v3 的上下文中: * 100万小时的弱标签数据:可能是指这些语音数据的转录文本不是由人工逐字校对的,而是通过某种自动语音识别(ASR)系统、机器翻译、或者基于已有元数据(如视频字幕、播客脚本等)粗略对齐得到的。这类标签可能存在错误、时间对齐不准、或内容不完整等问题。 * 相比之下,“强标签”数据通常是高质量、人工审核或精确对齐的语音-文本对。 弱标签的特点: * 成本低:可以大规模自动获取。 * 噪声大:包含错误或不一致。 * 仍具价值:在大规模预训练中,即使带噪声的数据也能帮助模型学习语言和声学模式,尤其是在自监督或半监督学习框架下。 Whisper

【AIGC】AI工作流workflow实践:构建日报

【AIGC】AI工作流workflow实践:构建日报

workflow实践 * 引言 * 实现步骤分析 * 实践 * 创建 dify workflow 应用 * 创建工作流内部节点 * 1、设置输入字段 * 2、创建两个LLM节点 * 3、设置结束节点 * 运行工作流 * 结语 引言 工作流 workflow 是现在 LLM 很重要的一个概念,因为对于一个模型来说,非常复杂的问题很难一次性完美解决,而且可能需要很多别的辅助工具。而工作流就是将这些工具和模型组合起来,形成一个完整的解决方案。今天我们来做个工作流实践,帮助读者理解工作流。我们来构建一个帮助我们写日报的工作流。在帮助我们完成日报的填写的同时,我们需要它进行 AI 味的去除,免得出现别人一看就是 AI 写出来的文章的情况。 实现步骤分析 1. 我们需要一个可以构建工作流的平台,这边我们选择 dify 2. 我们需要模型根据我们提供的今天做的事情去自动生成日报 我们需要对刚才生成的文章进行 AI 味的去除 实践 创建

【AIGC】Claude Code Rules配置

建议直接使用别人沉淀好的rules,比如:来自 Anthropic 黑客马拉松获胜者的完整 Claude Code 配置集合。 1. Claude Code Rules 配置基础篇 Claude Code的Rules是用于定义代码规范、安全限制、工作流规则的核心配置机制,能让AI遵循项目特定的开发标准。以下是详细配置方法: 一、规则文件基础配置 1. 规则文件位置与命名 * 单一文件规则(简化版):项目根目录的 CLAUDE.md 或用户主目录的 ~/.claude/CLAUDE.md 全局规则(跨项目复用):用户主目录下的 .claude/rules/ 文件夹 ~/.claude/rules/ 项目级规则(优先级最高):项目根目录下的 .claude/rules/ 文件夹,所有 .md 文件会自动加载 project-root/