基于 nomic-embed-text-v2-moe 与 Gradio 构建多语言文本相似度 WebUI

nomic-embed-text-v2-moe 模型结合 Gradio 框架可搭建多语言文本相似度分析 Web 界面。通过 Ollama 部署模型，支持百种语言语义向量计算。教程提供基础计算、增强分析及完整 WebUI 实现代码，涵盖历史记录管理与性能优化策略。该方案适用于文档去重、内容推荐及语义搜索等实际场景。

嘘发布于 2026/4/8更新于 2026/7/2339 浏览

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

nomic-embed-text-v2-moe 是一款强大的多语言文本嵌入模型，专门用于处理多语言文本检索任务。这个模型在多个关键指标上表现出色，让我们来看看它的核心特点：

多语言能力突出：支持约 100 种语言，经过超过 16 亿对多语言文本的训练，能够准确理解不同语言的语义信息。

性能表现优异：虽然只有 3.05 亿参数，但在多语言检索任务上的表现超越了参数量更大的模型，真正做到了'小而精'。

灵活高效的嵌入维度：采用 Matryoshka 嵌入训练技术，可以将存储成本降低 3 倍，同时保持几乎不损失性能。

完全开源透明：模型权重、训练代码和训练数据全部开源，确保了使用的透明度和可复现性。

为了更直观地了解它的性能优势，我们来看一下与其他主流模型的对比：

模型	参数量 (百万)	嵌入维度	BEIR 得分	MIRACL 得分	开源状态
Nomic Embed v2	305	768	52.86	65.80	完全开源
mE5 Base	278	768	48.88	62.30	部分开源
mGTE Base	305	768	51.10	63.40	部分开源
BGE M3	568	1024	48.80	69.20	部分开源

从表格可以看出，nomic-embed-text-v2-moe 在相对较小的模型尺寸下，取得了相当不错的性能表现。

2. 环境准备与模型部署

2.1 系统要求与依赖安装

在开始之前，确保你的系统满足以下基本要求：

Python 3.8 或更高版本
至少 8GB 内存（推荐 16GB）
支持 CUDA 的 GPU（可选，但推荐用于更好的性能）

首先安装必要的依赖包：

pip install ollama gradio numpy sentence-transformers

2.2 使用 Ollama 部署模型

Ollama 提供了一个简单的方式来管理和运行大语言模型。部署 nomic-embed-text-v2-moe 非常简单：

# 拉取模型
ollama pull nomic-embed-text-v2-moe
# 运行模型
ollama run nomic-embed-text-v2-moe

如果一切顺利，你会看到模型成功加载并准备就绪的输出信息。

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

Gradio 是一个强大的 Python 库，可以快速构建机器学习应用的 Web 界面。让我们创建一个基础的文本相似度应用：

 gradio  gr
 ollama
 numpy  np
 numpy.linalg  norm

 ():
    
    response = ollama.embeddings(model=, prompt=text)
     response[]

 ():
    
    emb1 = get_embedding(text1)
    emb2 = get_embedding(text2)
    
    cosine_sim = np.dot(emb1, emb2) / (norm(emb1) * norm(emb2))
     (cosine_sim)


 gr.Blocks(title=)  demo:
    gr.Markdown()
    gr.Markdown()
     gr.Row():
         gr.Column():
            text1 = gr.Textbox(label=, lines=, placeholder=)
         gr.Column():
            text2 = gr.Textbox(label=, lines=, placeholder=)
    similarity_btn = gr.Button(, variant=)
    output = gr.Textbox(label=, interactive=)
    similarity_btn.click(
        fn=calculate_similarity,
        inputs=[text1, text2],
        outputs=output
    )

 __name__ == :
    demo.launch(server_name=, server_port=)

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

多语言能力突出：支持约 100 种语言，经过超过 16 亿对多语言文本的训练，能够准确理解不同语言的语义信息。

性能表现优异：虽然只有 3.05 亿参数，但在多语言检索任务上的表现超越了参数量更大的模型，真正做到了'小而精'。

灵活高效的嵌入维度：采用 Matryoshka 嵌入训练技术，可以将存储成本降低 3 倍，同时保持几乎不损失性能。

完全开源透明：模型权重、训练代码和训练数据全部开源，确保了使用的透明度和可复现性。

为了更直观地了解它的性能优势，我们来看一下与其他主流模型的对比：

模型	参数量 (百万)	嵌入维度	BEIR 得分	MIRACL 得分	开源状态
Nomic Embed v2	305	768	52.86	65.80	完全开源
mE5 Base	278	768	48.88	62.30	部分开源
mGTE Base	305	768	51.10	63.40	部分开源
BGE M3	568	1024	48.80	69.20	部分开源

从表格可以看出，nomic-embed-text-v2-moe 在相对较小的模型尺寸下，取得了相当不错的性能表现。

2. 环境准备与模型部署

2.1 系统要求与依赖安装

在开始之前，确保你的系统满足以下基本要求：

Python 3.8 或更高版本
至少 8GB 内存（推荐 16GB）
支持 CUDA 的 GPU（可选，但推荐用于更好的性能）

首先安装必要的依赖包：

pip install ollama gradio numpy sentence-transformers

2.2 使用 Ollama 部署模型

Ollama 提供了一个简单的方式来管理和运行大语言模型。部署 nomic-embed-text-v2-moe 非常简单：

# 拉取模型
ollama pull nomic-embed-text-v2-moe
# 运行模型
ollama run nomic-embed-text-v2-moe

如果一切顺利，你会看到模型成功加载并准备就绪的输出信息。

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

Gradio 是一个强大的 Python 库，可以快速构建机器学习应用的 Web 界面。让我们创建一个基础的文本相似度应用：

 gradio  gr
 ollama
 numpy  np
 numpy.linalg  norm

 ():
    
    response = ollama.embeddings(model=, prompt=text)
     response[]

 ():
    
    emb1 = get_embedding(text1)
    emb2 = get_embedding(text2)
    
    cosine_sim = np.dot(emb1, emb2) / (norm(emb1) * norm(emb2))
     (cosine_sim)


 gr.Blocks(title=)  demo:
    gr.Markdown()
    gr.Markdown()
     gr.Row():
         gr.Column():
            text1 = gr.Textbox(label=, lines=, placeholder=)
         gr.Column():
            text2 = gr.Textbox(label=, lines=, placeholder=)
    similarity_btn = gr.Button(, variant=)
    output = gr.Textbox(label=, interactive=)
    similarity_btn.click(
        fn=calculate_similarity,
        inputs=[text1, text2],
        outputs=output
    )

 __name__ == :
    demo.launch(server_name=, server_port=)

import gradio as gr import ollama import numpy as np from numpy.linalg import norm import time import pandas as pd class TextSimilarityAnalyzer: def __init__(self, model_name="nomic-embed-text-v2-moe"): self.model_name = model_name self.history = [] def get_embedding(self, text): """获取文本嵌入向量""" try: response = ollama.embeddings(model=self.model_name, prompt=text) return response['embedding'] except Exception as e: raise Exception(f"获取嵌入向量失败：{str(e)}") def analyze_similarity(self, text1, text2, show_details=False): """分析文本相似度""" start_time = time.time() # 获取嵌入向量 emb1 = self.get_embedding(text1) emb2 = self.get_embedding(text2) # 计算相似度指标 cosine_sim = np.dot(emb1, emb2) / (norm(emb1) * norm(emb2)) processing_time = time.time() - start_time # 保存到历史记录 record = { 'text1': text1, 'text2': text2, 'similarity': cosine_sim, 'timestamp': time.strftime("%Y-%m-%d %H:%M:%S") } self.history.append(record) # 生成结果 similarity_percent = round(cosine_sim * 100, 2) result = { 'similarity_score': similarity_percent, 'processing_time': round(processing_time, 2), 'analysis': self._get_analysis(similarity_percent) } if show_details: result.update({ 'vector_length1': len(emb1), 'vector_length2': len(emb2) }) return result def _get_analysis(self, similarity): """根据相似度得分生成分析文本""" if similarity > 90: return "🌟 文本几乎相同，语义高度一致" elif similarity > 70: return "✅ 文本非常相似，核心含义相同" elif similarity > 50: return "📋 文本有较强相关性，但存在一些差异" elif similarity > 30: return "⚠️ 文本有部分相关性，但差异明显" else: return "🔍 文本差异较大，可能涉及不同主题" # 创建应用界面 def create_web_ui(): analyzer = TextSimilarityAnalyzer() with gr.Blocks(theme=gr.themes.Soft(), title="多语言文本相似度分析") as demo: gr.Markdown(""" # 🌐 多语言文本相似度分析工具使用 nomic-embed-text-v2-moe 模型，支持 100+ 种语言的文本相似度分析 """) with gr.Row(): with gr.Column(scale=1): gr.Markdown("### 📝 输入文本") text1 = gr.Textbox( label="第一个文本", lines=4, placeholder="输入第一段文本（支持中文、英文、法文、德文等多种语言）..." ) text2 = gr.Textbox( label="第二个文本", lines=4, placeholder="输入第二段文本进行比较..." ) advanced = gr.Checkbox(label="显示详细分析", value=False) analyze_btn = gr.Button("开始分析", variant="primary", size="lg") with gr.Column(scale=1): gr.Markdown("### 📊 分析结果") similarity = gr.Number(label="相似度得分 (%)", precision=2) analysis = gr.Textbox(label="分析说明", interactive=False) process_time = gr.Number(label="处理时间 (秒)", precision=2) with gr.Accordion("高级详情", open=False): vec_len1 = gr.Number(label="向量维度 1", interactive=False) vec_len2 = gr.Number(label="向量维度 2", interactive=False) # 历史记录部分 with gr.Accordion("📋 历史记录", open=False): history_df = gr.Dataframe( headers=["时间", "文本 1 片段", "文本 2 片段", "相似度"], interactive=False, height=300 ) clear_btn = gr.Button("清空历史", variant="secondary") # 事件处理 def analyze_texts(text1, text2, show_advanced): result = analyzer.analyze_similarity(text1, text2, show_advanced) outputs = [ result['similarity_score'], result['analysis'], result['processing_time'] ] if show_advanced: outputs.extend([result.get('vector_length1', 768), result.get('vector_length2', 768)]) else: outputs.extend([None, None]) return outputs def update_history(): if not analyzer.history: return pd.DataFrame(columns=["时间", "文本 1 片段", "文本 2 片段", "相似度"]) history_data = [] for record in analyzer.history[-10:]: # 显示最近 10 条记录 text1_preview = record['text1'][:30] + "..." if len(record['text1']) > 30 else record['text1'] text2_preview = record['text2'][:30] + "..." if len(record['text2']) > 30 else record['text2'] history_data.append([ record['timestamp'], text1_preview, text2_preview, f"{record['similarity']*100:.1f}%" ]) return history_data analyze_btn.click( fn=analyze_texts, inputs=[text1, text2, advanced], outputs=[similarity, analysis, process_time, vec_len1, vec_len2] ).then(update_history, outputs=history_df) clear_btn.click( fn=lambda: analyzer.history.clear(), outputs=history_df, show_progress=False ).then(update_history, outputs=history_df) return demo # 启动应用 if __name__ == "__main__": demo = create_web_ui() demo.launch( server_name="0.0.0.0", server_port=7860, share=False )

基于 nomic-embed-text-v2-moe 与 Gradio 构建多语言文本相似度 WebUI

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

2. 环境准备与模型部署

2.1 系统要求与依赖安装

2.2 使用 Ollama 部署模型

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

基于 nomic-embed-text-v2-moe 与 Gradio 构建多语言文本相似度 WebUI

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

2. 环境准备与模型部署

2.1 系统要求与依赖安装

2.2 使用 Ollama 部署模型

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

更多推荐文章

相关免费在线工具

3.2 增强版相似度分析功能

4. 完整的多语言 WebUI 实现

4.1 构建功能完整的界面

4.2 多语言示例测试

5. 实用技巧与最佳实践

5.1 性能优化建议

5.2 常见问题解决

6. 总结

更多推荐文章

相关免费在线工具

基于 nomic-embed-text-v2-moe 与 Gradio 构建多语言文本相似度 WebUI

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

2. 环境准备与模型部署

2.1 系统要求与依赖安装

2.2 使用 Ollama 部署模型

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

基于 nomic-embed-text-v2-moe 与 Gradio 构建多语言文本相似度 WebUI

nomic-embed-text-v2-moe 实战教程：基于 Gradio 构建多语言文本相似度 WebUI

1. 模型简介与核心优势

2. 环境准备与模型部署

2.1 系统要求与依赖安装

2.2 使用 Ollama 部署模型

3. 构建文本相似度 Web 界面

3.1 创建 Gradio 应用基础框架

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 增强版相似度分析功能

4. 完整的多语言 WebUI 实现

4.1 构建功能完整的界面

4.2 多语言示例测试

5. 实用技巧与最佳实践

5.1 性能优化建议

5.2 常见问题解决

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具