StructBERT 中文情感分类 WebUI 实现与多语言切换 | 极客日志

PythonAI算法

StructBERT 中文情感分类 WebUI 实现与多语言切换

介绍基于 StructBERT 模型构建的中文情感分类 WebUI 项目，支持单文本与批量分析，提供中英文界面切换。采用 Python、PyTorch、Gradio 及 Transformers 技术栈。内容包括环境配置、核心代码实现（模型加载、推理优化）、部署脚本及电商评论、社交媒体监控等应用场景。旨在为用户提供便捷的情感分析工具，支持 API 集成与批量处理，适用于个人及企业场景。

岁月神偷发布于 2026/4/6更新于 2026/7/640 浏览

StructBERT 中文情感分类 WebUI 实现与多语言切换

基于百度 StructBERT 模型的中文情感分类 WebUI，支持中英文界面切换，让非技术用户也能轻松进行情感分析

1. 项目概述与环境准备

StructBERT 中文情感分类模型是百度基于 StructBERT 预训练模型微调后的经典模型，专门用于识别中文文本的情感倾向（正面/负面/中性）。这个模型在中文 NLP 领域有着很好的效果和效率平衡，特别适合实际业务应用。

本项目提供了一个完整的 WebUI 界面，支持单文本和批量情感分析，并且实现了中英文界面切换功能，让不同语言习惯的用户都能方便使用。

环境要求：

Python 3.8+
PyTorch 1.8+
Gradio 3.0+
至少 4GB 内存

快速安装：

# 创建 conda 环境
conda create -n sentiment python=3.8
conda activate sentiment
# 安装核心依赖
pip install torch gradio flask transformers

2. WebUI 界面功能详解

2.1 单文本情感分析

单文本分析是最常用的功能，适合快速检查一段文字的情感倾向：

打开 WebUI 界面：访问 http://localhost:7860
输入待分析文本：在文本框中输入中文内容
点击分析按钮：获取情感倾向和置信度
查看详细结果：包括情感标签和概率分数

使用示例：

输入："这个产品真的很好用，推荐购买！"
输出：积极情感（置信度 98%）

2.2 批量文本分析

批量分析功能适合处理大量文本数据，比如用户评论分析：

准备数据：每行一个文本，支持中文内容
粘贴到输入框：将多条文本粘贴到批量分析区域
开始批量分析：系统会自动处理所有文本
查看结果表格：包含原文、情感标签、置信度等信息

批量处理优势：

一次性处理上百条文本
结果以表格形式展示，方便导出
支持大规模情感分析任务

3. 多语言界面实现详解

3.1 中英文切换核心代码

实现多语言界面的关键在于使用 Gradio 的语言切换功能和动态界面更新：

import gradio as gr
from typing import Dict

LANGUAGE_TEXT = {
    "zh": {
        "title": "StructBERT 中文情感分析",
        : ,
        : ,
        : ,
        : ,
        : ,
        : ,
        : 
    },
    : {
        : ,
        : ,
        : ,
        : ,
        : ,
        : ,
        : ,
        : 
    }
}

 ():
    
    texts = LANGUAGE_TEXT[lang]
     gr.Blocks(title=texts[])  demo:
        gr.Markdown()
        
         gr.Row():
            lang_btn = gr.Radio(
                choices=[, ],
                value=  lang ==   ,
                label=
            )
        
         gr.Tab(texts[]):
             gr.Row():
                single_input = gr.Textbox(
                    label=,
                    placeholder=texts[],
                    lines=
                )
             gr.Row():
                analyze_btn = gr.Button(texts[])
             gr.Row():
                output = gr.Label(label=)
        
         gr.Tab(texts[]):
             gr.Row():
                batch_input = gr.Textbox(
                    label=,
                    placeholder=texts[],
                    lines=
                )
             gr.Row():
                batch_btn = gr.Button()
             gr.Row():
                batch_output = gr.Dataframe(
                    headers=[, , ],
                    label=
                )
        
         ():
            new_lang =   selected_lang ==   
             create_interface(new_lang)
        lang_btn.change(update_language, inputs=lang_btn, outputs=demo)
     demo

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 启动多语言界面
demo = create_interface("zh")
demo.launch(
    server_name="0.0.0.0",
    server_port=7860,
    share=False
)

from transformers import BertTokenizer, BertForSequenceClassification
import torch
from typing import List, Dict

class SentimentAnalyzer:
    def __init__(self, model_path: str):
        """初始化情感分析模型"""
        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
        self.tokenizer = BertTokenizer.from_pretrained(model_path)
        self.model = BertForSequenceClassification.from_pretrained(model_path)
        self.model.to(self.device)
        self.model.eval()
        # 情感标签映射
        self.label_map = {0: "negative", 1: "neutral", 2: "positive"}

    def analyze_single(self, text: str):
        """分析单条文本"""
        # 文本编码
        inputs = self.tokenizer(
            text, return_tensors="pt", truncation=True, max_length=512, padding=True
        )
        # 模型预测
        with torch.no_grad():
            inputs = {k: v.to(self.device) for k, v in inputs.items()}
            outputs = self.model(**inputs)
            probabilities = torch.softmax(outputs.logits, dim=-1)
        # 结果解析
        pred_label = torch.argmax(probabilities, dim=-1).item()
        confidence = probabilities[0][pred_label].item()
        return {
            "text": text,
            "sentiment": self.label_map[pred_label],
            "confidence": round(confidence, 4),
            "probabilities": probabilities.tolist()
        }

    def analyze_batch(self, texts: List[str], batch_size: int = 32):
        """批量分析文本，支持大批量处理"""
        results = []
        # 分批处理避免内存溢出
        for i in range(0, len(texts), batch_size):
            batch_texts = texts[i:i + batch_size]
            # 批量编码
            inputs = self.tokenizer(
                batch_texts, return_tensors="pt", truncation=True, max_length=512,
                padding=True, add_special_tokens=True
            )
            # 批量预测
            with torch.no_grad():
                inputs = {k: v.to(self.device) for k, v in inputs.items()}
                outputs = self.model(**inputs)
                probabilities = torch.softmax(outputs.logits, dim=-1)
            # 批量结果处理
            batch_results = []
            for j, probs in enumerate(probabilities):
                pred_label = torch.argmax(probs).item()
                confidence = probs[pred_label].item()
                batch_results.append({
                    "text": batch_texts[j],
                    "sentiment": self.label_map[pred_label],
                    "confidence": round(confidence, 4)
                })
            results.extend(batch_results)
        return results

#!/bin/bash
# start_sentiment.sh
# 激活 conda 环境
conda activate sentiment
# 启动 WebUI 服务
cd /root/nlp_structbert_sentiment-classification_chinese-base
python app/webui.py &
# 启动 API 服务
python app/main.py &
echo "服务启动完成！"
echo "WebUI 地址：http://localhost:7860"
echo "API 地址：http://localhost:8080"

supervisorctl status

# 重启 WebUI
supervisorctl restart nlp_structbert_webui
# 重启 API
supervisorctl restart nlp_structbert_sentiment

# 实时查看 WebUI 日志
supervisorctl tail -f nlp_structbert_webui
# 查看 API 日志
supervisorctl tail -f nlp_structbert_sentiment

# 示例评论数据
reviews = [
    "产品质量很好，物超所值！",
    "快递速度太慢了，等了好几天",
    "包装很精美，适合送礼",
    "功能没有描述的好，有点失望"
]
# 批量分析
analyzer = SentimentAnalyzer(MODEL_PATH)
results = analyzer.analyze_batch(reviews)
for result in results:
    print(f"评论：{result['text']}")
    print(f"情感：{result['sentiment']} (置信度：{result['confidence']})")
    print("-" * 50)

def monitor_social_media(keywords: List[str], platform: str = "weibo"):
    """监控社交媒体情感"""
    # 获取相关帖子
    posts = fetch_posts(keywords, platform)
    # 情感分析
    sentiments = analyzer.analyze_batch(posts)
    # 生成情感报告
    positive_count = sum(1 for s in sentiments if s['sentiment'] == 'positive')
    negative_count = sum(1 for s in sentiments if s['sentiment'] == 'negative')
    return {
        "total_posts": len(posts),
        "positive_rate": positive_count / len(posts),
        "negative_rate": negative_count / len(posts),
        "details": sentiments
    }

StructBERT 中文情感分类 WebUI 实现与多语言切换

StructBERT 中文情感分类 WebUI 实现与多语言切换

1. 项目概述与环境准备

2. WebUI 界面功能详解

2.1 单文本情感分析

2.2 批量文本分析

3. 多语言界面实现详解

3.1 中英文切换核心代码

更多推荐文章

相关免费在线工具

3.2 界面动态更新机制

4. 情感分析核心功能实现

4.1 模型加载与初始化

4.2 批量处理优化

5. 完整部署与使用指南

5.1 一键启动脚本

5.2 服务管理命令

6. 实际应用案例

6.1 电商评论分析

6.2 社交媒体情绪监控

7. 总结与建议

更多推荐文章

相关免费在线工具

StructBERT 中文情感分类 WebUI 实现与多语言切换

StructBERT 中文情感分类 WebUI 实现与多语言切换

1. 项目概述与环境准备

2. WebUI 界面功能详解

2.1 单文本情感分析

2.2 批量文本分析

3. 多语言界面实现详解

3.1 中英文切换核心代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 界面动态更新机制

4. 情感分析核心功能实现

4.1 模型加载与初始化

4.2 批量处理优化

5. 完整部署与使用指南

5.1 一键启动脚本

5.2 服务管理命令

6. 实际应用案例

6.1 电商评论分析

6.2 社交媒体情绪监控

7. 总结与建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具