PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线 | 极客日志

PythonAI算法

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

介绍基于 PaddleNLP 完成命名实体识别（NER）任务的完整流程。涵盖环境配置、数据准备、模型训练（命令行与 API）、静态图导出及 Paddle Serving 服务部署。内容包含 ERNIE-CRF 模型选择、MSRA 数据集处理、性能优化策略及工程实践建议，适用于中文场景下的工业级落地。

乱七八糟发布于 2026/3/24更新于 2026/5/1921K 浏览

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

在智能客服、电子病历解析或金融舆情监控中，我们常常需要从一段非结构化文本里快速提取出'人名''地名''组织机构'等关键信息。这类需求本质上就是**命名实体识别（NER）**任务。然而，真正将一个 NER 模型从实验跑通到线上稳定运行，并不是简单调用几行 API 就能搞定的——它涉及环境配置、数据处理、训练调优、格式转换和高并发服务部署等一系列工程挑战。

如果你正在寻找一条清晰、可复现、且适合中文场景的端到端实现路径，那么基于百度开源生态的 PaddlePaddle + PaddleNLP 组合或许是最务实的选择之一。这套国产技术栈不仅对中文语义理解做了深度优化，还打通了从训练到推理的服务闭环，尤其适用于有信创要求或希望规避国外框架依赖的项目。

下面我将以一个真实落地的视角，带你走完从 git clone 开始，到最后通过 HTTP 接口完成实体抽取的完整流程。过程中不讲空话，只聚焦你能直接用上的操作细节与避坑经验。

为什么选 PaddleNLP 做中文 NER？

先说结论：对于中文 NER 任务，PaddleNLP 相比 PyTorch+Transformers 方案，在开箱即用性、部署一致性与本土适配上更具优势。

很多人习惯用 HuggingFace Transformers 做 NLP 任务，这没问题。但在实际工程中你会发现：

中文分词效果不稳定？BERT 默认的 WordPiece 对中文粒度不够友好；
模型转 ONNX 后精度下降？不同框架间算子映射存在差异；
推理延迟高？缺少针对国产硬件的底层优化；

而 PaddleNLP 从一开始就为中文场景设计。比如它的 ERNIE 系列模型引入了'实体感知预训练'，能更好捕捉'阿里巴巴集团'这样的复合名词；再如其内置的 Jieba+WordPiece 混合分词策略，在保持 BPE 通用性的同时提升了中文切分准确率。

更重要的是，整个链路是原生自洽的：你在 PaddleNLP 里训练的模型，可以直接导出为 Paddle Inference 格式，由 Paddle Serving 加载提供服务，无需任何中间转换步骤。这种'研运一体'的设计理念，极大降低了线上出问题的概率。

环境准备与代码获取

一切始于一次简单的克隆：

git clone https://github.com/PaddlePaddle/PaddleNLP.git
cd PaddleNLP

接着安装开发模式依赖：

pip install -e .

⚠️ 建议使用 Python 3.8+ 和 PaddlePaddle 2.6 以上版本。若需 GPU 支持，请确保已正确安装 CUDA 驱动并配置 cuDNN。

你可以通过以下命令验证安装是否成功：

import paddle
print(paddle.__version__)
print(paddle.is_compiled_with_cuda()) # 应返回 True（如有 GPU）

此时你的本地环境已经具备运行 PaddleNLP 所有示例的能力。接下来我们可以直接进入 NER 实战环节。

数据准备：让模型'看懂'你要识别什么

NER 本质是一个序列标注任务。输入是一串字或词，输出是每个位置对应的标签，常用 BIO 或 BILUO 编码。例如：

文本：北 京 协 和 医 院
标签：B-LOC I-LOC I-LOC I-LOC E-LOC

PaddleNLP 支持多种数据集格式，包括内置的、等公开数据集，也允许你自定义读取逻辑。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

msra_ner

clue_ner

wget https://s3.cn-north-1.amazonaws.com.cn/datasets.msra.cn/msra_ner.zip
unzip msra_ner.zip -d ./datasets/msra_ner/

python examples/ner/ernie_crf/run_ner_crf.py \
 --model_type ernie \
 --model_name_or_path ernie-gram-zh \
 --train_set ./datasets/msra_ner/train.txt \
 --dev_set ./datasets/msra_ner/dev.txt \
 --test_set ./datasets/msra_ner/test.txt \
 --do_train True \
 --do_predict True \
 --max_seq_length 128 \
 --batch_size 32 \
 --learning_rate 5e-5 \
 --num_train_epochs 10 \
 --output_dir ./ernie_ner_checkpoints/

model_state.pdparams # 模型参数
training_args.json # 训练配置
vocab.txt # 分词表

from paddlenlp.transformers import ErnieTokenizer, ErnieForTokenClassification
from paddlenlp.datasets import load_dataset
import paddle

# 加载 tokenizer 和模型
tokenizer = ErnieTokenizer.from_pretrained('ernie-gram-zh')
model = ErnieForTokenClassification.from_pretrained('ernie-gram-zh', num_classes=7)

# 自定义数据处理函数
def tokenize_and_align_labels(example):
    words = example['tokens'] # 如 ['北', '京']
    labels = example['labels'] # 如 [0, 1]
    tokenized_inputs = tokenizer(
        words,
        is_split_into_words=True,
        max_seq_len=128,
        return_length=True,
        return_attention_mask=True
    )
    # 对齐标签（注意 subword 情况下的标签偏移）
    word_ids = tokenized_inputs.pop("word_ids")
    label_ids = []
    for word_id in word_ids:
        if word_id is None:
            label_ids.append(-100)
        else:
            label_ids.append(labels[word_id])
    tokenized_inputs["labels"] = label_ids
    return tokenized_inputs

# 加载并处理数据集
train_ds = load_dataset('msra_ner', splits='train')
train_ds = train_ds.map(tokenize_and_align_labels)

# 创建 DataLoader
train_loader = paddle.io.DataLoader(
    train_ds,
    batch_size=32,
    shuffle=True,
    collate_fn=lambda x: {k: paddle.stack([d[k] for d in x]) for k in x[0]}
)

python export_model.py \
 --model_type ernie \
 --model_path ./ernie_ner_checkpoints/best_model \
 --output_path ./inference_model/

pip install paddle_serving_server_gpu # GPU 版
pip install paddle_serving_client

port: 9292
workers: 4
model_config:
  - name: ner_model
    type: ernie_ner
    runtime: pd_gpu
    model_data_path: ./inference_model/

python -m paddle_serving_server.serve --config config.yml --thread 10

from paddle_serving_client import Client
client = Client()
client.load_client_config("./inference_model/inference.pdmodel")
client.connect(['127.0.0.1:9292'])
text = "张伟在北京协和医院就诊" # 需先分词并对齐输入格式
words = list(text)
feed = {"tokens": words}
result = client.predict(feed=feed, fetch=["labels"])
print(result)

curl -X POST http://127.0.0.1:9292/ner/prediction \
-H "Content-Type: application/json" \
-d '{"tokens": ["李", "强", "在", "浙", "江", "大", "学"]}'
# 返回示例
{"predictions": ["B-PER", "E-PER", "O", "B-LOC", "I-LOC", "I-LOC", "E-LOC"]}

优化手段	效果
启用 Batching	提升 GPU 利用率，吞吐翻倍
使用 TensorRT	显存占用降低 30%，延迟下降 40%
模型蒸馏为 TinyBERT	参数量缩小 80%，速度提升 3 倍

graph TD
A[客户端] --> B[Paddle Serving]
B --> C[Paddle Inference Engine]
C --> D{GPU/CPU 资源}
C --> E[PDModel 模型文件]
F[训练平台] --> G[PaddleNLP]
G --> H[导出静态图]
H --> E

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

为什么选 PaddleNLP 做中文 NER？

环境准备与代码获取

数据准备：让模型'看懂'你要识别什么

更多推荐文章

相关免费在线工具

模型选择与训练：一键启动还是精细控制？

方式一：命令行快速训练（推荐初学者）

方式二：Python API 细粒度操控（适合进阶用户）

模型导出：从动态图到静态图推理

服务部署：用 Paddle Serving 暴露 API 接口

安装与配置

发起预测请求

实战中的常见问题与应对策略

1. 中文实体边界模糊怎么办？

2. 标注数据太少怎么破？

3. 推理性能跟不上 QPS 需求？

系统架构与工程实践建议

写在最后：这条技术链的价值在哪？

更多推荐文章

相关免费在线工具

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

PaddleNLP 命名实体识别 NER 任务全流程：从代码拉取到部署上线

为什么选 PaddleNLP 做中文 NER？

环境准备与代码获取

数据准备：让模型'看懂'你要识别什么

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

模型选择与训练：一键启动还是精细控制？

方式一：命令行快速训练（推荐初学者）

方式二：Python API 细粒度操控（适合进阶用户）

模型导出：从动态图到静态图推理

服务部署：用 Paddle Serving 暴露 API 接口

安装与配置

发起预测请求

实战中的常见问题与应对策略

1. 中文实体边界模糊怎么办？

2. 标注数据太少怎么破？

3. 推理性能跟不上 QPS 需求？

系统架构与工程实践建议

写在最后：这条技术链的价值在哪？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具