Python 风控规则评估与优化库 rulelift 使用指南 | 极客日志

PythonAI算法

Python 风控规则评估与优化库 rulelift 使用指南

综述由AI生成rulelift 是一款用于风控规则实时评估及优化的 Python 库。它解决了传统规则系统效果监控难、稳定性差及缺乏系统性评估的问题。核心功能包括基于用户评级分布的规则智能评估（无需分流）、单特征及多特征交叉规则挖掘、以及决策树规则提取。支持命中率监控、规则相关性分析及策略增益计算。通过 pip 安装即可快速上手，适用于信用风险管理团队提升规则系统的整体效果及稳定性。

岁月神偷发布于 2026/3/23更新于 2026/5/305.7K 浏览

Python 风控规则评估与优化库 rulelift 使用指南

一、规则系统的缺陷

在风控领域，规则系统因其配置便捷性和较强的解释性而被广泛应用，但也存在明显的缺陷：

效果监控难：被规则拒掉的客户没有后续表现数据，无法直接评估规则拦截效果。
稳定性差：规则效果可能随时间漂移，需要定期监控和调整。
评估优化缺乏系统性：手动调整规则耗时耗力，规则之间的相互影响难以评估，容易导致冗余或冲突，陷入局部最优。

二、rulelift 解决方案

rulelift 提供了全面的解决方案，帮助风控团队克服上述挑战：

1. 规则智能评估模块

无需分流及事后标签：基于规则命中用户的评级情况即可评估规则效果。
实时监控：支持基于生产数据的实时规则效果分析。
多维度评估：综合考虑命中率、逾期率、召回率、精确率、lift 值、F1 分数等指标。
规则相关性分析：识别冗余规则，评估规则之间的相互影响。
策略增益计算：评估不同规则组合的效果提升。

2. 规则自动挖掘模块

单特征规则挖掘：自动从单个特征中挖掘有效的风控规则。
多特征交叉规则挖掘：发现特征之间的复杂交叉关系。
决策树规则提取：从决策树模型中提取可解释的规则。
可视化支持：直观展示规则效果和关系。

基于对上线规则的评估结果，我们可以及时发现规则效率低下或不稳定的问题，从而及时调整规则阈值或删减。也可以结合规则挖掘，新增有效规则，提升规则系统的整体效果及稳定性。

快速开始

# 使用 pip 安装（推荐）
pip install rulelift

# 从源码安装
pip install git+https://github.com/aialgorithm/rulelift.git

基本使用示例

# 加载示例数据
from rulelift import load_example_data, analyze_rules, DecisionTreeRuleExtractor

# 1. 规则评估示例（使用用户评级评估）
print("=== 规则评估示例（使用用户评级） ===")
hit_rule_df = load_example_data('hit_rule_info.csv')
result = analyze_rules(hit_rule_df, user_level_badrate_col='USER_LEVEL_BADRATE')
print()
(result[[, , ]].head())


()
feature_df = load_example_data()
dt_miner = DecisionTreeRuleExtractor(
    feature_df,
    target_col=,
    exclude_cols=[, ],
    max_depth=,
    min_samples_leaf=
)
dt_rules = dt_miner.extract_rules()
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

评级	客户占比	对应坏账率
1	10%	20.00%
2	20%	15.00%
3	30%	10.00%
4	25%	5.00%
5	15%	2.00%

评级	客户占比	对应坏账率
1	35%	20.00%
2	30%	15.00%
3	20%	10.00%
4	10%	5.00%
5	5%	2.00%

RULE	USER_ID	HIT_DATE	USER_LEVEL	USER_LEVEL_BADRATE
阿里欺诈分>=95	ID20261120004467	2026/10/1	1	0.20
百度欺诈分>=90	ID20261120004467	2026/10/1	1	0.20
百度欺诈分>=90	ID20261119001974	2026/10/1	2	0.15
授信通过	ID20261116003965	2026/10/1	3	0.10

评级	评级名称	对应坏账率	风险描述
1	高风险	20.00%	高逾期风险客户
2	中高风险	15.00%	较高逾期风险客户
3	中风险	10.00%	中等逾期风险客户
4	中低风险	5.00%	较低逾期风险客户
5	低风险	2.00%	低逾期风险客户

RULE	USER_ID	HIT_DATE	USER_TARGET
阿里欺诈分>=95	ID20261120002631	2026/10/1	1
百度欺诈分>=90	ID20261116003919	2026/10/1	0
授信通过	ID20261115001234	2026/10/1	1

from rulelift import analyze_rules, load_example_data

# 加载规则命中数据
df = load_example_data('hit_rule_info.csv')

# 分析规则效度（仅使用用户评级数据）
result = analyze_rules(df, user_level_badrate_col='USER_LEVEL_BADRATE')

# 查看分析结果
print(result[['rule', 'estimated_badrate_pred', 'estimated_lift_pred']].head())

        rule  estimated_badrate_pred  estimated_lift_pred
0  阿里欺诈分>=95                0.191988             1.185612
1  百度欺诈分>=90                0.193519             1.195128
2       授信通过                0.175126             1.080866

# 分析规则效度（仅使用实际逾期数据）
result = analyze_rules(df, user_target_col='USER_TARGET')

# 查看分析结果，按 lift 值排序
result_sorted = result.sort_values(by='actual_lift', ascending=False)
print(result_sorted[['rule', 'actual_badrate', 'actual_lift', 'f1']].head())

        rule  actual_badrate  actual_lift        f1
0  阿里欺诈分>=95      0.150000     1.250000  0.260870
1  百度欺诈分>=90      0.120000     1.000000  0.210526
2       授信通过      0.080000     0.666667  0.145455

# 分析规则效度（包含命中率计算）
result_with_hitrate = analyze_rules(df,
                                    user_target_col='USER_TARGET',
                                    hit_date_col='HIT_DATE')

# 查看命中率相关指标
hitrate_cols = ['rule', 'base_hit_rate', 'current_hit_rate', 'hit_rate_cv']
print(result_with_hitrate[hitrate_cols].head())

        rule  base_hit_rate  current_hit_rate  hit_rate_cv
0  阿里欺诈分>=95     0.331609          0.323529     0.420712
1  百度欺诈分>=90     0.333333          0.347826     0.256944
2       授信通过     0.334953          0.328638     0.086924

from rulelift import analyze_rule_correlation

# 计算规则相关性矩阵
correlation_matrix, max_correlation = analyze_rule_correlation(df)

# 查看相关性矩阵
print("规则相关性矩阵：")
print(correlation_matrix)

# 查看每条规则的最大相关性
print("\n每条规则的最大相关性：")
for rule, corr in max_correlation.items():
    print(f"  {rule}: {corr['max_correlation_value']:.4f}")

规则相关性矩阵：
RULE            授信通过  百度欺诈分>=90  阿里欺诈分>=95
RULE 授信通过       1.000000  -0.398847  -0.887592
百度欺诈分>=90 -0.398847   1.000000  -0.053852
阿里欺诈分>=95 -0.887592  -0.053852   1.000000
每条规则的最大相关性：
  授信通过：-0.3988
  百度欺诈分>=90: -0.0539
  阿里欺诈分>=95: -0.0539

from rulelift import calculate_strategy_gain

# 实际存在的规则策略
actual_rules = df['RULE'].unique()
print("\n场景 2: 单个规则作为策略")
single_rule_strategies = {
    rule: [rule] for rule in actual_rules[:3]  # 使用前 3 个规则作为单个策略
}
gain_matrix, gain_details = calculate_strategy_gain(
    df,
    rule_col='RULE',
    user_id_col='USER_ID',
    user_target_col='USER_TARGET',
    strategy_definitions=single_rule_strategies
)
print(f"单个规则策略的增益矩阵:")
print(gain_matrix)

场景 2: 单个规则作为策略
单个规则策略的增益矩阵:
                 授信通过  阿里欺诈分>=95  百度欺诈分>=90
授信通过       0.000000   0.796356   0.859801
阿里欺诈分>=95  1.255720   0.000000   1.076994
百度欺诈分>=90  1.163059   0.910642   0.000000

数据类型	描述	示例
特征数据	用户的各种属性和行为特征	信用评分、申请次数、收入水平等
标签数据	用户的实际表现标签	逾期/未逾期、欺诈/非欺诈等

字段名	描述	类型	示例值
ID	用户唯一标识	字符串	ID20260510020747
CREATE_TIME	数据创建时间	日期	25-Apr
ALI_FQZSCORE	阿里欺诈分数	数值	700
BAIDU_FQZSCORE	百度欺诈分数	数值	458
人行近 3 个月申请借款次数	用户近 3 个月借款申请次数	数值	35
ISBAD	目标变量（坏客户标记）	0/1	1

from rulelift import VariableAnalyzer, load_example_data

from rulelift import SingleFeatureRuleMiner, load_example_data

# 加载用户特征数据集
feature_df = load_example_data('feas_target.csv')
print(f"用户特征数据集形状：{feature_df.shape}")
print(f"数据列名：{list(feature_df.columns)}")

# 初始化单特征规则挖掘器
miner = SingleFeatureRuleMiner(feature_df, target_col='ISBAD', exclude_cols=['ID', 'CREATE_TIME'])

# 选择一个特征进行分析
feature = 'ALI_FQZSCORE'
print(f"\n分析特征：{feature}")

# 计算单个特征的指标
metrics_df = miner.calculate_single_feature_metrics(feature, num_bins=20)

# 获取 top 规则
top_rules = miner.get_top_rules(feature, top_n=5, metric='lift')
print(f"{feature}特征的 top 5 规则:")
print(top_rules[['rule_description', 'lift', 'badrate', 'sample_ratio']])

用户特征数据集形状：(499, 6)
数据列名：['ID', 'CREATE_TIME', 'ALI_FQZSCORE', 'BAIDU_FQZSCORE', '人行近 3 个月申请借款次数', 'ISBAD']
分析特征：ALI_FQZSCORE
ALI_FQZSCORE 特征的 top 5 规则:
           rule_description      lift   badrate  sample_ratio
1  ALI_FQZSCORE <= 515.0000  3.261438  1.000000      0.002004
3  ALI_FQZSCORE <= 635.0000  2.213119  0.678571      0.056112
5  ALI_FQZSCORE <= 665.0000  2.174292  0.666667      0.102204
7  ALI_FQZSCORE <= 688.5000  2.087320  0.640000      0.150301
9  ALI_FQZSCORE <= 705.0000  1.993101  0.611111      0.216433

from rulelift import MultiFeatureRuleMiner, load_example_data

# 加载用户特征数据集
feature_df = load_example_data('feas_target.csv')

# 初始化多特征规则挖掘器
multi_miner = MultiFeatureRuleMiner(feature_df, target_col='ISBAD')

# 生成交叉规则
feature1 = 'ALI_FQZSCORE'
feature2 = 'BAIDU_FQZSCORE'
print(f"\n生成 {feature1} 和 {feature2} 的交叉规则")

# 获取交叉规则
cross_rules = multi_miner.get_cross_rules(feature1, feature2, top_n=5, metric='lift')
print(f"{feature1}和{feature2}的交叉规则 top 5:")
print(cross_rules[['rule_description', 'lift', 'badrate', 'sample_ratio']])

# 绘制交叉热力图
plt = multi_miner.plot_cross_heatmap(feature1, feature2, metric='lift')
plt.savefig('cross_feature_heatmap.png', dpi=300, bbox_inches='tight')
print("交叉特征热力图已保存到：cross_feature_heatmap.png")

生成 ALI_FQZSCORE 和 BAIDU_FQZSCORE 的交叉规则
ALI_FQZSCORE 和 BAIDU_FQZSCORE 的交叉规则 top 5:
                          rule_description      lift   badrate  sample_ratio
90  ALI_FQZSCORE = count AND BAIDU_FQZSCORE = 18.0  5.000000  5.000000         0.1
14   ALI_FQZSCORE = lift AND BAIDU_FQZSCORE = 2.0  3.261438  3.261438         0.1
80  ALI_FQZSCORE = count AND BAIDU_FQZSCORE = 16.0  3.000000  3.000000         0.1
20   ALI_FQZSCORE = count AND BAIDU_FQZSCORE = 4.0  2.000000  2.000000         0.1
30   ALI_FQZSCORE = count AND BAIDU_FQZSCORE = 6.0  2.000000  2.000000         0.1
交叉特征热力图已保存到：cross_feature_heatmap.png

from rulelift import DecisionTreeRuleExtractor, load_example_data

# 加载用户特征数据集
feature_df = load_example_data('feas_target.csv')

# 初始化决策树规则提取器
dt_miner = DecisionTreeRuleExtractor(
    feature_df,
    target_col='ISBAD',
    exclude_cols=['ID', 'CREATE_TIME'],
    max_depth=3,
    min_samples_leaf=10
)

# 训练决策树并提取规则
dt_miner.extract_rules()

# 获取规则 DataFrame
dt_rules_df = dt_miner.get_rules_as_dataframe()
print(f"决策树提取的规则数量：{len(dt_rules_df)}")
print(f"规则 DataFrame 列名：{list(dt_rules_df.columns)}")

# 打印规则
dt_miner.print_rules(top_n=3)

# 绘制特征重要性图
dt_miner.plot_feature_importance()
plt.savefig('feature_importance.png', dpi=300, bbox_inches='tight')
print("特征重要性图已保存到：feature_importance.png")

决策树提取的规则数量：7
规则 DataFrame 列名：['rule_id', 'rule', 'predicted_class', 'class_name', 'class_probability', 'sample_count', 'importance', 'class_distribution']
=== Top 3 Rules ===
Rule 5 (Importance: 1.9111): 
  人行近 3 个月申请借款次数 > 10.5000 AND ALI_FQZSCORE <= 807.5000 AND BAIDU_FQZSCORE <= 490.5000 
  Predicted Class: bad (Probability: 0.9556) 
  Sample Count: 1 
  Class Distribution: {'good': 0.044444444444444446, 'bad': 0.9555555555555556} 
  拦截用户数：11 
  坏客户数：9 
  好客户数：2 
  Badrate: 0.8182 
  召回率：0.3462 
  Lift: 3.1469

Python 风控规则评估与优化库 rulelift 使用指南

Python 风控规则评估与优化库 rulelift 使用指南

一、规则系统的缺陷

二、rulelift 解决方案

1. 规则智能评估模块

2. 规则自动挖掘模块

快速开始

基本使用示例

更多推荐文章

相关免费在线工具

三、规则智能评估模块介绍

技术原理

原全量客户评级分布（规则拦截前）

规则拦截客户评级分布

规则监控数据集

示例 1：规则命中记录数据（关联用户评级）

示例 2：规则记录数据（关联实际逾期）

规则评估功能完整示例

示例 1：使用预估指标评估规则（基于用户评级）

示例 2：使用实际指标评估规则（基于实际逾期数据）

示例 3：结合命中率稳定性监控

示例 4：规则相关性分析

示例 5：规则增益分析

本方法缺陷与优化

四、规则自动挖掘模块介绍

1. 单特征规则挖掘

2. 多特征交叉规则挖掘

3. 决策树规则提取

数据要求

内置数据集

功能使用示例

示例 0：特征基础分析

示例 1：单特征规则挖掘

示例 2：多特征交叉规则挖掘

示例 3：基于决策树的规则提取

项目地址

后续维护

更多推荐文章

相关免费在线工具

Python 风控规则评估与优化库 rulelift 使用指南

Python 风控规则评估与优化库 rulelift 使用指南

一、规则系统的缺陷

二、rulelift 解决方案

1. 规则智能评估模块

2. 规则自动挖掘模块

快速开始

基本使用示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、规则智能评估模块介绍

技术原理

原全量客户评级分布（规则拦截前）

规则拦截客户评级分布

规则监控数据集

示例 1：规则命中记录数据（关联用户评级）

示例 2：规则记录数据（关联实际逾期）

规则评估功能完整示例

示例 1：使用预估指标评估规则（基于用户评级）

示例 2：使用实际指标评估规则（基于实际逾期数据）

示例 3：结合命中率稳定性监控

示例 4：规则相关性分析

示例 5：规则增益分析

本方法缺陷与优化

四、规则自动挖掘模块介绍

1. 单特征规则挖掘

2. 多特征交叉规则挖掘

3. 决策树规则提取

数据要求

内置数据集

功能使用示例

示例 0：特征基础分析

示例 1：单特征规则挖掘

示例 2：多特征交叉规则挖掘

示例 3：基于决策树的规则提取

项目地址

后续维护

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具