路径排序算法（PRA）：知识图谱中的随机游走推理方法

路径排序算法（Path Ranking Algorithm, PRA）

路径排序算法（Path Ranking Algorithm, PRA）是知识图谱推理中一种经典的基于随机游走的归纳式推理方法，主要用于预测知识图谱中缺失的三元组（如头实体 + 关系→尾实体）。其核心思想是：两个实体之间若存在多条符合特定关系路径的'语义路径'，则它们更可能具有某种隐含关系。PRA 通过在图上进行受限随机游走（限定路径长度和关系序列），统计从头实体出发、按给定关系序列到达尾实体的路径数量（或概率），并用逻辑回归等分类器对路径特征进行加权学习，从而实现关系预测或链接预测。

因果推理扩展

在因果推理方面，PRA 本身并非原生的因果推断方法（它主要建模相关性与路径共现），但可被扩展用于因果场景：例如，将知识图谱构建为因果图（节点为变量，有向边表示潜在因果关系），结合 do-演算约束或干预路径筛选（如仅保留前门/后门路径），再用 PRA 评估干预路径的稳健性；或与因果发现算法（如 PC、GES）联合，利用 PRA 增强稀疏因果结构中的长程依赖推理能力。

实践应用

推荐系统：挖掘用户→交互→商品→属性→类目等多跳路径，提升可解释性推荐；
生物医学知识补全：预测'药物→靶点→通路→疾病'等跨模态因果路径，辅助新药机制发现；
金融风控：在企业关联图谱中识别'股东 A→控股 B→担保 C→违约 D'的风险传导链；
智能问答：支持多跳复杂问句（如'爱因斯坦获得诺奖的工作与哪位科学家的理论有关？'）的路径式答案生成。

# 简化版 PRA 路径计数示意（以 2 跳为例）
def count_paths(graph, start, end, rel_seq=["rel1", "rel2"]):
    # graph: {entity: [(relation, neighbor), ...]}
    count = 0
    for r1, mid in graph.get(start, []):
        if r1 == rel_seq[0]:
            for r2, tgt in graph.get(mid, []):
                if r2 == rel_seq[1] and tgt == end:
                    count += 1
    return count
# 实际 PRA 需枚举所有合法路径、特征哈希、负采样及逻辑回归训练

对称性与反对称性建模

路径排序算法（PRA）本身不显式建模关系的对称性或反对称性，而是通过路径特征的统计与学习隐式捕获这些性质。其处理方式如下：

对称性关系（如 spouseOf, siblingOf）：在随机游走中，若存在路径 A → spouseOf → B，则 B → spouseOf → A 也常被采样（尤其在无向化或双向遍历设置下）。PRA 将这两条路径视为不同特征（因起始/终止实体不同），但逻辑回归分类器在训练中会学习到二者具有高度共现性和相似权重，从而在预测时对和给出相近的置信度——即。