AI评估建议可信度：破解决策迷局

Ne0inhk

16 Mar 2026 — 8 min read

demo：更新决策数学模型的版本https://www.coze.cn/s/yCV7zGc-F6A/

#人的一生处处在决策，决策的好坏决定结果有没有遗憾，有的人寻求外在建议综合决策，而无法判断建议是否可靠，因此，提出Cognitive Trustworthiness Evaluator, CTE，这是一个极具潜力且前沿的交叉领域项目——将认知科学、行为经济学、概率推理与人工智能结合，构建一个基于认知偏差建模的建议可信度评估智能体（Cognitive Trustworthiness Evaluator, CTE）

一、项目目标

构建一个智能体（Agent），通过分析用户在表达观点、提出建议时所体现出的认知特征（尤其是与概率感、事后归因、幸存者偏差、反事实思维等相关的模式），对其认知可靠性进行量化评分，并据此判断其建议是否值得采纳。

核心假设：一个人对不确定性的理解能力（即“概率感”）及其对因果关系的误判倾向，是其建议质量的重要预测指标。

二、理论基础与关键维度

我们聚焦以下五个核心认知维度，每个维度均有心理学/行为经济学实证支持：

表格

维度	定义	行为表现	可观测信号
1. 概率感（Probabilistic Intuition）	对随机性、不确定性、贝叶斯更新的理解能力	能区分“可能”与“必然”，避免确定性幻觉	使用模糊语言（如“大概”“可能”）、校准度（预测 vs 实际结果）
2. 事后诸葛亮偏差（Hindsight Bias）	事后将事件视为“本可预见”的倾向	“我早就知道会这样”、“这很明显”	过度简化因果链、使用确定性回溯语言
3. 幸存者偏差（Survivorship Bias）	只关注成功案例而忽略失败样本	“你看他成功了，所以方法一定对”	忽略基线率、选择性引用案例、缺乏对照组思维
4. 因果错觉（Illusory Causality）	将相关性误认为因果	“因为A发生，所以B发生”（无控制变量）	缺乏反事实思考、过度归因于单一因素
5. 波函数坍缩隐喻（Quantum Collapse Metaphor）	（非物理意义）指将未实现的可能性彻底否定，忽视多重可能性	“既然结果是X，那其他路径就不存在”	否认替代历史、拒绝考虑反事实情景

注：“波函数坍缩”在此作为认知封闭性的隐喻，强调个体是否能保持对未实现可能性的开放态度。

三、数据输入与特征工程

3.1 输入源（多模态）

文本：用户发言、社交媒体帖子、会议记录、访谈转录
结构化行为：预测记录（如对事件结果的预判）、决策日志
元数据：时间戳（用于检测事后言论）、上下文（是否在结果已知后发言）

3.2 特征提取（NLP + 认知语言学）

表格

维度	特征示例
概率感	- 模态动词频率（“可能”“或许” vs “肯定”“绝对”） - 概率词汇校准（如说“90%可能”但实际准确率仅60%） - 使用置信区间或范围表述
事后诸葛亮	- 时间副词（“本来”“早就”“显然”） - 回溯性确定语言（“注定”“必然导致”） - 与事前预测对比（若存在）
幸存者偏差	- 成功案例提及次数 / 失败案例提及次数 - 是否提及“失败者”或“沉默证据” - 基线率忽略指数（如讨论创业成功但不提90%失败率）
因果错觉	- 因果连接词密度（“因为…所以…”） - 是否包含“控制变量”“其他可能”等缓冲语 - 反事实句式缺失（如“如果当时没…”）
认知封闭性（波函数隐喻）	- 否定虚拟语气（“那种情况根本不可能”） - 历史决定论语言（“历史必然如此”） - 对“其他可能性”的排斥程度

技术实现：使用LLM（如Qwen、Llama）进行零样本/少样本提示工程提取认知特征，或微调BERT类模型进行多标签分类。

四、数学模型架构

采用分层加权评分模型 + 动态贝叶斯网络：

4.1 单维度评分（S₁–S₅）

对每个维度计算标准化得分（0–1，越低表示偏差越严重）：

例如，事后诸葛亮得分 = 1 − (确定性回溯语言频率 / 总因果陈述数)

4.2 综合认知可靠性得分（CR Score）

CR=w1S1+w2S2+w3S3+w4S4+w5S5CR=w1S1+w2S2+w3S3+w4S4+w5S5

初始权重 wi=0.2wi=0.2 ，可通过专家标注或建议采纳后的实际效果反馈进行动态调整（强化学习）

4.3 建议可信度输出

高可信：CR ≥ 0.7 → 建议值得认真考虑
中等：0.4 ≤ CR < 0.7 → 需交叉验证
低可信：CR < 0.4 → 谨慎对待，可能存在系统性认知偏差

可附加解释模块：指出“该建议在‘幸存者偏差’维度得分较低，因其仅引用成功案例”。

五、系统实现路径（MVP → 产品化）

阶段1：最小可行原型（MVP）

输入：用户一段文本建议（如“你应该All-in这个项目，因为张三靠它赚了1个亿”）
处理：
1. 用提示工程让LLM分析文本中的认知偏差信号
2. 计算5维得分
3. 输出CR分数 + 简要解释
工具：Python + Qwen API / Llama.cpp + 自定义prompt

阶段2：增强版（加入行为校准）

接入用户历史预测记录（如是否常做市场预测）
计算预测校准度（Brier Score）作为概率感的客观指标
动态更新权重

阶段3：产品化（如浏览器插件、企业决策辅助系统）

实时分析会议发言、邮件、报告
生成“认知健康度”仪表盘
提供改进建议（如“请补充失败案例以降低幸存者偏差风险”）

六、验证与迭代机制

6.1 有效性验证

外部效标：将CR分数与建议的实际结果相关性做回归分析（需标注数据集）
专家评审：邀请心理学家/决策科学家对评分结果盲评

6.2 偏差防范

避免将“谨慎”误判为“低概率感”
区分领域知识不足 vs 认知偏差
加入上下文感知（如在确定性高的领域，“绝对”表述可能是合理的）

七、伦理与局限性声明

不用于人格评判，仅评估特定建议的认知质量
避免自动化决策，应作为辅助工具而非替代人类判断
需透明化评分逻辑，防止“黑箱信任”

八、直接可用的启动方案（今日即可实施）

工具包建议：

# 示例：用Qwen API分析一段建议的认知偏差 import dashscope from dashscope import Generation def analyze_cognitive_bias(text): prompt = f""" 你是一个认知科学专家。请分析以下文本在以下五个维度的表现（每项0-1分，1表示认知质量高）： 1. 概率感：是否合理表达不确定性？ 2. 事后诸葛亮：是否将结果描述为“本可预见”？ 3. 幸存者偏差：是否只提成功案例？ 4. 因果错觉：是否错误归因因果？ 5. 认知开放性：是否承认其他可能性？ 文本：{text} 请按JSON格式返回：{{"prob_sense": 0.8, "hindsight": 0.3, ...}} """ response = Generation.call( model="qwen-max", prompt=prompt, api_key="YOUR_API_KEY" ) return eval(response.output.text)

然后计算：

scores = analyze_cognitive_bias("你应该买这只股票，它肯定会涨！") cr = sum(scores.values()) / 5 print(f"认知可靠性得分: {cr:.2f}")

最小MVP/demo地址：https://www.coze.cn/s/rFp1BCAVUnU/

展示：示例1 最开始的版本

示例2 更新决策数学模型的版本https://www.coze.cn/s/yCV7zGc-F6A/