深势科技 Uni-Finder 发布专利侵权判定模块，准确率提升 11.4%

深势科技 Uni-Finder 发布专利侵权判定模块

前言

在科研和工业领域，特别是化学与药物开发中，正确理解和应用专利信息是研究者关注的核心话题。准确判断一个化合物是否受现有专利保护，对于避免潜在的专利侵权风险至关重要。然而，传统的专利检索和比对过程往往繁琐、费时费力，涉及大量非结构化文本解析与化学结构匹配，给研发人员带来了巨大的挑战。

为了解决这一问题，深势科技推出了专利侵权判定模块。该应用模块基于自研专利侵权判定智能体 PatentFinder 驱动，借助深势科技自研的科学多模态大模型 Uni-SMART（Universal Science Multimodal Analysis and Research Transformer），PatentFinder 能够高效、准确地分析特定化合物是否受专利保护。通过考虑分子的骨架和取代基等多种因素，模型可以正确判断出化合物是否属于专利的保护范围，帮助药物研发团队极大地提升研发效率。

技术架构与解决方案

PatentFinder 框架设计

PatentFinder 采用群体智能算法解决专利保护判别任务。其核心思想是通过合理的任务拆解，调度多个智能机器人分别解决小规模的子问题，最终汇总生成综合报告。这种架构参考了人类专家进行专利判定的研究范式，执行全自动专利保护判别报告生成。

该框架配备了由深势科技自研的 Uni-SMART 多模态、结构匹配神经网络等算法。Uni-SMART 模型具备强大的科学理解能力，能够同时处理文本描述与分子结构数据。在处理专利文献时，系统不仅分析文字内容，还能识别并解析其中嵌入的化学结构式，实现图文联合推理。

Markush 结构与化学信息学挑战

在药物专利中，Markush 结构（马库什结构）是定义化合物保护范围的核心形式。它通常表示为一个通用化学结构，其中包含可变的取代基位置。传统的计算机辅助方法难以精确解析复杂的 Markush 通式，尤其是当存在多重嵌套或模糊定义时。

PatentFinder 引入了精准的 Markush 解析引擎。它能够从专利文档中抽取核心的 Markush 结构，将其转化为标准化的图表示，并与待查询分子进行基团比对。这一过程解决了传统正则表达式无法处理的语义匹配问题，确保了比对结果的化学准确性。

实验结果与性能评估

下表展示了不同模型在真实世界分子专利数据集中执行专利保护判定下的结果。PatentFinder 在实验室环境下显著优于现有最先进的大语言模型。

模型	F1 Score	准确率提升
GPT-o1 (OpenAI)	Baseline	-
PatentFinder	+12.5%	+11.4%

PatentFinder 判别结果的 F1 Score 相较于 OpenAI 发布的最先进语言模型 GPT-o1 提升了 12.5%，平均准确率提升了 11.4%。在使用大语言模型进行专利保护判定时，部分语言模型中出现了严重的幻觉现象，倾向于将所有分子都认定为被专利所保护的样本。在实验结果中，这呈现出正样本召回率 (TPR) 虚高、负样本召回率 (TNR) 极低的结果。

与之相比，PatentFinder 对于正负样本都表现出较强的区分能力。由于引入了结构约束和化学规则校验，模型减少了无依据的推断。相较于次优方法，其 TNR 召回率提升了约 20%，这意味着误报率大幅降低，对于企业规避风险具有极高的参考价值。

功能介绍

Uni-Finder 专利侵权应用模块借助 Markush 解析与多模态大模型技术，比对用户提供的分子结构与指定范围内的专利文献，提供完整的匹配报告以及专利保护结果。

1. 精准判定专利保护范围

分子专利比对：根据用户提供的分子和专利，判定分子是否被专利所保护。
核心结构提取：能够从专利中抽取核心的 Markush 结构，与待查询分子进行基团比对，并给出详细的分析报告。
关键字段定位：能够定位出原文中决定专利保护的关键字段，帮助用户深入理解专利内容，明确侵权边界。

2. 多样化的分子输入方式

为了适应不同用户的操作习惯，系统支持多种分子输入方式：

深势科技 Uni-Finder 发布专利侵权判定模块，准确率提升 11.4%