深势科技 Uni-Finder 发布专利侵权判定模块,准确率提升 11.4%
深势科技推出基于 Uni-SMART 多模态大模型的专利侵权判定模块。该模块利用群体智能算法和化学结构匹配技术,解决传统专利检索繁琐及大模型幻觉问题。实验显示其准确率较 GPT-o1 提升 11.4%,显著降低研发侵权风险,支持多种分子输入与专利文献比对。

深势科技推出基于 Uni-SMART 多模态大模型的专利侵权判定模块。该模块利用群体智能算法和化学结构匹配技术,解决传统专利检索繁琐及大模型幻觉问题。实验显示其准确率较 GPT-o1 提升 11.4%,显著降低研发侵权风险,支持多种分子输入与专利文献比对。

在科研和工业领域,特别是化学与药物开发中,正确理解和应用专利信息是研究者关注的核心话题。准确判断一个化合物是否受现有专利保护,对于避免潜在的专利侵权风险至关重要。然而,传统的专利检索和比对过程往往繁琐、费时费力,涉及大量非结构化文本解析与化学结构匹配,给研发人员带来了巨大的挑战。
为了解决这一问题,深势科技推出了专利侵权判定模块。该应用模块基于自研专利侵权判定智能体 PatentFinder 驱动,借助深势科技自研的科学多模态大模型 Uni-SMART(Universal Science Multimodal Analysis and Research Transformer),PatentFinder 能够高效、准确地分析特定化合物是否受专利保护。通过考虑分子的骨架和取代基等多种因素,模型可以正确判断出化合物是否属于专利的保护范围,帮助药物研发团队极大地提升研发效率。
PatentFinder 采用群体智能算法解决专利保护判别任务。其核心思想是通过合理的任务拆解,调度多个智能机器人分别解决小规模的子问题,最终汇总生成综合报告。这种架构参考了人类专家进行专利判定的研究范式,执行全自动专利保护判别报告生成。
该框架配备了由深势科技自研的 Uni-SMART 多模态、结构匹配神经网络等算法。Uni-SMART 模型具备强大的科学理解能力,能够同时处理文本描述与分子结构数据。在处理专利文献时,系统不仅分析文字内容,还能识别并解析其中嵌入的化学结构式,实现图文联合推理。
在药物专利中,Markush 结构(马库什结构)是定义化合物保护范围的核心形式。它通常表示为一个通用化学结构,其中包含可变的取代基位置。传统的计算机辅助方法难以精确解析复杂的 Markush 通式,尤其是当存在多重嵌套或模糊定义时。
PatentFinder 引入了精准的 Markush 解析引擎。它能够从专利文档中抽取核心的 Markush 结构,将其转化为标准化的图表示,并与待查询分子进行基团比对。这一过程解决了传统正则表达式无法处理的语义匹配问题,确保了比对结果的化学准确性。
下表展示了不同模型在真实世界分子专利数据集中执行专利保护判定下的结果。PatentFinder 在实验室环境下显著优于现有最先进的大语言模型。
| 模型 | F1 Score | 准确率提升 |
|---|---|---|
| GPT-o1 (OpenAI) | Baseline | - |
| PatentFinder | +12.5% | +11.4% |
PatentFinder 判别结果的 F1 Score 相较于 OpenAI 发布的最先进语言模型 GPT-o1 提升了 12.5%,平均准确率提升了 11.4%。在使用大语言模型进行专利保护判定时,部分语言模型中出现了严重的幻觉现象,倾向于将所有分子都认定为被专利所保护的样本。在实验结果中,这呈现出正样本召回率 (TPR) 虚高、负样本召回率 (TNR) 极低的结果。
与之相比,PatentFinder 对于正负样本都表现出较强的区分能力。由于引入了结构约束和化学规则校验,模型减少了无依据的推断。相较于次优方法,其 TNR 召回率提升了约 20%,这意味着误报率大幅降低,对于企业规避风险具有极高的参考价值。
Uni-Finder 专利侵权应用模块借助 Markush 解析与多模态大模型技术,比对用户提供的分子结构与指定范围内的专利文献,提供完整的匹配报告以及专利保护结果。
为了适应不同用户的操作习惯,系统支持多种分子输入方式:
点击产品首页的新建侵权查询按钮,即可启动任务流程。
专利侵权支持多种分子输入方式,如交互式分子绘制工具、SMILES 式导入、从图片导入。同时支持多种文献导入方式,如从知识库导入专利,从文件导入专利。
专利保护判别报告会被记录在产品主页。用户可以点击查询记录右侧的详情按钮查看解析明细。
在解析明细页面,可以看到保护判定的判别结果,点击解析详情查看解析报告。在解析报告中,可以看到文献信息、判断依据等内容,包括具体的结构重叠区域和法律依据引用。
Uni-Finder 专利侵权功能的发布标志着深势科技在化学和药物研发领域专利分析工具的一大进步。该工具简化了传统的专利分析流程,将专利保护判定准确率提升了 11.4%,显著降低了研发过程中的侵权风险。通过集成多模态大模型 Uni-SMART,专利侵权能够迅速准确地判断化合物的专利保护范围,提供详尽的匹配报告和专利保护结果。
未来,深势科技将继续优化专利侵权机器人,支持更广泛的专利文献来源,进一步提升工具的准确性和用户体验。我们致力于为化学与药物研发团队提供强大的支持,助力他们在科研道路上更加自信地迈进。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online