零门槛玩转AI找药!DrugCLIP保姆级操作指南

零门槛玩转AI找药!DrugCLIP保姆级操作指南

最近药学圈彻底被清华团队发表在《Science》的DrugCLIP刷屏了!号称“10万亿次蛋白–配体打分计算”一天就能搞定——不过要说明下,文中用的是A100显卡,要是拿一张5060-8G显卡来跑肯定不会这么快

,笔记本、移动端就更不用想了。

但我们完全不用慌高硬件门槛!作者团队早就贴心备好网页版,只要提交任务,就能快速完成“计算”(更准确说是检索)。接下来,小编就专门带纯药学背景的AI小白们(AIDD大佬们麻烦点赞后直接冲GitHub区👀),手把手解锁DrugCLIP的使用方法,实现你的科研目标!

相信大家都已经都刷到过相关文章或公众号介绍🙇,对于纯药学背景的AI小白来说,想简单高效上手,完全不需要死磕公式和原理,因为一环套一环的时间成本实在太高啦。我们的核心需求就一个:知道怎么用AI达成目标即可!至于模型评价、数据集处理这类内容,纯药学背景且没精力深究AI的同学,略看甚至不看都没问题~ 我们就做AI的“使用者”,不用当“研究者”!

  想快速上手任何AI工具,记住3个核心问题就够了,比记公式简单10倍:

  1. 最关键:这个AI模型的核心功能是什么?
  2. 应用域是什么(看case study就懂)?也就是它适用于哪些场景、哪些内容?
  3. 输入和输出的内容是什么?

我们就拿DrugCLIP举个例子👇

1

DrugCLIP模型的功能是什么?

给口袋找配体:如果已知目标口袋,能在网站可选的化合物库中,快速筛选出最可能与之结合的化合物;

给配体找口袋:如果已知目标配体,能在网站自带的蛋白口袋库中,精准匹配出最可能与之结合的口袋。

  有人可能会问:那它能找和目标蛋白结合的其他蛋白吗?emm抱歉,这不是它的“业务领域”哦

2

DrugCLIP适合用在哪些场景?

  借用作者团队的一句话:“我们算法更适合筛选蛋白质-小分子口袋,对于其他的口袋,效果不太能保证。”

  正确的专业的中肯的!不过小编觉得,只要我们手头有蛋白口袋或配体,都可以大胆试试!反正操作超简单、出结果又快,不试白不试🙋,万一能出惊喜呢?

3

输入输出对应关系,一张表搞定!

输入

Model

输出

口袋

DrugCLIP

可能与之“结合”的配体

配体

可能与之“结合”的配体

恭喜你!看到这里,DrugCLIP的核心使用逻辑已经完全搞懂了!

还是觉得心里没底?别慌!接下来小编再把准备输入心仪的蛋白口袋或配体时的关键要求说透👌

注意事项

基本要求:必须严格按照网站示例的模板格式准备!DrugCLIP需要的是蛋白PDB文件,这是后续提取口袋的基础。

文中要求:口袋位置一定要给准!划重点:DrugCLIP对口袋构象的要求相对宽松,但最怕口袋位置找错——位置一错,结果肯定不准,之前的努力就白费啦。

  以上就是DrugCLIP的核心基础认知,搞懂这些,实操就没难度了!接下来,正式进入网页版DrugCLIP手把手实操环节!

图片

类型一:给口袋(已知)找配体

 以CYPA蛋白为例(PDB:8G9P,https://www.rcsb.org/structure/8G9P)

  我们可以先看下网站中给的例子是什么。下载例子得到两个文件,2fyt_protein .pdb和2fyt_1.sdf,打开可以看到,一个是全蛋白文件,一个是配体文件。

  注意!如果使用后续使用Specify the pocket location中的By Upload Ligand来确定口袋,那么应该将配体对接到正确的蛋白口袋中,我们也准备相同格式的文件即可。

  同时,我们也可以看到也支持以下格式的文件:“Supports: .pdb, .cif, .sdf, .mol2. Ensure that the uploaded file contains the complete protein receptor structure.

image.png

01

目标蛋白和配体预处理

pymol或RCSB网站下载蛋白的pdb文件,得到8G9P.pdb,然后(建议):删除水、删除其他蛋白、其他例子,仅保留目标蛋白和配体,另存为蛋白8g9p_protein.pdb和8g9p_lig.sdf,注意保存格式。

image.png

02

上传网站及选择口袋提取方法

2.1将刚刚提取的蛋白pdb文件上传。

2.2以下四种方法四选一即可

A. 选择By Upload Ligand方法,将刚刚配体上传,应该是将基于配体位置自动识别口袋(也是之前说选择此方法要对接到正确到口袋的原因),根据文章中的描述原理,即使上传不同的配体,只要口袋正确且相同应该不会影响筛选得到的分子,即对于同一个口袋的Top分子将会是相同的(前提:同库)

B. 选择By Het Id方法,此方法应该上传的是无配体的pdb文件,输入配体的Het Id即可识别对应口袋,。

C. 选择By Center Coordinates方法,此方法应该上传的是无配体的pdb文件,输入配体在pdb文件中的xyz位置,pymol中即可查看位置。

D. 选择By Residue方法,此方法应该上传的是无配体的pdb文件,输入配体的附近的口袋残基即可,pymol中即可查看对应配体的口袋残基。

image.png

Het Id查看方法,可以直接在RCSB网站中对应的蛋白条目下方查看目标配体的Het Id名称(下图),也可以直接用记事本打开pdb文件进行查看(上图),均可看到本例中的配体的Het Id为YV2。

image.png

03

选择筛选的目标库以及Top_K

  目标库即选择查找小分子的范围,本例中仅选择ChemDiv库进行演示。

 Top_K:选择最终输出的数量,本例中选择前100打分的进行输出演示

image.png

04

输入工作名运行、查看结果

如果不输入Job name无法运行。

image.png

image.png

图片

类型二:给配体(已知)找口袋

直接上传一个小分子即可实现钓靶。

image.png

类型三:构建化合物库

网站中还提供了自定义化合物库进行筛选

只需要上传一个csv文件即可,相对简单。

包含以下两列

ID    SMILES

以下是论文作者发布的在线问题汇总,供大家参考:

https://kwansgdlwoz.feishu.cn/wiki/JhKAwMMgIiwC7ZkfnLucxitjnxZ

Read more

HTML5+CSS3+JavaScript实现高木同学圣诞树GalGame完整开发指南

HTML5+CSS3+JavaScript实现高木同学圣诞树GalGame完整开发指南

HTML5+CSS3+JavaScript实现高木同学圣诞树GalGame完整开发指南 摘要:圣诞节快要到了,本文详细介绍了一个基于Web技术栈开发的完整GalGame(美少女游戏)项目。从项目架构设计、核心技术实现到性能优化,全面阐述如何使用纯前端技术构建具有丰富交互功能的视觉小说游戏。项目包含完整的对话系统、角色表情管理、分支剧情和存档功能,是Web前端技术在游戏开发领域应用的优秀实践案例。 📋 目录 * 1. 项目概述与目标 * 2. 技术架构选型 * 3. 核心功能实现 * 4. 界面设计与响应式布局 * 5. 开发难点与解决方案 * 6. 性能优化与用户体验 * 7. 部署与运行指南 * 8. 扩展功能与未来展望 * 9. 总结与收获 1. 项目概述与目标 1.1 项目背景 随着HTML5、CSS3和现代JavaScript技术的快速发展,Web平台已经能够承载复杂的交互应用。GalGame作为强调剧情叙事和角色互动的游戏类型,非常适合使用Web技术来实现。本项目选择热门动漫《擅长捉弄人的高木同学》作为题材,结合圣诞节主题,开发一个温馨有趣

By Ne0inhk

从零开始搭建Tare的Java 开发环境

从0开始一步一步讲解如何在Trae 中构建Java开发环境,供大家学习交流。 1. java 项目plugin安装:Extension Pack for Java 拓展包包含以下内容,亦可手动安装; 2. 开发环境配置 Maven for java 拓展配置 与 Language Support for Java(TM) by Red Hat 中的 maven 需要分别单独配置;否则易出现 maven 拓展 与 Java Projects 所引用的 maven settings配置不相同的情况; 3. lombok 项目中有使用lombok时 可安装lombok插件: 并在项目的 settings.json 中增加:“lombok.configPath”: “lombok.

By Ne0inhk
和 AI 玩海龟汤差点崩溃:它永远比我多知道 100 个隐藏真相

和 AI 玩海龟汤差点崩溃:它永远比我多知道 100 个隐藏真相

关于海龟汤 第一次接触海龟汤时,我还以为这是某种美食烹饪挑战,直到朋友抛出第一个谜题 ——“一个人走进酒吧,要了一杯水,酒保却掏出一把枪对准他,可这个人不仅没害怕,反而说了声谢谢离开了”,才惊觉这是场烧脑的逻辑游戏。海龟汤,学名情境猜谜,玩家只能通过提问获取 “是”“否” 或 “无关” 的回答,一步步拼凑出汤底背后的完整故事。这种用有限线索破解无限想象的过程,就像在黑暗中摸索开关,每次提问都是试探,当真相突然亮起时,那种恍然大悟的快感让人上瘾。 作为计算机专业的学生,我常在蓝耘 API 的助力下完成课程设计。有次用它处理文本数据时,突然冒出个想法:既然海龟汤的本质是文本逻辑交互,为什么不做一款属于自己的海龟汤游戏? 最初的念头源于对解谜的热爱。深夜和朋友玩海龟汤时,看着大家为了一个谜题争论到面红耳赤,最后被反转的汤底惊得笑出眼泪,我意识到这种互动游戏的魅力。市面上虽然有不少海龟汤游戏,但要么谜题老套,要么交互不够灵活。我想用蓝耘 API 的高反应速度和灵活度,打造一款能实时生成新谜题、根据玩家提问动态调整线索的游戏,让每场推理都充满新鲜感。 为什么使用蓝耘api呢? 作为一

By Ne0inhk
真香预警!大模型Agent开发全栈教程:从概念到代码,小白也能666地玩转AI智能体

真香预警!大模型Agent开发全栈教程:从概念到代码,小白也能666地玩转AI智能体

一、什么是Agent? 在大模型应用开发中,Agent(智能体)是指能够感知环境、自主决策并采取行动以实现特定目标的智能系统。与传统的问答式AI不同,Agent具有主动性、自主性和持续性。 核心特征: * 自主性 - 能够独立做出决策,不需要每一步都由人类指导 * 反应性 - 能够感知环境变化并及时响应 * 主动性 - 能够主动采取行动以实现目标 * 社交性 - 能够与其他Agent或人类协作交互 二、Agent的核心组成部分 2.1 大脑:大语言模型(LLM) 大语言模型是Agent的核心推理引擎,负责: * 理解用户意图 * 制定行动计划 * 进行推理和决策 * 生成回复和指令 2.2 记忆系统(Memory) 短期记忆: 保存当前对话的上下文信息 长期记忆: 存储历史交互记录、用户偏好、知识积累 工作记忆: 任务执行过程中的中间状态和临时信息 2.

By Ne0inhk