论文阅读之——Semantic Scholar
Semantic Scholar
Semantic Scholar 是由美国 Allen Institute for AI(AI2) 开发的一个学术搜索引擎,旨在帮助研究人员快速获取高质量的学术信息。它结合了人工智能和自然语言处理技术,让用户可以更智能地浏览文献、发现引用、理解研究主题等。
官方网站:https://www.semanticscholar.org
Semantic Scholar 的入门使用
进入官网后直接根据所需检索的论文标题、作者等关键字进行搜索。
以搜索论文MFAS: Multimodal Fusion Architecture Search为例:
进入其中的一个结果后,可以看到文章的DOI等ID信息,Semantic Scholar也为用户提供了相应的PDF、引用该文章的代码以及文章中相关的图表等信息。Semantic Scholar还会引用该文章的所有文章及与该文章相关的论文。
Semantic Scholar也接入了大模型AI,用户可以直接在系统中对该文章进行提问。
Semantic Scholar API
该系统同时为用户提供了API接口,适合开发者和研究人员用来获取论文元数据、引用信息、作者信息等。
官方提供的API使用实例代码链接:https://github.com/allenai/s2-folks/tree/main/examples
首先需要根据自己的需求向官方写一份API申请,申请通过后官方会向邮箱中发送API密钥,然后就可以使用啦!(PS.最好使用学校提供的教育邮箱)
其官方代码库中提供了JavaScript、python等版本,检索论文、检索相关引用等具体功能的相关代码,大家可以尝试使用。
下面附上我自己的代码,用户收集引用某一篇文章的所有文章的标题、作者、摘要等字段信息,保存在json文件中。
import requests import json from tqdm import tqdm API_KEY ="*********"# 替换为你的 API Key PAPER_ID ="******************"# 替换为你要查找的论文 DOI 或 Semantic Scholar ID FIELDS ="title,authors,abstract,venue,year,externalIds" HEADERS ={ "x-api-key": API_KEY }defget_all_citations(paper_id): all_citations =[] offset =0 limit =100print("开始下载所有引用文献...")whileTrue: url =f"https://api.semanticscholar.org/graph/v1/paper/{ paper_id}/citations" params ={