【TJU】信息检索与分析课程笔记和练习(6)英文数据库检索—web of science

【TJU】信息检索与分析课程笔记和练习(6)英文数据库检索—web of science

【TJU】信息检索与分析课程笔记和练习(6)英文数据库检索—web of science

一、前言

二、课程笔记

2.1 Web of Science简介

1、Web of Science简介

Web of Science是一个商业学术资源整合平台,包含多个子数据库、多种文献类型。主要有:期刊、会议录、专利以及该系统提供的学术网站中的各类资源,内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文等领域。

在这里插入图片描述

2、Web of Science核心合集资源

SCIE、SSCI、AHCI、CPCI-S、ESCI作为核心合集的子数据库,收录综合学科的学术论文。

在这里插入图片描述

IC和CCR作为核心合集子数据库,只收录包含化学结构数据的论文,主要是为了满足科研人员发现论文的制定需求,一般不建议勾选。

在这里插入图片描述

3、SCIE、SSCI、AHCI

1955年,美国宾州大学结构语言学博士尤金·加菲尔德(Eugene Garfield)第一次在《科学》杂志(Science)上提出了“引文索引”的设想。 随后,加菲尔德于于1960年创办了科学情报研究所(Institute for Scientific Information)。

科学引文索引(Sciences Citation Index-简称SCI),1961年创刊SCI,1964年开始出版,随着网络的发展,逐渐发展为Sciences Citation Index Expanded-SCIE。《SCIE》以整本期刊为单元划分归属学科,用“Multidisplinary Sciences”来收纳综合性期刊论文。

社会科学引文索引(Social Sciences Citation Index-简称SSCI),为SCIE的姊妹篇,亦由美国科学信息研究所创建,是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。

艺术人文引文索引(Arts & Humanities Citation Index -简称AHCI)为美国科学情报研究所(ISI)建立的综合性艺术与人文类文献数据库,包括语言、文学、哲学、亚洲研究、历史、艺术等内容。

4、CPCI会议录索引

1981年起ISI推出ISTP(Index to Scientific & Technical Proceeding)数据库,即《科学技术会议录索引》。自2008年10月20日起,在全新升级的Web of Science中,ISTP更名为CPCI(Conference Proceedings Citation Index )。

美国科学情报研究所将科学技术会议录索引(CPCI-S)和社会科学及人文科学会议录索引(CPCI-SSH)两大会议录索引集成,提供会议论文的文摘索引信息。汇集了世界上最新出版的会议录资料,包括专著、丛书、预印本以及来源于期刊的会议论文,提供了综合全面、多学科的会议论文资料。

5、Emerging Sources Citation Index

Emerging Sources Citation Index,即ESCI是2015年推出的一个检索集,将原先的核心集扩展了约20%。ESCI并不是SCIE期刊,只是进入到SCIE期刊的预备队里面了,通过进一步的评估也许能进SCIE,也许不能。现有SCIE期刊表现不好的,也可能被降级到ESCI里面。ESCI期刊2023年首次获得期刊影响因子(JCR2022), 2025获得中科院分区。

在这里插入图片描述

2.2 Web of Science登录

由天大图书馆进入-主站。

在这里插入图片描述

2.3 Web of Science检索

1、选择检索集合范围

在这里插入图片描述

2、在核心合集选择子数据库

在这里插入图片描述

3、文献检索

在这里插入图片描述

4、检索规则

逻辑算符:逻辑运算符 AND、OR、NOT、NEAR 和 SAME 可用于组配检索词,从而扩大或缩小检索范围。

  • 在单个检索式中可使用无限数量的布尔运算符或位置限定运算符。
  • WOS核心合集中执行“所有字段 (AF)”检索时。检索式限制为 49 个布尔或位置限定运算符。
  • 支持词形还原和词干
    • Cite 查找单词 cite 的变化形式,例如 citing、cites、cited 和 citation。
    • 英文检索式中的检索词超出允许的数目时,产品会关闭词形还原。超出此限制后,产品将只返回完全匹配的结果
    • 检索词与通配符结合使用时,产品会关闭词形还原。
  • 两个或两个以上相邻的检索词时,Web of Science 检索会使用隐含的 AND 运算符; rainbow trout fish farm 与输入 rainbow AND trout AND fish AND farm 等效
  • 运算符的优先级:1.NEAR/x 2.SAME 3.NOT 4.AND 5.OR
  • 使用括号可以忽略运算符优先级,括号内的表达式优先执行。比如:(A OR B) NEAR/10 C 可查找其中的 A 或 B 与 C 相隔不到 10 个单词的记录。

检索词:检索词可以是单词、词组、缩写词、分子式等.

  • 引号标识词组作精确检索,如:“carbon nanotube”
  • “主题”或“标题”检索词中自动查找不同拼写形式(如美式与英式拼写差异)
  • 通配符“*”表示无限截词,通配符前面必须至少有三个字符。如:pharmac 可检出pharmacy, pharmacology,pharmaceutics等
  • 检索词与通配符结合使用时,产品会关闭词形还原。例如,color* 可查找包含单词 color、colors 和 colorful 的记录,但不查找 colour、colours 和 colourful。

5、检索说明

使用 NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。用数字取代x可指定将检索词分开的最大单词数。如果只使用 NEAR 而不使用 /x,则系统将查找其中的检索词由 NEAR 连接且彼此相隔不到 15 个单词的记录。

在“地址”检索中,使用 SAME 将检索限制为出现在“全记录”同一地址中的检索词。当在其他字段(如“主题”和“标题”)中使用时,如果检索词出现在同一记录中,SAME 与 AND 的作用就完全相同。

6、检索字段-主题

主题检索:主题词指含在文献记录中的标题、摘要、作者关键词中的词,检索词可以是单词、词组、或更多的词组,多词检索时可以使用逻辑算符或截词符操作。

7、作者检索

作者检索:作者名称输入方式“姓氏” 空格 “名的首字母”:Chandler N*、De La Rose W*。作者检索时可参考作者索引或使用作者甄别检索,姓名中的连字符 (-) 和撇号 (') 视为空格处理。如:AU=O Brien 返回与 AU=O’Brien 相同数量的检索结果。

在这里插入图片描述

8、检索字段-地址

地址检索:在地址输入框中,检索词包括机构、部门、城市、州、省、国家、邮编,
以及几种名称的组合。

  • 可以使用邻近算符和通配符组织检索词。如使用SAME算符,IBM same NY(表示出现在同一地址中)。
  • 地址检索常使用缩写,可参考索引表。

9、检索字段-出版物

出版物检索:检索出版物名称时,可参考出版物一览表。同时检索多个出版物时,用OR连接。

10、作者检索

在这里插入图片描述

11、被引参考文献检索

一方面,可以对在基本检索中得到的论文的引用信息数据进行补充,另一方面,可以检索未被web ofscience核心合集收录论文的引用情况。

在这里插入图片描述


2.4 Web of Science结果分析

1、检索示例1

1️⃣ 检索过程

检索:碳纳米管材料的光催化应用方面的WOS核心合集论文

检索词提取:碳纳米管\材料\的\光催化\应用\研究

检索词:

  • 碳纳米管/巴基管:carbon nanotube / Bucky Tube;
  • 光催化:Photocatalysis。

检索式:

  • ((“carbon nanotube*” OR “Bucky Tube*”) AND (Photocatalys* OR “Photo catalys*”))
  • S2 ((carbon NEAR/0 nanotube OR Bucky NEAR/0 Tube) AND (Photocatalysis OR Photo NEAR/0 catalysis))
双引号 " "表示短语精确匹配,“carbon nanotube*” 会作为一个整体出现,而不是 carbon 和 nanotube 分散出现;通配符 * 表示任意字符扩展,例如:nanotube* → nanotube / nanotubes。
NEAR/n 的通用含义:表示两个词之间的最大词距,NEAR/0 = 紧邻(中间不能有其他词,顺序可变)。

2️⃣ 短语检索对比

在这里插入图片描述

2、聚类分析和排序

聚类分析:可以针对检索结果进行学科、年份、作者、来源出版物等方面的聚类。可用于投稿选刊、年度追踪等等。

在这里插入图片描述


3、聚类-出版物

有哪些SCIE收录的期刊出版过相关领域的论文?

在这里插入图片描述


在这里插入图片描述

4、出版年

在这里插入图片描述


5、引用

在这里插入图片描述


在这里插入图片描述

6、高被引论文、热点论文等

在这里插入图片描述

7、期刊影响因子

在这里插入图片描述

8、引文跟踪

在这里插入图片描述

9、InCites 的比较指标

在这里插入图片描述


在这里插入图片描述

10、标记文献

在这里插入图片描述


在这里插入图片描述

三、课后练习

作业要求

  • 1.请利用web of Science检索自己导师或者想了解的学者的学术成果。对比利用“文献”和“研究人员”检索获得的结果区别,思考其原因。
  • 2.注册个人WOS账号,个性化设置数据库显示页面。
  • 3.撰写自选主题的wos检索式,并试检索。
  • 4.指出文章:“Ternary NiCo2Px Nanowires as pH-Universal Electrocatalysts for Highly Efficient Hydrogen Evolution Reaction”发表期刊的2023年的期刊影响因子、被wos核心合集引用的次数和被SCIE子数据库引用的次数。(答案之间以英文半角逗号隔开1,2,3)
  • 5.请检索文章:“Electric field effect in atomically thin carbon films” 确定其被收录在WOS核心集的哪个子数据库(简写如CPCI-S、SCIE或SSCI),并指出该文的入藏号(WOS:00000000000)。
  • 6.利用WOS数据库,请检索“计算机辅助设计”这一领域的SCIE收录论文情况(要给出检索结果数量),并列出在这一领域发文量最多的前3种期刊名称和前3个研究机构名称。

1、利用web of Science检索自己导师或者想了解的学者的学术成果。对比利用“文献”和“研究人员”检索获得的结果区别,思考其原因

结论::文献检索是“按字段文本匹配”的逻辑,所以召回更广但更容易混入噪声;研究人员检索是“作者消歧与档案归并”的逻辑,准确性更高但依赖算法归并与标识符(ORCID 等),因此可能出现拆分、漏并或延迟更新。当需要“尽可能全”时用文献检索;当需要“更准确归属某个人”时用研究人员检索,并在两者之间交叉核对。

以学者何恺明(Kaiming He)为例:

首先是“文献”字段检索,检索设置如下:

在这里插入图片描述

对应的检索结果如下:

在这里插入图片描述

首先是“研究人员”检索,检索设置如下:

在这里插入图片描述


对应的检索结果如下:

在这里插入图片描述


在这里插入图片描述

2、注册个人WOS账号,个性化设置数据库显示页面

首先通过tju电子资源平台访问Web of Science网站,会自动跳转到登陆页,选择注册,输入表单信息进行注册即可。

在这里插入图片描述


会发送邮箱验证信息,进行验证即可。

在这里插入图片描述


在这里插入图片描述

在Web of Science主页,选择设置,比如选择语种为简体中文。

在这里插入图片描述


3、撰写自选主题的wos检索式,并试检索

自选主题为“基于深度学习的红外可见光图像融合方法研究”。

对应的检索式为:

  • (“infrared visible image fusion” OR “infrared and visible image fusion” OR (“infrared image” AND “visible image” AND fusion)) AND (“deep learning” OR “convolutional neural network*” OR CNN*)

检索设置如下:

在这里插入图片描述


对应的检索结果如下:

在这里插入图片描述


4、指出文章:“Ternary NiCo2Px Nanowires as pH-Universal Electrocatalysts for Highly Efficient Hydrogen Evolution Reaction”发表期刊的2023年的期刊影响因子、被wos核心合集引用的次数和被SCIE子数据库引用的次数。(答案之间以英文半角逗号隔开1,2,3)

结论:27.4,656,656

检索设置如下:

在这里插入图片描述


检索结果如下。选择查看期刊影响,弹出右侧内容,选择跳转到JCR,将年份设置为2023年,即可看到对应期刊在2023年的影响因子为27.4。

在这里插入图片描述


在这里插入图片描述
在这里插入图片描述


在这里插入图片描述

在WOS文章:“Ternary NiCo2Px Nanowires as pH-Universal Electrocatalysts for Highly Efficient Hydrogen Evolution Reaction”主页,可以看到被wos核心合集引用次数为656次。且核心合集中的引用来源于 SCIE 子数据库,因此其 SCIE 被引次数为 656 次。

在这里插入图片描述

5、请检索文章:“Electric field effect in atomically thin carbon films” 确定其被收录在WOS核心集的哪个子数据库(简写如CPCI-S、SCIE或SSCI),并指出该文的入藏号(WOS:00000000000)

结论:文章:“Electric field effect in atomically thin carbon films” 被收录在WOS核心集的SCIE子数据库。入藏号为:WOS:000224756700045。

检索设置如下:

在这里插入图片描述

检索结果如下。

在这里插入图片描述

在文章详情页可以看到对应的数据库为Science Citation Index Expanded (SCI-Expanded)。

在这里插入图片描述

在检索页选择复制入藏号,粘贴得到入藏号为:WOS:000224756700045。

在这里插入图片描述

6、利用WOS数据库,请检索“计算机辅助设计”这一领域的SCIE收录论文情况(要给出检索结果数量),并列出在这一领域发文量最多的前3种期刊名称和前3个研究机构名称

结论:“计算机辅助设计”这一领域的SCIE收录论文情况为29172篇。在这一领域发文量最多的前3种期刊名称为《JOURNAL OF PROSTHETIC DENTISTRY》、《INTERNATIONAL JOURNAL OF ADVANCED MANUFACTURING TECHNOLOGY》、《IEEE TRANSACTIONS ON ELECTRON DEVICES》;前3个研究机构名称为Seoul National University College Of Engineering、Shanghai Medical University 2、Zhejiang University Faculty Of Information Technology。

确定检索式为:(“computer aided design” OR “computer-aided design” OR “computer aided drafting”) OR (CAD AND design)。

检索设置如下。可以看到共有29172条检索结果。

在这里插入图片描述
在这里插入图片描述

接着选择分析检索结果。选择出版物标题,可以看到排名前三的期刊为《JOURNAL OF PROSTHETIC DENTISTRY》、《INTERNATIONAL JOURNAL OF ADVANCED MANUFACTURING TECHNOLOGY》、《IEEE TRANSACTIONS ON ELECTRON DEVICES》。

在这里插入图片描述


选择带部门的所属机构。可以看到排名前三的机构为:Seoul National University College Of Engineering、Shanghai Medical University 2、Zhejiang University Faculty Of Information Technology。

在这里插入图片描述

写在最后

🖊️由于笔者精力有限且本文更多的目的是通过📒博客记录学习、分享更多知识,因此文中部分描述不太具体,如有不太理解💫的地方可在评论区👀留言。非特殊赶deadline或假期期间,笔者会经常上线回复。如有不便之处,请海涵~另外,创造不易,转载请注明出处💗💗💗~

Read more

开源大模型实战:GPT-OSS本地部署与全面测评

开源大模型实战:GPT-OSS本地部署与全面测评

文章目录 * 一、引言 * 二、安装Ollama * 三、Linux部署GPT-OSS-20B模型 * 四、模型测试 * 4.1 AI幻觉检测题 * 题目1:虚假历史事件 * 题目2:不存在的科学概念 * 题目3:虚构的地理信息 * 题目4:错误的数学常识 * 题目5:虚假的生物学事实 * 4.2 算法题测试 * 题目1:动态规划 - 最长公共子序列 * 题目2:图算法 - 岛屿数量 * 4.3 SQL题测试 * 题目1:复杂查询 - 员工薪资排名 * 题目2:数据分析 - 连续登录用户 * 题目3:窗口函数 - 移动平均 * 4.4

By Ne0inhk

GitHub网络加速完整解决方案:轻松突破访问限制

GitHub网络加速完整解决方案:轻松突破访问限制 【免费下载链接】hostsGitHub最新hosts。解决GitHub图片无法显示,加速GitHub网页浏览。 项目地址: https://gitcode.com/gh_mirrors/host/hosts GitHub Hosts项目是一个专为开发者设计的开源工具,通过智能优化hosts配置,有效解决GitHub图片无法显示、页面加载缓慢等常见网络问题。这个基于TypeScript开发的项目提供了多种配置方案,让您能够轻松享受流畅的GitHub访问体验。 🚀 项目核心价值 快速网络访问:通过精心测试的IP地址映射,绕过传统DNS解析瓶颈,实现直接快速访问GitHub服务。 全平台兼容性:完美支持macOS、Windows、Linux等主流操作系统,无论您使用哪种开发环境都能轻松部署。 自动化更新机制:支持定时获取最新IP配置,确保长期稳定的访问体验,无需手动维护。 零成本解决方案:完全免费开源,无需额外付费服务,为开发者提供经济高效的网络优化方案。 📋 快速配置指南 第一步:获取项目文件 # 克隆项目仓库

By Ne0inhk