第一章电子资源及检索概述
•第一节电子资源概述
1.1.1 电子资源的产生与发展1.1.2 电子资源的概念与类型:
参考数据库,全文数据库,事实数据库,电子图书,电子期刊,电子报纸,其它。•第二节电子资源的检索理论与方法1.2.1 电子资源检索原理1.2.2 电子资源检索方法1.2.3 电子资源检索技术•教学提示
本章重点在于让学生了解电子资源的概念和类型,掌握检索的基本原理和方法。
1
第一节电子资源的概念与类型
•1.1.1 电子资源的产生与发展•1.1.2 电子资源的概念与类型
2
1.1.2 电子资源的概念与类型
电子资源概念
简单地说,指一切以数字形式生产和发行的信息资源。的信息资源。
电子信息资源是以数字化形式(即二进制代码0,1)把文字、图象、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上,并以光信号、电信号的形式传输,通过响应的计算机和其他外部设备再现出来的信息资源.
应该明确:一,电子信息资源是一种可利用的资源;二,电子信息资源包括网络信息资源和一些不在网上传输的信息资源,如光盘数据库、E-book等。
3
电子资源的特点
•易获取性•共享性
•资料更新快•形式的多样性•知识的类聚性
4
电子资源类型
按物理存在分:按物理存在分:
有形资源(光盘、磁盘、磁带、IC卡等);虚拟资源(网络数据库、互联网信息资源等)
按表现形式分:按表现形式分:
数据(数字形式、字母形式、图形形式、声音形式、混合形式);程序(计算机指令或例程)
按访问方式分:按访问方式分:
本地访问资源;远程访问资源
5
电子资源类型
按照生产途径和发布范围划分为:按照生产途径和发布范围划分为:(1)商用电子资源(正式出版物):
是正式出版机构或出版商/数据库商出版发行的,在电子资源中所占比例最大,包括各类数据库、电子刊、电子图书等。这类资源学术价值高,具备检索系统,出版成本高,必须购买使用权才可使用。
(2)网络公开学术资源(完全开放),如网页、图书馆的OPAC。
(3)特色资源(半开放的,如教学课件、特色数据库)
(4)其他资源(如FTP、BBS、E-MAIL、BLOG、个人空间等)
6
电子资源类型
按内容划分:按内容划分:
文摘索引数据库全文数据库电子图书电子期刊学位论文会议论文标准
事实型数据库
搜索引擎/分类指南网络学术资源学科导航
其他:网站、FTP资源、BBS、新闻组等
8
电子资源类型
按内容划分:按内容划分:
(1)文摘索引型数据库:文摘索引型数据库:
包含各种数据、信息或知识的原始来源和属性的数据库,如书目、文摘、索引等。例:万方科技信息子系统各数据库-----中文SCI、ISTP、EI、INSPEC -----英文
9
(2)全文数据库:全文数据库:
收录原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主,数据库中的文献类型多样。如:
IEEE/IEE(IEL)电子图书馆数据库
EBSCO全文数据库
10
11
12
13
14
(3)事实型数据库:事实型数据库:
包含大量数据、事实的数据库,如数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。如:
万方数据库系统中:
中国企业、公司及产品数据库
中国科技专家数据库
中国科研机构数据库
中国大百科全书
15
16
17
(4)电子图书:电子图书:
如:超星电子图书
方正Apabi方正Apabi电子图书Apabi电子图书
外文电子图书1000外文电子图书1000种1000种
读秀知识库
SPRINGER电子书SPRINGER电子书
数图外文电子书
18
(5)电子期刊:电子期刊:
包括与纸本期刊并行的电子期刊,如著名的《科学》杂志等,以及纯电子期刊。如:中国期刊网、中国期刊网、万方数字化期刊、万方数字化期刊、维普电子期刊、龙源电子期刊
Kluwer、Kluwer、Elsevier、Elsevier、Springer、Springer、John Wiley、John Wiley、APS、APS、ACM、ACM、…
19
(6)电子报纸:电子报纸:包括印刷型报纸的电子版和纯电子报纸。例:
《人民日报》(光盘版、网络版)
20
(7)搜索引擎和分类指南:搜索引擎和分类指南:
例:、百度、百度、Yahoo
21
(8)网络学术资源导航:网络学术资源导航:
即学科导航系统,即学科导航系统,主要由图书馆或行业协会单独或联合建成。业协会单独或联合建成。
例:材料复合新技术信息门户
学科虚拟导航
22
23
24
(9)其他网络资源:其他网络资源:
主要为用户提供有用的知识和动态信息,主要为用户提供有用的知识和动态信息,包括网站、括网站、FTP、E-MAIL、BBS等。
25
第二节电子资源的检索理
论与方法
•1.2.1 电子资源检索原理
•1.2.2 电子资源检索方法
•1.2.3 电子资源检索技术
26
第二节电子资源的检索理论与方法•1.2.1电子资源检索原理
(1)检索的涵义:检索的涵义:电子资源检索是通过检索系统,采用一定的技术手段,根据一定的准则,在数据库中或其他形式的网络信息资源中自动找出用户所需要的相关信息。
(2)检索的过程:检索的过程:用户在检索界面上输入自己的检索式,并通过网络向数据库系统提交提问;检索系统将用户的请求与数据库中的信息进行匹配运算,将命中的信息通过网络发回到用户的检索界面上,用户通过检索界面获取自己的检索结果。
27
检索语言
检索语言:检索语言:是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。征和表达用户信息提问的一种专门语言。(是根据信息检索需要创建的一种人工语言。)息检索需要创建的一种人工语言。)
当存储信息时,检索系统对文献内容进行分析,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词并赋于一定的标识,如题名、如题名、作者、作者、主题词等,主题词等,作为存储与检索的依据,然后纳入到数据库中。然后纳入到数据库中。
当检索信息时,检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。找到自己所需的信息
28
•分类语言
以号码为基本符号,用分类法和类目表达文献主题概念的检索语言,特点是用分类号表达各种概念,根据概念之间的关系,把他们组织成一个逻辑体系。
•主题语言
用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念,特点是直接用词语来表达各种概念。
29
信息
存储信息检索30
1.2.2 电子资源检索方法
制定正确的检索策略,制定正确的检索策略,为检索过程进行指
优化检索过程,提高检索效率,全面、导,优化检索过程,提高检索效率,全面、准确、准确、快速地找到所需信息。快速地找到所需信息。
检索策略:检索策略:
需求分析---选择相关信息资源----构造检索式---选择检索入口----调整检索策略。调整检索策略。
31
1.2.3 电子资源检索技术
A、布尔逻辑检索:运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念
之间的逻辑关系。
A AND BA OR BA NOT B
32
作者单位:合肥工业大学材料科学与工程学院年:2012.1.1----2012.9.17
作者:“吴玉程”、“薛克敏”
33
34
检索:“恐怖主义”不包含
“宗教”
35
36
37
B、位置算符检索
表示两个检索词之间的位置邻近关系。只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。
(可提高检索的准确性)
38
算符作用表达式检索结
果
W、W/N、WITH两词相邻,按顺序排Education(w)school
列Education WITH school
nW两词相邻,按顺序排Education(1w)school
列,词间可插入n个
词
两词相邻,按顺序排Education PRE schoolPRE
nNN、NEAR、ADJ两词相邻,顺序可颠Education(N)school倒Education NEAR school两词相邻,顺序可颠Education (1N) school
倒,两词间可插入n个
词
两词同在一个字段中Education (F) school
两词同在一个段落中Education SAME school
39FSAME
B、位置算符检索:位置算符检索:
注意事项:注意事项:
不是每一个检索系统都使用上述位置算符,算符,不同的系统使用的位置算符不同,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。请一定注意查阅系统的帮助文档。请一定注意查阅系统的帮助文档。
40
C、截词检索:
用截词符号“?”、“*”、“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。
(名词的单复数形式、词的不同拼写法、词的前缀或后缀变化等)
41
•截词举例
–符号:*,?,$
–后截断:librar* →library, libraries, librarian,…
199?
–前截断:*magnetic →magnetic, electro-magnetic, electromagnetic, thermo-magnetic, …
–中截断:organi?ation→organization, organisation
–无限截断:不限制被截断的字符数量,例如输入electri?可以检
electric,electrical,electricity,electrify,electrize,electrization,electrification等等。
–有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。
comput??? →compute、computer、computers、computing等,不能检索出:computable、computation、computerize等
42
D、字段检索:
检索词出现的字段,也称检索入口。常用检索字段如下表:
43
中文数据库
文摘
作者
机构
主题词/叙词
文献类型
国际标准连续出版物号
刊名
关键词
语言
出版年
题名
全文Abstracts(AB)Author(AU)外文数据库常用检索字段列表Corporate Source、Organization、Company (CS)Subiect、Descriptor(DE)Document Type(DT)ISSN (ISSN)Journal Name 、Publication Title (JN)Keywords Topic (KW)Language(LA)Publication Yea r(PY)Title(TI)Full text(FT)
常用检索字段介绍:
(一)主题词检索
主题词检索是根据标引人员按照规范词表标引出的主题词进行检索的途径,
优点:
①能满足特性检索要求,专指性强;
②能适应新兴学科及多学科文献检索,只要根据新学科的出现、发展及多学科的需要,随时增加主题词,就能快速检出所需文献。缺点:
主题词选择必须准确,需要事先掌握一定的方法。
45
•主题词由主题词表来进行规范
46
叙词表的作用
•叙词表是由专业的规范词组成,叙词表是由专业的规范词组成,它可以将同一主题不同表述的词,不同表述的词,按主题内容规范在标准的专业词
避免了由于词汇书写不同造成漏检,下,避免了由于词汇书写不同造成漏检,或词义概念混淆导致错检的问题。念混淆导致错检的问题。
•用户利用叙词表可从主题角度检索文献,用户利用叙词表可从主题角度检索文献,进而提高文献的查准率。文献的查准率。
•利用叙词表还可以从主题概念的角度扩展或缩小检索范围;索范围;
2013-10-114747
叙词检索也称为主题词,是经过规范化处理的,以基本概念为基础
的表达信息内容的词和词组。也叫受控词。
2013-10-114848
叙词检索
举例:举例:滞弹性弛豫
stress
49
2013-10-11
5050
第一章电子资源及检索概述
•第一节电子资源概述
1.1.1 电子资源的产生与发展1.1.2 电子资源的概念与类型:
参考数据库,全文数据库,事实数据库,电子图书,电子期刊,电子报纸,其它。•第二节电子资源的检索理论与方法1.2.1 电子资源检索原理1.2.2 电子资源检索方法1.2.3 电子资源检索技术•教学提示
本章重点在于让学生了解电子资源的概念和类型,掌握检索的基本原理和方法。
1
第一节电子资源的概念与类型
•1.1.1 电子资源的产生与发展•1.1.2 电子资源的概念与类型
2
1.1.2 电子资源的概念与类型
电子资源概念
简单地说,指一切以数字形式生产和发行的信息资源。的信息资源。
电子信息资源是以数字化形式(即二进制代码0,1)把文字、图象、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上,并以光信号、电信号的形式传输,通过响应的计算机和其他外部设备再现出来的信息资源.
应该明确:一,电子信息资源是一种可利用的资源;二,电子信息资源包括网络信息资源和一些不在网上传输的信息资源,如光盘数据库、E-book等。
3
电子资源的特点
•易获取性•共享性
•资料更新快•形式的多样性•知识的类聚性
4
电子资源类型
按物理存在分:按物理存在分:
有形资源(光盘、磁盘、磁带、IC卡等);虚拟资源(网络数据库、互联网信息资源等)
按表现形式分:按表现形式分:
数据(数字形式、字母形式、图形形式、声音形式、混合形式);程序(计算机指令或例程)
按访问方式分:按访问方式分:
本地访问资源;远程访问资源
5
电子资源类型
按照生产途径和发布范围划分为:按照生产途径和发布范围划分为:(1)商用电子资源(正式出版物):
是正式出版机构或出版商/数据库商出版发行的,在电子资源中所占比例最大,包括各类数据库、电子刊、电子图书等。这类资源学术价值高,具备检索系统,出版成本高,必须购买使用权才可使用。
(2)网络公开学术资源(完全开放),如网页、图书馆的OPAC。
(3)特色资源(半开放的,如教学课件、特色数据库)
(4)其他资源(如FTP、BBS、E-MAIL、BLOG、个人空间等)
6
电子资源类型
按内容划分:按内容划分:
文摘索引数据库全文数据库电子图书电子期刊学位论文会议论文标准
事实型数据库
搜索引擎/分类指南网络学术资源学科导航
其他:网站、FTP资源、BBS、新闻组等
8
电子资源类型
按内容划分:按内容划分:
(1)文摘索引型数据库:文摘索引型数据库:
包含各种数据、信息或知识的原始来源和属性的数据库,如书目、文摘、索引等。例:万方科技信息子系统各数据库-----中文SCI、ISTP、EI、INSPEC -----英文
9
(2)全文数据库:全文数据库:
收录原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主,数据库中的文献类型多样。如:
IEEE/IEE(IEL)电子图书馆数据库
EBSCO全文数据库
10
11
12
13
14
(3)事实型数据库:事实型数据库:
包含大量数据、事实的数据库,如数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。如:
万方数据库系统中:
中国企业、公司及产品数据库
中国科技专家数据库
中国科研机构数据库
中国大百科全书
15
16
17
(4)电子图书:电子图书:
如:超星电子图书
方正Apabi方正Apabi电子图书Apabi电子图书
外文电子图书1000外文电子图书1000种1000种
读秀知识库
SPRINGER电子书SPRINGER电子书
数图外文电子书
18
(5)电子期刊:电子期刊:
包括与纸本期刊并行的电子期刊,如著名的《科学》杂志等,以及纯电子期刊。如:中国期刊网、中国期刊网、万方数字化期刊、万方数字化期刊、维普电子期刊、龙源电子期刊
Kluwer、Kluwer、Elsevier、Elsevier、Springer、Springer、John Wiley、John Wiley、APS、APS、ACM、ACM、…
19
(6)电子报纸:电子报纸:包括印刷型报纸的电子版和纯电子报纸。例:
《人民日报》(光盘版、网络版)
20
(7)搜索引擎和分类指南:搜索引擎和分类指南:
例:、百度、百度、Yahoo
21
(8)网络学术资源导航:网络学术资源导航:
即学科导航系统,即学科导航系统,主要由图书馆或行业协会单独或联合建成。业协会单独或联合建成。
例:材料复合新技术信息门户
学科虚拟导航
22
23
24
(9)其他网络资源:其他网络资源:
主要为用户提供有用的知识和动态信息,主要为用户提供有用的知识和动态信息,包括网站、括网站、FTP、E-MAIL、BBS等。
25
第二节电子资源的检索理
论与方法
•1.2.1 电子资源检索原理
•1.2.2 电子资源检索方法
•1.2.3 电子资源检索技术
26
第二节电子资源的检索理论与方法•1.2.1电子资源检索原理
(1)检索的涵义:检索的涵义:电子资源检索是通过检索系统,采用一定的技术手段,根据一定的准则,在数据库中或其他形式的网络信息资源中自动找出用户所需要的相关信息。
(2)检索的过程:检索的过程:用户在检索界面上输入自己的检索式,并通过网络向数据库系统提交提问;检索系统将用户的请求与数据库中的信息进行匹配运算,将命中的信息通过网络发回到用户的检索界面上,用户通过检索界面获取自己的检索结果。
27
检索语言
检索语言:检索语言:是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。征和表达用户信息提问的一种专门语言。(是根据信息检索需要创建的一种人工语言。)息检索需要创建的一种人工语言。)
当存储信息时,检索系统对文献内容进行分析,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词并赋于一定的标识,如题名、如题名、作者、作者、主题词等,主题词等,作为存储与检索的依据,然后纳入到数据库中。然后纳入到数据库中。
当检索信息时,检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。找到自己所需的信息
28
•分类语言
以号码为基本符号,用分类法和类目表达文献主题概念的检索语言,特点是用分类号表达各种概念,根据概念之间的关系,把他们组织成一个逻辑体系。
•主题语言
用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念,特点是直接用词语来表达各种概念。
29
信息
存储信息检索30
1.2.2 电子资源检索方法
制定正确的检索策略,制定正确的检索策略,为检索过程进行指
优化检索过程,提高检索效率,全面、导,优化检索过程,提高检索效率,全面、准确、准确、快速地找到所需信息。快速地找到所需信息。
检索策略:检索策略:
需求分析---选择相关信息资源----构造检索式---选择检索入口----调整检索策略。调整检索策略。
31
1.2.3 电子资源检索技术
A、布尔逻辑检索:运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念
之间的逻辑关系。
A AND BA OR BA NOT B
32
作者单位:合肥工业大学材料科学与工程学院年:2012.1.1----2012.9.17
作者:“吴玉程”、“薛克敏”
33
34
检索:“恐怖主义”不包含
“宗教”
35
36
37
B、位置算符检索
表示两个检索词之间的位置邻近关系。只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。
(可提高检索的准确性)
38
算符作用表达式检索结
果
W、W/N、WITH两词相邻,按顺序排Education(w)school
列Education WITH school
nW两词相邻,按顺序排Education(1w)school
列,词间可插入n个
词
两词相邻,按顺序排Education PRE schoolPRE
nNN、NEAR、ADJ两词相邻,顺序可颠Education(N)school倒Education NEAR school两词相邻,顺序可颠Education (1N) school
倒,两词间可插入n个
词
两词同在一个字段中Education (F) school
两词同在一个段落中Education SAME school
39FSAME
B、位置算符检索:位置算符检索:
注意事项:注意事项:
不是每一个检索系统都使用上述位置算符,算符,不同的系统使用的位置算符不同,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。请一定注意查阅系统的帮助文档。请一定注意查阅系统的帮助文档。
40
C、截词检索:
用截词符号“?”、“*”、“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。
(名词的单复数形式、词的不同拼写法、词的前缀或后缀变化等)
41
•截词举例
–符号:*,?,$
–后截断:librar* →library, libraries, librarian,…
199?
–前截断:*magnetic →magnetic, electro-magnetic, electromagnetic, thermo-magnetic, …
–中截断:organi?ation→organization, organisation
–无限截断:不限制被截断的字符数量,例如输入electri?可以检
electric,electrical,electricity,electrify,electrize,electrization,electrification等等。
–有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。
comput??? →compute、computer、computers、computing等,不能检索出:computable、computation、computerize等
42
D、字段检索:
检索词出现的字段,也称检索入口。常用检索字段如下表:
43
中文数据库
文摘
作者
机构
主题词/叙词
文献类型
国际标准连续出版物号
刊名
关键词
语言
出版年
题名
全文Abstracts(AB)Author(AU)外文数据库常用检索字段列表Corporate Source、Organization、Company (CS)Subiect、Descriptor(DE)Document Type(DT)ISSN (ISSN)Journal Name 、Publication Title (JN)Keywords Topic (KW)Language(LA)Publication Yea r(PY)Title(TI)Full text(FT)
常用检索字段介绍:
(一)主题词检索
主题词检索是根据标引人员按照规范词表标引出的主题词进行检索的途径,
优点:
①能满足特性检索要求,专指性强;
②能适应新兴学科及多学科文献检索,只要根据新学科的出现、发展及多学科的需要,随时增加主题词,就能快速检出所需文献。缺点:
主题词选择必须准确,需要事先掌握一定的方法。
45
•主题词由主题词表来进行规范
46
叙词表的作用
•叙词表是由专业的规范词组成,叙词表是由专业的规范词组成,它可以将同一主题不同表述的词,不同表述的词,按主题内容规范在标准的专业词
避免了由于词汇书写不同造成漏检,下,避免了由于词汇书写不同造成漏检,或词义概念混淆导致错检的问题。念混淆导致错检的问题。
•用户利用叙词表可从主题角度检索文献,用户利用叙词表可从主题角度检索文献,进而提高文献的查准率。文献的查准率。
•利用叙词表还可以从主题概念的角度扩展或缩小检索范围;索范围;
2013-10-114747
叙词检索也称为主题词,是经过规范化处理的,以基本概念为基础
的表达信息内容的词和词组。也叫受控词。
2013-10-114848
叙词检索
举例:举例:滞弹性弛豫
stress
49
2013-10-11
5050