郑州大学信息组织期末考试总结
(白华老是的)
名词解释
1.轮排转换:依次把检索语句中每一个有检索意义的词轮流排列在检索位置上。
2.分析标引:是一种根据资源中部分片段或集合型资源的构成单元为单位所进行的标引
3.职能符号:是一种表示主题标识在组配中的句法职能而规定的辅助符号。
4.层累制:按照类目相应的等级配置相应位数的号码,类号反映类目次序和等级的标记制度。
5.标记符号:是分类法中标记类目的次序、关系和位置的符号。
6.同义控制,对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。
7.联系符号:防止主题词之间误组配而使用的揭示同一文献主题之间联系强度的专用符号。
8.句法控制:即根据信息资源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的规定。
9.范畴索引:范畴索引又称分类索引、范畴表,是一种按照词汇所属的 学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具
10.引用次序:指复合主题标引或检索时,各个主题因素的组合次序。
11.叙词法:叙词法是一种从自然语言中精选出来的、经过严格规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题法。
12.标题法:以标题词作为检索标识的文献标引与检索方法
常识性问题
一.词汇控制方法
词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
词汇控制的主要措施包括:
1)同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。
3)词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。
词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等。
二.文献分类法类目之间有哪些关系,它们的表现有哪些?
(1)类目之间的关系主要有:从属关系,即类目体系中一个类与其直接区分出来的子类之间的关系;并列关系,是类目体系中同位类之间构成的关系;交替关系,是指交替类目与相
应的使用类目之间形成的关系;相关关系,是指类目之间除从属、并列、交替等关系之外其他联系;
(2)上述关系在类目体系中体现为:从属、并列关系是类目体系的主要关系,揭示类目之间的纵向联系,类目从属关系以上位类、下位类表现出来,类目并列关系以同位类表现出来;类目交替关系、类目相关关系是类目体系主要关系的补充,揭示了类目之间的横向联系;在类目体系中,交替关系以交替类目与使用类目体现出同一关系主题内容的资源的可选择性;相关关系以类目参照体现类目之间的交叉等联系。
三.汉语主题词表》中标示词间关系的符号
等同关系 用Y 代D
等级关系 分F 属 S 族z
相关关系 参 C
四.元数据总体结构
1)内容结构对该Metadata的构成元素及其定义标准进行描述。
2)句法结构定义Metadata结构以及如何描述这种结构。
3)语义结构定义Metadata元素的具体描述方法。
五 主题法的类型
标题法 元词法 叙词法 关键词法
六 叙词法吸取了其他检索语言哪些技术
1吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档; 2吸取了体系分类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词汇分类表;
3同时它广泛吸取了先组式标题和参照方法、关键词法的轮排技术、分面分类法的分面技术等,使之成为最具优势的检索语言。
七.概念组配与字面组配的区别
1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合;
2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。
八 一个概念的内涵和它的外延存在着反比关系:即内涵越多,外延越少;反之亦然。
九.在CNMARC中,个人名称主题、团体名称主题和普通主题在哪些字段
个人名称(规范化的名称形式),入600人名主题字段
例:600 #0 $a冰心 $f 1900-1999 $x传记
机构名称(学校、公司、政府机构、研究所等),入601团体名称主题字段。
一般学科名称主题填入“606论题性(学科名称)主题”字段。
十.在主题法中一般能够轮排的主题因素
主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)
十一.按组配方式分的信息组织类型
先组式检索工具 后组式检索工具
十二.信息组织类型中以形式特征形成的检索工具特点
只能按资源某个形式,查找已知的个别资源,不能查找同一类的大量资源
重要问题
一.主题法中同义控制的内容
同义控制,是指在语义相同而词形不同的语词之间,只能优选其中的一个作为正式的叙词,
其余的可作为非叙词收入叙词表,作为查找入口。同义控制的内容包括同义词之间的控制和准同义词之间的控制。同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
二.用《中图法》归入相应的基本大类,谈你应用的分类规则
注意复分、仿分和组配的应用及号码加“0”的问题
三.概念组配与字面组配的区别
(1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合;
(2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。
四.句式转换的方法及轮排索引的作用
方法:1)轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动。
2)链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。
3)分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。
作用:(1)增加检索入口,可从词素出发对叙词进行查找。
(2) 根据相同词素集中在一起的特点,便于相关词的查找。
(3) 编表时,可以利用字面成族的特点,对词间关系进行处理。
五.主题标引的组配规则是:
主题标引的组配必须是概念组配;在几个相互组配的主题词之间,其概念必须有交叉或限定的逻辑关系,不能采取单纯的字面拼合组配或随意组配;应优先选用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时,才考虑采用限定组配方式;必须选用与文献主题关系最密切、最邻近的主题词,不能选用泛指的主题词进行越级组配;对并列多主题文献进行分组标引;组配必须概念清楚、确切,只能具有一个含义,若组配的结果具有多个含义时,应考虑改用上位或近义的主题标引,或者是增补新的专指主题词标引;组配次序,应依据国家标准中主题分面组配公式,即:“主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)”确定其次序,多个主体因素的主题可依逻辑顺序确定其次序,在难以确定逻辑顺序时,可采用自然语言顺序。
六.主题标引的概念转换有哪些基本的方式和规则?
两种方式:一种是直接转换,即直接用叙词表的一个叙词来表达;一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题.
两种规则是:必须进行概念分,避免字面分拆;必须根据概念内涵析出最专指的分解 形式。
七.引用次序在分类体系建立的作用是:
1)决定着类目体系的展开方式与类目体系的结构,可以直接影响分类体系的性能;
2)决定选择何种标准建立体系及其先后次序,因而决定着按什么方式集中信息资源;
3)决定着为用户提供何种检索途径,它与分类法的适用性有着密切关系。
因此,应优先选择某一学科、事物的主要属性或具有检索意义的属性作为分类标准。
八.叙词词汇选择的原则
词汇选择的原则是客观性、可预见性、实用性、单义性、成族性、专指性和科学性。
保留学科领域中使用频率较高的词组。凡经分解后,分解后的单词有一方没有独立检索意义,
或改变它在词组中的原义,或组配结果可能有歧义的,应该在叙词表中收录词组。有检索价值的专有名词,一般可直接使用。
九.主题法揭示和处理叙词之间关系的意义是:
1)建立叙词之间的语义关系,把相关叙词(同一、从属、相关)联系起来,形成语义网络,
2)把相关叙词指向某个叙词,形成一个叙词的相关索引
十.主题标引的基本规则:
1.标引书写形式规则:文献主题标引必须选用词表中的正式主题词标引,其书写形式要与词表中的词形一致。词表中的非正式主题词只起指向正式主题词的作用,本身不得直接用于标引
2.CNMARC中各类名称主题词可直接作为正式主题词记录在相应的字段的规则
3 .增词(自由词)标引规则
4.标引选词的专指性 /优先顺序 /查词规则
5.主题标引的组配规则
十一.主题概念的转换的方式
主题概念的转换有两种方式,一种是直接转换,即直接用叙词表的一个叙词来表达,一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题 十二.分类标引的基本规则有哪些?
(1)按学科属性原则
分类标引必须首先以其内容的学科或专业属性为主要标准,只有在不适于以学科属性为区分标准时, 才考虑以其它方面的性质(如体裁、地域、时代、语文等)作为分类标准;
(2)专指性原则
文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类;
(3)实用性原则
文献分类标引必须使文献尽其用,即要根据读者的需要将文献分入最大用途的类; 十三(十二里面的分支)专指性原则?
文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类; 十四.主题法的基本特征
直接以语词作为检索标识, 以字顺作为主要的检索途径;以特定的事物、问题、现象、主题为中心集中信息资源;通过参照系统等方式揭示主题词之间的关系;
十五.增词(自由词)标引的要求
词有检索意义或较广泛的组配作用;表中漏收的重要主题概念;具有或预计有较高的标引频率;地名、人名、机构名、著作名等专有名词等
十六.叙词法的优点与局限
优点:结构完备,词汇控制严格;采用概念组配,避免了字面组配带来的一些误差,保证了组配语义的准确性;设置了完善的参照系统,同时使用多种方法显示概念间的关系,有利于提高查全率与查准率
缺点:由于词汇控制严格,词表编制和管理的要求高,编制和管理成本高;文献标引需要在概念分析的基础上进行,增加了标引的难度。
十七.专有叙词表一般收录哪些词汇
通常可根据使用需要,将一些特定领域的专有名词或专有叙词单独编为副表。如“世界各国
政区名称表”“自然地理区划名称表”、“组织机构表”、“人物表”、“学科名称表”等。
郑州大学信息组织期末考试总结
(白华老是的)
名词解释
1.轮排转换:依次把检索语句中每一个有检索意义的词轮流排列在检索位置上。
2.分析标引:是一种根据资源中部分片段或集合型资源的构成单元为单位所进行的标引
3.职能符号:是一种表示主题标识在组配中的句法职能而规定的辅助符号。
4.层累制:按照类目相应的等级配置相应位数的号码,类号反映类目次序和等级的标记制度。
5.标记符号:是分类法中标记类目的次序、关系和位置的符号。
6.同义控制,对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。
7.联系符号:防止主题词之间误组配而使用的揭示同一文献主题之间联系强度的专用符号。
8.句法控制:即根据信息资源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的规定。
9.范畴索引:范畴索引又称分类索引、范畴表,是一种按照词汇所属的 学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具
10.引用次序:指复合主题标引或检索时,各个主题因素的组合次序。
11.叙词法:叙词法是一种从自然语言中精选出来的、经过严格规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题法。
12.标题法:以标题词作为检索标识的文献标引与检索方法
常识性问题
一.词汇控制方法
词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
词汇控制的主要措施包括:
1)同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。
3)词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。
词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等。
二.文献分类法类目之间有哪些关系,它们的表现有哪些?
(1)类目之间的关系主要有:从属关系,即类目体系中一个类与其直接区分出来的子类之间的关系;并列关系,是类目体系中同位类之间构成的关系;交替关系,是指交替类目与相
应的使用类目之间形成的关系;相关关系,是指类目之间除从属、并列、交替等关系之外其他联系;
(2)上述关系在类目体系中体现为:从属、并列关系是类目体系的主要关系,揭示类目之间的纵向联系,类目从属关系以上位类、下位类表现出来,类目并列关系以同位类表现出来;类目交替关系、类目相关关系是类目体系主要关系的补充,揭示了类目之间的横向联系;在类目体系中,交替关系以交替类目与使用类目体现出同一关系主题内容的资源的可选择性;相关关系以类目参照体现类目之间的交叉等联系。
三.汉语主题词表》中标示词间关系的符号
等同关系 用Y 代D
等级关系 分F 属 S 族z
相关关系 参 C
四.元数据总体结构
1)内容结构对该Metadata的构成元素及其定义标准进行描述。
2)句法结构定义Metadata结构以及如何描述这种结构。
3)语义结构定义Metadata元素的具体描述方法。
五 主题法的类型
标题法 元词法 叙词法 关键词法
六 叙词法吸取了其他检索语言哪些技术
1吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档; 2吸取了体系分类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词汇分类表;
3同时它广泛吸取了先组式标题和参照方法、关键词法的轮排技术、分面分类法的分面技术等,使之成为最具优势的检索语言。
七.概念组配与字面组配的区别
1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合;
2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。
八 一个概念的内涵和它的外延存在着反比关系:即内涵越多,外延越少;反之亦然。
九.在CNMARC中,个人名称主题、团体名称主题和普通主题在哪些字段
个人名称(规范化的名称形式),入600人名主题字段
例:600 #0 $a冰心 $f 1900-1999 $x传记
机构名称(学校、公司、政府机构、研究所等),入601团体名称主题字段。
一般学科名称主题填入“606论题性(学科名称)主题”字段。
十.在主题法中一般能够轮排的主题因素
主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)
十一.按组配方式分的信息组织类型
先组式检索工具 后组式检索工具
十二.信息组织类型中以形式特征形成的检索工具特点
只能按资源某个形式,查找已知的个别资源,不能查找同一类的大量资源
重要问题
一.主题法中同义控制的内容
同义控制,是指在语义相同而词形不同的语词之间,只能优选其中的一个作为正式的叙词,
其余的可作为非叙词收入叙词表,作为查找入口。同义控制的内容包括同义词之间的控制和准同义词之间的控制。同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
二.用《中图法》归入相应的基本大类,谈你应用的分类规则
注意复分、仿分和组配的应用及号码加“0”的问题
三.概念组配与字面组配的区别
(1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合;
(2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。
四.句式转换的方法及轮排索引的作用
方法:1)轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动。
2)链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。
3)分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。
作用:(1)增加检索入口,可从词素出发对叙词进行查找。
(2) 根据相同词素集中在一起的特点,便于相关词的查找。
(3) 编表时,可以利用字面成族的特点,对词间关系进行处理。
五.主题标引的组配规则是:
主题标引的组配必须是概念组配;在几个相互组配的主题词之间,其概念必须有交叉或限定的逻辑关系,不能采取单纯的字面拼合组配或随意组配;应优先选用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时,才考虑采用限定组配方式;必须选用与文献主题关系最密切、最邻近的主题词,不能选用泛指的主题词进行越级组配;对并列多主题文献进行分组标引;组配必须概念清楚、确切,只能具有一个含义,若组配的结果具有多个含义时,应考虑改用上位或近义的主题标引,或者是增补新的专指主题词标引;组配次序,应依据国家标准中主题分面组配公式,即:“主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)”确定其次序,多个主体因素的主题可依逻辑顺序确定其次序,在难以确定逻辑顺序时,可采用自然语言顺序。
六.主题标引的概念转换有哪些基本的方式和规则?
两种方式:一种是直接转换,即直接用叙词表的一个叙词来表达;一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题.
两种规则是:必须进行概念分,避免字面分拆;必须根据概念内涵析出最专指的分解 形式。
七.引用次序在分类体系建立的作用是:
1)决定着类目体系的展开方式与类目体系的结构,可以直接影响分类体系的性能;
2)决定选择何种标准建立体系及其先后次序,因而决定着按什么方式集中信息资源;
3)决定着为用户提供何种检索途径,它与分类法的适用性有着密切关系。
因此,应优先选择某一学科、事物的主要属性或具有检索意义的属性作为分类标准。
八.叙词词汇选择的原则
词汇选择的原则是客观性、可预见性、实用性、单义性、成族性、专指性和科学性。
保留学科领域中使用频率较高的词组。凡经分解后,分解后的单词有一方没有独立检索意义,
或改变它在词组中的原义,或组配结果可能有歧义的,应该在叙词表中收录词组。有检索价值的专有名词,一般可直接使用。
九.主题法揭示和处理叙词之间关系的意义是:
1)建立叙词之间的语义关系,把相关叙词(同一、从属、相关)联系起来,形成语义网络,
2)把相关叙词指向某个叙词,形成一个叙词的相关索引
十.主题标引的基本规则:
1.标引书写形式规则:文献主题标引必须选用词表中的正式主题词标引,其书写形式要与词表中的词形一致。词表中的非正式主题词只起指向正式主题词的作用,本身不得直接用于标引
2.CNMARC中各类名称主题词可直接作为正式主题词记录在相应的字段的规则
3 .增词(自由词)标引规则
4.标引选词的专指性 /优先顺序 /查词规则
5.主题标引的组配规则
十一.主题概念的转换的方式
主题概念的转换有两种方式,一种是直接转换,即直接用叙词表的一个叙词来表达,一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题 十二.分类标引的基本规则有哪些?
(1)按学科属性原则
分类标引必须首先以其内容的学科或专业属性为主要标准,只有在不适于以学科属性为区分标准时, 才考虑以其它方面的性质(如体裁、地域、时代、语文等)作为分类标准;
(2)专指性原则
文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类;
(3)实用性原则
文献分类标引必须使文献尽其用,即要根据读者的需要将文献分入最大用途的类; 十三(十二里面的分支)专指性原则?
文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类; 十四.主题法的基本特征
直接以语词作为检索标识, 以字顺作为主要的检索途径;以特定的事物、问题、现象、主题为中心集中信息资源;通过参照系统等方式揭示主题词之间的关系;
十五.增词(自由词)标引的要求
词有检索意义或较广泛的组配作用;表中漏收的重要主题概念;具有或预计有较高的标引频率;地名、人名、机构名、著作名等专有名词等
十六.叙词法的优点与局限
优点:结构完备,词汇控制严格;采用概念组配,避免了字面组配带来的一些误差,保证了组配语义的准确性;设置了完善的参照系统,同时使用多种方法显示概念间的关系,有利于提高查全率与查准率
缺点:由于词汇控制严格,词表编制和管理的要求高,编制和管理成本高;文献标引需要在概念分析的基础上进行,增加了标引的难度。
十七.专有叙词表一般收录哪些词汇
通常可根据使用需要,将一些特定领域的专有名词或专有叙词单独编为副表。如“世界各国
政区名称表”“自然地理区划名称表”、“组织机构表”、“人物表”、“学科名称表”等。