本体构建方法
本文通过借鉴其他领域本体的构建方法,尤其是苏格兰爱丁堡大学的企业本体的建立过程,首先尝试着一步步建立起自己的本体模型,并且经过反复迭代的过程,不断的进行排错和修改,直至本体模型初具雏形。然后在遵循本体建立准则的基础上,通过抽象总结出一套领域本体的知识工程构建方法。 领域本体构建过程
3.1 确定本体的领域与范围
首先要明确构建的本体将覆盖的专业领域、应将本体的目的、作用以及它的系统开发,维护和应用对象,这些对于领域本体的建立过程中有着很大的关系,所以应当在开发本体前注意。对于特定的专业领域的一些特殊的表达法和特定的详细内容等的注释,应当明确。另外能力问(competency questions )是由一系列基于该本体的知识库系统应该能回答出的问题组成(Gruninger 和Fox ,1995),能力问题被用来检验该本体是否合适:本体是否包含了足够的信息来回答这些问题?问题的答案是否需要特定的细化程度或需要一个特定领域的表示。
3.2 列举领域中重要的术语、概念。
在领域本体创建的初始阶段,尽可能列举出系统想要陈述的或要向用户解释的所有概念。这上面的概念和术语是需要声明或解释的。而不必在意所要表达的概念之间的意思是否重叠,也不要考虑这些概念到底用何种方式(类、属性还是实例)来表达。
3.3 建立本体框架。
上一步骤中已经产生了领域中大量的概念,但却是一张毫无组织结构的词汇表,这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。另外,对其中的每一个概念的重要性要进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,尽可能准确而精简的表达出领域的知识。从而形成一个领域知识的框架体系,得到领域本体的框架结构。 上述Step 2和 Step 3并非是绝对的顺序,这两个步骤往往也可以颠倒过来进行,有时会先列举出领域中的术语和概念,然后从概念中抽象出本体框架;也可以先产生本体框架,再按照框架列举出领域的术语。至于如何具体进行,应该根据开发人员对领域的认识程度,如果领域内已经存在非常清晰的框架或者认识已经很深刻,则可以直接产生框架。当然,这两个步骤也可以交叉进行。
3. 4 设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。
为了描述各个概念,利用术语对概念进行标识,并对其含义进行定义,在这一步定义时先采用自然语言进行定义。为了定义一个概念,设计了元本体。一个概念可以采用元本体中定义的元概念进行定义,或采用在本体中已经被定义的概念进行定义,或重用已有的本体。
元本体是指本体的本体,其术语用于定义本体中的概念,如实体、关系、角色等。它可以说是更高层次的本体,是领域内概念的抽象。在设计元本体时,尽量做到领域无关性,并且包含的元概念数目尽可能的少。 目前,web 上有许多可重用的本体资源库。重用已有的本体,既可以减少开发的工作量,又能增强与其它使用该本体的系统的交互能力。目前有许多本体可以通过internet 获得,许多现成的本体,例如:UNSPSC 、 DMOZ 、Ontolingua 的本体文库和DAML 的本体文库等,可以导入倒本体开发系统中。本体被表达的形式通常并不重要,因为许多知识表示系统能够导入和导出本体。即使某个知识表示系统不能直接使用某种形式的本体,将本体从一种形式到另一种形式通常也不难实现。
除了概念,还要定义概念之间的关系。这些关系不仅仅涉及同工作领域的概念,不同工作领域的概念也可以相关,只是这些关系总是属于某一个工作领域。
定义类(class )及类的层次体系。创建的概念中,很大一部分属于类,而对类的层次的定义有以下3种方法:
(1) 自上向下法(top-down ):先定义领域中综合的、概括性的概念,然后逐步细化、说明。
(2) 自下向上法(bottom-up ):先定义具体的、特殊的概念,最底层、最细小的类的定义开始,然后对这些概念泛化成综合性的概念。
(3) 混合法(combination ):混合使用自上向下法与自下向上法。先建立那些显而易见的概念,然后分别向上与向下进行泛化与细化。
这3种方法各有利弊,采用那种方法取决于开发人员对领域认识的角度。如果设计人员对该领域有自上向下系统的认识,第1种方法比较适合。一般来说,混合法比较适合大部分设计人员。但不论采用哪种方法,都需要从概念类的定义开始,从步骤2建立的概念中,选择那些独立存在的对象所对应的概念(注意:不是那些描述这些对象性质的概念),并采用术语来表示。这些术语将以类的形式组织到本体的类的层次分类系统中去。
本体构建方法
本文通过借鉴其他领域本体的构建方法,尤其是苏格兰爱丁堡大学的企业本体的建立过程,首先尝试着一步步建立起自己的本体模型,并且经过反复迭代的过程,不断的进行排错和修改,直至本体模型初具雏形。然后在遵循本体建立准则的基础上,通过抽象总结出一套领域本体的知识工程构建方法。 领域本体构建过程
3.1 确定本体的领域与范围
首先要明确构建的本体将覆盖的专业领域、应将本体的目的、作用以及它的系统开发,维护和应用对象,这些对于领域本体的建立过程中有着很大的关系,所以应当在开发本体前注意。对于特定的专业领域的一些特殊的表达法和特定的详细内容等的注释,应当明确。另外能力问(competency questions )是由一系列基于该本体的知识库系统应该能回答出的问题组成(Gruninger 和Fox ,1995),能力问题被用来检验该本体是否合适:本体是否包含了足够的信息来回答这些问题?问题的答案是否需要特定的细化程度或需要一个特定领域的表示。
3.2 列举领域中重要的术语、概念。
在领域本体创建的初始阶段,尽可能列举出系统想要陈述的或要向用户解释的所有概念。这上面的概念和术语是需要声明或解释的。而不必在意所要表达的概念之间的意思是否重叠,也不要考虑这些概念到底用何种方式(类、属性还是实例)来表达。
3.3 建立本体框架。
上一步骤中已经产生了领域中大量的概念,但却是一张毫无组织结构的词汇表,这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。另外,对其中的每一个概念的重要性要进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,尽可能准确而精简的表达出领域的知识。从而形成一个领域知识的框架体系,得到领域本体的框架结构。 上述Step 2和 Step 3并非是绝对的顺序,这两个步骤往往也可以颠倒过来进行,有时会先列举出领域中的术语和概念,然后从概念中抽象出本体框架;也可以先产生本体框架,再按照框架列举出领域的术语。至于如何具体进行,应该根据开发人员对领域的认识程度,如果领域内已经存在非常清晰的框架或者认识已经很深刻,则可以直接产生框架。当然,这两个步骤也可以交叉进行。
3. 4 设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。
为了描述各个概念,利用术语对概念进行标识,并对其含义进行定义,在这一步定义时先采用自然语言进行定义。为了定义一个概念,设计了元本体。一个概念可以采用元本体中定义的元概念进行定义,或采用在本体中已经被定义的概念进行定义,或重用已有的本体。
元本体是指本体的本体,其术语用于定义本体中的概念,如实体、关系、角色等。它可以说是更高层次的本体,是领域内概念的抽象。在设计元本体时,尽量做到领域无关性,并且包含的元概念数目尽可能的少。 目前,web 上有许多可重用的本体资源库。重用已有的本体,既可以减少开发的工作量,又能增强与其它使用该本体的系统的交互能力。目前有许多本体可以通过internet 获得,许多现成的本体,例如:UNSPSC 、 DMOZ 、Ontolingua 的本体文库和DAML 的本体文库等,可以导入倒本体开发系统中。本体被表达的形式通常并不重要,因为许多知识表示系统能够导入和导出本体。即使某个知识表示系统不能直接使用某种形式的本体,将本体从一种形式到另一种形式通常也不难实现。
除了概念,还要定义概念之间的关系。这些关系不仅仅涉及同工作领域的概念,不同工作领域的概念也可以相关,只是这些关系总是属于某一个工作领域。
定义类(class )及类的层次体系。创建的概念中,很大一部分属于类,而对类的层次的定义有以下3种方法:
(1) 自上向下法(top-down ):先定义领域中综合的、概括性的概念,然后逐步细化、说明。
(2) 自下向上法(bottom-up ):先定义具体的、特殊的概念,最底层、最细小的类的定义开始,然后对这些概念泛化成综合性的概念。
(3) 混合法(combination ):混合使用自上向下法与自下向上法。先建立那些显而易见的概念,然后分别向上与向下进行泛化与细化。
这3种方法各有利弊,采用那种方法取决于开发人员对领域认识的角度。如果设计人员对该领域有自上向下系统的认识,第1种方法比较适合。一般来说,混合法比较适合大部分设计人员。但不论采用哪种方法,都需要从概念类的定义开始,从步骤2建立的概念中,选择那些独立存在的对象所对应的概念(注意:不是那些描述这些对象性质的概念),并采用术语来表示。这些术语将以类的形式组织到本体的类的层次分类系统中去。