[摘要]知识构建的基本原理不仅表现在知识构建需要一定的前提条件,而且表现在其知识状态要发生由知识元→知识单元→知识结构→知识空间的演变,还表现在其应遵循的基本原则:知识元抽取原则、知识单元序化原则、知识结构展示原则、知识空间优化原则上。
[关键词]知识构建 基本原理 知识元 知识单元 知识结构 知识空间 本体
[分类号]G350
1 引言
知识构建(Knowledge Architecture,KA)是基于信息构建(Information Architecture,IA)之上的更高层次的资源构建形式,其核心内容是由知识组织、知识标识、知识检索和知识导航四个系统组成的,它能使知识更易于理解和吸收,为用户提供比信息空间更高层次的知识空间。从“事实→数据→信息→知识→智慧→创新”的信息资源开发链来看,KA提供的是信息资源开发链较高层次的知识、智力,提供的是知识服务,它更突出人与内容的结合。
目前,人们对IA已进行了比较深入系统的研究,但对KA的研究却刚刚开始,主要是围绕着KA与IA的区别与联系,从IA迈向KA的趋势分析。所以,对KA的基本原理研究,已成为突破其理论与实践发展的瓶径。在现有基础上对KA基本原理进行研究,首先应采取比较研究方法,以便从与IA的区别中迈向KA的目标,从与M的联系中寻求KA的发展;其次,将先进的知识技术应用于KA,使KA建立的知识框架嵌入更完善的思想体系和复杂的背景因素。
2 知识构建过程中知识状态的演变
2.1 知识元――KA的理想基元
信息源于物质的抽象变换,知识源于智能对信息的认知结果;信息和知识属于两个不同领域的实体,存在着依存和变换关系。实现信息向知识的转化,是KA的首要环节。
文本是信息和知识记录的载体,文本的知识内容是由一个个独立的知识元素按其逻辑关系进行组织排列的。这种独立的知识元素人们称之为知识元,逻辑依存关系称为知识链。知识元是构成知识结构的最小独立单元,用来表示一个个针对特定问题的解决方案,可以是概念、方法、规则、公理等数据或事实,以及实例化的知识。
知识元的本体特征与认知属性更适合KA的需求。知识元可表示为:知识元=文本知识(本体论)+知识元语义概念(认知论)。知识元的本体特征为资源描述和查询提供了必须的元素,知识元采用规范的形式语言、精确的句法和明确定义的语义,对领域中的概念与概念、概念与实体、实体与实体之间的关系进行预先标注,有效减少了系统内各主体领域中概念和逻辑关系可能造成的误解和歧义,具有良好的概念层次结构和对逻辑推理的支持;知识元的认知属性使信息检索从字面匹配深入到知识元的层次,提高了检索效率,在信息源的知识标引和检索中具有重要意义。
知识元的独立性、拓扑性和链接性是语义网格环境下KA的重要起点。利用知识元这些特性,语义网格便可在知识结构、知识单元、知识元之间,通过知识链和语义链形成知识链网络和语义链网络,进而构画出知识地图,为知识的语义检索提供了途径。可见,基于知识元链接的知识网络与语义网络不仅为KA建立了知识地图,而且实现了知识组织系统以知识元为基元的语义互联推理体系结构,消除网络资源孤岛,为在语义网格中对知识的动态检索与利用建立了知识导航。
知识元内容的单一性与独立性,便于KA的知识组织与检索。内容单一、独立的知识元,容易选择与之相适应的最佳存储和查询,便于知识库的构建与检索,便于用户直接查询知识元,组合知识元,改善自己的知识结构,从而加快知识创新速度。
上述三方面知识元优势的有机结合,不但保证了将知识元作为KA的起点,既符合知识检索的要求,又遵从客观知识结构的本来面目;而且保证了基于知识元的知识组织体系的整体性和关联性,为实现KA由等级式向网络式转变提供了理论和技术可行性,使知识元成为KA的理想基元。
2.2 知识单元――KA的基本对象
文献单元是有形的物理单元,信息单元是表现文献属性的特征单元,而知识单元则是源于文献单元和信息单元的知识内容单元。若将每篇文献看成是人类知识系统中的一个知识单元,知识单元与知识系统就组成了个性知识与共性知识系统。个性知识体现在知识的创新上,共性知识系统则表现在知识的完整性上。于是,知识系统={知识单元1,知识单元2,…,知识单元n},知识单元={知识元1,知识元2,…,知识元n}。
随着人类知识管理的目标从知识载体和知识属性特征过渡到知识内容本身,知识管理的对象也经历了从文献单元到信息单元既而到知识单元的演进过程。所以,出于对知识管理优化的KA,必将知识单元视为自己构建的基本对象。为此,文献[7]对文本单元向知识单元转化进行了研究,并提出了基于本体的OTKTS(Ontology-based Text Knowledge TransformSystem)系统模型。
2.3 知识结构――KA的内容主体
在KA活动中,知识建筑师(Knowledge Architects)需要在对知识内容、用户的知识需求以及知识环境理解的基础上,对知识集合中的知识单元进行知识元抽取、分解,并对知识单元及其知识元进行本体语义标注,形成知识单元之间及其不同知识元之间的语义关联,从而建立起知识固有的层次结构关系,使知识体系成为有序的关联整体,这就是知识结构。它是知识系统存储知识及其进行交流的方式和渠道。因此,KA必将知识结构纳入其知识空间设计的内容主体。
2.4 知识空间――KA的实现目标
网络时代,KA更凸显其空间特征。KA的任务就是要求知识建筑师们在知识空间规划中,进行知识界面设计,建立知识结构和知识路径,并将知识结构及其包含的知识内容以科学的或艺术的方式在特定的知识空间中展示给用户,使用户易于发现和获取所要的知识。可见,在KA过程中,不但要使信息向知识转化,而且还要实现知识状态由知识元→知识单元→知识结构→知识空间的日益清晰化和可利用性递进。这就需要在空间中实现对知识的控制,使知识的空间分布合理化,建立知识存取的空间秩序,实现KA的目标。
总之,KA的主要活动是组织知识内容、生成知识结构和规范知识空间,直接目标是建立一个清晰的、易于理解的知识空间结构,最后向用户提供给一个良好的知识生态环境。因此,可以说KA的过程就是为知识单元生成一个合理的知识结构,并在特定的知识空间中展示这种知识结构。
3 知识构建的前提条件
我们尚不完全清楚从IA迈向KA的充分条件,但KA起码要满足以下必要条件。
3.1建立一种系统架构,提供智能交互的环境
正如T.Reamy所言:知识不是我们典型意义上存储下来的东西,相反,我们存储信息,是让人们将它转 化为知识。这意味着KA不仅关注存储系统的结构,还要关注其中嵌入的、让人们在信息系统中相互影响的、将信息转化为知识的知识管理过程,并且要让这个过程更容易、更快捷和更有生产力。
3.2 为不同的知识状态建模,实行本体存储,让知识易于获取
知识模型化为知识利用与知识采集之间架起桥梁。知识模型结构必须能够表现知识才能用于解决问题,其重要领域之一是概念本体的模型化。概念本体是某一领域或某一知识库的广义概念、属性、关系和定理的说明。概念本体可以起到已采集知识的位置标识和组织结构的作用,同时也提供人们了解知识用法的一个格式。
3.3 建立能够捕捉隐性知识的特征概貌图,强化人与人之间的知识联系
挖掘个人头脑中的隐性知识是知识管理的重要任务,这个任务与KA的目标是一致的。KA不仅要为显性知识,还需要为隐性知识建立可能的关联;不仅建立人与知识之间的联系,还要建立人与人之间的知识关联。
3.4 构建知识地图,进行知识导航
IA的一个重要产品是内容地图(Content Map),而KA要在内容地图的基础上生成一个更丰富、更复杂、更多维、更人性化的知识地图。知识地图是已获取的知识及其关系的可视化网络结构,是知识资源的导航与定位系统,它不仅能提示知识的存储地点及其关联,提供用户所需要的知识,而且还能够直观地提供知识的视觉展示。知识地图除了关注内容以外,还需要关注任务、人员和社团几个维度,不仅对信息行为建模,还为它的人员、政策、技术和智能结构建模。
在KA中,基于知识元的知识地图的建立,能起到资源的知识连接和引导的作用,知识元描述的知识属性有基本属性和扩展属性,包括贡献者、类型、背景等信息。依据一般的需要,把知识地图表示为图表层、描述层,它们都是实际的知识资源层在可视化界面上的映射(见图1)。
图1中的知识单元及其知识元都是从信息资源的知识描述中提取出来的知识对象,表示不同的知识节点,节点之间的关系即为知识关联;知识关联包括不同知识单元之间的隐含关联、同一或不同的知识单元中知识元之间的直接联系――知识元链接。知识链接提供了知识的详细信息或知识本身的位置,知识描述提供知识节点更详细的信息。知识节点、知识关联、知识链接和知识描述有机地结合起来,共同构成知识地图,准确地表达了知识及其相关属性,为KA的知识导航与检索提供了坐标和路径。
4 知识构建的基本原则
4.1 知识元抽取原则
知识元是KA的理想基元,所以知识元的抽取是KA的起点和建立知识元库的关键。
文本是记录信息和反映知识的主要载体,而创新点则反映了其科学研究的创造性和科学性,是文本内容的灵魂表现。所以基于创新点来建构知识元可以解决文本创新知识的有效发现和利用问题。文本的创新点可根据文本特征进行判断。一篇文本特征主要体现在题名、摘要、引言、正文、结论和参考文献6个核心要素上,一般创新点分布在几个不同的要素中,并有一些特定的表达形式。通过特征提取发现文本创新点,抽取与创新点相关的特征语句组成不同层次的知识元结构,判断相关度、选择合适的创新点知识元内容,可实现基于创新点的知识元抽取。
在宏观上,知识元的抽取应遵守二条原则:①在知识元对象的选择上,要建立信息与知识元的一致性、联系的直接性、关系的简明性。即知识元除了具有知识表示、推理、结论的共同特征外,还应具有独立性、唯一性、完整性和单一性。②在知识元对象的实体结构上,应同时体现编号、时间、地域、领域、对象、对象数值、单位、上属对象、相关对象和数据来源等内容项。
在微观上,一个具体知识元的抽取应遵循下面(见图2)的步骤:①由文本标题词定位知识元的方向;②由文摘词确定创新点知识元的名称;③从小标题及正文中找出带有创新点具体内容的语句;④将关键词与知识元名称比较;⑤建立创新点与知识元之间的信息谱关系,统计创新点与其有关的特征句的相关度,由特征句聚合成知识元谱。以此建立知识元的模糊语义网关系,实现文本知识元自动提取的算法。
4.2 知识单元序化原则
KA的效果要取决于组织知识后有效知识量的大小,而有效知识量的大小与知识组织的有序程度成正比。在KA过程中,之所以对知识单元中的知识元进行组织表示和关系确定,一是为了满足人们对具体知识元的需求而建立知识元库;二是为了使其组合成的知识单元得以序化而集成为知识仓库,从而增强有效知识的含量,自觉控制知识结构体系中的熵值,进而形成有条理、合逻辑、主题鲜明、主次关系清晰的知识结构体系。为此,在应用各种知识技术手段进行知识表示和知识组织时,知识建筑师们需要有所选择,对知识进行有序集成,去除知识结构体系中的无序组合,强化知识内在逻辑关系的组织和条理,突出知识功能和主题的一致性,理清知识的层次关系。
4.3 知识结构展示原则
知识结构是知识建筑师与知识使用者沟通的媒介,有效地展示和表达知识结构是知识建筑师必备的技能。因此,寻找一种表述框架、构建一个协调一致的、功能化的知识体系结构,就是为了通过知识界面,有效地展示知识系统的结构、风格和特色,让用户能够感知知识结构中所存在的知识,方便地、迅速地从中获得知识,以满足对知识的需求,完成自己的任务。
4.4 知识空间优化原则
知识空间优化是指通过一系列知识组织与本体构建技术,在复杂且庞大的知识空间中帮助人们缓解知识环境造成的心理上的迷惑,摆脱行动困境,减轻知识导航与检索的障碍,增强人们知识感知和知识捕捉能力,促进其知识接受和利用。知识空间优化原则有宏观和微观两方面的表现形式。
4.4.1 知识的宏观空间 知识的宏观空间主要是指知识在社会或自然界中分布的物理状态。它可以是知识分布的社会空间或自然空间。
在知识的社会空间中,KA应通过社会知识资源的有效配置、宏观调控等手段,来构建一个和谐的知识生态环境。充分考虑知识接受者和发送者双方的社会空间特点,遵循用户知识接受的有关法则,使客观知识通过KA的促进而在整个社会中易于得到主观化,也使主观知识通过广泛的社会共享便于得到客观化,这也许就是和谐社会构建的一个目标。
在知识的自然空间中,KA的对象既有形态上的多样性、内容上的复杂性,又有存储上的分布性和组织上的异构性,这就需要营造一个良好的知识集成环境。可喜的是,网格技术带来了知识管理的革命。它可以整合分布、异构、自治的知识资源,获得透明的调用。
4.4.2 知识的微观空间 知识的微观空间主要是指宏观空间中的知识系统(如信息机构、信息系统等)和虚拟组织(如数字图书馆),主要体现在知识导航和检索应遵循的准则上。
空间缩小准则。在知识空间中,各种知识表达的标识代表各个知识(单)元,存取地址代表各知识(单)元的路径。这样,知识在知识系统中以知识节点一知识路标的形式实现了知识集合在空间中的分布秩序和存取秩序。这就使庞大的知识空间得以缩小,并使用户易于知识发现,节省查询时间。
空间定位准则。当知识(单)元被各种元数据和资源描述框架以编码的方式定位在某个空间,成为有序知识的一个节点,它们以知识链的方式被不同空间所存取,在查询时构成一定的空间秩序。这就使用户能在复杂的知识空间中快速准确地确定自己所需知识的具体位置而不迷失方向。在知识空间定位中,KA的主要任务是:①按知识的内在联系构建知识存取系统,使知识(单)元本体化、系统化、集成化。②用知识本体的语义互联和匹配构建知识查询系统,建立基本的存取秩序,实现对知识的有效控制,进而达到知识空间的优化。③构建知识地图,进行知识可视化导航。
(待续)