2024年8月31日发(作者:)

【本章提要】

本章主要讲述信息组织的基本内容与基本过程。在了解了信息组织的概念内涵的基础上,明确了信息

组织的对象、原则及功能;在此基础上,围绕着信息组织的过程,从广义的角度讨论发信息搜集的方法与

原则、信息外在形态的描述与内在特征的提示原理、信息存储的方法、信息分析的主要技术及信息服务等

内容;针对网络电子住处资源不断增多的现实,对其描述与揭示与为当前理论与实践界重点关注的问题。

本章从元数据的概念出发,讨论了元数据的基本概念、类型、功能、结构、应用等问题,并用实例向学习

者进行了展示。

【学习目标】

、信息组织的概念、原则及其功能;

、信息组织的过程;

、信息搜集的方法及其原则;

、信息描述与揭示的基本原理;

、信息存储的方法;

、信息分析的方法;

、元数据的概念、类型、功能及其结构。

【学习指南】

本章的重点是第1节、第2节。

【预习思考题】

、什么是信息组织?信息组织应遵循的原则有哪些?为什么要进行信息组织?

、信息组织的广义与狭义过程各包含哪些内容?

、如何搜集一手信息和二手信息?搜集信息时应遵循哪些原则?

、如何描述不同类型的信息的外在特征?描述的方法主要有哪些?在不同的信息载体发展阶段,人们

所使用的描述方法产生了哪些变化?

、如何揭示信息的内在特征?揭示的方法主要有哪些?

、网络信息资源的描述与揭示对传统方法提出了哪些挑战?如何描述与揭示网络信息资源?

、传统与现代时期的信息存储方法各有哪些?发生了什么样的变化?

、什么是信息分析?信息分析的主要方法有哪些?

、什么是元数据?元数据有哪几种主要类型?元数据具有哪些功能?元数据的结构是怎样的?

、试述元数据在人类信息组织活动历史中的名称、形态、功能的变化。

◇ 第一节 信息组织的基本问题

本节内容

一、信息组织的含义与目的 二、信息组织的对象范围分析 三、信息组织的功能 四、信

息组织的原则

明确信息组织的基本问题是做好信息组织工作的基础。在信息组织工作开展之前,首先要了解

信息组织的目的与功能、做好信息组织工作应遵循的原则等基本问题。

一、信息组织的含义与目的

1、信息组织的定义:

1

★信息组织也称信息有序化或信息整序,是根据信息资源检索的需要,利用一定的科学方法和

规则,通过对信息外在特征和内容特征的分析、选择、标引、处理,使其有序化,从而保证用户对

信息的有效获取和利用,实现信息的有效流通和组合。

★含义:

从此定义中可以看出,信息组织的前提是信息资源检索的需要,保证是有一定的科学规则和

方法,对象是根据检索需要而采集的各种类型的信息,手段是分析和处理信息的外在和内容特征,

目的是保证用户的有效获取和利用。这里包含两层意思:一是序化,即是整序,把杂乱无序的事物

整理为有序的活动;二是重组,即信息开发,是信息组织的深化和优化,它是把无序的信息整理为

有序,进而重组激活,挖掘信息潜在价值,使信息得到充分有效的利用,满足用户各层次、多种类

需求的过程。信息的重组是通过不同的新思路,使信息建立不同的新联系,通过思维加工使信息功

能放大,实现更大的价值,通过重组激活,才能充分有效地被用户吸收利用,产生相应的社会效益

和经济效益。

★信息管理的目的:

信息组织是信息管理的重要活动,是沟通用户和信息的管理“桥梁”的“桥基工程”。信息管理的

目的是解决日益增长的信息需求和相对滞后的信息服务的矛盾,信息组织是解决这一矛盾的关键环

节。通过信息组织活动对信息进行序化和整理,从而达到甄别信息、精化信息、重组信息的作用,

方便用户对各种类型信息资源的检索和利用,最终实现其有益于社会的目的。

二、信息组织的对象范围分析

1、信息的外在特征和内容特征

信息的外在特征

就是指信息的物质载体所反映的特征,构成信息载体的外在的、形式的特征,

如信息的物理形态、题名和责任者、信息的类型、信息生产和流通状况等方面的特征。

★信息的内容特征

就是信息所包含和承载的具体内容,也即通过信息载体传递和交流的具体信

息内容。信息的这种特征共同统一于信息本身,也是信息组织的基本对象和管理依据。

信息组织的对象可从不同的层面来划分和理解,对每一不同层面的对象使用的组织方法也不相同。

(一)信息内容层次的组织

信息内容层面包括叙述层、含义层、效用层三个层面,它们分别对应着语法信息、语义信息和语

用信息。

★叙述层

信息是按照语法规则从信息编码中摄取表面状态的信息而成,叙述层信息组织往往采

用号码法、物名法、引证关系法、时序法、地序法等;

★含义层

信息是以叙述层信息为基础或现象的深层信息,其组织多采用分类法或主题法;

★效用层

信息是指信息所表述的内容的价值与效用,其组织采用权值或逻辑序化等方法。

(二)信息加工层次的组织

信息依其产生的先后与组织加工的深度可分为零次信息、一次信息、二次信息、三次信息。

(三)信息载体的组织

信息的存在必然要依赖于一定的载体,潜在信息以大脑为载体,现实信息以口语、体语、文献、

实物为载体表现出来。这时信息组织大致可分为:动态信息组织(包括对口语、体语、实物等信息的

组织)、文献信息组织、数据组织、网络信息组织。

(四)信息学科内容的组织

按信息的内容区分,信息组织可分为政务信息、军事信息、经济信息、科技信息、管理信息等

不同领域的信息组织,多成为行业性的信息资源建设或行业性网络信息资源建设的重要部分,进而

2

形成各自信息系统、行业网络或网络站点的数据库等。

三、信息组织的功能

信息组织在信息管理流程中处于“承上启下”的地位。“承上”是指在信息采集的基础上进行,也

即在一定的信息范围内进行;“启下”是指为信息传播和利用创造有利条件,也即提供信息传播和利

用的信息组织成果。

★信息组织功能主要表现为:

第一,基本功能——全面揭示和再现信息的特征,科学反映和描述信息的特色。

信息组织

通过一定的方法表征信息的外在特征和内容特征,并根据这些特征将信息进行聚类和体系化,达到

集中相关信息和相同信息、反映不同信息的差异的目的,使信息集合从一种自然汇集的无序状态或

经过信息有目的的采集活动形成的初步有序状态过渡到完全的有序状态中。

第二,增值优化功能——信息单元、数据依据逻辑方法再现和重组的过程是一个序化增值

过程。

信息经过一定的方法进行组织后形成索引、文摘、综述等二、三次信息,信息被再现和重组

后得以浓缩,单位信息的价值得到了提升,信息单元之间的联系也得到了优化重组,所以说信息组

织具有增值优化功能。

第三,目标功能——有效减除或减少信息之间的干扰,准确控制信息的运动方向,使之与

特定用户需求相结合,从而方便有效地为用户提供服务。

信息组织可以降低信息集合的混乱程度,

使信息的各种特征特别是内容特征得以充分地显示,有利于信息的有针对性的提供,也有利于用户

的有针对性的选择,加强了“特定用户一特定信息”的联系,并且使用户能够多途径查找信息,也使

信息能够多途径展示特色。因此,从总的方面看,信息组织就是为用户的信息需求满足和信息的使

用价值实现提供有利的条件和方法,形成一系列经过组织化和序化的信息成果以供利用。

第四,社会功能——规范、控制信息流向的社会目标。

世界、国家乃至各行业的目录控制(包

括网络信息的目录控制)、搜索引擎及导航库、网站栏目对网络信息的筛选和过滤、信息资源评价、

搜索引擎评价与网站评价,这些方法与手段都是在规范和控制信息的流向。实现一定的社会目标。

四、信息组织的原则

★在信息组织中,我们必须坚持以下基本原则。

(一)客观性原则

信息组织中进行描述和揭示的基本依据就是信息本身(the item 0b—tained),因此,我们描述和揭

示信息的外在特征和内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映

和序化,形成相应的信息组织的成果。客观性原则率先确定了信息描述和揭示的数据来源必须是客

观存在的信息本身。同时,客观性原则也为我们具体进行信息组织工作提出了相应的要求,要完整

地、全面地、精确地反映信息的客观特征,就必须建立在对信息本身客观地了解和判断的基础上。

另外,信息组织的客观性原则还要求我们不断跟踪信息源的发展变化和信息组织技术的发展变化,

使信息组织与条件变化和环境变化保持客观一致性。

(二)系统性原则

系统性的信息组织工作为实现其整体目标奠定基础,其实质即为协调。为实现信息组织的系统

性,我们必须把握四个关系:一是宏观信息组织和微观信息组织的关系。二是信息组织部门与其他

部门的关系。三是信息组织工作的各个环节之间的关系。四是不同信息处理方法之间的关系。

(三)目的性原则

信息组织具有鲜明的目的性,必须充分围绕用户的信息需求开展工作,必须充分注意信息机构

的目标市场的需求状态及其变化特征。信息管理的一切环节都必须以“用户第一”为宗旨,信息传播

3

及其效果如何在很大程度上是由信息组织水平所决定的。

(四)现代化原则

信息组织的现代化主要表现在两个方面,一是信息组织的思想观念现代化,二是信息组织的技

术手段现代化。信息组织的思想观念现代化集中体现在信息组织的标准化。信息组织的标准化主要

体现在信息组织工作的统一性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的

通用性。信息组织的标准化是整个信息交流和管理的标准化的重要组成部分,主要包括:基本术语

标准,有关信息技术标准(如信息交换格式、程序设计与数据库语言、网络标准与协议、信息分享和

信息传输格式等),信息组织技术标准(如信息描述规则、信息代码、信息标引规则、信息组织成果

编排规则等),其他相关标准。为此,信息领域的若干国际性和国家性标准组织已经制定和实施了一

系列有关信息组织工作的标准,为促进信息组织的整体化、科学化发展创造了良好的条件。

(五)方便性原则

方便性原则,即采用用户认可和习惯的方式。这也是以用户为中心的信息组织工作所要求的。

信息组织的目的就是为了把信息与知识激活,让人们更加有效地利用信息,开发出信息的价值,所

以信息组织工作要紧密地配合用户对信息的利用环节,最大限度地方便用户。

(六)重要性递减原则

即依据信息的重要程度序化信息,通常的做法是突出重要信息使其处于醒目位置,而将其他次

要信息置于不显著的相应位置。这个原则是根据用户查询信息的心理规律提出的。

◇ 第二节 信息组织过程及其内容

本节内容

一、信息采集 二、信息描述 三、信息揭示 四、信息存储 五、信息分析 六、信息

服务

信息组织是信息管理中的重要组成部分。从狭义上说,单纯指信息整序,即利用一定的科学方法,

通过对信息外在特征和内容特征的分析、选择、标引、处理,从而将无序的社会信息流转换为有序的

社会信息流的过程。但从广义上说,信息组织的内容范围非常广,从信息采集、信息描述与揭示、信

息存储、信息分析一直到服务的这个完整的过程中,都渗透着信息组织的活动。

信息采集是信息组织

的前提;信息描述是对信息的初级组织;信息揭示是核心,是对信息的中级组织;信息分析是深

化,是对信息的高级组织;信息存储是对信息及其他信息组织的成果的空间组织;而信息服务则

是宗旨,是信息组织这个微观信息管理过程重要环节的目标。

虽然这几个方面并不是严格意义上的

逐次推进的几个阶段,但它们之间既相互独立而又保持联系,共同构成信息组织的完整内容和全部意

义。

一、信息采集

★信息的采集

,简而言之,就是信息的选择和提取的过程,是根据不断变化的用户需求从信息源中

搜索、选择和提取的连续过程。它是信息组织的前提,是开展其他信息工作的物质基础,采集到信息

的质量好坏、数量多少往往直接影响和决定着信息工作的效益。

★信息采集要遵循一定的原则:一是准确性原则

,即准确是信息的生命力;

二是针对性原则

即信息采集的目的要明确,适合用户的需求,并据此确定信息采集的范围和重点;

三是及时性原则

即以最短的时间、最快的速度搜集需要的信息资源;

四是系统性原则

,即指信息在时间、空间、内容

的采集上要做到全面、完整;

五是预见性原则

,要求信息采集者不仅要研究用户的当前信息需求,还

4

要研究用户未来的信息需求;六是计划性原则,要求制定科学合理的采集计划,有目的有步骤地采集

信息。

★信息资源的采集方法主要有:一是采购法

,常用方法包括预订、现购、邮购以及代购等方式;

二是交换法

,通过此方法在一定的时间、空间范围内与其他信息机构交换信息资源,可以获得一些不

易获得的非卖品或内部资料,加强信息的交流,扩大协调合作以及学术交流;

三是调查法

,主要用于

获取潜在信息资源和关于现实信息资源的各种信息;四是网络法,即通过互联网检索采集信息的方法。

二、信息描述

★信息描述

是根据一定的描述规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择、

记录的过程。

(一)信息描述的原则与标准

信息描述必须客观反映信息资源的特征,严格遵循一定的描述规范进行操作,应做到准确、规范、

完备。信息描述的对象十分广泛,目前比较成熟的是针对文献信息的描述,也即文献编目,正在迅速

发展的有网络资源编目,其他还有档案编目、博物馆藏品编目等等。

文献资源编目是采用ISBDs的著录标准,

它将描述内容主要分为八大描述项目,每个描述项目

又由若干描述单元构成。ISBDs模式已得到国际性认可。

随着网络资源编目的出现与发展,元数据的概念被重提和强调,最后一节中详细介绍。

(三)信息描述的一般程序

第一,查重

,就是在描述信息资源前,首先要确定该信息资源是否已经收入系统,可以避免不必要

的重复劳动和信息的冗余。

第二,描述,

即采用一定的描述规范,根据不同信息资源的特点进行处理,如文献资源编目要根据

ISBDs和相应的著录规则来进行。

第三,复核并输入系统

,即检查所进行的描述是否符合要求,即检索描述项目是否完备、准确,然

后将描述结果输入到数据库中。

信息描述在信息组织中具有非常基础的地位,信息描述是信息揭示、信息分析和信息存储的重要

前提。信息揭示必须充分把握信息的一切特征,信息描述是掌握信息特征的重要手段,信息分析的实

质是信息重组和再生,因而不能不利用信息描述及信息揭示的基本成果;信息描述和信息揭示所辨识

的信息特征为信-基存储提供了排列的基本依据。信息描述中使用的信息组织语言主要用自然语言或其

代码化作为信息特征的描述语言:用人工语言(即描述中使用的标识符号和著录格式)来使描述内容体

系化。

三、信息揭示

★信息揭示

是信息组织的中级形式,即对信息的内容特征进行深层揭示并转换成主题标识,形成

一个科学的逻辑的概念标识系统。在本质上,信息揭示就是要形成一个“信息实体——概念标识矩阵”,

即将信息主题通过一定的方法和工具转换成系统化的概念标识,其工具主要就是我们通常所说的信息

组织语言。

(一)信息主题

在信息揭示中,“主题”是一个基本概念,也是一个非常宽泛的概念。主题即信息主题,是指某一

个具体信息实体所介绍、论述、研究、说明、表现的对象或问题。完整的主题是由若干概念因素构成

的,各个主题概念因素在构成主题的功能方面具有结构性和区别性,一般可以区分为五个方面,即

PMEST。P指Personality,即本体;M指Matter,即物质;E指Energy,即动力;S指Space,即空间;

T指Time,即时间。主题的概念因素的分析方法较多,除了阮冈纳赞的PMEST区分法外,还可以区

5

分为“对象一方法一作用-一条件一生成物”,或“物体一现象一条件一过程一属性一空间一时间一材料

一结果一对象”,凡此等等,说明了主题的复杂性和可分析性。

(二)信息揭示的一般程序

第一,主题分析

,即对信息所包含的主题的分析。它主要包括三个方面:一是主题数量分析,该信

息包含多少个主题;二是主题结构分析鄹每个主题有多少个主题概念因素;三是主题内容分析,具体

说明该信息包含了什么主题,各个主题有哪些概念因素。

第二,主题标引

,就是将主题分析结果转换为主题标识。有三种基本方法:一是抽词标引,又称为

自由词标引,从信息实体中直接抽取未加规范化的能代表该信息主题概念的若干词作为主题标识,是

自然语言在信息揭示中的运用方式;二是赋词标引,根据规范化的主题词表即一种语词型人工语言将

主题概念转换为主题标识,这时的主题标识以词或词串的形式出现;三是分类标引,根据专门的分类

表即一种非语词型人工语言将主题概念转换为主题标识,这时的主题标识以分类号或代码的形式出现。

这三种基本方法都是在建立信息系统数据库前以人工或自动的方式进行的,还有一种主题标引方式被

称为无标引或后控标引,即不对信息进行利用前的标引,而在利用过程中对用户提问进行主题概念向

主题标识的转换,或者把这些转换结果加以积累形成事后标引。

根据对信息主题的揭示程度,主题标引方式可以有四种策略:一是整体标引,即对某一信息实

体的整体主题用一个标识来进行概括性标引;二是全面标引,即对某一信息实体的所有局部主题或不

同主题及其主题概念因素分别进行详细标引;三是补充标引,即对某一信息实体的整体主题作概括性

标引外,对部分局部主题及其主题概念因素单独进行标引,又称为分析标引;四是重点标引,即对某

一信息实体中与信息系统性质、任务、目的有关的主题部分进行标引。

第三,检验审核

,即对上述主题分析和主题标引的过程和结果进行检验和审核,最后正式形成信息

揭示的结果。

(三)信息揭示的语言

信息揭示中信息组织语言发挥了重要的作用,信息组织语言的具体特点决定了信息揭示的具体方

式。信息揭示中信息组织语言的应用主要包括两个方面。

1.自然语言在信息揭示中的应用

自然语言在信息揭示中的应用,主要以下列方式发挥作用:

一是关键词法。

一般仍把它作为人

工语言的主题型语言的一种,实质上是一种以自然语言为主的准人工语言;

二是自由词标引或利用自

由词标引作受控标引的补充形式

三是全文标引和全文检索

四是自然语言以入口词形式辅助受

控人工语言

五是受控人工语言作为主要控制手段,与关键词法结合使用

六是后控标引作为主

要控制手段,与关键词法结合使用;七是自动分类

,通过计算机对词频和语词共现频率的统计分析,

判别出若干最能表达主题内容的语词,然后将其与语词类集用数学方法进行相似性比较,确定该信息

实体所属的代表某个语词类集的类,从而使相关信息聚类。

2.人工语言在信息揭示中的应用

人工语言在信息揭示中应用,这种人工语言就是信息检索语言。信息检索语言主要按其构成原理

分为三大类型:

第一类,分类型信息检索语言(分类法)。

它是用分类号来表达各种概念,将各种概念按学科性

质进行归类和系统排列。分类法又可分为主要应用概念划分与概括方法的等级体系型分类法(体系分类

法)和主要应用概念分析与综合方法的分析一综合型分类法(组配分类法)两大类。用分类法揭示信息必

须有专门编制的分类表。分类表是运用分类法的原理编制的专用信息揭示工具。目前我国主要采用的

信息分类表有:《中国图书馆图书分类法>(推荐国家标准)、<中国科学院图书馆图书分类法>等综合性

分类表和一系列专业性分类表。

第二类,主题型信息检索语言(主题法)

。它是用经过规范化处理的语词来表达各种概念并按字

6

顺方式排列。主题法又可分为标题词型主题法(标题法)、单元词型主题法(单元词法、元词法)、叙词型

主题法(叙词法)、关键词型主题莹(关键词法、键词法)四大类。其中,标题法、元词法和叙词法要对自

然语言的语词进行规范化形成主题标识(虽然在形式上与自然语言的语词没有什么区别,但它已是经过

转换的“标识”而不是“语词”),键词法则对自然语言不做或只做较少的规范化处理。标题法是用一个完

整的标题直接表达一个具体的主题概念,因而标题在标引之前已由标题表固定下来,是一种“先组式语

言”。元词法和叙词法则是由若干检索标识在检索时才通过组配固定下来表达一个具体的主题概念,在

元词表和叙词表中的只是一个个独立的主题概念因素,故被称为“后组式语言”。元词法与叙词法的主

要区别在于元词法对概念的分析和综合是在字面意义上进行的,叙词法则是在概念层次上的“概念组

配”。键词法则是直接对信息的题名、文摘等部分进行简单的词汇控制后,把对于表达主题内容有实质

意义和查检意义的关键词加以规律化排列的揭示方法。我国已编制和使用了<汉语主题词表>、《航空

科技资料主题词表>等大量的综合性和专业性主题词表。目前,各种信息检索语言,包括分类法系统和

主题法系统内部和两者之间的互相渗透日趋明显。

第三类,代码型信息检索语言(代码法)。

它针对事物的某一方面特征用某种代码系统来加以标

引和排列,其实质是一种分类法的特例。

四、信息存储

信息存储是将经过加工整理序化后的信息按照一定的格式与顺序存储在特定的载体中的一种信息

组织活动。信息存储的目的就是为了便于查找、定位和检索信息。各种各样的信息检索类工具书、光

盘检索系统、网络检索工具等都是信息存储的方式。信息存储于各种检索系统中,就意味着信息描述

与揭示过程的结束,也意味着信息检索等狭义信息管理阶段的开始。

传统印刷型媒体阶段,人们经常采用分类组织与主题组织两种方法来进行信息的组织

。为

了更加高效地组织信息,还辅之以其他次要方法,如字顺组织法、时空组织法等。

分类组织

是依据分类法的要求,依据信息内容给每一个信息进行学科的归类,并给予一个代

表其学科内容的类号。在组织信息时,依据这个类号进行排列。这种方法历史最悠久,是对知识分类

体系的反映。

主题组织

则与分类组织不同,它不是从学科的角度出发考虑信息的组织问题,而是从概念的

角度出发,将位于不同学科的、表达相同或相近概念的信息统一在一起,而这个概念是词或词组,没

有歧义性,所以说,这两种方法相辅相成。将表达信息内容的概念再根据一定的规则排列起来,以便

于人们的查找与组织,就是主题组织法。

字顺组织法

是一种信息组织的辅助方法,它不能单一用于组织信息。如分类号或概念依据英

文字母或汉语拼音的顺序,把它们组织排列起来,就是使用了字顺法。国外也称之为“字典法”。

时空组织法

也是一种信息组织的辅助方法,它是按照时间和空间的要求。将信息加以组织。

如某年鉴、报纸、年度统计报告等,就要按照年代的顺序加以组织;再如地方志等,就要以地理名称

为依据加以组织。

★网络信息的组织

因其表现及生成方法与传统信息资源不一致,所以出现了一些新型的信息组织方

法,如超媒体组织方法、主题树方法、数据库方法、自由文本方法、文件方法等。

超媒体技术

是超文本与多媒体技术的结合,它是将文字、图表、声音、图像、视频等多媒

体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到

所需要的任何媒体的信息。人的思维方式是跳跃式、非线性的,而不是像传统信息组织的直线性方式,

所以说,超媒体组织方法更加符合人们的思维习惯。

主题树方法

就是将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,

用户通过浏览的方式逐层加以选择,层层遍历,直到找到所要的信息线索,并通过信息线索直接找到

7

相应的网络信息资源。这种主题树的方式类似于传统的分类组织方法,所不同的是传统的分类组织方

法更加严谨、科学、规范,它面向学科;而网络主题树方式则面向网络信息类型,更多地反映了人们

所关注的社会信息,具有片面性、实用性,缺乏科学性;其用词也不是很规范;揭示的信息因为更新

太快,有时可用性差。

数据库方法

主要是针对已经结构化了的二次信息的组织方法,它将事物对象的共同属性抽取

出来作为数据库的字段,众多字段共同说明事物对象的特征。每个对象的多方面特征描述(字段)构成

一条完整的记录,众多记录(对象)形成一个数据库文件。而数据库文件的组织方法又由计算机根据文

件组织的方法加以管理。

自由文本方法

主要用于全文数据库的组织,是对非结构化的文本信息进行组织和处理的一种

方式。全文数据库是用自然语言揭示知识单元,根据全文情况直接设置检索点。它明显不同于二次信

息的数据库组织方法。

文件

是计算机保存与处理结果的基本单位,数据在计算机中全是以文件的形式保存的。它以

其操作简单方便,更适应非结构化信息(如图形、图像、图表、声音等)的处理,而被大量运用到网络

信息资源的组织方法中来。如FTP的协议和服务,就是帮助人们利用以文件方式组织的信息资源的。

在上述几种方法中,主题树方法与数据库方法属于针对二次信息的信息存储方法,而超媒体方法、

自由文本方法与文件方法更适用于非结构化的一次信息存储。

五、信息分析

信息分析是信息组织过程中必不可少的重要一环,在这一过程中,信息的-加工与组织将会得以深

化,为信息的利用提供更高层次的保障。

信息分析是通过已知信息揭示客观事物的运动规律的过程。信息分析的主要任务就是运用科学的

理论、方法和手段,在对大量的(通常是零散、杂乱无章的)信息进行搜集、加工整理与价值评价的基

础上,透过由各种关系交织而成的错综复杂的表面现象,把握其内容本质,从而获取对客观事物运动

规律的认识。信息分析主要包括课题选择,信息搜集,信息整理、评价与分析,产品制作、评价和利

用等过程。

当前,信息分析工作大致可分

为决策研究

(主要是为各级政府机构进行科技政策、发展战略研究及

专题调研等)、

咨询服务

(多半是为企业提供市场咨询、技术咨询和决策咨询等,即属于竞争情报研究

的范畴)及

编译报道

三个方面

。在形式上,前两种或以研究报告和参考资料,或以咨询建议书的形

式提供给用户;而编译报道则多半以期刊的形式向读者发行。

(一)信息分析的基本功能

信息分析对其所研究的对象来说具有整理、评价、预测和反馈四项基本功能

。整理功能是对

信息进行搜集、组织,使之由无序变为有序;评价功能是对信息价值进行评价,以去粗取精、去伪存

真、辨新、权重、评价、荐优;预测功能是通过对已知信息内容的分析获取未知或未来信息;反馈功

能是根据用户的实际消费效果对预测结论进行审议、评价、修改和补充。一般来说,这四项基本功能

是密切相关的。信息整理和评价是信息分析的两项基本性功能,是为预测和反馈功能的实现做准备的;

预测和反馈是信息分析的两项特征性功能。是信息整理和评价功能的进一步拓展和延伸。

(二)信息分析的主要方法

信息分析基本上通常采用的信息分析方法有比较法、分析综合方法、推理法、专家调查法、

计量法、层次分析法、回归分析法、.时间序列分析法等。

1.比较法

有了比较才有鉴别,判断一个信息是否准确,分析一条信息价值的高低优劣,首先用到的就是比

较法。比较是人类认识客观事物、揭示客观事物发展变化规律的一种基本方法。它是对照各个事物,

8

以确定其间差异点和共同点的逻辑方法。比较法应用的范围可大可小,大到决策方案,小到只言片语,

都可用比较法加以研究。比较可以发现问题、提出问题、推动研究发展。比较常常是分析、综合、推

理研究的基础,也是信息调研工作中一种最常规的和基本的方法。比较法适用对象广泛,常见的有:

国家或公司的水平、能力、技术发展特点的比较;某一学科或专业知识与技术发展的历史和现状的比

较;市场销路的比较;决策方案的比较等。总的来说,通过各方面信息的分析,可以总结经验教训,

对比水平、速度,了解薄弱环节,确立发展方向,寻找最佳方案和改进措施。

2.分析综合法

分析就是把客观事物整体按照研究目的的需要分解为各个要素及其关系,并根据事物之间或事物

内部各要素之间的特定关系,通过由此及彼、由表及里的研究,达到认识事物的目的的一种逻辑方法。

分析通常采用的步骤是:明确分析的目的;将事物分解为若干个相对独立的要素;分别考察和研究各

个事物以及构成事物整体的各个要素的特点;探明各个事物以及构成事物整体的各个要素之间的相互

关系,并进而研究这些关系的性质、表现形式、在事物发展变化中的地位和作用等。它具体还包括因

果分析、表象和本质分析、相关分析、典型分析等方法。

综合是同分析相对立的一种方法。它是指人们在思维过程中将与研究对象有关的片面、分散、众

多的各个要素联结起来考虑,以从错综复杂的现象中探索它们之间的相互关系,从整体的角度把握事

物的本质和规律,通观事物发展的全貌和全过程,获得新知识、新结论的一种逻辑方法。它的基本步

骤是:明确综合的目的;把握被分析出来的研究对象的各个要素;确定各个要素的有机联系形式;从

事物整体的角度把握事物的本质规律,从而获得新的知识和结论。它具体包括简单综合、系统综合和

分析综合三个类型。

3.推理法

推理是由一个或几个已知的判断推出一个新判断的思维形式,就是在掌握一定的已知事实、数据

或因素相关性的基础上,通过因果关系或其他相关关系顺次、逐步地推论,最终得出新结论的一种逻

辑方法。任何推理都包括前提、结论和推理过程三个要素。在信息分析中,经常采用的信息推理主要

有常规推理、归纳推理、假言推理三种形式。

4.专家调查法

专家调查法是在调查题目确定后选定要调查的专家名单,然后将调查提纲以及背景材料等分别寄

给被调查的专家本人,由每个专家对调查的问题经过研究后,按提纲要求用书面形式做出回答。调查

组织者收齐专家们的意见后,将他们的回答综合归纳起来,进行初步的统计处理,然后再匿名分别寄

给各位专家,并请各位专家在这些意见的基础上审核,补充或修改自己的意见,并以书面形式做出第

二次回答。调查组织者可根据第二次意见统计,汇总出最后的结论。如果问题复杂,也可以反复多次,

使结论更加明确和集中。一般经过三四个循环就可以得出预测结果。这种方法有一些明显的优点:被

调查人有比较充足的时间去收集信息、查阅资料,对所回答的问题能做细微的研究,可以通过阅读前

次调查的结果,了解别人的意见,启发自己的认识,修改与完善自己的观点。而且由于匿名介绍别人

观点,故考虑问题时不受知名专家学者的意见或领导意图等束缚,便于敞开思想,独立思考,出现对

立性观点时,能避免冲突。由于回答问题尽量表格化,因而可以把一般定性问题用定量的方法处理。

这种方法在国内外已经广泛用于军事、科技、人口、管理等方面的研究分析之中。专家调查方法

主要有德尔菲法、头脑风暴法和交叉影响分析法三种类型。

信息分析方法多种多样,在实际工作中可以根据不同的内容要求、使用范围来确定一种或几种具

体的分析方法。通常情况下,不能仅仅使用单一的方法,而应该多种方法并举,以实现信息分析的目

的,达到信息分析的要求。

六、信息服务

9

信息服务是信息管理的主要环节,也是信息管理的重要组成部分,应该说,它是信息管理的最终

目标与归宿。因为,无论广义上的信息管理,还是狭义上的信息管理,它的基本宗旨还是为了更好、

更高效地发挥信息资源的价值,充分利用好信息资源。上面所讲的各种信息加工的环节,都是为了更

好地实现信息服务的初衷。所以说,信息服务作为信息管理的主要内容,受到了各层次信息管理主体

的重视。有关信息服务的内容,我们有专门章节讲述。

◇ 第三节 元数据方案

本节内容

一、什么是元数据 二、元数据的类型 三、元数的功能 四、元数据的结构 五、元数据

在不同领域的应用 六、元数据示例

一、什么是元数据

元数据

(Metadata)这一名词出现于网络时代,很难清晰而准确地定义它。普遍认为:元数据是

指用于帮助识别、描述和定位网络化的电子资源的结构化数据,通过它可以揭示各类电子文献的内容

和其他特征以方便检索,能够提高信息的利用价值,其典型的操作环境是网络环境。

虽然说它是网络环境下的产物,但它的理念却不是新的,图书情报界的编目格式就是元数据的一

种,只是它不叫元数据罢了。从字面上看,“meta一”是“在其中,与……在一起。在……之后”的意思,

它取自希腊语,表示一种更高的次序或更基本的属性。每一个元数据格式通常都会包括三种特征:一

组有限的元素、每一个元素的名称以及每一元素的意义。可以说,元数据不是独立的数据,而是一种

必须与其他数据结合在一起,起辅助作用的数据。元数据元素集合可以描述一种或多种信息资源,它

与其所描述的信息资源之间存在着某种必然的联系。例如,图书馆书目记录就是元数据元素的集合,

这些元素通过索书号与图书馆馆藏中的图书或其他文献连接起来;存储在HTML主页中的“META\'’区

域的信息就是元数据,它通过嵌入信息资源而达到与信息资源相联系的目的;索引数据也是二种元数

据(虽然它不能称为非常好的元数据),它通过多种形式与信息资源连接起来。

二、元数据的类型

★依据英国UKOLN(The UK Office for Library and Information Networking,英国图书馆与信息网络办

公室)的DESIRE(Development 0f an European Service for Information on Research and Education,欧洲研

究与教育信息服务的开发)项目,从结构和语意方面来划分元数据,可以分为三类:

第一类,简洁化格式。

基于全文索引的独立格式,其最好的例证就是AltaVista、Lycos等所采用

的格式。这些搜索引擎使用起来是很方便的,但如上文所述,其检索效率是很低的。

第二类,复杂化格式

。建立于国际标准之上,通常应用于较窄的领域,其最佳的例证就是MARC。

这种格式很难被其他机构利用,如很少档案馆、博物馆使用MARC标识档案文献及展品。一般来说,

复杂化格式需要经过专门培训的专业人员才能完成。

第三类,结构化格式。

它是对上述两种格式的综合,通常其结构不如复杂格式复杂。这种格式是

最近几年才开发的,主要面向Internet应用,多针对特定的专业领域,但也有针对较广泛的应用领域的,

而且正在形成正式的标准。从检索方面来说,它们多支持字段检索,在很大程度上提高了检索的精确

度。这种格式的工作主体除专业人员外,更主要的是网络信息资源的作者、提供者、出版者、发行者

以及网络服务提供商等,也就是说,结构化格式的应用更面向大众。

★ 而美国Getty信息研究所(Getty Information Institute)的专项研究则根据元数据的功能来划分其类

型,分为以下五种类型。

第一类,管理型元数据

。在管理信息资源中利用的元数据。例如:采购信息,指该元数据描述

10

的对象是由何人在何地何时采购的等信息;位置信息,指该元数据描述对象实体的物理位置;版本控

制,指出该元数据的版本;等等。

第二类,描述型元数据。

用来描述或识别信息资源的元数据。例如:书目记录、查找帮助、

资源间超链接的关系等。

第三类,保存型元数据。

与信息资源的保存管理相关的信息。例如:资源实体状况、保存资

源的物理和数字版本中所作的处理等。

第四类,技术型元数据。

与系统如何行使职责或元数据如何发挥作用相关的元数据。例如:

硬件和软件文献,数字化信息(如格式、压缩比例、缩放比例等),系统反应次数的跟踪,安全性数据(如

密码、口令)。

第五类,使用型元数据。

与信息资源利用的等级和类型相关的元数据。例如:展览记录,使

用和用户跟踪,内容再利用和多个版本的信息等。

三、元数据的功能

从其定义可以看出,元数据的主要目的就是通过准确地描述、评估信息资源来促进和提高信息检

索,这就明确了元数据的基本功能:描述网络数据的内容;使网络中的数据便于搜索,有助于更准确

地识别、定位和访问网络信息;帮助用户决定某些数据是否为其所需等等。其具体功能可概括为以下

内容强

第一,描述

:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而

为信息对象的识别、存取与利用奠定必要的基础。

第二,定位:

由于网络信息资源是虚拟的,因此,明确它的位置十分重要。元数据中包含有关网络

信息资源位置方面的信息可确定资源的位置,促进了网络环境中信息对象的发现和检索。

第三,搜索

:元数据为搜索提供基础。在描述过程中,信息对象中的重要信息被抽出和组织在一定

的语义关系内,为用户提供多层次、多途径的检索体系,使检索时更加方便,检索结果也更加准确,

这就有利于用户识别重要的信息,帮助用户认识信息的价值,发现其真正需要的资源。

第四,管理:

支持信息资源的存储和使用管理,包括权限管理(版权、所有权、使用权)、数字信息

管理、防伪措施(电子水印、电子签名)、使用管理等。

第五,评估:

元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在

无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准,即可对其

价值进行必要的评估,作为存取与利用的参考。

第六,选择:

根据元数据所提供的信息,参照相应的评估标准,结合使用环境,用户便能够做出对

信息对象取舍的决定,选择适合用户使用的资源。

此外,从系统的角度审视元数据,元数据的功能还包括提供浏览及检索的功能、管理功能以及组合各

个对象以及藏品的再呈现功能等。

四、元数据的结构

元数据结构从功能上来说可分为内容结构、句法结构和语义结构。内容结构

是对该元数

据的构成元素及其定义标准进行描述,它包括描述性元数据、管理性元数据、技术性元数据以及复用

性元数据。描述性元数据是用于描述或标.识数字对象的外在和内容特征的元数据,如资源名称、创

建者、主题、内容描述、资源类型、出版者等项;管理性元数据是对数据对象及元数据本身进行管理

的要求、规格和控制机制进行描述的元数据,如有效期、使用权限等。 技术性元数据是对数据对象制

作、传递、使用或保存过程中的技术条件或参数进行描述的元素,如扫描分辨率、压缩方法、使用软

件等。复用性元数据是该元数据集从其他元数据集中复用的元素,有可能需要对其语义范围和编码规

11

则进行修订。

句法结构

定义元数据整体结构以及如何描述这种结构,如:元素的分区分层分段组织结构;元素

结构描述方法;DTD描述语言;元数据复用方式。句法结构还可以定义元数据与被描述数据对象的捆

绑方式,如:元数据与数据对象捆绑在一起;元数据独立于数据对象存在;元数据作为单独数据存在

但以一定形式与数据对象链接。

语义结构

定义元数据的具体描述方法。它包括四个层次:元素定义(对元素本身有关属性进行明确

定义);元素内容编码规则定义(描述元素内容时应采用的编码规则);元素语义概念关系(定义元素的具

体含义,将它放在一个概念体系中来说明它的上下文关系,说明它与其他概念的关系,以明确元素在

不同体系中的不同意义);元数据版本管理(元数据是动态变化的,所以要明确描述元数据版本变化情

况,并通过开放登记系统发布)。

五、元数据在不同领域中的应用

元数据的使用范围非常广,Susanne Boll等认为元数据可应用于:图像检索、导航和图像集合中的

浏览;视频;声频和演讲;结构化的文献管理;地理和环境信息系统;数字图书馆;支持信息存取的

混合多种媒体。

在整个世界范围内,元数据正在被用于越来越多的领域中。目前研究和采纳DC的各种项目已遍

及欧亚美洲各地,DC也已被译成20多种语言。比较突出的实例有:

(一)教育资料网关

1998年,美国教育部(US Department of Education)和国家教育图书馆(National Library of Education,

USA)责成位于锡拉丘兹大学的信息与技术科教资源信息中心信息与技术交换处(ERIC Clearinghouse

on Information andTechnology)开发一个项目,为全国的教师在因特网网站上提供课程计划、课程单元

和其他因特网上的教育资源检索方面的资料建立一个可操作性架构。该项目即为教育资料网关

(Gateway to Educational Materials,简称GEM)项目,

(二)欧洲数学图书馆和电子资源

“欧洲数学图书馆和电子资源”(The EULER project,European Librariesand Electronic Resources in

Mathematical Sciences)项目始于1998年3月,旨在将迄今为止只能单独获得的各类型有关数学方面的

信息资源都集中在一个“数学数字图书馆”里。在这个综合项目中,包含以都柏林核心元素集为基础的

元数据描述。该项目在欧洲数学协会(European Mathematical Society)和主题信息中心

(Fachinformationszentrum,Karlsruhe)的带动下,由一个社团具体运营。

(三)北欧万维网索引

1998年4月14—18日,第七届国际万维网研讨会(The Seventh Interna.tional World Wide Web

Conference)在澳大利亚的Brisbane召开。在这次会议上,与会者的报告向人们展示了元数据在海洋科

学、数学、标记语言、电子商务等诸多方面的应用。一个实现分布式万维网合作标引的开放系统之建

立便是此次会议的成果。该系统包括三个主要部分:收获软件(harvester)(收集信息)、数据库(使得收集

的信息能够被检索)和用户界面(使得信息能够被获取)。

(四)数字图书馆

(五)DESIRE项目

DESIRE(Development of a European Service for Information on Research and Education,欧洲研究与

教育信息服务之发展)项目(DESIRE Project)由欧盟(European Union)赞助。

(六)北欧元数据项目

元数据的开发虽始于美国,但应用元数据最广泛的地区却在欧洲和澳大利亚。目前为止,世界上

最大的元数据项目就是北欧元数据项目(The Nordic Metadata Project)。它也是当前在都柏林核心集的应

12

用和实践系统方面最著名和成功的研究项目之一。

北欧元数据项目是一个规模很大的区域性跨国合作项目,由北欧五国——挪威、瑞典、芬兰、丹麦、

冰岛等学者共同合作。项目实施期是1996年10月到1998年3月,其核心合作组织是丹麦图书馆联合

中心。

六、元数据示例

目前元数据格式多种多样,其表现形式和标记语言也并不相同,目前最流行的为DC元数据,最

成熟的为MARC格式。

★ 章节小结

●1、本章主要讲述信息组织的基本内容与基本过程。

、介绍了信息组织的含义与目的,信息组织的对象范围,功能和原则;

、围绕着信息组织的过程,从广义的角度讨论发信息搜集的方法与原则、信息外在形态的描述与内

在特征的提示原理、信息存储的方法、信息分析的主要技术及信息服务等内容;

、 针对网络电子信息资源不断增多的现实,从元数据的概念出发,讨论了元数据的基本概念、类型、

功能、结构、应用等问题。

13


更多推荐

信息,组织,数据,方法,描述,资源,进行,分析