独上高楼网站
  •    你所在位置:首页 数据库标准理论〉实现电子政务元数据的标准化
  • 实现电子政务元数据的标准化
  • 作者:佚名  文章来源:http://www.ccw.com.cn/cio/research/zf/htm2005/20051118_14ETM.asp  发布日期:2007-09-03  浏览次数:763
  • 打印这篇文章
  • 在电子政务信息的互联互通中,数据的标准化是前提和基础,而要实现数据的标准化首先必须解决元数据的标准化问题。

    信息是电子政务的核心,如何有效利用信息、促进共享是电子政务应用体系框架的目标。在这种

     
    情况下,描述并有效利用政务信息的元数据就变得非常重要。为此,我们迫切需要科学、规范地建立一套电子政务元数据标准(E-Government Metadata Standard, E-GMS)。

    本文所探讨的E-GMS是支持电子政务数据标准化的基础标准之一,主要用于描述政务信息资源特征,规范信息资源使用的标准。其目标是最大程度地实现各类政务资源在管理、发现和获取方法上的一致性,体现政务信息系统的整体性,为实现不同系统间的互操作、业务协同和信息共享建立良好的基础,从而提高整个政府部门的应用水平。

    E-GMS的概念及功能

    元数据的一般定义是“关于数据的数据”或“描述数据的数据”。本文将元数据定义为:描述具体的信息资源对象的数据,并能对该对象进行识别和管理,实现信息资源的有效发现与获取。

    电子政务(E-Government)是用信息技术实现的符合各级政府的具体业务、事务、会务需求的应用系统,电子政务元数据则是描述电子政务数据集内容的数据,是进行电子政务中信息资源的管理、查询和应用的关键。

    元数据标准是描述某类资源的具体对象时所有规则的集合,不同类型的资源可能会有不同的元数据标准。元数据标准可以分为3个层次:

    ● 语义: 提供内容的标准化;

    ● 结构: 提供形式的标准化;

    ● 句法: 提供表达的标准化。

    本文所探讨的E-GMS为电子政务元数据提供了一个结构化的表达方式,主要建立在语义层次上。它从数据的最小单元这个角度规范了政务信息资源,为进行信息共享、促进系统技术和业务上的互联、互通、互操作提供支持。

    在元数据标准的设计中,首要解决的问题是要明确利用元数据实现哪些功能。根据对国外常用元数据标准及国内已有较成熟的中文元数据标准进行的研究和分析,并结合电子政务各方面的需求分析,归纳出元数据应考虑实现的功能有如下几个方面:

    ● 资源描述: 从信息共享和数据交互的需要出发,元数据最基本的功能是用于对信息资源的内容、属性进行详细、全面的描述,以完整反映出信息资源对象的全貌,从而帮助用户了解数据。

    ● 资源管理: 提供信息资源的存储和使用管理方面的信息,以及权限管理、电子签名、电子印章等方面的信息。

    ● 版权管理: 提供其拥有者、版权和安全级别等信息内容。

    ● 查询检索: 支持用户发现资源的能力,即利用元数据提供数据分类、数据内容、数据质量等方面的信息,为用户提供多层次、多途径的检索体系。

    E-GMS的总体结构

    E-GMS体系包括数据元规范、代码规范和主题词规范。数据元规范主要定义了数据元的设计方法和数据元目录格式。主题词规范规定了方法规范和词目规范格式。代码规范则主要提供了描述方法,各个具体业务系统的代码索引应按照该规范中提供的描述方法来确定。

    1. 数据元规范

    数据元(Data Element)又称数据类型、数据元素或数据项,是一种非常重要的元数据类型。数据元是通过定义、标识、表示以及允许值等一系列属性描述的数据单元,在特定的语义环境中被认为是不可再分的最小数据单元,一般来说由名称、属性和表示组成。定义和描述数据元是为了规定电子政务所需的基础数据规范,从而使政务信息资源更易于表示和共享。

    数据元规范的制订要从政务系统的岗位人员、政务系统的开发人员、政务信息资源这三方面的调查分析入手。同时,在标准制定过程中,要充分考虑前两者的需求和后者的特性,并在其中进行最佳平衡和组配。数据元的提取采用面向对象的分析方法,以业务用例为驱动、顺序图为手段,分析出目标领域的业务实体及其属性。同时,制定的数据元目录应采用统一的格式,如表1所示。关于数据元的定义和管理规范,国家标准《电子政务数据元》第一部分“设计和管理规范”(报批稿)已做了详细的规定,本文不再详述。

    2. 主题词规范

    主题词是自然语言中经过规范化处理的、显示语义关系的词和词组。这些主题词之间有三种主要的关系:用代关系、属分关系和相关关系。主题词及其之间的关系,构成了主题词表。电子政务主题词表覆盖电子政务活动的名词、术语,它概括了电子政务领域,由语义相关、族性相关的名词术语组成,是可以不断更新的规范化词表。主题词表由主表(字顺表)、附表和相应索引组成。主表由正式主题词款目和非正式主题词款目按字顺排列构成,是主题词表的主体,亦是信息组织和信息检索的主要工具。附表由人物名称、国家、地理名称,组织机构名称等专有主题词组成。索引是将主题词表中的主题词或其特定构成部分,按一定规则排列形成的辅助查词工具。

    电子政务主题词收词来源主要有:

    ● 各级政府已有的政务信息;

    ● 国家法律、参考工具书和检索工具书;

    ● 国外电子政务相关资料;

    ● 其他与电子政务有关的信息。

    主题词款目是构成主题词表的基本单元。一般由主题词、汉语拼音、注释、范畴号和参照项等组成。其规范的描述格式应采用统一的格式,参考格式如表2所示。

    主题词表范畴类目的设置应以政府部门的职能区分、业务分工和政府部门面向企业、社团、公众的服务,以及新闻发布、公文处理以及党务为主要依据。此外还要适当考虑电子政务各领域的信息量和词汇分类的需要。下面是主题词范畴类目的制定示例。该示例给出了政府协同办公中的信息简报业务的范畴词及其编号。范畴词是按照功能来确定的,同时因为国家电子政务主题词表中的范畴表对政府工作的编号是01D,因而本范畴词实际上是对01D范畴的细化。

    示例:01D03 信息简报

    01D03A 上报

    01D03B 采集

    01D03C 编辑

    01D03D 发布

    01D03E 传阅

    3. 代码规范

    信息编码是将事物或者概念(编码对象)赋予具有一定规律性、易于计算机和人识别与处理的符号而形成的代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。信息编码包含的内容有:数据表达成代码的方法、数据的代码表现形式、代码元素集合的赋值。

    政务信息资源涉及的范围非常广泛,实践中应根据国家信息编码标准体系的框架结构,结合电子政务的实际情况,建立合理、统一的政务信息编码标准体系的总体框架。

    构造科学、完整、有序的信息编码标准体系,旨在汇集并参考现有国家标准从而提出待制定的相关国家标准,一方面明确标准制定工作的需求,另一方面反映标准化现状,为政务系统设计人员提供参考,为进一步采用国际标准和国外先进标准提供支撑。

    基本政务信息编码标准体系表由总表和明细表两部分组成。明细表是由总表进一步细化、扩展而成的,共有若干个细目。总表分三个层次:门类,类别,项目。总表第一层次包含以下四个方面的内容:

    管理标准 由标准制定主管单位制定政务信息编码工作的有关管理规定,这是电子政务建设中开展信息编码工作的管理基础。  基础标准 这些标准是由标准制定主管单位贯彻的、必须遵循的、全国统一的基础性通用标准和规定,是所有信息编码标准的技术基础和方法指南,具有较长时期的稳定性和指导性。

    业务标准 它是针对政务应用领域(经济管理、国土资源、信息产业、城乡建设等)的标准,对具体的政务系统建设具有指导意义。

    相关标准 相关标准是与电子政务相关的专门领域标准。虽然目前还未正式出台颁布电子政务相关标准,但各项标准的编制工作正在有条不紊地展开。《电子政务标准化指南(征求意见稿)》和电子政务六项标准(征求意见稿)都可作为参考的依据。

    电子政务元数据是一种相对稳定的资源,当投入使用后,如进行修改将耗费许多成本和时间。因此,必须在形成标准前,跟踪元数据的发展,注意与国际接轨,并仔细规划和测试,综合各方的意见,不断进行修正,以减少对现存政务系统的冲击。(作者单位:科邦网业有限公司)

    链接

    制定E-GMS的意义

    E-GMS的制定是电子政务标准化体系中的一项重要内容,更是电子政务应用系统建设的基础,其意义体现在以下几个方面:

    ● 规范、引导系统建设和系统集成,有助于不同系统间互联互通,避免重复建设,避免浪费。

    ● 根据E-GMS建立的元数据不仅可以让信息资源容易被管理和搜索,而且也能够以多种形式存储信息,如纸质文档、数据库、电子文档等。

    ● E-GMS使元数据在不同应用系统中保持一致,有利于发挥元数据的有效性。 (CCW)

  • 打印这篇文章
  • 与本文主题相关的文章
  • 返回首页