gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
20楼#
发布于:2004-10-28 15:55
<H3 0cm; TEXT-INDENT: 0cm"><A>2.1 概述</A></H3><P left" align=left>地理信息元数据(Metadata)已越来越为人们所重视。许多国家已经发布实施元数据内容标准,并开发了许多元数据操作工具。本文通过对国外一些元数据标准的研究分析,阐述元数据的定义、作用、意义、常用形式及标准化问题,介绍美国、加拿大、英国、澳大利亚、新西兰、印度等国家及ISO/TC211正在制定的元数据标准的主要组成部分,为制定中国可持续发展信息共享的元数据标准,并进而制定中国地理信息元数据国家标准提供参考。</P><P left" align=left>随着计算机技术和GIS技术发展,特别是网络通信技术的发展,空间数据共享日益普遍。管理和访问大型数据集的复杂性正成为数据生产者和用户的最突出的问题。数据生产者需要有效的数据管理和维护办法;用户需要找到更快、更加全面和有效的方法,以便发
现、访问、获取和使用现势性强、精度高、易管理和易访问的地理空间数据。在这种情况下,空间数据的内容、质量、状况等元数据信息变得更加重要,成为信息资源有效管理和应用的重要手段。数据生产者和用户都已认识到元数据的重要价值。在许多国家,对元
数据感兴趣的已经从中央政府部门扩展到省和地方部门,以及非盈利组织和私人企业。不少国家和国际性组织已经发布实施元数据内容标准,并开发了许多元数据操作工具。地理信息元数据标准和操作工具已经成为国家空间数据基础设施的一个重要组成部分。美国
副总统戈尔在其有关“数字地球”的讲话中也把元数据作为数字地球的重要支撑条件之一。</P><P left" align=left> <p></p></P><H4 0cm; TEXT-INDENT: 0cm"><A>2.1.1 元数据的常用形式和标准化的必要性</A></H4><P left" align=left>元数据也是一种数据,在形式上与其他数据没有区别,它可以以数据存在的任何一种形式存在。元数据常用形式是填写了数据源和数据生产工艺过程的文件卷宗,也可以是用户手册。用户手册提供的简洁的元数据容易阅读,并且可以联机查询。</P><P left" align=left>元数据更主要的形式是与地理信息元数据内容标准相一致的数字形式。数字形式的元数据可以用多种方法建立、存贮和使用: </P><P left" align=left>最基本的是文本文件 (ASCII) 。ASCII文件易于传输给用户,而不管用户使用什么硬件和软件。 </P><P left" align=left>另一种形式是用超文本链接标示语言 (Hypertext Markup Language, HTML) 编写的超文本文件。用户可以利用Netscape Navigator, Mosaic, 或美国微软公司的Internet Explorer查
阅元数据。 </P><P left" align=left>用通用标示语言 (Standard for General Markup Language, SGML) 建立元数据。SGML提供一种有效的办法连接元数据元素。这种方法便于建立元数据索引和在空间数据交换网络上查询元数据,并且提供一种在元数据用户间交换元数据、元数据库和元数据工具的方法。 </P><P left" align=left>地理空间数据交换网络是一个在数据生产者、管理者和用户之间建立的分布式、电子连接网络。它既可包含能够下载的数据集,也可包含有关数据集的信息即元数据。用户通过万维网(WWW)进行访问,以便查找所需要的地理空间数据,帮助用户决定是否值得获取这些数据和如何获取。</P><P left" align=left>元数据可以组织成为若干等级,从简单的数据基本情况列表,到各个数据集的详细说明文件。最基础等级的元数据可以支持建立一个部门、或一个地区所拥有数据的目录。最详细等级的元数据可以保证潜在用户能够就数据是否满足其需求作出正确的决定。建立
元数据是数据生产者的责任。</P><P left" align=left>然而,信息技术产品的数据处理和管理工具的快速增涨,已经引起元数据内容和处理的不同,并且没有考虑元数据的共享。唯一能够在不同数据管理软件间交换元数据的途径是统一的元数据标准。元数据标准能够使数据生产者和用户一起着手处理有关元数据交换、共享和管理的问题。元数据标准的研制与实施已引起各国广泛重视,许多国家不但已经完成标准的制定,开发了多种操作工具软件,建成了大量的元数据库,并已投入使用,而且多次召开国际学术讨论会,对元数据的理论、实施、应用及标准化的有关问题进行讨论,国际地理信息元数据标准也在抓紧研制中。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
21楼#
发布于:2004-10-28 15:55
<H5 0cm; TEXT-INDENT: 0cm"><A>三、数据的时效性与唯一性</A></H5><P left" align=left>地球系统的数据,有些具有明显的时效(时间)特征,有的则对时间的反应比较迟缓,例如,土地利用图具有明显的时效性特征,而地质图、地形图则没有明显的时效性。对于土地利用图的时效性来说,随地区的差异在时间上也有明显的变化,比如在城市近郊区的土地利用图有效时间一般只有1~2年,而远效区则可达4~5年。而地质、地形图的有效年限一般为10~15年,当然随着科技的发展,地质上也有新的发现和改正,地形也有一定的变化,这样五十年代的地质图和今天同样比例尺的地质图,在图形内容上可能会发生较大的变化。</P><P left" align=left>在图形的时效性上,一般来说凡具有动态特征的数据,它们的时间有效性较短,相反则长。但从研究历史变化或发展过程来说,则任何时间的数据都是有用的,所以不同时效性的数据集将根据其作用的不同来确定其重要性。而这些因素在元数据体系中都应有所
反应。</P><P left" align=left>另外,地球系统的数据有可派生数据和不可派生数据之分,而我们在数据集描述中应避免数据的冗余。比如在气象和水文数据中,每天的降雨量是基本数据,或非派生数据,而周平均降雨、旬平均降雨、月平均降雨、年平均降雨等都是派生的,又如人口数与粮食
产量这两个基础数据,可以派生十多个不同意义的数据,而且派生数据可以和基础数据进行校对纠错等。因此,在元数据描述中,应只限于基础数据,而不应包括可派生数据,这样,便需要有专门的元素来描述数据集的这些特征,并需要对不同的计算公式等加以阐
述。</P><H5 0cm; TEXT-INDENT: 0cm"><A>四、数据的精度的测试与报告</A></H5><P left" align=left>对于用户和数据生产者来说,所关心的数据质量是有一定联系的。数据集生产者必须使所生产的数据集满足制图规范,而用户则根据数据集的质量信息确定该数据集是否满足他们的应用需求。因此数据集生产者提供的数据集信息应是用户所关心的信息。因此,
在数据集报告中应包括相应的精度测试方法以及测试结果等内容。</P><P left" align=left> <p></p></P><H4 0cm; TEXT-INDENT: 0cm"><A>1.2.6 计算机、通讯及其它理论</A></H4><P left" align=left>计算机、通讯等信息技术领域内的相关理论对地理信息的形成也具有一定的决定作用,诸如传输协议等对信息传输的质量等都有一定的影响。另外,地理信息的空间共享也受其它理论的限制,诸如行政区划理论等,但随着元数据研究的不断深入,有关支持地理信息元数据的理论体系将逐渐清晰。</P><P> <p></p></P><H2 0cm; TEXT-INDENT: 0cm"><A>2. 元数据标准</A></H2><P left" align=left>(本节选自国家基础地理信息中心蒋景瞳、刘若梅、贾云鹏的《国际元数据标准的发展和研究现状》)<p></p></P><P> <p></p></P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
22楼#
发布于:2004-10-28 15:55
<H4 0cm; TEXT-INDENT: 0cm"><A>1.2.4 地理信息的空间坐标系模型</A></H4><H5 0cm; TEXT-INDENT: 0cm"><A>一、地球模型</A></H5><P left" align=left>地球是一个复杂的表面,它由陆地和海洋组成,并随着地形的变化又有很大的起伏。因此,要用空间几何模型表示地球对象,首先需要对地球进行合理的描述。</P><P left" align=left>大地学家通常用一种近似的方法来表示地球,即忽略掉地球上的地形,认为它是一个没有起伏的表面,并用近似于平均海水面(大地水准面)的重力面来代表它的形状。尽管如此,由于地球内部组成的差异,在一些地方同样会产生重力异常,这样用大地水准面也很难准确地描述地球上的位置。因此,人们又用一种相对简单的“地球模型”的方法来表示地球,即把地球形象地描述为一个扁椭球体,通常称为椭球体。</P><P left" align=left>目前全球已定义了几百个用于描述地球的椭球体,比较典型的有克拉索夫斯基(1866)椭球、1924国际椭球以及1980大地参考椭球体(GRS80)等。由于椭球体的不同,定义椭球体的参数也不尽一致,但在当代大地测量学中主要用椭圆长半轴(a)以及扁率分母(1/f)两个参数来表示它们。</P><P left" align=left>随着椭球体的提出,人们为了唯一地确定地球上对象位置的坐标信息,又提出了“大地水准”的概念,即通过大地水准与地球圆心之间的位置及方向关系来确定空间对象的位置信息。这样通过椭球体坐标系统中的经度、纬度值以及椭球体高度值便可唯一地确定某一点的坐标。</P><P left" align=left>由于椭球体坐标系是一个基于经纬度值的坐标系,而地心坐标系是一个笛卡儿空间正交三维右手垂直坐标系,因此这二者之间的坐标转换也相对容易,即通过一定的数学方程使两个坐标系统的中心圆点重复,并依次计算出各对应对象的相应坐标即可。</P><P left" align=left>另外,随着地域的差异,通常各国或一定区域都有它们自己独特的椭球体,以形成他们自己的地方坐标系。这些椭球体之间随着参数的不同,坐标值也有很大的差异。但在当代大地测量学中,人们已以地心坐标系的坐标圆点为各自参考椭球体的参考起算点,因此,只要选定所需的参数和对应公式,不同椭球体之间的转换也是比较容易的。</P><H5 0cm; TEXT-INDENT: 0cm"><A>二、地球的坐标表示</A></H5><P left" align=left>现实世界中的位置是由地点和时间组成的(Cook, et al.,1992),为了能对地理信息进行合理的描述,人们引进了坐标系的概念按坐标几何对象的方式表示地理实体。坐标参照系通常有空间参照系、时间参照系、时空参照系、属性参照系等多种方式,它是一种按照一定的方式为某一位置、时间或其它定性定量描述赋值的体系,通常可以被认为是一种比例尺。通过参照系,便可以按照点、线、面、体的方式对现实对象进行描述[ISO/TC 211 N403.]。</P><H5 0cm; TEXT-INDENT: 0cm"><A>三、空间参照系的转换接口</A></H5><P left" align=left>空间参照系是地面实体与数字几何对象之间对应的数学基础,因此应准确地描述它们,以便用户能够很好地理解地理信息。</P><P left" align=left>通常在地理信息相关软件中都有有关参照系的模块,并且通过相应的参数可以设置参照系之间的转换,以便地理数据模型中的地点和时间与软件中的实体对应起来。通常地点指现实世界中的某一可以测量的地方,而时间则是某一点、某一段或某一系列在连续性上的间隔。时间和地点均可以测量到,它们的坐标也可以从具体的时空坐标系中获取,因此,通过坐标转换模块可实现地点和时间的统一。</P><P left" align=left>地理信息互操作是空间信息基础设施的关键,而坐标系之间的转换是实现它们的重要技术之一,通过合理的空间信息转换标准,便可以实现地理信息模型之间的通讯。因此,坐标参照系模型便成了元数据的主要理论之一。</P><P left" align=left> <p></p></P><H4 0cm; TEXT-INDENT: 0cm"><A>1.2.5 地理信息的质量体系</A></H4><H5 0cm; TEXT-INDENT: 0cm"><A>一、质量评价过程</A></H5><P left" align=left>地理空间数据的质量对数据生产者和用户来说都是一个非常重要的考虑因子,它可以使数据生产者正确描述他们的数据集符合生产规范的程度,也是用户决定数据集是否符合他们应用目的的依据。因此,探索数据质量的理论问题便成为地理空间数据标准化的重要
组成部分。</P><P left" align=left>在元数据标准中,质量信息主要在标识信息、数据质量信息以及数据继承关系等元数据部分中出现,其所涉及的主要元素有数据集的完备性、逻辑一致性、位置精度、时间精度、专题精度等,而每一元素又有各自的子元素。</P><P left" align=left>由于用户需要不同层次的数据质量,有些用户需要高精度的信息,而另一些用户则有较低层次的精度便可以满足他们的需求,这样对数据集的质量标准就有不同的评价依据。但作为质量中的几何精度评价,则通过一定的计算公式和相应的精度指标,可以获得数
据集的几何精度。</P><H5 0cm; TEXT-INDENT: 0cm"><A>二、多尺度评判依据</A></H5><P left" align=left>在质量评定过程中,一般来说,数据的精度或准确度越高越好,但在实际应用中却不能不分对象一概而论。事实上有的数据在实际应用中的意义很大(如大地控制点等),其本身精度也可以达到很高,因此对这些数据的精度要求也就很高;而另一些数据本身的精
度不可能很高,如不同土壤类型的面积,由于它们之间的界线是模糊的,所以面积也是相对的,若要求很高则不可能办到。有的数据它们的精度可以达到很高,但需要花费很多的人力、物力和时间才能达到,而生产上或应用上又不一定要求很高。因此,在实际应用
中应根据具体需求来评定数据的质量,如对荒漠化土地与水浇地按同样的精度要求,则事实上便成为“冗余精度”,是一种浪费。地球是一个复杂系统,不少物体具有不确定性或模糊性特征,比如:</P><P left" align=left>1、有些物体本身就没有明确的界线,它们是逐渐过渡的,在由量变到质变过程中,难以确定其分界线,如红壤与黄壤之间的界线,棕壤与灰棕壤的界线,气候带之间的界线等都具有模糊的特征。另外,从全球范围来讲,一个国家的人口数量也是无法精确统计的。</P><P left" align=left>2、虽有明确的定义,但很难操作。如在林地与灌丛的界线划分过程中,林地被定义为树的重直投影面积占60%以上的土地,但在野外实地划界时,却难以操作,只能做大概的估算,即使通过遥感数据,所反映出的界线也是模糊的。</P><P left" align=left>3、有些数据是动态的,甚至是瞬间的。如人口数(每秒都有生和死,每秒都有流动)、耕地数(每天在开垦和荒弃)等,也是模糊的,对这些数据太精确则没有必要,因为它们的精度只具有瞬间的意义。</P><P left" align=left>通过上面的分析,在地理信息描述中,我们应该辨证地分析精度问题,既要追求很高的数据精度,还得反对“冗余”精度,以免造成精度浪费。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
23楼#
发布于:2004-10-28 15:54
<H5 0cm; TEXT-INDENT: 0cm"><A>二、地理信息的存储方式</A></H5><P left" align=left>利用GIS表示现实世界时,大多数信息是通过一定的数学模型,即存储函数方式存储在计算机中的,因此,GIS其实是一种模型地理空间信息。按照这种方式,人们便可以利用GIS揭示自然界中许多用人类视觉难以发觉的信息,比如城市中鸟类居住的变迁情况、发生龙卷风后土地的盐碱化情况以及地震等许多复杂的自然现象。对于这些信息,随着数学模型的不同,所模拟或得出的结果一般是有一定差异的。</P><P left" align=left>利用存储函数反映地理现象时,涉及到两大部分的内容,即取值范围和结果范围,他们之间通过数学模型接口来实现。最简单的数学模型便是参照系,通过它,便可以实现现实世界到数字地理空间世界的映射。</P><P left" align=left>当然,在整个地理空间表示中,涉及到许多存储或转换函数,它们的变量也是千差万别的,比如,摄影测量便是由三维到二维再到三维的过程,在这种转换中涉及到亮度函数、坐标几何函数、以及误差传播等多方面的函数,因此,在利用元数据表示它们时,便
需要通过继承关系等把它们反映出来。</P><H5 0cm; TEXT-INDENT: 0cm"><A>三、地理信息的图层表示</A></H5><P left" align=left>图层(coverage)的产生是一个复杂的过程,它通常由图层产生函数实现。比如航天遥感和航空遥感影像等,都是通过特定的方程使它们由现实世界转变为图象以及数字世界的。</P><P left" align=left>对于产生函数G来说,在由现实世界到地理空间世界的转变过程中,需要考虑的影响因子比较多,包括成像时的动态补偿、地形起伏、大气折射、地图投影转换等诸多因素,因此在实际应用中通常根据不同的阶段采取分段函数的方法,逐步实现由现实世界到所需目的世界的转换。另外,也可以根据元数据不同模型中的一些相似属性实现,包括通讯(或传递)参数、误差估计参数、影像支持参数、像素的小数位、以及计算方向等参数。通过这些约束参数以及它们的子集,便可以用元数据全面记录下数据的整个传递过程,使数据集的形成和使用更加容易理解。</P><P left" align=left> <p></p></P><H5 0cm; TEXT-INDENT: 0cm"><A>四、图层的几何匹配</A></H5><P left" align=left>图层集合或影像对等对数据集也是非常重要的,人们可以通过同一几何范围内不同内容的图层集进行相互叠加,以分析不同要素之间的关系,而这种叠加也符合人类对现实世界的认识过程。因此,元数据描述时,需要记录影像的匹配相对、数据集图层范围以及所对应的属性集等相关元素,同时对描述它们各自的参数、单位、以及数学模型等也要做一定的阐述。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
24楼#
发布于:2004-10-28 15:54
<H4 0cm; TEXT-INDENT: 0cm"><A>1.2.3 地理信息的表示方法</A></H4><H5 0cm; TEXT-INDENT: 0cm"><A>一、几何要素的表示</A></H5><P left" align=left>坐标系统是GIS中表示要素的重要部分,通常由地球坐标系统和GIS坐标系统组成,其中当GIS采用大地坐标系时,这两个坐标系便等价。但对于大多数GIS系统,对几何要素的表示都采用GIS坐标系统,这样,人们便把现实世界中的对象抽象为点、线、多边形等不同的几何形状,并按照点连接成线,线连接成多边形,多边形再组成多面体等递归的方法用GIS坐标系统表示地理实体。</P><P left" align=left>利用几何方式构建GIS关系时,拓扑理论是它的基础[Corbett, J.P.,1979],被用于分析几何关系。这样我们可以利用拓扑学知识分析数据集质量的完备性、逻辑一致性等特征,以正确评价数据集的质量。在使用时,通常通过空间几何的接口实现。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
25楼#
发布于:2004-10-28 15:54
<H3 0cm; TEXT-INDENT: 0cm"><A>1.2 地理信息的理论基础</A></H3><P>(本节选自承继成、<SUP> </SUP>赵永平、<SUP> </SUP>李琦的《关于元数据的理论问题探讨》)</P><P> <p></p></P><H4 0cm; TEXT-INDENT: 0cm"><A>1.2.1 概述</A></H4><P>元数据的理论问题是研究制定元数据标准的重要依据。本节对影响数字地理信息的模型建立理论、表示理论、空间参照系理论、质量体系理论以及计算机通讯技术等理论进行了详细的探讨,其对元数据标准的制定具有积极作用。</P><P>伴随人类对数字地理信息重要性认识的加深,元数据标准化这一问题便逐渐成为共享地学信息的热点,而要研究元数据体系,则首先要对元数据的理论基础有一正确地分析。</P><P>事实上元数据标准依赖于地理空间信息共享标准的理论,它与自然科学中的许多学科都有交叉,几乎涉及到“数、理、化,天、地、生”中的所有方面,并依赖于现代科技的发展[承继成,1996]。计算机是它的基础平台,网络是它的通讯基础,没有数学模型和对
各学科的综合认识,也就谈不上用遥感等技术研究地球基理[陈述彭,1991]。因此,从宏观角度考虑,地理信息标准化涉及到许多领域,似乎它的理论也枚不胜举,但从微观角度来考虑,在基于国家地理空间信息基础设施这一层次,我们所研究的共享体系理论则主要包
括地理信息的模型建立理论、表示理论、空间参照系理论、质量体系理论以及计算机通讯技术等方面的理论,它们是我们共享体系依赖的基础,也是我们首先要考虑的内容。当然其它能够促使地理信息共享的理论也将成为基于元数据体系的有力支柱。</P><P> <p></p></P><H4 0cm; TEXT-INDENT: 0cm">1.2.2  <A>地理信息的模型建立理论</A></H4><P left" align=left>人类对地理对象的认识是一个复杂的过程,它需要把一系列具体的对象抽象为我们在计算机上能够表示的信息。</P><P left" align=left>地理空间信息事实上是我们在浏览地图时所获取的一切信息,它的主要目的是告诉人们“某处有何物”,而数字地理空间信息则是用计算机编码和显示方式对地理空间现象的表示。然而,由于地图是我们对地球实体的简单抽象,因此,我们既可以认为地球影像是一幅地图,也可以把用任何简单仪器采集的不太完备的地球现象的集合认为是地图,这样不同的人对地球现象的认识随方法、时间等的差异便有明显的不同[Raafat H,et al., 1994]。对于数字信息更是如此,随着不同的数据结构、存储方式、分析模型等的存在,便产生了数字地理空间信息领域的混乱现象,给信息的共享带来了很大的不便。</P><P left" align=left>为促使地理信息的共享,便需要对地理信息的整个认知过程有一个总体的了解,即对地理要素之间的关系应比较清楚。这里的要素是指地理空间信息的基本单位,它可通过回归的方法逐渐由简单要素组成复杂的要素,比如一幅卫星影像、影像中的一个像素、非
规则三角网、叠加在天气图上的温度等都为要素。</P><P left" align=left>对地理对象的抽象过程通常认为有九个层次,在这九个层次之间通过八个接口与它们连接,实现了由现实世界到地理要素集合世界的转换。这九个层次依次为现实世界、概念世界、地理空间世界、尺度世界、项目世界、点世界、几何世界、地理要素世界以及要素集合世界。连接它们的八个接口分别为认识接口、GIS学科接口、局域几何接口、群体接口、空间参照系接口、几何结构接口、要素结构接口及项目结构接口。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15951
  • QQ
  • 铜币25345枚
  • 威望15368点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
26楼#
发布于:2004-10-28 15:54
<H2 0cm; TEXT-INDENT: 0cm"><A>1. 元数据理论</A></H2><H3 0cm; TEXT-INDENT: 0cm"><A>1.1 元数据的定义、作用和意义</A></H3><H4 0cm; TEXT-INDENT: 0cm"><A>1.1.1 元数据的定义</A></H4><P left" align=left>人们对元数据的理解比较混乱,有的将其与数据字典混为一谈,迄今尚没有一个统一的元数据定义。但是,一般都认为元数据就是“关于数据的数据”。在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。</P><P left" align=left>元数据并不是一个新的概念。实际上传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都是元数据。纸质地图的元数据主要表现为地图类型、地图图例,包括图名、空间参照系统和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。在这种形式下,元数据是可读的,生产者与用户之间容易交流,用户通过它可以非常容易地确定该书或地图是否能够满足其应用需要。</P><P 6pt; TEXT-INDENT: 21pt; mso-char-indent-count: 2.0; mso-char-indent-size: 10.5pt"> </P><H4 0cm; TEXT-INDENT: 0cm"><A>1.1.2 元数据的作用</A></H4><P left" align=left>当地图转换为数字形式时,数据的管理和应用均产生一些新的问题,例如:</P><P left" align=left>数据生产者需要管理和维护好海量数据,提高效率,且不受工作人员变动的影响; </P><P left" align=left>用户缺乏查询可用数据的方便简洁的途径,不知道在何处能够找到数据;缺少可用数据的技术文件信息,不知道如何获得所需数据;当数据格式对于应用而言直接使用时,不知道如何理解数据和转换数据;不知道有关联系信息,不能远程访问数据资源等。</P><P left" align=left>元数据可以用来辅助地理空间数据,帮助数据生产者和用户解决这些问题。元数据的<B>主要作用</B>可以归纳为如下方面: </P><P left" align=left>1. 帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解; </P><P left" align=left>2. 提供有关数据生产单位数据存贮、数据分类、数据内容、数据质量、数据交换网络(clearinghouse)及数据销售等方面的信息,便于用户查询检索地理空间数据; </P><P left" align=left>3. 提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息; </P><P left" align=left>4. 帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断; </P><P left" align=left>5. 提供有关信息,以便用户处理和转换有用的数据。 </P><P left" align=left>由此可见,元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。原始数据如果没有元数据,就很难有效地进行管理和使用。元
数据对于建立空间数据交换网络是十分重要的,网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分结点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。不难预见,元数据在地理信息系统产业中将担当重要的角色。然而,
在数字形式下,元数据的建立和维护、生产者与用户之间的交流均不那么容易,需要数据生产者更多的努力,并需要那些随后可能应用数据的用户,或可能修改数据以便符合其需求的用户作出相应的努力。</P><P> <p></p></P><P 7.8pt">FGDC认为元数据主要有如下作用:</P><P 0cm 0cm 7.8pt 21pt; TEXT-INDENT: -21pt; tab-stops: list 21.0pt; mso-list: l12 level1 lfo78">l         组织和维护对数据的投资</P><P 7.8pt; TEXT-INDENT: 21pt; mso-char-indent-count: 2.0; mso-char-indent-size: 10.5pt">元数据帮助确保一个组织在数据上的投资。随着技术的进步,信息的采集变得越来越容易,人们每天都在收集各种各样大量的信息(比如:NASA的行星地球计划每天产生10<SUP>11 </SUP>字节的信息,加上其它来源,每天产生10<SUP>15</SUP>字节的信息,即每天产生了海量信息<SUP>[5]</SUP> ),然而随着人员的变更或者时间的流逝,关于数据的信息可能会丢失。缺少必要的关于数据的信息,后来的工作人员可能无法使用或者因为对数据的质量缺乏信任而放弃使用,于是先前获取数据的投资将会遭受损失。完整的数据信息的描述和关于信息的可靠性的保证将帮助用户很好地使用数据。另一方面,这些描述信息在因用户错误地使用数据(比如没有按规定操作)而引发纠纷时给数据提供者予保护。</P><P 0cm 0cm 7.8pt 21pt; TEXT-INDENT: -21pt; tab-stops: list 21.0pt; mso-list: l12 level1 lfo78">l         为数据的发现和获取提供信息</P><P 7.8pt; TEXT-INDENT: 21pt; mso-char-indent-count: 2.0; mso-char-indent-size: 10.5pt">一般的应用可能会涉及到各个方面的数据。比如一个有关城市规划的应用项目就可能会用到各种基础数据:绘局的城市地形图,遥感所的测绘图,水利局的地下供水管道图,电讯局的光缆分布图等等。这些数据显然是不可能由一个组织来提供的,只有通过根据数据集的相关元数据建立的数据目录服务器或空间信息交换中心,用户才可以在相关工具的帮助下发现和获取需要的数据,进而才能有效地利用各种基础数据。通过元数据定义数据集被用于检索的相关信息,使得被查询的数据具有了一定的结构性,从而使查询更加准确和方便。就像现在图书馆网站提供的复杂查询功能,在系统界面的帮助下,用户可以输入记录项在某些域段需要满足的条件,以及这些条件的逻辑关系,从而形成一条比较准确的查询语句,这样可以大大地减少查询的返回结果。同时元数据还提供了了有关数据获取的信息(比如用户要找的某本书所在图书馆及其书号)来帮助用户取得数据。</P><P 0cm 0cm 7.8pt 21pt; TEXT-INDENT: -21pt; tab-stops: list 21.0pt; mso-list: l12 level1 lfo78">l         为数据的使用提供信息</P><P 7.8pt; TEXT-INDENT: 21pt; mso-char-indent-count: 2.0; mso-char-indent-size: 10.5pt">通过元数据详细地描述数据集的相关结构信息及其语义解释,可以帮助用户更好地使用数据,并为实现数据集间的共享和互操作以及数据挖掘工作提供了必要的信息。比如,有时用户取回的图层数据并不是自己系统直接能用的格式,此时就需要根据其元数据对该图层空间信息结构的描述信息来理解该数据,进行数据格式转换后使用。还比如,用户拿到一幅地图数据以后不知道它是否满足自己系统的精度要求,这就需要根据元数据提供的数据质量信息来做判断。</P><P 7.8pt; TEXT-INDENT: 21pt; mso-char-indent-count: 2.0; mso-char-indent-size: 10.5pt">由此可见,元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换及数据使用等。元数据对于促进数据的管理、使用和共享均有重要的作用<SUP>[6]</SUP>。</P>
GIS麦田守望者,期待与您交流。
举报 回复(0) 喜欢(0)     评分
上一页 下一页
游客

返回顶部