|
阅读:1240回复:1
什么是海量数据?
<FONT face=宋体>海量数据是一个形容词,它是用来形容巨大的、空前浩瀚的数据。现在,在许多业务部门中 都需要操作海量数据,如规划部门有规划方面的数据,水利部门有水利方面的数据,气象部 门有气象方面的数据,测绘部门有测绘方面的数据,这些部门都可能有几百兆甚至数十千兆 的数据,如仅测绘部门的全国1∶25万地形数据库的数据量就达4.5Gb(千兆);又如一景包含 七个波段的Landsat TM影像的数据量达270兆左右,如果统计覆盖全国的TM影像的数据量将 达到135Gb(千兆),真是不可思议。随着人类信息化程度的提高,数据已超出它原始的范畴 ,它包含各种空间数据、报表统计数据、文字、声音、图像、超文本等各种环境和文化数据 信息。随着社会信息化程度的提高、计算机的普及,特别是因特网和万维网(WWW)的迅速发 展,世界各地、各行业、各部门以及个人都能通过网络达到信息共享,使得分布于世界各地 的海量数据能有机地联系在一起。</FONT>
|
|
|
|
1楼#
发布于:2004-12-26 12:09
<P><b><FONT face=宋体 size=4>如何处理海量信息?</FONT></b></P><P><FONT face=宋体>我们知道,海量数据可以泛指巨量的事务性数据,也可专指巨量的空间数据。对于巨量的事 务性数据的处理,目前已有非常成熟的数据库技术,可采用分布式的数据库(面向对象的或 关系的)来处理这些海量信息。对于巨量的空间数据,由于其自身的特点,目前的基于结构 化的数据库技术还不能很好地独立处理这类海量信息。</FONT></P><P><FONT face=宋体> 要处理海量空间信息,在数据处理的过程中必须遵守以下原则:</FONT></P><P><FONT face=宋体> (1)共享原则。空间信息的共享可以使数据具有更大的应用前景。</FONT></P><P><FONT face=宋体> (2)数据独立性原则,即要处理的数据与应用程序之间是分离的。这使得同样的数据可以被 不同的应用程序利用。</FONT></P><P><FONT face=宋体> (3)最小冗余度原则。</FONT></P><P><FONT face=宋体> (4)统一管理原则,即将巨量的数据统一管理,而不管数据具体的存放地址。</FONT></P><P><FONT face=宋体> 由于空间数据种类很多,所以目前通用的空间数据模型有以下几类:</FONT></P><P align=left><FONT face=宋体> </FONT></P><P><TABLE height=136 width="70%" border=1><TR><TD width="11%" height=130 rowSpan=3><P align=left><FONT face=宋体>空间数据模 型</FONT></P></TD><TD width="13%" height=8><P align=left><FONT face=宋体>矢量模型</FONT></P></TD><TD width="76%" height=33><P align=left><FONT face=宋体>简单的矢量模型;GBF/DIME(地理基础文件/双独立坐标 地图编码系统)数据模型;POLYVRT(多边形转换器)数据模型;链码</FONT></P></TD></TR><TR><TD width="13%" height=54><P align=left><FONT face=宋体>镶嵌模型</FONT></P></TD><TD width="76%" height=48><P align=left><FONT face=宋体>栅格数据模型;非规则的镶嵌数据模型</FONT></P></TD></TR><TR><TD width="13%" height=50><P align=left><FONT face=宋体>混合模型</FONT></P></TD><TD width="76%" height=51><P align=left><FONT face=宋体>栅格数据模型;多级矩形模型(又称剥树皮模型);多级格网模型</FONT></P></TD></TR></TABLE></P><P 150%"><FONT face=宋体> 在空间数据模型上,以往的GIS系统都是将几何意义上的空间数据和其对应的属性数据分开 存储,属性数据用数据库管理,空间数据用文件管理。上面提到的空间数据模型均是如此, 它们在空间数据索引上通常采用四叉树、八叉树、B—树等方法。</FONT></P><P 150%"><FONT face=宋体> 为了解决这个问题,目前研究的热点集中在面向对象的数据模型和空间数据仓库技术。面向 对象的数据模型是采用面向对象技术建立数据模型,具有封装、继承等特点。它可以将几何 数据和属性数据置于一个逻辑上统一的面向对象的数据模型之中。</FONT></P><P 150%"><FONT face=宋体> 而空间数据仓库技术则是真正意义上的用数据库来管理海量的空间数据。由于空间数据具有 非结构性特点,因此,在此技术的研究和探索上还有很长的路要走。要着重解决多维数据存 储、数据共享、数据一致性、数据采集和挖掘及系统性能等诸多问题</FONT></P>
|
|
|