|
阅读:553回复:1
“大数据”生意的节操
作为“智慧城市”最热门的概念之一,“大数据”这个词汇我已经在许多地理信息行业的讲座、论坛和报告中看到过了,坦率地讲,除了最初的几次有所感触外,其余内容都毫无新意:它们总是在“喋喋不休”地重复一个可能并不存在的“事实”,即我们的日常生活中产生了多少与地理信息相关的海量数据,而这些数据需要被我们的GIS进行存储、处理、分析和挖掘,以探索其中的奥秘,并更好地服务“智慧城市”。我毫不怀疑某些机构正在生产出海量的数据,如卫星影像或航片分辨率越来越高,采集速度越来越快,数据量越来越大。然而,这些在“大数据”一词出现之前就存在的特例与普通用户又有什么直接的关系呢?正如许多“大数据”PPT总是津津乐道“啤酒与尿不湿”段子的时候,往往忽视了一个问题:除了能列举亚马逊、沃尔玛这样的巨头例子外,难道就没有中小规模企业使用的例子吗?也许我们并不清楚其它行业,那么我们自己的地理信息产业中又有哪些企业真正在处理和分析“大数据”,并为自己创造了商业价值呢?!
<p> 很多谈论“大数据”的观点着眼点在其数据量之大,如每天有多少个GB甚至TB的数据被制造出来,但怎么样存放和访问是存储硬件巨头们的事情,并且他们做的是如此的好,以至于我们根本不必担心自己的数据无处可放——只要你肯出钱就行。“大数据”的“大”更多体现在数据的高维度上,当一个数据的属性超过数十项乃至上百项时,想要了解不同属性间的相关性或挖掘出数据间潜在的模式就非常的困难,这正是“大数据”的意义所在;但在很多PPT中,对于这么关键的内容往往只能看到几个干瘪的字眼“分析、挖掘”,至于到底怎么样来分析和挖掘,使用什么样的工具,有什么样的技巧,实现了什么价值,这些我从未见过。</p> <p> 另一个问题是在地理信息应用的大客户群——电子政务领域——有那么多需要分析的大数据吗?为了了解相关问题,我曾经问过不同的人群:从卖存储和负载均衡设备的售前工程师、不同信息中心的技术人员到相关业务系统的开发工程师,他们给我的答案是:海量存储和负载均衡是现在的一种标配形式,市级层面的电子政务应用几乎没有遇到过访问量激增以至需要负载均衡的情况。而在地理信息应用中,我们的层次也大多处于“底图共享”阶段,离真正的数据挖掘和分析还很远:包括数据、方法和应用场景都还没有准备成熟。</p> <p> 如果作为一种技术理念和研究方向,这些演讲和PPT内容倒也无可厚非。然而恶劣的是,有些企业则是已经开始兜售由全套开源产品组成的所谓“大数据分析平台”,从Hadoop、HDFS、Hbase、Hive到R,能想到的概念和名词全部砌在一起,似乎他们已经完美地实现了基于大数据的空间数据存储和分析流程,将用户忽悠的一愣一愣,但在现实中你却从未找到过他们分析的一个数据实例。这些无法落地的行为已经在丧失一个企业的节操,说多了,反感自然就来了。</p> |
|
|
1楼#
发布于:2013-10-15 19:28
good, 大数据是需要的,但国内离得还很远,概念忽悠居多,实打实的做的较少。
|
|