破除存储神话 大数据的困难点在哪里?

云计算、物联网时代的来临,大数据或者说是全部数据是如何收集的呢?得到这些数据量可能是一个吓人的整体,如何将他们变得更小更有用呢?

破除存储神话 大数据的困难点在哪里?

据Gartner称,到2018年,70%的Hadoop的部署将无法满足节约成本和增加收入的目的,这主要因为来自技能和整合方面的挑战。
技能和整合方面的挑战?目前所有厂商不是都生成能够使大数据轻松流畅的被使用吗?那么他的困难在哪里呢?下面就让我们来逐一来看。
 

 收集数据


大数据或者说是全部数据是如何收集的呢?得到这些数据量可能是一个吓人的整体,如何将他们变得更小更有用呢?
在传统收集数据方面,例如,惠及、人力资源系统等的,这些交易系统已经很早就被用作数据源进行分析,ETL过程也非常到位。因为这些数据都是结构化的数据,所以相对起来更轻松容易。
云计算、物联网时代的来临,传感器和其它设备每天都会产生很多的数据,这些数据需要进行及时的收集,但是总体来说,这些数据通常还是非常标准版的,而上行数据转换的要求也并不巨大。
难点在非结构化数据方面,收集媒体文件、文本数据是大数据平台如Hadoop进行的。因为这些数据是非结构化数据,所以在存储方面,需要真正的了解数据,并弄清楚他们,给予适当的ETL工具和API接口,以及所需要的吞吐量,这些才是收集数据所面临的挑战。

存储数据

大数据平台是一个多类型产物,需要存储所有类型的数据,并且数据可以被表示出来。从简单的文件存储到复杂的非常规的数据存储,都需要进行存储。
由于大数据平台的设计理念,该平台是无限扩展的,他能够提供在云中的服务,具有非常好的弹性,至少,存储大数据来说是非常容易的。
然而存储数据最棘手的问题是如何使大数据平台在现实中应用,从核心的Hadoop平台,以及各种商业发行版以及数据库厂商提供的混合平台,有很多选择,很多价位,这对于企业来说,需要了解不同的变化,需要很深的技术水平。
 

 使用数据

一旦你在数据平台中保存了所有的这些数据,那么你需要他们变换成你需要的核核对数据,并且确保跨多个源的一致性,保证数据的质量,这是大数据中最困难的部分。
如果你只需要在一个特定的额数据源上构建应用程序,或者在一直的数据上顶部做报告,anemia有许多解决方案能够自动化进行。
但是,当需要跨渠道的界限、探索和利用异构数据,这个时候对于企业用户往往是个难题,往往需要厂商的加入才能解决问题。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)

相关推荐

  • 网传防拍“秘籍”是否靠谱?

    面对各种各样的监控探头,稍有不慎就有可能因为违章被曝光。为此,网上流传了很多躲避电子警察曝光的方法,但它们真的靠谱吗?路口探头又是如何抓拍交通违法的呢?

    2026年6月20日
  • 破解智慧城市难题 智慧银川为何获点赞

    银川建设智慧城市的魄力值得赞赏,并取得了良好的成果,这源于银川的智慧城市顶层设计,这是真正的以城市为单位进行的顶层设计,而不是较多见到的某一个智慧的模块。

    2026年6月20日
  • 昆明市部分小区摄像头失效多 后期维护谁负责

    监控缺位的情况下,一旦小区住户财物丢失,应由谁来负责?对此,云南凌云律师事务所律师李春光介绍,小区财物被盗,应分两种情况,如果是收费停车等场所被盗、或出现其他损失,物业公司作为管理方,收了费就得承担相应的赔偿责任;如果是业主家中被盗,就要看业主和物业双方的合同约定了,不能说监控设备失效,就得由物管负责。

    2026年6月20日
  • 移动支付持续走高 二维码or近场支付谁能独得恩宠?

    昨日(12月3日),中国金融认证中心(CFCA)发布的《2015中国电子银行调查报告》(以下简称《报告》)显示,综合来看,二维码支付的使用率已大幅领先于NFC手机支付。二维码支付与NFC支付的争论从未停止。

    2026年6月20日
  • 交通监管常用几种监控方式

    交通监管常用几种监控方式

    2026年6月20日
  • 辨别门禁控制器性能的几个步骤

    门禁就是出入口控制,在人进出重要通道的时候,进行适当级别的权限鉴别,以区分是否能通过的一种管理手段。而门禁控制器就好像门禁系统的双手,没有良好门禁控制器门禁系统就难以良好运作。所以选择一个好的门禁控制器至关重要。门禁控制器对于整个门禁系统的重要性我就不累述了,门禁控制器犹如人之心脏,系统之灵魂,总体说来就是如果选择了合适的门禁控制器,不仅能节约成本,延长整个系统的使用寿命,而且后期的维护也会相当简便,工程商高兴,用户也高兴,厂商也高兴,可谓皆大欢喜。

    2026年6月20日