亚洲乱码午夜理论不卡公息肉欲_无遮挡一级毛片在线播放_国产AV无码国产永久播放_中出欧美美脚在线观看

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
您的位置: 網站首頁 > 幫助中心>文章內容

數據分析不使用Hadoop的五大理由

發(fā)布時間:  2012/8/18 19:48:20

我一度是Hadoop的忠實擁護者。我喜歡它可以輕而易舉地處理PB級別的數據,喜歡它可以將運算擴展到數千個節(jié)點的分布式計算能力,也喜歡它存儲和加載數據的靈活性。但在經歷過一系列的探索與使用之后,我對Hadoop非常失望。

下面就是我為什么不使用Hadoop做數據分析的見解。

Hadoop只是一個框架,而非一種完備的解決方案。人們期望Hadoop可以圓滿地解決大數據分析問題,但事實是,對于簡單的問題Hadoop尚可,對于復雜的問題,依然需要我們自己開發(fā)Map/Reduce代碼。這樣看起來,Hadoop與使用J2EE編程環(huán)境開發(fā)商業(yè)分析解決方案的方式別無二致!

Pig和Hive都非常不錯,但卻受到架構的局限。Pig和Hive都是設計精巧的工具,它們可以讓人迅速上手,提高生產力。但它們畢竟只是一種工具,用于將常規(guī)的SQL或文本轉化成Hadoop環(huán)境上的Map/Reduce查詢。Pig和Hive受限于Map/Reduce框架的運作性能,尤其是在節(jié)點通信的情況下(如排序和連接),效率更為低下。

沒有軟件成本,部署相對容易,但維護和開發(fā)的代價極大。Hadoop非常受歡迎的理由在于,我們可以自由的下載、安裝并運行。由于它是一個開源項目,所以沒有軟件成本,這使得它成為一種非常吸引人的解決方案,用于替代Oracle和Teradata.但是一旦進入維護和開發(fā)階段,Hadoop的真實成本就會凸顯出來。

擅長大數據分析,卻在某些特定領域表現不佳。Hadoop非常擅長大數據分析,以及將原始數據轉化成應用(如搜索或文本挖掘)所需的有用數據。但如果我們并不很清楚要分析的問題,而是想以模式匹配的方式探索數據,Hadoop很快會變得一塌糊涂。當然,Hadoop是非常靈活的,但需要你花費較長的時間周期去編寫Map/Reduce代碼。

并行處理的性能極佳,但不排除特例。Hadoop可以將數千個節(jié)點投入計算,非常具有性能潛力。但并非所有的工作都可以進行并行處理,如用戶交互進行的數據分析。如果你設計的應用沒有專門為 Hadoop集群進行優(yōu)化,那么性能并不理想,因為每個Map/Reduce任務都要等待之前的工作完成。

綜上所述,Hadoop的確是一個令人震驚的計算框架,它可以進行大規(guī)模的數據分析。另一方面,這也意味著數據分析工作必須建立在大量的編程工作之上。


本文出自:億恩科技【www.ruiliheng.com】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1-20183354
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 網絡版權侵權舉報電話:0371-60135995
  • 警情提示:注意防范電信網絡詐騙
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2026 ENKJ All Rights Reserved 地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師  B1-20183354   京公網安備41019702002023號 
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線