【成都網(wǎng)站設計】高性能集群計算(HPCC)能取代Hadoop嗎?

2022-07-04    分類: 網(wǎng)站建設

LexisNexis公司將發(fā)布一款開源的數(shù)據(jù)處理方案,LexisNexis公司宣稱其處理工作負載的能力要優(yōu)于Hadoop。該技術被稱為HPCC系統(tǒng),該系統(tǒng)在10年前幫助LexusNexis公司的Risk Solutions分析大量的客戶數(shù)據(jù)。并在金融業(yè)和其他重要的行業(yè)中應用??磥鞨PCC(High-Performance Cluster Computing 高性能集群計算)似乎有能力成為替代Hadoop的解決方案

據(jù)LexisNexis Risk Solutions部門CTO Armando Escalante表示,LexisNexis公司決定發(fā)布HPCC系統(tǒng),目前的狀況是Hadoop技術已經(jīng)成為處理海量數(shù)據(jù)的選。Armando Escalante表示Hadoop雖然在海量數(shù)據(jù)處理方面走在前邊,但他認為HPCC系統(tǒng)更為優(yōu)越。

但重要的是,Hadoop的開源模式吸引了大量相關人員對其進行開發(fā)和創(chuàng)新。Armando Escalante解釋說,如果公司想要繼續(xù)保持HPCC的影響力就需要通過一個新社區(qū)提供應用和好的創(chuàng)意。

Hadoop是許多年前由當時的Yahoo員工Doug Cutting在Apache軟件基金會創(chuàng)建的項目。Hadoop現(xiàn)已成為網(wǎng)絡公司的重要工具。包括Yahoo、Facebook,并幫助他們處理不斷增長的非結構化數(shù)據(jù)。Hadoop催生了一批用于商業(yè)的基于分布式技術的產(chǎn)品,包括Cloudera,EMC和IBM等公司。

HPCC如何工作

Hadoop依靠兩個核心組件來存儲和處理海量數(shù)據(jù)——Hadoop分布式文件系統(tǒng)和Hadoop Mapreduce。Cloudant公司CEO Mike Miller認為MapReduce在編寫并行處理工作流時依然相對復雜,HPCC旨在通過ECL(Enterprise Control Language)改善這一局面。

Escalante表示ECL是一種聲明式并以數(shù)據(jù)為中心的語言,它剝離了大量MapReduce必要的工作。對于某些千行代碼的MapReduce任務ECL只需要99行。此外,他還表示ECL對集群中節(jié)點的數(shù)量沒有要求,系統(tǒng)會自動將數(shù)據(jù)分布式的存放在當前節(jié)點之中。從技術上講,HPCC還可以運行在單一的虛擬機上。HPCC基于C++,如同Google最早的Mapreduce,這使得HPCC天生在效率上就優(yōu)于基于Java開發(fā)的Hadoop。

HPCC提供兩種數(shù)據(jù)處理和服務的方式——Thor Data Refinery Cluster和Roxy Rapid Data Delivery Cluster。Escalante表示如此命名是因為其能像Thor(北歐神話中司雷、戰(zhàn)爭及農(nóng)業(yè)的神)一樣解決困難的問題,Thor主要用來分析和索引大量的Hadoop數(shù)據(jù)。而Roxy則更像一個傳統(tǒng)的關系型數(shù)據(jù)庫或數(shù)據(jù)倉庫,甚至還可以處理Web前端的服務。

雖然沒有深入探討HPCC存儲組件的細節(jié),但Escalante表示HPCC基于分布式文件系統(tǒng),并可支持各種off-node存儲架構和本地的SSD。

Escalante認為為了確保LexisNexis產(chǎn)品質(zhì)量,應采用“eating its own dogfood”(指軟件公司強調(diào)自己的軟件產(chǎn)品首先應內(nèi)部使用,如果希望顧客購買公司的產(chǎn)品,公司內(nèi)部也應該愿意使用它們)做法。HPCC開發(fā)團隊還聘請了Hadoop專家?guī)椭鷻z驗其產(chǎn)品是否有問題疏漏。HPCC還構建了一個轉換器,用于遷移Hadoop Pig編寫的應用并轉換為ECL。

HPCC具有競爭力嗎?

一個關鍵的問題是HPCC是否能吸引到業(yè)界的構建者和用戶,這將有助于提升其在海量數(shù)據(jù)領域的話語權。Escalante認為HPCC能夠成功,因為HPCC已經(jīng)證明了自己,它已處理LexisNexis Risk Solutions的35000個數(shù)據(jù)源。同時HPCC還可以每秒處理5000次的和支付客戶打交道的交易事物。

Hadoop已經(jīng)證明了自己,其潛在的巨大核心業(yè)務每天都在增長,現(xiàn)在企業(yè)和組織在海量數(shù)據(jù)上依托于Hadoop。但Hadoop并不滿足這些成就。這使得微軟也在海量數(shù)據(jù)的競爭中推出了自己的分布式計算技術Dryad。(李智/譯)

原文鏈接:GIGAOM

成都網(wǎng)站設計公司 成都網(wǎng)站建設公司 成都網(wǎng)站制作公司 成都網(wǎng)站設計 成都網(wǎng)站建設 成都網(wǎng)站制作  成都精品網(wǎng)站制作 成都精典網(wǎng)站制作

網(wǎng)頁標題:【成都網(wǎng)站設計】高性能集群計算(HPCC)能取代Hadoop嗎?
轉載源于:http://www.bm7419.com/news37/174337.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、企業(yè)網(wǎng)站制作、網(wǎng)站收錄、網(wǎng)站維護、標簽優(yōu)化、網(wǎng)站策劃

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

h5響應式網(wǎng)站建設