為什么沒(méi)有以hbase作為存儲(chǔ)引擎的關(guān)系型數(shù)據(jù)庫(kù)實(shí)現(xiàn)?
一、為什么沒(méi)有以hbase作為存儲(chǔ)引擎的關(guān)系型數(shù)據(jù)庫(kù)實(shí)現(xiàn)
SQL引擎都可以作為hbase的SQL層。但是作為關(guān)系型數(shù)據(jù)庫(kù),支持多表事務(wù),的確基于hbase沒(méi)有很好的解決方案。首先目前hbase的事務(wù)是針對(duì)單機(jī)region server單表行級(jí)事務(wù),也就是客戶端一次請(qǐng)求,將多筆記錄作為一條日志針對(duì)一個(gè)region進(jìn)行處理。成功則寫(xiě)入memstore,失敗則wal回滾,所以事務(wù)操作并不復(fù)雜,但是若要在一次事務(wù)中實(shí)現(xiàn)多表寫(xiě)入,多機(jī)region一致性協(xié)同,這在hbase設(shè)計(jì)之初并沒(méi)有考慮。
因此,若按照目前hbase的設(shè)計(jì),寫(xiě)入不同hregionserver,再寫(xiě)入不同region的memstore記錄,包括各個(gè)wal的記錄,必須保證一致性,這就是region分布式一致性的名列前茅難,必須要有集群一致性機(jī)制,例如paxos或者raft,可是hbase沒(méi)有,只有一個(gè)簡(jiǎn)單的master解決region分片后的遷移平衡問(wèn)題。必須要具備表表之間,列簇之間的ACID特性,hbase并沒(méi)有設(shè)計(jì)此處,他的master和region server在這些問(wèn)題上基本沒(méi)有任何前期預(yù)留的分布式擴(kuò)展機(jī)制。
其次每次事務(wù)必然會(huì)有多次查詢請(qǐng)求,如果用tps代表事務(wù)吞吐,那么qps就代表了一次tps內(nèi)可能涉及數(shù)百次的查詢,我們可以忍受1秒1個(gè)事務(wù)操作,但是查詢不行,每次查詢必須能在毫秒內(nèi)完成,甚至更短周期,那么這就存在優(yōu)化問(wèn)題了,如果查詢是熱點(diǎn)數(shù)據(jù)在memstore或者blockcache中,這還好說(shuō),但是在多個(gè)hfiile的磁盤中掃描這就慢了,例如:hbase的lsm-tree的刪除和更新都只是一條新紀(jì)錄的標(biāo)識(shí),這種用空間換取寫(xiě)入性能的設(shè)計(jì),另外的副作用就是增加查詢量,過(guò)期數(shù)據(jù)在查詢中都掃描出來(lái),由掃描器自己去過(guò)濾。那么為了解決查詢問(wèn)題,就必須加大內(nèi)存和使用固態(tài)磁盤來(lái)解決查詢速度,這就是第二難,實(shí)際上hbase類lsm樹(shù)的查詢機(jī)制復(fù)雜度遠(yuǎn)高于寫(xiě)入,而且提升基礎(chǔ)資源成本改善性能并不具有普適性,這就是另一個(gè)問(wèn)題了!
或許LevelDB,rocksdb,這些輕量級(jí)的kv的查詢性能比起hbase會(huì)更適合事務(wù)單元內(nèi)的高密度kv查詢,但hbase還是傾向于大吞吐kv寫(xiě)入和熱點(diǎn)數(shù)據(jù)查詢用于支撐實(shí)時(shí)流處理過(guò)程的流庫(kù)連接。因此我認(rèn)為hbase要是考慮在未來(lái)支持分布式rdbms,必須得徹底升級(jí)master服務(wù)支撐region server的分布式一致性,并且實(shí)現(xiàn)跨表的ACID特性支持,最后就是region級(jí)別的讀優(yōu)化。
延伸閱讀:
二、MongoDB是什么
非關(guān)系型數(shù)據(jù)庫(kù)(nosql ),屬于文檔型數(shù)據(jù)庫(kù)。MongoDB采用類JSON的documents來(lái)存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)由鍵值(key=>value)對(duì)組成。
MongoDB采用動(dòng)態(tài)數(shù)據(jù)模型schema,這意味著不需要預(yù)先定義表的數(shù)據(jù)類型和字段名。當(dāng)MongoDB需要更新文檔documents的時(shí)候,可以輕松增加新的字段名或者刪除舊的字段。MongoDB讓數(shù)據(jù)結(jié)構(gòu)更加層級(jí)化,因而存儲(chǔ)數(shù)組等復(fù)雜數(shù)據(jù)結(jié)構(gòu)。 在同一個(gè)集合collection中,文檔document對(duì)字段也沒(méi)有強(qiáng)約束,因此更容易設(shè)計(jì)差異化的數(shù)據(jù)結(jié)構(gòu)。

猜你喜歡LIKE
相關(guān)推薦HOT
更多>>
mysql怎么查看連接池是否已滿?
一、mysql怎么查看連接池是否已滿1.查看連接數(shù)配置(MySQL服務(wù)器允許的最大連接數(shù)16384)show variables like ‘%max_connections%’2.查看當(dāng)前...詳情>>
2023-10-17 21:20:19
什么是職場(chǎng)情商,如何提高?
什么是情商?情商是一個(gè) 20 世紀(jì) 90 年代作為學(xué)術(shù)話題出現(xiàn)的概念,并迅速成為商業(yè)心理學(xué)和職場(chǎng)動(dòng)態(tài)研究的重要組成部分。它通常被稱為 EQ(情商...詳情>>
2023-10-17 20:16:30
vector, list, map等容器使用場(chǎng)合是什么?
一、vector, list, map等容器使用場(chǎng)合vector適用于對(duì)象簡(jiǎn)單,變化較小,并且頻繁隨機(jī)訪問(wèn)的場(chǎng)景。list適用經(jīng)常進(jìn)行插入和刪除并且不經(jīng)常隨機(jī)訪...詳情>>
2023-10-17 19:45:03
數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用有哪些?
一、數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用關(guān)于關(guān)聯(lián)規(guī)則分析,這篇文章可以認(rèn)真學(xué)習(xí)一下,講的比較全面,關(guān)聯(lián)規(guī)則分析還在零售、快消、電...詳情>>
2023-10-17 18:40:06熱門推薦
sql server2012r2所在服務(wù)器做端口限制,需要開(kāi)放什么端口才能繼續(xù)訪問(wèn)數(shù)據(jù)庫(kù)?
沸Oracle有什么優(yōu)勢(shì)和劣勢(shì)?
熱數(shù)據(jù)庫(kù)聚集索引非聚集索引實(shí)現(xiàn)上有哪些區(qū)別?
熱數(shù)據(jù)庫(kù)(如oracle、mysql)及編程語(yǔ)言(php、python、perl、lisp)的區(qū)別?
新CSS 隱藏頁(yè)面元素有哪些方法?
除了cx_Oracle,python還可以通過(guò)什么方式訪問(wèn)Oracle數(shù)據(jù)庫(kù)?
SQL開(kāi)啟事務(wù)處理的語(yǔ)句 START TRANSACTION 和BEGIN TRAN的區(qū)別?
Android適配你需要學(xué)習(xí)哪些?
開(kāi)發(fā)web應(yīng)用,好的開(kāi)發(fā)流程是怎么樣的?
為什么說(shuō)Gradle是Android進(jìn)階繞不去的坎?
mysql怎么查看連接池是否已滿?
WHERE中有很多IN判斷怎么提速?
軟件開(kāi)發(fā)要遵循哪些事項(xiàng)?
有了innodb buffer pool為什么要有redis?
技術(shù)干貨







快速通道 更多>>
-
課程介紹
點(diǎn)擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學(xué)習(xí)費(fèi)用
了解課程價(jià)格 -
優(yōu)惠活動(dòng)
領(lǐng)取優(yōu)惠券 -
學(xué)習(xí)資源
領(lǐng)3000G教程 -
師資團(tuán)隊(duì)
了解師資團(tuán)隊(duì) -
實(shí)戰(zhàn)項(xiàng)目
獲取項(xiàng)目源碼 -
開(kāi)班地區(qū)
查看來(lái)校路線