Naresh Kumar是位軟件工程師與熱情的博主,對于編程與新事物擁有極大的興趣,非常樂于與其他開發(fā)者和程序員分享技術(shù)上的研究成果。近日,Naresh撰文談到了12款知名的免費、開源NoSQL數(shù)據(jù)庫,并對這些數(shù)據(jù)庫的特點進行了分析。
現(xiàn)在,NoSQL數(shù)據(jù)庫變得越來越流行,我在這里總結(jié)出了一些非常棒的、免費且開源的NoSQL數(shù)據(jù)庫。在這些數(shù)據(jù)庫中,MongoDB獨占鰲頭,擁有相當(dāng)大的使用量。這些免費且開源的NoSQL數(shù)據(jù)庫具有很好的可伸縮性與靈活性,非常適合于大數(shù)據(jù)存儲與處理。相較于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,這些NoSQL數(shù)據(jù)庫在性能上具有很大的優(yōu)勢。然而,這些NoSQL數(shù)據(jù)庫未必最適合你。大多數(shù)常見的應(yīng)用仍然可以使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫進行開發(fā)。NoSQL數(shù)據(jù)庫依然不太適合于那些任務(wù)關(guān)鍵型的事務(wù)要求。我對這些數(shù)據(jù)庫進行了一些簡單介紹,下面就來看看。
MongoDB是個面向文檔的數(shù)據(jù)庫,使用JSON風(fēng)格的數(shù)據(jù)格式。它非常適合于網(wǎng)站的數(shù)據(jù)存儲、內(nèi)容管理與緩存應(yīng)用,并且通過配置可以實現(xiàn)復(fù)制與高可用性功能。
MongoDB具有很強的可伸縮性,性能表現(xiàn)優(yōu)異。它使用C++編寫,基于文檔存儲。此外,MongoDB還支持全文檢索、跨WAN與LAN的高可用性、易于實現(xiàn)的復(fù)制、水平擴展、基于文檔的豐富查詢、在數(shù)據(jù)處理與聚合等方面具有很強的靈活性。
這是個Apache軟件基金會的項目,Cassandra是個分布式數(shù)據(jù)庫,支持分散的數(shù)據(jù)存儲,可以實現(xiàn)容錯以及無單點故障等。換句話說,“Cassandra非常適合于那些無法忍受數(shù)據(jù)丟失的應(yīng)用”。
這也是Apache軟件基金會的一個項目,CouchDB是另一個面向文檔的數(shù)據(jù)庫,以JSON格式存儲數(shù)據(jù)。它兼容于ACID,像MongoDB一樣,CouchDB也可以用于存儲網(wǎng)站的數(shù)據(jù)與內(nèi)容,以及提供緩存等。你可以通過JavaScript在CouchDB上運行MapReduce查詢。此外,CouchDB還提供了一個非常方便的基于Web的管理控制臺。它非常適合于Web應(yīng)用。
Hypertable模仿的是Google的BigTable數(shù)據(jù)庫系統(tǒng)。Hypertable的創(chuàng)建者將“成為高可用、PB規(guī)模的數(shù)據(jù)庫開源標(biāo)準(zhǔn)”作為Hypertable的目標(biāo)。換言之,Hypertable的設(shè)計目標(biāo)是跨越多個廉價的服務(wù)器可靠地存儲大量數(shù)據(jù)。
這是個開源、高級的鍵值存儲。由于在鍵中使用了hash、set、string、sorted set及l(fā)ist,因此Redis也稱作數(shù)據(jù)結(jié)構(gòu)服務(wù)器。這個系統(tǒng)可以幫助你執(zhí)行原子操作,比如說增加hash中的值、集合的交集運算、字符串拼接、差集與并集等。Redis通過內(nèi)存中的數(shù)據(jù)集實現(xiàn)了高性能。此外,該數(shù)據(jù)庫還兼容于大多數(shù)編程語言。
Riak是最為強大的分布式數(shù)據(jù)庫之一,它提供了輕松且可預(yù)測的伸縮能力,向用戶提供了快速測試、原型與應(yīng)用部署能力,從而簡化應(yīng)用的開發(fā)過程。
Neo4j是一款NoSQL圖型數(shù)據(jù)庫,具有非常高的性能。它擁有一個健壯且成熟的系統(tǒng)的所有特性,向程序員提供了靈活且面向?qū)ο蟮木W(wǎng)絡(luò)結(jié)構(gòu),可以讓開發(fā)者充分享受到擁有完整事務(wù)特性的數(shù)據(jù)庫的所有好處。相較于RDBMS,Neo4j還對某些應(yīng)用提供了不少性能改進。
HBase是一款可伸縮、分布式的大數(shù)據(jù)存儲。它可以用在數(shù)據(jù)的實時與隨機訪問的場景下。HBase擁有模塊化與線性的可伸縮性,并且能夠保證讀寫的嚴(yán)格一致性。HBase提供了一個Java API,可以實現(xiàn)輕松的客戶端訪問;提供了可配置且自動化的表分區(qū)功能;還有Bloom過濾器以及block緩存等特性。
雖然Couchbase是CouchDB的派生,不過它已經(jīng)成為了一款功能完善的數(shù)據(jù)庫產(chǎn)品。它向文檔數(shù)據(jù)庫轉(zhuǎn)移的趨勢會讓MongoDB感到壓力。每個節(jié)點上它都是多線程的,這是個非常主要的可伸縮性優(yōu)勢,特別是當(dāng)托管在自定義或是Bare-Metal硬件上時更是如此。借助于一些非常棒的集成特性,諸如與Hadoop的集成,Couchbase對于數(shù)據(jù)存儲來說是個非常不錯的選擇。
這是個分布式的鍵值存儲系統(tǒng),我們不應(yīng)該將其與緩存解決方案搞混;相反,它是個持久化存儲引擎,用于數(shù)據(jù)存儲并以非常快速且可靠的方式檢索數(shù)據(jù)。它遵循memcache協(xié)議。其存儲后端用于Berkeley DB中,支持諸如復(fù)制與事務(wù)等特性。
RAVENDB是第二代開源數(shù)據(jù)庫,它面向文檔存儲并且無模式,這樣就可以輕松將對象存儲到其中了。它提供了非常靈活且快速的查詢,通過對復(fù)制、多租與分片提供開箱即用的支持使得我們可以非常輕松地實現(xiàn)伸縮功能。它對ACID事務(wù)提供了完整的支持,同時又能保證數(shù)據(jù)的安全性。除了高性能之外,它還通過bundle提供了輕松的可擴展性。
這是個自動復(fù)制的分布式存儲系統(tǒng)。它提供了自動化的數(shù)據(jù)分區(qū)功能,透明的服務(wù)器失敗處理、可插拔的序列化功能、獨立的節(jié)點、數(shù)據(jù)版本化以及跨越各種數(shù)據(jù)中心的數(shù)據(jù)分發(fā)功能。
各位讀者,不知在你的項目中曾經(jīng)、現(xiàn)在或是未來使用了哪些NoSQL數(shù)據(jù)庫。現(xiàn)今的NoSQL世界紛繁復(fù)雜,NoSQL數(shù)據(jù)庫也多如牛毛,而且有一些數(shù)據(jù)庫提供了相似的特性,本文所列出的只是其中比較有代表性的12款NoSQL產(chǎn)品。你是否使用過他們呢?是否使用了本文沒有介紹的產(chǎn)品呢?他們有哪些特性打動了你,讓你決定使用他們呢?非常歡迎將你的經(jīng)歷與看法與我們一起分享。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com