[置頂]如何在Mongodb集合中統計去重之后的數據

來源：懂視網責編：小采時間：2020-11-09 16:29:11

[置頂]如何在Mongodb集合中統計去重之后的數據

[置頂]如何在Mongodb集合中統計去重之后的數據:比方說我們有個Mongodb集合，以這個簡單的集合為例，我們需要集合中包含多少不同的手機號碼，首先想到的應該就是使用distinct關鍵字， db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼，那么可以省略后面的length屬性，因

推薦度：

點擊下載本文 文檔為doc格式

導讀[置頂]如何在Mongodb集合中統計去重之后的數據:比方說我們有個Mongodb集合，以這個簡單的集合為例，我們需要集合中包含多少不同的手機號碼，首先想到的應該就是使用distinct關鍵字， db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼，那么可以省略后面的length屬性，因

比方說我們有個Mongodb集合，以這個簡單的集合為例，我們需要集合中包含多少不同的手機號碼，首先想到的應該就是使用distinct關鍵字， db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼，那么可以省略后面的length屬性，因為 db

比方說我們有個Mongodb集合，

以這個簡單的集合為例，我們需要集合中包含多少不同的手機號碼，首先想到的應該就是使用distinct關鍵字，
db.tokencaller.distinct('Caller').length
如果想查看具體的而不同的手機號碼，那么可以省略后面的length屬性，因為db.tokencaller.distinct('Caller')返回的是由所有去重手機號碼組成的數組。

但是，這種方式對于所有情況都是滿足的嘛？并不如此，如果要統計的集合記錄數較大，如千萬級別的，那么在這么統計的時候往往會報10044錯誤，提示信息“exception : distinct too big , 16mb cap”. 后面我們將通過其他方式進行解決。
另外一種方式可以使用runCommand結合distinct進行使用，
db.runCommand({"distinct":"tokencaller","key":"Caller"})

可見在values上顯示了去重之后的手機號碼，，看結果是一個Json格式的，于是嘗試了下看看能不能取出values的大小，因為如果對于大數據量的集合來說，直接顯示去重的號碼明顯不合適，于是嘗試了下面的寫法：

發現是可以的，于是對大數據量使用了這種方式看看是否能取出結果，發現不存在length屬性，想了想應該跟mongodb的客戶端版本有關系吧，還待驗證！！！
兩種方式都不行，于是試了下mapReduce方式，具體如下：

然后我們會發現，他會將查詢出來的結果輸出到一個稱為“callerstatis”的結合，如下所示：

然后使用db.callerstatis.count()就可以知道有多少不同的手機號碼了。
使用這種方式，我們同樣在大數據量的集合上試了一下，可惜還是失敗了！！！！（桑心T_T)，如果有誰有好的方法，麻煩也告訴我一下，小的感激不盡啊^_^

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

[置頂]如何在Mongodb集合中統計去重之后的數據

推薦度：

點擊下載本文 文檔為doc格式

標簽：置頂數據如何

熱門焦點

[置頂]如何在Mongodb集合中統計去重之后的數據

[置頂]如何在Mongodb集合中統計去重之后的數據

[置頂]如何在Mongodb集合中統計去重之后的數據

最新推薦

猜你喜歡

熱門推薦