[置頂]如何在Mongodb集合中統計去重之后的數據
來源:懂視網
責編:小采
時間:2020-11-09 16:29:11
[置頂]如何在Mongodb集合中統計去重之后的數據
[置頂]如何在Mongodb集合中統計去重之后的數據:比方說我們有個Mongodb集合, 以這個簡單的集合為例,我們需要集合中包含多少不同的手機號碼,首先想到的應該就是使用distinct關鍵字, db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼,那么可以省略后面的length屬性,因
導讀[置頂]如何在Mongodb集合中統計去重之后的數據:比方說我們有個Mongodb集合, 以這個簡單的集合為例,我們需要集合中包含多少不同的手機號碼,首先想到的應該就是使用distinct關鍵字, db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼,那么可以省略后面的length屬性,因
比方說我們有個Mongodb集合, 以這個簡單的集合為例,我們需要集合中包含多少不同的手機號碼,首先想到的應該就是使用distinct關鍵字, db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼,那么可以省略后面的length屬性,因為 db
比方說我們有個Mongodb集合,

以這個簡單的集合為例,我們需要集合中包含多少不同的手機號碼,首先想到的應該就是使用distinct關鍵字,
db.tokencaller.distinct('Caller').length
如果想查看具體的而不同的手機號碼,那么可以省略后面的length屬性,因為db.tokencaller.distinct('Caller')返回的是由所有去重手機號碼組成的數組。
但是,這種方式對于所有情況都是滿足的嘛?并不如此,如果要統計的集合記錄數較大,如千萬級別的,那么在這么統計的時候往往會報10044錯誤,提示信息“exception : distinct too big , 16mb cap”. 后面我們將通過其他方式進行解決。
另外一種方式可以使用runCommand結合distinct進行使用,
db.runCommand({"distinct":"tokencaller","key":"Caller"})
可見在values上顯示了去重之后的手機號碼,,看結果是一個Json格式的,于是嘗試了下看看能不能取出values的大小,因為如果對于大數據量的集合來說,直接顯示去重的號碼明顯不合適,于是嘗試了下面的寫法:
發現是可以的,于是對大數據量使用了這種方式看看是否能取出結果,發現不存在length屬性,想了想應該跟mongodb的客戶端版本有關系吧,還待驗證!!!
兩種方式都不行,于是試了下mapReduce方式,具體如下:
然后我們會發現,他會將查詢出來的結果輸出到一個稱為“callerstatis”的結合,如下所示:
然后使用db.callerstatis.count()就可以知道有多少不同的手機號碼了。
使用這種方式,我們同樣在大數據量的集合上試了一下,可惜還是失敗了!!!!(桑心T_T),如果有誰有好的方法,麻煩也告訴我一下,小的感激不盡啊^_^
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com
[置頂]如何在Mongodb集合中統計去重之后的數據
[置頂]如何在Mongodb集合中統計去重之后的數據:比方說我們有個Mongodb集合, 以這個簡單的集合為例,我們需要集合中包含多少不同的手機號碼,首先想到的應該就是使用distinct關鍵字, db.tokencaller.distinct('Caller').length 如果想查看具體的而不同的手機號碼,那么可以省略后面的length屬性,因