风凌天下,盗墓笔记全集,盗墓笔记小说txt下载

主頁 > 知識庫 > mongoDB中聚合函數(shù)java處理示例詳解

mongoDB中聚合函數(shù)java處理示例詳解

1.問題

最近在做項目的時候碰到一個對mongoDB的數(shù)據(jù)處理，從MongoDB中拿到內嵌文檔的時間排序的list。

一開始考慮到直接對mongoDB中的屬性排序，后面發(fā)現(xiàn)屬性存在內嵌文檔中，所以處理中需要用到聚合函數(shù)。

思考

（key）解決這個問題的過程讓我學到很多，發(fā)現(xiàn)自己在解決一個問題不僅查找問題的姿勢不對，浪費太多時間。而且在碰到問題之后，應該多看看解決辦法，甚至解決了之后要去思考問題，回顧問題。而不是像以前一樣，解決問題了就萬事大吉，拋之腦后。

2.解決

需要對document中的一個tweet_list 集合中的一個屬性 timestamp_ms進行排序。組內排序

使用聚合框架，通過match，unwind，sort等不同的組件創(chuàng)建一個管道。

類似mysql中的多層嵌套子查詢。

mongoDB中js代碼

db.text.aggregate(
 // Initial document match (uses index, if a suitable one is available)
 [
 { $match: {
  _id : ObjectId("5ca95b4bfb60ec43b5dd0db5")
 }},

 // Expand the scores array into a stream of documents
 { $unwind: '$tweet_list' },
  
  { $match: {
   'tweet_list.timestamp_ms': '1451841845660'
  }},

 // Sort in descending order
 { $sort: {
  'tweet_list.timestamp_ms': 1
 }}
 ]
)

java實現(xiàn)此聚合函數(shù)

java中的Aggregation類，查詢條件的順序決定結果。

Aggregation agg = Aggregation.newAggregation(
  Aggregation.match(Criteria.where("_id").is(id)),
  Aggregation.unwind("tweet_list"),
  Aggregation.sort(Sort.Direction.ASC,"tweet_list.timestamp_ms"),
  Aggregation.project("tweet_list.timestamp_ms","tweet_list.text","tweet_list.created_at")

);
AggregationResultsJSONObject> results = mongoTemplate.aggregate(agg, "text", JSONObject.class);
//System.out.println("results"+results.getRawResults()); //獲取到的結果是document
//String res = results.getRawResults();
String json = com.mongodb.util.JSON.serialize(results.getRawResults());
System.out.println("JSON serialized Document: " + json);
JSONObject jso= JSON.parseObject(json);
JSONArray resultss=jso.getJSONArray("results");
System.out.println(resultss);

3.擴展

管道pipeline

以下的管道操作符可以按照任意順序組合在一起使用。每個操作符都會接受一連串文檔，對這些文檔做了類型轉換后，將轉換后的文檔作為結果傳遞給下一個操作符。直到最后一個管道操作符，將結果返回給客戶端。

篩選match

盡可能將帥選放在管道的前部。兩個原因：

1.先過濾掉不需要的文檔，減少管道的工作量。

2.如果在project和group之前執(zhí)行match，查詢可以用索引。

3.不能在match中使用地理空間操作符

投射project

類似select操作?？梢杂霉艿辣磉_式，數(shù)學表達式，日期表達式，字符表達式，邏輯表達式等。

分組group

跟mysql中的分組比較像

排序sort

1 升序 -1 降序

限制limit

限制結果條數(shù)

跳過skip

丟棄結果中的前n個文檔

拆分unwind

把數(shù)組中的每個值拆分為單獨的文檔，例如此問題中需要對一個document中的tweetlist進行排序，可以使用unwind把tweetlist中的不同map拆分成不同的文檔。

結果返回

文檔

MapReduce

如果聚合框架中查詢語言不能不表達，需要用到MapReduce。

使用：把問題拆分為多個小問題，把各個小問題發(fā)送到不同的機器上，每臺機器只負責完成一部分的工作，完成之后，再把零碎的解決方案合并。

步驟：

1.映射map：把操作映射到集合中每個文檔

2.洗牌shuffle：按照鍵值分組，并將產生的鍵值組成列表放到對應的鍵中。

3.化簡reduce：把列表中的值化簡成一個單值，值被返回，繼續(xù)shuffle，然后最終每個鍵的列表只有一個值，即最終結果，

應用：

1.找到集合中所有鍵

2.網頁分類

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，謝謝大家對腳本之家的支持。

您可能感興趣的文章:

java操作elasticsearch的案例解析
利用Java多線程技術導入數(shù)據(jù)到Elasticsearch的方法步驟
JAVA使用ElasticSearch查詢in和not in的實現(xiàn)方式
java 使用ElasticSearch完成百萬級數(shù)據(jù)查詢附近的人功能
使用java操作elasticsearch的具體方法
基于Lucene的Java搜索服務器Elasticsearch安裝使用教程
JAVA mongodb 聚合幾種查詢方式詳解
mongodb聚合_動力節(jié)點Java學院整理
java使用elasticsearch分組進行聚合查詢過程解析

標簽：遼陽興安盟廈門雞西無錫泰安玉林自貢

巨人網絡通訊聲明：本文標題《mongoDB中聚合函數(shù)java處理示例詳解》，本文關鍵詞 mongoDB,中,聚合,函數(shù),java,；如發(fā)現(xiàn)本文內容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡，涉及言論、版權與本站無關。