当前位置：移动技术网 > IT编程>数据库>MongoDB > mongoDB中聚合函数java处理示例详解

mongoDB中聚合函数java处理示例详解

2019年07月18日 | 移动技术网IT编程 | 我要评论

1.问题

最近在做项目的时候碰到一个对mongodb的数据处理，从mongodb中拿到内嵌文档的时间排序的list。

一开始考虑到直接对mongodb中的属性排序，后面发现属性存在内嵌文档中，所以处理中需要用到聚合函数。

思考

（key）解决这个问题的过程让我学到很多，发现自己在解决一个问题不仅查找问题的姿势不对，浪费太多时间。而且在碰到问题之后，应该多看看解决办法，甚至解决了之后要去思考问题，回顾问题。而不是像以前一样，解决问题了就万事大吉，抛之脑后。

2.解决

需要对document中的一个tweet_list 集合中的一个属性 timestamp_ms进行排序。组内排序

使用聚合框架，通过match，unwind，sort等不同的组件创建一个管道。

类似mysql中的多层嵌套子查询。

mongodb中js代码

db.text.aggregate(
 // initial document match (uses index, if a suitable one is available)
 [
 { $match: {
  _id : objectid("5ca95b4bfb60ec43b5dd0db5")
 }},

 // expand the scores array into a stream of documents
 { $unwind: '$tweet_list' },
  
  { $match: {
   'tweet_list.timestamp_ms': '1451841845660'
  }},

 // sort in descending order
 { $sort: {
  'tweet_list.timestamp_ms': 1
 }}
 ]
)

java实现此聚合函数

java中的aggregation类，查询条件的顺序决定结果。

aggregation agg = aggregation.newaggregation(
  aggregation.match(criteria.where("_id").is(id)),
  aggregation.unwind("tweet_list"),
  aggregation.sort(sort.direction.asc,"tweet_list.timestamp_ms"),
  aggregation.project("tweet_list.timestamp_ms","tweet_list.text","tweet_list.created_at")

);
aggregationresults<jsonobject> results = mongotemplate.aggregate(agg, "text", jsonobject.class);
//system.out.println("results"+results.getrawresults()); //获取到的结果是document
//string res = results.getrawresults();
string json = com.mongodb.util.json.serialize(results.getrawresults());
system.out.println("json serialized document: " + json);
jsonobject jso= json.parseobject(json);
jsonarray resultss=jso.getjsonarray("results");
system.out.println(resultss);

3.扩展

管道pipeline

以下的管道操作符可以按照任意顺序组合在一起使用。每个操作符都会接受一连串文档，对这些文档做了类型转换后，将转换后的文档作为结果传递给下一个操作符。直到最后一个管道操作符，将结果返回给客户端。

筛选match

尽可能将帅选放在管道的前部。两个原因：

1.先过滤掉不需要的文档，减少管道的工作量。

2.如果在project和group之前执行match，查询可以用索引。

3.不能在match中使用地理空间操作符

投射project

类似select操作。可以用管道表达式，数学表达式，日期表达式，字符表达式，逻辑表达式等。

分组group

跟mysql中的分组比较像

排序sort

1 升序 -1 降序

限制limit

限制结果条数

跳过skip

丢弃结果中的前n个文档

拆分unwind

把数组中的每个值拆分为单独的文档，例如此问题中需要对一个document中的tweetlist进行排序，可以使用unwind把tweetlist中的不同map拆分成不同的文档。

结果返回

文档

mapreduce

如果聚合框架中查询语言不能不表达，需要用到mapreduce。

使用：把问题拆分为多个小问题，把各个小问题发送到不同的机器上，每台机器只负责完成一部分的工作，完成之后，再把零碎的解决方案合并。

步骤：

1.映射map：把操作映射到集合中每个文档

2.洗牌shuffle：按照键值分组，并将产生的键值组成列表放到对应的键中。

3.化简reduce：把列表中的值化简成一个单值，值被返回，继续shuffle，然后最终每个键的列表只有一个值，即最终结果，

应用：

1.找到集合中所有键

2.网页分类

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对移动技术网的支持。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

三分钟快速搭建分布式高可用的Redis集群

Redis Cluster是Redis在3.0版本正式推出的专用集群方案，有效地解决了Redis分布式方面的需求，让我们一起快速搭建出分布式高可用的Re... [阅读全文]
修复 Mac brew 安装 mongodb 报 Error: No available formula with the name ‘mongodb’ 问题详解

根据 homebrew-brew 官方的解释得知，mongodb 不再是开源的了，并且已经从 homebrew中移除 #43770正是由于 mongodb 的商... [阅读全文]
MongoDB常用数据库命令大全

一、mongodb 数据库常用操作命令1、help查看命令提示helpdb.help();db.yourcoll.help();2、切换/创建数据库use ra... [阅读全文]
28个MongoDB经典面试题详解

mongodb是目前最好的面向文档的免费开源nosql数据库。如果你正准备参加mongodb nosql数据库的技术面试，你最好看看下面的mongodb nos... [阅读全文]
MongoDB 数据库的命名、设计规范详解

mongodb 数据库的命名和设计也有一套规范。只不过，由于用的人不多，目前在业界还没有形成权威的共识，今天根据我个人平时的一些经验，总结了一些规范第一部分，我... [阅读全文]
MongoDB中数据的替换方法实现类Replace()函数功能详解

近日接到一个开发需求，因业务调整，需要dba协助，将mongodb数据库中某集合的进行替换。例如我们需要将集合a中b字段中，有关《美好》的字符替换为《非常美好... [阅读全文]
解决MongoDB占用内存过大频繁死机的方法详解

从mongodb 3.4开始，默认的wiredtiger内部缓存大小是以下两者中的较大者：50％（ram-1 gb），或 256 mb例如，在总共有4gb ra... [阅读全文]
在 Fedora 上安装 MongoDB 服务器的方法教程

mongo（来自 “humongous” —— 巨大的）是一个高性能、开源、无模式的、面向文档的数据库，它是最受欢迎的 nosql 数据库之一。它使用 json... [阅读全文]
mongodb driver使用代码详解

mongodb 是一个基于分布式文件存储的数据库。由 c++ 语言编写。旨在为 web 应用提供可扩展的高性能数据存储解决方案。mongodb 是一个介于关系数... [阅读全文]
MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]

网友评论


验证码：

mongoDB中聚合函数java处理示例详解

2019年07月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论