当前位置：移动技术网 > IT编程>数据库>MongoDB > MongoDB聚合(aggregate)

MongoDB聚合(aggregate)

2020年04月04日 | 移动技术网IT编程 | 我要评论

一、基础

1、什么是聚合？

聚合是基于数据处理的聚合管道，每个文档通过一个有多个阶段(stage)组成的管道
可以对每个阶段的管道进行分组、过滤等功能，然后经过一系列的处理，输出相应的结果

db.集合名称.aggregate({管道: {表达式}})

有点像django中orm聚合的语法

2、常用管道

$group： 将集合中的文档分组，用于统计结果
$match: 过滤数据，只输出符合条件的文档
$project: 修改输入文档的结构，如重命名、增加、删除字段、创建计算结果

$sort: 将输入文档排序后输出
$limit: 限制聚合管道返回的文档数
$skip: 跳过指定数量的文档，并返回余下的文档
$unwind(): 将列表(数组)类型的字段进行拆分

3、常用表达式

处理输入文档，并输出
语法： 表达式：'$列名'
常用表达式
$sum: 计算总和， $sum:1 表示以一倍计数
$avg: 计数平均值
$min: 获取最小值
$max: 获取最大值
$push: 在结果文档中插入值到一个数组中
$first: 根据资源文档的排序获取第一个文档数据
$last: 根据资源文档的排序获取最后一个文档数据

二、常用管道用法

1、$group

作用： 将集合中的文档分组，可用于统计结果
_id表示分组的依据，使用某个字段的格式为'$字段'
格式
db.集合名称.aggregate({$group:{ _id: '$字段', 自定义字段: {表达式: '$字段'}}})

db.stu.aggregate({$group: {_id: '$gender'}})
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}}})
db.stu.aggregate({$group: {_id: '$gender', avg_age: {$avg: '$age'}}})
db.stu.aggregate({$group: {_id: '$hometown', min_age: {$min: '$age'}, count: {$sum: 1}}})

注意： 
    _id后面的值，表示按照什么分组，格式'$字段'
    count, avg_count是自定义的字段
    表达式的值是'$字段'

group by null

将集合中所用文档分为一组，即该集合就是一个组
# 求学生的总量和平均年龄
db.stu.aggregate({$group: {_id: null, count:{$sum: 1}, avg_age:{$avg: '$age'}}})

补充

# 插入数据

db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "b"})
db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "c"})
db.test.insert({country: "china", province: "bj", userid: "da"})
db.test.insert({country: "china", province: "bj", userid: "fa"})

# 1.去重
能够同时按照多个键进行分组，若文档中的每个字段都进行分组，那么可以实现去重的功能
db.test.aggregate({$group: {_id: {country: '$country', province: '$province'}}})
# 2.取字典嵌套的字典中的值 
_id: {contry: '$_id.country'}
例子
db.test.aggregate(
{$group: {_id: {country: '$country', province: '$province', userid: '$userid'}}},  
{$group: {_id: {country: '$_id.country', province: '$_id.province'}, count: {$sum: 1}}}, 
{$project: {country: '$_id.country', province: '$_id.province', count: '$count', _id: 0}}
)

2、$project

作用：修改输入文档的结构，如重命名、增加（显示）、删除(隐藏)字段，创建计算结果
1.显示和隐藏
格式： 
db.集合名称.aggregate({$project: {_id: 0, 字段:1}})
值为0，是隐藏
值为1，是显示
示例
db.stu.aggregate({$project: {_id: 0, name: 1, hometown: 1, age: 1, gender: 1}})
注意： 显示、隐藏字段和投影差不多
2.重命名
例子
db.stu.aggregate({$group: {_id: '$gender', count: {$sum: 1}, avg: {$avg: '$age'}}}, {$project: {_id: 0,gender: '$_id', counter: '$count', avg_age: '$avg'}})
注意： 
重命名字段格式 {新的字段名: '$旧的字段名称'}
管道符之间用逗号隔

3、$match

作用： 用于过滤数据，只输出符合条件的文档
注意： match是管道命令，能将结果交给下一个管道，find不可以
例子
db.stu.aggregate({$match: {age: {$lte: 18}}})
# 过滤->分组->重命名、显示
db.stu.aggregate({$match: {age: {$lte: 18}}}, {$group: {_id: '$gender', count: {$sum: 1}}}, {$project: {gender: '$_id', _id: 0, count: 1}})

4、$limit和$skip

$limit
限制聚合管道返回的文档数
例子
db.stu.aggregate({$limit: 2})

$skip
跳过指定数量的聚合管道文档。并返回剩下的文档
例子
db.stu.aggregate({$skip: 2})
db.stu.aggregate({$limit: 2}, {$skip: 3})
注意顺序：先写skip，再写limit

5、$unwind

# unwind 解开，松开
作用： 将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值
格式：
db.集合名称.aggregate({$unwind: '$字段名称'})
例子
db.t2.insert({_id: 1, item:'t-shirt', size: ['s', 'm', 'l']})
db.t2.aggregate({$unwind: '$size'})
结果：
{ "_id" : 1, "item" : "t-shirt", "size" : "s" }
{ "_id" : 1, "item" : "t-shirt", "size" : "m" }
{ "_id" : 1, "item" : "t-shirt", "size" : "l" }

# 补充

db.集合名称.aggregate({
    $unwind: {
        path: '$字段名称',
        preservenullandemptyarrays: <boolean>  # 防止数据丢失
    }
})
属性preservenullandemptyarrays值
为false表示抛弃属性值为空的文档
为true表示保留属性值为空的文档

例子
db.t3.aggregate({$unwind: {path: '$size', preservenullandemptyarrays: false}})

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

MongoDB常用数据库命令大全

一、mongodb 数据库常用操作命令1、help查看命令提示helpdb.help();db.yourcoll.help();2、切换/创建数据库use ra... [阅读全文]
28个MongoDB经典面试题详解

mongodb是目前最好的面向文档的免费开源nosql数据库。如果你正准备参加mongodb nosql数据库的技术面试，你最好看看下面的mongodb nos... [阅读全文]
MongoDB 数据库的命名、设计规范详解

mongodb 数据库的命名和设计也有一套规范。只不过，由于用的人不多，目前在业界还没有形成权威的共识，今天根据我个人平时的一些经验，总结了一些规范第一部分，我... [阅读全文]
MongoDB中数据的替换方法实现类Replace()函数功能详解

近日接到一个开发需求，因业务调整，需要dba协助，将mongodb数据库中某集合的进行替换。例如我们需要将集合a中b字段中，有关《美好》的字符替换为《非常美好... [阅读全文]
解决MongoDB占用内存过大频繁死机的方法详解

从mongodb 3.4开始，默认的wiredtiger内部缓存大小是以下两者中的较大者：50％（ram-1 gb），或 256 mb例如，在总共有4gb ra... [阅读全文]
在 Fedora 上安装 MongoDB 服务器的方法教程

mongo（来自 “humongous” —— 巨大的）是一个高性能、开源、无模式的、面向文档的数据库，它是最受欢迎的 nosql 数据库之一。它使用 json... [阅读全文]
mongodb driver使用代码详解

mongodb 是一个基于分布式文件存储的数据库。由 c++ 语言编写。旨在为 web 应用提供可扩展的高性能数据存储解决方案。mongodb 是一个介于关系数... [阅读全文]
MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]
Redis 字符串 SDS

SDS 简单动态字符串。 SDS的结构： struct sdshdr{ int len;//记录BUF数组中已使用字节的数量，等于SDS所八寸字符串的... [阅读全文]
理解Redis持久化，RDB持久化和AOF持久化的不同处理方式

理解和掌握Redis的持久机制，对于Redis的日常开发和运维都有很大帮助，也是在大厂面试经常被问到的知识点。 ... [阅读全文]

网友评论


验证码：

MongoDB聚合(aggregate)

2020年04月04日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论