当前位置: 移动技术网 > IT编程>数据库>DB2 > MongoDB完全使用教程和知识要点

MongoDB完全使用教程和知识要点

2018年09月29日  | 移动技术网IT编程  | 我要评论

mongodb完全教程

基础知识

mongodb简介

mongodb是一个可扩展,开源,表结构自由,用c++语言编写的面向文档的。旨在为web应用提供高性能、高可用性的且易扩展的数据存储解决方案。 mongodb是最像关系数据库的nosql数据库,支持关系数据库的绝大部分查询。mongodb不支持join语句。 mongodb服务端可运行于linux,windows或os x平台,支持32位和64位应用,默认监听端

口是27017。 mongodb内存管理依赖于操作的自动内存管理机制,通过map对数据文件进行内存映射,推荐在64位平台上运行,否则32位模式受虚拟内存地址大小的限制,而且运行时支持的最大文件尺寸也只能为2gb。 mongodb支持日志功能journaling,对数据库的crud操作都会记录在日志文件中(crud操作指,create,read,update,delete增删改查操作)。 mongodb支持副本集和自动分片。 mongodb文档结构和sql结构的对应关系:

sql术语/概念 mongodb术语/概念 解释说明
database database 数据库
table collection 数据库表/集合
row document 数据记录行/文档
column field 数据字段/域
index index 索引
table joins / 表连接,mongodb不支持
primary key primary key 主键,mongodb自动将_id设置为主键

mongodb安装

windows安装

安装

mongodb提供了32位和64位系统的预编译二进制包,可从mongodb官网下载安装,mongodb预编译二进制包下载地址:https://www.mongodb.org/downloads。mongodb2.2 版本后已经

不再支持 windows xp 系统。 版本介绍:

mongodb for windows 64-bit 适合 64 位的 windows server 2008 r2, windows 7 , 及最新版本的 window 系统 mongodb for windows 32-bit 适合 32 位的 window 系统及最新的 windows vista。 32 位系统上 mongodb 的数据库最大为 2gb mongodb for windows 64-bit legacy 适合 64 位的 windows vista, windows server 2003, 及 windows server 2008 根据系统下载对应的 .msi 文件,双击运行,按操作提示安装即可。

启动

创建数据目录,数据目录必须存在,否则启动失败;假设新建目录为d:/mongo_data/db 启动命令:mongod --dbpath=d:/mongo_data/db;如不指定–dbpath,mongodb默认当

前安装盘符下的mongodb/db目录。 将mongodb服务器作为windows服务运行请注意,你必须有管理权限才能运行下面的命令。执行以下命令将mongodb服务器作为windows服务运行:

mongod.exe --bind_ip youripadress --logpath "d:/mongo_data/db/mongodb.log" --logappend
 --dbpath "d:/mongo_data/db" --port yourportnumber --servicename "yourservicename" 
 --servicedisplayname "yourservicename" --install
使用配置文件的方式启动,创建mongod.conf,使用mongod -f mongod.conf运行
# 数据目录
dbpath = d:/mongo_data/db
# 端口
port = 27017
# 是否使用journal日志
journal = true
# 日志路径
logpath = d:/mongo_data/db/logs/mongo_start.log
# 是否开启授权
auth = true

建议使用配置文件的方式。

mongodb后台管理 shell
mongo ip:port/dbname

如不指定ip,端口和dbname,默认链接本机27107的test数据库。

linux安装

安装
1,下载
curl -o https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.6.tgz
2,解压
tar -zxvf mongodb-linux-x86_64-3.0.6.tgz
3,拷贝到指定目录
mv  mongodb-linux-x86_64-3.0.6/ /usr/local/mongodb
启动

启动方式和windows类似,注意调整路径。

几个重要的进程介绍(以windows平台为例,linux类似)

1,mongod

mongod.exe是数据库实例进程,是整个mongodb中最核心部分,负责数据库的创建、删除等各项管理工作,运行在服务器端
为客户端提供监听,相当于mysql中的mysqld进程。使用示例:mongod -f d:/mongo_data/conf/mongod.conf

2,mongo

mongo是一个与mongod进程进行交互的javascript shell进程,它提供了一些交互的接口函数,用于系统管理员对数据库系
统进行管理。使用示例mongo --port 27017 -username xxx -password xxx -authenticationdatabase admin

3,mongodump

mongodump提供了一种从mongod实例上创建bson dump文件的方法,mongorestore则相反,能够利用这些dump文件重建数据库
,常用命令如下:mongodump --port 27017 --db test --out d:/mongo_data/dump

4,mongoexport

mongoexport是一个将mongodb数据库实例中的数据导出来生成json或者csv文件的工具。命令格式如下:mongoexport --port 27017 --db test --out collection mytest --out d:/mongo_data/test.json

5,mongoimport

mongoimport和mongoexport刚好相反,是一个将csv或json文件内容导入到mongodb实例中的工具,常用命令格式:mongoimport --port 50000 --db shop --collecition goods --file d:/mongo_data/goods.csv

6,mongos

mongos是一个在分片中用到的进程,所有应用程序端的查询操作都会先有它分析,然后将查询定位到某一个分片上。它的作用与mongod类似,客户端的mongo与它连接。

7,mongofiles

mongofiles提供了一个操作mongodb分布式文件存储系统的命令行接口,常用命令如下:mongofile --port 50000 --db mydocs --local d:/mongo_data/docs/c++ primer.pdf put c++_primer.pdf

8,mongostat

mongostat提供了一个展示当前正在运行的mongod实例的状态工具。

9,mongotop

mongotop提供一个而分析mongodb实例花在读写数据上的时间的跟踪方法。它提供的统计数据在每一个collection的级别上。

mongodb crud操作

1,插入文档(create)

mongodb使用insert()或者save()向集合插入文档,基本语法:

-- insert会自动创建collection,删除collection可使用db.collection.drop()
db.collection_name.insert(document)

实例:

db.staffinfo.insert({"name":"tdx10274","desc":"very handsome","option":{"age":18,"addr":"wuhan"}})

2,查询操作(read)

语法格式:

db.collection_name.find(document);
-- 美化输出
db.collection_name.find(document).pretty()

和rdbms查询where比较:

操作 格式 范例 rdbms中类似语句
等于 {key:value} db.col.find({“by”:”age”}).pretty() where by = “age”
小于 {key:{lt:value}}|db.col.find({"likes":{lt:50}}).pretty() where likes<50  
小于或等于 {key:{lte:value}}|db.col.find("likes":{lte:50}).pretty() where likes<=50  

类似的有大于(gt),大于或等于(gte),不等于($ne)。
实例:

db.staffinfo.find({"name":"abc"});

3,更新操作(update)

语法格式:

db.collection_name.update(
    ,
    ,
    {
        upsert:,
        mulit:,
        writeconcern:
    }
)

参数说明:
* query : update的查询条件,类似sql update查询内where后面的。
* update : update的对象和一些更新的操作符(如,inc…)等,也可以理解为sql update查询内set后面的
* upsert : 可选,这个参数的意思是,如果不存在update的记录,是否插入objnew,true为插入,默认是false,不插入。
* multi : 可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。
* writeconcern :可选,抛出异常的级别

实例:

db.staffinfo.update({"name":"tdx10274"},{$set:{"desc":"smart and handsome"}})

4,删除操作(delete)

语法格式:

db.collection.remove(
    ,
    {
        justone:,
        writeconcern:
    }
)

实例:

db.staffinfo.remove({"name":"tdx10274"});

mongodb复制集

概述

mongodb复制集实现数据库的冗余备份、故障转移,提高了数据库的可用性和安全性。类似mysql中的备库。

复制集基本结构:

复制集

复制集配置

主从复制

-- 启动主库
monogd --dbpath="../db" -port=27017 --master
-- 启动从库
monogd --dbpath="../db" --port=8888 --slave --source=127.0.0.1:12707 

假设已启动端口为5555的mongod服务,如何添加为从库呢?

mongo 127.0.0.1:5555
use local
db.sources.insert({"host":"127.0.0.1:27017"})
-- 查询确认主从复制是否添加成功
db.sources.find()

副本集

与主从复制的区别:
* 没有特定的主数据库
* 如果主数据库宕机,集群中会推选一个从数据库作为主数据库顶上,具备自动恢复能力
* 集群中包含一个仲裁节点,集群中数据库数目最好为奇数(包含仲裁数据库),方便仲裁
*
配置示例1(假设replset的名称为myrep):

-- mongod实例1,端口2222
mongod --port=2222 --dbpath="../db" --replset myrep/127.0.0.1:3333
-- mongod实例2,端口3333
mongod --port=3333 --dbpath="../db" --replset myrep/127.0.0.1:2222
-- 初始化副本集,mongo 127.0.0.1:2222
db.initiate({"_id":"myrep","members":[{"_id":1,"host":"127.0.0.1:2222"},{"_id":2,"host":"127.0.0.1:3333"}]});
--添加仲裁节点
mongo --port=4444 -dbpath="../db" --repset myrep/127.0.0.1:2222:
-- 只能在primary节点上操作
db.addarb("127.0.0.1:4444") 

仲裁数据节点只参与选举,并没有数据副本。它起到的作用只是当primary节点故障时,能参与到复制集剩下的节点中选出一个新的primary,仲裁节点永远不会变成primary节点。

注册用复制启动成功后,从备库查询报错:not master and slaveok=false。解决办法:从mongo客户端执行 db.getmongo().setslaveok()。

mongodb分片

概述

分片技术是解决mongodb数据量大量增长的需求,存储海量数据。将数据分割存在多个分片上,使得数据库可以存储和处理更多的数据。
副本集主要是提高系统的可用性和安全性,决绝故障转移的问题。每个副本都有完整的数据。

分片的基本结构:
分片

分片配置

假设有2个复制集rs0,rs1,一个配置服务器configdb,一个mongos

复制集rs0

节点配置示例rs0_0.conf,其他节点类似

dbpath = d:/mongo_data/db_rs0/data/rs0_0
logpath = d:/mongo_data/db_rs0/logs/rs0_0.log
journal = true
port = 40000
replset = rs0

启动副本集

mongod -f d:/mongo_data/config_rs0/rs0_0.conf
mongod -f d:/mongo_data/config_rs0/rs0_1.conf
mongod -f d:/mongo_data/config_rs0/rs0_2.conf

初始化副本集

-- 初始化副本集,假设主机名为win7
mongo --port 40000
rs.initiate()
-- 添加副本节点
rs.add("win7:40001")
-- 添加仲裁节点
rs.addarb("win7:40002")

复制集rs1

同上,选择不同的端口和文件目录即可。

配置服务器

配置服务器配置示例(其他副本集节点类似,启动方式参见rs0)

dbpath = d:/mongo_data/db_configs/data/db_config0
logpath = d:/mongo_data/db_configs/logs/db_config0.log
journal = true
port = 40006
configsvr = true

mongos路由服务器

示例配置(cfg_mongos.conf):

logpath = d:/mongo_data/mongos/logs/mongos.log
port = 40009
configdb = win7:40006,win7:40007,win7:40008

启动mongos服务器:

mongos --config d:/mongo_data/mongos/cfg_mongos.conf

添加各个分片到集群:

mongo --port 40009
sh.addshard("rs0/win7:40000,win7:40001")
sh.addshard("rs1/win7:40003,win7:40004")

-- 查看状态
sh.status()

权限控制与监控

权限控制

mongod启动后,默认并没有开启权限认证功能,即使配置文件中指定auth=true。mongod
激活权限控制之后,所有的操作都必须进行权限认证,mongodb采用基于角色的权限控制,一个角色是一组权限的集合,一个权限决定了用户能对数据库进行哪些操作,用户可能具有多个角色。

数据库admin上保存了针对实例上所有数据库的管理用户。常用角色:
* readanydatabase角色:针对所有数据库的只读权限
* readwriteanydatabase角色:针对所有数据的读写权限
* useradminanydatabase角色:针对所有数据库的用户管理权限
* dbadminanydatabase角色:真多所有数据库的管理权限
* root:相当于以上四中角色的组合,权限最大

权限控制示例

针对单个数据库的角色,dbowner相当于单个数据库的管理员
db.createuser(
    {
        user:"test",
        pwd:"123456",
        roles:[{role:"dbowner",db:"staffinfo"}]
    }
)

添加用户完成,在通过mongo --port 27017登陆,无权限执行操作。必须通过权限认证才能正常执行操作。

复制集和集群的权限控制
首先要创建一个最少6个字符的文件,该温江将被部署到复制集中的每一个节点上,文件内容相当于密码,用作复制集各成员间的权限认证。启动时mongod需要加上--keyfile指定密码文件的路径。其他同上。

监控

1,mongostat工具
命令如下:
mongostat --port 50000 -u test -p 123456 --authenticationdatabase admin

返回字段:
* inserts:每秒插入次数
* query:每秒查询次数
* update:每秒更新次数
* delete:每秒删除次数
* flushes:每秒异步刷新到文件次数
* mapped:映射的数据文件大小
* vsize:进程所占的虚拟内存大小
* res:进程时间占用的物理内存大小
* faults:每秒产生的缺页错误次数
* 2,mongotop工具
命令如下:

mongotop --port 50000 -u test -p 123456 --authenticationdatabase admin 5

每隔5秒返回统计数据。
* 3,数据库命令serverstatus

db.serverstatus()

返回字段解释:
* uptime:实例进程已经激活的总时间,单位秒
* localtime:实例所在服务器的当前时间
* totaltime:数据库启动后运行的总时间,单位微妙
* locktime:获得全局锁的总时间,单位微妙
* currentqueue:因为锁引起多谢等待队列数
* readers:等待读锁的操作数
* writers:等待写锁的操作数
* activeclients:链接的激活客户端读写操作的总数
* readers:激活客户端读操作总数
* writers:激活客户端写操作总数
* mem:当前内存使用情况
* bits:目标机器的架构
* resident:当前使用的物理内存总量,单位mb
* virtual:mongod进程印象的虚拟内存大小,单位mb
* supported:系统是否支持可扩展内存
* mapped:映射数据文件所使用的内存大小,单位mb
* mappedwithjournal:映射journaling锁使用的内存大小,单位mb

mongodb工具介绍

adminmongo

数据库管理工具。基于node.js,界面清爽,操作简单。

安装步骤

clone repository: git clone https://github.com/mrvautin/adminmongo.git && cd adminmongo install dependencies: npm install start application: npm start visit https://127.0.0.1:1234 in your browser

使用方法

访问https://127.0.0.1:1234

ycsb

nosql基准测试工具。

安装

编译

下载源码解压 cd ycsb-0.7.0 全数据库绑定编译 mvn clean package 指定mongodb绑定编译 mvn -pl com.yahoo.ycsb:mongodb-binding -am clean package

下载安装版
下载页面 https://github.com/brianfrankcooper/ycsb/releases/tag/0.7.0,解压tar.gz即可。

使用方法(windows下,linux下更简单)

查看帮助
python bin/ycsb -h

测试

load阶段:加载数据
python bin/ycsb load mongodb -threads 100 -s -p workloads/workloada -p mongodb.url=mongodb://mongos:28000/ycsb?w=0 > outputload.txt
run阶段:load完成后,各种场景运行测试
python bin/ycsb run mongodb -threads 100 -s -p workloads/workloada -p mongodb.url=mongodb://mongos:28000/ycsb?w=0 > outputrun.txt

每次load数据前要把上次测试中产生的数据删除,包括各个分片,配置服务器,mongos等的数据。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网