当前位置：移动技术网 > IT编程>数据库>MongoDB > MongoDB系列教程（八）：GridFS存储详解

MongoDB系列教程（八）：GridFS存储详解

2017年12月08日 | 移动技术网IT编程 | 我要评论

安全证书错误怎么办,人力资源管理形成性考核册答案,楚楚街9.9包邮

gridfs简介

mongodb的文档以bson格式存储，支持二进制的数据类型，当我们把二进制格式的数据直接保存到mongodb的文档中。但是当文件太大时，例如图片和视频等文件，每个文档的长度是有限的，于是mongodb会提供了一种处理大文件的规范--gridfs。

gridfs实现原理

在gridfs数据库中，默认使用fs.chunks 和fs.files来存储文件，其中fs.files集合存放文件的信息，fs.chunks存放文件的数据,一个fs.files集合中的一条记录内容如下，即一个file信息如下所示：

复制代码代码如下:

{   

"_id" : objectid("4f4608844f9b855c6c35e298"),       //唯一id，可以是用户自定义的类型  

"filename" : "cpu.txt",      //文件名  

"length" : 778,      //文件长度  

"chunksize" : 262144,    //chunk的大小  

"uploaddate" : isodate("2012-02-23t09:36:04.593z"), //上传时间  

"md5" : "e2c789b036cfb3b848ae39a24e795ca6",      //文件的md5值  

"contenttype" : "text/plain"     //文件的mime类型  

"meta" : null    //文件的其它信息，默认是没有”meta”这个key，用户可以自己定义为任意bson对象  

}

对应fs.chunks中的chunk（中文意思数据块），如下所示：

复制代码代码如下:

{   

"_id" : objectid("4f4608844f9b855c6c35e299"),    //chunk的id  

"files_id" : objectid("4f4608844f9b855c6c35e298"),  //文件的id，对应fs.files中的对象，相当于fs.files集合的外键  

"n" : 0,     //文件的第几个chunk块，如果文件大于chunksize的话，会被分割成多个chunk块  

"data" : bindata(0,"qgv...")     //文件的二进制数据，这里省略了具体内容  

}

默认大小是256k，所以把文件存入到gridfs过程中，如果文件大于chunksize，则把文件分割多个chunk，再把这些chunk保存在fs.chunks中，最后再把文件信息存入fs.files中。

在读取文件的时候，先根据查询的条件，在fs.files中找到一个合适的记录，得到“_id”的值，再根据这个值到fs.funks中查找所有files_id 为 _id 的chunk，并按照“n”排序，最后依次读取chunk中的“data”对象的内容，还原成原来的文件。

注：
1、gridfs不自动处理md5相同的文件，对于md5相同的文件，如果想在gridfs中只有一个存储，要用户处理，md5值的计算由客户端完成。
2、因为gridfs在上传文件过程中是先把文件数据保存到fs.chunks,最后再把文件的信息保存到fs.files中，所以如果上传文件过程中失败，有可能在fs.chunks中出现垃圾数据，这些垃圾数据，可以定期清理掉。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

MongoDB常用数据库命令大全

一、mongodb 数据库常用操作命令1、help查看命令提示helpdb.help();db.yourcoll.help();2、切换/创建数据库use ra... [阅读全文]
28个MongoDB经典面试题详解

mongodb是目前最好的面向文档的免费开源nosql数据库。如果你正准备参加mongodb nosql数据库的技术面试，你最好看看下面的mongodb nos... [阅读全文]
MongoDB 数据库的命名、设计规范详解

mongodb 数据库的命名和设计也有一套规范。只不过，由于用的人不多，目前在业界还没有形成权威的共识，今天根据我个人平时的一些经验，总结了一些规范第一部分，我... [阅读全文]
MongoDB中数据的替换方法实现类Replace()函数功能详解

近日接到一个开发需求，因业务调整，需要dba协助，将mongodb数据库中某集合的进行替换。例如我们需要将集合a中b字段中，有关《美好》的字符替换为《非常美好... [阅读全文]
解决MongoDB占用内存过大频繁死机的方法详解

从mongodb 3.4开始，默认的wiredtiger内部缓存大小是以下两者中的较大者：50％（ram-1 gb），或 256 mb例如，在总共有4gb ra... [阅读全文]
在 Fedora 上安装 MongoDB 服务器的方法教程

mongo（来自 “humongous” —— 巨大的）是一个高性能、开源、无模式的、面向文档的数据库，它是最受欢迎的 nosql 数据库之一。它使用 json... [阅读全文]
mongodb driver使用代码详解

mongodb 是一个基于分布式文件存储的数据库。由 c++ 语言编写。旨在为 web 应用提供可扩展的高性能数据存储解决方案。mongodb 是一个介于关系数... [阅读全文]
MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]
Redis 字符串 SDS

SDS 简单动态字符串。 SDS的结构： struct sdshdr{ int len;//记录BUF数组中已使用字节的数量，等于SDS所八寸字符串的... [阅读全文]
理解Redis持久化，RDB持久化和AOF持久化的不同处理方式

理解和掌握Redis的持久机制，对于Redis的日常开发和运维都有很大帮助，也是在大厂面试经常被问到的知识点。 ... [阅读全文]

网友评论


验证码：

MongoDB系列教程（八）：GridFS存储详解

2017年12月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论