百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MongoDB+GridFS存储文件方案

wptr33 2025-05-24 17:33 35 浏览

GridFS是MongoDB的一个内置功能, 它提供一组文件操作的API以利用MongoDB存储文件, GridFS的基本原理是将文件保存在两个Collection中, 一个保存文件索引, 一个保存文件内容, 文件内容按一定大小分成若干块,

每一块存在一个Document中, 这种方法不仅提供了文件存储, 还提供了对文件相关的一些附加属性(比如MD5值, 文件名等等)的存储。

http://www.mongodb.org/display/DOCS/GridFS

http://www.mongodb.org/display/DOCS/GridFS+Specification

安装文档

https://docs.mongodb.com/manual/installation/

环境搭建

1.安装mongoDb

vim /etc/yum.repos.d/mongodb.repo

如果是64bit的

[mongodb]

name=MongoDB Repository

baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/x86_64/

gpgcheck=0

enabled=1

32bit的系统:

[mongodb]

name=MongoDB Repository

baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/i686/

gpgcheck=0

enabled=1

然后安装, 会提示Y/N:

yum install mongo-10gen mongo-10gen-server # 此时在安装之前会自动更新yum源 mongodb-org与mongo-10gen 10gen 是 MongoDB 原来的名字, 在源里还留着 10gen 只是为了旧包的维护, 现在就不要用 10gen 了

启动:

service mongod start

查看状态

service mongod status

停止

service mongod stop

2.安装nginx及nginx-gridfs

依赖库、工具

# yum -y install pcre-devel openssl-devel zlib-devel

# yum -y install gcc gcc-c++

下载nginx-gridfs源码

# git clone https://github.com/mdirolf/nginx-gridfs.git

# cd nginx-gridfs

# git checkout v0.8

# git submodule init

# git submodule update

下载nginx源码,编译安装。(高版本支持不好)

# wget http://nginx.org/download/nginx-1.4.7.tar.gz

# tar zxvf nginx-1.4.7.tar.gz

# cd nginx-1.4.7

# ./configure --with-openssl=/usr/include/openssl --add-module=../nginx-gridfs/

# make -j8 && make install –j8

解释: make -j4 作业数是在编译的时候指定主机的CPU个数

../nginx-gridfs/ 配置成对应nginx-gridfs的路径

3. 配置nginx-gridfs

vim /usr/local/nginx/conf/nginx.conf

在 server 节点中添加 location 节点

location /img/ {

gridfs testdb

field=filename

type=string;

mongo 192.168.0.159:27017;

}

location /files/ {

gridfs testdb

field=_id

type=objectid;

mongo 192.168.0.159:27017;

}

这里我们的mongo服务在IP 192.168.0.159。

如果不指定 field, 默认为 MongoDB 的自增ID, 且type为int

配置参数介绍:

gridfs:nginx识别插件的关键字

testdb:db名

[root_collection]: 选择collection, 如root_collection=blog, mongod就会去找blog.files与blog.chunks两个块, 默认是fs

[field]: 查询字段, 保证mongdb里有这个字段名, 支持_id, filename, 可省略, 默认是_id

[type]: 解释field的数据类型, 支持objectid, int, string, 可省略, 默认是int

[user]: 用户名, 可省略

[pass]: 密码, 可省略

mongo: mongodb url

启动nginx服务

# /usr/local/nginx/sbin/nginx

可能出现:

Nginx [emerg]: bind() to 0.0.0.0:80 failed (98: Address already in use)

这时可用使用命令关闭占用80端口的程序

sudo fuser -k 80/tcp

GridFS使用

MongoDB提供了一个命令行工具mongofiles可以来处理GridFS, 在bin目录下。

列出所有文件:

mongofiles list

上传一个文件:

mongofiles put xxx.txt

下载一个文件:

mongofiles get xxx.txt

查找文件:

mongofiles search xxx //会查找所有文件名中包含“xxx”的文件

mongofiles list xxx //会查找所有文件名以“xxx”为前缀的文件

参数说明:

–d 指定数据库, 默认是fs, Mongofiles list –d testGridfs

-u –p 指定用户名, 密码

-h 指定主机

-port 指定主机端口

-c 指定集合名, 默认是fs

-t 指定文件的MIME类型, 默认会忽略

使用MongoVUE来查看,管理GridFS

MongoVUE地址:http://www.mongovue.com/

MongoVUE是个免费软件, 但超过15天后功能受限。可以通过删除以下注册表项来解除限制:

[HKEY_CURRENT_USER\Software\Classes\CLSID\{B1159E65-821C3-21C5-CE21-34A484D54444}\4FF78130]

把这个项下的值全删掉就可以了。

<?php

// 初始化gridfs

$conn = new Mongo(); // 连接MongoDB

$db = $conn->photos; // 选择数据库

$collection = $db->getGridFS(); // 取得gridfs对象

// gridfs有三种方式存储文件

// 第一种直接存储文件

$id = $collection->storeFile("./logo.png");

// 第二种存储文件二进制流

$data = file_get_contents("./logo.png");

$id = $collection->storeBytes($data,array("param" => '附加参数将随图片一起存入'));

// 第三种保存直接表单提交的文件$_FILES

$id = $collection->storeUpload('upfile');

// 相当于

$id = $collection->storeFile($_FILES['upfile']['tmp_name']);

//--------------以上是保存图片--下面开始读取图片----------------

// 保存成功后返回$id = md5字符串

$logo = $collection->findOne(array('_id'=>$id)); // 以_id为索引取得文件

header('Content-type: image/png'); // 输出图片头

echo $logo ->getBytes(); // 输出数据流

?>

特别备注:

通过 $id = $collection->storeFile($_FILES['upfile']['tmp_name']); 产生的ID, 是MongoDB的 ID对象, 而不是一个 字符串! 如以下格式:

{

"_id": ObjectId("525418525ba8a18c1b000001"),

"filename": "D:\\php\\xampp\\tmp\\php8116.tmp",

"uploadDate": ISODate("2013-10-08T14:36:02.0Z"),

"length": NumberInt(55862),

"chunkSize": NumberInt(262144),

"md5": "a6f19f3434f0b36bb2611cd4c6d82b35"

}

不过, 我们可以通过 $id = strval($id), 把上述 ID对象字符串化, 如可得到上述的 525418525ba8a18c1b000001 值, 再把这个值存到MySQL数据库中, 到时候可通过这个字符串ID 作为条件, 找到相应的MongoDB资源。

参考代码如下:

$conn = new Mongo(C('127.0.0.1:27017')); //如果设置了密码自己配置DSN

$db=$conn->selectDB('edu_sns'); // 选择数据库

$collection = $db->getGridFS('zk_attach'); // 选择集合,相等于选择数据表

$id=$_GET['id'];

$object=$collection->findOne(array('_id'=>new MongoId($id)));

header('Content-type: image/png');

echo $object->getBytes();

完整流程

1、前端上传文件html index.html

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Mongo Gridfs</title>
</head>
<body>
<form action="upload.php" method="post" enctype="multipart/form-data">
<label for="upfile" >上传图片</label>
<input type="file" id="upfile" name="upfile" />
<input type="submit" />
</form>
</body>
</html>

2、上传文件进入MongoDB数据库并返回图片的索引ID upload.php

<?php
//上传图片到
header("Content-type:text/html;charset=utf-8");
// 连接Mongo并初始化GFS
// 数据库命名 picDB;集合命名pic_userid
$conn = new MongoClient();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
// 上传图片
if(isset($_FILES['upfile'])){
$id = $collection->storeUpload('upfile');
$id = strval($id);
echo "<p>图片路径为:<font color=red>http://{$_SERVER['HTTP_HOST']}/image.php?id={$id}</font></p>";
}
?>

3、根据图片ID直接从MongoDB里面获取图片资源并显示 image.php

<?php
// 根据ID索引值将图片资源取出来,即图片二进制数据
$conn = new Mongo();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
$id = $_GET['id'];
$object = $collection->findOne(array('_id' => new MongoId($id)));
header('Content-type:image/jpg');
echo $object->getBytes();
?>

在upload.php里面万一根据ID无法取出数据! 应该做出提示。

在image.php里面应该添加异常处理, 如果取出的数据格式不是image而是其他格式! 要提前判断type。

最后, 要在MongoDB的使用中添加授权使用! 因为mongo默认是非授权使用的, 也就是访问数据库时不需要提供用户名和密码。

参考类库:

https://github.com/crodas/MongoFS

相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...