百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MongoDB+GridFS存储文件方案

wptr33 2025-05-24 17:33 5 浏览

GridFS是MongoDB的一个内置功能, 它提供一组文件操作的API以利用MongoDB存储文件, GridFS的基本原理是将文件保存在两个Collection中, 一个保存文件索引, 一个保存文件内容, 文件内容按一定大小分成若干块,

每一块存在一个Document中, 这种方法不仅提供了文件存储, 还提供了对文件相关的一些附加属性(比如MD5值, 文件名等等)的存储。

http://www.mongodb.org/display/DOCS/GridFS

http://www.mongodb.org/display/DOCS/GridFS+Specification

安装文档

https://docs.mongodb.com/manual/installation/

环境搭建

1.安装mongoDb

vim /etc/yum.repos.d/mongodb.repo

如果是64bit的

[mongodb]

name=MongoDB Repository

baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/x86_64/

gpgcheck=0

enabled=1

32bit的系统:

[mongodb]

name=MongoDB Repository

baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/i686/

gpgcheck=0

enabled=1

然后安装, 会提示Y/N:

yum install mongo-10gen mongo-10gen-server # 此时在安装之前会自动更新yum源 mongodb-org与mongo-10gen 10gen 是 MongoDB 原来的名字, 在源里还留着 10gen 只是为了旧包的维护, 现在就不要用 10gen 了

启动:

service mongod start

查看状态

service mongod status

停止

service mongod stop

2.安装nginx及nginx-gridfs

依赖库、工具

# yum -y install pcre-devel openssl-devel zlib-devel

# yum -y install gcc gcc-c++

下载nginx-gridfs源码

# git clone https://github.com/mdirolf/nginx-gridfs.git

# cd nginx-gridfs

# git checkout v0.8

# git submodule init

# git submodule update

下载nginx源码,编译安装。(高版本支持不好)

# wget http://nginx.org/download/nginx-1.4.7.tar.gz

# tar zxvf nginx-1.4.7.tar.gz

# cd nginx-1.4.7

# ./configure --with-openssl=/usr/include/openssl --add-module=../nginx-gridfs/

# make -j8 && make install –j8

解释: make -j4 作业数是在编译的时候指定主机的CPU个数

../nginx-gridfs/ 配置成对应nginx-gridfs的路径

3. 配置nginx-gridfs

vim /usr/local/nginx/conf/nginx.conf

在 server 节点中添加 location 节点

location /img/ {

gridfs testdb

field=filename

type=string;

mongo 192.168.0.159:27017;

}

location /files/ {

gridfs testdb

field=_id

type=objectid;

mongo 192.168.0.159:27017;

}

这里我们的mongo服务在IP 192.168.0.159。

如果不指定 field, 默认为 MongoDB 的自增ID, 且type为int

配置参数介绍:

gridfs:nginx识别插件的关键字

testdb:db名

[root_collection]: 选择collection, 如root_collection=blog, mongod就会去找blog.files与blog.chunks两个块, 默认是fs

[field]: 查询字段, 保证mongdb里有这个字段名, 支持_id, filename, 可省略, 默认是_id

[type]: 解释field的数据类型, 支持objectid, int, string, 可省略, 默认是int

[user]: 用户名, 可省略

[pass]: 密码, 可省略

mongo: mongodb url

启动nginx服务

# /usr/local/nginx/sbin/nginx

可能出现:

Nginx [emerg]: bind() to 0.0.0.0:80 failed (98: Address already in use)

这时可用使用命令关闭占用80端口的程序

sudo fuser -k 80/tcp

GridFS使用

MongoDB提供了一个命令行工具mongofiles可以来处理GridFS, 在bin目录下。

列出所有文件:

mongofiles list

上传一个文件:

mongofiles put xxx.txt

下载一个文件:

mongofiles get xxx.txt

查找文件:

mongofiles search xxx //会查找所有文件名中包含“xxx”的文件

mongofiles list xxx //会查找所有文件名以“xxx”为前缀的文件

参数说明:

–d 指定数据库, 默认是fs, Mongofiles list –d testGridfs

-u –p 指定用户名, 密码

-h 指定主机

-port 指定主机端口

-c 指定集合名, 默认是fs

-t 指定文件的MIME类型, 默认会忽略

使用MongoVUE来查看,管理GridFS

MongoVUE地址:http://www.mongovue.com/

MongoVUE是个免费软件, 但超过15天后功能受限。可以通过删除以下注册表项来解除限制:

[HKEY_CURRENT_USER\Software\Classes\CLSID\{B1159E65-821C3-21C5-CE21-34A484D54444}\4FF78130]

把这个项下的值全删掉就可以了。

<?php

// 初始化gridfs

$conn = new Mongo(); // 连接MongoDB

$db = $conn->photos; // 选择数据库

$collection = $db->getGridFS(); // 取得gridfs对象

// gridfs有三种方式存储文件

// 第一种直接存储文件

$id = $collection->storeFile("./logo.png");

// 第二种存储文件二进制流

$data = file_get_contents("./logo.png");

$id = $collection->storeBytes($data,array("param" => '附加参数将随图片一起存入'));

// 第三种保存直接表单提交的文件$_FILES

$id = $collection->storeUpload('upfile');

// 相当于

$id = $collection->storeFile($_FILES['upfile']['tmp_name']);

//--------------以上是保存图片--下面开始读取图片----------------

// 保存成功后返回$id = md5字符串

$logo = $collection->findOne(array('_id'=>$id)); // 以_id为索引取得文件

header('Content-type: image/png'); // 输出图片头

echo $logo ->getBytes(); // 输出数据流

?>

特别备注:

通过 $id = $collection->storeFile($_FILES['upfile']['tmp_name']); 产生的ID, 是MongoDB的 ID对象, 而不是一个 字符串! 如以下格式:

{

"_id": ObjectId("525418525ba8a18c1b000001"),

"filename": "D:\\php\\xampp\\tmp\\php8116.tmp",

"uploadDate": ISODate("2013-10-08T14:36:02.0Z"),

"length": NumberInt(55862),

"chunkSize": NumberInt(262144),

"md5": "a6f19f3434f0b36bb2611cd4c6d82b35"

}

不过, 我们可以通过 $id = strval($id), 把上述 ID对象字符串化, 如可得到上述的 525418525ba8a18c1b000001 值, 再把这个值存到MySQL数据库中, 到时候可通过这个字符串ID 作为条件, 找到相应的MongoDB资源。

参考代码如下:

$conn = new Mongo(C('127.0.0.1:27017')); //如果设置了密码自己配置DSN

$db=$conn->selectDB('edu_sns'); // 选择数据库

$collection = $db->getGridFS('zk_attach'); // 选择集合,相等于选择数据表

$id=$_GET['id'];

$object=$collection->findOne(array('_id'=>new MongoId($id)));

header('Content-type: image/png');

echo $object->getBytes();

完整流程

1、前端上传文件html index.html

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Mongo Gridfs</title>
</head>
<body>
<form action="upload.php" method="post" enctype="multipart/form-data">
<label for="upfile" >上传图片</label>
<input type="file" id="upfile" name="upfile" />
<input type="submit" />
</form>
</body>
</html>

2、上传文件进入MongoDB数据库并返回图片的索引ID upload.php

<?php
//上传图片到
header("Content-type:text/html;charset=utf-8");
// 连接Mongo并初始化GFS
// 数据库命名 picDB;集合命名pic_userid
$conn = new MongoClient();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
// 上传图片
if(isset($_FILES['upfile'])){
$id = $collection->storeUpload('upfile');
$id = strval($id);
echo "<p>图片路径为:<font color=red>http://{$_SERVER['HTTP_HOST']}/image.php?id={$id}</font></p>";
}
?>

3、根据图片ID直接从MongoDB里面获取图片资源并显示 image.php

<?php
// 根据ID索引值将图片资源取出来,即图片二进制数据
$conn = new Mongo();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
$id = $_GET['id'];
$object = $collection->findOne(array('_id' => new MongoId($id)));
header('Content-type:image/jpg');
echo $object->getBytes();
?>

在upload.php里面万一根据ID无法取出数据! 应该做出提示。

在image.php里面应该添加异常处理, 如果取出的数据格式不是image而是其他格式! 要提前判断type。

最后, 要在MongoDB的使用中添加授权使用! 因为mongo默认是非授权使用的, 也就是访问数据库时不需要提供用户名和密码。

参考类库:

https://github.com/crodas/MongoFS

相关推荐

每天一个AI姬,AMD核显用户有福了,AI绘画打破 NVIDIA 显卡垄断

使用StableDiffusion进行AI绘画,并不一定只能使用NVIDIA英伟达显卡,甚至,也不一定只能使用独立显卡。今天我们使用AMD6800H核显,并安装了StableDif...

NETworkManager:功能强大的网络管理与问题排除工具

关于NETworkManagerNETworkManager是一款功能强大的网络管理与问题排除工具,该工具完全开源,可以帮助广大研究人员轻松管理目标网络系统并排除网络疑难问题。该工具使用远程桌面、Po...

AMD也能深度学习+免费AI绘画:StableDiffusion+ROCm部署教程!

某国政客扇扇嘴皮子,CN玩硬件和深度学习的圈子里就掀起了一场风暴,这就是著名的嘴皮子效应(误)。没了高性能计算的A100H100倒也能理解,但是美利坚这波把RTX4090禁售了就让人无语了,所以不少做...

windows 下编译 python_rtmpstream

最近在研究数字人,看了大咖的项目(https://github.com/lipku/metahuman-stream),尝试编译此项目的依赖项目python_rtmpstream(https://gi...

如何使用 Python 操作 Git 代码?GitPython 入门介绍

花下猫语:今天,我在查阅如何用Python操作Gitlab的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作Git的方法,后续有机会的话,再陆续分享之~~作者:匿蟒...

网上看了不少,终于把ZlmediaKit流媒体框架搭建起来啦

你都站在2023年代了,视频通话、视频直播、视频会议、视频监控就是风口浪尖上的猪师兄,只要你学那么一丁点,拿个高薪的工作不过分吧!我也是半瓶子晃荡的,所以路人呀,共学习,同进步!本篇开始,只讲在Lin...

MacDown:一款 macOS 的强大 Markdown 编辑器

大家好,很高兴又见面了,我是"...

ZLMediaKit安装配置和推拉流

一、ZLMediaKit库简介ZLMediaKit是一个基于...

大神赞过的:学习 WebAssembly 汇编语言程序设计

文/阿里淘系F(x)Team-旭伦随着前端页面变得越来越复杂,javascript的性能问题一再被诟病。而Javascript设计时就不是为了性能优化设计的,这使得浏览器上可以运行的本地语言一...

【Docker】部署WVP视频监控平台

回来Docker系列,今天将会跟大家分享一则关于开源WVP视频监控平台的搭建。先说结论吧,一开始按照网上说的一步一步搭建没有搭建成功,不知道是版本太旧还是我这边机器有问题,尝试了好几个不同方式的搭建都...

MongoDB+GridFS存储文件方案

GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文...

【开源】强大、创新且直观的 EDA套件

今天分享的LibrePCB是...

Ollama如何制作自己的大模型?

背景Llama3发布了,这次用了...

Ollama使用指南【超全版】

一、Ollama快速入门Ollama是一个用于在本地运行大型语言模型的工具,下面将介绍如何在不同操作系统上安装和使用Ollama。官网:https://ollama.comGithub:http...

基于区块链的价值共享互联网即时通讯应用平台源码免费分享

——————关注转发之后私信回复【源码】即可免费获取到本项目所有源码基于区块链的价值共享互联网即时通讯应用平台,是一个去中心化的任何人都可以使用的通讯网络,是一款基于区块链的价值共享互联网即时通讯AP...