返回顶部
首页 > 资讯 > 数据库 >将MongoDB作为Redis式的内存数据库的使用方法
  • 542
分享到

将MongoDB作为Redis式的内存数据库的使用方法

使用方法内存数据库 2022-06-04 17:06:25 542人浏览 独家记忆
摘要

基本思想 将mongoDB用作内存数据库(in-memory database),也即,根本就不让MonGoDB把数据保存到磁盘中的这种用法,引起了越来越多的人的兴趣。这种用法对于以下应用场合来讲,超实用

基本思想

mongoDB用作内存数据库(in-memory database),也即,根本就不让MonGoDB把数据保存到磁盘中的这种用法,引起了越来越多的人的兴趣。这种用法对于以下应用场合来讲,超实用:

置于慢速RDBMS系统之前的写操作密集型高速缓存 嵌入式系统 无需持久化数据的PCI兼容系统 需要轻量级数据库而且库中数据可以很容易清除掉的单元测试(unit testing)

如果这一切可以实现就真是太优雅了:我们就能够巧妙地在不涉及磁盘操作的情况下利用MongoDB的查询/检索功能。可能你也知道,在99%的情况下,磁盘io(特别是随机IO)是系统的瓶颈,而且,如果你要写入数据的话,磁盘操作是无法避免的。

MongoDB有一个非常酷的设计决策,就是她可以使用内存影射文件(memory-mapped file)来处理对磁盘文件中数据的读写请求。这也就是说,MongoDB并不对RAM和磁盘这两者进行区别对待,只是将文件看作一个巨大的数组,然后按照字节为单位访问其中的数据,剩下的都交由操作系统(OS)去处理!就是这个设计决策,才使得MongoDB可以无需任何修改就能够运行于RAM之中。

实现方法

这一切都是通过使用一种叫做tmpfs的特殊类型文件系统实现的。在linux中它看上去同常规的文件系统(FS)一样,只是它完全位于RAM中(除非其大小超过了RAM的大小,此时它还可以进行swap,这个非常有用!)。我的服务器中有32GB的RAM,下面让我们创建一个16GB的 tmpfs:

# mkdir /ramdata

# mount -t tmpfs -o size=16000M tmpfs /ramdata/

# df

Filesystem           1K-blocks      Used Available Use% Mounted on

/dev/xvde1             5905712   4973924    871792  86% /

none                  15344936         0  15344936   0% /dev/shm

tmpfs                 16384000         0  16384000   0% /ramdata

接下来要用适当的设置启动MongoDB。为了减小浪费的RAM数量,应该把smallfiles和noprealloc设置为true。既然现在是基于RAM的,这么做完全不会降低性能。此时再使用journal就毫无意义了,所以应该把nojournal设置为true。

dbpath=/ramdata

nojournal = true

smallFiles = true

noprealloc = true

MongoDB启动之后,你会发现她运行得非常好,文件系统中的文件也正如期待的那样出现了:

# mongo

MongoDB shell version: 2.3.2

connecting to: test

> db.test.insert({a:1})

> db.test.find()

{ "_id" : ObjectId("51802115eafa5d80b5d2c145"), "a" : 1 }

# ls -l /ramdata/ total 65684 -rw-------. 1 root root 16777216 Apr 30 15:52 local.0 -rw-------. 1 root root 16777216 Apr 30 15:52 local.ns -rwxr-xr-x. 1 root root 5 Apr 30 15:52 mongod.lock -rw-------. 1 root root 16777216 Apr 30 15:52 test.0 -rw-------. 1 root root 16777216 Apr 30 15:52 test.ns drwxr-xr-x. 2 root root 40 Apr 30 15:52 _tmp

现在让我们添加一些数据,证实一下其运行完全正常。我们先创建一个1KB的document,然后将它添加到MongoDB中4百万次:

> str = ""

> aaa = "aaaaaaaaaa" aaaaaaaaaa > for (var i = 0; i < 100; ++i) { str += aaa; }

> for (var i = 0; i < 4000000; ++i) { db.foo.insert({a: Math.random(), s: str});} > db.foo.stats() { "ns" : "test.foo", "count" : 4000000, "size" : 4544000160, "avgObjsize" : 1136.00004, "storageSize" : 5030768544, "numExtents" : 26, "nindexes" : 1, "lastExtentSize" : 536600560, "paddingFactor" : 1, "systemFlags" : 1, "userFlags" : 0, "totalIndexSize" : 129794000, "indexSizes" : { "_id_" : 129794000 }, "ok" : 1 }


可以看出,其中的document平均大小为1136字节,数据总共占用了5GB的空间。_id之上的索引大小为130MB。现在我们需要验证一件 非常重要的事情:RAM中的数据有没有重复,是不是在MongoDB和文件系统中各保存了一份?还记得MongoDB并不会在她自己的进程内缓存任何数据,她的数据只会缓存到文件系统的缓存之中。那我们来清除一下文件系统的缓存,然后看看RAM中还有有什么数据:

# echo 3 > /proc/sys/vm/drop_caches 

# free

             total       used       free     shared    buffers     cached

Mem:      30689876    6292780   24397096          0       1044    5817368

-/+ buffers/cache:     474368   30215508

Swap:            0          0          0

可以看到,在已使用的6.3GB的RAM中,有5.8GB用于了文件系统的缓存(缓冲区,buffer)。为什么即使在清除所有缓存之后,系统中仍然还有5.8GB的文件系统缓存??其原因是,Linux非常聪明,她不会在tmpfs和缓存中保存重复的数据。太棒了!这就意味着,你在RAM只有一份数据。下面我们访问一下所有的document,并验证一下,RAM的使用情况不会发生变化:

> db.foo.find().itcount()

4000000

# free total used free shared buffers cached Mem: 30689876 6327988 24361888 0 1324 5818012 -/+ buffers/cache: 508652 30181224 Swap: 0 0 0 # ls -l /ramdata/ total 5808780 -rw-------. 1 root root 16777216 Apr 30 15:52 local.0 -rw-------. 1 root root 16777216 Apr 30 15:52 local.ns -rwxr-xr-x. 1 root root 5 Apr 30 15:52 mongod.lock -rw-------. 1 root root 16777216 Apr 30 16:00 test.0 -rw-------. 1 root root 33554432 Apr 30 16:00 test.1 -rw-------. 1 root root 536608768 Apr 30 16:02 test.10 -rw-------. 1 root root 536608768 Apr 30 16:03 test.11 -rw-------. 1 root root 536608768 Apr 30 16:03 test.12 -rw-------. 1 root root 536608768 Apr 30 16:04 test.13 -rw-------. 1 root root 536608768 Apr 30 16:04 test.14 -rw-------. 1 root root 67108864 Apr 30 16:00 test.2 -rw-------. 1 root root 134217728 Apr 30 16:00 test.3 -rw-------. 1 root root 268435456 Apr 30 16:00 test.4 -rw-------. 1 root root 536608768 Apr 30 16:01 test.5 -rw-------. 1 root root 536608768 Apr 30 16:01 test.6 -rw-------. 1 root root 536608768 Apr 30 16:04 test.7 -rw-------. 1 root root 536608768 Apr 30 16:03 test.8 -rw-------. 1 root root 536608768 Apr 30 16:02 test.9 -rw-------. 1 root root 16777216 Apr 30 15:52 test.ns drwxr-xr-x. 2 root root 40 Apr 30 16:04 _tmp # df Filesystem 1K-blocks Used Available Use% Mounted on /dev/xvde1 5905712 4973960 871756 86% / none 15344936 0 15344936 0% /dev/shm tmpfs 16384000 5808780 10575220 36% /ramdata

果不其然! :)

复制(replication)呢?

既然服务器在重启时RAM中的数据都会丢失,所以你可能会想使用复制。采用标准的副本集(replica set)就能够获得自动故障转移(failover),还能够提高数据读取能力(read capacity)。如果有服务器重启了,它就可以从同一个副本集中另外一个服务器中读取数据从而重建自己的数据(重新同步,resync)。即使在大量数据和索引的情况下,这个过程也会足够快,因为索引操作都是在RAM中进行的 :)

有一点很重要,就是写操作会写入一个特殊的叫做oplog的collection,它位于local数据库之中。缺省情况下,它的大小是总数据量的5%。在我这种情况下,oplog会占有16GB的5%,也就是800MB的空间。在拿不准的情况下,比较安全的做法是,可以使用oplogSize这个选项为oplog选择一个固定的大小。如果备选服务器宕机时间超过了oplog的容量,它就必须要进行重新同步了。要把它的大小设置为1GB,可以这样:

oplogSize = 1000

分片(sharding)呢?

既然拥有了MongoDB所有的查询功能,那么用它来实现一个大型的服务要怎么弄?你可以随心所欲地使用分片来实现一个大型可扩展的内存数据库。配置服务器(保存着数据块分配情况)还还是用过采用基于磁盘的方案,因为这些服务器的活动数量不大,老从头重建集群可不好玩。
注意事项

RAM属稀缺资源,而且在这种情况下你一定想让整个数据集都能放到RAM中。尽管tmpfs具有借助于磁盘交换(swapping)的能力,但其性能下降将非常显著。为了充分利用RAM,你应该考虑:

使用usePowerOf2Sizes选项对存储bucket进行规范化 定期运行compact命令或者对节点进行重新同步(resync) schema的设计要相当规范化(以避免出现大量比较大的document)

结论

宝贝,你现在就能够将MongoDB用作内存数据库了,而且还能使用她的所有功能!性能嘛,应该会相当惊人:我在单线程/核的情况下进行测试,可以达到每秒20K个写入的速度,而且增加多少个核就会再增加多少倍的写入速度。

您可能感兴趣的文档:

--结束END--

本文标题: 将MongoDB作为Redis式的内存数据库的使用方法

本文链接: https://lsjlt.com/news/11739.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 将MongoDB作为Redis式的内存数据库的使用方法
    基本思想 将MongoDB用作内存数据库(in-memory database),也即,根本就不让MongoDB把数据保存到磁盘中的这种用法,引起了越来越多的人的兴趣。这种用法对于以下应用场合来讲,超实用...
    99+
    2022-06-04
    使用方法 内存 数据库
  • MongoDB数据库的使用方法
    这篇文章主要介绍“MongoDB数据库的使用方法”,在日常操作中,相信很多人在MongoDB数据库的使用方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”MongoDB数据库...
    99+
    2024-04-02
  • Node.js中使用mongoose操作mongodb数据库的方法
    如何利用mongoose将数据写入mongodb数据库? 1.利用npm下载安装mongoose; npm install mongoose 2.建立js文件,引入mongoose var mon...
    99+
    2022-06-04
    操作 数据库 方法
  • redis缓存数据库中数据的方法
    本文实例为大家分享了Redis缓存数据库中数据的具体代码,供大家参考,具体内容如下 将数据库的数据保存到redis缓存 当第一次查询时,缓存没有对应的数据,则会查询数据库,并将数据更新到缓存当缓存中有对应的数据时,则会直...
    99+
    2022-07-28
    redis缓存数据库数据 redis缓存数据库 redis缓存数据
  • IDEA版使用Java操作Redis数据库的方法
    首先 下载 jedis.jar包 然后再 工程设置里面找到Libraries,点击+。添加下载好的jedis.jar包。点击OK退出即可 创建Java_Control_Redis类...
    99+
    2024-04-02
  • node.js利用redis数据库缓存数据的方法
    一、运行redis Redis服务器默认使用6379端口 redis-server 自定义端口 redis-server port 6390 客户端 redis-cli 指定ip和端口连接...
    99+
    2022-06-04
    缓存 数据库 方法
  • redis缓存同步数据库的方法
    这篇文章将为大家详细讲解有关redis缓存同步数据库的方法,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。缓存数据与持久化数据的一致性,这个问题总结了一下(看...
    99+
    2024-04-02
  • 浅谈redis内存数据的持久化方式
    一、概述 Redis的强大性能很大程度上都是因为所有数据都是存储在内存中的,然而当Redis重启后,所有存储在内存中的数据将会丢失,在很多情况下是无法容忍这样的事情的。所以,我们需要将内存中的数据持久化!典...
    99+
    2024-04-02
  • redis存储应用程序使用不同数据库的方法
    这篇文章为大家带来有关redis存储应用程序使用不同数据库的方法。大部分知识点都是大家经常用到的,为此分享给大家做个参考。一起跟随小编过来看看吧。redis下,数据库是由一个整数索引标识,而不是由一个数据库...
    99+
    2024-04-02
  • Python 操作 MongoDB数据库的方法(非 ODM)
    目录一、连接器的安装和配置二、新增文档三、查询文档四、更新文档五、删除文档一、连接器的安装和配置 pymongo: MongoDB 官方提供的 Python 工具包。官方文档: ht...
    99+
    2023-03-19
    Python 操作 MongoDB Python MongoDB
  • Python 操作 MongoDB数据库的方法(非 ODM)
    目录一、连接器的安装和配置二、新增文档三、查询文档四、更新文档五、删除文档一、连接器的安装和配置 pymongo: MongoDB 官方提供的 python 工具包。官方文档: https://pymongo.readt...
    99+
    2023-03-19
    Python 操作 MongoDB
  • redis缓存数据库的作用有哪些
    1. 提高访问速度:Redis缓存数据库可以将热门数据存储在内存中,从而加快数据的访问速度,提高系统的响应性能。2. 减轻数据库负载...
    99+
    2023-09-04
    redis
  • redis存储数据的方法
    这篇文章主要介绍redis存储数据的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!redis是什么?Redis 是一个高性能的key-value数据库。 redis的出现,很大程...
    99+
    2024-04-02
  • Go语言操作redis数据库的方法
    先上命令速查网站,菜鸟yydshttps://www.runoob.com/Redis/redis-strings.html操作redis的包是go-redis/redis官方文档 https://redis.uptra...
    99+
    2022-07-21
    go操作redis goredis数据库
  • h2数据库作为内存型与springboot+mybatis的案例
    一.前言 H2 是一个用 Java 开发的嵌入式数据库,它本身只是一个类库,即只有一个 jar 文件,可以直接嵌入到应用项目中。H2 主要有如下三个用途: 第一个用途,也是最常使用的用途就在于可以同应用程序打包在一起发布,...
    99+
    2015-05-24
    h2数据库作为内存型与springboot+mybatis的案例
  • 将Access数据库转换为SQL Server的方法
    小编给大家分享一下将Access数据库转换为SQL Server的方法,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!随着时间的推移,大多数数据库的规模和复杂性都在增长。如果Access 201...
    99+
    2024-04-02
  • SpringBoot集成H2内存数据库的方法
    目录前言准备技术栈目录结构pom.xml实体类 UserAddressRepositoryapplication.yml连接配置数据初始化配置h2 web consloe配置代码下载...
    99+
    2024-04-02
  • redis是什么类型的内存数据库
    redis 是一种基于内存的开源数据库,使用键值存储模型,具有极高的读写速度。其特性包括:内存存储:数据存储在内存中,而不是磁盘上。键值存储:数据以键值对形式存储,其中键是唯一标识符,值...
    99+
    2024-04-08
  • MongoDB到数据库的使用
    MongoDB到数据库的使用?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。今天的主题是从MongoDB漫谈数据库,在日常的项目中,我们一般都是...
    99+
    2024-04-02
  • mongodb存数据的方法有哪些
    MongoDB存储数据的方法有以下几种:1. 插入文档(Documents Insertion):通过使用insert()或inse...
    99+
    2023-09-06
    mongodb
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作