返回顶部
首页 > 资讯 > 数据库 >MongoDB从入坑到入迷的过程是怎样的
  • 545
分享到

MongoDB从入坑到入迷的过程是怎样的

2024-04-02 19:04:59 545人浏览 薄情痞子
摘要

本篇文章为大家展示了mongoDB从入坑到入迷的过程是怎样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。背景:我司是一家正处于高速发展,目前拥有数百万用户,年销售

本篇文章为大家展示了mongoDB从入坑到入迷的过程是怎样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

背景:我司是一家正处于高速发展,目前拥有数百万用户,年销售额近五十亿的社交电商公司。公司技术部建立之初,为了适应用户量的高速增长,与业务的不断变更迭代,在选用数据库的时候,经过调研对比我们选择了MonGoDB。

是的,你没看错,All in MongoDB!

1.为什么使用MongoDB

因为我司主要做社交电商的业务,所以对数据库的性能有一定的要求,加上商品交易是公司主要盈利来源,所以对数据库的高可用也有一定的要求。

总结一下我们对数据库的要求:

  • 安全,稳定

  • 高可用

  • 高性能

我们在考虑数据库选型的时候主要考虑什么?

  • 数据规模

  • 支持读写并发

  • 延迟与吞吐量

从数据规模来说订单和商品SKU,还有会员信息这些重要的数据记录肯定会随着时间源源不断的增长,所以我们需要的不仅仅是满足当下要求,更需要为半年一年后海量数据更为方便的扩容做考量!

下面我们从MongoDB的架构,性能,和文档模型来介绍一下我们选择MongoDB的理由!

2.MongoDB架构

2.1 关于高可用

数据库作为系统核心,要保证99.99%的可用性,而高可用的保证来自于MongoDB冗余数据的复制集模式。MongoDB自带多副本高可用,只需要合理的配置,就能避免单数据库节点故障导致服务的不可用。

MongoDB从入坑到入迷的过程是怎样的

图例说明:

  • 一个Primary主节点,主要接受来自server的读写;

  • 两个Secondary从节点,用于同步来自Primary的数据。

关于高可用:当主节点发生故障的时候,两个从节点会进行选举,投票产生一个新的主节点,进而保证服务的可用性。(PS:在选举过程中数据不可写入,但是如果Secnondary节点配置可读,那么此时是可以读取数据的。)这就是MongoDB的高可用,配置简单,不需要引入额外的中间件或者插件去辅助数据库节点间的故障转移。

2.2 关于选举算法《分布式一致性算法---raft》

raft协议是在leader节点发生故障或者网络分区导致脑裂时如何保证分布式数据一致性的一个算法,MongoDB采用了该算法来保证当主节点故障或者网络分区的情况下,数据的一致性。当然MongoDB用的和raft原版算法肯定会略有不同,MongoDB会采用Secondary向Primary拉数据,而不是Primary向Secondary推数据的方式来减轻Primary的压力等等有利于数据库操作的方式对raft进行改进使用。

raft算法动画演示

Http://thesecretlivesofdata.com/raft/

2.3 关于超大规模复制集(集群)

MongoDB从入坑到入迷的过程是怎样的

{    "_id" : <num>,    "host" : <hostname:port>,    "arbiterOnly" : false,    "buildIndexes" : true,    "hidden" : false,    "priority" : 0,  // 设置为0    "tags" : {      },    "slaveDelay" : NumberLong(0),    "votes" : 0  // 设置为0 }

MongoDB最多允许50个节点,但是最多只有7个节点有投票权,一个节点可以配置7个无投票权的Non-Voting节点,加上一个Primary节点。

为什么只能允许存在7个投票节点呢?参考2.2小节的raft算法,节点越多,投票时间越长,选举出来的Primary节点时间也就越长,这个过程中我们是无法进行写操作的,因为没有主节点。

那么多非投票节点有什么用呢?大家应该都听过Mysql的读写分离吧,利用读写分离来提高数据库性能。  MongoDB这里其实也可以,Primary用来写,Secondary用来读,可以给BI部门一个Secondary,给财务部门一个Secondary,给运营部门一个Secondary&middot;&middot;&middot;&middot;&middot;&middot;

2.4 WriteConcern

既然我们的数据库拥有至少超过三个节点(1Primary+2Secondary),Secondary通过同步Primary的数据来保持一致性,那么当我们写操作的时候,如何保证数据安全的落盘呢?

MongoDB从入坑到入迷的过程是怎样的

有以下几种情况:

1. 写Primary成功,返回客户端写成功,Secondary还未同步Primary的时候,Primary挂了,数据丢失!

2.  写Primary成功,数据同步一个Secondary成功,返回客户端写成功。此时Primary挂了,数据不会丢失。但是恰好Primary与同步的Secondary同时挂了,数据丢失!

3. 写Primary成功,数据同步两个Secondary成功,返回客户端写成功。此时Primary挂了,数据不会丢失。

我们对以上三种情况进行分析:第一种情况有风险会造成数据丢失。第二种情况还是会出现数据丢失,但是数据丢失的概率大大降低。第三种情况是最安全的做法,但是节点数目多了,同步非常耗时,用户需要等待的时间过长,一般不考虑。

MongoDB在这里推荐折衷方案就是使用Write Concern---在数据可靠性与效率之间的权衡!

db.products.insert(    { item: "envelopes", Qty : 100, type: "Clasp" },    { writeConcern: { w: "majority" , wtimeout: 5000 } }  // 设置writeConcern为majority,超时时间为5000毫秒 )

3.MongoDB分片

3.1 大规模数据是如何影响数据库效率的?

数据库的性能还与数据库本身规模息息相关。拿关系型数据库举例:

  • 查询百万表和千万表甚至过亿的表效率相差很大,查询性能急剧恶化。

  • 插入的时候创建索引可能会引起索引树的调整与页分裂。

3.2 面对海量数据如何提升数据读写效率?

为了在海量数据中提升数据库的效率,我们采用分而治之的思想,将大表拆成小表,大库拆成小库。

关系型数据库中我们常用分表分库来解决:

  • 例如将订单库分为在线库和离线库,近三个月是在线库,远期的订单数据放入离线库,这样在线库的数据就大大减少,数据库性能就得到了提升。

  • 又例如当我们的用户量过多超过千万行记录,单表查询效率下降,我们将一张用户表拆成多张用户表,这个就是水平拆分。

MongoDB中我们是如何做的呢?

3.3 MongoDBSharding

MongoDB从入坑到入迷的过程是怎样的

MongoDB的分片

通过将同一个集合(Collection1)的数据按片键(shard  keys)分到不同的分片(shard)上面,减少同一个数据文件上的数据量,已达到拆分数据规模的目的。

MongoDB从入坑到入迷的过程是怎样的

Shard 优势:在线扩容,动态扩容

Shard:用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承担,防止主机单点故障。

Config Server:配置服务器 mongod实例,存储了整个集群的元数据与配置,其中包括 chunk信息,在MongoDB  3.4中,配置服务器必须部署为一个副本集。

Mongos:mongos充当查询路由器,提供客户端应用程序和切分集群之间的接口。

服务器插入的数据通过Mongos路由到具体地址,这也是MongoDB的便利之处,不需要自己关注路由,也不需要使用第三方提供的中间件辅助路由,可靠,放心。

MongoDB从入坑到入迷的过程是怎样的

分片的负载均衡

当我们的MongoDB 副本集变成分片集群后,随着数据量的增长,各个分片也会越来越大,这里就会出现两种情况:

1. 冷热数据,某个分片数据量过大。

2. 数据总量大,分片集群的分片过大。

当出现问题(1)的时候,MongoDB的负载均衡器(Balancer)会自动将大分片中的数据迁往小分片。注意这并不意味我们可以高枕无忧了,恰恰相反,我们应该反思是不是自己片键选择失误而造成的数据不均匀!因为对分片迁移也是消耗性能的,应用服务器写一次到Shard  B,然后Shard B重写到Shard C无形之中数据被写了两次,这是极大的浪费!

当出现问题(2)的时候,当然是给过大的分片集合添加新的分片以此分摊分片集群的压力。

注意:MongoDB分片虽然是可在线的,但是多少都会对正常的读写操作性能有一定的影响,建议在非繁忙时间段进行分片部署!

4.MongoDB文档模型介绍

数据库建模的挑战在于平衡应用的需要,适合该数据库引擎发挥的结构以及数据的检索模式。当我们设计数据模型的时候,需要考虑应用使用数据的情况(查询,更新,和数据处理)以及该数据本身的结构。

4.1 灵活的Schema

在关系型数据库中,必须按照确定的表结构去插入数据。但是,由于MongoDB是文档型数据库,在插入数据的时候默认并不对此做要求。其表现在于:

同一个集合中不同文档不一定需要有相同的字段,并且字段类型也可以不同。

在集合中改变文档的结构,例如增加一个字段,删除一个字段,或者改变一个字段的类型,只需要对该文档更新即可。

4.2 举例1:N模型设计

在电商业务中,一个用户可能有多个收件人以及收件地址。在关系型数据库中,我们需要建立联系人表,地址表,并且将其关联。但是在MongoDB中,我们只需要一个集合就能将此搞定!

数据关系如下:

// patron document {    _id: "joe",    name: "Joe Bookreader" }   // address documents {    patron_id: "joe", // reference to patron document    street: "123 Fake Street",    city: "Faketon",    state: "MA",    zip: "12345" }   {    patron_id: "joe",    street: "1 Some Other Street",    city: "Boston",    state: "MA",    zip: "12345" }

在MongoDB中我们可以这样进行设计:

{    "_id": "joe",    "name": "Joe Bookreader",    "addresses": [                 {                   "street": "123 Fake Street",                   "city": "Faketon",                   "state": "MA",                   "zip": "12345"                 },                 {                   "street": "1 Some Other Street",                   "city": "Boston",                   "state": "MA",                   "zip": "12345"                 }               ]  }

没错,以上就是集合中的一个document(文档),是不是感觉很灵活很方便!你可以在SKU集合中添加分类信息,或者商品标签,还可以在库存集合中冗余SKU的基本信息,还可以在订单集合中冗余部分下单者信息&middot;&middot;&middot;没错,就是这么灵活!这也是我们选择MongoDB的一个重要原因之一,让开发者的心智负担少了很多,不需要成为sql高手,你也能在MongoDB中写出性能优异的查询语句。

当然冗余一时爽,重构火葬场的段子也不是没听过,因为过多的冗余最终会造成数据的过于臃肿,性能降低等各种问题,这个要控制住开发者的冗余冲动,也依赖于团队技术Leader对此的把关。

互联网业务不是一成不变的,产品和用户的需求还有市场都一直在变!我们没有技术实力打造一个能够适应灵活多变的业务的中台,但是目前我们可以选择一个可靠,强大并且灵活的数据库  -- MongoDB!

上述内容就是MongoDB从入坑到入迷的过程是怎样的,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注编程网数据库频道。

您可能感兴趣的文档:

--结束END--

本文标题: MongoDB从入坑到入迷的过程是怎样的

本文链接: https://lsjlt.com/news/61372.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • MongoDB从入坑到入迷的过程是怎样的
    本篇文章为大家展示了MongoDB从入坑到入迷的过程是怎样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。背景:我司是一家正处于高速发展,目前拥有数百万用户,年销售...
    99+
    2024-04-02
  • SQL注入全过程的深入分析是怎样的
    这篇文章将为大家详细讲解有关SQL注入全过程的深入分析是怎样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。分析了SQL注入全过程,具体如下:初步注入--绕...
    99+
    2024-04-02
  • MongoDB的选举过程是怎样的
    本篇文章给大家分享的是有关MongoDB的选举过程是怎样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。MongoDB的复制集具有自动容忍部分...
    99+
    2024-04-02
  • 学习嵌入式Linux过程是怎么样的
    这篇文章给大家介绍学习嵌入式Linux过程是怎么样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。我专业是电子信息工程,在初入大学的时候,我们的班主任便要我们多多去了解一些关于电子方面的知识。后来我了解到了嵌入式,继而...
    99+
    2023-06-05
  • 样式的进化:从内联样式到 HTML 嵌入样式的旅程
    HTML 嵌入样式的引入解决了内联样式的局限性。它允许在 元素中定义样式规则,并将其应用于整个文档或其特定部分。这种方法提供了更大的灵活性,更容易维护,因为它使样式与 HTML 内容分离。 内联样式的缺点: 重复性和冗余:当同样的样式...
    99+
    2024-04-02
  • Nacos入门过程的坑--获取不到配置的值问题
    目录Nacos获取不到配置的值本地nacosJAVA代码Nacos配置文件,通过@Value() 获取时失败了在nacos中配置的是这样的但是在Controller中取值取不到是我的...
    99+
    2024-04-02
  • Ajax提交表单数据到入库的全盘操作过程是怎样的
    Ajax提交表单数据到入库的全盘操作过程是怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 *******p...
    99+
    2024-04-02
  • mysql迁移到mongodb shared架构的过程中踩到的一个坑
        Mysql库中有一个表,数据量在10亿左右,基本上对于这个表的操作都是没有意义的,因此想测试一下迁移到mongodb的shared架构上是否会有所改善。于是哼哧哼哧的搭...
    99+
    2024-04-02
  • 从输入URL到页面显示过程原理是什么
    这篇文章主要讲解了“从输入URL到页面显示过程原理是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“从输入URL到页面显示过程原理是什么”吧!前言说说从输入 URL 到页面显示的过程,这是...
    99+
    2023-07-06
  • Ubuntu 9.04升级到9.10的过程是怎样的
    这篇文章将为大家详细讲解有关Ubuntu 9.04升级到9.10的过程是怎样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Ubuntu 9.10(Karmic Koala)采用GNOME ...
    99+
    2023-06-13
  • Cassandra的数据写入流程是怎样的
    Cassandra的数据写入流程如下: 客户端应用程序向Cassandra节点发送写请求。 请求首先发送到负责处理数据分片的节点,...
    99+
    2024-04-09
    Cassandra
  • EF架构codeFirst从初始化到数据库迁移的过程是怎样的
    这篇文章给大家介绍EF架构codeFirst从初始化到数据库迁移的过程是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一些介绍CodeFirst是EntityFrameworks...
    99+
    2024-04-02
  • MySQL主从不一致的修复过程是怎样的
    本篇文章给大家分享的是有关MySQL主从不一致的修复过程是怎样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。 昨天发现一个5.7的MySQ...
    99+
    2024-04-02
  • MySQL主从复制的详细过程是怎么样的
    这篇文章将为大家详细讲解有关MySQL主从复制的详细过程是怎么样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。 MySQL数...
    99+
    2024-04-02
  • Dropbox是怎么将接入层从Nginx迁移到Envoy的
    这篇文章主要介绍了Dropbox是怎么将接入层从Nginx迁移到Envoy的,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。在我们大...
    99+
    2024-04-02
  • Linux 上的 Go 编程:从入门到精通的教程
    Go 语言是谷歌开发的一种编程语言,它结合了 C 语言的高效性和 Python 语言的易学性,成为了一种非常受欢迎的编程语言。本文将为您介绍如何在 Linux 上使用 Go 语言进行编程,从入门到精通。 安装 Go 首先,您需要在 L...
    99+
    2023-07-10
    教程 linux 关键字
  • 涉及到linux内核的bug排查过程是怎样的
    这期内容当中小编将会给大家带来有关涉及到linux内核的bug排查过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。编写代码只是程序员的工作之一,调试代码的时间甚至会超过编写代码,之前为大家讲解了...
    99+
    2023-06-15
  • 配置ECS上自建MySQL作为RDS从库过程中踩到的坑
    环境:  RDS版本:阿里云的5.6  ECS自建MySQL5.6.34(官方版本)通过将阿里云rds的自动全量备份下载到ECS上,按照官方的步骤解压--> aploy-log -...
    99+
    2024-04-02
  • UNIX系统中的Java编程:从入门到面试
    Java是一门广泛应用于计算机编程领域的编程语言。在UNIX系统中,Java的应用也非常广泛,尤其是在企业级应用和互联网应用中。本文将从入门到面试,为大家介绍在UNIX系统中如何进行Java编程。 安装Java开发环境 首先,我们需要...
    99+
    2023-10-06
    教程 unix 面试
  • MongoDB命令行与进程是怎样的
    本篇文章给大家分享的是有关MongoDB命令行与进程是怎样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。一、命令行MongoDB shell...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作