非关系型 MongoDB 快速入门,掌握这些就够了

凛冬王昭君 2021年09月26日 123次浏览

1. 概述

可能有一些胖友对 MongoDB 不是很了解,这里我们引用一段介绍:

MongoDB是NoSQL数据库中的佼佼者,目前是排名第一的文档型数据库。该数据库基于灵活的JSON文档类型,非常适合敏捷式的快速开发。于此同时,其与生俱来的高可用、高水平扩展能力使得它在处理海量、高并发的数据应用时颇具优势。

1.1 面向文档设计

在我们的系统中,通常会用分层描述现实中的模型,如下图所示:

数据的分层模型.jpg

从下往上看,每一层都提供了更简单、更容易表述的模型来隐藏下层的复杂性。最为典型的是。数据库系统屏蔽了所有磁盘文件中如何存取,压缩/解压缩等细节,向应用程序展示了一些通用的数据模型,如SQL表、列,或是基于JSON、XML的文模型。而应用程序方面,面对对象的模型也已经被绝大多数人所熟知并接受。

在处理SQL数据模型时,应用程序需要通过代码做一些必要的转换工作,一般可以借助一些ORM框架来减轻工作量,例如hibernate。然而,SQL模型与面向对象之间仍存在不少差异,这些差异并不能完全通过框架屏蔽。相较之下,基于JSON的文档模型则更能契合面向对象的设计准则,对于开发者来说,这在一定程度上降低了使用数据的门槛。

MongoDB是居于JSON来描述数据的,所有的“数据行”都可以通过一个JSON格式的文档(document)来表示。比如下面的例子:

{
  "title": "一种面向文档的数据存储模型",
  "url": "http://www/.mongoing.com/",
  "tags": [
    "数据库",
    "模型",
    "论文"
  ],
  "author": {
    "name": "李晓凯",
    "career": "教师"
  }
}

很明显,基于JSON格式的数据模型可读性非常强,也更加灵活;除了基本的数据类型,文档中还可以使用数组,内嵌子对象等高级的字段类型。

此外,JSON还具备无模式(模式灵活)的特点,可以轻松地进行扩展。在访问MongoDB的“表”之前,并不需要事先对表模型进行声明(尽管你也可以这么做)。同时当数据模型发生变更时,MongoDB不会强制要求你去执行表结构更新的相关操作,这提供了很大的便利性。

在MongoDB内部,BJSON(一种二进制版本的JSON扩展)被真正用来存储这些JSON形式的文档数据,在JSON的基础之上,BJSON进行了一些易用性方面的扩展,例如增加日期、二进制等类型的支持。

虽然MongoDB“沿袭”了JSON的特点,但将它归类为无模式数据库是不恰当的。实际上,所有的读写都是基于一种内部隐含的模式,模式采取按需变更而非是提前声明,因此动态模式一词更适合它。

1.2 特性

  • 具备完善的索引
  • 跨平台,支持各种语言
  • 强大的聚合计算能力
  • 复制,分布式

1.3 优势

在选择某个数据库时,通常都会从各个方面进行考量。对于MongoDB来说,它的优势主要有以下几点。

  1. 易用性
    简单易用是MongoDB的一大优势。MongoDB是基于JSON格式的,这点对于开发人员来说显然是更加友好,尤其是对全栈开发者来说,JSON是前后端开发领域中最通用、易读的描述性语言。
    如果你是一名新手,则只需要了解一点JavaScript的语法就可以基本掌握一种数据库的使用,这听起来非常振奋人心。
    另外一点,则是无模式带来的便利,由于没有了强制的表定义约束,在文档结构发生变化时并不需要如关系型数据库事先执行一些DDL变更语句,这非常有利于业务的平滑升级。 因此,MongoDB的开发效率更高,更适合敏捷开发。

  2. 高性能
    从MongoDB 3.0版本开始引入WiredTiger存储引擎,在性能以及稳定性上都有了明显的提升。
    WiredTiger存储引擎在数据检索性能上做了许多优化,基于内存的二级的缓存提供了高速读取数据能力,在写方面则是根据磁盘I/O的特点做了缓冲式写入,这是基于空间、时间因素权衡的一种择优设计。从大量的测评结果来看,其性能表现是令人满意的。

  3. 高可靠
    对于单个MongoDB节点来说,可以通过开启Journal机制来实现断电保护,这是一种WAL预写日志机制,在发生异常断电后,可以通过Journal机制,进行数据恢复。在默认情况下,Journal仅允许最多丢失50ms内更新的数据。
    对于集群节点来说,MongoDB则提供了副本集架构来支持数据库的高可用,在节点发生宕机时,可以实现秒级的切换,这个过程对于应用是透明的。

  4. 高可扩展
    在分片的集群架构中,数据的读写会均衡的分布在多个数据库节点上,通过增加分片的方式就可以实现按需扩展。在数据业务持续增长时,借助分片集群可以轻松支撑海量的数据存取。

  5. 强大的社区支持
    MongoDB有着庞大的使用群体,在一定程度上巩固了它在NoSQL领域的领先地位。

  6. 事务的支持
    在MongoDB 4.0 版本之后,开始支持事务功能,这意味着在一些对一致性要求非常高的场景中(比如金融交易类产品)也可以使用MongoDB了。利用数据库本身的事务性保证,还可以实现分布式事务,这对于提升系统的可伸缩性有明显的效果。

2.类比SQL模型

2.1 数据结构

如果你已经熟知关系型数据库(RMDMS)的概念模型,那么不难理解database、table、column这几个基本概念。MongoDB使用的数据模型与它们非常相似。

SQL概念MongoDB概念解释/说明
databasedatabase数据库
tablecollection数据库表/集合
rowdocument数据记录行/文档
columnfield数据字段/域
indexindex索引
primary keyprimary key主键,MongoDB自动将_id字段设置为主键

说明如下:

  • 数据库(database):最外层的概念,可以理解为逻辑上的名称空间,一个数据库包含多个不同名称的集合。
  • 集合(collection):相当于SQL中的表,一个集合可以存放多个不同的文档。
  • 文档(document):一个文档相当于数据表中的一行,由多个不同的字段组成。
  • 字段(field):文档中的一个属性,等同于列(column)。
  • 索引(index):独立的检索式数据结构,与SQL概念一致。
  • _id:每个文档中都有一个唯一的_id字段,相当于SQL中的主键(primary key)。
  • 视图(view):可以看做一种虚拟的(非真实存在的)集合,与SQL中的视图类似。从MongoDB 3.4 版本开始提供了视图功能,其通过聚合管道技术实现。
  • 聚合操作($lookup):MongoDB用于实现“类似”表连接(table join)的聚合操作符。

2.2 数据库操作

  • 创建数据库,使用use命令去创建数据库,当插入第一条数据时会创建数据库,例如创建一个test数据库;
> use test
switched to db test
> db.article.insert({name:"MongoDB 教程"})
WriteResult({ "nInserted" : 1 })
> show dbs
admin   0.000GB
config  0.000GB
local   0.000GB
test    0.000GB
  • 删除数据库,使用db对象中的dropDatabase()方法来删除;
> db.dropDatabase()
{ "dropped" : "test", "ok" : 1 }
> show dbs
admin   0.000GB
config  0.000GB
local   0.000GB

2.3 集合操作

  • 创建集合,使用db对象中的createCollection()方法来创建集合,例如创建一个article集合;
> use test
switched to db test
> db.createCollection("article")
{ "ok" : 1 }
> show collections
article
  • 删除集合,使用collection对象的drop()方法来删除集合,例如删除一个article集合;
> db.article.drop()
true
> show collections

2.4 文档操作

上面的数据库和集合操作是在MongoDB的客户端中进行的,下面的文档操作都是在Robomongo中进行的。

2.4.1 插入文档

  • MongoDB通过collection对象的insert()方法向集合中插入文档,语法如下;
db.collection.insert(document)
  • 使用collection对象的insert()方法来插入文档,例如插入一个article文档;
db.article.insert({title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: 'Andy',
    url: 'https://www.mongodb.com/',
    tags: ['mongodb', 'database', 'NoSQL'],
    likes: 100
})
  • 使用collection对象的find()方法可以获取文档,例如获取所有的article文档;
db.article.find({})
{
    "_id" : ObjectId("5e9943661379a112845e4056"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://www.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
}

2.4.2 更新文档

  • MongoDB通过collection对象的update()来更新集合中的文档,语法如下;
db.collection.update(
   <query>,
   <update>,
   {
     multi: <boolean>
   }
)
# query:修改的查询条件,类似于SQL中的WHERE部分
# update:更新属性的操作符,类似与SQL中的SET部分
# multi:设置为true时会更新所有符合条件的文档,默认为false只更新找到的第一条
  • 将title为MongoDB 教程的所有文档的title修改为MongoDB
db.article.update({'title':'MongoDB 教程'},{$set:{'title':'MongoDB'}},{multi:true})
  • 除了update()方法以外,save()方法可以用来替换已有文档,语法如下;
db.collection.save(document)
  • 这次我们将ObjectId为5e9943661379a112845e4056的文档的title改为MongoDB 教程
db.article.save({
    "_id" : ObjectId("5e9943661379a112845e4056"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://www.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
})

2.4.3 删除文档

  • MongoDB通过collection对象的remove()方法来删除集合中的文档,语法如下;
db.collection.remove(
   <query>,
   {
     justOne: <boolean>
   }
)
# query:删除的查询条件,类似于SQL中的WHERE部分
# justOne:设置为true只删除一条记录,默认为false删除所有记录
  • 删除title为MongoDB 教程的所有文档;
db.article.remove({'title':'MongoDB 教程'})

2.4.4 查询文档

  • MongoDB通过collection对象的find()方法来查询文档,语法如下;
db.collection.find(query, projection)
# query:查询条件,类似于SQL中的WHERE部分
# projection:可选,使用投影操作符指定返回的键
  • 查询article集合中的所有文档;
db.article.find()
/* 1 */
{
    "_id" : ObjectId("5e994dcb1379a112845e4057"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://www.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 50.0
}

/* 2 */
{
    "_id" : ObjectId("5e994df51379a112845e4058"),
    "title" : "Elasticsearch 教程",
    "description" : "Elasticsearch 是一个搜索引擎",
    "by" : "Ruby",
    "url" : "https://www.elastic.co/cn/",
    "tags" : [ 
        "elasticearch", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
}

/* 3 */
{
    "_id" : ObjectId("5e994e111379a112845e4059"),
    "title" : "Redis 教程",
    "description" : "Redis 是一个key-value数据库",
    "by" : "Andy",
    "url" : "https://redis.io/",
    "tags" : [ 
        "redis", 
        "database", 
        "NoSQL"
    ],
    "likes" : 150.0
}
  • MongoDB中的条件操作符,通过与SQL语句的对比来了解下;
操作格式SQL中的类似语句
等于{<key>:<value>}where title = 'MongoDB 教程'
小于{<key>:{$lt:<value>}}where likes < 50
小于或等于{<key>:{$lte:<value>}}where likes <= 50
大于{<key>:{$gt:<value>}}where likes > 50
大于或等于{<key>:{$gte:<value>}}where likes >= 50
不等于{<key>:{$ne:<value>}}where likes != 50
  • 条件查询,查询title为MongoDB 教程的所有文档;
db.article.find({'title':'MongoDB 教程'})
  • 条件查询,查询likes大于50的所有文档;
db.article.find({'likes':{$gt:50}})
  • AND条件可以通过在find()方法传入多个键,以逗号隔开来实现,例如查询title为MongoDB 教程并且by为Andy的所有文档;
db.article.find({'title':'MongoDB 教程','by':'Andy'})
  • OR条件可以通过使用$or操作符实现,例如查询title为Redis 教程MongoDB 教程的所有文档;
db.article.find({$or:[{"title":"Redis 教程"},{"title": "MongoDB 教程"}]})
  • AND 和 OR条件的联合使用,例如查询likes大于50,并且title为Redis 教程或者"MongoDB 教程的所有文档。
db.article.find({"likes": {$gt:50}, $or: [{"title": "Redis 教程"},{"title": "MongoDB 教程"}]})

2.5 其他操作

2.5.1 Limit与Skip操作

  • 读取指定数量的文档,可以使用limit()方法,语法如下;
db.collection.find().limit(NUMBER)
  • 只查询article集合中的2条数据;
db.article.find().limit(2)
  • 跳过指定数量的文档来读取,可以使用skip()方法,语法如下;
db.collection.find().limit(NUMBER).skip(NUMBER)
  • 从第二条开始,查询article集合中的2条数据;
db.article.find().limit(2).skip(1)

2.5.2 排序

  • 在MongoDB中使用sort()方法对数据进行排序,sort()方法通过参数来指定排序的字段,并使用1和-1来指定排序方式,1为升序,-1为降序;
db.collection.find().sort({KEY:1})
  • 按article集合中文档的likes字段降序排列;
db.article.find().sort({likes:-1})

2.5.3 索引

  • 索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。

  • MongoDB使用createIndex()方法来创建索引,语法如下;

db.collection.createIndex(keys, options)
# background:建索引过程会阻塞其它数据库操作,设置为true表示后台创建,默认为false
# unique:设置为true表示创建唯一索引
# name:指定索引名称,如果没有指定会自动生成
  • 给title和description字段创建索引,1表示升序索引,-1表示降序索引,指定以后台方式创建;
db.article.createIndex({"title":1,"description":-1}, {background: true})
  • 查看article集合中已经创建的索引;
db.article.getIndexes()
/* 1 */
[
    {
        "v" : 2,
        "key" : {
            "_id" : 1
        },
        "name" : "_id_",
        "ns" : "test.article"
    },
    {
        "v" : 2,
        "key" : {
            "title" : 1.0,
            "description" : -1.0
        },
        "name" : "title_1_description_-1",
        "ns" : "test.article",
        "background" : true
    }
]

2.5.4 聚合

  • MongoDB中的聚合使用aggregate()方法,类似于SQL中的group by语句,语法如下;
db.collection.aggregate(AGGREGATE_OPERATION)
  • 聚合中常用操作符如下;
操作符描述
$sum计算总和
$avg计算平均值
$min计算最小值
$max计算最大值
  • 根据by字段聚合文档并计算文档数量,类似与SQL中的count()函数;
db.article.aggregate([{$group : {_id : "$by", sum_count : {$sum : 1}}}])
/* 1 */
{
    "_id" : "Andy",
    "sum_count" : 2.0
}

/* 2 */
{
    "_id" : "Ruby",
    "sum_count" : 1.0
}
  • 根据by字段聚合文档并计算likes字段的平局值,类似与SQL中的avg()语句;
db.article.aggregate([{$group : {_id : "$by", avg_likes : {$avg : "$likes"}}}])
/* 1 */
{
    "_id" : "Andy",
    "avg_likes" : 100.0
}

/* 2 */
{
    "_id" : "Ruby",
    "avg_likes" : 100.0
}

2.5.5 正则表达式

  • MongoDB使用$regex操作符来设置匹配字符串的正则表达式,可以用来模糊查询,类似于SQL中的like操作;

  • 例如查询title中包含教程的文档;

db.article.find({title:{$regex:"教程"}})
  • 不区分大小写的模糊查询,使用$options操作符;
db.article.find({title:{$regex:"elasticsearch",$options:"$i"}})

3 结合SpringBoot使用

具体参考:《spring boot 整合Mongodb实现文档操作》