(注:近我发现MONGODB 的文字,大家好像不大感兴趣,不知道是大家的公司不使用MONGBDB 还是由于MONGODB 太稳定,所以就忽略了,其实MONGODB 可以聊的话题和使用的范围很大,有的公司可能主力数据库就是MONGODB 所以MONGODB 确实不是可有可无的)
今天开发一个美女,她刚开始使用MONGODB,所以会经常问我问题,例如为什么 update 无法更新数据,我过去看了看,原来数据中包含了嵌套和数组,开发人员处理嵌套是没有问题的,但这次JSON的结构是第三方反馈的,所以比较复杂,由于信息敏感这里就不展示了。
要说清楚这个问题,其实这就牵扯到一些MONGODB 的document 设计的问题,这里有一个经常被问到的问题,是嵌套好,还是数组好,我应该在设计中多用嵌套,还是多用数组。
首先个人认为,要搞清楚这个问题,需要分析你的数据在是 一对少,还是一对多,还是一对一的问题
例如:我们举个例子,一对少
如我们有一个客户,他的地址信息,一般来说不是房哥,房嫂的情况下,一个人得房产信息,一个手的手指头就够了。所以我这里定义为 一对少的关系。
{
name: 'super_man',
id:'109838973',
addresses:[
{city:'北京',district:'朝阳区',street:'xcecdieei'},
{city:'上海',district:'虹桥区',street:'werdfsrew'}
]
}
首先我们先明确两点,任何设计都有优点,和缺点,这一般都是并存的,没有说我的设计十全十美,这里为什么要使用数组,原因是查询的时候,可以一并带出地址信息,而地址信息一般不会是直接单独作为查询条件来进行查询的。
一句话:这样的设计不必单独查询来获取嵌入的信息,但无法将嵌入的细节作为独立的实体访问。
而一对多的例子可以我们可以假设,我们有一个销售系统,我们里面有很多老客户的信息,而每次他们订购产品也都是组团进行购买,每个产品需要有购买产品的客户信息。
我们可以建议一个collection 来存储客户的信息
同时在建立一个订购产品的 collection ,将订购某个产品的用户信息存储在一个 document 中
上面就是一个处理一对多的MONGODB 中的一种设计方法,这样设计的好处是,他们都作为一个独立的文档,可以更快的更新,但每次查询就需要两步来走,而不是通过一个查询就可以获得所要的数据,例如要某个订单的所有客户的地址信息。
个人领会,MONGODB collection 的设计,要考虑后期的查询便利性和数据更改的便利性,太复杂的多层嵌套数组,是不利于MONGODB 的查询和分析的。
我们以 mongodb 3.6 作为一个锚点,
我们先不考虑那种设计更好,我们先根据一个已经成型的设计来看看(以下信息来自于一个成熟的第三方接口返回的信息,部分敏感数据已经更改或覆盖),这样的设计给数据的 UDPATE 和 Find 带来的是什么,然后我们就可以知道,那样的设计更适合某些场景。
我们下面有这样一个文档,我们想更改queryConditions 里面的name 为yesyesyes 的记录,改为nono
我们使用下面的语句来进行相关的更改,这里涉及了 MONGODB 里面关于数组的 $ 占位符。
db.py_queryfraud.update(
{"documentno":"130532199001108012","data.cisReport.queryConditions.$.name":"yesyesyes"},
{$set:{"data.cisReport.0.queryConditions.$.name":"nono"}})
我们可以看到人,个符号条件的嵌套数组的name 值已经更改为我们指定的,而其他的值name 的值还都是yesyesyes
而使用通配符,也是有场景限制的
1 使用upsert 操作中是不允许有 $ 符号的
2 位置$操作符不能用于遍历多个数组的查询,例如遍历嵌套在其他数组中的数组的查询,因为$占位符的替换是单个值
3 当与$unset操作符一起使用时,位置$操作符不会从数组中删除匹配的元素,而是将其设置为null。
4 如果查询使用否定运算符(如$ne、$not或$nin)匹配数组,则不能使用位置运算符从该数组更新值。但是,如果查询的否定部分位于$elemMatch表达式中,则可以使用位置操作符更新该字段。
而如果我们要将其他符合条件的数组嵌套也都更改过来,其实就没有那么好做了,如果我们在cisReport那层不只有一个数组的情况下,我们将更难的处理这样数据的更改(详情请参加上面的占位符的限制)
所以MONGODB 中的设计,尽量避免大量的多层的嵌套数组,这样给查询和更新数据都提高了难度。所以MONGODB 的 “表”设计一点也不比传统数据库来的“随便”。
后如果想更新所有符合条件的值,需要写一个循环来遍历所有符合条件的元素。