MongoDB 高级查询与索引

覆盖索引查询

所有的查询字段都是索引的一部分;所有的查询返回字段在同一个索引中。

由于索引存在于 RAM 中,因而从索引中获取数据要比扫描文档更快。

范例:

创建如下 users 集合(使用前面所学的方法创建该集合):

{
   "contact": "987654321",
   "dob": "01-01-1991",
   "gender": "M",
   "name": "Tom Benzamin",
   "user_name": "tombenzamin"
}

在 users 中创建一个联合索引:

> db.users.ensureIndex({gender:1,user_name:1})

该索引会覆盖下面的查询:

> db.users.find({gender:"M"},{user_name:1,_id:0})

对于上述查询,MongoDB 不会在数据库文件中查找,而会从索引中提取数据。因为索引中不包含 _id 字段,所以 _id 在查询中会默认返回,可以在查询结果中将其排除。而 db.users.find({gender:"M"},{user_name:1})
 就不会被索引覆盖。

我们在名为users的集合中插入了以下文档,如下所示–

db.users.insert(
	{
		"address": {
			"city": "Los Angeles",
			"state": "California",
			"pincode": "123"
		},
		"tags": [
			"music",
			"cricket",
			"blogs"
		],
		"name": "Tom Benzamin"
	}
)

上面的文档包含一个address子文档和一个标记数组。

索引数组字段

假设我们要根据用户的标记搜索用户文档。为此,我们将在集合中的tags数组上创建一个索引。

在数组上创建索引,依次为数组的每个字段创建单独的索引项。所以在我们的实例中,当我们在tags数组上创建索引时,将为其值music、cricket和blogs创建单独的索引。

要在标签tags数组上创建索引,请使用以下代码-

>db.users.createIndex({"tags":1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 2,
"numIndexesAfter" : 3,
"ok" : 1
}
>

创建索引之后,我们可以在集合的 tags 字段上进行搜索,如下-

> db.users.find({tags:"cricket"}).pretty(){
	"_id" : ObjectId("5dd7c927f1dd4583e7103fdf"),
	"address" : {
		"city" : "Los Angeles",
		"state" : "California",
		"pincode" : "123"
	},
	"tags" : [
		"music",
		"cricket",
		"blogs"
	],
	"name" : "Tom Benzamin"
}
>

要验证是否使用了正确的索引,请使用下面的 explain 命令-

>db.users.find({tags:"cricket"}).explain()

这给您以下结果-

{
	"queryPlanner" : {
		"plannerVersion" : 1,
		"namespace" : "mydb.users",
		"indexFilterSet" : false,
		"parsedQuery" : {
			"tags" : {
				"$eq" : "cricket"
			}
		},
		"queryHash" : "9D3B61A7",
		"planCacheKey" : "04C9997B",
		"winningPlan" : {
			"stage" : "FETCH",
			"inputStage" : {
				"stage" : "IXSCAN",
				"keyPattern" : {
					"tags" : 1
				},
				"indexName" : "tags_1",
				"isMultiKey" : false,
				"multiKeyPaths" : {
					"tags" : [ ]
				},
				"isUnique" : false,
				"isSparse" : false,
				"isPartial" : false,
				"indexVersion" : 2,
				"direction" : "forward",
				"indexBounds" : {
					"tags" : [
						"[\"cricket\", \"cricket\"]"
					]
				}
			}
		},
		"rejectedPlans" : [ ]
	},
	"serverInfo" : {
		"host" : "Krishna",
		"port" : 27017,
		"version" : "4.2.1",
		"gitVersion" : "edf6d45851c0b9ee15548f0f847df141764a317e"
	},
	"ok" : 1
}
>

上面的命令产生了“ cursor”:“ BtreeCursor tags_1”,它确认使用了正确的索引。

索引子文档字段

假设我们要根据city,state 和  pincode 字段搜索文档。由于所有这些字段都是地址子文档字段的一部分,因此我们将在子文档的所有字段上创建索引。

要在子文档的所有三个字段上创建索引,请使用以下代码-

>db.users.createIndex({"address.city":1,"address.state":1,"address.pincode":1})
{
	"numIndexesBefore" : 4,
	"numIndexesAfter" : 4,
	"note" : "all indexes already exist",
	"ok" : 1
}
>

创建索引后,我们可以使用此索引搜索任何子文档字段,如下所示:

> db.users.find({"address.city":"Los Angeles"}).pretty(){
	"_id" : ObjectId("5dd7c927f1dd4583e7103fdf"),
	"address" : {
		"city" : "Los Angeles",
		"state" : "California",
		"pincode" : "123"
	},
	"tags" : [
		"music",
		"cricket",
		"blogs"
	],
	"name" : "Tom Benzamin"
}

请记住,查询表达式必须遵循指定索引的顺序。因此,上面创建的索引将支持以下查询-

>db.users.find({"address.city":"Los Angeles","address.state":"California"}).pretty(){
	"_id" : ObjectId("5dd7c927f1dd4583e7103fdf"),
	"address" : {
		"city" : "Los Angeles",
		"state" : "California",
		"pincode" : "123"
	},
	"tags" : [
		"music",
		"cricket",
		"blogs"
	],
	"name" : "Tom Benzamin"
}
>

查询分析

explain()

 操作提供了查询信息,使用索引及查询统计等。有利于我们对索引的优化。接下来我们在 users 集合中创建 gender 和 user_name 的索引:

> db.users.ensureIndex({gender:1,user_name:1})
> db.users.find({gender:"M"},{user_name:1,_id:0}).explain()

hint()

虽然 MongoDB 查询优化器一般工作的很不错,但是也可以使用 hints()
 来强迫 MongoDB 使用一个指定的索引。通过这种方法在某些情形下会提升性能。

范例:

指定使用 gender 和 user_name 索引字段来查询:

> db.users.find({gender:"M"},{user_name:1,_id:0}).hint({gender:1,user_name:1})

可以使用 explain()

 函数来分析以上查询:

>  db.users.find({gender:"M"},{user_name:1,_id:0}).hint({gender:1,user_name:1}).explain(

编程笔记 » MongoDB 高级查询与索引