MongoEngine - 文本搜索


MongoDB 支持使用查询运算符对字符串内容执行文本搜索。如前所述,要设置一个带有$符号的索引前缀名称的文本索引。对于文本索引,索引字段的权重表示该字段相对于其他索引字段在文本搜索分数方面的重要性。您还可以在类的元字典中指定默认语言。

支持的语言列表可以在https://docs.mongodb.com/manual/reference/text-search-languages/找到。 MongoEngine API 由 QuerySet 对象的search_text()方法 组成。要在索引字段中搜索的字符串作为参数给出。

在下面的示例中,我们首先定义一个名为 lang 的 Document 类,它具有两个字符串字段:语言名称及其特性。我们还在两个字段上创建具有各自权重的索引。

from mongoengine import *
con=connect('newdb')

class lang (Document):
   name=StringField()
   features=StringField()
   meta = {'indexes': [
      {'fields': ['$name', "$features"],
         'default_language': 'english',
         'weights': {'name': 2, 'features': 10}
      }]
   }

l1=lang()
l1.name='C++'
l1.features='Object oriented language for OS development'
l1.save()
l2=lang()
l2.name='Python'
l2.features='dynamically typed and object oriented for data science, AI and ML'
l2.save()
l3=lang()
l3.name='HTML'
l3.features='scripting language for web page development'
l3.save()

为了执行“面向”一词的搜索,我们采用 search_text() 方法,如下所示 -

docs=lang.objects.search_text('oriented')
for doc in docs:
   print (doc.name)

上述代码的输出将是其描述中出现“orient”一词的语言名称(在本例中为“Python 和”C++”)。