搜索引擎采用的搜索模型

搜索引擎采用布尔模型和向量空间模型相结合进行信息检索,布尔模型的检索效率高,易于实现;向量空间模型可以提高检索的相似度,通过相似度排序可以大大提高查询效果。因此,搜索引擎结合了两者的优点,完整的检索过程如图6-3所示。

如图6-3所示,图中的块为计算部分,斜块为数据部分。具体检索过程如下。

搜索引擎采用的检索模型

1对查询词进行分段以获得逻辑表达式。例如,查询“enter the search engine”将被分割为“enter”和“search engine”。并将其转化为一个用And逻辑表示的表达式,即“walk into”和“search engine”。
2。采用布尔模型的方法得到结果文档列表,如从倒排索引中提取包含“entering”关键字的文档列表和包含“search engine”关键字的文档列表。同时,通过对检索到的文档列表的交集得到同时包含“in”和“search engine”的文档列表。
3。将步骤(2)中得到的文档列表中的所有文档和查询词分别矢量化,计算向量之间的相似度。
4。根据相似度输出检索结果。
综上所述,整个过程包括分词、doclist交集、向量化和向量角度计算与排序,这四个计算依次完成。在查询系统中,我们介绍了分词的计算,这里不再赘述。接下来的两部分将介绍序时簿交集的计算方法和排序结果的技巧。

版权声明:本文由守候(www.rc58.com.cn)发表于 2020年07月02日 ,本文共:563字
转载请注明,本文转载自守候网络工作室:搜索引擎采用的搜索模型

在线留言

说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!