关于影响检索结果排序的得分公式的说明:

1、 搜索词拆分成一个或多个词条,然后按词条进行检索,而不是按搜索词本身进行检索,不能保证搜索词本身完全匹配的就一定排在前面(其他搜索引擎例如百度也不能保证)

2、 得分与各个词条在标题和内容中的命中次数的开平方成正比

3、 得分与整个文章中的词条总数开10次方成反比

4、 得分进行了粘连加权:如果搜索词中的各个词条在标题和正文中出现的位置接近,则得分乘以一个系数(直接紧挨加权40%,相隔不超过10个词加权20%,不超过50个词加权10%),例如搜索“台湾媒体”,则标题中“台湾媒体”“台湾的媒体”会加权40%,”台湾领导人对媒体说“加权20%。

5、 得分考虑了均衡命中:如果搜索词中的各个词条在标题和正文中出现的次数越接近,则得分越高,比如搜索“台湾媒体”,文档A中“台湾”出现15次,“媒体”出现5次,文档B中“台湾”和“媒体”各出现10次,则A的得分会比B的得分低

6、 标题的权重是内容的4倍

7、 一般正常提交的搜索需求主要含有的是名词或动词,代介谓助等很少,如果搜索词中主要是代介谓助则搜索结果质量不能保证

8、 如果要追求完全匹配优先,则可以使用双引号将搜索词括起来,建议在搜索框右边加“精确检索”的多选框,以实现完全匹配的功能。