多种检索方式

包括按图书检索、单篇资源检索、图片检索、全文关键词检索、跨库检索等资源多维度检索方式,可满足用户对数字内容资源的全方位提取和利用。

多维度智能检索包括按图书检索、单篇资源检索、图片检索、全文关键词检索、跨库检索等资源多维度检索方式,可满足用户对数字内容资源的全方位提取和利用。检索方式介绍如下:

1 .简单检索

基于高效的索引和排序算法,实现方便快捷的普通检索,将数据库中所有内容统一检索排序,并可按照分库检索、内容归类筛选排序。

同时,不同库(比如参考书和图表)有不同的倒排索引,可方便地进行统一检索和分库检索。统一检索时查找所有的索引库,而分库检索时则只检索相关的库。而且,在并行进行多路检索后采用多线程的归并算法,快速地进行多路归并,使得统一检索和分库检索都比普通的单库系统的顺序查找要高效很多。

同时,通过加Tag的方法来实现内容归类筛选排序,保证一次查询后可以高效地反复进行内容归类筛选。系统的Tag编码与分类对应,当进行内容归类筛选排序的时候,只有Tag符合对应类别的文档能过通过求交。

2. 精确检索/扩展检索

支持灵活的同义词配置,除了扩展词表的可配置外,是否使用同义词、使用哪些同义词表等均可配置。能够很好地实现精确检索时关闭Query的同义词扩展,扩展查询时则使用同义词库进行扩展检索。

3. 二次检索

为了能够快速、准确的反馈给用户二次查询结果,并按照相关对返回的结果进行排序,系统在用户查询提交索引库之前,会进行文本分析,对用户的查询语句进行分词。将分词后的多个结果在缓存中进行查询,对于命中缓存的直接返回缓存结果,没有命中的则进行索引查询,然后对查询返回的多个索引结果集暗中布尔逻辑关系合并,并对合并后的结果集进行排序。

1

4. 高级检索

系统支持上百种索引条件的复杂组合。同时支持灵活的检索结果展示,可以按相关度排序或时间排序,支持按照升序或者逆序排序,支持灵活的分页条数选择等。

支持精确检索或者扩展检索。

能够自由限定字段检索、不同字段之间布尔逻辑检索、限定学科检索、限定疾病分类检索、限定出版时间检索。

5 .图书检索

系统支持图文并茂的搜索结果展示。从数据库中检索书名,检索结果页样式同图书列表。即含有封面缩略图的展示形式。

6. 单本书内检索

系统针对单本书内的检索设计了单独高效的排序算法,既避免了重复计算无关紧要的标题、作者等重复域的相关度,又考虑了单本书内检索的独特性,包括查询词命中的频率、命中位置的距离、命中位置处于章节或段落的位置等信息,此外,如果命中的是定义性的片段或者综述性章节,对这些搜索结果还会适当加权以进一步提升用户体验。

用户在系统中浏览某一本书的时候可以进行当前图书内检索,查阅书中出现查询词的句子或片段(关键词有高亮显示),点击对应的搜索结果可以跳到书内对应的部分。

7 .人性化提示

提供人性化的检索服务,如拼音检索提示、检索词拼写检查、同音词拼写检查、 语义检查校正、相关检索词提示、检索结果分类展示。

8 .检索结果排序

支持搜索结果,按类别排序,并且可手动控制排序结果,支持多字段加权的相关性排序。