飞雪连天射白鹿,笑书神侠倚碧鸳

青山相待,白云相爱,梦不到紫罗袍共黄金带。

一茅斋,野花开,管甚谁家兴废谁成败,陋巷单瓢亦乐哉。

贫,气不改!达,志不改!

飞雪连天射白鹿,笑书神侠倚碧鸳

近期博客

近期项目

近期动态

近期论文

「论文阅读」基于倒排索引和字典树的站内搜索引擎的设计与实现

随着互联网的不断发展,快节奏的生活,人们对更好的用户体验的追求, 搜索的长时间等待变得让人无法忍受。如何获得更快的搜索、更好的搜索结果、 更符合用户心理的推荐成为很多网站、手机应用的痛点。本项目意在通过建立 倒排索引加快搜索,使用字典树结构快速找到联想词,二者相结合的方式提供 良好的搜索体验。完成一个独立的站内搜索引擎,使得项目可以快速的移植到 不同的系统中,提高开发速度,降低开发成本。本项目主要完成一个轻量级站内搜索引擎。系统主要分为两大部分:第一 部分为全文索引引擎,主要负责从数据源建立倒排索引、以有效的格式保存索 引、增量更新索引、索引的压缩、搜索排序等功能; 第二部分主要为拼音搜索 引擎,主要完成关键字检索、模糊查询、拼音联想等功能;此外完成系统对外 的相关接口。主要的工作内容是:独立完成对整个站内搜索引擎需求分析、系 统设计、系统实现以及测试等工作;完成了系统的 8 大核心功能模块,2 个辅 助模块以及所有对外的接口。具体包括(1)文档数据源获取,(2)倒排索引的建立 与压缩,(3)倒排索引更新,(4)倒排索引的查找,(5)搜索排序,(6)拼音转化功能 的实现,(7)拼音搜索 Trie 建立,(8)拼音联想词的查找,以及辅助功能如高亮显 示、相关推荐等功能。