编辑: 达达恰西瓜 | 2017-10-08 |
5 .
2 . 7实现了分摘要和全文两种模式搜索 在传统搜索引擎中,都是对网页全文进行搜索,这可以 保证搜索结果的全 面性, 但用户会面 对数 万条搜索结果, 对用户 有用的也就前1
0 0条而己.因此 本系统提出两种搜索模式,即摘要搜索和全文搜索.全文搜索和传统搜索引擎 没什么差别,很好理解.摘要搜索就是只搜索摘要的信息,网页的摘要无疑代 表了该网页的和信息,因此搜索到的结果也是最具有价值的.显然,摘要搜索 在同一个关键词下得到的搜索结果数量要小于全文搜索,但是都是相关性极强 的结果,可以帮助用户迅速找到需要的信息.如果在摘要中找不到需要的信息, 系统还会提示你在全文中进行搜索.
5 .
2 . 8实现了相关度和发布时间两种排序结果 在众多的搜索结果中,有时我们需要相关度优先的排序方式,有时我们对 实时性要求较高,需要按照发布时间进行排序.因此,本系统实现了这两种排 序方式,供具有不同需求的用户选择使用.
5 .
2 . 9增加了网页快照功能 由于L uc en e仅仅是一个开源工具包, 距离搜索引擎实际应用还有较大距离, 并没有提供搜索引擎常见的网页快照功能.本系统根据实际需求,开发了网页 快照功能,使得用户在网页连接失效的情况下仍然可以访问到该网页.在下一 章的性能测试截图中我们会看到这一功能.
5 . 2系统架构设计 本系统采用 B / S 架构和 C / S 架构相结合的方式.后台数据的采集、封装、 索引采用C / S架构,便于管理员进行集中的管理.前端用户访问使用B /S 架构, 用户可以使用 W e b浏览器进行访问. 用户可以选择在摘要和全文中进行搜索,还可以选择按时间顺序或相关度 顺序对搜索结果排序.对用户输入的关键字, 给予高亮显示,方便查阅. 后台系统每隔一定时间就从 R S s 重新抓取新的信息,并更新索引,使用得 到的信息具有较强的实时性.
5 . 3本童小结 第5 章 系统设计与系统实现 本章论述了系统的设计和实现,对本系统实现的九大创新点进行了概括性 总结,并对整个系统使用的架构做了论述,随后我们会对这些创新点的性能进 行测试与分析.