内容简介
《这就是搜索引擎:核心技术详解》是一本深入探讨搜索引擎技术的专业书籍。书中详细介绍了搜索引擎的核心技术,包括爬虫技术、索引技术、排序算法等。
作者通过丰富的实例和详细的代码解析,帮助读者深入理解搜索引擎的工作原理和实现方法。无论是对搜索引擎技术感兴趣的初学者,还是希望深入了解搜索引擎内部机制的专业人士,本书都是一本不可多得的参考书。
目录
为什么会有这本书
这本书是写给谁的
1.2 单词词典
1.3 倒排列表(Posting List)
第2章 链接分析
2.1 Web图
2.2 两个概念模型及算法之间的关系
2.3 PageRank算法
2.4 HITS算法(Hypertext Induced Topic Selection)
2.5 SALSA算法
2.6 主题敏感PageRank(Topic Sensitive PageRank)
2.7 Hilltop算法
2.8 其他改进算法
本章提要
本章参考文献
第3章 网页反作弊
3.1 内容作弊
3.2 链接作弊
3.3 页面隐藏作弊
3.5 反作弊技术的整体思路
这本书是写给谁的
1.2 单词词典
1.3 倒排列表(Posting List)
第2章 链接分析
2.1 Web图
2.2 两个概念模型及算法之间的关系
2.3 PageRank算法
2.4 HITS算法(Hypertext Induced Topic Selection)
2.5 SALSA算法
2.6 主题敏感PageRank(Topic Sensitive PageRank)
2.7 Hilltop算法
2.8 其他改进算法
本章提要
本章参考文献
第3章 网页反作弊
3.1 内容作弊
3.2 链接作弊
3.3 页面隐藏作弊
3.5 反作弊技术的整体思路
免责申明:
1. 本站分享的所有书籍均来源于自互联网,我们只进行收集整理,并不对书籍内容进行更改。
2. 部分书籍中可能有书籍压制者放置的广告,这并不是本站所为,请注意甄别。
3. 我们分享这些书籍,纯粹是出于知识分享的热情,以及对互联网分享精神的高度认同和践行,没有任何商业目的。
4. 本站分享的所有书籍,仅供个人学习研究使用,请勿用于任何商业用途,否则产生的一切法律纠纷与本站无关。
5. 如果这些书籍让你有所收获,在条件允许的情况下,请一定购买正版书籍,这是对创作者最好的支持。
6. 如果您是此书籍的版权所有者,且您不希望此作品出现在本站,请联系我们,我们将在收到您的请求后48时间内予以删除。
1. 本站分享的所有书籍均来源于自互联网,我们只进行收集整理,并不对书籍内容进行更改。
2. 部分书籍中可能有书籍压制者放置的广告,这并不是本站所为,请注意甄别。
3. 我们分享这些书籍,纯粹是出于知识分享的热情,以及对互联网分享精神的高度认同和践行,没有任何商业目的。
4. 本站分享的所有书籍,仅供个人学习研究使用,请勿用于任何商业用途,否则产生的一切法律纠纷与本站无关。
5. 如果这些书籍让你有所收获,在条件允许的情况下,请一定购买正版书籍,这是对创作者最好的支持。
6. 如果您是此书籍的版权所有者,且您不希望此作品出现在本站,请联系我们,我们将在收到您的请求后48时间内予以删除。
📖 支持知识自由流动
这本书的持续提供,需要服务器运行成本支持(约 3.7元/小时)

