搜索引擎技术研究 翻译国外搜索引擎文章 关注搜索行业动态 提供搜索引擎使用技巧和信息检索技巧


收藏本页到>> 新浪ViVi  365Key网摘   IE收藏夹 | 设为首页

Google 任何站点内部搜 关键字 站点地址
 中国搜首页>>搜索引擎技术>>介绍搜索引擎原理的好书:《搜索引擎-原理、技术与系统》

介绍搜索引擎原理的好书:《搜索引擎-原理、技术与系统》

作者: 为人民服务 日期:2005-8-07

这是一本好书:购买地址
这本书概括了北京大学计算机科学技术希望楼宇分布室自1996年以来的研究成果。其中许多段落来自同学的博士和硕士论文,他们是雷鸣、赵江华、冯是聪、单松巍、谢正茂、彭波、张志刚、龚笔宏、孟涛等。这些成果是国家九五攻关计划、973计划、985计划的一个,是开发天网搜索引擎的技术总结。
内容提要
本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构 建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜 索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设 ,计要点及其关键技术;最后介绍了面向主题和个性化的Web信息服务,阐 述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深 入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商 务等专业的研究生或高年级本科生的教学参考书和技术资料,对广大从事 网络技术、Web站点的管理、数字图书馆、Web挖掘等研究和应用开发的科 技人员也有很高的参考价值。
目录:
第一章引论
第一节 搜索引擎的概念
第二节 搜索引擎的发展历史
第三节 一些茂名的搜索引擎
第二章 WEB搜索引擎工作原理和体系结构
第一节 基本要求
第二节 见面搜集
第三节 预处理
第四节 查询服务
第五节 体系结构
第三章 WEB信息的搜集
第一节 引言
第二节 网页搜集
第三节 多道搜集程序并行工作
第四节 如何避免网页的重复搜集
第五节 如何首先搜集重要的网原则页
搜集
第七节 本章小结
第四章 对搜集信息的预见处理
第一节 信息预见处理的系统结构
第二节 索引网页库
第三节 中文自动分词
第四节 分析网页和建立倒排文件
第五节 本章小结
第五章 信息查询服务
第一节 查询服务的系统新风尚
第二节 检索的定义
第三节 查询服务的实现
第四节 本章洪炉点雪结
第六章 可指导性计划搜集子系统
第一节 天网系统概述和集中式搜集系统结构
第二节 利用并行处效搜集网页的一种方案
第三节 本章小结
第七章 网页净化与消重
第一节 网页净化与元数据提取
第二节 网页消算法
第八章 高性能检索子系统
第一节 检索系统基本技术
第二节 倒排文件性能模型
第三节 混合索引技术]
第四节 倒排文件缓存机制
第五节 本章小结
第九章 用户行为的特征及缓存的应用
第一节 用户查询与点击日志
第二节 用雇用行为特征的统计分析
第三节 查询缓存的使用
第四节 用户行为与用户特征
第十章 相关系统质量评伏
第一节 传统IR的相关排序技术
第二节 链接分析相关排序
第三节 相关排序的一种实现方案
第四节 索引名手 系统质量评伏
第十一章 中文网页自动 分类技术
第一节 引言
第二节 文档自动分类算法的类型
第三节 实现中文 网页自动分类的一过程
第四节 影响分类器性能的关键因素分析
第五节 天网目录导入服务
第六节 本章小结
第十二章 搜索引敬个性化查询服务
第一节 基于控掘的个性化技
第二节 天网和知名度系统
第十三章 而向主题的信息搜集与应用
第一节 主题信息的搜集
第二节 主题信息的一种搜集与处理模型及其应用
参考文献
附录术语
后记

(来自: http://www.zhongguosou.com)


  ©2004   www.zhongguosou.com