众果搜的博客

脚踏大地,仰望星空,致力于在线网络工具的开发与普及,以及其他思考

Search(博客搜索)

热文排行

最近发表

最新评论及回复

« 网站地图创建(以前网页存档,原网页调整后删除)彭大帅选牛股九大原则 »

历史网页查询(互联网的档案馆-原页面存档)

历史网页搜索:互联网存档(intenet archive)正在建立一个互联网站点和其他文化艺术的数字形式的数字图书馆。就像一个真正的图书馆,向研究者、学者、历史学家和普通公众提供免费访问。WayBackmachine提供的互联网存档是对历史网页记录存储,允许你通过网页的地址进行查询。其数据库中存有自1996年以来上40多亿个网页,搜索结果提供收集网页的日期。这些历史数据的收集,对于学者研究事件和人们行为之间的互动来说是无价的。在下面输入网页或者站点的地址,按下搜索按钮即可返回历史网页。目前不支持关键字查询。包含中文网页。

国内历史网页:“北大燕穹”包括“天网中英文网页和文件搜索引擎”“中国网页信息博物馆”和“中文数字财富大全库”等三个子系统。该平台现收藏有自2001年以来约5亿中国互联网上的网页,每天还以约20万网页的数量增加;有从2001年以来约4000万条搜索引擎访问日志,并有近1万本图书、2000多部电影电视、2万多首歌曲乐曲、10万多张照片图片,以及其它多种数字资源,实现了10万亿字节容量的数字资源积累。 北京大学从1999年开始大规模收集、整理中国互联网信息,并将这些数据赠给清华大学、中科院、上海交大等科研院所和高校用于各种研究,使该平台成为我国多学科科研人员从事互联网信息研究的实验场。此外,北大还帮助香港城市大学建立起香港地区第一个大规模中文搜索引擎,方便了香港地区通过互联网更多地了解和参与国家的发展。中国Web信息博物馆:输入URL,浏览永久保存的历史网页,欣赏旧时网页的风采. 畅游昔日网站,随意纵横比照,品味网络世界的兴衰变迁 。关注重大历史事件,将发展进程历历览尽,感受时代的进步 .申请网页数据,研究深层联系,挖掘信息世界的潜在秘密。

网页快照:实际上百度或者Google的搜索引擎存放的是网站网页的前几天的快照(网页的缓存),你搜索的时候,搜索引擎在这些快照中寻找你的输入相匹配的搜索结果,同样,你也可以查看这些快照,在每个搜索结果末尾,有百度快照,Google快照字样,单击这些链接,出现的就是几天前的网页(搜索引擎缓存的网页),但是只有一份,就是搜索引擎一个网页地址只保留一份其抓取的最新的网页快照。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-Blog 1.8 Spirit Build 80722 Code detection by Codefense

Copyright www.zhongguosou.com. Some Rights Reserved.