半岛客户端app官方登录印第安纳大学的网站Archive-It.org上
https://archive-it.org/collections/219
半岛客户端app官方登录印第安纳大学社交媒体账户在Archive-it.org上
https://archive-it.org/collections/8920
概述
印第安纳半岛客户端app官方登录大学印第安纳大学网站和社交媒体账户集合寻求保护和促进访问网站和社交媒体由行政办公室、学校、部门、服务单位、机构、中心,项目,和教师,学生和校友组织在印第安纳大学布卢明顿分校。此外,一些网站和占印第安纳大学办公室,负责操作系统级别的也被收集。半岛客户端app官方登录请注意,目前一些博客和/或其他社交媒体可能访问的网站收集。这些网站是之前爬社交媒体账户的创建集合。
引用网站的档案
请引用集合如下:
(标题)集合。由印第安纳大学图书馆网页档案存档半岛客户端app官方登录http://www.archive-it.org/collections/219<访问[日期]>
请引用单个种子或web页面如下:“学校的教育。“[标题]集合。由印第安纳大学图书馆网页档案存档半岛客户端app官方登录http://www.archive-it.org/collections/219<访问[日期]>
选择标准
范围:我们的目标是保护,使访问每个网站由一个单位在布卢明顿大学校园,和少数的网站和账户,重要的系统级的办公室。基于使用,选择社交媒体账户归档内容,网络爬虫的技术能力。的唯一原因,布卢明顿大学网站会被排除在外是如果网站密码保护,被机器人。txt或无法访问互联网档案馆的自动化系统。
体积:目前,有742个独特的域或种子被抓获。新种子经常添加的收藏。请求一个页面被存档在收集,请联系大学档案馆。
爬行参数
集合时间:
半岛客户端app官方登录印第安纳大学的网站开始日期:2006年7月1日
半岛客户端app官方登录印第安纳大学社交媒体账户开始日期:2017年5月11日
频率捕获:捕获的频率取决于频率的分析网站会随着时间而改变。预计大多数网站将爬在一个季度。几个活跃的站点会爬每月和一些不太活跃的网站将每年爬。
采集参数
深度:完整的网站,如果可能的话。
宽度:链接是跟着一个外部级别。
搜索
它存档所有公共集合提供全文检索功能。或者,如果你知道你正在寻找的网站,在搜索框中输入URL,它存档存档的URL将搜索实例。
它存档2.0版(2006年7月24日)使搜索的网站和元数据的全文已经分配给种子,或者个人的URL。然而,搜索元数据元素的能力是不向公众开放。
搜索工具用来提供全文访问图书馆的Web归档集合是由开源搜索引擎,Nutch。
在搜索一些提示:
- 一般来说,搜索结果排名根据几个因素相关:
- 查询项出现在页面的频率相对于出现的频率,整个收集
- 多长时间查询术语出现在页面的长度相比
- 是否查询项出现在URL
- 是否查询项出现在主机名
- 布尔搜索默认。
- 如果你知道你正在寻找在一个特定类型的文件,你可以限制你的搜索只是格式通过添加类型:【文件类型】你的搜索条件。例如,赫尔曼·威尔斯PDF文档可能被发现使用以下字符串:赫尔曼·威尔斯类型:PDF。
- 如果你想了解一个主题讨论具体存档的网站上,你可以限制你的搜索通过添加网站:[存档网站的URL]你的搜索条件。例如,大卫·贝克的网站:www.music.indiana.edu/会发现提到大卫•贝克在音乐学院的网站。
- 你可以在以下方面改进搜索结果:
- 其他版本的链接将带你去一个被俘的存档版本列表在不同的日期。
- 更多的……链接将带你去其他主机。
印第安纳大学图书馆以半岛客户端app官方登录来只存档网站自2006年春季以来,您可能希望寻找的早期版本在图书馆网站的许多集合通过互联网档案馆的将军机器Wayback。然而,机器Wayback不是文本搜索;你必须知道网站的URL,您想要的观点。
联系信息
国际单位图书馆大学档案馆
档案@印第安纳州。edu
地点: