图书馆图书馆数字资源访问统计研究(统计学范文)

访问统计  时间:2021-01-28  阅读:()

论文范文

《图书馆数字资源访问统计研究》Word格式可编辑可修改

精心整理放心阅读欢迎下载

文档信息

图书馆数字资源访问统计研究

1图书馆数字资源访问统计的现状

;典型的研究计划

;美国和欧盟针对图书馆数字资源的访问统计已经展开了一些针对性的研究计划 比如 由美国研究图书馆协会资助的E-Metric项目、美国多个机构包括ARL、 JISC、 NISO等资助的COUNI ER项目、欧盟Telematics for Libraries Programme支持的EQUINOX项目等这些项目多为研究制定描述电子信息服务和资源的统计指标和绩效测度及其方法。

;相关标准

;在相关的标准方面面对新的信息环境和图书馆形态一些组织开始尝试将新的电子资源绩效评估标准融入原有相关标准指南的框架。例如NISO在2004年批准了图书馆和信息提供者信息服务和利用的测度和统计数据字典(NISO Information Services and

Use:Metrics & statistics for libraries and infomationprovide--Data Dictionary) 该标准在传统图书馆工作的基础上还特别增加了网络服务、网络资源、 网络运行的新的测度方法这套数据字典将逐渐纳入美国图书馆统计工作成为美国图书馆统计工作的参考依据

; ICOLC 1998年制定的《网上索引、文摘和全文资源使用统计测度指南》 (Guidelines for Statistical MeaSures of Usage of Web-Based Indexed Abstracted and Full Text Resources)提供了一套网络化信息资源使用的绩效测度指南。 2001年的修订版明确了网络信息使用数据统计的最基本要求并提供在隐私、保密、获取、传递和报告形式方面的指导。

; ISO ISO/CD 11620也在传统服务统计指标的基础上结合ICOLC和COU NTER的研究进行了图书涫数字资源测度及其定义、方法的描述。

; 国内图书馆数字资源访问统计的研究和应用

; 国内随着公共图书馆、大学图书馆、科学图书馆系统图书馆评估工作的进行 图书馆界开始逐步重视对图书馆数字馆藏、 图书馆数字化信息服务的评估。

;参考文献2中提出了数字资源后评估的概念但是对图书馆数字资源访问统计等后评估的方法和指标体系尚未全面展开评论。一些图书馆自行开发了基于jsp或者asp的图书馆网站访问统计软件一些数字图书馆系统如清华同方的TPI、北京拓尔思的T、浙江天宇的CG等等也提供了相应的统计功能但是尚没有一款商业化的软件针对图书馆的各种类型的数字资源提供一揽子的访问统计方案。

; 2图书馆数字资源访问统计的方式

; 日志方式

; web服务器在工作时时刻将WWW访问的结果记录在一些log

日志文件中通过对服务器日志的分析可以得到以下信息

; (1)通过对访问时间进行统计可以得到服务器在某些时段的访问情况

; (2)对访问者的IP进行统计从中可以判断主要是那些用户在访问Web服务器

; (3)对访问请求的错误进行统计和分析可以找出有问题的页面加以改正

; (4)对访问者清求的URL进行统计就可以判断出读者对那些页面的内容最感兴趣对哪些页面的内容不感兴趣。

;各种web服务器日志文件的格式和内容大致相同。根据W3C的际准[2] 一般Web日志都包括诸如用户的IP地址、请求时间、方法

GET/POST等 、被请求网页或文件的URL、发送接收字节数、协议版本等信息。表1列出了几种不同类型的Web日志。

;但这些日志文件信息量很大用户难以直接从log文件获得直观的结果。对日志文件的分析可以借助一些商业性的或者源代码开放的软件完成。其中比较好的开放源代码的日志分析软件有 AWStats、webalizer等。

;从日志文件提供的信息进行统计和分析就可以对整个网站有一个数字化、精确的认识从而对网站的设计和内容进行改善和调整使图书馆网站更好地为读者提供服务。

;资源提供商提供

;数据库的使用情况属于后评估指标主要用于更新、续订数据库时使用一般在图书馆购买资源提供商的数字资源时应该要求由出版商或数据库商提供使用报告再据此进行各类分析。

; 目前出版商数据库商提供的统计报告常用的相关统计指标有

;①检索次数(searfh/query) 用户在某一个数据库中提出检索式的次数。

;②登录次数(sessioign on) 用户打开某个数据库的次数。

;③文摘全文(abstract/fulltext page/image) 用户在某一个数据库中到本地客户机中的文摘或全文篇数。

;通过网络代理proxy

;代理服务器(Proxy Server)是一种服务器软件它的主要功能有设置用户验证和记帐功能可按用户进行记帐没有登记的用户无权通过代理服务器访问Internet网可以对用户的访问时间、访问地点、信息流量进行统计。

; 目前代理服务器软件产品十分成熟功能也很强大可供选择的服务器软件很多。主要的服务器软件有WinGate公司的WinGate Pro、微软公司的Microsoft Proxy、 Netscape的Netscape Proxy、

Sybergen Netwo rks公司的SyGate等这些代理软件不仅可以为局域网内的PC机提供代理服务还可以为基于Novel l网络的用户甚至UNLX的用户提供代理服务。 目前绝大部分Intemet的应用都可以通过代理方式实现。大多数代理服务器软件产品具有登记内部网用户访问外部网的日志记录有些产品还可以直接将日志记录到数据库中。根据日志记录文件或数据库可以统计内部网每个用户的网络流量以及上网时间甚至可以按服务网络类型如 HTTP、 SMTP、 FTP等分别进行统计。

;利用脚本语言自行开发

;通过web服务器的日志可以获得用户访问图书馆网站信息的情况但是这种方式需要对日志的格式进行了解然后用相应的工具软件或者进行一定的开发来完成。还有一种获取网站访问情况的方法是利用asp或者isp等网络脚本语言利用它们内置的server、session、 request对象等获取相关的信息获取数据进行统计。比如利用Jsp我们可以用Jsp的内置request对象的获取参数方法Parameter("userid") 获取用户名用( Remote Addr)获取访问者的IP地址通过Header("User-Agent")获取包含浏览器和操作系统的信息然后用字符串分割substring()方法来分别得到浏览器和操作系统通过Jsp的内置对象session的方法session get Creation-

Time()返回Session被创建的时间而Last Accessed Time()则返回当前Session对象最后被客户发送的时间两者之差为停留时间。

;主要分以下几个开发步骤

; (1)确定将要统计的信息

; (2)建立数据库

; (3)实时的访问信息纪录记录每次点击的信息包括页面信息、用户信息、访问IP、访问时间

; (4)实时信息的分类存储

; (5)显示方式的选择。可以用Windows的表格系统也可以自行编制表格显示。

;利用这种方法相对比较简单但是可获得的统计指标也有限。

;除了上述几种统计方式外还有基于路由器的流量统计、基于防火墙的流量统计、基于以太网广播特性的流量统计。但是这些方法所提供的简单流量的统计功能不能完全满足图书馆数字资源访问统计的目标。

; 国际图书馆联盟的统计指标指南

; 国际图书馆联盟认为信息资源提供商对他们提供的特定的电子信息资源所提供的统计数据应该满足以下的最低需求。

;必须提供的数据元素是

; a)会话(session)数量或者登陆数量 number of sessio。为了满足政府机构和专业组织的报告的需要应该提供会话数量或者登陆数量。在没有国界的网络环境中会话数量的统计是一个粗糙的指标。

; b)提问数(number of queries)  即经过分类的提问数量。一次检索是一次独立的知识查询。典型地一次检索被记录为向服务器提交的一个检索表单之后的浏览行为或者选定一个单独条目的行为没有表现为额外的检索除非通过提交二次检索。立即进行重复的检索、双击或者其他用户的无意识行为都不应计入其内。

; c)菜单的选择数(number of menu selectio) 如果数据的显示需要通过使用菜单来进行浏览则应该提供这个指标如一个电子期刊网站提供的基于音序和主体的菜单选择

; d)全文的数量打开的、的或者提供给用户的全文这些全文都是由服务器控制的而不是由浏览器控制的

;期刊文章按照期刊名称列出刊名和issn

; 电子书——按照书名列出书名和isbn

;参考资料——按照改资源的内容单元如字典的定义、百科全书的文章、传记等

;非文本型资源——按照自愿的文献类型如图像、音频、视频等

;上述的每个数据元素应该按照每个特定的数据库提供商、按照每一组机构的IP地址或其他特别的元素如账号  以及机构名称、协会名称和时间跨度每月或者每年分组描述供应商还应该提供每天、每小时的统计数据并且还应该可以动态地集成几个月或者某一段时间的数据而不用限制是当年数据还是由供应商限定的时间段。

;推荐的统计指标

;为了了解图书馆数字资源的使用情况确定数字资源的花费是否合理 MRL的E-Metrics项目推荐的指标如下

; (1)用户可检索的电子资源。包括 R1电子全文期刊种数、 R2电子参考资源种数、 R3电子书的种数。

; (2)对网络资源和服务的使用情况。包括 U1电子参考事务的数量、 U2登录电子数据库的数量会话ses sion数 、 U3电子数据库的提问和检索数量、 U4电子数据库的请求条数、 U5对图书馆网站和书目的远程访问次数。

; (3)网络资源和相关设备的花费。包括 C1全文电子期刊的成本、 C2电子参考资源的成本、 C3电子书的成本、 C4图书馆对书目设备、 网络环境等相关设备的花费、 C5对书目设备、网络环境等相关设备的外部花费。

HostDare($33.79/年)CKVM和QKVM套餐 可选CN2 GIA线路

关于HostDare服务商在之前的文章中有介绍过几次,算是比较老牌的服务商,但是商家背景财力不是特别雄厚,算是比较小众的个人服务商。目前主流提供CKVM和QKVM套餐。前者是电信CN2 GIA,不过库存储备也不是很足,这不九月份发布新的补货库存活动,有提供九折优惠CN2 GIA,以及六五折优惠QKVM普通线路方案。这次活动截止到9月30日,不清楚商家这次库存补货多少。比如 QKVM基础的五个方案都...

Megalayer优化带宽和VPS主机主机方案策略 15M CN2优化带宽和30M全向带宽

Megalayer 商家主营业务是以独立服务器和站群服务器的,后来也陆续的有新增香港、菲律宾数据中心的VPS主机产品。由于其线路的丰富,还是深受一些用户喜欢的,有CN2优化直连线路,有全向国际线路,以及针对欧美的国际线路。这次有看到商家也有新增美国机房的VPS主机,也有包括15M带宽CN2优化带宽以及30M带宽的全向线路。Megalayer 商家提供的美国机房VPS产品,提供的配置方案也是比较多,...

MOACK:韩国服务器/双E5-2450L/8GB内存/1T硬盘/10M不限流量,$59.00/月

Moack怎么样?Moack(蘑菇主机)是一家成立于2016年的商家,据说是国人和韩国合资开办的主机商家,目前主要销售独立服务器,机房位于韩国MOACK机房,网络接入了kt/lg/kinx三条线路,目前到中国大陆的速度非常好,国内Ping值平均在45MS左右,而且商家的套餐比较便宜,针对国人有很多活动。不过目前如果购买机器如需现场处理,由于COVID-19越来越严重,MOACK办公楼里的人也被感染...

访问统计为你推荐
苹果x和xr哪个好苹果x,苹果xs,苹果xr,苹果xs max哪个更值得买?华为p40和mate30哪个好mate30 5G和p40 5G有什么区别?宝来和朗逸哪个好朗逸和宝来那个比较好些各方面绝地求生加速器哪个好绝地求生用什么加速器比较好?炒股软件哪个好最好的炒股软件是哪个?电陶炉和电磁炉哪个好电陶炉和电磁炉哪个好播放器哪个好哪个播放器最好云盘哪个好哪个网盘好用 而且下载速度快 还免费空间登录页面登录QQ空间时,如何使登陆界面不直接进入个人中心?飞信空间登录移动飞信客户端怎么登陆???
深圳虚拟主机 主机优惠码 赵容 宕机监控 dropbox网盘 合肥鹏博士 ca4249 柚子舍官网 hkt vul 免费ftp 论坛主机 中国电信测速网站 lamp的音标 酸酸乳 美国迈阿密 创速 七牛云存储 杭州电信宽带 webmin 更多