[摘要]从网络信息老化的定义、特点、产生的原因等方面对网络信息老化现象展开理论研究;并从网络信息效用价值的视角对中文期刊电子文献、网络新闻信息及网站链接进行实证研究,以揭示网络信息老化及其效用价值的动态规律。
[关键词]网络信息 网络信息老化 效用价值
[分类号]G203
1 引言
20世纪90年代,随着互联网技术的兴起和信息数量的激增,信息增长方式产生了极大的变化,网络信息老化问题逐渐成为关注的热点。笔者在中国期刊全文数据库中检索到,在1990~2009年间,篇名包含“网络信息”的检索记录有284991条,全文中包含“信息老化”和“网络信息老化”的命中文献各有899篇和29篇。可见,网络信息老化研究借鉴和继承了文献老化研究的思路与方法,但同时又有了新的发展。到目前为止,国内外学者对网络信息的一般理论,文献老化、文献计量学等领域的研究较多,而对网络信息老化的研究相对较少。
我国的网络信息老化研究起步于2003年发表的《关于网络信息老化研究的若干问题》一文,该文从文献信息老化与信息计量学角度初步探索了网络信息老化的研究内容、研究思路与方法。2005年发表的《网络信息资源老化规律研究》一文以团体性的网络资源为整体研究对象,进一步探索了网络信息老化现象,对网络信息老化指标做了较细致的分类。2008发表的《网络信息存续期研究》一文又进一步细化了网络信息老化的研究范畴,最早从理论与实证两方面初步探索了我国互联网信息的存续状态,大大推进了我国的网络信息老化研究进程。可以说,目前国内学界对网络信息老化研究已具备了基本的理论架构,并正在朝着加强网络信息老化的实证和应用研究的方向发展。本课题即是在这样的研究趋势下开展的。
本文在初步探讨网络信息老化的定义、特点及产生原因的基础上,从网络信息效用价值的角度,主要运用引文分析法对网络信息老化开展了实证研究,揭示了网络信息老化及效用价值的动态规律和特性,以期引导人们正确认识并积极应对信息老化现象,更为高效地利用网络信息资源,同时为信息生产者提高网络信息的效用价值提供新思路。
2 网络信息老化的理论研究
2.1 网络信息老化基本理论概述
2.1.1 网络信息老化的定义
段宇锋认为,“网络信息的老化是指网络信息资源中情报的有效价值随着时间的流逝逐渐衰减,利用率逐渐降低,这与传统文献的老化一样,是一种普遍存在的现象”。曾鸿认为,“信息老化是指信息的有效价值随时间流逝而衰减的现象”。
结合上述观点,笔者认为,网络信息老化是一种普遍存在的现象,是指网络信息的效用价值随着时间推移越来越低,人们对该信息的利用率随之越来越低的过程。网络信息老化的概念是随着文献信息老化概念以及网络信息计量学的发展而产生的。因此,在研究思路和方法上,网络信息老化研究在较大程度上借鉴了文献信息老化的研究。
2.1.2 网络信息老化的特点 网络信息数量大、更新快、信息源复杂、稳定性差等特点导致其老化现象非常复杂,呈现出较之传统文献信息老化所不同的特征:
?老化迅速。由于网络带宽的增长,网络信息的传播速度越来越快,时效性越来越强,旧的信息很快会被新的信息取代,网络信息老化的速度要比传统文献信息的老化速度快得多。
?动态循环。在网络环境中,由于时效性和各种因素的影响,网络信息的内容、地址、链接关系一直都处在动态变化之中。同时,网络信息的存在、更新和消亡存在一定的周期性,在循环变化中达到平衡。
?难以测度。传统的文献信息有固定的有形载体,其生产和传播易于管理。因此文献信息老化的研究对象明确,测度容易。而网络信息老化研究很难准确划定研究对象的范围,不易精确地计量其数量以及回溯其历史状态。
2.1.3 网络信息老化产生的原因
?网络信息总量的迅猛增长。CNNIC统计数据显示,从2003年开始,中国的网页规模基本保持翻番增长,截至2010年12月,网页数量达到336亿。网页作为网络信息的主要组织形式,其数量的大幅度增长,从某种程度上说明了网络信息总量的增长迅猛。这一趋势使得网络单位信息利用率降低,效用价值变小,也就产生了网络信息更快老化现象。
?网络信息的新陈代谢。人们对于信息的需求具有“喜新厌旧”的心理,新网络信息的出现加速了旧网络信息的老化,原来内容不全面,组织方式不科学的“陈旧”信息不断被全面的、精心组织的“新”信息所替代。研究表明,97%的网站6个月内会发生变化,99%的网站1年内会发生变化。
?网络信息的消亡。是指由于软硬件故障或人为因素导致网络信息内容无法访问和利用,网络信息的效用价值无法体现,“瞬间”完成老化的现象。对此大多数用户都有切身体会。经常会遇到不久前收藏的网页很短一段时间后就无法再打开。
?网络信息的边际效用递减。用户再次获取同类信息时,虽然信息的客观价值没变,但对于接收者的效用价值已经衰减。此外,时间也是制约网络信息效用价值的因素,如经济新闻、有奖竞答等实时信息都在特定时限内产生效用,“过期”信息的效用价值衰减。
此外,网络信息受性质、用途、技术进步的影响,用户个性化信息需求等因素也将导致网络信息老化现象。
2.2 网络信息老化的研究视角
网络信息资源的效用价值是指信息用户在利用网络信息资源过程中获取收益的大小。具体地说,网络信息的利用是网络信息含有的知识量消除了用户的不确定性,带来用户知识结构改善的过程,同时也是用户信息需求产生和满足的过程。当人们对网络信息需求旺盛时,对该信息的利用就多,其效用价值也就越大,此时,信息处于生长期。当人们对该信息的需求程度越来越小时,对该信息的利用就逐渐减少,其效用价值也就越来越小,此时,该信息逐渐老化。由此可见,网络信息老化是与其效用价值息息相关的。本文的实证研究将从网络信息效用价值的视角展开。
3 网络信息老化的实证研究分析
3.1 网络信息老化的实证研究
引文分析法是利用数学及统计学方法以及比较、归纳等逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。引文分析法的一项重要应用是评估文献的学术价值,其基本前提假设之一是:一篇文献的学术水平可由它被其他文献引用的次数来评定,被引用的次数越多,其学术水平就越高。换成信息老化的视角,可以将上一假设修正为:被引用数量越少,文献对引用者的效用价值也就越小,老化程度越高。
引文分析法同样适用于网络信息资源的老化研究。网络环境下引用与被引用关系的表现形式更加丰富。人们通过多种形式“引用”网络信息,如引用学术期刊电子版、评论网络新闻、论坛跟贴、设置网站链接 等。其中引用是最基本的,而评论、跟贴、设置链接、收藏等都是引用在网络环境下的延伸,是引用与被引用关系的特殊表现形式。
本文的实证研究基于如下假设:网络信息被利用得越少,其效用价值就越小。本假设中的“利用”对应于引文分析法中的“引用”,并且此“利用”是“引用”在网络环境下的广义延伸。为了与前面界定的网络信息老化概念中的“利用”保持一致,所以仍以“利用”行文。还要说明的是,网络链接是网络环境下一种重要的引用形式,针对网络链接的引文分析方法――链接分析法已经发展得相当成熟。本文的3.1.3部分运用了链接分析法,通过网站的入链数量变化情况来研究网络信息老化。
基于上述假设,笔者进行了中文期刊电子文献、网络新闻信息及网站链接这三种类型网络信息老化现象的实证研究。其他类型的网络信息,如Email、电子书、博客日志等,其实证研究方法和思路基本一致,无需赘述。
3.1.省略ki.net)的高级检索功能,输入具体日期(从1997一叭一叭到1997-12-31)以及文献来源(期刊名),从检索结果中随机选取10篇文献,查看其被引频次。统计结果如表1所示:
为了统一实验样本的统计分布性,便于比较不同期刊中文章被引次数,对表1中各期刊的观测数据分别在Excel中作归一化处理(设X是其中一个数值,Min,Max分别是这组数中的最小值和最大值,(X-Min)/(Max-Min)可归一到(0,1)之间),再乘以100,然后除以4,得到各年份总被引用次数的平均值,具体数据处理过程如表2、表3所示:
然后以年份为横坐标,以该年份总被引用次数的平均值为纵坐标,在Excel中得到折线图,如图1所示:
3.1.2 新闻信息被评论情况 新闻信息是众多网络信息中的一种,新闻一经发布,将被人们广泛阅读和评论,如果某条新闻信息被阅读评论的次数越来越少,则说明人们的关注度在不断减小,或者该新闻已经过时,其效用价值越来越小,该新闻信息逐渐老化。因此,可以通过观察分析新闻信息被评论情况来研究网络信息的老化现象。
从搜狐新闻(news.省略)2010年5月17-18日发布的新闻中随机选取10条跟踪观测。具体做法为:登陆搜狐网站新闻版块,随机选取10条新闻,点击选中新闻标题下方的“我来说两句”,便可转到评论页面,此页面自动记录了选中新闻的评论次数以及评论内容,统计每一条选中新闻发布后每2小时内被评论的次数,一共观测12次,观测结果如表4所示:
需要说明的是,新闻的评论体系是分层的,本实验的研究对象是对新闻本身的评论,对评论的评论不在考虑之列。
为了便于比较不同新闻的评论次数,对表4中各列的数据在Excel中作归一化处理,进一步得到各次观测数据的平均值,然后绘制搜狐新闻被评论情况折线图,如图2所示:
3.1.3 网站的入链数量变化情况网络信息老化研究需要确立网络结构单元的有用性度量指标,通常可以使用网络结构单元的被链接数来表示,被链接数一般通过大型网络获得。
入链(inlink)是指从其他网站链接到该网站的链接,可以视为其他网站对该网站信息的引用。一般来说,大型网站会被其他网站广泛的链接,如果该网站的入链数量越来越少,则说明对该网站信息需求在不断减小,其效用价值也就越来越小,这些信息就逐渐老化。因此,可以通过观察分析大型网站的入链数量变化来研究网络信息的老化现象。
从Alexa(alexa.省略)发布的全球综合排名前50位且中文排名前10位的网站中选取6个,使用Altavista搜索引擎来获取入链数。以新浪为例,在Altavista的搜索栏中输入“link:WWW.省略-host:sina.省略”指令即可。自2010年4月1日到4月30日,隔天采集一次网站的入链数,统计结果如表5所示:
为了便于比较不同网站的入链数量,对表5中数据作归一化处理,进一步得到各次观测数据的平均值,然后绘制网站入链数量变化情况折线图,如图3所示:
3.2 实证研究结果分析
将上面三条折线(分别记作L1,L2,L3)整合到图4中,可以发现三条折线的变化趋势大体一致,从而揭示了网络信息及其效用价值随时间变化的一般规律:即网络信息发布后,其效用价值会在较短的时间内快速达到最大值;随后在短时间内基本保持相对稳定,然后在较长一段时间内逐渐减小,直至趋近于零,这也就是网络信息老化的过程。
运用Microsoft Office Visio 2007将Ll,L2,L3拟合成网络信息的效用价值变化曲线,如图5所示:
图5中横轴表示时间,纵轴表示网络信息的效用价值,该曲线描述了网络信息从产生到消亡整个过程中效用价值变化的趋势。分析图5可以发现,网络信息产生之后在较短的时间内,被访问量迅速增加,人们对该信息的利用率迅速增高,其效用价值也迅速增加。在B点,网络信息的访问量达到最大值,网络信息的效用价值发挥到极致,表明该信息被充分利用。在B点附近较短的时间段内,访问量变化不大,网络信息的效用价值基本保持平稳。随后,网络信息的访问量开始进人下降阶段,直至趋近于零,人们对该信息的利用率越来越低,其效用价值也逐渐降低,直至趋近于零。在图5中,A-B段远远短于C-D段,因此可以初步推断,在网络信息从产生到消亡的整个过程中,有相当长的一段时间,其效用价值是逐渐降低的,说明网络信息老化过程占据其生命周期的更大比重。
4 网络信息老化实证研究的拓展
网络信息的效用价值是动态变化的。结合相关文献资料,笔者认为网络信息效用价值具有如图6所示的循环趋势
图6中E点表示逐渐衰退甚至接近于消亡的网络信息由于更新,外部环境的变化等原因,其效用价值被重新激活。例如,某网站因管理不当,内容长期不更新,访问量十分小,信息逐渐老化;后被一知名网站收购,网站的管理和维护加强,及时更新信息,该网站的访问量逐步回升。可见,网络信息的效用价值是循环的,但不同网络信息的效用价值循环周期不同。如某信息被系统完全删除,其效用价值将不能被重新被激活,循环终结。
还有一点值得提出,在E点被重新激活的效用价值已经变化,此效用价值非彼效用价值。例如,江苏省人事考试网上发布了2009年公务员招考信息,这条信息在一段时间内的效用价值是提供参考信息和报名指南,但自报名截止到发布2010年公务员招考信息之前,该信息的效用主要体现在参考性,而非报名指南。至于网络信息的效用价值如何被重新激活以及如何循环,笔者希望在后续研究中做进一步分析。