大学生搜索引擎使用行为研究|搜索引擎营销中的用户行为研究

  [摘要]通过问卷调查的方法,对高校学生使用搜索引擎的行为进行实证研究。研究发现:大学生在使用搜索引擎时,较少使用高级搜索功能;在浏览搜索结果时,近一半大学生只会点击查看3页以内的搜索结果;从时间上来看,不愿让检索时间超出半小时的人占74.9%。同时相关性分析显示,上网频率会对大学生在使用搜索引擎时关键词的输入情况以及逻辑检索功能的使用情况产生影响;上网时间则会对大学生愿意花费多少时间去浏览检索结果产生影响。
  [关键词]高校学生 搜索引擎 使用行为
  [分类号]G20
  
  1 引言
  
  自20世纪中叶以来,对用户信息需求及相关信息行为的研究日益受到研究者的广泛关注。1959年Bruce Westley和Lionel C.Barrow提出,用户信息查寻模式应重点研究个体对信息查寻时的心理行为与确认决定行为的因素上。他们把“信息查寻”当做因变量,试图找出其影响因素。此后,来自图书情报学以及新闻传播学领域相关的研究层出不穷。特别是近年来随着网络信息环境的发展,用户信息查寻行为的研究更逐渐成为当前图书情报学以及新闻传播学的一个热点。英国牛津大学出版社出版的著名的传播学期刊Human Communication Research 2002年第28卷第2期出版了针对用户信息查寻行为进行探讨的专辑。同时,在国内也有一些研究者注意到了网络信息环境中用户信息查寻行为的研究价值。陈力丹就曾指出:“传统的讨论用户寻找、处理所需信息的复杂过程(心理的、程序的和策略的)的‘信息查寻模式’理论,对于分析在互联网上查寻信息时的用户状况就有重要参考价值”。
  本文将研究的重心聚焦于目前网络信息查寻中备受研究者关注的搜索引擎使用行为。搜索引擎由于其独特的功能及效果,是目前互联网服务中最受经营者和使用者关注的一种服务,对它的研究将有助于进一步提高搜索引擎的功效,同时也有助于深入了解网络用户的使用行为,认识和把握这些行为将会为网络信息资源管理以及网络传播服务的改进提供参考依据。
  CNNIC2010年7月最新公布的中国互联网发展状况统计报告显示,中国的网络用户已达到4.2亿,其中30岁以下网民占到近60%。在这个年龄群体中,最具代表性的应该是大学生,他们也是中国最先接触和最先接受互联网的群体之一。因此,本文选择大学生这一特殊群体作为研究对象,希望通过对大学生搜索引擎使用行为的研究,丰富我国网络用户的研究。
  
  2 文献探讨
  
  关于搜索引擎使用行为的研究目前深受关注,大部分的研究者都会基于特定搜索引擎的检索日志记录来分析用户的检索行为。例如早期Bernard J.Jansen通过对五个搜索引擎(Alta Vista,Excite,FAST Search,Infoseek,Northern Light)的记录分析,研究了检索提问式的复杂性对检索结果的影响,发现提问复杂性的增加对检索结果的改善并不大,从学习使用高级检索所付出的努力和可能出错的危险来看,可以放弃对复杂提问式的要求。他提出网络信息检索服务应在检索界面和结果的排序机制上大下功夫,以迎合用户的检索习惯。
  
  之后,Eastman等人通过大量试验并与搜索日志进行对比分析,发现高级搜索方式的作用并不像大家想象的那么乐观。他们主要对“AND”、“OR”、“MUSTAPPEAR”以及“PHRASE”四种高级方式进行观察,发现采取高级搜索方式确实影响了搜索的范围(Cover-age),但是搜索结果的相关度(Relevance)并没有显著增高。Zhao等人通过分析搜索日志,发现搜索流量的周期性规律,并对搜索日志中的查询和对应点击的URL建立无向有权连通图,采用图论的相关算法检测特殊事件的发生。
  近年来,王建勇等人通过对我国天网中英文搜索引擎的查寻日志的分析得出用户查寻行为的分布特征。他们分析了相邻N项查询词的偏差,发现用户查询项分布过程具有自相似性,并以此提出高速缓存替换策略。此外他们还分析了网页被访问次数与网页的镜像数、网页的人度以及网页目录的深度之间的关系。邓小昭则对用户使用中国知网(CNKI)和Google中文搜索引擎的查寻行为进行了研究。余慧佳等人对Sogou搜索引擎在一个月内的近5000万条查询日志进行了分析,分别从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。陈红涛等人也针对Sogou搜索引擎一个月内的日志重点分析了用户输入搜索词的一些规律,还提出了用户提交搜索词的模型,给出了历史搜索词对搜索结果的影响因子算法。
  此外,也有部分研究者从使用者的角度分析用户选择检索工具的考虑因素。通过问卷调查,JasonVaughan归纳出两类影响人们选择检索工具的因素:①方便性因素,即用户使用检索工具的容易程度,涉及到检索工具的界面设计、帮助文件的提供、检索速度、用户过滤检索结果的意愿、返回结果的显示格式等因素;②效用性因素,即结果的有用性、全面性和准确性,它包括检索结果的数量、结果的准确性、想要的结果出现的位置、检索功能项的多少及灵活性、数据库标引的扩展性、数据库覆盖面的广泛性、数据的时效性等。
  Dania Bilal对少年学生利用搜索引擎的认知行为和物理行为进行了研究,发现这些学生在信息检索上都存在困难,犯有各种类型的错误,包括在不支持自然语言检索的系统中使用自然语言来构建提问,检索提问太宽泛或太狭窄,拼写错误,忽略相关链接,很少浏览相关信息,等等。
  
  综观目前关于搜索引擎使用行为的研究,可以发现从使用者角度进行的搜索引擎使用行为的研究主要集中在国外,他们的研究结果,由于网络用户文化之间的差异,并不能完全适用于我国的网络用户;同时目前也较为缺乏对特定用户群体的研究。理论上而言,不同类型的用户群体,由于其社会文化背景的差异,其使用搜索引擎的行为特征也是不相同的。
  有鉴于此,本文以目前中国网络用户中最普及的群体――年轻人为研究对象,选择大学生群体进行搜索引擎使用行为的研究。
  
  3 研究目的与研究方法
  
  3.1 研究目的
  就高校学生而言,也有着多层次的网络用户群体,可依性别、专业、教育程度、网络经验等的不同进行划分。本研究的目的,一方面试图揭示高校学生利用搜索引擎查找信息的外在行为方式和习惯表现,了解他们对搜索引擎使用的基本情况;另一方面也希望能揭示不同层次的学生用户在搜索引擎使用方面的共同点和差异性,探究影响大学生搜索引擎使用行为的个人特征因素。
  具体来说本研究能达到以下目的:①了解高校学生网络搜索引擎使用的基本情况;②了解高校学生的基本特征,如性别、网络经验等与其搜索引擎使用的相关性;③了解高校学生对现有搜索引擎服务的评价。   
  3.2 问卷发放及回收情况
  为了对网民使用搜索引擎行为有一个比较准确的掌握,此次研究以南京大学浦口校区全体本科生为样本框,按照严格的社会学统计方法进行,采取了系统随机抽样法,在全浦口校区8 528名学生中抽出了213名同学为样本,发放问卷。
  此次问卷的发放共发出213份,回收问卷189份,回收率为88.73%;其中有效问卷179份,问卷有效率为94.71%。利用社会科学统计分析软件SPSS13.0对有效问卷的数据进行统计描述及进一步的相关分析。最后,为进一步了解某些问题的具体原因,笔者还进一步访谈了部分学生。
  
  
  4 数据统计与分析
  
  4.1 基本情况统计
  本次调查男性占63.1%,女性占36.9%。上网时间上,每周上网时间控制在10小时以内的同学居多,占总样本的75%。大部分同学常用的搜索引擎是百度和Google。专门的搜索网站受到的关注远远大于各大门户网站,如表1所示:
  也就是说,在进行信息搜索行为时,大学生群体较多倾向于选择专门的搜索网站。在之后对部分调查对象的访谈中了解到,大多数人认为专门的搜索网站可以提供更全更好的信息。
  搜索引擎的获知情况中,通过别人介绍和通过常去网站的链接获知的比例为最高。调查对象中只有5.6%的人是通过有关课程学习来获知搜索引擎使用方法的情况,这说明学校缺乏网络知识的传授,绝大多数学生网络经验都是靠自己摸索出来,而非课堂中学来的。实际上,尽管网络信息的检索和利用操作性非常强,但如果老师先在课堂上传授一些基础性知识,比如说网络信息资源的组成、搜索引擎的工作原理等,显然能让学生在选择检索工具、制定检索策略上更得心应手。缺乏系统的培训,是目前学生网络检索技能不足的一个重要原因。
  在所有的搜索内容中,科技教育的搜索频次最高。这主要表现在大学生群体由于课程、论文等学习的需要,查询网络上相关资源。应该说,这是大学生群体所特有的现象。这一点与Joy Tillotson等人的研究结论有很大的不同。他们发现“真正上网查找学术资源以研究生和教工为主体,他们往往为研究、论文和教学的目的上网检索相关信息,而本科生则多数以个人兴趣为出发点”。但是,在此次所做的针对大学生的调查中却发现,大学生上网有很多是为了搜寻学术资料。至于其原因,可能是与中国的教育体制密切相关。
  
  4.2 大学生搜索引擎使用技巧情况分析
  数据显示,在调查对象中,只有4.5%的人总会或经常会阅读帮助文件,36.3%的人偶尔阅读,而59.2%的人从不阅读。为了提高搜索效率,绝大部分搜索引擎都会提供高级搜索功能,但从调查的结果可以看到,只有30.2%的人总会或经常会使用这一功能,而69.8%的调查对象却只是偶尔或从不使用高级搜索功能。在关键词的输入上,有89.9%的人会不同程度地一次输入一个以上的关键词,与仅输入单一词用户的比例高达9:1,这说明高校学生在搜索网络信息时,很注重利用一个以上的单词组成词串或词组来表达完整的检索概念。然而多数人只是简单地把词堆放到一块,仅有15%的学生用户总会或经常会使用逻辑检索功能,有54,7%的学生则完全没想过利用逻辑符号来进一步增强检索式的灵活度和专指度。如表2所示:
  上面几组数据表明人们对高级检索功能的利用率并不高,不管是高级检索界面的使用,还是高级检索符号的利用。进一步的访谈得知其原因有:对高级检索功能不熟悉;简单检索已经可以找到自己要找的内容,没必要再用什么高级检索功能;高级检索用处不大。实际上,充分利用高级检索功能对于节省检索时间提高检索精度是非常有效的。然而普通用户并不能体会检索系统设计人员为设计高级搜索功能而付出的努力,甚至对此不以为然,怀疑高级检索功能的效用。显然,要充分利用高级检索功能必须先让用户了解和掌握这些功能,也就是说在系统人员努力让高级功能的使用变得更简洁和易用的同时,应重点考虑通过怎样的方式和渠道来增加用户对高级检索功能的了解,并引导和帮助他们有效使用这些功能。
  绝大多数搜索引擎都提供在结果中二次检索这一功能,二次检索较上面所说的高级检索更方便使用,所以在搜索引擎经常性返回成千上万条检索结果的情况下,人们很容易就想到利用二次检索。这可以从数据中看出来,总会和经常会使用二次检索的学生用户高达53.7%,而从不使用这一功能的人仅占10.1%。如表3所示:
  按双侧检验,检验水准0.05,该相关系数具有统计学惹义。
  上表中p值均大于0.05,说明性别、院系、周上网时间与搜索引擎使用技巧之间并不具备统计意义上的显著相关。也就是说,性别的差异、院系差别以及每周上网时间与搜索技巧之间没有必然的联系。男女生对搜索技巧的掌握是差不多的;专业的不同对于搜索引擎技巧的掌握也没有产生影响,尤其关注的计算机系与软件学院这两个与网络直接相关的院系,其搜索技巧的掌握程度并不比其他院系的学生高;这可以理解为,教育程度、背景的相近性,弱化甚至是淡化了以上这些差异所带来的搜索引擎使用方面的差别。
  上网频率与关键词输入以及逻辑检索功能的使用情况具有统计意义上的显著相关。如表4所示
  上网频率较高的学生,对于搜索技巧的掌握程度比上网频率低的学生要高。具体体现在关键字的输入和逻辑符号的使用方面。数据表明,上网频率较高的学生,对于搜索引擎技巧的掌握要好于上网频率较低的学生。同时,上网频率较高的学生更容易成功查询到自己所需要的信息。对于搜索技巧应用的总体看法,上网频率为1~3天上一次网的学生评价最高,每天上网的次之。
  
  4.3 对搜索结果的处理情况
  调查结果显示,大学生在浏览搜索结果时最多的是点击查看1-3页返回结果,占44.1%;其次是4-7页,占28.5%;一定要查询到自己满意的信息的则占22.3%。这一结果与类似的研究有一定的相似之处。iProspect的搜索引擎用户行为调查结果也显示,62%的用户只点击搜索结果页第一页的结果,而高达90%的用户只点击搜索结果前三页的结果。当前三页的结果不能满足用户需求时,41%的用户变换搜索词或者转而访问其他搜索引擎继续搜索。这主要是由两方面原因造成的:①用户的惰性,即用户无意去检索更多的信息;②搜索引擎每次返回的检索结果集合太大,需要分页显示,一般用户在浏览过程中很少会点击查看后几页的网页信息。
  从时间上看,不愿让检索时间超出半小时的人居多,共占74.9%,其中只愿花费不到10分钟时间的人占39.1%,为数不少。对这些意欲在10分钟以内结束查找的人,可以说他们甚至不在乎是否能找到与自己需求完全相关的信息,时间成为他们结束一次检索的重要因素。调查对象中愿意花费一小时以上时间来查找信息的人只占2.2%,完全不考虑时间因素的人占 15.6%,显然这两部分人关心的是信息本身而非时间,尤其是后者,对检索结果的满意与否成为决定检索结束与否的唯一因素,而这种满意是建立在自己的需求是否得到满足,也就是所检信息的质量和数量之上。
  性别与翻看搜索结果页数之间具有统计意义上的显著相关,如表5所示:
  对于翻看搜索结果的页数,男生的耐心明显小于女生。绝大多数男生表示只愿意翻看1~3页,而女生则愿意为达到自己的搜索目的付出更多的时间。这可以用认知心理学的理论来加以解释,人的认知类型可以分为两种,一种为场独立型(Field independent,FI),一种为场依存型(Field dependent,FD)。前者能够在复杂的情景中理清问题的脉络,将原本无结构的领域变得结构化,进而迅速地抓住问题的主线。而后者则更多地以一个观察者的身份看待问题,他们关注更多的线索而不仅仅是解决问题的主线。显然,FI类型较FD类型的人在信息查找上花费的时间更少。心理学认为,一般来说男性比女性更具场独立性,这也是解释为什么查看结果的数量在性别上表现出显著差异的原因。
  周上网时间与花费时间之间具有统计意义上的显著相关,如表6所示:
  每周平均上网时间越长的人,越愿意花更多的时间用以搜索。可以这样来解释,计算机知识和网络经验越丰富的人,越习惯于长时间坐在电脑跟前,也就越不容易因长时间面对屏幕而生厌,即便有厌倦感也较一般的人来得迟。作为一种惯性,很自然他们对信息的查找就不太计较时间的长短。
  
  4.4 对搜索结果的满意度情况
  从调查数据来看,对检索效果的评价呈两端少中间多的分布。绝大多数人抱有比较满意和无所谓的态度,分别占44.7%和36.9%,不太满意的占12.8%,而非常满意的仅有8人,占4.5%,完全不满意的更少,只有2人,占1.1%。可以说学生用户对网络信息资源的检索效果基本上是肯定的。
  相关分析发现上网频率与对搜索引擎的总体看法之间具有统计意义上的显著相关(见表7)。也就是说,上网频率较高的学生,对于搜索引擎的满意度相对比较高。联系上文的相关分析可以认为,由于上网频率高的学生对于搜索技巧的掌握情况相对较好,比之其他同学能搜寻到更多更好的信息,因此满意度电相应的较高。
  
  5 结语
  
  5.1 大学生使用搜索引擎行为的外在表现
  大学生所用搜索引擎较集中,其中最常用的搜索引擎是百度和Google。专门的搜索网站受到的关注远远大于各大门户网站。而且有相当多的调查对象表示他们是由别人介绍和通过常去网站的链接才获知搜索引擎的使用的。在大学生利用搜索引擎搜索时,最常见的是进行科技教育内容检索。当然这可能是大学生群体所特有的现象。
  在使用搜索引擎时,大学生普遍不怎么阅渎帮助文件,跟这一情况密切相关的是使用高级搜索功能的大学生也不是很多。但是在关键词的输入上,大学生们却很注重利用一个以上的单词组成词串或词组来表达完整的检索概念;然而多数人只是简单地把词堆放到一块,仅有15%的学生用户总会或经常会使用逻辑检索功能。
  在对搜索结果的反映上,绝大部分的大学生点击查看7页以内的搜索结果,从时间上来看,不愿让检索时间超出半小时的人居多,共占74.9%。另外,对检索效果的评价呈两端少中间多的分布。绝大多数人对利用搜索引擎查询信息的结果抱有比较满意和无所谓的态度,大体上说大学生用户对网络信息资源的检索效果基本上是肯定的。
  
  5.2 影响大学生搜索引擎使用行为的因素
  在大学生使用搜索引擎的过程中,有一些个体特征是会对此产生一定影响的,根据相关性分析可以看到,上网频率会对大学生在使用搜索引擎时关键词的输入情况以及逻辑检索功能的使用情况产生影响。上网频率较高的学生,对于搜索技巧的掌握程度比上网频率低的学生要高。具体体现在关键字的输入和逻辑符号的使用方面。而性别则与翻看搜索结果页数之间具有相关性,男生的耐心明显小于女生。绝大多数男生表示只愿意翻看1~3页,而女生则愿意为达到自己的搜索目的付出更多的时间。
  另外大学生每周上网时间对大学生愿意花费多少时间去浏览检索结果会产生影响。每周平均上网时间越长的人,越愿意花更多的时间用以搜索。可以这样来解释,计算机知识和网络经验越丰富的人,越习惯于长时间坐在电脑跟前,也就越不容易因长时间面对屏幕而生厌,即便有厌倦感也较一般的人来得迟。另外相关性分析还发现上网频率与对搜索引擎的总体看法之间具有统计意义上的显著相关。也就是说,上网频率较高的学生,对于搜索引擎的满意度相对比较高。
  
  5.3 本研究的局限
  由于本研究在设计之初目的只是想初步考察大学生这个群体对搜索引擎的使用情况及认知态度,因此在理论方面存在一定的局限。同时对于中国网络用户来说,大学生群体虽然能在一定程度上代表了中国网络用户中的年轻人群体,但其代表性到底有多大,还有一定的置疑。笔者将在未来的研究继续关注我国各个群体的网络用户使用互联网的行为特征,此方面的研究对于推动我国网络信息资源管理的发展有相当重要的指导意义。