高校人事管理中决策树分类法的应用
摘 要:高校人才的引进对学校的发展十分重要,人才识别方式是通过考察引进人员的定性指标实现的,很难保证识别结果的全面性、科学性和准确性。数据挖掘中的决策树分类技术是一种常用的预测模式,对已有的引进人才数据库的判断。
关键词:人事管理;数据挖掘;分类;决策树
1.概述
人力资源管理作为高校管理重要组成部分,日益受到各个领域的重视。高校人事管理的重要内容是人才预测与评价,它涉及的因素有人才的总量、人才的学历、人才的专业分布、人才的年龄以及人才的层次等。其主要内容有:人才的专业结构预测;人才的层次结构预测;人才的年龄结构预测;人才的学历结构预测;人才的需求总量预测等。人力资源管理面对着海量数据,迫切需要一种技术来发现有价值的知识,从而制定人才发展战略,并为其提供决策支持。传统的人才识别方式是通过考察引进人员的定性指标实现的,依靠手工操作很难保证识别结果的全面性、科学性和准确性。鉴于许多高校都建立了人才数据库系统,应用数据挖掘技术对以往人才数据进行分析,有助于提高人才识别的准确性,并提高识别效率。
研究数据挖掘中的分类技术,在高校人事管理系统数据库或数据仓库中提取隐含的、未知的、异常的或有潜在应用价值的信息或模式,可以为制定人事激励制度,预测和评估最优秀的人才提供科学依据,针对不同类别的教师建立有针对性的人事激励制度,为领导和职能部门科学决策提供依据。因此,基于决策树分类在高校人事管理中的应用研究有着重要的意义。
2.高校人事管理数据库主要特点与分类技术
人力资源管理是企业(事业)单位生存的命脉。高校的人力资源具有明显的特点,它基本上由五个部分构成:管理人员、教研人员、服务人员、附属部门的工作人员与离退休人员。其中教研人员是主体,管理人员是关键,服务人员和离退人员是补充。教研人员中一般教学人员居多,满足于课程开设与知识传授的岗位需要;管理岗位中一般的维特性的管理人员居多,缺乏管理思想与能力,满足于学校的正常工作的运转;服务人员中文化素质不高,大都是教研人员和管理人员的家属与子女,对于离退休人员,有的认为是不用组织利用的富余人员,听任自由生活。这种结构现状,既不能满足高校跨世纪发展的需要,又引发了许多人力资源的问题:高精尖教研人员缺乏,而一般老师过剩;行政领导人才缺乏,而一般管理人员过多;上岗教研人员过少,而非教研人员比例过大;资深教授闲置,而年轻教授负担过重;教学型教师过剩,而研究型教师不足,一般性教师过多,而艺术性教师偏少;一般性研究人员较多,而开发应用性研究人员缺乏等。
由于高校人员流动性强,人力资源数据库中积累的信息过多,人事部门对现有的数据进行客观分析的难度很大。因此基于高校人力资源数据,应用分类技术,无疑是一种可行的举措,它不仅可以发现有价值的知识,而且可以为管理者提供决策支持。
3.决策树分类法在高校人事管理中的应用
目前,各个高校都建立了各自的信息管理系统,这些系统积累了大量数据。由于数据来源于不同部门,大部分数据在放入挖掘库前,要经过整理。在进行数据挖掘前,把预处理过的数据都放到一个数据库中,建立数据挖掘库的同时就开始数据预处理工作,最后建成一个可以直接用挖掘工具进行挖掘的库,处理过程主要环节有:收集数据、数据预处理模块、数据准备、程序运行,查看结果等,如图3-1所示。
3.1 数据准备
数据准备包括数据的选择、抽取,数据的转换,数据的预处理[1-2]。用于数据挖掘的源数据,可以是任何一个数据库。
数据的预处理经过了以下步骤;
(1)数据的审核、整理与收集。
(2)数据清理。
(3)数据离散化。
(4)加载数据挖掘库。
3.2 高校人事管理中的决策树分类算法
数据挖掘中的分类算法分类是数据挖掘中非常重要的方法。分类的目的是分析输入的数据,通过观察处于数据源中的数据记录表现出来的特征,为每一个类找到一种准确的描述或者模型。由此生成的类描述可以用来对未来的数据进行分类,即预测。
决策树算法是分类技术的一种常用算法。决策树是一种表现一系列导致类或值的规则的方法,是一个类似于流程图的树结构,最顶层是根节点,下面每个内部节点表示一个属性上的测试,每个分枝代表一个测试的输出,每个叶节点表示类。它可以生成易于理解的规则。本文采用C4.5算法
决策树C4.5算法的基本迭代过程:
(1)决策树从训练样本的单个节点开始;
(2)如果训练样本都在同一个类,那么该节点成为叶子,并用该类标记;
(3)否则,决策树算法使用信息增益作为度量,选择一个能最好地将训练样本分类的字段。
(4)对字段的每个已知的属性值,创建一个分枝,并据此划分样本;
(5)递归形成每个划分上的样本决策树。直至满足递归划分终止条件结束。
递归划分终止条件:
(1)当给定节点的所有训练样本都属于同一个类时,停止,并用该类来标记此叶子;
(2)当没有剩余字段可用来进一步划分训练样本时,停止,并用训练样本的多数的类来标记此叶子;
(3)分枝没有训练样本时,停止,并用训练样本的多数的类来标记此叶子。
4 算法的程序实现
采用MicrosoftVisualBasic6.0企业版作为开发工具。在VisualBasic中,有三种方式可以建立与数据源的连接,这里选择MicrosoftODBC驱动程序。对高校人力资源进行数据挖掘的结果,是通过一棵决策树来显示的,在VisualBasic中使用TreeView控件来实现。节点位置的设计为:根节点的位置表示“e0”,一级节点表示为“e0_”,二级节点表示为“e0_ _”,类似地,n级节点表示为“e0_ _ … _”。例如:节点“e0213”表示的是第三级节点,具体位置是:一级节点的第二个分枝、二级节点的第一个分枝、三级节点的第三个分枝。程序的结束可以以是否满足n=0为条件判断,当回归到第n级节点,n=0时,表示回归到了根节点,所有分枝、叶子已经产生结束,数据挖掘到此结束。
5 决策树分类法数据挖掘实例
决策树算法的执行结果是生成一棵决策树,对决策树从根到叶子的每条路径创建一个规则,以IF-Then形式形成分类规则,组成规则集G。沿给定路径上的每个属性值形成IF部分的一个合取项,叶节点包含的类预测,形成Then后面的部分,将规则存入规则库。
例如:要找出高校教师人员变动情况与各种原因之间的关系并建立模式,以便通过调整薪资、增加培训机会!更换工作环境、提升职位等手段,留住所需人才,并对新引进人才作出预测,可以以离职情况作为目标类,其它字段有XL(学历),ZY(专业),ZJ(职称),ZW(职位),XB(性别),年龄(NL),配偶工作情况(PO),下面是一些规则:
(1) 如果职位B(处级),年龄C(41~50),则不流失(N类)。
(2) 如果学历05(博士),配偶工作情况C(不满意),年龄B(31~40),则流失(Y类)。
通过决策树,可以看到,年龄在30~45之间的男性博士生容易感觉当前单位待遇不理想或夫妻不在一地而调动;25~35岁硕士生容易感觉当前单位不能充分发挥作用或想继续深造而离职。最后的分析结果通过人机交互界面反映给高校领导层和相关的职能部门,对今后关于人才的引进及管理起到一定的辅助决策作用。
6 结束语
随着社会的发展,教育体制的改革与完善,高校面临的竞争会越来越激烈,这就要求高校的管理者能根据人事管理、教学管理、科研管理、就业管理、学校发展规划等实际情况进行科学决策。本文研究数据挖掘技术在高校人事管理中的应用,完成了程序代码的实现,通过友好的人机交互界面,为高校人才引进和管理提供了科学的决策依据。
参考文献
[1]周学君,杨敏,面向高校就业的数据仓库中数据析取技术及实现.三峡大学学报,2005,27(3):260~263
[2]范明,孟小峰数据挖掘概念与技术[M].第1版一t京:机械工业出版社,2001
[3]姜欣,徐六通.C4.5决策树展示算法的设计.计算机工程与应用,2003,4:93~94