logo

您所在位置网站首页 > 海量文档  > 专业论文 > 理科论文

人才市场需求预测模型的研究和应用.pdf 89页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
同意并开始全文预览
《人才市场需求预测模型的研究和应用.pdf》
中图分类号:TP391 密级: 公开 UDC: 620 学校代码: 10094 诃4£解为尤孥 硕士学位论文 (学历硕士) 人才市场需求预测模型的研究与应用 and oftheTalentMarket Research Application Demand Model Forecasting 研究生姓名: 王立敏 指导教师: 董东副教授 学科专业: 基础数学 研究方向: 智能信息系统 论文开题日期: 2012年3月29日 学位论文原创性声明删 本人所提交的学位论文《人才市场需求预测模型的研究与应用》,是在导师的指导 下,独立进行研究工作所取得的原创性成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的 个人和集体,均已在文中标明。 本声明的法律后果由本人承担。 论文储。签鼽毛渺指剥币确认(签名,物、 砂B年多月吲日 砂f.;;年多月习日 I , 学位论文版权使用授权书 本学位论文作者完全了解河北师范大学有权保留并向国家有关部门或机构送交学位 论文的复印件和磁盘,允许论文被查阅和借阅。本人授权河北师范大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、 汇编学位论文。 (保密的学位论文在——年解密后适用本授权书) 指导教师(签名) ≯/;年 妇印 摘要 人才资源是第一资源。人才是生产力中最重要也最活跃的因素,对社会和经济的发 展具有基础性、决定性和战略性的作用。近几年,随着经济全球化的发展,全球产业都 在加速转型和优化。与此同时,经济社会也对人才提出了越来越多的要求以适应经济的 发展和变化。因此,合理有效的预测人才市场的需求已经成了求职者、企业、地区乃至 全球的迫切需求。 网络招聘具有人才信息量大、影响覆盖面广、投入少回报多、招聘效果好和人才匹 配信息化等特点,是越来越多的求职者和招聘者首选的求职与招聘途径。 本论文通过对网络招聘数据库中数据的统计、分析,对H省的人才市场需求做了初 步的预测,具体研究如下: 1.分析当前网络人才求职招聘市场的需求,阐述研究动机。研究分析用于数据描述 的多维分析技术、基于概率统计的数据预测和基于数据挖掘的预测。 2.构建多维分析数据模型发现人才市场招聘求职基本特征。从求职者的性别结构、 年龄结构、学历(学位)结构、工作经验结构、专业结构和职位结构角度出发,分析了 近5年省级人才市场的基本现状:招聘单位不限制招聘人才性别的招聘比例约占74%; 招聘单位不限制招聘人才年龄的招聘比例约占43%,要求求职者年龄在18—30岁之间 的约占22%;要求的学历相对集中于本科和大专学历;约67%的用人单位不要求有工作 经验;求职者的专业分布集中在电子信息类、管理类、工程类、经济类、机械类、土建 类等;岗位需求分布中,销售类人员需求量约为29%且一直居高不下,其次为对机械类 和土建类人才的需求等。 3.运用灰度预测模型对省级人才需求总量做出了短期预测。2013年的人才需求总量 约为16.86万人。 4.组合决策树方法和时间序列预测对人才结构需求做出了预测。首先,为了更具体 的对人才结构需求作出预测,将人才结构划分为人才自然结构、人才社会结构和人才经 济结构三个部分。其次,应用了微软决策树算法和一次移动平均算法,对省级人才市场 的人才需求结构做出了短期预测。发现在对人才自然结构需求中,对人才求职影响程度 较强的是性别结构、体重结构(形体要求)、年龄结构和就业状态结构;在人才社会结 构需求中,对人才求职影响程度较强的是;工作经验结构、学历水平结构、普通话水平 TTT 结构:在人才经济结构需求中,对人才求职影响程度较强的是需求岗位类别和所学专业 类别。 5.根据结构化的思想,提出了阶段性条件概率预测模型。人才招聘求职市场总体呈 现出阶段性特征。现有的预测方法,不管是统计方法,还是数据挖掘方法,尚未发现考 虑了阶段性特征。阶段性建模,即以月为阶段,提出基于阶段末总量的部分累积量的条 件概率分布模型,分别对具有稳定的阶段性和非稳定的阶段性时间序列建模,并通过极 大似然法进行参数估计,估计出预测期内的阶段性参数,最后对需求总量作出预测。 总之,本论文通过对人才市场需求的研究,将人才需求的信息及时反馈到求职者中 去,使求职者得到了准确的就业需求预测信息,使他们可以更加清晰的看清未来的就业 形势,找到自己理想的就业岗位,选择合适的大学专业,从而更好的适应将来的就业状 态。 关键词:市场需求预测多维分析灰色模型决策树 IV Abstract TalentresourceiSthefirst has resource.Talent,which and factorin effectonsocialandeconomic themost active strategic development,isimportant forces.Withthe ofeconomic inrecent productive development globalizationyears,global industriesare transformationand thesame social time,the accelerating optimization.At also forwardmoreandmore fortalentsto tothe and economyput requirements adapt change of hasbeenthemost needfor seekers, economic.Therefore,it job development urgent andeven toforecastthe oftalentmarket enterprise,regionalglobalorganizations requirements and reasonablyeffectively. Online hasthefeaturesof oftalent information,wide recruitment,which plenty coverage, lessinvestmentandreturnfor recruitment fortalent more,good performance,automation SO the of andrecruitmentfor on,is matching,andbecomingpreferredapproachjobhunting moreandmoreseekerandrecruiters. job This conductsa forthetalentmarket ofH paper preliminaryforecasting requirements data thedatabasefromthe computing,andmining provincebycollecting,analyzing,statistical iSasfollows: anonlinerecruitmentwebsite.Thedetailedresearch 1.It the fromtheonlinerecruitmentofH the analysesrequirement province,clarifies themultidimensional fordata researchmotivation.Itstudies analysistechnologydescription, ondata data basedon and based statistics,and predictionprobability prediction mining. buildsamultidimensionalmodeltofindthebasicfeaturesoftheonline 2.It analysis recruitmentwebmarket.Theforthebasicsituationof talentmarket analysis provincial during thelastfive fromthe of seekers’sex years aspectsjob structure,age structure,majorstructure,andposition background(degree)structure,workexperience structurefindssomeusefulresults.For recruitmentratethat donot example,the employers restrictthe accountsforabout74%andtherecruitment that talents’gender percentage donotrestrictthe accountsforabout43%.Therecruitmentwith employers talents’age that isbetween and accountsforabout22%.The requirementjobseekers’age eighteenthirty educational of talents focuseson and requirementprovincialrelatively undergraduatecollege recruitwithoutthe forwork degree.About67%employers requirementexperience.Thejob V distributionis concentratedonelectronic seekers’major forsales havebeen engineering,economy,enginery,civil,etc.The requirementpersonnel the about29%andnextisthe occupied for andcivil highposition requirementenginery talentsinthedistributionof positionrequirement. 3.Itchooses needsless grey model,whichhistoricaldatawith prediction highprecision, tomakeashort-term for talent demand.Thetotaldemand prediction quantity oftalentsis about168600 in 2013. people 4.Itcombinesdecisiontree withtimeseriesmodeltoforecastthetalent algorithm structure ordertomakeaforecast requirement.Firstly,in fortalentstructure requirement,it dividesthe talentstructureintonatural structureandeconomic structure,social structure. Microsoftdecisiontrees and Secondly,itemploys algorithm to movingaveragealgorithm makeashort-term fortalent structureof talentmarket.Inthe prediction requirementprovincial talentnaturalstructure findsthatwhathaveanintenseinfluenceontalent requirement,it is applicationgender structureand structure,weightstructure(shape demands),age statusstructure.In employment thetalentsocialstructure havean requirement,what influence ontalent are importance work application experience mandarinstructure.In backgroundstructure,and thetalenteconomicstructure requirement, and havea positioncategories influenceontalent majorcategoriessignificant application. 5.It a conditional modelbasedon proposalsphasic probability theideaof structuralization.Therecruitment market from presentsphasicpatterntheoverall perspective. the SO hasnotfindthe By far,it currentstatisticmethodanddata knowledge method mining considerthe the stable andnonstable time pattern.Itarguments seriesmodel periodic periodic basedonthe attheendof respectively phases the ofthetotalcumulativeamountof part conditional distribution probability model.Itestimatesthe oftheforecast phaseparameters phasebythemaximumlikelihood estimation makesa parameter method,andprediction finally. In this researchoftalentmarket summary,by requirement,this the paperproduces feedbackoftalent informationto seekers.It seekersthe requirements job helpsjob get accurate demand informationSOthat can employment havean intothe forecasting they insight VI future situationmore canfindtheirideal can employment clearly,they jobsquickly,they choosea Callbetter tothefuture status. propermajor,therefore,theyadapt employment model;decision Keywords:marketdemand;forecasting;multidimensionalanalysis;gray VII VIII 目 录 摘要………………………………………………………….III Abstract...................................................................、f 1绪论…………………………………………………………..1 1.1 研究背景…………………….……………………………1 1.1.1人才问题已成为制约H省经济社会发展的瓶颈……………………1 1.1.2经济社会的发展对人力资源提出新需求…………………………1 1.2 研究目的和意义…………………………………………….2 1.3 文献综述………………………………………………….2 1.3.1 市场需求预测文献综述……………………………………3 1.3.2 人才预测研究综述……………………………………….5 1.4 研究内容和研究方法…………………………………………6 1.4.1 数据来源………………………………………………6 1.4.2 研究的内容…………………………………………….6 1.4.3 研究方法………………………………………………7 1.4.4 研究的框架…………………………………………….7 1.5 本章小结………………………………………………….8 2核心概念与理论基础………………………………………………9 2.1 人才的概念界定…………………………………………….9 2.1.1 人才的概念…………………………………………….9 2.1.2 人才的分类…………………………………………….9 2.1.3 人才结构………………………………………………9 2.2 数据描述与模型研究………………………………………..10 2.2.1 多维数据模型………………………………………….10 2.2.2 回归分析预测…………………………….………......12 2.2.3 时间序列预测………………………………………….15 2.2.4 灰色预测理论……………………………………….…16 2.2.5 决策树预测………………………………….………..18 IX 2.3 本章小结…………………………………………………27 3人才市场现状分析……………………………………………….29 3.1 网络招聘…………………………………………………29 3.2 人才规模现状……………………………………………..30 3.3 人才结构现状……………………………………………..31 3.3.1性别结构……………………………………………….33 3.3.2年龄结构……………………………………………….34 3.3.3学历(学位)结构………………………………………..36 3.3.4工作经验结构……………………………………………37 3.3.5专业结构……………………………………………….39 3.3.6职位结构……………………………………………….42 3.4 省级人才存在的主要问题…………………………………….44 3.5 本章小结…………………………………………………45 4 人才总量需求预测…………………………………………….47 4.1 影响省级人才需求总量的因素…………………………………47 4.2 灰色GM(1,1)预测模型……………………………………….47 4.3 本章小结…………………………………………………51 5 人才结构需求预测…………………………………………….53 5.1 影响人才结构因素的实证分析…………………………………53 5.2 挖掘模型的建立……………………………………………53 5.2.1人才自然结构需求预测…………………………………….54 5.2.2人才社会结构的需求预测…………………………………..57 5.2.3人才经济结构的需求预测…………………………………..59 5.3 本章小结…………………………………………………60 6 阶段性条件概率模型…………………………………………..61 6.1建模背景…….…………………………………………….61 6.2相关变量的定义……………………………………………..61 6.3阶段性时间序列模型的构建…………………………………….64 6.3.1建模思想.........………………...…………………….64 X 6.3.2稳定阶段性短时间序列模型构建……………………………..64 6.3.3非稳定性模型构建………………………………………..66 6.4模型实验结果及分析………………………………………….69 6.5本章小结…………………………………………………..70 7 全文总结与展望………………………………………………71 7.1总结………………………………………………………7l 7.2展望………………………………………………………71 参考文献…………………………………………………………73 XI 1 绪论 1.1 研究背景 1.1.1人才问题已成为制约H省经济社会发展的瓶颈 改革开放三十多年来,H省在经济与社会发展方面取得了不俗的成就。初步核算, 产业增长13.1%,增加产值6928.6亿元。第一产业增加值占全省生产总值的比重为12.7%, 第二产业增加值比重为53.O%,第三产业增加值比重为34.3%Ⅲ。2011年,H省生产总 值实现24228.2亿元,比上年增长11.3%。然而在取得成就的同时,却也暴露出日益严 峻的人才问题。特别是进入2l世纪以后,H省在产业结构升级和金融危机的影响下,对 人才的需求量虽然有所增加而对人才的要求却日益提高。2011年年末,仅H省城镇的登 普通中学生和121万中等职业学校在校学生。同年,教育部招收研究生约12万人,同比 上年增长约4%;在校研究生有约3.5万人,同比上年增长约8.4%;毕业生约11.5万人, 同比上年增长约45.6%。同年,H省存在普通高等学校112所,招收学生约36万人,同 比上年增长6.2%;在校学生约115万人,同比上年增长约4.1%;毕业生约31万人,同 比上年增长约4.7%乜3。而2011年H省应届毕业生的就业率约为89%口3。纵观全国就业 形势,劳动力的供给总量约年均增加1800万左右,而从经济增长的因素看,劳动力的需 求总量取平均值约为1600万左右,故每年约200.300万人属于劳动力供给大于需求的 范围。因此,全民就业压力将持续存在H1。 201 1年,H省的S市有3.9万大学生毕业,而仅有1.7万工作岗位面向应届大学生, 即就业率不到50%,社会资源的无故消耗和人才的闲置问题使人们进一步认识到人才问 题若不能得到妥善解决将直接降低经济的增长速度畸1。 1.1.2经济社会的发展对人力资源提出新需求 人力资源是指一个地区或国家的总人口中减去没有劳动能力的人口之后的人口。此 外,在一个地区或国家中,处于劳动年龄、超过劳动年龄和未到劳动年龄但具有劳动能 力的人口之和也可以被称为人力资源∞1。 近几年,H省面临着产业结构的加快转型和优化,存在人才结构和布局不是很合理; 人才发展的体制环境不完善;各个产业人才供给与人才需求不均衡等问题口1。上述问题 说明H省的人力资源没有实现有效的配置,这些问题将严重影响H省经济社会的快速发 展。 在人力资源问题日益成为制约H省经济社会可持续发展的形势下,H省明确提出到 “十二五”末,H省要初步形成适应企业发展需要、层级结构分明、年龄结构合理、专 业结构配套的人才市场,人才规模与层次要适应经济社会发展的需要。这标志着H省对 于新形势下全面加强建设人才规模的决心阳1。 人力资源的优化关键在于人才。从目前H省人才市场总体素质和结构看,还难以适 应当前形势下的需要。据分析,H省人才市场存在三个突出问题:一是人才资源匮乏, 二是人才结构低度化即高技能人才短缺,三是人才结构与产业结构的构成比例不协调。 这些问题的存在,将会大大制约H省科技的发展和经济的增长阳1。 1.2研究目的和意义 人才问题与经济社会发展息息相关,研究省级人才市场需求的目的: 1.统计分析近5年来省级人力资源的基本现状(岗位分布、专业分布、学历要求、 待遇水平、工作经验、年龄、性别等),研究发现人才市场供求特点,为求职者提供就 业参考。 2.比较、选择和运用适当的预测方法,对省级人才市场人才总量需求和人才结构需 求做出短期预测,从而为求职者提供有价值的参考。 本文的研究意义:首先,对省级人才需求状况进行研究,响应了国家实施人才强国 战略的号召;其次,人才需求的信息及时反馈到求职者与招聘者中去,优化了省级的人 力资源配置,也使求职者得到了准确的就业需求预测信息,使他们可以更加清晰的看清 未来的就业形势,学好所需的专业知识,未雨绸缪,快速找到自己理想的就业岗位,从 而更好的适应将来的就业状态。 1.3文献综述 ' 有关预测的相关研究文献,主要包括以下两个方面: 1.3.1 市场需求预测文献综述 预测是-1'7综合性学科,它的研究范围非常广泛。简单来说,以科技理论或社会经 验为基础,以数学知识创建模型为主要手段,以实际现状反映事物过去发展规律的调查 统计资料为依据,对客观事物未来发展变化进行测算和推断的过程就是预测n…。预测未 来需求可以帮助人们揭示事物的发展认识事物的规律。使得人们对当前的行为有所依据 n¨。将预测的方法和理论运用于对市场发展的研究过程即被称为市场需求预测n引。 预测的目的不同、预测的科研条件不同、预测的目的不同,则预测所选的方法则不 同,但大体来讲,预测的流程都是基本相同的,如下图1.1所示,为预测的基本流程图。 图1.1预测过程流程图 关于近年市场需求预测的研究成果,部分学者从定量角度已做过一些研究。如石聿 俊(1993)用灰色预测模型和回归分析的预测方法分别对自卸汽车的年产量做出了预测, 并对两种预测方法进行分析和对比,得出模型使用的范围及其优劣性n引。李响、宗群、 合预测方法:用ARMA模型对汽车销量进行线性预测,再利用RBF神经网络方法对线 性预测的残差建模——得到非线性预测,将总预测值定义为两部分预测值的和。虽然该 方法的适用性有待验证,但是该方法既揭示了数据内部的非线性特征,又克服了单一方 41。James 法的局限性n 测方法通过加权方法相结合,准确预测了超市插座的日销量n51。章杰鑫,张烈平(2009) 为了解决商品销售企业对商品需求预测的问题,提出了一种改进的时序关联规则挖掘算 法。他利用企业商品销售数据与客户相关的特点,提出了客户模式数据模型,针对该模 型给出了时序关联规则挖掘算法。该算法对超市销售数据进行了时序关联规则挖掘,得 出了正确的结果,并验证了其在实际应用中的有效性口6|。胡慧敏(2009)采用直线趋势 71。Robert 车产业的预测而言,具有相当的准确性n K.Lai,Chin.YuanFan,Wei-Hsiu Huang, Pei.Chann Chang(2009)对股票价格做出了预测。投资者和专业分析师觉得买进和卖出股 票的最佳时机是非常难确定的,该文章则以聚类分析方法、模糊决策树方法和遗传算法, 针对历史数据,建立了一个决策系统索引。由于历史数据的组被分类为几个子簇,所以 预测的准确性被大大提高。通过将该方法实际应用于证券交易所,发现该模型与其他模 Zhu,Wai.Ki 型相比,表现最好的时候能达到82%的平均命中率口引。Dong.Mei Ching (2010)提出了一个新的估计模型:一个多元的马尔科夫链模型。在新方法中,他们通 过多元的马尔科夫模型先计算出了序列的相关性,再通过参数估计使得预测误差达到最 小。香港的某一软饮料公司正在使用他们提供的多元马尔科夫链模型方法对软饮料生成 Stefan K.,Smith 1) 进行预测,并取得了很好的预测效果n引。JeffTaymanStanley Rayer(201 在许多研究者评估了人口的差异影响和增长速度的基础上,针对某一具体县,利用了回 归模型预测了该县10年10年之后的全县总人口乜0|。王文才,乔旺,王瑞智,李刚(2010) 采用一元线性回归预测法预测了我国煤炭业安全形势的未来发展状况。该模型首先用 与死亡人数、年份与煤炭年产量分别成负线性相关和正线性相关。分别建立线性相关模 型后,对我国未来3年的死亡人数和煤炭产量做出了预测瞳1。。袁庆玉,彭赓,刘颖,吕 本富(2011)使用网络搜索关键词数据对中国汽车销量进行预测,预测结果为:未来5 年内,虽然重型汽车的需求量却有可能快速增长,但全球汽车总需求量不会有大幅度的 增长乜2‘。上述的预测都提供了一个极其实用、又符合自己特色的预测方法。 1.3.2人才预测研究综述 人才预测主要包括人才的拥有量预测、需求量预测、人才的拥有结构预测、人才的 需求结构预测和人才评价系统等,它是一项复杂的社会系统工程。由于人才预测工作具 有结构复杂、信息量大、时间性强、分析综合频繁、不确定性因素众多等特点,这就决 定了人才预测必须依靠科学的理论、先进的技术对这项工作进行组织,才能有步骤、有 计划、有效率的按照预定要求完成乜引。 Lin(2000) 在国外的研究现状中,Ping-TengChang,Liang—ChihHuang,Homg-Jiun 经过研究,发现德尔菲方法作为一个传统的预测工具,已经被广泛接受并应用在技术预 测、人才预测、趋势预测等范围。该文作者还指出,采用隶属函数拟合和模糊统计技术 推导出一种新的模糊德尔菲法,较之传统的德尔菲预测法能得到更为准确的预测结果, 为满足随机的、非平稳服务方面的要求,制定了马氏决策过程模型。该模型被应用到服 务组织中来解决人才需求的问题,并取得了有效成果乜5|。Shen shu-jie,Ligang,Song hai.yan(2008)通过对组合预测的研究,认为如果有几种方法对同一预测问题都能做出 有效预测,我们就可以采用组合预测方法。因为一个虽然效果不佳但含有独立信息的预 测方法,与多个或一个预测效果较好的预测方法组合后,更能较好的改善系统预测的性 能。由于组合预测综合了各种方法所提供的信息,避免了单一模型丢失信息,也减少了 随机性,从而更能有效的提高预测精度乜6。。 国内的研究现状,从近年人才市场预测的研究成果来看,部分学者也取得了一定的 成效。所用的研究方法主要有主观概率预测,专家预测法和常用的定量预测等方法。如 金玉秋(2009)从劳动力的供给与需求增量方面入手,并考虑经融危机和产业结构升级 对就业需求的影响,对2001--2020年的劳动力供给与需求做出预测,并提出希望政府采 取各种积极有效的措施,解决就业问题的号召[27]o王玉荣,徐安兴,史晓平(2009)从高 校专业结构与经济发展的不适应性角度出发,定性的预测了高校培养的人才数量、质量、 层次、结构,发现其已经不符合社会发展的需求,因为产业结果和技术结构已经出现多 元化的趋势,故此作者预测调整专业结构已成为高校培养人才的必然的选择乜81。赵昕, 我国海洋从业人员需求量将达到45955万人,海洋科技人才将达到6893万人。文中最后 指出,要满足未来几年内海洋人才大幅上升的需求,必须加强海洋类高校的人才培养力度 瞳引。赵晖(2010)通过对河南各个外语专业人才需求市场所占的百分比的主观分析,判 断出近几年内,河南对只会单一外语的人才需求已经饱和,而熟悉有关外交、外贸、经 济、法律、新闻、政治等有关学科的基本知识和理论的适用性强的复合型人才的“外语 人”却大受欢迎∞0。。朱印岗,余斌,黄朝华(2011)通过对新疆人力资源现状的分析, 充分利用人力资源规划的功能,结合当地实际人才需求,使用多元线性回归模型,得出 了“十二五"期间(201 1年_2015年)新疆煤炭煤电煤化工专业技术人才的具体需求人 数,并据此制定了切合实际的人才培养目标及落实目标的具体方案口1|。罗建梅(2011) 根据长株潭城市群“两型社会”建设的现状与趋势,运用预测模型GM(1,1)灰色系统理 论和回归模型预测,以产业结构为划分区间,对人力资本需求总量做出预测,并分析了 人力资本支撑长株潭“两型社会”建设的适配性,提出长株潭“两型社会’’建设中发展 人力资本的对策建议扫2|。焦凌佳,吴红梅(2011)通过定性与定量结合的预测方法预测 了江苏省2020年的农村实用人才需求。其中对于技术服务型人才,他们利用多元回归预 测模型对人才数量进行了中长期预测,预测方程的拟合优度为0.939,属于高精度预测模 型‘圳。 1.4研究内容和研究方法 1.4.1 数据来源 信息需求者对人才信息的需求是人力资源发展的动力,而网络的出现让信息的获取 与传递变得更加轻松容易。“零距离竞争”就是指由于互联网的出现,无论你身处任何 一个角落,只要轻触鼠标,全球都可同时知晓你是何种人才。网络人才求职招聘的时效 性保证了大型网络招聘网站数据的权威性。 本论文的主要数据来源是2006年_2012年H省人才网历年的人才市场招聘求职资 料和2008年.2011年H省历年的经济年鉴资料。通过对H省人才网中数据的清洗、转 换和对H省经济年鉴中数据的直接引用、整理,运用于论文的理论分析与实际预测。 1.4.2研究的内容 本文研究内容主要包括以下几个部分: (1)对人才预测及人才预测方法等相关理论和应用研究的回顾。比较、选择和运用 适当的预测模型和方法,对省级人才市场的需求状况进行短中期预测。 6 (2)通过常规统计分析、多维分析和数据挖掘等途径,对近5年来省级人力资源基 本现状(年龄、性别、学历要求、技术职称、工作经验、岗位分布、专业分布等)进行 分析,研究发现人才市场供求特点和分布特点,为求职者提供有价值的参考。 (3)对省级人才总量需求进行预测研究:从历史数据分析影响人才总量需求的因素, 建立人才规模预测模型,预测短中期人才需求量。 (4)对人才结构进行短期预测研究:分析人才结构需求的影响变量,发现人才结构 的特征及演化特征,将人才结构细分,并分别建立人才结构挖掘模型,预测结构变量对 人才需求的影响强弱程度。 1.4.3研究方法 本论文采用了文献研究法、比较法和定量模型构建法。 (1)文献研究法:把握现有方法和理论的研究成果,通过对相关研究文献的总结、 评述、归纳、梳理,了解研究的发展趋势。文献资料主要通过图书、期刊、科研报告、 学位论文、会议论文、统计年鉴等获得。 (2)比较法:通过对国外人才规模、素质等的对比研究,为确定我国人才规模、结 构、素质提供参考依据。 (3)模型建构法:分析人才结构、人才数量的影响因素,建立人才结构与人才数量 的定量模型并通过模型的构建对人才做出预测。 1.4.4研究的框架 本文的研究框架如下图1.2所示: 图1.2论文架构图 1.5本章小结 本章是绪论性章节,主要是为了以后的研究工作做简要的引导性介绍。本章第一节是 研究背景,主要介绍了本文的研究需求;第二节介绍本文的研究目的和研究意义;第三节 介绍了预测领域的国内外研究现状;第四节介绍了本文的主要研究内容、研究方法和整体 研究框架图。 2核心概念与理论基础 2.1 人才的概念界定 2.1.1人才的概念 关于人才定义的界定,最常用的有两种解释,一种是指衡量人才的标准可以简单的 依据个人的身份和学历;另一种是专指能承担专业技术工作和管理方面的人员。总的来 说,人才通常指具有某项特殊才能的人。总之,随着人才学科的发展,学者见仁见智, 都对人才做出了具体的定义,具有代表性的人才定义如下: 人才是指在一定社会条件下,能以其创造性劳动对社会发展、人类进步做出较大贡 献的人或者人才是指那些具有良好的内在素质,能够在一定条件下不断进取,创造劳动 成果,对社会的发展和进步产生较大影响的人口41。 2.1.2人才的分类 为了对人才本质有更深入的认识,故对人才进行分类。各个国家对人才的认识不同, 所分类别也各有差异,我国常用的人才分类有以下几种情况口5|: 1.依据人才的贡献大小和才能高低,分类为:伟大人才、杰出人才、一般人才。 2.依据人才的发展过程,分类为:显人才、潜人才、准人才。 3.依据人才的思维类型,分类为:艺术型人才、逻辑型人才。 4.依据人才所从事的专业,分类为:金融、教育、法律、军事、外交、科技、政党 等类型人才。 5.依据社会分工不同,分类为:政治、文化、教育、服务、科技、军事、农业、商 业、工业、艺术10个类型 6.依据人才结构的不同,分类为:宏观人才结构、微观人才结构。 上述方法从不同视觉角度、不同方面反映了我国人才的不同性质和特点。 2.1.3人才结构 人才结构一般指人才在组织系统中的配置与分布。宏观人才结构通常指人才在某一 国家、某一社会范围或一个地区中的分布与配置组合。微观人才结构定义为人才在某一 具体单位系统中的配置与分布组合。宏观人才结构由国家或地方政府的相关职能部门管 理,一般涉及某一范围或区域内的人才总体在数量、质量以及不同方面的分布,包括人 才的经济结构、人才的社会结构、人才的自然结构等。微观人才结构的配置与分布一般 指一个单位内部具体的员工结构,由单位内部的人力资源管理部门负责调配啪1。 本论文主要依据影响人才结构的微观层面的因素进行宏观人才结构分析,将求职者 的就业状态、性别、民族、出生日期(年龄)、身高、体重、政治面貌、婚姻状况、健 康状况作为宏观人才结构的自然结构;将求职者的学历水平、工作经验、外语语种、外 语水平、普通话水平、计算机水平、技术职称作为宏观人才结构的社会结构;将求职者 的出生省地点、出生市地点、要求工作省地点、要求工作市地点、岗位类别、专业类别 作为宏观人才结构的经济结构来对人才结构需求进行研究与预测。 2.2数据描述与模型研究 2.2.1 多维数据模型 为了满足用户从多层次多角度对数据进行分析和查询而建立的模型被称为多维数据 模型。该模型是由一组维表和一个事实表组成,其基本应用的目的是为了实现OLAP (Online AnalyticalProcessing)㈨。 多维数据模型中,最常见的模型是星型模型,如下图2.1所示即为一个星型模型实 例。在该模型中,事实表主要包含维和度量两方面的信息,而维的具体描述信息则被记 录在维表中。 童黛爱j藏j二纛皇i麓燕熙捌麓 搴麓槲囊彩磊i蠢≮…… ……2 ;避引罗弋 广牌 。童一“一; 冀: l 厂;;:苫。 ·o,t∽,·;篆‰。, { f i锶0一一 { f;赛薹‰。 +J嚣鼍登…一{j…“m’V:,.¨t”i ; ?;““1"’ J·g蠢j麓蠢 }| 。j黧嚣‰乙飘‰ i /i \翔朦啊_ 。’‘#‘ —i§}ft}t{;;# ;—■—一}’ 图2.1星型多维数据模型 在建立多维数据模型时,度量值的选取、维的选取、维成员属性的设计、维级别的 设计是关键。设计多维数据模型后,观察者可以从各个角度观察数据值,而不必设计不 10 同的SQL语句、组合不同的条件去查询。下图2.2以税务机关延期纳税为案例,对多维 数据模型加以解释。 增{直税。 At B. C.一 D+ E, F。 G. H· 税务机关一 -l 图2.2税务机关延期纳税多维数据模型 该模型中税额就是被观察的数据,位于虚线的焦点上,这些数据被组织到三维空间: 征收项目、时间和税务机关。选定某个征收项目后,就会呈现于平面该征收项目下各个 税务机关在各个年月时间点的税额情况。如果对某个税额有疑点,则可以通过钻去,提 取底层明细数据。 多维数据模型的设计一般分为五个步骤啪3。 1.确定目标。确定目标的目的是体现出某一方面的统计数值型数据(度量值)和各 分析角度目标(维)之间的关系,即在数据分析前端所展现的主题。 2.确定度量值。在确定目标主题后,将考虑要分析的指标,即为度量值。度量值为 数值型数据。 3.确定事实数据粒度。因为在不同维度下度量值的聚合情况不同,所以要考虑未来 的分析数据所需要的数据粒度。通常情况下,将度量值的粒度设置到最小,即采用最小 粒度原则。 4.确定维。数据分析的各个角度被称为维。确定维包括确定维的级别(Level)和层 次(Hierarchy)。 5.形成多维数据模型:事实表的创建。确定好事实数据和维度后,加载事实表即可 创建一个多维数据模型。 2.2.2 回归分析预测 在常见应用中,如果两个变量间存在线性正相关或线性负相关,我们就可以通过一 个变量的值来预测另一变量的值。如下图2.3所示: y X 图2.3变量X与Y的线性关系图 变量X与Y的值可以由图上的直线近似的表示,则该直线所形成的的关于X,Y的模 型表示就是一个_元线性回归模型,该直线被称为回归线。 一元线性回归预测模型的数学模型: 其中%是一个随机变量称为随机项,口,b是两个常数称为回归系数,f表示变量的第 f个观察值,共有玎组观察样本值。 在建立模型的过程中,一般采用参数的最小二乘法,其基本思想是:找到最有代表 性的直线,它应该是直线到各点的距离最近,然后用这条直线进行预测。 相对于咒的估计值虫=占+魄,或与只之差称为残差或误差,用‘表示,NI,=咒一或。 显然,误差大小就是衡量估计量参数好坏的重要标志,以误差平方和最小作为衡量估计 量参数好坏的重要标志,以误差平方和最小作为衡量总误差最小的准则,并根据这一准 则对参数做出估计。令: 要让Q最小,从而得出参数值的方法就为最小二乘法。应用多元微分知识: 暑-o,嚣=u…………………Ⅷ.3, 解得: .∑‘只一;∑咒∑‘只一刀;歹 b=鼍———}=鼍-—一 ∑‘2一;∑薯 ∑(‘一;)2 a=Y—bx…………………………………………………………(2.5) 其中, ;=丢喜‘,歹=去喜只…………………………………………c2.6, 令 乞=∑(薯一;)2…………………………(2.7) f=l 0=∑@一歹)2………………………………(2.8) i=l 勺=∑(薯一;)(只一歹)……………………(2.9) i=l 则可以写成: ^口 =一 ^6一X 2 .L0 = ^6 ,一 ,●●●●●●●J、●●●●●,●、 一少勺一匕。 对一元线性回归模型进行R检验: ∑‘咒一nx—y i=l ‘ R= 一 一丽’ (一1≤R≤1)………(2.11) 由相关临界表值,若R≥兄(n-2),则线性相关关系显著,通过检验,则可以作为 预测模型。 对一元线性回归模型进行F检验: F检验是从方差分析的角度进行的回归模型的整体性检验。具体步骤为: 1)计算构造统计量F=i西E而SS,其中,z是样本总数;Ess:喜(允一了)2,表示由 平方和。 2)给定显著性水平口,确定临界值疋(1,n-2)。 测显著。 对一元线性回归模型进行t检验: t检验是对引入回归方程的自变量进行显著性检验的过程。具体步骤为: 1)假设风:b=0,备择假设q:b≠0; 2)计算构造统计量IT|= 3)给定显著性水平亿,确定临界值乞,:(,z一1); 模型没有通过检验曲9l。 在应用回归方程进行预测时,一般分为预测值的点估计和区间估计。对于点估计, 将给定的某个变量‰代入通过检验的回归方程即可。为估计预测风险和给出置信水平, 故要做区间估计,即求置信区间。由于预测值和实际值都服从正态分布,则预测误差也 服从正态分布。所以: 万=f。Q一2)x盯x 2 其中 盯=扼了丽丽………………-.(2.13) 从而得出,在口的概率下,预测范围是(或一万,成+万)。 2.2.3 时间序列预测 时间序列预测模型主要包括:移动平均预测模型和指数平滑预测模型。 1.一次移动平均法 一次移动平均法的基本原理是对算术平均法的改进H0。,其数学模型为: 式中:‘+。为t+l期的预测值;蟛1)为第,期一次移动平均值;玎为跨越期数,即参加 移动平均的历史数据的个数。当用一次移动平均预测会出现滞后偏差,即序列具有的发 展趋势为线性增长时,可进行二次移动平均计算,即将一次移动平均再进行一次移动平 均来建立线性趋势模型。其数学模型: 2 只+r q+包f………………………………………………(2.15) 其中截距:匆=2蟛¨一删∞,斜率:匆=2蟛11一蟛孙,f:预测超前期,埘1).一 次移动平均数,彬z):代表第f期二次移动平均值二次移动平均数n¨。计算公式为: 彬z)一丝坐垡业 玎 其中”代表计算移动平均值时所选定的数据个数。 2.指数平滑法 该算法是通过对过去时间序列的观察值给予不同的权值,从而将加权平均数作为预 21。 测值的一个过程。权值给定的大小与数据的新旧程度有关系H 一次指数平滑模型的计算公式:设时间序列为Y,,Y2,…彤,则: 15 s;1’=毗+(1一∞$…………………………(2.17) 其中,$1)为t周期的一次指数平滑值;口为加权系数且0<口<1。为了弄清楚指数 平滑的实质,将公式展开: 由于0<口<1,当f j∞时,(1一口)j0,则: j=o 以第f期的一次指数平滑值作为t+l期的预测值: 或¨=s11’=口”+(1一口)或…………………………(2.20) 当时间序列的变动出现直线趋势时,用一次模型会有滞后性,于是需要用至rJ--次指 数平滑模型n3‘。其计算公式: s;2’=稍}1’+(1一口)s跺……………………(2.21) 其中:91)为t周期的一次指数平滑值;若时问序列:M奶,…彤从某时开始具有直 线趋势,则与趋势移动平均类似,可用如下模型预测H钔H引: 允+T2q+6f丁 (丁=1,2,…,f)…………………………(2.22) 其中at为截距,f为当前时期数,6f为斜率,当前时期数到预测期的差值为T;或+T 为第f+丁期的预测值;且q=2s51)一s:2、,6f=尚(S11)-s:2))。 2.2.4灰色预测理论 灰色系统理论(GreySystemTheory)的创建源于20时间80年代。邓聚龙教授在上 海中美控制系统学术会议上所作的“含未知数系统的控制问题”的学术报告,首次用了 “灰色系统’’一词“引。用“灰色”定义该理论的含义是指信息不确定或不完全。在控制 Box) 论中,信息的明确程度常常用颜色的深浅来形容。例如,科学家用“黑箱”(Black 来描述那些内部结构、参数、特性未知而只能从对象运动的因果关系及输入输出关系来 研究的一类事物。 灰色系统理论认为任何随机过程都是在一定时间范围,一定幅值范围内变化的灰色 量,称灰色过程。对数据进行处理的过程就是对原始数据的整理,是一种就数找数的现 实规律途径。尽管客观系统数据离乱,表象复杂,但它总是有序的,总是有整体功能的, 故必然潜藏着某种内在规律。灰色系统理论避免了以下缺陷:需要按先验规律来处理数 据;需要按统计规律,而且要有较好的分布规律来处理数据;要求数据越多越好,计算 工作量也大;可能出现量化结果与定性结果不符等现象。故当缺少建模信息,找不到适 当的系统模型或观测变量时,可采用灰色系统。 GM(I,1)模型是灰色预测理论的核心。它是一阶的,它表示~个变量的微分方程型 预测模型。其建模过程如下H引: 的时间序列x(1),如下式: k x‘1’(七)=∑x‘。’(m i=l 对于x(1),其相应的白化微分方程为: \厶‘厶1/ 辈dt+∥)_虬………………(2.24) 其中口,“为待识别的参数变量,可用最小二乘法求出它们的值: 【口“】7’=(B 7’B)一1B,虬…………………..(2.25) 其中, 一L2(x(1)(1)一(2)) B=一三(x(1’(2)+x(1’(3)) ; 一三(x(1’(刀一1)+z(1’(胛)) x‘o’(2) x‘o’(3) 虬2 x‘o’(刀) 求解:将所得口,u结果代入白化微分方程,得伽(1,1)预测模型为: 对上式求导,还可以得到还原模型: 通过计算实际值和预测值的统计情况对灰色预测模型的精度做出检验H8。。它的检验 指标是相对误差:通常误差越小,表示预测结果越精确。模型预测精度的综合评价如下 表2.1所示。 表2.1灰色系统模型精度等级分析表 精度等级 相对误差(指标临界值) 1级(优) 0.01 2级(良) 0.05 3级(合格) O.10 4级(不适用) 0.20 2.2.5决策树预测 决策树的概念:决策树(DecisionTree),也叫判定数,是一个类似流程图的树状 结构,它可以是二叉树或非二叉树H9。。决策树的基本思想是把事例(case)递归地分成 若干子集,使得每个子集是预测变量某个类属。每次划分时,都评估全部输入变量对预 测变量的影响。决策树有三种结点:根节点、内部结点和叶子节点。从根节点到叶子节 点的路径就是一条规则,所以决策树对知识的表达力很强。决策树的根节点就是最高层 节点,它是整个决策树的开始。决策树的内部结点代表了决策树的一个属性的测试或选 择,一个分支就代表了一个测试或选择的结果。决策树的叶子节点代表了决策树中事例 最后被分成的一个类别。决策树使用属性选择度量来构造模型,使得它容易将元组很好 的划分成不同类的属性。如下图2.4所示,就是一个决策树的示例模型,这棵决策树描 述了一个人是否去看电影的预测分类模型,利用它可以对一个人是否去看电影进行预测 和分类。从图中可以看到决策树的基本组成部分由:叶子节点、分支和决策节点。此外, 决策树的每个节点的子节点数目还与决策树所使用的算法有关。例如,ID3算法得到的 决策树的节点就可以有多个分支,而CART算法得到的决策树就是二叉树,因为决策树 的每个节点都只有两个分支。 r雾—琴鬻鬃零”鼍~—焉…—黧t 卜是否黟朋友一起? 、、_l……——……一一’ 是 否 } 天气是否下搿 ? ; {熬上是否接到公霹电话
下载地址
文档纠错    收藏文档    下载帮助


发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

“原创力文档”前称为“文档投稿赚钱网”,本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。原创力文档是网络服务平台方,若您的权利被侵害,侵权客服QQ:3005833200 电话:19940600175 欢迎举报,上传者QQ群:784321556