创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
你的位置:洋萝莉系 > 第四色 > av 白虎 基于采集招聘信息的分析与挖掘 Analysis and Mining Based on the Online Recruitment Information
发布日期:2024-11-04 22:22 点击次数:150
1Department of Mathematics and Computer Science, Guizhou Education Universityav 白虎, Guiyang Guizhou
2Internet + Innovation and Entrepreneurship Center of Guizhou Education University, Guiyang Guizhou
3Industrial Internet of Things Engineering Research Center of the Higher Education Institutions of Guizhou Province, Guizhou Education University, Guiyang Guizhou
Received: Sep. 28th, 2016; accepted: Oct. 15th, 2016; published: Oct. 18th, 2016
Copyright © 2016 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
ABSTRACT
With the development of Internet technology, online recruitment has become a communication platform for recruiters and applicants. In order to understand the dynamic information of society and the related industries, using the network text information and data mining technology to research the online recruitment information, we can get the social demand for talent and talent demand trends, which is of great significance to the colleges and universities and the graduates preparing for employment.
Keywords:Online Recruitment, Numerical Value, ARIMA Model, Grey Model
基于采集招聘信息的分析与挖掘
张路路1,2,廖玉梅1,2,3,何丽1,郭小敏1,刘倩1
1贵州师范学院数学与计较机科学学院,贵州 贵阳
2贵州师范学院大学生互联网+立异创业教学中心,贵州 贵阳
3贵州师范学院贵州省高校工业物联网工程时刻磋商中心,贵州 贵阳
收稿日历:2016年9月28日;托付日历:2016年10月15日;发布日历:2016年10月18日
摘 要
跟着采集信息时刻的发展,采集招聘早已成为招聘者和应聘者交流的一大平台。为明晰解社会和有关行业之间的动态信息,应用采集文天职析和数据挖掘时刻对采集招聘信息进行磋商,咱们不错取得社会对东谈主才的需求情况以及东谈主才需求趋势,对高等院校以及应届毕业生的职业准备具有迫切意念念。
重要词 :采集招聘,数值化,ARIMA模子,灰色模子
1. 小序
近几年来,传统招聘模式隐敝率低、末端差、资本高的缺点缓缓露出,但跟着互联网对各个行业的渗入,百行万企开动倾向于给与互联网招聘的模式。其中智联招聘截止至2016年6月6日第四期总营业收入增长至20.5%,足以可见,跟着互联网时间的发展,不仅给采集招聘 [1] 带来了增长契机,况且招聘模式正在冉冉高潮。
本文利用招聘网站以及贵阳东谈主力资源网,给与数据挖掘时刻,并利用差分自转头迁徙平均模子、ARIMA模子以及灰色预测法对东谈主才市集的需求作念出了预测,接着再对招聘职位的责狂妄质和内涵进行词云作图分析,不错取得职业类型与专科限制的分类,在此基础上分析其咫尺的东谈主才需求情况,哪些是热点行业、职位等,并预测改日的东谈主才需求走向。临了再使用与数据有关行业的职业进行分析,并预测改日大数据挖掘行业的发展趋势。
2. 分析方法与进程
由于采集招聘信息所波及的数据信息较大,领先对文本 [2] 数据进行去重、去空,然后辘集不同身分对文本数据进行图形的处理。本文的总体法子及念念路如下:
法子一:领先对数据进行预处理,由于采集招聘信息所波及的数据信息较大,因此可依据职业类型和行业限制的不同,不错将职业类型、行业限制进行或者的分类。利用SPSS16.0软件取得质地更高的数据,以便后续责任的分析。
法子二:由法子一处理后的数据分析咫尺的东谈主才需求情况对职业类型和专科限制进行分类,建立Excel表格进行词频汇总,作念或者的形容统计分析,接着利用R软件画出词云图,临了建立图形并进行分析,得出职业类型和专科限制的分类。
法子三:基于ARIMA模子对销售岗亭进行预测。
法子四:通过对数据挖掘有关行业的分析,进行词频的分类,得出有关职位的需求情况,并用灰色预测法对其进行预测。
2.1. 数据数值化
由于网上发布的招聘信息不够严谨模范,因此存在好多分歧理的数据,因此必须对骨子数据进行数据数值化处理。本文通过词频的处理作出词云图,将数据进行数值化。
2.2. 职业类型与专科限制
对于招聘信息,本文领先对责狂妄质、责任内涵、职业类型以及专科限制进行了分析领会,并对收蚁集的数据进行了初步解读,并利用重要词的词频将每个职位样本进行数值化处理。明确分析行业限制、职业类型需求类型,借助SPSS读取Excel中的数据,然后断根其中的一样项,断根后的数据有402,627条,笔据未一样项的景况称号来统计该景况称号出现的次数,取得具体如下所示:
由表1职业类型可知,职业类型大体可分为七大类,其中时刻类职位需求量最大,占了总体数据的40.7%,其次为市集与销售,占20.6,%背面的划定循序为:运营、想象、职能、居品和金融,所占比例较小。
业由表2行业限制看出,在总共行业中,迁徙互联网占据社会的主导地位,排在第二的是电子商务,第三是金融。由此可看出,在现在这个大环境下,无论是什么行业限制,均以互联网为支握发展。
由表3不错澄莹地看到职业前五名,职业词频比例最大的是迁徙互联网,背面循序为迁徙互联网·电
表1. 职业类型
表2. 行业限制
表3. 职业类型
子商务、金融、迁徙互联网·O2O和电子商务等等,从中不难发现,金融、数据服务、企业服务、确认等等,皆是在迁徙互联网的基础上发展,因此应大肆发展迁徙互联网产业,智商推进其它产业的发展。
2.3. 贵州东谈主才需求走向
以贵州招聘信息为磋商对象进行具体分析,2016年6月贵州省统计局发布职业论述中夸耀:本年以来,跟着互联网+、新产业、新业态、新营业模式的发展,第一季度组织招聘单元1760家,提供职业岗亭10,560个。采集招聘成为了新的渠谈,第一季度我省新注册网上招聘单元1721家,与第一季度现场招聘单元数量格外,截止第一季度末,在线招聘单元14,032家,提供招聘职位总额70,160个,个东谈主注册累计总额862,900份,采集招聘已占据半壁山河。
而在骨子求职中,如果将求职鸿沟固定在一个区域,那了解本区域东谈主才需求就显得十分迫切了。本文以2015年9月~2016年7月贵阳东谈主力资源网站招聘数据为例,笔据贵州省招聘专科的行业、职位等脾气,利用咫尺的东谈主才需求情况,分析对于贵州省的热点行业、职位,并以销售岗亭为例预测其改日的东谈主才需求。
由表4辘集图1可知,从供需结构来看,需求较大有销售东谈主员、客服东谈主员、时刻支握东谈主员,医疗一系列需求量较小。笔据贵阳东谈主力资源网数据夸耀,2016年7月求职东谈主数前三的专科是通讯工程、经济学、测控时刻与仪器,求职次数前三的专科分手是通讯工程、经济学、电子信息工程。可知2016年7月通讯工程专科需求东谈主员十分有余。
笔据2016年8月上旬贵州招聘职业类型中类型总额达到2000以上刻画条形图,图2中可看出在贵州地区,东谈主才需求最大的是行政类岗亭,其次是销售类、财务类等、百货类、房地产类等。
通过贵阳东谈主力资源网2016年8月上旬按国民经济类型分,可看出贵阳热点行业分手为批发和零卖业、建筑业以及信息传输、计较机服务和软件业(图3)。网上招聘单元总额分手约为200、155、140,这些行业的需求量较大。在8月《贵州省大数据产业统计报表轨制(试行)》近日获国度统计局批复实行。这是国度统计局批准实行的首个省级大数据产业统计报表轨制,符号着贵州省将在寰宇率先开展大数据产业统计。贵州省内波及大数据及有关产业的东谈主才需求会渐渐增多,罕见是从事大数据磋商、盘算、处置、应用和实行大数据及有关东谈主员需求,以及通讯、互联网等基础设施树立东谈主员。
表4. 职业类型
图1. 职业类型
图2. 贵州省招聘职业类型
将2015年9月~2016年7月的贵州省销售东谈主员需求量时序列用x暗示,时序图 [3] 如图4所示,不错看出,该时序图蕴含遥远趋势,有一定增长趋势。确认该序列瑕瑜沉稳时辰序列,需要进行沉稳化处理。
为了使数据沉稳,对它进行差分运算,排斥趋势性。故对社会保险支拨对数据进行1阶差分后,时序图照旧含有增长趋势,为非沉稳序列。再对其进行2阶差分,也为非沉稳时辰序列,进而再进行3阶差分,时序图如图5所示,可看出该序列为沉稳序列,对其进行白噪声历练,该序列为非纯速即序列。为幸免出现过度差分的直快,形成太多信息的赔本,况且时序图沉稳,是以只进行了3阶差分。
图6和图7的自有关图和偏自有关图可知,除1阶偏自有相干数大于两倍要领外,其他的皆在两倍
图3. 采集招聘东谈主数漫衍图
图4. 贵州省销售东谈主员需求量时序图
要领差外,二者皆是拖尾。自有相干数和偏自有相干数均夸耀不出截尾的性质,因此不错尝试使用ARIMA(1,1,0)。经过反复尝试及拟合,取得模子ARIMA(1,3,1)的AIC函数到达最小的模子被合计是最优模子。
深信拟合模子的口径之后,还要对该拟合模子进行必要的历练。模子的显赫性历练 [4] 主如果模子的有用性,显赫有用主要看它索要的信息是否充分。换言之,ARIMA模子(1,3,1)拟合残差项中将不再贮蓄
图5. 贵州省销售东谈主员需求量三阶差分时序图
图6. 贵州省销售东谈主员自有关图
任何有关信息,即通过白噪声序列历练,残差序列为白噪声序列,该模子称为显赫有用模子。模子方程为:
笔据模子对2016年8月~2016年10月贵州省销售东谈主员需求进行预测,预测值如表5。
由表5可知,改日三期贵州省销售东谈主员需求东谈主员处在一个不断高潮的趋势。
巨屌自慰2.4. 大数据有关职位的预测
对数据分析的有关职业进行需求分析,并使用灰色预测法,预测改日数据行业的发展趋势。底下均是用R软件画出来的词云图,这些词汇皆是招聘单元所给的地域称号、职位称号以及行业称号,领先装配并加载R [5] 中器具包(wordcloud),利用SPSS读取整理好的词频文献,建立好相应的颜料即可,为了
图7. 贵州省销售东谈主员偏自有关图
表5. 贵州省销售东谈主员需求预测值
使统计出来的数据更精确,咱们在统计时领先剔除去一样数据,其次去掉空格的数据,然后再进一步进行词频汇总,接着就画出了词云图如下。
图8暗示的是地域词云图,其中最理解的城市是北京,其次是上海,深圳、广州和杭州,从地舆位置上看它们均属于我国的沿海地区,是我国的“一线城市”,经济发展飞速,对东谈主才的需求量格外大。
紧接着是分析出了对于职业的词云图(图9),其中最显眼的是引诱,因此在总共的职业中,引诱的东谈主数量最大,其次是销售、运营、市集和营销,居品等职业。两个词云图辘集了对地域、职业和行业的分析,末端标明,地域无须置疑北京的需求职位最多;在任业方面,市集与销售的需求量较大。
针对高档数据工程师、大数据分析师、高档数据引诱工程师、数据挖掘工程师等在招聘网站出现的频率,分手闭幕30天作一次统计汇总,分析与预测有关职位的需求情况,末端如表6所示,从表中咱们了解到数据挖掘工程师招聘最多,数据库工程师、数据库引诱工师二者之间收支未几,数据挖掘与分析高档工程师相对招聘较少。只是从数据中进行预测并不科学,因为每一个月招聘数量并不交流,因此,速即抽取几个月数据工程师招聘的信息量分手把数据职位占总共这个词招聘比例计较出来,利用灰色预测法对数据工程招聘比例进行预测,取得的末端如表7所示。
咱们笔据灰色预测取得的预测方程为:
临了预测下一个月的数值为0.4137721,因为相对精度就是1,确认这个模子的精度相配高,具有一定可靠性。从预测数值中咱们不错果敢预测数据工程师改日需求将会提升,并提升所占总共这个词招聘行业的比重。
图8. 地域词云图
图9. 职业词云图
表6. 数据有关行业频率表
表7. 招聘比例
3. 论断
通过以上的分析笼统,咱们了解了现在社会的热点职业类型和行业限制皆在哪些方面,为了便于骨子的磋商分析,咱们还对贵州省销售东谈主员需求作了分析预测,模子自己的先天性颓势在于跟着预测期的延伸,其预测纰谬会缓缓增大,但与其他的预测方法比拟,在短期内其预测的准确进度较高。笔据以上的对比,发现ARIMA模子能较好地分析、计较贵州省销售东谈主员需求的发展波动的情况,具有较好的应用前程,数据起原于采集,可能存在纰谬,使用灰色预测法只可用对应相干的数据进行预测,不具有代表性。因此本文给与招聘比例进行预测,使代表精度远远提升,更能了解社会和有关行业的需求脾气以及发展趋势。
基金景况
贵州师范学院校级学生科研景况(景况编号:2016DXS097);贵州省2014年省级本科教学工程景况“计较机科学与时刻”专科综合编削(景况编号:黔教高发[2014]378号);不凡工程师确认培养筹画景况(黔教高发[2013]446号);2015年省级本科教学工程树立景况(黔教高发[2015]337号);2016年大数据视角下的贵阳市交通优化配置问题磋商(景况编号:201614223037)。
著作援用
张路路,廖玉梅,何 丽,郭小敏,刘 倩. 基于采集招聘信息的分析与挖掘 Analysis and Mining Based on the Online Recruitment Information[J]. 数据挖掘, 2016, 06(04): 148-157.
参考文献 (References)av 白虎
上一篇:女同 sex 资源再生期骗
下一篇:足交 porn 丹江口