当前位置: 查字典论文网 >> 基于逻辑回归模型探索新生代农民工对“用工荒”影响

基于逻辑回归模型探索新生代农民工对“用工荒”影响

格式:DOC 上传日期:2023-08-28 00:04:42
基于逻辑回归模型探索新生代农民工对“用工荒”影响
时间:2023-08-28 00:04:42     小编:

【摘 要】“用工荒”是新时期各级政府面临的难题。而“新生代农民工”是农民工中主体,破解“用工荒”的关键落在如何吸引和留住新生代农民工。文章以科学发展示范县――嘉善县为例,借助逻辑回归模型分析了新生代农民工对“用工荒”的影响。

【关键词】逻辑回归模型;新生代农民工;用工荒;嘉善县

从2004年起,从沿海“长三角”“珠三角”出现季节性、区域性的用“用工荒”,逐渐向内陆蔓延。如何破解“用工荒”难题,是新时期排在各级政府面前的难题。目前在外出打工的1.5亿农民工中“新生代农民工”占到60%,大约1个亿。他们出生以后就上学,上完学就进城打工。相对来讲,对农业、农村、土地、农民等不是那么熟悉。另一方面,他们渴望进入、融入城市社会,而城市在很多方面还没有完全做好接纳他们的准备。“新生代农民工”以“三高一低”为特征,即受教育程度高,职业期望值高,物质和精神享受要求高,工作耐受力低。中国社科院研究员王春光描述为新生代民工有76%未婚;基本上没有务农的经历,很多是从学校毕业后就直接外出的,甚至连基本的农业常识都缺乏;从动机上看,他们基本上不是基于“生存理性”外出,而是更多地将流动视为改变生活方式和寻求更好发展的契机。

2013年中央批复《浙江嘉善县域科学发展示范点建设方案》,嘉善县成为长三角地区唯一被纳入区域发展规划的县。嘉善县在经济发展中也遇到“用工荒”的难题。本文中界定的“新生代农民工”从出生时间是在1980年和1995年之间,目前年龄在19岁到34岁之间。因此,准确的来说文中研究的新生代农民工是年龄在19到34岁的年轻的务工人员,占到样本总量56.60%,也验证了嘉善县务工人员的主体是新生代的农民工。在分析嘉善县“用工荒””影响因素中是“是否是新生代农民工”,采用方法是逻辑(Logistic)回归分析。

一、新生代农民工的特点

根据中国青少年研究中心和中国青少年发展基金会的《新生代当代中国青年农民工研究报告》,与上一代农民工相比,新生代农民工具有以下明显特征:

(一)心态不同

对大多数第一代民工而言,他们清楚地知道自己只是城市的“过客”,他们来自农村,归宿也在农村。对于新生代民工来说,他们往往不清楚自己的未来在哪里。他们向往城市,却不被城市所接纳;他们的根在农村,却对农村日益疏远。对他们而言,城市意味着一种新的生活方式,意味着不一样的前途,不一样的命运。他们希望通过进城务工经商,告别祖祖辈辈“面朝黄土背朝天”的生活。外出的经历更让他们深刻地体会到城乡之间的巨大差异,因此他们才发出了“死也要死在城市”的心声。但是城市高昂的生活成本、严格的户籍制度、冷漠的社会歧视等一道道有形无形的门槛不断粉碎着他们的城市梦。比起第一代民工,他们真正成了既融不进城,也回不了乡的“边缘人”。因此,他们无法规划自己的人生,走一步看一步、得过且过的心态相当盛行。

(二)劳动供给与就业行为不同

新生代农民工的劳动供给和就业行为明显不同于第一代农民工。在不同时代成长的农民工有着不同的阅历和自身不同特点,导致他们追求目标、偏好等不同,因此,仅仅将农民工视为同质群体的传统研究方法不能了解当今农民工劳动市场的供求状况。从经济学的角度说,新生代农民工因为他们的效用和目标函数与第一代农民工的差异导致了他们的劳动供给函数及其在劳动力市场的供求均衡点与厂商需求之间存在“缺口”而出现“用工荒”现象。

(三)社会保障需求较强

他们对社会保障的需要胜过第一代农民工。在心态和观念上,第一代农民工更接近于农民,对城市认同感较低,即使在城市中无法生存时,还有回乡务农的最后一条退路。第二代农民工更接近于市民,对城市的认同感较高,但与城市劳动力相比,由于缺乏必要的专业技能和进入正规就业市场的本领,心中过高的期望与所面对的非正规就业市场,形成巨大落差,在城市中无法实现真正立足,但也不愿甚至没有能力退回到农村中务农,成为了城市和农村之间真正的“两栖人”。新生代农民工不仅需要劳动权益的保护,而且需要社会失业救急网络的保障。

(四)更加注重个人发展和个人尊重

二、Logistic回归模式应用

(一)连接函数

Yi=N(μi,σ2) (公式1)

我们进一步假设均值μi是p个预测变量的线性函数,即如果我们假设第i组预测变量是x′i=(xi1,…,xip),那么我们有

μi=x′iβ (公式2)

其中β是未知参数向量 我们引入一个一对一连续可微变换:

ηi=g(μi) (公式3)

函数g(μi)就叫做连接函数。我们进一步假定做函数变换后的均值μi是一个线性模型,即

ηi=g(μi)=x′iβ (公式4)

那么ηi就是一个线性预测值,而且关于ηi的模型是非常简单的。由于这个变换是一对一的变换,我们可以有

μi=g-1(x′iβ) (公式5)

关于μi的模型一般比ηi的模型要复杂很多。

(二)Logit变换

首先我们假设反应变量yi是一个二元变量,方便起见我们假定它取0或1两个值。例如,我们定义:

yi=1 事件发生

0 事件未发生

本文中

yi=1 代表在嘉善长期工作

yi=0 代表不在嘉善长期工作

我们把yi看做是随机变量Yi的实际观测值,且它取1和0的概率分别是πi和1-πi。那么Yi就是服从概率πi的为Bernoulli(伯努利)分布,我们可以写成:

Pr{Yi=y}i=πyii (1-πi)1-yi (公式6)

其中yi=0或 1,且当yi=1时Pr{Yi=y}i=πi,当yi=0时Pr{Yi=y}i=(1-πi)。

另外我们知道,

E(Yi)=μi=πi (公式7)

var(Yi)=σ2i=πi(1-πi) (公式8)

如果我们视均值πi为一些预测因子的线性模型,即

πi=x′iβ (公式9)

其中β是回归系数向量。这个模型的问题在于,式子左边取值介于0到1之间,但是式子右边可以取任意实数值,因此,如果没有复杂的限制条件,我们不能确保预测值一定在正确的取值范围内。所以,我们需要对πi做一个变换。

首先,我们先令

(公式10)

即定义为事件发生的概率与事件不发生的概率的比值。这时oddsi的取值范围为(0,+∞)。

然后我们再对oddsi做对数变换,即

ηi=logit(πi)=log (公式11)

我们可以解出πi,即

(三)Logistic回归模型的系数介绍

1.发生比与发生比率

发生比是指事件发生的频数与没有发生的频数的比值,即:

odds=________________ 事件发生的频数

事件未发生的频数

如对于第i种事件,上式还可以表示为:

oddsi= (公式13)

其中pi是指第i种事件发生的概率,因此发生比odds也可以理解成事件发生的概率与不发生的概率的比值。

Logistic 回归的另一个重要的概念是发生比率odds ratio,它是指两组事件发生比的比值,用来比较两组事件的发生比。

2.用发生比率解释回归系数

我们以是否在嘉善长期工作为例,建立logistic回归模型,模型中反映变量就是是否在嘉善长期工作,如果一个被调查者留在嘉善,那么反映变量就编码为y=1,否则的话y=0,模型只有一个自变量―是否是新生代农民工。此时的logistic回归模型如下:

logit(pi)=log=η+αi (公式14)

其中反映变量为是否在嘉善长期工作的logit变换,预测变量为“是否是新生代农民工”(“是”为基准变量,αi=0)。

那么在这个例子中,η就可以作为基准发生比的对数,为了更方便理解,我们可以将logistic回归模型按照事件发生比的形式进行改写:

odds==exp(η+αi)=eη×eαi (公式15)

如此看来模型各项之间就不再是加法关系而是乘法关系。对于是新生代农民工的群体,由于α1=0,所以

odds是新生代农民工=eμ (公式16)

对于不是新生代农民工的群体,

odds不是新生代农民工=eμ×eα (公式17)

这样得到下面计算公式:

OR=_____________________ odds是新生代农民工 =eα

odds不是新生代农民工 (公式18)

odds不是新生代农民工==0.4072

OR=_____________________ odds是新生代农民工 ==2.5349

odds不是新生代农民工

三、结语

通过上述分析,我们看到新生代农民工比非新生代农民工有更强愿意在嘉善长期工作的意愿,因此要缓解嘉善的“招工难”和“用工荒”问题,必须慎重考虑如何留住新生代农民工。

新生代农民工与他们的父辈相比在文化程度、人格特征、打工的主要目的、城市认同感、生活方式、工作期望、与农村家庭的经济联系等方面与第一代农民工也迥然不同。新生代农民工的“城市梦”也比他们的父辈更执著,他们中间大多数人不愿意在结束了若干年的打工生涯后回乡务农。同时他们中间绝大多数根本没有务农的经历和经验。因此,要缓解“用工荒”必须能够准确把握新生代农民工的就业需求与特征。

全文阅读已结束,如果需要下载本文请点击

下载此文档

相关推荐 更多