5种人员分析的高级方法

之前已经给出了多个示例,说明员工如何从数据分析中受益,本文我想探索一组不同的高级数据分析技术,以了解如何将其用于分析人员数据以提高组织的成功率。
数据科学越来越多地融入企业,产品和整个社会,事例变得越来越复杂,并且在各个部门中得到了广泛使用。
作为人力资源分析从业人员,我与组织合作,以深入了解其员工队伍并设计有效的战略来帮助组织成功。尽管上面的事例通常是使用IT技术来不断改进的算法,但是这种算法的概念始终是一种或多种数据科学技术。
尽管具有基本功能HR数据和度量标准已经存在很长时间了,但是使用高级统计技术进行人员分析的案例仍然是一个新话题,只有少数组织实际对人员数据进行了这类分析。因此,我认为与HR从业者们一起讨论已经做的事情和集思广益,并提出使用通用数据科学技术进行人员分析的方法可能是个好主意,同时让我们得到启发!
1、回归分析
作为最常见的统计分析之一,回归用于捕获一个或多个变量与函数结果之间的关系,可以根据上下变量的值预测结果以及未来进展。例如:薪酬内部公平性和外部竞争性分析。
当结果变量本质上是分类时,线性和逻辑回归之间的区别在于使用逻辑回归的方式;当结果变量是连续的时,使用线性回归。这里要注意的是与相关性不同,回归中假设上下变量和结果变量具有单向因果效应。
市场营销中试图预测客户流失,流失率是个人(客户,员工)离开的比率,显而易见的目标是防止他们跳槽。婚恋网站定期使用回归分析来改善其服务并为其成员提供更好的匹配。
如何通过人员数据分析帮助解决业务问题?
可以在销售有效性中找到一个例子,衡量性格问卷得分与销售数字之间的关系可能非常有价值。人格特质(如大五人格)以什么方式与销售数字相关联?外向性和尽责性可以预测销售成功。问题是,销售专业人员从事的市场是否存在差异?使用回归分析,您可以了解是否存在关系,以及人格特质在多大程度上预测员工的销售效率。
2、分类分析
分类是应用最广和最出名的数据科学方法之一。在分类中,对于任何新观察值(数据),我们要预测观察值所属的类别,这是通过分析已知类别的历史观察来完成。
分类最著名的模型之一是决策树。决策树是一个过程,其中回答许多是或不是问题以确定类别。大规模使用决策树也被称为随机森林技术,该方法通常用于大型数据集。它通常与逻辑回归结合使用,以一种称为集成学习的方法来改善统计模型的预测性能。
在医疗保健中,如何使用分类是一个例子,其中使用患者的历史数据来分析症状,以便确定(分类)新患者可能患有的疾病。这已经用于预测癌症和确定高危人群。
另一个例子是银行业,根据年龄和工资等属性,申请贷款的客户可能被归类为安全或有风险。这种活动也称为监督学习, 因为它是基于先前的学习和已经训练的模型,所构建的数据模型可用于分类新的输入数据。
它如何通过人员数据帮助应对组织挑战?
例如根据团队组成和上下变量来预测团队的成功率。作为组织我们倾向于根据经验,可用性和过去的个人表现来选择项目团队。阐明一些其他因素的影响非常有价值,例如角色偏好,领导风格,团队动力,团队规模,背景以及背景因素(例如任务期限和预算)。这将需要庞大的数据集以训练模型。在这种情况下,分类技术可能是神经网络。想象一下,能够预测在特定情况下哪种团队组成将具有最高的成功率!
3、聚类分析
聚类是一种描述数据并查找一般模式的技术。当可用数据未标记(或含糊不清)且通过查找彼此相似的观察而起作用时,将使用此方法。然后将这些观察结果“聚类”,以便可以对组进行标记和分类。在这方面,聚类类似于分类。它旨在对感兴趣的特定人群进行分类,但是在无监督学习的方式上有所不同,这意味着它没有预设的结果,而是在数据中寻找共同点。有关分类和聚类之间的简短比较,请参见下表。
可以在市场营销中找到很多集群的例子,其中该技术用于发现具有相似需求的客户群,因此可以针对他们的产品或服务。在政治中,聚类用于识别特定的选民群体,以便能够通过特定的信息来针对这些群体,这就是奥巴马著名地部分基于数据分析进行竞选的方式。
聚类分析通常是分类分析的起点,因为它有助于定义感兴趣的组。
它如何通过人员数据帮助应对组织挑战?
作为一个组织,我想知道我应该与哪些客户匹配以提高客户满意度
客户满意度对于大多数组织而言都是至关重要的业务成果,因此,了解哪些员工与哪种类型的客户最匹配将是非常重要的。我处理过的一家保险公司实际上是在呼叫中心进行呼叫之后,对客户和员工的反馈进行文本挖掘,以作为因素分析的输入,在该分析中,他们发现了偏好的沟通方式集群。
基于这些信息,他们开发了一种算法,可根据客户和员工的通信偏好将客户打补丁到特定的呼叫中心员工。通过利用这一点,他们能够提高客户满意度。
4、关联分析
关联分析或关联规则挖掘(ARM)是一种使数据科学家能够在大型数据集中查找模式的技术。它通过发现大型数据库中不同变量之间的相关关联来创造价值。模式的解释并不容易,因为存在大量可能的模式,关联或模式通常毫无意义。它有助于提前限制算法,从而尽可能减少数据“噪声”。
常见的示例来自使用ARM技术按照购物行为中的模式创建楼层平面图的零售和超市连锁店:(有X%的人从品牌A购买果汁,也从品牌B购买巧克力,所以我们将这些物品放在相同高度的同一走道上)。
根据生成的规则,商场经理可以战略性地将产品放置在一起或按顺序放置,从而导致销售增长,进而增加商店的收入。在银行业务中,他们使用类似的技术向遵循特定购买模式的客户提供产品。
它如何通过人员数据帮助应对组织挑战?
该技术可用于确定人力资源实践中的模式,例如入职,职业道路,教育和人才管理,然后确定哪些模式与快乐高效的员工相关。然后可以将其反馈给HR系统以获取自定义内容。就像Amazon和Netflix向我们作为消费者提供定制内容的方式一样。
5、异常检测分析
异常检测是一种专注于识别意外或异常模式的方法。这些技术可以根据历史数据将新情况标记为“异常”。这就是识别异常值的全部内容,当您处理大型数据集时,有一种算法可以帮助您完成繁重的工作。
在金融领域,异常检测被广泛用于识别欺诈或异常交易。您可能自己有一天接到银行的电话,以检查是否在您了解的情况下执行了某笔交易。这可能是基于异常检测算法发出的信号。
另一个例子是核电厂的维护需求。如您所料,任何异常情况都需要立即报告。分析工厂传感器数据的不断流入是否存在异常,可以实现这一点。
它如何通过人员数据帮助应对组织挑战?
工作中的事故通常是疲劳和长时间工作的结果。对12项研究的回顾表明,每天工作超过12小时的员工比工作8小时的员工有38%的职业伤害风险。
与每天工作8个小时相比,每天工作10个小时会使受伤风险增加15%。在这里,异常检测分析可以帮助识别工作时间超过指定阈值的员工,尤其是在诸如建筑,制造和工程等高风险职业中。这有助于防止工作场所发生事故和伤害。
我意识到,讨论数据科学方法并将可能的HR用例与它们联系起来是一种倒置。通常,您首先要面对业务挑战,然后选择有用的分析和合适的方法。但这有时可以帮助您了解其他部门以及那里有些相似的挑战并从中得到启发。
数据科学家倾向于使用不同的技术进行大量实验,以生成准确的模型。通常,无法准确预测哪种技术最能为复杂的研究问题提供答案。这就是为什么数据科学家了解各种不同的技术很重要的原因。此外,对于任何人的分析从业人员来说,从其他部门完成的分析用例中获得启发确实很有意义。
   —End—
(0)

相关推荐