Excel应用大全 | 什么是CRISP-DM 模型

一本书教会你分分钟搞定数据分析!

什么是CRISP-DM 模型呢?你听说过吗?来让小编给你解答吧!

CRISP-DM模型的起源

CRISP-DM(跨行业的数据挖掘标准流程,其全称为 Cross-Industry Standard Process for Data Mining)是一种被广泛应用的跨行业数据挖掘的标准流程。CRISP-DM 是由在数据挖掘领域中经验丰富的 DaimlerChrysler、SPSS 和 NCR 三家机构共同发展起来的数据挖掘方法论。

CRISP-DM 模型的 6 阶段

CRISP-DM 模型并不是什么全新的概念,本质上仍是数据分析领域通用的方法论:提出问题、分析问题和解决问题。CRISP-DM 模型核心亮点在于其简洁易用的特性,非常适合大规模定制和工程管理。在当今的商业数据挖掘领域,CRISP-DM 模型已经成为业内广泛认可的事实上的行业标准。
按 照 CRISP-DM 模 型, 通 常 将 数 据 挖 掘 的 整 个 过 程 划 分 为 6 个阶段:业务理解(Business Understanding)、 数 据 理 解(Data Understanding)、 数 据 准 备(Data Preparation)、模型搭建(Modeling)、模型评估(Evaluation)和模型部署(Deployment),如图 1-8 所示。

图 1-8 CRISP-DM 模型的 6 个阶段

1. 业务理解

在这个阶段,首先必须从业务角度上全面了解客户的要求和最终目的,然后将这些业务理解转化为一个明确的数据挖掘问题,最后制定项目计划并设计初步方案。

2. 数据理解

收集数据是数据理解阶段的第一步,也是整个数据挖掘项目的基础。为了对数据有初步的理解,接下来需要探索数据特征,进行简单的描述统计并核验数据质量。

3. 数据准备

数据准备阶段将对原始数据进行变量选择、数据清洗、数据加工和数据整合以构建数据挖掘数据集。在整个数据挖掘项目过程中,有可能需要多次实施数据准备工作。

4. 模型搭建

对于某类数据挖掘的需求,通常有多种方法和最佳实践可供选择使用。在模型搭建阶段,应根据数据挖掘项目的需求与特点,选择使用多种技术或方式搭建模型。

5. 模型评估

全面评估备选模型的准确性、稳定性和性能等指标,从备选模型中遴选最佳模型,并回顾模型搭建的各个步骤环节,确保最佳模型与业务目标一致,除此之外还应与客户根据实际业务场景来共同决定如何使用模型的结果。

6. 模型部署

搭建模型并不是数据挖掘的终极目的,更不是数据挖掘项目的结束标识,模型只是数据挖掘项目的交付物之一。搭建模型的目的在于应用于业务实践,解决业务问题,实现业务目标,这样才能真正实现数据挖掘的商业价值,这些都是在模型部署阶段完成的。

上述 6 个阶段的顺序并非一成不变,在不同的业务场景中,在不同类型的数据挖掘项目中,6 个阶段可以有先后不同的执行顺序,某个阶段也可能被多次执行。

例如,某公司决定实施供应链优化项目,希望借助数据挖掘技术提升门店销量预测的准确性,进而实现智能补货,避免由于门店缺货而错失销售机会。首先,物流部和信息部共同组建项目团队,针对供应链优化项目的业务需求进行充分沟通,并共同确定相关业务逻辑。信息部发现此项目所需基础数据已经在公司其他项目实施过程中完成了清洗与入库。因此可以直接进入模型搭建阶段,算法工程师将使用多种不同的数据挖掘技术来搭建算法模型。

非常不幸的是,项目进入模型评估阶段后,项目团队发现销量预测的准确性无法达到业务方的要求,经过进一步的业务调研分析,项目团队决定引入更多的输入因子,以优化模型
算法,进而提升预测算法的拟合度和泛化能力。对于新增数据集需要先进行数据理解,充分了解数据的业务含义,然后依次进入数据准备和模型搭建阶段。经过再次优化的算法模型在模型评估阶段表现优异,数据挖掘项目将进入模型部署阶段。以数据挖掘提供的算法模型为核心基础,配合智能补货系统,公司将极大提升供应链运营效率。

还想要学习其他数据处理与分析的吗?快来看看应用大全吧!

(0)

相关推荐

  • 数据挖掘与分析的六种经典方法论

    数据挖掘与分析的六种经典方法论 运营增长2021-03-07 14:33:18 最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型. 1.CRISP-DM 模型 CRISP-DM是Cros ...

  • 清理数据的重要性

    介绍 在精神上和卫生上进行清洁的概念在任何健康的生活方式中都是非常有价值的. 数据集有些是相同的.如果没有在数据科学生命周期中进行清理或作为日常活动进行清理,那么出于任何目的的代码将根本无法工作. 在 ...

  • 人员数据分析的CRISP-DM模型

    如何证明人力资源实践的有效性是重要且有价值,传统上,研究人员通过使用调查,访谈或观察收集数据来产生此类证据.借助这些数据,他们获得了对劳动力的洞察力,并制定了切实可行的干预措施以改善结果. 技术进步导 ...

  • 盘点数据挖掘包括哪些部分?

    大数据的时代我们人人身处其中,那么对于大数据的挖掘就是十分有价值的了,数据挖掘包括以下三点: 数据预处理 之所以有这样一个步骤,是因为通常的数据挖掘需要涉及相对较大的数据量,这些数据可能来源不一导致格 ...

  • Excel应用大全 | 单纯随机抽样

    一本书教会你分分钟搞定数据分析! 在数据分析中,抽样是指从全部数据中选择部分数据进行分析,以发掘更大规模数据集中的有用信息.在收集数据过程中,绝大多数情况下,并不采取普查的方式获取总体中所有样本的数据 ...

  • 实用Excel快捷键大全

    光明网2月23日 · 光明网官方账号 来源: 宁波发布

  • Excel快捷键大全

    Excel快捷键大全

  • 最强Excel快捷键大全,需要时查一查!说起Excel,可能所有人都知道这是一个office软件,但...

    说起Excel,可能所有人都知道这是一个office软件,但很少有人知道,这个名字其实源自英语中的"Excellence"一词,代表着:卓越和优秀. 感感顾名思义,设计者对这款软件 ...

  • Excel应用大全 | 二维表转换一维表

    一本书教会你分分钟搞定数据分析! 常见的二维表是一种交叉表,有行.列两个方向的标题交叉定义数据的属性.二维表在工作和生活中应用十分广泛,如课程表.工资表.人员花名册.价格表等.一维表则是每一行都是完整 ...

  • Excel应用大全 | PDF中的数据如何导出

    一本书教会你分分钟搞定数据分析! PDF(便携式文档格式,其全称为Portable Document Format)是由Adobe Systems公司开发设计的一种支持跨平台使用可移植的电子文件格式. ...

  • Excel应用大全 | 动手创建第一个数据透视表

    一本书教会你分分钟搞定数据分析! 图 6-1 展示了某鞋服零售公司在某时期内各零售商店的销售和成本明细数据,现在需要总结各店的综合销售情况.如果是 Excel 初学者遇到这上万行的数据,通常的做法可能 ...

  • 神级Excel函数大全:对手残党来说好用哭了,全部都是“高能”

    财务人之前在日常工作中多多少少都会用到财务函数公式,但是很多财务人对于一些常用的函数公式都不会,有的乱学一通还没有多少有用的,神级Excel函数大全:对手残党来说好用哭了,全部都是"高能&q ...

  • 纯干货, Excel快捷键大全,职场...

    纯干货, Excel快捷键大全,职场小白变大神 不管是在学习还是工中,Excel都会经常用到的,会这些快捷键,可以快递提升工作和学习效率,简单易上手,大家快用起来吧.#Excel# #Excel快捷键 ...