Excel应用大全 | 什么是CRISP-DM 模型
什么是CRISP-DM 模型呢?你听说过吗?来让小编给你解答吧!
CRISP-DM模型的起源
CRISP-DM(跨行业的数据挖掘标准流程,其全称为 Cross-Industry Standard Process for Data Mining)是一种被广泛应用的跨行业数据挖掘的标准流程。CRISP-DM 是由在数据挖掘领域中经验丰富的 DaimlerChrysler、SPSS 和 NCR 三家机构共同发展起来的数据挖掘方法论。
CRISP-DM 模型的 6 阶段
图 1-8 CRISP-DM 模型的 6 个阶段
1. 业务理解
在这个阶段,首先必须从业务角度上全面了解客户的要求和最终目的,然后将这些业务理解转化为一个明确的数据挖掘问题,最后制定项目计划并设计初步方案。
收集数据是数据理解阶段的第一步,也是整个数据挖掘项目的基础。为了对数据有初步的理解,接下来需要探索数据特征,进行简单的描述统计并核验数据质量。
数据准备阶段将对原始数据进行变量选择、数据清洗、数据加工和数据整合以构建数据挖掘数据集。在整个数据挖掘项目过程中,有可能需要多次实施数据准备工作。
对于某类数据挖掘的需求,通常有多种方法和最佳实践可供选择使用。在模型搭建阶段,应根据数据挖掘项目的需求与特点,选择使用多种技术或方式搭建模型。
全面评估备选模型的准确性、稳定性和性能等指标,从备选模型中遴选最佳模型,并回顾模型搭建的各个步骤环节,确保最佳模型与业务目标一致,除此之外还应与客户根据实际业务场景来共同决定如何使用模型的结果。
搭建模型并不是数据挖掘的终极目的,更不是数据挖掘项目的结束标识,模型只是数据挖掘项目的交付物之一。搭建模型的目的在于应用于业务实践,解决业务问题,实现业务目标,这样才能真正实现数据挖掘的商业价值,这些都是在模型部署阶段完成的。
例如,某公司决定实施供应链优化项目,希望借助数据挖掘技术提升门店销量预测的准确性,进而实现智能补货,避免由于门店缺货而错失销售机会。首先,物流部和信息部共同组建项目团队,针对供应链优化项目的业务需求进行充分沟通,并共同确定相关业务逻辑。信息部发现此项目所需基础数据已经在公司其他项目实施过程中完成了清洗与入库。因此可以直接进入模型搭建阶段,算法工程师将使用多种不同的数据挖掘技术来搭建算法模型。
还想要学习其他数据处理与分析的吗?快来看看应用大全吧!