【系列1】工业数据分析的关键

工业发展是国民经济的命脉,在现代工业体系中,中国拥有39个工业大类,191个中类,525个小类。工业领域门类众多、产业链复杂,生产工艺、产品类型、发展水平各不相同,各个企业面临的市场、管理、生产、技术问题也各不相同,如何从形态各异的表象问题中,抽取共性的问题,发现具有代表性的解决方案,成为工业转型的突破口。

为了加快向工业强国迈进,工业大数据作为制造业数字化转型与智能化升级的关键点,引起了业界的普遍关注。其中,对工业数据的分析、挖掘、利用,成为重中之重。尽管所属行业、门类各不相同,但是工业数据成为了工业界最普遍、最通行的存在,几乎没有哪个现代的工业企业能够在没有数据和信息系统的支撑下顺利运行。数据,成为了现代工业的新“基建”,是通行的语言,通行的“货币”。

不仅数据的产生、流动、存在成为了工业界的普遍特征,工业界亟需依赖数据力量解决的问题在本质上也具有一定的共性。提质、增效、降本、安全,是工业企业共同且永恒的主题,以这些主题为线索,结合各个行业中的具体问题和具体特点,形成了工业数据分析中一些典型的应用场景。

本系列文章将根据寄云科技在为多个工业客户合作与服务的过程中遇到的客户痛点,尝试梳理出一些跨行业、但具有共性的问题,并根据我们采取同类或相似的技术、算法以及提出的解决方案,提炼出工业数据分析应用的典型场景。结合具体的工业应用场景,对于不同的数据分析主题和应用场景,进行举例说明。并结合寄云的工业大数据建模分析平台DA Studio展示一些分析主题中的具体分析步骤和分析结果。

数据分析基本概念

NeuCloud

(1)数据分析

数据分析是指通过选用合适的统计学、机器学习、规则挖掘等方法来对数据进行建模和分析,从数据中提取出有用的信息并得出结论。数据分析方法在各个领域均有应用,可以说,有数据的地方就会用到数据分析。

(2)数据分析的应用

随着大数据技术的发展,数据分析渗透进了各行各业,典型的如:保险业的客户分析、理赔分析及风险分析等;电信业的需求分析、渠道分析等;银行业的效益分析、交易分析以及信贷分析等。可以说,在通用领域数据分析方法的应用非常广泛,同样的,对于工业领域,我们一样可以利用数据分析的方法,帮助企业实现降低成本、提高效率、优化管理等目标。

(3)工业领域的数据分析

通过采用数据分析的方法,诸如描述统计分析、机器学习、关联规则挖掘、运筹与优化、专家知识库与专家系统、概率推理等,我们可以实现设备运行监控与性能对比分析、企业生产流程的优化、产品的质量管理与分析、设备故障诊断与健康管理(包括异常检测、故障诊断、根因分析)等问题。

不等于工业+数据分析理论

工业数据分析

需要强调的是,工业数据分析并非在工业领域直接套用一般的数据分析理论。工业数据分析既要遵循普通的数据分析技术,也要以工业机理为基础。如果直接套用现成的“数学模型”和分析套路,而不顾实际领域知识,结果只会是脱离数据的上下文背景做分析,得出的结论甚至会违背业务常识。正因为此,工业数据分析面临着一些独特的挑战。

首先是海量数据与有效数据量矛盾。麦肯锡报告显示,美国的离散制造业是所有行业中数据储量最大的。但实际上,在海量的工业数据中,有价值的数据非常稀缺,原因是在工业领域,有分析利用价值的机器数据往往需要包含故障情形下的“坏”样本,以及在各个典型工况下的样本。但很多工业系统的数据可靠性较高,观测到故障并且已经被人准确标记的有效样本更是难能可贵。而且运行工况变化不频繁,长期稳定在某个工作点下,无法提供多样性的样本。

另一方面,由于基础建设水平参差不平,也带来了缺少有效数据源的尴尬局面。这就造成了很多遗憾,比方说,有的数据分析方法已经得到验证可行,但是现实中却缺少足够的数据点而不能落地。

还有一点,有些工业场景,只有在极短的时间内采集测量数据,才能捕获机器设备的细微状况,这种高频数据对采集、存储和分析全体系软件都带来了很大的挑战,对其进行处理分析在以往是不可想象的。

离不开“平台”的支撑

工业数据分析

随着IT、通信和人工智能等的技术进步,更多的传感器正在部署,更高性能的数据采集、处理软硬件正在解决这些挑战。

然而,尽管一些前沿企业正在充分的享受这些技术带来的巨大收益,但是对于大部分企业来说,那些经过领导型企业和实验室验证的数据价值挖掘手段似乎难以企及。

为什么?丰富的数据本身解决不了任何问题。通过庞大的技术团队或者实验室构建的繁杂的数据分析技术,很难在一般企业落地。IT和OT的发展和整合已经较具有挑战,从海量数据中挖掘价值则更加困难,让企业望而却步。为了从数据中方便快速地提取价值、产生洞见,需要一站式的数据平台来应对这些大数据集的数量、速度和多样性以及大量繁杂的异构系统融合带来的挑战。

以寄云NeuSeer 工业互联网平台为例,针对传统的烟囱式应用造成的大量功能重用、数据隔离和软件质量问题,能够为企业构建统一的工业互联网平台,实现海量数据的接入,提供丰富的应用开发、数据分析和模型开发功能,支持多个场景的工业互联网应用开发,采用微服务的架构简化应用的设计,实现应用的快速迭代。

通过数据管理平台,实现数据的统一管理,通过配置实现标准化的指标体系,使用基于规范后的开放数据进行开发,可以降低对底层数据架构的依赖,加快应用开发效率。方便的定义各类模型并实例化,快速构建各类工业关键指标并实时计算,提供便捷安全的数据共享。

当前数据分析需要多数据源、多流程的、以手工为主的分析,熟悉问题的业务工程师往往无法直接构建算法模型,需要借助于算法工程师进行分析代码的开发,因此很难快速建模。对此,寄云NeuSeer平台提供图形化、拖放式的模型开发工具,实现流程化的建模,提供丰富的组件,减少算法开发工作量,提供针对不同场景的的分析模板,加快分析过程。

系列2预告

《工业数据分析应用之软测量》:

软测量也称之为软仪表、虚拟量测、虚拟仪器,它是对一些难以测量或暂时不能测量的重要变量,选择另外一些容易测量的变量,通过构成某种数学关系模型,来推断和估计难测量的重要变量,以代替或辅助真实测量仪表的功能。

(0)

相关推荐