目前国内数据挖掘人员工作领域分为几类?开课吧
在数据分析过程中,任何一个环节都是非常重要的,同时也是数据分析师需要做好的事情,为了能够做好数据分析工作,需要搞清楚目前国内数据挖掘人员工作领域分为几类?
目前国内数据挖掘人员工作领域分为几类?开课吧
目前国内的数据挖掘人员工作领域大致可分为三类:
1、数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。
2、数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。
3、科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。
各工作领域需要掌握的技能:
数据分析师:
需要有深厚的数理统计基础,但是对程序开发能力不做要求。
需要熟练使用主流的数据挖掘(或统计分析)工具如Business Analytics and Business Intelligence Software(SAS)、SPSS、EXCEL等。
需要对与所在行业有关的一切核心数据有深入的理解,以及一定的数据敏感性培养。
目前国内数据挖掘人员工作领域分为几类?开课吧
数据挖掘工程师:
需要理解主流机器学习算法的原理和应用。
需要熟悉至少一门编程语言如(Python、C、C++、Java、Delphi等)。
需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。
科学研究方向:
需要深入学习数据挖掘的理论基础,包括关联规则挖掘 (Apriori和FPTree)、分类算法(C4.5、KNN、Logistic Regression、SVM等) 、聚类算法 (Kmeans、Spectral Clustering)。目标可以先吃透数据挖掘10大算法各自的使用情况和优缺点。
相对SAS、SPSS来说R语言更适合科研人员The R Project for Statistical Computing,因为R软件是完全免费的,而且开放的社区环境提供多种附加工具包支持,更适合进行统计计算分析研究。虽然目前在国内流行度不高,但是强烈推荐。
可以尝试改进一些主流算法使其更加快速高效,