数据分析师是指数据工程师datician[&; #039; detn]的一种,在各行各业中,专门从事行业数据收集、组织、分析,并根据数据对行业进行研究、评估、预测的专家。 这是一个用数据说话的时代,也是一个依靠数据竞争的时代。 目前,世界500强企业中,90%以上设立了数据分析部门。 IBM、微软、谷歌等知名公司积极投资数据业务,成立数据部门,培养数据分析团队。 各国政府和越来越多的企业认识到数据和信息已经成为企业的知识资产和资源,分析和处理数据的能力越来越成为可靠的技术手段。
1
有Hive/Pig/Spark等大型数据分析工具的使用经验。 hive是一种基于Hadoop的数据仓库工具,提供了简单的sql查询功能,可以将结构化数据文件映射到数据库表,并将sql语句转换为MapReduce任务并执行。
2
熟练使用SAS、5PSS、r、Excel等相关工具,具有出色的报告和数据解读能力。 其中,静态分析系统( SAS )是一个模块化、集成的大规模APP应用软件系统。 它由数据访问、数据存储和管理、APP开发、图形处理、数据分析、报告、运筹学方法、计量经济学和预测等几十个专用模块组成。 SAS系统基本上可分为SAS数据库部分的4大部分; SAS分析的核心; SAS开发演示工具SAS对分布式处理模型的支持及其数据仓库设计。
3
熟悉MySQL等关系数据库。 MySQL是一种关系数据库管理系统,由瑞典MySQL AB公司开发,目前是Oracle旗下的产品。 MySQL是最流行的关系数据库管理系统之一,在web APP方面,MySQL是最好的RDBMS ( relationaldatabasemanagementsystem ) APP软件。
4
至少熟悉一种脚本语言( shell、Python等),能够独立进行相关数据处理。 Python有丰富而强大的库。 经常被称为粘接剂语言,可以很容易地把用其他语言制作的各种模块,特别是C/C联系起来。 一个常见的应用实例是使用Python快速生成程序原型(有时是程序的最终接口),其中,用更合适的语言改写有特殊要求的部分。 例如,如果对性能要求特别高,3D游戏的图形呈现模块可以被C/C重写并封装到Python可以调用的扩展类库中。 请注意,在使用扩展类库时,必须考虑平台问题,并且可能不提供跨平台实现。
5
了解数理统计、数据分析和挖掘,熟悉常用算法。 具有数据仓库和建模理论基础或实际经验。 数据仓库,英文名为Data Warehouse,简称DW或DWH。 数据仓库是一个战略集合,为企业各级决策过程提供所有类型的数据支持。 这是为分析报告和决策支持而创建的单个数据存储。 指导需要业务智能的企业改进、监控业务流程时间、成本、质量和控制。
6
具有良好的交际能力,文字语言表达能力,优秀的逻辑分析能力:
具有良好的数据灵敏度,可以从大量数据中提取核心结果
具有高度的责任感,对数据分析和挖掘有浓厚的兴趣
具有良好的团队合作精神,具有项目管理能力。