Glassdoor连续第三年将数据科学家评为2018年美国排名第一的最佳工作。随着越来越多的数据可访问性,大型科技公司不再是唯一需要数据科学家的公司。各种行业(无论大小)对数据科学专业人员的需求不断增长,这是因为缺少可填补空缺职位的合格候选人而面临的挑战。
谷歌的数据科学家职位介绍当中有这么一段描写:“作为数据科学家,您将评估和改进Google的产品。您将与工程师和分析师的多学科团队合作解决各种问题。该职位将以科学的严谨和统计方法应对产品创建,开发和改进的挑战,并对最终用户的行为表示赞赏。”
UC Berkeley信息学院对于数据科学的介绍中强调:“数据科学正在不断发展,成为熟练专业人员最有前途和需求最大的职业之一。如今,成功的数据专业人员已经意识到,他们必须超越分析大量数据的传统技能,数据挖掘和编程技能。为了发现对组织有用的情报,数据科学家必须掌握数据科学生命周期的全部范围,并具有一定程度的灵活性和理解力,以在流程的每个阶段最大化回报。”
该图像代表了数据科学生命周期的五个阶段:采集(数据采集,数据输入,信号接收,数据提取);维护(数据仓库,数据清理,数据分段,数据处理,数据体系结构);处理(数据挖掘,聚类/分类,数据建模,数据汇总);分析(探索性/确认性,预测性分析,回归,文本挖掘,定性分析);沟通(数据报告,数据可视化,商业智能,决策)。
从数据科学的生命周期中我们可以看出:对于数据科学的发展,并不是一个线性的过程,而是一个循环周期性的发展。
数据科学家检查哪些问题需要回答以及在哪里可以找到相关数据。他们具有商业头脑和分析能力,以及挖掘,清理和显示数据的能力。企业使用数据科学家来获取,管理和分析大量非结构化数据。然后将结果合成并传达给关键利益相关者,以推动组织中的战略决策。
所需技能:编程技能(SAS,R,Python),统计和数学技能,讲故事和数据可视化,Hadoop,SQL,机器学习。
数据分析师弥合了数据科学家与业务分析师之间的鸿沟。向他们提供了组织需要回答的问题,然后组织和分析数据以找到与高级业务策略相符的结果。数据分析师负责将技术分析转化为定性的行动项目,并有效地将其发现传达给不同的利益相关者。
所需技能:编程技能(SAS,R,Python),统计和数学技能,数据整理,数据可视化。
数据工程师管理指数级快速变化的数据。他们专注于数据管道和基础结构的开发,部署,管理和优化,以将数据转换并传输给数据科学家进行查询。
所需技能:编程语言(Java,Scala),NoSQL数据库(MongoDB,Cassandra DB),框架(Apache Hadoop)。
数据科学专业人士因其高超的技术技能而获得奖励,这是在大多数行业的大小公司中具有竞争力的薪水和巨大的工作机会。在Glassdoor上有4,500多个未平仓职位,具有适当经验和知识的数据科学专业人员将有机会在世界上一些最具前瞻性的公司中脱颖而出。
以下是以下职位的平均基本工资:
数据分析师:65,470美元
数据科学家:120,931美元
高级数据科学家:141,257美元
数据工程师:137,776美元
获得数据科学领域的专门技能可以进一步区分数据科学家。例如,机器学习专家利用高级编程技能来创建算法,该算法不断收集数据并自动调整其功能以提高效率。
(文章来源:https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)