大数据分析 - 数据科学家


数据科学家的角色通常与预测建模、开发细分算法、推荐系统、A/B 测试框架等任务相关,并且经常处理原始非结构化数据。

他们的工作性质要求对数学、应用统计和编程有深刻的理解。数据分析师和数据科学家之间有一些共同的技能,例如查询数据库的能力。两者都分析数据,但数据科学家的决策可以对组织产生更大的影响。

以下是数据科学家通常需要具备的一组技能 -

  • 使用统计包进行编程,例如:R、Python、SAS、SPSS 或 Julia
  • 能够清理、提取和探索来自不同来源的数据
  • 统计模型的研究、设计和实现
  • 深厚的统计、数学和计算机科学知识

在大数据分析中,人们通常会混淆数据科学家和数据架构师的角色。事实上,差异非常简单。数据架构师定义存储数据的工具和架构,而数据科学家则使用该架构。当然,如果临时项目需要,数据科学家应该能够设置新工具,但基础设施定义和设计不应成为其任务的一部分。