数据科学 - 科学家


数据科学家是经过培训的专业人员,负责分析和理解数据。他们利用数据科学知识帮助企业做出更好的决策并更好地运营。大多数数据科学家在数学、统计学和计算机科学方面拥有丰富的经验。他们利用这些信息来查看大量数据并发现趋势或模式。数据科学家还可能想出收集和存储数据的新方法。

如何成为一名数据科学家?

非常需要懂得如何使用数据分析来为公司带来竞争优势的人才。作为数据科学家,您将制定基于数据的业务解决方案和分析。

成为数据科学家的方法有很多,但由于这通常是一项高级工作,因此大多数数据科学家都拥有数学、统计学、计算机科学和其他相关领域的学位。

以下是成为数据科学家的一些步骤 -

步骤 1 - 正确的数据技能

如果您没有数据相关的工作经验,您可以成为数据科学家,但您需要获得从事数据科学职业所需的基础。

数据科学家是一个高级角色;在达到这种专业水平之前,您应该获得相关主题的全面知识基础。这可能包括数学、工程、统计学、数据分析、编程或信息技术;一些数据科学家的职业生涯始于银行业或棒球球探。

但无论您从哪个领域开始,都应该从 Python、SQL 和 Excel 开始。这些能力对于处理和组织原始数据非常重要。熟悉 Tableau 很有帮助,您会经常使用它来构建视觉效果。

第 2 步 - 学习数据科学基础知识

数据科学训练营可能是学习或改进数据科学原理的完美方法。您可以参考数据科学训练营,其中详细介绍了每个主题。

学习数据科学基础知识,例如如何收集和存储数据、分析和建模数据以及使用数据科学库中的每种工具(例如 Tableau 和 PowerBI 等)显示和呈现数据。

在训练结束时,您应该能够利用 Python 和 R 创建评估Behave和预测未知的模型,以及以用户友好的格式重新打包数据。

一些数据科学职位列表都将高级学位作为先决条件。有时,这是没有商量余地的,但当需求超过供应时,这就会越来越暴露出真相。也就是说,对必要才能的证明往往超越了单纯的资历。

招聘经理最关心的是你能在多大程度上表现出你对这个主题的了解,越来越多的人意识到这不必以传统方式完成。

数据科学基础知识

  • 收集和存储数据。

  • 对数据进行分析和建模。

  • 构建一个可以使用给定数据进行预测的模型。

  • 以用户友好的形式可视化和呈现数据。

第 3 步 - 学习数据科学的关键编程语言

数据科学家使用各种专门用于清理、分析和建模数据的工具和程序。数据科学家需要了解的不仅仅是 Excel。他们还需要了解 Python、R 或 Hive 等统计编程语言,以及 SQL 等查询语言。

RStudio Server 提供了在服务器上使用 R 的开发环境,是数据科学家最重要的工具之一。另一种流行的软件是开源 Jupyter Notebook,它可用于统计建模、数据可视化、机器学习等。

机器学习在数据科学中应用最多。这是指使用人工智能赋予系统学习和变得更好的能力的工具,而无需专门编程来实现这一点。

第 4 步 - 学习如何进行可视化并进行练习

练习使用 Tableau、PowerBI、Bokeh、Plotly 或 Infogram 等程序从头开始制作自己的可视化。找到让数据说话的最佳方法。

这一步一般使用Excel。尽管电子表格背后的基本思想是通过关联单元格中的信息来进行简单的计算或图表,但 Excel 在 30 多年后仍然非常有用,没有它几乎不可能进行数据科学。

但制作美丽的照片仅仅是开始。作为数据科学家,您还需要能够使用这些可视化效果向现场观众展示您的发现。您可能已经具备这些沟通技巧,但如果没有,也不必担心。任何人都可以通过练习变得更好。如果需要的话,可以先从小事做起,先向一位朋友甚至是你的宠物做演示,然后再向小组进行演示。

第 5 步 - 从事一些数据科学项目,这将有助于培养您的实用数据技能

一旦您了解了数据科学家使用的编程语言和数字工具的基础知识,您就可以开始使用它们来练习和提高您的新技能。尝试承担需要广泛技能的项目,例如使用 Excel 和 SQL 来管理和查询数据库,使用 Python 和 R 使用统计方法分析数据,构建分析Behave并为您提供新见解的模型,并使用统计分析来预测你不知道的事情。

在练习时,尝试涵盖该过程的不同部分。首先研究公司或市场部门,然后为手头的任务定义并收集正确的数据。最后,清理并测试该数据,使其尽可能有用。

最后,您可以创建并使用自己的算法来分析和建模数据。然后,您可以将结果放入易于阅读的视觉效果或仪表板中,用户可以使用它们与您的数据进行交互并提出相关问题。您甚至可以尝试向其他人展示您的发现,以更好地沟通。

您还应该习惯使用不同类型的数据,例如文本、结构化数据、图像、音频甚至视频。每个行业都有自己的数据类型,可以帮助领导者做出更好、更明智的决策。

作为一名在职数据科学家,您可能只是一两个领域的专家,但作为构建技能的初学者,您将希望学习尽可能多类型的基础知识。

承担更复杂的项目将使您有机会了解如何以不同的方式使用数据。一旦您知道如何使用描述性分析来寻找数据模式,您就可以更好地准备尝试更复杂的统计方法,例如数据挖掘、预测建模和机器学习来预测未来事件甚至提出建议。

第 6 步 - 制作一个展示您的数据科学技能的作品集

一旦您完成了初步研究、接受了培训,并通过制作各种令人印象深刻的项目来练习您的新技能,下一步就是通过制作精美的作品集来展示您的新技能,这将使您获得梦想的工作。

事实上,你的作品集可能是你找工作时最重要的东西。如果您想成为一名数据科学家,您可能想在 GitHub 上展示您的工作,而不是(或除了)您自己的网站之外。GitHub 可以让您轻松展示您的工作、流程和结果,同时还可以在公共网络中提升您的个人资料。不过,不要就此止步。

在您的数据中加入一个引人入胜的故事,并展示您试图解决的问题,以便雇主可以看到您的表现。您可以在 GitHub 上以更大的图片显示您的代码,而不仅仅是单独显示您的代码,这使您的贡献更容易理解。

当您申请特定工作时,不要列出您的所有工作。仅突出显示与您所申请的工作最相关的几部分,并且最能展示您在整个数据科学过程中的技能范围,从基本数据集开始到定义问题、清理、构建模型,并寻找解决方案。

你的作品集是你展示你能做的不仅仅是处理数字和良好沟通的机会。

第 7 步 - 展示你的能力

您自己完成的一个出色的项目可以是展示您的技能并给可能雇用您的招聘经理留下深刻印象的好方法。

选择您真正感兴趣的事物,提出有关它的问题,并尝试用数据回答该问题。

通过以优美的方式展示您的发现并解释您是如何到达那里的,记录您的旅程并展示您的技术技能和创造力。您的数据应该附有令人信服的叙述,展示您解决的问题,突出您的流程和您采取的创造性步骤,以便雇主能够看到您的价值。

加入像 Kaggle 这样的在线数据科学网络是展示您参与社区、展示您作为有抱负的数据科学家的技能以及继续发展您的专业知识和影响力的另一种好方法。

第 8 步 - 开始申请数据科学工作

数据科学领域有很多工作。在学习基础知识后,人们通常会继续专注于不同的子领域,例如数据工程师、数据分析师或机器学习工程师等等。

了解公司的价值观以及他们正在从事的工作,并确保它符合您的技能、目标以及您未来想做的事情。并且不要只关注硅谷。波士顿、芝加哥和纽约等城市很难找到技术人才,因此机会很多。