数据科学需要掌握的几个基本技能

1、Python Programming
Python编程。Python是世界上最流行的编程语言之一,是每个数据科学初学者入门的语言。

2、R Programming
R编程。R语言是由统计学家设计的语言,支持概率分布、统计函数、数学函数、绘图、可视化、互操作性,以及机器学习和AI,是世界上仅次于Python数据科学语言。

3、Statistics & Probability
统计和概率。这些数学基础知识,是数据科学的基石。

4、Linear Algebra
线性代数。有了统计和概率,进一步的数据操作就用到了线性代数。

5、Data Preparation and Data Extraction, Data Transformation, Data Loading
数据准备和数据提取、数据转换、数据加载。这是数据科学的核心操作,直接关系到数据的使用效率和正确与否。

6、Machine Learning with Python and R
使用Python和R进行机器学习。数据科学的升华之处。

7、Data Visualization
数据可视化。会做还得会展示,常用的可视化工具和库有Matplotlib、Seaborn、Bokeh、ggplot2、plot.ly、D3.js、Tableau、Google Data Studio、Microsoft Power BI Desktop。

英文原文:
7 Technical Concept Every Data Science Beginner Should Know

登录注册后才能评论。