对比 Python – 它们之间的区别
R 和之间的主要区别 Python
- R主要用于统计分析,而 Python 提供更通用的数据科学方法
- R 的主要目标是数据分析和统计,而 Python 是部署和生产
- R 用户主要由学者和研发专业人员组成,而 Python 用户主要是程序员和开发人员
- R 提供了使用可用库的灵活性,而 Python 提供从头构建新模型的灵活性
- R 语言一开始很难学,而 Python 学习起来线性且平滑
- R 集成到本地运行,而 Python 与应用程序完美集成
- R 和 Python 可以处理庞大的数据库
- R 可以在 R Studio IDE 上使用,而 Python 可用于 Spyder 和 Ipython Notebook IDE
- R 包含各种软件包和库,例如 tidyverse、ggplot2、caret、zoo,而 Python 包含 pandas、scipy、scikit-learn、TensorFlow、caret 等软件包和库
和 Python 都是开源编程语言,社区规模庞大。新的库或工具不断添加到各自的目录中。 R 主要用于统计分析,而 Python 为数据科学提供了更通用的方法。
和 Python 是面向数据科学的编程语言中最先进的。当然,学习它们都是理想的解决方案。R 和 Python 需要时间的投入,并不是每个人都能享受到这样的奢侈。 Python 是一种具有易读语法的通用语言。而 R 是由统计学家构建的,包含他们特定的语言。
R
学者和统计学家在二十多年里开发了 R。R 现在已经拥有最丰富的数据分析生态系统之一。CRAN(开源存储库)中提供了大约 12000 个软件包。无论您要执行什么分析,都可以找到一个库。丰富的库种类使 R 成为统计分析的首选,尤其是对于专业分析工作。
R 与其他统计产品之间的最显著区别在于输出。R 拥有出色的工具来传达结果。Rstudio 附带库 knitr。谢益辉编写了这个包。他使报告变得简单而优雅。用演示文稿或文档传达调查结果很容易。
Python
Python 可以执行与 R 几乎相同的任务:数据整理、工程、特征选择网络抓取、应用程序等等。 Python 是一种大规模部署和实施机器学习的工具。 Python 代码比 R 更容易维护、更强大。几年前; Python 没有太多的数据分析和机器学习库。最近, Python 正在迎头赶上,并为机器学习或人工智能提供尖端的 API。大多数数据科学工作可以用五个 Python 库:Numpy、Pandas、Scipy、Scikit-learn 和 Seaborn。
Python另一方面,与 R 相比,它使可复制性和可访问性更容易。事实上,如果你需要在应用程序或网站中使用分析结果, Python 是最好的选择。
人气指数
IEEE Spectrum 排名是衡量 编程语言左栏为2017年排名,右栏为2016年排名。2017年, Python 今年排名第一,而一年前排名第三。R 排名第 6th 的地方。
工作机会
下图显示了按编程语言划分的数据科学相关职位数量。 SQL 遥遥领先,其次是 Python 和 Java.R 等级 5th.
如果我们关注 Python (黄色)和 R(蓝色),我们可以看到 Python 在职位描述中被引用的次数比 R 多。
R 和 Python
然而,如果我们看一下数据分析工作,R 是迄今为止最好的工具。
转换人数百分比
下图中有两个关键点。
- Python 用户比 R 用户更忠诚
- 转向 R 的用户百分比 Python 是 Python 到 R。
R 和之间的区别 Python
产品型号 | R | Python |
---|---|---|
目的 | 数据分析与统计 | 部署和生产 |
初级用户 | 学者与研发 | 程序员和开发人员 |
灵活性 | 易于使用的可用库 | 易于从头构建新模型。例如矩阵计算和优化 |
学习曲线 | 开始很困难 | 线性和平滑 |
编程语言的流行度。百分比变化 | 在4.23 2018% | 在21.69 2018% |
平均工资 | $99.000 | $100.000 |
之路 | 在本地运行 | 与应用程序完美集成 |
任务 | 轻松获得初步结果 | 适合部署算法 |
数据库大小 | 处理巨大尺寸 | 处理巨大尺寸 |
IDE | 工作室 | Spyder,Ipython 笔记本 |
重要的软件包和库 | tidyverse、ggplot2、插入符号、动物园 | pandas、scipy、scikit-learn、TensorFlow、插入符号 |
缺点 | 放慢 学习曲线高 库之间的依赖关系 |
没有 R 那么多库 |
性能 |
|
|
或 Python 用法
Python 由计算机专家 Guido van Rossum 于 1991 年左右开发。 Python 拥有数学、统计和人工智能领域有影响力的图书馆。你可以认为 Python 作为机器学习领域的纯粹参与者。然而, Python 对于计量经济学和通信来说还未完全成熟。 Python 是机器学习集成和部署的最佳工具,但不适合商业分析。
好消息是 R 是由学者和科学家开发的。它旨在解决统计问题、机器学习和数据科学。R 是数据科学的正确工具,因为它具有强大的通信库。此外,R 配备了许多软件包来执行时间序列分析、面板数据和数据挖掘。最重要的是,没有比 R 更好的工具了。
我们认为,如果您是数据科学的初学者,并且具备必要的统计基础,那么您需要问自己以下两个问题:
- 我想了解该算法是如何工作的吗?
- 我想要部署该模型吗?
如果你对这两个问题的回答都是肯定的,那么你可能会开始学习 Python 首先。一方面, Python 包含用于操作矩阵或编写算法的强大库。作为初学者,学习如何从头开始构建模型,然后切换到机器学习库中的函数可能会更容易。另一方面,如果你已经知道算法或想立即进行数据分析,那么 R 和 Python 一开始就没问题。如果你要专注于统计方法,R 的一个优势就是。
其次,如果你想做的不仅仅是统计,比如部署和可重复性, Python 是更好的选择。如果您需要编写报告和创建仪表板,R 更适合您的工作。
简而言之,R 和 Python 越来越近了。大部分工作都可以用两种语言完成。你最好选择一种既适合你的需求,又适合你的同事使用的工具。如果你们都说同一种语言,那就更好了。在你掌握了第一种编程语言之后,学习第二种就简单多了。
结语
最后,在 R 和 Python 取决于:
- 您的任务目标:统计分析或部署
- 你可以投入的时间
- 您的公司/行业最常用的工具