R срещу Python – Разлика между тях
Ключова разлика между R и Python
- R се използва главно за статистически анализ, докато Python предоставя по-общ подход към науката за данните
- Основната цел на R е анализ на данни и статистика, докато основната цел на Python е внедряване и производство
- Потребителите на R се състоят главно от учени и специалисти по научноизследователска и развойна дейност Python потребителите са предимно програмисти и разработчици
- R осигурява гъвкавост за използване на наличните библиотеки, докато Python осигурява гъвкавост за конструиране на нови модели от нулата
- R е трудно да се научи в началото, докато Python е линеен и плавен за учене
- R е интегриран за изпълнение локално докато Python е добре интегриран с приложения
- И R, и Python може да обработва огромен размер база данни
- R може да се използва в R Studio IDE, докато Python може да се използва на Spyder и Ipython Notebook IDE
- R се състои от различни пакети и библиотеки като tidyverse, ggplot2, caret, zoo, докато Python съдържа пакети и библиотеки като pandas, scipy, scikit-learn, TensorFlow, caret
R и Python и двата са езици за програмиране с отворен код с голяма общност. Нови библиотеки или инструменти се добавят непрекъснато към съответния им каталог. R се използва главно за статистически анализ, докато Python предоставя по-общ подход към науката за данните.
R и Python са най-модерните по отношение на езика за програмиране, ориентиран към науката за данните. Научаването и на двете е, разбира се, идеалното решение. R и Python изисква инвестиция във време, а такъв лукс не е достъпен за всеки. Python е език с общо предназначение с четим синтаксис. R обаче е създаден от статистиците и обхваща техния специфичен език.
R
Учени и статистици са разработили R в продължение на две десетилетия. Сега R има една от най-богатите екосистеми за извършване на анализ на данни. Има около 12000 XNUMX налични пакета в CRAN (хранилище с отворен код). Възможно е да намерите библиотека за какъвто и да е анализ, който искате да извършите. Богатото разнообразие от библиотеки прави R първия избор за статистически анализи, особено за специализирана аналитична работа.
Авангардната разлика между R и другите статистически продукти е изходът. R има фантастични инструменти за съобщаване на резултатите. Rstudio идва с библиотеката knitr. Xie Yihui написа този пакет. Той направи репортажите тривиални и елегантни. Съобщаването на констатациите с презентация или документ е лесно.
Python
Python може да върши почти същите задачи като R: преборване на данни, инженеринг, уеб бракуване за избор на функции, приложение и т.н. Python е инструмент за внедряване и прилагане на машинно обучение в голям мащаб. Python кодовете са по-лесни за поддръжка и по-стабилни от R. Преди години; Python нямаше много библиотеки за анализ на данни и машинно обучение. наскоро Python наваксва и предоставя авангарден API за машинно обучение или изкуствен интелект. По-голямата част от работата по наука за данни може да се свърши с пет Python библиотеки: Numpy, Pandas, Scipy, Scikit-learn и Seaborn.
Python, от друга страна, прави възпроизвеждането и достъпността по-лесни от R. Всъщност, ако трябва да използвате резултатите от вашия анализ в приложение или уебсайт, Python е най-добрият избор.
Индекс на популярност
Класацията на IEEE Spectrum е показател, който определя количествено популярността на a програмен език. Лявата колона показва класирането през 2017 г., а дясната през 2016 г. През 2017 г. Python го направи на първо място в сравнение с трето класиране година по-рано. R е в 6th място.
Възможност за работа
Картината по-долу показва броя на работните места, свързани с науката за данни по езици за програмиране. SQL е далеч напред, следван от Python намлява Java. R се класира на 5th.
Ако се фокусираме върху дългосрочната тенденция между Python (в жълто) и R (синьо), можем да видим това Python е по-често цитиран в длъжностната характеристика от R.
Анализ, направен от R и Python
Въпреки това, ако разгледаме задачите за анализ на данни, R е най-добрият инструмент.
Процент на хората, които сменят
На снимката по-долу има две ключови точки.
- Python потребителите са по-лоялни от потребителите на R
- Процентът на потребителите на R, които преминават към Python е два пъти по-голям от Python към Р.
Разлика между R и Python
Параметър | R | Python |
---|---|---|
Цел | Анализ на данни и статистика | Внедряване и производство |
Основни потребители | Учен и изследователска и развойна дейност | Програмисти и разработчици |
Гъвкавост | Лесна за използване налична библиотека | Лесно конструиране на нови модели от нулата. Т.е. матрично изчисление и оптимизация |
Крива на обучение | Трудно в началото | Линеен и гладък |
Популярност на езика за програмиране. Процентна промяна | 4.23% в 2018 | 21.69% в 2018 |
Средна работна заплата | $99.000 | $100.000 |
Integration | Стартирайте локално | Добре интегриран с приложението |
Task | Лесно получаване на първични резултати | Добър за внедряване алгоритъм |
Размер на базата данни | Дръжка с огромен размер | Дръжка с огромен размер |
IDE | студио | Spyder, Ipython Notebook |
Важни пакети и библиотека | tidyverse, ggplot2, caret, zoo | pandas, scipy, scikit-learn, TensorFlow, каретка |
Недостатъци | Бавен Висока крива на обучение Зависимости между библиотеката |
Не толкова много библиотеки, колкото R |
Предимства |
|
|
R или Python употреба
Python е разработен от Guido van Rossum, компютърен човек, около 1991 г. Python има влиятелни библиотеки за математика, статистика и изкуствен интелект. Можете да мислите Python като чист играч в машинното обучение. обаче Python не е напълно зрял (все още) за иконометрия и комуникация. Python е най-добрият инструмент за интегриране и внедряване на машинно обучение, но не и за бизнес анализи.
Добрата новина е, че R е разработен от академици и учени. Той е предназначен да отговаря на статистически проблеми, машинно обучение и наука за данни. R е правилният инструмент за наука за данни поради своите мощни комуникационни библиотеки. Освен това R е оборудван с много пакети за извършване на анализ на времеви серии, панелни данни и извличане на данни. На всичкото отгоре няма по-добри инструменти в сравнение с R.
Според нас, ако сте начинаещ в науката за данни с необходимата статистическа основа, трябва да си зададете следните два въпроса:
- Искам ли да науча как работи алгоритъмът?
- Искам ли да разположа модела?
Ако отговорът ви и на двата въпроса е да, вероятно ще започнете да учите Python първи. от една страна, Python включва страхотни библиотеки за манипулиране на матрица или за кодиране на алгоритми. Като начинаещ може да е по-лесно да научите как да изградите модел от нулата и след това да преминете към функциите от библиотеките за машинно обучение. От друга страна, вие вече знаете алгоритъма или искате веднага да преминете към анализа на данните, след което R и Python са добре като начало. Едно предимство за R, ако ще се фокусирате върху статистически методи.
Второ, ако искате да направите нещо повече от статистика, да кажем внедряване и възпроизводимост, Python е по-добър избор. R е по-подходящ за вашата работа, ако трябва да напишете отчет и да създадете табло за управление.
С две думи, статистическата разлика между R и Python се приближават. По-голямата част от работата може да се извърши и на двата езика. По-добре изберете този, който отговаря на вашите нужди, но и на инструмента, който вашите колеги използват. По-добре е, когато всички говорите на един език. След като знаете първия си език за програмиране, изучаването на втория е по-лесно.
Заключение
В крайна сметка изборът между R или Python зависи от:
- Целите на вашата мисия: Статистически анализ или внедряване
- Количеството време, което можете да инвестирате
- Най-използваният инструмент на вашата компания/отрасъл