R vs Python – Razlika među njima
Ključna razlika između R i Python
- R se uglavnom koristi za statističku analizu dok Python pruža općenitiji pristup znanosti o podacima
- Primarni cilj R-a je analiza podataka i statistika, dok je primarni cilj Python je implementacija i proizvodnja
- Korisnici R-a uglavnom se sastoje od znanstvenika i stručnjaka za istraživanje i razvoj Python korisnici su uglavnom programeri i programeri
- R pruža fleksibilnost za korištenje dostupnih knjižnica dok Python pruža fleksibilnost za konstruiranje novih modela od nule
- R je teško naučiti u početku dok Python je linearan i jednostavan za učenje
- R je integriran za lokalno pokretanje dok Python dobro je integriran s aplikacijama
- I R i Python može obraditi veliku veličinu baze podataka
- R se može koristiti na R Studio IDE dok Python može se koristiti na Spyder i Ipython Notebook IDE-ovi
- R se sastoji od raznih paketa i biblioteka kao što su tidyverse, ggplot2, caret, zoo dok Python sastoji se od paketa i biblioteka kao što su pandas, scipy, scikit-learn, TensorFlow, caret
R i Python oba su programski jezici otvorenog koda s velikom zajednicom. Nove biblioteke ili alati neprestano se dodaju u odgovarajući katalog. R uglavnom se koristi za statističku analizu dok Python pruža općenitiji pristup znanosti o podacima.
R i Python vrhunac su u smislu programskog jezika orijentiranog prema znanosti o podacima. Učenje oboje je, naravno, idealno rješenje. R i Python zahtijeva ulaganje vremena, a takav luksuz nije dostupan svima. Python je jezik opće namjene s čitljivom sintaksom. R su, međutim, izgradili statističari i obuhvaća njihov specifični jezik.
R
Akademici i statističari razvili su R tijekom dva desetljeća. R sada ima jedan od najbogatijih ekosustava za analizu podataka. U CRAN-u (open-source repository) dostupno je oko 12000 paketa. Moguće je pronaći knjižnicu za bilo koju analizu koju želite izvesti. Bogat izbor knjižnica čini R prvim izborom za statističku analizu, posebno za specijalizirani analitički rad.
Vrhunska razlika između R-a i ostalih statističkih proizvoda je rezultat. R ima fantastične alate za komuniciranje rezultata. Rstudio dolazi s knjižnicom knitr. Xie Yihui je napisao ovaj paket. Izvještavanje je učinio trivijalnim i elegantnim. Priopćavanje nalaza prezentacijom ili dokumentom je jednostavno.
Python
Python može uglavnom obavljati iste zadatke kao i R: razmjena podataka, inženjering, odabir značajki web scrapping, aplikacija i tako dalje. Python je alat za razvoj i implementaciju strojnog učenja u velikim razmjerima. Python kodovi su lakši za održavanje i robusniji od R. Prije mnogo godina; Python nije imao mnogo knjižnica za analizu podataka i strojno učenje. Nedavno, Python hvata korak i pruža vrhunski API za strojno učenje ili umjetnu inteligenciju. Većina posla u području znanosti o podacima može se obaviti s pet Python biblioteke: Numpy, Pandas, Scipy, Scikit-learn i Seaborn.
Python, s druge strane, čini replikabilnost i pristupačnost lakšom nego R. Zapravo, ako trebate upotrijebiti rezultate svoje analize u aplikaciji ili web stranici, Python je najbolji izbor.
Indeks popularnosti
IEEE Spectrum poredak je metrika koja kvantificira popularnost a programski jezik. Lijevi stupac prikazuje poredak u 2017., a desni stupac u 2016. U 2017. Python dospio na prvo mjesto u usporedbi s trećim mjestom godinu dana prije. R je u 6th mjesto.
Prilika za posao
Na slici ispod prikazan je broj poslova vezanih uz podatkovnu znanost po programskim jezicima. SQL je daleko ispred, a prati ga Python i Java. R zauzima 5. mjestoth.
Ako se usredotočimo na dugoročni trend između Python (žuto) i R (plavo), to možemo vidjeti Python češće se navodi u opisu posla nego R.
Analizu izvršio R and Python
Međutim, ako pogledamo poslove analize podataka, R je daleko najbolji alat.
Postotak ljudi koji se mijenjaju
Dvije su ključne točke na slici ispod.
- Python korisnici su lojalniji od R korisnika
- Postotak R korisnika koji prelaze na Python dvostruko je veći od Python prema R.
Razlika između R i Python
Parametar | R | Python |
---|---|---|
Cilj | Analiza podataka i statistika | Implementacija i proizvodnja |
Primarni korisnici | Znanstvenik i istraživanje i razvoj | Programeri i programeri |
Fleksibilnost | Dostupna biblioteka jednostavna za korištenje | Lako je konstruirati nove modele od nule. Tj. matrično izračunavanje i optimizacija |
Krivulja ucenja | Teško na početku | Linearno i glatko |
Popularnost programskog jezika. Postotna promjena | 4.23% u 2018 | 21.69% u 2018 |
Prosječna plaća | $99.000 | $100.000 |
Integracija | Trčanje lokalno | Dobro integriran s aplikacijom |
Zadatak | Jednostavan za dobivanje primarnih rezultata | Dobar algoritam za implementaciju |
Veličina baze podataka | Ručka ogromne veličine | Ručka ogromne veličine |
IDE | studio | Spyder, Ipython Bilježnica |
Važni paketi i biblioteka | tidyverse, ggplot2, caret, zoo | pandas, scipy, scikit-learn, TensorFlow, caret |
Nedostaci | Usporiti Visoka krivulja učenja Ovisnosti između biblioteke |
Nema toliko knjižnica kao R |
Prednosti |
|
|
R ili Python Upotreba
Python je razvio Guido van Rossum, informatičar, oko 1991. Python ima utjecajne knjižnice za matematiku, statistiku i umjetnu inteligenciju. Moš mislit Python kao čisti igrač u strojnom učenju. Međutim, Python nije sasvim zreo (još) za ekonometriju i komunikaciju. Python je najbolji alat za integraciju i implementaciju strojnog učenja, ali ne i za poslovnu analitiku.
Dobra vijest je da su R razvili akademici i znanstvenici. Osmišljen je za rješavanje statističkih problema, strojnog učenja i znanosti o podacima. R je pravi alat za podatkovnu znanost zbog svojih snažnih komunikacijskih biblioteka. Osim toga, R je opremljen mnogim paketima za izvođenje analize vremenskih serija, panel podataka i rudarenje podataka. Povrh toga, nema boljih alata u usporedbi s R-om.
Po našem mišljenju, ako ste početnik u znanosti o podacima s potrebnom statističkom osnovom, trebate si postaviti sljedeća dva pitanja:
- Želim li naučiti kako algoritam radi?
- Želim li implementirati model?
Ako je vaš odgovor na oba pitanja potvrdan, vjerojatno biste počeli učiti Python prvi. S jedne strane, Python uključuje sjajne biblioteke za manipuliranje matricom ili kodiranje algoritama. Kao početniku, možda će biti lakše naučiti kako izraditi model od nule, a zatim se prebaciti na funkcije iz biblioteka strojnog učenja. S druge strane, već znate algoritam ili želite odmah ući u analizu podataka, tada i R i Python su u redu za početak. Jedna prednost za R ako se namjeravate usredotočiti na statističke metode.
Drugo, ako želite učiniti više od statistike, recimo implementaciju i ponovljivost, Python je bolji izbor. R je prikladniji za vaš posao ako trebate napisati izvješće i izraditi nadzornu ploču.
Ukratko, statistički jaz između R i Python su sve bliže. Većina posla može se obaviti na oba jezika. Radije odaberite onaj koji odgovara vašim potrebama, ali i alatu koji koriste vaši kolege. Bolje je kada svi govorite istim jezikom. Nakon što znate svoj prvi programski jezik, učenje drugog je jednostavnije.
Zaključak
Na kraju, izbor između R odn Python ovisi o:
- Ciljevi vaše misije: Statistička analiza ili implementacija
- Količina vremena koju možete uložiti
- Alat vaše tvrtke/industrije koji se najčešće koristi