Waarom is R zo goed?


Beste antwoord

Ik wil specifiek zijn en zeggen dat R goed is voor gegevensanalyse, vooral als je in plaats daarvan de “moderne R” -ontwikkeling volgt van inheemse R. Ik vind het ecosysteem erg aantrekkelijk. Hier zijn enkele van de dingen waardoor R opvalt.

  1. R is gratis, vergeleken met andere populaire statistische / gegevensanalysesoftware zoals SAS of Matlab.
  2. R was ontworpen om tabelgegevens in data-analyse te verwerken. (Het is nooit ontworpen als een algemene taal zoals python, dus ze zijn niet echt vergelijkbaar.)
  3. R heeft enkele van de beste mogelijkheden voor gegevensmanipulatie, gegevensvisualisatie en rapportage van resultaten. Dingen zoals tidyverse (dplyr, tidyr, ggplot2 etc.), data.table, Rmarkdown, glanzende app etc. Er zijn vergelijkbare dingen in Python, maar lang niet zo goed of gemakkelijk te gebruiken. Het visualisatiepakket ggplot2 ziet er net zo goed uit en kan zeer complexe plotten aan. Sommige mensen gebruiken R simpelweg voor ggplot2. Er zijn ook webgebaseerde grafische pakketten zoals plotly enz.
  4. Rstudio IDE. Het is gewoonweg fantastisch. Ik zou zeggen dat de aantrekkelijkheid van R met minstens de helft zal worden verminderd als Rstudio niet bestaat. Hoe ik wou dat python iets zo mooi uitziet, gemakkelijk te gebruiken en krachtig is. (Spyder is dichtbij, alleen er nog niet.)
  5. Commerciële ontwikkeling door Rstudio. Winstgedreven ontwikkeling is van cruciaal belang voor de gezondheid van het R-ecosysteem op de lange termijn. R heeft een sterke gebruikersgemeenschap en de sterke toewijding van het bedrijf Rstudio. Ik denk dat de recente inspanningen van Rstudio R een aantrekkelijkere omgeving hebben gemaakt dan anderen. Dat betekent de fantastische Rstudio IDE-omgeving, geïntegreerd met Rmarkdown, Rbookdown, debugging-tools, glanzende app enz. Rstudio heeft ook enkele van de belangrijkste R-ontwikkelaars ingehuurd, zoals Hadley Wickham, Max Kuhn, Yihui Xie enz. Die worden beschouwd als de zielen van de moderne tijd. R. Het leuke is dat wanneer deze mensen lid werden van Rstudio, hun R-pakketten, zoals knitr, devtools etc. ook verbeterd en geïntegreerd zijn voor een betere workflow.
  6. Ten slotte, als je al op het schip bent gesprongen van R, is het niet moeilijk om je vaardigheden op python toe te passen. Python, als taal, is gemakkelijker te leren dan R. Met de mentaliteit van data-analyse getraind in R, kunnen vergelijkbare vaardigheden vrij snel worden overgedragen naar Python.

Als iemand wat wil hebben idee van werken in de moderne R-mode, kan Hadleys recente boek “R for data science” als een erg leuke introductie dienen. Volg ook de ontwikkeling van Rstudio, aangezien ze voortdurend nieuwe dingen toevoegen die het gebruik van R tot een zeer plezierige ervaring maken.

Antwoord

Zoals Paulina Jonušaitė opmerkte, is R goed omdat het is ontworpen voor statistici door statistici, en hoewel statistici geen competente taalontwerpers zijn – zeker niet genoeg om een ​​ontwerp van een taal coherent en voorspelbaar te maken – blijkt dat gemiddeld de taal doet wat men zou verwachten (of in ieder geval vaak genoeg zodat de mensen die er slechts oppervlakkig contact mee hadden meestal niet merken dat het incoherentie).

De R-programmeertaal is ontworpen door een zeer goede programmeertaal genaamd Scheme te nemen en een of andere rare syntaxis en gedrag toe te voegen om het, eh, aantrekkelijker te maken voor statistici. Dus als er enig gevoel van goedheid in die taal zit, moet het afkomstig zijn van Scheme.

Je kunt enkele verwijzingen vinden in Panicz Godeks antwoord op Waarom is de syntaxis van R zo (erg) anders dan andere programmeertalen?

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *