Product Design, Manufacturing & Innovation Resources
Casa » L'ecosistema R Tidyverse

L'ecosistema R Tidyverse

2010
  • Hadley Wickham
Spazio di programmazione R con strumenti di analisi dei dati Tidyverse e visualizzazioni ggplot2.

(Immagine generata a solo scopo illustrativo)

Tidyverse è una raccolta di pacchetti R progettati per la scienza dei dati che condividono una filosofia di progettazione, una grammatica e strutture dati di base. Sviluppato da Hadley Wickham e altri, fornisce un toolkit coerente e potente per l'importazione, l'ordinamento, la trasformazione, la visualizzazione e la modellazione dei dati. I pacchetti principali includono `ggplot2`, `dplyr`, `tidyr` e `readr`, che si compongono tramite pipe.

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

La filosofia centrale del Tidyverse è quella di rendere l'analisi dei dati più leggibile e intuitiva per l'uomo. Ciò si ottiene attraverso nomi di funzioni e argomenti coerenti e l'uso estensivo dell'operatore pipe (`%>%` o `|>`), che consente di concatenare le operazioni in una sequenza che si legge come una frase (ad esempio, `data %>% filter(…) %>% group_by(…) %>% summarize(…)`). I pacchetti chiave forniscono strumenti specializzati: `dplyr` per la manipolazione dei dati, `ggplot2` per la visualizzazione dichiarativa dei dati basata sulla "Grammatica della Grafica", `tidyr` per la pulizia dei dati, `readr` per l'importazione rapida dei dati e `purrr` per la programmazione funzionale. Sebbene a volte criticato per essere un "dialetto" separato, Grazie alla sua efficienza e alla sua potenza espressiva, Tidyverse, parte integrante di R, è diventato di fatto uno standard per molti data scientist.

UNESCO Nomenclature: 1203
- Informatica

Tipo

Software/Algoritmo

Interruzione

Rivoluzionario

Utilizzo

Uso diffuso

Precursori

  • Il linguaggio di programmazione R stesso
  • Il concetto di una "Grammatica della Grafica" di Leland Wilkinson
  • Il concetto di operatore pipe dalle shell Unix e da altri linguaggi di programmazione
  • Principi di programmazione funzionale
  • La struttura del data frame in R

Applicazioni

  • pulizia dei dati e preparazione per l'apprendimento automatico
  • creazione di visualizzazioni di dati complesse e di qualità da pubblicazione con ggplot2
  • esplorazione e analisi interattiva dei dati nei notebook R
  • creazione di pipeline di analisi dei dati riproducibili
  • insegnare concetti di data science con una sintassi coerente e intuitiva

Brevetti:

    Idee e potenziali innovazioni

    A causa dell'eliminazione del traffico generato dai bot, che attualmente supera i 40.000 al giorno, questo contenuto è riservato ai membri della community.
    > Accedi O > Registrati L'accesso a questo contenuto, così come a tutti gli altri contenuti e strumenti riservati, è (100% gratuito).

    Argomenti correlati: Tidyverse, R, scienza dei dati, ggplot2, dplyr, Hadley Wickham, dati ordinati, visualizzazione dei dati, manipolazione dei dati, operatore pipe.

    Contesto storico

    L'ecosistema R Tidyverse

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (se la data è sconosciuta o non rilevante, ad esempio "meccanica dei fluidi", viene fornita una stima approssimativa della sua notevole comparsa)

    Invenzioni, innovazioni e principi tecnici correlati

    Le immagini a grandezza naturale e i download sono disponibili, 100% gratuitamente, solo per i membri registrati.

    > Login <