Product Design, Manufacturing & Innovation Resources
Maison » L'écosystème R Tidyverse

L'écosystème R Tidyverse

2010
  • Hadley Wickham
Espace de programmation R avec des outils d'analyse de données Tidyverse et des visualisations ggplot2.

(Image générée à titre d'illustration uniquement)

Tidyverse est un ensemble de packages R conçus pour la science des données, partageant une philosophie de conception, une grammaire et des structures de données communes. Développé par Hadley Wickham et d'autres, il offre une boîte à outils cohérente et puissante pour l'importation, le rangement, la transformation, la visualisation et la modélisation des données. Parmi les packages clés, on trouve « ggplot2 », « dplyr », « tidyr » et « readr », qui s'assemblent grâce à des pipelines.

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

La philosophie principale de Tidyverse est de rendre l'analyse des données plus lisible et intuitive.

UNESCO Nomenclature: 1203
- Informatique

Taper

Logiciel/Algorithme

Perturbation

Révolutionnaire

Usage

Utilisation généralisée

Précurseurs

  • Le langage de programmation R lui-même
  • Bien que parfois critiqué pour être un « dialecte » distinct de R, le Tidyverse est devenu de facto un standard pour de nombreux data scientists en raison de son efficacité et de sa puissance expressive.
  • Le concept d'opérateur de pipe des shells Unix et d'autres langages de programmation
  • Principes de la programmation fonctionnelle
  • La structure du cadre de données dans R

Applications

  • nettoyage et préparation des données pour l'apprentissage automatique
  • créer des visualisations de données complexes et de qualité publication avec ggplot2
  • exploration et analyse interactives des données dans les notebooks R
  • créer des pipelines d'analyse de données reproductibles
  • enseigner les concepts de la science des données avec une syntaxe cohérente et intuitive

Brevets:

    Idées d'innovations potentielles

    En raison du trafic généré par les robots de scraping, actuellement supérieur à 40 000 par jour, ce contenu est réservé aux membres de la communauté.
    > Connexion < ou > Registre < (100% gratuit) pour y accéder, ainsi qu'à tous les autres contenus et outils à accès restreint.

    Related to: Tidyverse, R, data science, ggplot2, dplyr, Hadley Wickham, tidy data, data visualization, data manipulation, pipe operator.

    Contexte historique

    L'écosystème R Tidyverse

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (si la date est inconnue ou non pertinente, par exemple « mécanique des fluides », une estimation arrondie de son émergence notable est fournie)

    Inventions, innovations et principes techniques connexes

    Les images en pleine résolution et les téléchargements sont uniquement disponibles, et 100% gratuits, pour les membres inscrits.