Product Design, Manufacturing & Innovation Resources
Hogar » El ecosistema R Tidyverse

El ecosistema R Tidyverse

2010
  • Hadley Wickham
Espacio de trabajo de programación R con herramientas de análisis de datos Tidyverse y visualizaciones ggplot2.

(Imagen generada únicamente con fines ilustrativos)

Tidyverse es una colección de paquetes de R diseñados para la ciencia de datos que comparten una filosofía de diseño, una gramática y estructuras de datos subyacentes. Desarrollado por Hadley Wickham y otros, proporciona un conjunto de herramientas consistente y potente para la importación, ordenación, transformación, visualización y modelado de datos. Entre los paquetes clave se incluyen `ggplot2`, `dplyr`, `tidyr` y `readr`, que se integran mediante tuberías.

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

La filosofía central de Tidyverse es hacer que el análisis de datos sea más legible e intuitivo para los humanos. Esto se logra a través de nombres de funciones y argumentos consistentes y el uso extensivo del operador de tubería (`%>%` o `|>`), que permite encadenar operaciones en una secuencia que se lee como una oración (por ejemplo, `data %>% filter(…) %>% group_by(…) %>% summarize(…)`). Los paquetes clave proporcionan herramientas especializadas: `dplyr` para manipulación de datos, `ggplot2` para visualización de datos declarativa basada en la “Grammar of Graphics,” `tidyr` para ordenar datos, `readr` para importación rápida de datos y `purrr` para programación funcional. Aunque a veces se critica por ser un “dialecto” De R, Tidyverse se ha convertido en un estándar de facto para muchos científicos de datos debido a su eficiencia y poder expresivo.

UNESCO Nomenclature: 1203
- Informática

Tipo

Software/Algoritmo

Ruptura

Revolucionario

Uso

Uso generalizado

Precursores

  • El lenguaje de programación R en sí
  • El concepto de una "Gramática de los Gráficos" por Leland Wilkinson
  • El concepto de operador de tubería de los shells de Unix y otros lenguajes de programación
  • Principios de programación funcional
  • La estructura del marco de datos en R

Aplicaciones

  • Limpieza y preparación de datos para el aprendizaje automático
  • Creación de visualizaciones de datos complejas con calidad de publicación con ggplot2
  • Exploración y análisis interactivo de datos en cuadernos R
  • Construcción de canales de análisis de datos reproducibles
  • Enseñar conceptos de ciencia de datos con una sintaxis consistente e intuitiva

Patentes:

    Ideas para posibles innovaciones

    Debido al bloqueo del tráfico generado por bots, que actualmente supera los 40.000 al día, este contenido está reservado para los miembros de la comunidad.
    > Iniciar sesión < o > Registrarse < (100% gratis) para acceder a esto, al igual que a todo el demás contenido y herramientas restringidos.

    Relacionado con: Tidyverse, R, ciencia de datos, ggplot2, dplyr, Hadley Wickham, datos ordenados, visualización de datos, manipulación de datos, operador de tubería.

    Contexto histórico

    El ecosistema R Tidyverse

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)

    Invención, innovación y principios técnicos relacionados.

    Las imágenes a tamaño completo y las descargas sólo están disponibles, 100% gratis, para los miembros registrados.

    > Acceso <