Product Design, Manufacturing & Innovation Resources
Lar » O ecossistema R Tidyverse

O ecossistema R Tidyverse

2010
  • Hadley Wickham
Espaço de trabalho de programação R com ferramentas de análise de dados Tidyverse e visualizações ggplot2.

(Imagem gerada apenas para fins ilustrativos)

O Tidyverse é uma coleção de pacotes R projetados para ciência de dados que compartilham uma filosofia de design, gramática e estruturas de dados subjacentes. Desenvolvido por Hadley Wickham e outros, ele fornece um conjunto de ferramentas consistente e poderoso para importação, organização, transformação, visualização e modelagem de dados. Os principais pacotes incluem `ggplot2`, `dplyr`, `tidyr` e `readr`, que podem ser combinados usando pipes.

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

A filosofia central do Tidyverse é tornar a análise de dados mais legível e intuitiva para humanos. Isso é alcançado por meio de nomes consistentes para funções e argumentos e pelo uso extensivo do operador pipe (`%>%` ou `|>`), que permite encadear operações em uma sequência que se lê como uma frase (por exemplo, `data %>% filter(…) %>% group_by(…) %>% summarize(…)`). Pacotes importantes fornecem ferramentas especializadas: `dplyr` para manipulação de dados, `ggplot2` para visualização de dados declarativa baseada na “Gramática dos Gráficos”, `tidyr` para organizar dados, `readr` para importação rápida de dados e `purrr` para programação funcional. Embora às vezes criticado por ser um “dialeto” separado Em R, o Tidyverse tornou-se um padrão de facto para muitos cientistas de dados devido à sua eficiência e poder expressivo.

UNESCO Nomenclature: 1203
Ciência da Computação

Tipo

Software/Algoritmo

Interrupção

Revolucionário

Uso

Uso generalizado

Precursores

  • The R programming language itself
  • O conceito de uma "Gramática dos Gráficos" por Leland Wilkinson
  • O conceito do operador pipe (ou pipe) dos shells Unix e outras linguagens de programação.
  • Princípios de programação funcional
  • The data frame structure in R

Aplicações

  • Limpeza e preparação de dados para aprendizado de máquina
  • Criando visualizações de dados complexas e com qualidade para publicação usando ggplot2.
  • Exploração e análise interativa de dados em notebooks R
  • Construindo fluxos de trabalho reproduzíveis para análise de dados
  • Ensinar conceitos de ciência de dados com uma sintaxe consistente e intuitiva.

Patentes:

    Ideias de Inovação Potencial

    Devido ao tráfego de bots de coleta de dados, atualmente superior a 40 mil por dia, este conteúdo é reservado aos membros da comunidade.
    > Login < ou > Registrar < (100% gratuito) para acessar isso, assim como todo o restante do conteúdo e das ferramentas restritas.

    Relacionado a: Tidyverse, R, ciência de dados, ggplot2, dplyr, Hadley Wickham, dados organizados, visualização de dados, manipulação de dados, operador pipe.

    Contexto histórico

    O ecossistema R Tidyverse

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (Caso a data seja desconhecida ou irrelevante, por exemplo, "mecânica dos fluidos", é fornecida uma estimativa aproximada de seu surgimento notável)

    Princípios relacionados à invenção, inovação e tecnologia

    Imagens em tamanho real e downloads estão disponíveis apenas, 100% gratuitos, para membros registrados.