Product Design, Manufacturing & Innovation Resources
» R Tidyverse 生态系统

R Tidyverse 生态系统

2010
  • Hadley Wickham
带有 Tidyverse 数据分析工具和 ggplot2 可视化功能的 R 编程工作区。.

(图片仅供参考)

Tidyverse 是专为数据科学设计的 R 软件包集合,这些软件包共享相同的底层设计理念、语法和数据结构。它由 Hadley Wickham 等人开发,为数据导入、整理、转换、可视化和建模提供了一致且强大的工具包。主要软件包包括 `ggplot2`、`dplyr`、`tidyr` 和 `readr`,它们使用管道组合在一起。

The Tidyverse is an opinionated ecosystem of R packages that has profoundly influenced modern data analysis in R. It is built on the concept of “tidy data,” a standard way of organizing data where each variable is a column, each observation is a row, and each type of observational unit is a table. This consistent data structure allows for the creation of tools that compose together elegantly.

Tidyverse 的核心理念是让数据分析更易于阅读和理解。这通过统一的函数和参数名称以及管道运算符(`%>%` 或 `|>`)的广泛使用来实现,管道运算符允许将操作链接在一起,形成类似句子的序列(例如,`data %>% filter('') %>% group_by('') %>% summarize('')`)。关键软件包提供了专门的工具:`dplyr` 用于数据操作,`ggplot2` 用于基于“图形语法”的声明式数据可视化,`tidyr` 用于数据整理,`readr` 用于快速数据导入,以及 `purrr` 用于函数式编程。尽管有时因其被视为一种独立的“方言”而受到批评,但 Tidyverse 仍然是一种优秀的编程语言。由于其高效性和强大的表达能力,R 语言的 Tidyverse 已成为许多数据科学家的事实标准。

UNESCO Nomenclature: 1203
- 计算机科学

类型

软件/算法

中断

革命

用法

广泛使用

前体

  • R 编程语言本身
  • 莱兰·威尔金森提出的“图形语法”概念
  • Unix shell 和其他编程语言中的管道运算符概念
  • 函数式编程原则
  • R中的数据框结构

应用程序

  • 机器学习的数据清理和准备
  • 使用 ggplot2 创建复杂、可出版质量的数据可视化
  • R 笔记本中的交互式数据探索和分析
  • 构建可重复的数据分析流程
  • 使用一致且直观的语法教授数据科学概念

专利:

    潜在创新理念

    由于机器人流量被拦截(目前每天超过 4 万),此内容仅限社区成员查看。
    > 登录 > 或者 > 注册 < (100% 免费)即可访问此内容,以及所有其他受限内容和工具。

    相关术语:Tidyverse、R、数据科学、ggplot2、dplyr、Hadley Wickham、整洁数据、数据可视化、数据操作、管道运算符。

    历史背景

    R Tidyverse 生态系统

    1990
    1993
    1998
    2010
    2016
    1990
    1993
    1997-04-23
    2001
    2010
    2020

    (如果日期未知或不相关,例如“流体力学”,则提供其显著出现的近似估计)

    相关发明、创新和技术原理

    只有注册会员才能免费获得 100% 的全尺寸图片和下载。.

    > 登录 <