Product Design, Manufacturing & Innovation Resources
» R 数据框

R 数据框

1990
  • John Chambers
  • Rick Becker
  • Allan Wilks
R数据框在现代办公环境的电脑屏幕上显示。.

(图片仅供参考)

数据框(data.frame)是 R 中用于存储表格数据的基本数据结构。它是一个等长向量列表,每个向量代表一列,并且可以是不同的数据类型(例如,数值、字符、因子)。这种结构在 R 中广泛用于统计建模和数据操作,与数据集的矩形格式相似。

数据框可以说是 R 中最重要的数据结构。它旨在与统计学家使用的数据表类型紧密关联:行表示观测值,列表示变量。从技术角度来看,“数据框”是一个列表,其中每个元素都是一个向量,代表一列。一个关键约束是所有这些向量的长度必须相同,以确保数据的矩形形状。然而,与矩阵不同,数据框的每一列可以有不同的数据类型。例如,一列可以包含数值测量值,另一列可以包含字符串(例如名称),第三列可以包含因子(分类变量)。

This flexibility is crucial for real-world data analysis. Data frames have row and column names, making it easy to subset and reference data in an intuitive way (e.g., `my_data[,”age”]` or `my_data[5,]`). Many of R’s built-in functions, especially for statistics and plotting, are specifically designed to work with data frames as their primary input. The development of more efficient and user-friendly alternatives, like the `tibble` from the Tidyverse or the `data.table`, builds upon the foundational concept of the data frame, highlighting its central role in the R ecosystem.

UNESCO Nomenclature: 1203
- 计算机科学

类型

抽象系统

中断

基础

用法

广泛使用

前体

  • 编程中的数组和矩阵的概念
  • 人工分析使用的统计数据表
  • 来自其他统计软件包(如 SAS 和 SPSS)的数据文件结构
  • 类 Lisp 语言中的列表数据结构

应用程序

  • 存储和操作数据集以进行统计分析
  • 用于线性回归的建模函数(如 lm())的输入
  • 使用 dplyr 等包进行数据整理和转换
  • 使用 ggplot2 创建可视化效果,它是围绕数据框概念设计的

专利:

    潜在创新理念

    由于机器人流量被拦截(目前每天超过 4 万),此内容仅限社区成员查看。
    > 登录 > 或者 > 注册 < (100% 免费)即可访问此内容,以及所有其他受限内容和工具。

    相关术语:数据框、R、数据结构、表格数据、统计、数据操作、向量、列表、tibble、data.table。

    历史背景

    R 数据框

    1980
    1982-07-01
    1988-06-01
    1990
    1993
    1997-04-23
    2001
    1980
    1980
    1986-01-01
    1990
    1990
    1993
    1998
    2010

    (如果日期未知或不相关,例如“流体力学”,则提供其显著出现的近似估计)

    相关发明、创新和技术原理

    只有注册会员才能免费获得 100% 的全尺寸图片和下载。.

    > 登录 <