Product Design, Manufacturing & Innovation Resources
Hogar » El marco de datos R

El marco de datos R

1990
  • John Chambers
  • Rick Becker
  • Allan Wilks
Marco de datos R en la pantalla de un ordenador en una oficina moderna.

(Imagen generada únicamente con fines ilustrativos)

El marco de datos (`data.frame`) es la estructura de datos fundamental en R para almacenar datos tabulares. Consiste en una lista de vectores de igual longitud, donde cada vector representa una columna y puede ser de un tipo de dato diferente (p. ej., numérico, de caracteres, factorial). Esta estructura es omnipresente en R para el modelado estadístico y la manipulación de datos, imitando el formato rectangular de los conjuntos de datos.

El marco de datos es posiblemente la estructura de datos más importante en R. Fue diseñado para representar fielmente el tipo de tablas de datos utilizadas por los estadísticos: observaciones en filas y variables en columnas. Técnicamente, un `data.frame` es una lista donde cada elemento es un vector que representa una columna. Una restricción clave es que todos estos vectores deben tener la misma longitud, lo que garantiza la forma rectangular de los datos. Sin embargo, a diferencia de una matriz, cada columna puede tener un tipo de dato diferente. Por ejemplo, una columna puede contener medidas numéricas, otra cadenas de caracteres (como nombres) y una tercera factores (variables categóricas).

This flexibility is crucial for real-world data analysis. Data frames have row and column names, making it easy to subset and reference data in an intuitive way (e.g., `my_data[,”age”]` or `my_data[5,]`). Many of R’s built-in functions, especially for statistics and plotting, are specifically designed to work with data frames as their primary input. The development of more efficient and user-friendly alternatives, like the `tibble` from the Tidyverse or the `data.table`, builds upon the foundational concept of the data frame, highlighting its central role in the R ecosystem.

UNESCO Nomenclature: 1203
- Informática

Tipo

Sistema abstracto

Ruptura

Fundacional

Uso

Uso generalizado

Precursores

  • El concepto de matrices y arreglos en programación
  • Tablas de datos estadísticos utilizadas en el análisis manual
  • Estructuras de archivos de datos de otros paquetes estadísticos como SAS y SPSS
  • La estructura de datos de lista en lenguajes tipo Lisp

Aplicaciones

  • almacenar y manipular conjuntos de datos para análisis estadístico
  • Entrada para funciones de modelado como lm() para regresión lineal
  • Manipulación y transformación de datos mediante paquetes como dplyr
  • Creación de visualizaciones con ggplot2, que está diseñado en torno al concepto de marco de datos.

Patentes:

    Ideas para posibles innovaciones

    Debido al bloqueo del tráfico generado por bots, que actualmente supera los 40.000 al día, este contenido está reservado para los miembros de la comunidad.
    > Iniciar sesión < o > Registrarse < (100% gratis) para acceder a esto, al igual que a todo el demás contenido y herramientas restringidos.

    Relacionado con: marco de datos, R, estructura de datos, datos tabulares, estadística, manipulación de datos, vector, lista, tibble, data.table.

    Contexto histórico

    El marco de datos R

    1980
    1982-07-01
    1988-06-01
    1990
    1993
    1997-04-23
    2001
    1980
    1980
    1986-01-01
    1990
    1990
    1993
    1998
    2010

    (Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)

    Invención, innovación y principios técnicos relacionados.

    Las imágenes a tamaño completo y las descargas sólo están disponibles, 100% gratis, para los miembros registrados.

    > Acceso <