Product Design, Manufacturing & Innovation Resources
Maison » Le cadre de données R

Le cadre de données R

1990
  • John Chambers
  • Rick Becker
  • Allan Wilks
Cadre de données R affiché sur un écran d'ordinateur dans un bureau moderne.

(Image générée à titre d'illustration uniquement)

Le cadre de données (`data.frame`) est la structure de données fondamentale de R pour le stockage de données tabulaires. Il s'agit d'une liste de vecteurs de longueur égale, où chaque vecteur représente une colonne et peut être de type de données différent (par exemple, numérique, caractère, facteur). Cette structure est omniprésente dans R pour la modélisation statistique et la manipulation de données, reflétant le format rectangulaire des jeux de données.

Le data frame est sans doute la structure de données la plus importante de R. Il a été conçu pour représenter fidèlement le type de tableaux de données utilisés par les statisticiens : observations en lignes et variables en colonnes. Techniquement, un « data.frame » est une liste dont chaque élément est un vecteur représentant une colonne. Une contrainte clé est que tous ces vecteurs doivent avoir la même longueur, garantissant ainsi la forme rectangulaire des données. Cependant, contrairement à une matrice, chaque colonne peut avoir un type de données différent. Par exemple, une colonne peut contenir des mesures numériques, une autre des chaînes de caractères (comme des noms) et une troisième des facteurs (variables catégorielles).

This flexibility is crucial for real-world data analysis. Data frames have row and column names, making it easy to subset and reference data in an intuitive way (e.g., `my_data[,”age”]` or `my_data[5,]`). Many of R’s built-in functions, especially for statistics and plotting, are specifically designed to work with data frames as their primary input. The development of more efficient and user-friendly alternatives, like the `tibble` from the Tidyverse or the `data.table`, builds upon the foundational concept of the data frame, highlighting its central role in the R ecosystem.

UNESCO Nomenclature: 1203
- Informatique

Taper

Système abstrait

Perturbation

Fondamentaux

Usage

Utilisation généralisée

Précurseurs

  • Le concept de tableaux et de matrices en programmation
  • Tableaux de données statistiques utilisés dans l'analyse manuelle
  • Structures de fichiers de données provenant d'autres progiciels statistiques tels que SAS et SPSS
  • La structure de données de liste dans les langages de type Lisp

Applications

  • stockage et manipulation d'ensembles de données à des fins d'analyse statistique
  • entrée pour les fonctions de modélisation comme lm() pour la régression linéaire
  • traitement et transformation des données à l'aide de packages tels que dplyr
  • créer des visualisations avec ggplot2, qui est conçu autour du concept de trame de données

Brevets:

    Idées d'innovations potentielles

    En raison du trafic généré par les robots de scraping, actuellement supérieur à 40 000 par jour, ce contenu est réservé aux membres de la communauté.
    > Connexion < ou > Registre < (100% gratuit) pour y accéder, ainsi qu'à tous les autres contenus et outils à accès restreint.

    Lié à : data frame, R, structure de données, données tabulaires, statistiques, manipulation de données, vecteur, liste, tibble, data.table.

    Contexte historique

    Le cadre de données R

    1980
    1982-07-01
    1988-06-01
    1990
    1993
    1997-04-23
    2001
    1980
    1980
    1986-01-01
    1990
    1990
    1993
    1998
    2010

    (si la date est inconnue ou non pertinente, par exemple « mécanique des fluides », une estimation arrondie de son émergence notable est fournie)

    Inventions, innovations et principes techniques connexes

    Les images en pleine résolution et les téléchargements sont uniquement disponibles, et 100% gratuits, pour les membres inscrits.