Un package Python open-source qui fournit des tableaux et des ensembles de données étiquetés N-D, inspiré par pandas, facilitant le travail avec des données scientifiques multidimensionnelles.
xarray

- Python
- Analyse des données, Écologie et durabilité, Sciences marines, Mathématiques, Simulation
- Climat, Apprentissage profond, Génie de l'environnement, Impact environnemental, Machine Learning, Indicateurs de durabilité, Expérience utilisateur (UX)
Caractéristiques :
- Tableaux à N dimensions étiquetés (DataArray), ensembles de DataArrays alignés (Dataset), noms des dimensions, coordonnées (tick labels), attributs (métadonnées), indexation et sélection basées sur les étiquettes, diffusion par nom de dimension, opérations groupby, interpolation et rééchantillonnage, capacités de traçage (intégration avec Matplotlib, Seaborn), calcul parallèle avec Dask, E/S pour NetCDF, Zarr, GeoTIFF et d'autres formats.
Prix :
- Gratuit
- Puissant pour traiter les données multidimensionnelles étiquetées, simplifie la manipulation et l'analyse de données complexes, s'intègre bien avec pandas, NumPy, Dask et Matplotlib, excellent pour le climat, l'océanographie, la météorologie et d'autres données géoscientifiques, communauté active.
- Courbe d'apprentissage pour comprendre son modèle de données (dimensions, coordonnées, attributs) par rapport aux simples tableaux NumPy, peut avoir une surcharge de mémoire si elle n'est pas utilisée avec précaution avec de grands ensembles de données (bien que Dask aide de manière significative), certaines opérations avancées peuvent avoir une syntaxe plus complexe.
Idéal pour :
- Scientifiques et chercheurs travaillant avec des ensembles de données multidimensionnelles étiquetées, en particulier dans des domaines tels que la science du climat, l'océanographie, la météorologie et la télédétection, pour l'analyse, la visualisation et la manipulation des données.