受 pandas 的启发,这是一个开源 Python 软件包,提供 N-D 标注数组和数据集,使处理多维科学数据变得更容易。
xarray

- Python
- 数据分析, 生态与可持续性, 海洋科学, 数学, 模拟
- 气候, 深度学习, 环境工程, 环境影响, 机器学习, 可持续性指标, 用户体验(UX)
特点
- 带标签的 N 维数组(DataArray)、对齐 DataArray 的数据集(Dataset)、维度名称、坐标(勾选标签)、属性(元数据)、基于标签的索引和选择、按维度名称广播、groupby 操作、插值和重采样、绘图功能(与 Matplotlib 和 Seaborn 集成)、与 Dask 的并行计算、NetCDF、Zarr、GeoTIFF 和其他格式的 I/O
定价
- 免费
- 处理多维标注数据功能强大,简化了复杂的数据操作和分析,与 pandas、NumPy、Dask 和 Matplotlib 集成良好,非常适合气候、海洋学、气象学和其他地球科学数据,拥有活跃的社区。
- 与简单的 NumPy 数组相比,理解其数据模型(维度、坐标、属性)的学习曲线较长;如果不小心使用大型数据集,可能会造成内存开销(尽管 Dask 有很大帮助);某些高级操作可能需要更复杂的语法。
最适合:
- 科学家和研究人员处理多维标注数据集,特别是气候科学、海洋学、气象学和遥感等领域的数据集,以进行分析、可视化和数据处理。