Exportando información en QGIS vi que aparecen nuevos formatos de datos que se pueden incorporar en este programa, entre ellos me llamaron especialmente la atención GeoArrow y GeoParquet.
Por no abarcar mucho, estuve curioseando sobre GeoParquet, su origen procede de aportarle características geoespaciales al formato de datos ampliamente utilizado en proyectos de Big Data (Parquet) y que se le está considerando como referente para armonizar en uno los diferentes formatos de datos geoespaciales.
Varios son los beneficios que aporta:
- Es open source, GeoParquet es un estándar de Open Geospatial Consortium (OGC) que agrega tipos geoespaciales interoperables ( de tipo punto, línea, polígono) a Parquet.
- Es interoperable con los ecosistemas de datos más importantes en la nube como Snowflake, BigQuery, RedShift, DataBricks.
- Incluye los datos en columnas (como .csv) y esto permite un análisis más rápido y eficiente a la hora de trabajar con grandes volúmenes de datos.
- Permite una mayor compresión de los datos heredado de Parquet.
- Admite la visualización de datos tanto en 2D como en 3D.
Está en desarrollo y está claro que en los próximos años se va a hablar mucho de este tipo de formatos de datos, u de otro que copie sus especificaciones, pero permite interoperabilidad y trabajar con grandes volúmenes de datos geoespaciales y por eso, promete.
En este proyecto de GitHub puedes encontrar algunos ejemplos de este formato, pero ya sabes que en QGIS puedes transformar tus datos a Geo(Parquet). Incluso hay un script de R que permite incorporar este formato de datos y trabajar con este lenguaje de programación.
Deja tu comentario