R y Python son los lenguajes de programación por excelencia para trabajar en ciencia de datos, difieren en general en las librerías que utilizan, pero en este caso vamos a detallar cómo trabajan con una que tienen , más o menos, algo en común.
En Python la librería ggplot se basa en ggplot2, de R. Se puede utilizar gracias a plotnine que es una implementación de una gramática de gráficos en Python, se basa en ggplot2. La gramática permite a los usuarios componer tramas mapeando datos explícitamente a los objetos visuales que componen la trama.
En una entrada anterior vimos como trabajar con ggplot2 en R, vamos a ver cómo utilizar plotnine en Python. Podemos integrar un dataset directamente desde la librería, en este caso vamos a trabajar con los datos “huron” que muestra los niveles de agua de dicho lago entre 1875 y 1972.
El siguiente paso, yo trabajo con Anaconda, es instalar el paquete plotnine:
Y entonces lanzo un Jupyter notebook e importo la librería así como el dataset y lo invoco para ver cómo están organizados dichos datos.
Entonces desde plotnine vamos a importar otras librerías que voy a necesitar como ggplot, aes y geom_point. Y monto la gráfica:
Si la quiero hacer en línea e incluir un tema diferente para que se visualice de otra manera la gráfica, deberé incluir los siguientes elementos en el código:
Y, por supuesto, también podremos exportar la gráfica como una imagen en formato .png en este caso.
Existen muchos otros formatos de gráficas en plotnine, este sólo es un ejemplo sencillo, así que te animo a que la curiosees. Te dejo a continuación el código:
import plotnine from plotnine.data import huron huron from plotnine import ggplot, aes, geom_point ggplot(huron) + aes(x="year", y="level")+ geom_point() from plotnine import geom_line, theme_light ggplot(huron) + aes(x="year", y="level")+ geom_line()+ theme_light() graf = ggplot(huron) + aes(x="year", y="level")+ geom_line()+ theme_light() graf.save("huronlin.png", dpi=600)
Deja tu comentario