Los diagramas de cajas y bigotes (boxplots o box and whiskers) nos muestran gráficamente varias características relativas a la distribución de frecuencias de los datos contenidos en una tabla de atributos.

Nos permiten visualizar y comparar uno o más grupos de datos (categorías), percibiendo de un modo intuitivo la mediana, la dispersión de los datos y su simetría. En caso de observarse un sesgo en los datos también podríamos identificar en qué dirección se produce este sesgo.

Los gráficos de tipo caja y bigotes consisten en un rectángulo atravesados por una línea horizontal que representa la mediana (o segundo cuartil). La base de este rectángulo representa el primer cuartil de los datos (dato de la tabla de atributos que supera al 25% de los valores de la distribución) y el techo de la caja vendrá representado por el tercer cuartil (dato de la tabla de atributos que supera al 75% de los valores de la distribución). La distancia entre el primero y tercero de los cuartiles se conoce como rango intercuartílico (RI) y se manifiesta en el grafico como la altura de la caja. De la caja, salen dos líneas (“los bigotes”) alineadas con la caja que representan los valores mínimo y máximo que toma la muestra. De esto modo se percibe la variabilidad de los datos fuera de los cuartiles 1 y 3. En ocasiones se representan también los valores atípicos como puntos aislados en línea con los bigotes.

Para llevar a cabo la representación mediante cajas y bigotes de nuestros datos espaciales en QGIS, podemos emplear la función “Diagrama de Cajas”.

En ella solo tendremos que indicar:

1. Capa vectorial de entrada.
2. Campo nombre de categoría: Campo de la capa de entrada que identifica las distintas categorías o grupos de datos. Como resultado, de cada valor único obtendremos un gráfico de caja.
3. Campo de valor: Campo de la capa de entrada del cual vamos a tomar los valores.
4. Líneas de estadística adicionales: Podemos escoger entre:

• Mostrar media: Además de las líneas descritas también representaría la Media.
• Mostrar desviación estándar: Además de las líneas descritas también representaría la Desviación Estándar.
• No Mostrar media y desviación estándar.

5. Diagrama de caja: Nombre y ubicación del archivo HTML en el cual se representarán las gráficas.

Ejemplo:

En el siguiente ejemplo se han medido el crecimiento experimentado por una serie de plantones de Castaño a lo largo de un determinado periodo de tiempo. Estos plantones se distribuyen en 3 zonas claramente diferenciadas por sus características edáficas. Pretendemos representar mediante gráficos de cajas el crecimiento de dichos plantones para cada una de las áreas edáficas. Si observamos la tabla de atributos, los datos de altura están recogidos en el campo “VALOR”, y la zona edafica a la cual pertenece dicha medida se recoge en el campo “CATEGORÍA”.

En la función Diagrama de Caja, identificamos el campo que identifica a cada clase de suelo (Categorías), el campo que contiene los valores de crecimiento de los plantones, y el tipo de información que pretendemos mostrar en el gráfico que en este caso serán solo los valores Q1, Q2 (Mediana), Q3 y los valores mínimo y máximo (sin mostrar los valores de Media y Desviación estándar).

Tras ejecutar la función, se abre la ventana del Visor de Resultados, y al hacer clic sobre el archivo HTML resultante este se abre empleando navegador web que utilicemos por defecto, mostrando los gráficos de cajas.

Si estás interesado en mejorar tus competencias en QGIS Desktop, te ofrecemos la posibilidad de realizar nuestros cursos de especialización.

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (2 votos, promedio: 5,00 de 5)

Cargando…

Formación de calidad impartida por profesionales