A lo largo de mi carrera me he topado con la necesidad -todos los días- de analizar grandes conjuntos de datos. Los datos pueden tener -o no- una representación espacial (Bases de datos asociadas a archivos vectoriales como los *.SHP o valores de radiancia y reflectancia contenidos en bandas de imágenes satelitales, por mencionar algunos). En materia de análisis, el conocer y dominar los métodos básicos de clasificación constituye una herramienta indispensable para la correcta representación e interpretación de los mismos.
A pesar de que la gran mayoría de los paquetes incorporan métodos de clasificación "automátizados" el correcto entendimiento de los algoritmos de clasificación siempre brindará mejores resultados.
La presente entrada, aborda en específico el método de clasificación por Cuantiles. Los Cuantiles son especialmente útiles cuando tenemos un rango amplio de valores donde la frecuencia no se encuentra igualmente distribuida a lo largo del mismo. Citando textualmente de la ayuda de ESRI, en un Cuantil:
"Cada clase contiene un número igual de entidades. La clasificación de cuantiles es adecuada para los datos distribuidos linealmente. El cuantil asigna el mismo número de valores de datos a cada clase. No hay clases vacías ni clases con demasiados valores ni con pocos valores."
Finalmente, la ayuda de ESRI no aporta mucho en cuanto a cómo se determinan los rangos de las clases, por lo que para realizar una clasificación por cuantiles de manera manual hay que conocer la ecuación.
Cabe destacar que previo al cálculo de los rangos por clase, es necesario generar una tabla con los valores en orden ascendente o descendente seguido de su frecuencia y frecuencia acumulada. La fórmula para el cálculo de los percentiles está dada por:
No hay comentarios:
Publicar un comentario