INE

Texto grande

Texto Pequeño

Blanco y Negro

Eliminar Todos

portada-metodologico

Información

Fecha:

11 de Junio de 2020

Autor:

Julio Guerrero y Andrea Marín

Idioma:

Español

Estratificación socioeconómica del marco muestral de viviendas 2017 (MMV 2017) –Implementación en R

  • Documento de trabajo - Metodológico

La estratificación socioeconómica del marco de muestreo derivado del Censo de Población y Vivienda de 2017 (MMV 2017), permite aumentar la eficiencia de la inferencia en las encuestas de hogares que utilizan este marco.

En este documento presentamos la metodología utilizada para el proceso de estratificación y brindamos información sobre su implementación mediante el software estadístico R, un sistema altamente extensible para computación estadística y gráficos, distribuido en la red. Basados en la experiencia nacional y regional, así como en la literatura estadística, la metodología elegida cubre diferentes métodos estadísticos no supervisados, y su implementación se llevó a cabo sobre un conjunto de indicadores socioeconómicos que miden bienestar, llamado matriz de información. Consideramos dos escenarios principales para propósitos de estratificación: el univariante (sobre una medida resumida de la matriz de información), donde se implementaron métodos como Lavallée e Hidiroglou o la estratificación óptima; y el multivariante (sobre todas o algunas de las variables de la matriz de información), donde se implementaron diferentes variantes del algoritmo k-medias.

Posteriormente, para elegir cuál de las estratificaciones obtenidas era la más apropiada, se implementó como método de evaluación, el cálculo del efecto de diseño generalizado G(S). Este método tiene en cuenta tanto el objetivo de la estratificación de un marco muestral como su carácter multipropósito, pues será usada en los diseños muestrales de diferentes encuestas sociales. Bajo este criterio, el método elegido para la estratificación del MMV 2017 fue clasificación mediante el algoritmo de estratificación óptima sobre la primera componente principal para tres grupos.

Descargas complementarias

Instituto Nacional de Estadísticas