Mientras continuamos procesando las respuestas al Censo del 2020, las personas han preguntado qué sucede cuando no obtenemos una respuesta de una dirección. En este blog, describiré las técnicas estadísticas a las que recurrimos cuando no obtenemos una respuesta.
Para obtener un censo completo y preciso, necesitamos saber cierta información sobre todas las direcciones de los hogares del censo:
Al final de la recopilación de datos, teníamos la información requerida para ocuparnos de los primeros tres puntos con respecto a casi todas las direcciones del país. Para la pequeña parte restante de direcciones, aplicamos una técnica llamada imputación del conteo para resolver si estaban ocupadas y cuántas personas vivían allí.
Durante el procesamiento de datos, también usamos otro tipo de imputación —la imputación de características— para completar las características que faltan para las personas en el censo.
En lo que sigue, distinguimos entre las direcciones para unidades de vivienda y alojamientos de grupo. Debemos responder preguntas similares sobre los alojamientos de grupo, pero las tratamos de manera diferente en nuestra recopilación de datos y en cómo manejamos las respuestas que faltan.
A continuación, describiré cómo:
Nuestra investigación ha demostrado que la mejor información sobre un hogar proviene del hogar en sí. Sin embargo, algunos hogares no respondieron incluso después de los esfuerzos de extensión comunitaria de casi 400,000 colaboradores en todo el país, una campaña de comunicaciones multilingües, así como también un número de correspondencias (solo en inglés) y visitas de los censistas.
Cuando no podemos obtener una respuesta directamente de una dirección, recurrimos a tres métodos estadísticos ampliamente usados para completar la información:
Proporcionaremos métricas relacionadas con nuestro uso de cada una de estas tres técnicas el mismo día que publiquemos los primeros resultados del censo más adelante este mes. Hay más información sobre estas próximas métricas disponible en el reciente blog Introducción a los indicadores de calidad: métricas operacionales (solo en inglés).
Un tipo de imputación que usamos se llama “imputación del conteo”. Este tipo nos ayuda a completar la información que lleva al conteo de las personas que viven en un hogar, los primeros tres puntos de la lista que mencioné antes.
Por ejemplo, usamos la imputación para completar si una dirección está ocupada y el número de personas que viven allí copiando la información del vecino similar más cercano. Así es como funciona:
Usamos este enfoque porque funciona bien cuando las viviendas y casas desocupadas de un tamaño similar se agrupan geográficamente. Como resultado, podemos insertar la información que falta sobre el estatus de ocupación de una dirección y el tamaño de la población de forma más precisa.
Si dejáramos el conteo de una dirección en blanco después de que todos los intentos de obtener una respuesta fallaran, sería como asignar un conteo de 0. Esto sería menos preciso en general que imputar un número estadísticamente, debido a que con frecuencia tenemos información de que hay personas viviendo allí.
Es importante señalar que la imputación del conteo para hogares se ha usado para completar el conteo del censo a partir del Censo de 1960. El uso de este método estadístico fue cuestionado en los tribunales después de los censos de 1980 y del 2000. Ambas veces, los tribunales ratificaron el uso de la imputación del conteo.
Después de que terminemos de procesar las respuestas al Censo del 2020, informaremos qué porcentaje del conteo proviene de la imputación del conteo.
Durante nuestras recientes actividades de posprocesamiento, incorporamos una nueva operación que eliminó un gran número de personas duplicadas en el Censo del 2020. (Hablaremos más de esto en el próximo blog). Esta operación dejó un pequeño conjunto de direcciones de hogares sin resolver y con necesidad de imputación del conteo.
Como resultado, cuando informemos más adelante este mes el porcentaje de direcciones y personas imputadas, también informaremos sus dos componentes:
Los alojamientos de grupo son residencias donde normalmente vive un número de personas no emparentadas, tales como un dormitorio universitario, un hogar de ancianos o nursing home o una prisión estatal.
Como se describe en más detalle en el blog Alojamientos de grupo del Censo del 2020 (solo en inglés), tuvimos que adaptar y retrasar algunas de las maneras en que contamos a los alojamientos de grupo debido a la pandemia del COVID-19.
Después de que finalizó la recopilación de datos, cuando comenzamos a procesar los datos del censo de los alojamientos de grupo, nos dimos cuenta de que muchos de ellos estuvieron ocupados el 1 de abril de 2020 (el día de referencia para el censo), pero no proporcionaron un conteo de la población.
Por ejemplo, cuando los enumeramos en la mitad del verano, algunos alojamientos de grupo dijeron que estuvieron desocupados, pero en realidad estuvieron ocupados el 1 de abril. Si no se corrigen, dichos casos pueden llevar a un subconteo. Si las correcciones no se coordinaban adecuadamente con nuestros procedimientos para eliminar a las personas duplicadas, podían contribuir a un sobreconteo.
Para resolver estos asuntos, la Oficina del Censo se comunicó en una operación telefónica especial con muchos de los alojamientos de grupo que nos proporcionaron datos incompletos. Simultáneamente, reunimos un equipo para corregir las respuestas cuando fuera posible y para aplicar un nuevo procedimiento de imputación del conteo cuando no hubiera más información específica disponible.
Para algunos alojamientos de grupo, todavía no teníamos datos de respuestas para determinar precisamente cuántas personas debían asignarse a una instalación ocupada. Para estos casos, diseñamos reglas de procedimiento para determinar cuáles alojamientos de grupo necesitaban imputación del conteo. Luego desarrollamos, probamos y aplicamos los procedimientos de imputación a los casos adecuados.
A diferencia del procedimiento de imputación del conteo para las direcciones de unidades de vivienda, el procedimiento para los alojamientos de grupo no extrae información del vecino similar más cercano.
En su lugar, usamos los procedimientos de imputación que son más parecidos a los que usamos en censos y encuestas económicas. Para imputar un conteo, este enfoque generalmente usa información ya disponible sobre los alojamientos de grupo que se están considerando, tal como el conteo esperado o la capacidad máxima que el alojamiento de grupo indicó durante el contacto anticipado.
La Oficina del Censo nunca antes había realizado una imputación del conteo en alojamientos de grupo sin resolver. En los próximos meses, proporcionaremos las métricas sobre el uso de la imputación para la población de alojamientos de grupo. Para esas personas, también imputaremos todas sus características, como describo a continuación.
Para las unidades de vivienda y los alojamientos de grupo, usamos otro tipo de imputación, la “imputación de características”, para ayudarnos a completar las características que faltan de un hogar, tales como la edad o la raza. (Si bien el concepto es similar para las unidades de vivienda y los alojamientos de grupo, nuestra aplicación difiere levemente entre los dos).
Con este tipo de imputación, consideramos una combinación de fuentes para completar la información que falta: otra información de la respuesta al Censo del 2020 de la persona o del hogar, sus respuestas a otro censo o encuesta, otros registros existentes o información de vecinos similares cercanos.
Por ejemplo:
Al igual que con la imputación del conteo, planeamos proporcionar las tasas de imputación de características después de que finalicemos el procesamiento de las respuestas al Censo del 2020. (Aplicamos este tipo de imputación durante la siguiente fase del procesamiento de datos —la creación del Archivo Editado del Censo— por lo que estas tasas aún no estarán disponibles cuando publiquemos las tasas de la imputación del conteo hacia fines de abril).
Enfatizamos que la imputación del conteo y la imputación de características solo se implementan mucho después de que haya finalizado toda la recopilación de datos. Se realizan después de que todos los intentos para obtener una respuesta —una autorrespuesta del hogar o alojamiento de grupo, una entrevista con un censista, información de un sustituto o registros administrativos de alta calidad— se hayan agotado.
Reconocemos que usar la información de estas tres técnicas —imputación, uso de registros administrativos y sustitutos— no siempre puede coincidir con la realidad del estatus de ocupación de una dirección o las características de las personas que viven allí. Sin embargo, estas técnicas son usadas ampliamente en las estadísticas porque se ha comprobado que son más precisas que dejar la información en blanco.
Finalmente, sabemos que la mejor información sobre un hogar proviene directamente del hogar o de las personas en el alojamiento de grupo. Cuando ellos no responden, estas técnicas nos ayudan a entregar un conteo más completo y preciso.