Muchas partes del censo están a la vista de los estadounidenses: las invitaciones y los recordatorios para participar que llegan por correo, los anuncios multilingües, la extensión comunitaria que realizan los líderes de la comunidad y los censistas que tocan a las puertas para recopilar las respuestas.
Hoy continuaremos hablando sobre algunas de las tareas que no están tan a la vista, pero tienen la misma importancia para producir resultados del censo de calidad: las personas que hacen los cálculos numéricos y analizan las tendencias, los mapas, y los datos atípicos para asegurar que los datos sin procesar sobre nuestra población se conviertan en estadísticas de calidad.
Para el Censo del 2020, estamos realizando una de las revisiones más completas en la historia reciente del censo. Mediante esta revisión hemos identificado y corregido problemas de procesamiento de datos, hecho esfuerzos para corregir problemas de recopilación de datos, y hemos comenzado a desarrollar un entendimiento de cómo ha cambiado la población de la nación durante la última década.
Antes de hablar sobre la revisión, nos gustaría proporcionar un breve resumen de cómo funciona el procesamiento de datos. (El último blog sobre Información básica sobre el procesamiento de datos del Censo describe esto en más detalle.)
Tratamos de obtener información de todas las direcciones, incluso si esto significa aceptar múltiples respuestas sobre las mismas personas o el mismo lugar. En el blog hablamos más sobre por qué podría suceder esto Recibir la visita de un censista aunque usted ya haya respondido.
Una vez que finaliza la recopilación de datos:
Cada fase del procesamiento de datos produce un archivo de datos. Nuestros expertos en el tema revisan los datos para identificar problemas sistemáticos o generalizados en la recopilación o el procesamiento de datos. Si identificamos problemas que necesitan corregirse, desarrollamos ajustes y los probamos. Después de implementar un ajuste, revisamos el archivo de datos nuevamente y continuamos el proceso hasta que se hayan solucionado todos los problemas identificados. Explicamos este proceso en más detalle en un blog reciente, Encontrar ‘anomalías’ demuestra que los controles de calidad del Censo del 2020 funcionan.
Estos pasos de procesamiento y revisión son habituales en cada censo, y el Censo del 2020 no es diferente.
Aunque varía el tamaño de cada uno de los archivos de datos que se producen sucesivamente, todos son muy grandes, aun para los estándares del censo, e incluyen cientos de millones de registros con muchas variables.
Gracias a las mejoras en hardware y software de esta década, hemos podido convertir estos grandes archivos de datos en diagnósticos (métricas que nos ayudan a diagnosticar posibles problemas) y tabular los resultados que necesitamos para la revisión. Al producir esta información más rápido, hemos podido dedicar más tiempo a revisar los resultados.
Para hacer más fácil la revisión de esta enorme cantidad de datos en cada archivo, cargamos los archivos en un software de visualización y análisis. Una de las herramientas que usamos es una que desarrollamos para el Censo del 2020. A esta herramienta la llamamos Aplicación para Revisión, Análisis y Visualización del Censo o “CRAVA”, por sus siglas en inglés CRAVA ha mejorado enormemente nuestra capacidad de realizar una revisión rigurosa.
Cargamos las tabulaciones de cada uno de los archivos nuevos en CRAVA. Luego, CRAVA genera gráficos y mapas que muestran los totales de población del censo junto con puntos de referencia, tales como el Censo del 2010, las estimaciones de población del 2020 y la Encuesta sobre la Comunidad Estadounidense. Esto les permite a los equipos de revisores buscar simultáneamente datos atípicos y patrones en los resultados.
Si bien la tecnología proporciona una visión de los datos, son los expertos en el tema encargados de la revisión quienes deben darle sentido a todo lo que ven. Ellos desarrollan los sistemas de revisión, diseñan los procesos de revisión y tienen el conocimiento y la experiencia que hacen posible la revisión.
Tenemos un equipo de más de 70 expertos que revisan sistemáticamente los archivos de cada una de las etapas del procesamiento. Estos expertos —muchos de los cuales han trabajado en dos o más censos— tienen una amplia experiencia en y un conocimiento de las operaciones del censo, geografía y las características demográficas y tendencias que se miden en el censo.
Su dominio de un tema es lo que hace posible identificar posibles problemas con el procesamiento y la recopilación de datos y determinar si son problemas reales o si son mediciones precisas de cambios demográficos.
La revisión de datos se enfoca más en encontrar problemas sistemáticos y generalizados que en problemas en un determinado alojamiento de grupo o particulares de un área. Si un patrón de conteos es más alto o más bajo que los puntos de referencia, entonces investigamos más a fondo.
Vemos si el patrón puede estar relacionado con una operación o un proceso del censo para determinar el problema subyacente, y luego desarrollamos una acción correctiva, si es necesario. Si encontramos problemas exclusivos de un alojamiento de grupo o un área específicos, tales como cuando un alojamiento de grupo está en la ubicación incorrecta, también los corregimos.
El blog reciente Encontrar ‘anomalías’ demuestra que los controles de calidad del Censo del 2020 funcionan describe los tipos de anomalías que hemos encontrado y proporciona varios ejemplos, incluyendo cómo las resolvimos. El blog sobre Alojamientos de grupo del Censo del 2020 describe un problema más generalizado en los alojamientos de grupo, que identificamos durante nuestra revisión y resolvimos mediante esfuerzos adicionales de recopilación de datos y procesamiento.
Por último, en un próximo blog hablaremos sobre esfuerzos adicionales para quitar personas duplicadas luego de que nuestra revisión dejó ver altos niveles de respuestas al censo duplicadas que no se habían quitado mediante otros procesos.
Hasta ahora hemos completado la tercera fase del procesamiento de datos, la revisión del archivo de datos conocido como Archivo sin Editar del Censo o CUF, por sus siglas en inglés. El CUF incluye el conteo final de la población de cada dirección del censo, que sumamos para determinar la población de cada estado. Estos conteos de las poblaciones de los estados se usan en la distribución proporcional de distritos congresionales para calcular el número de representantes que tiene cada estado en el Congreso de los EE. UU.
Al CUF lo llamamos ‘Archivo sin Editar del Censo’ porque aún no hemos realizado los pasos finales de aplicar las correcciones e imputaciones para completar las características que faltan, tales como edad, sexo, raza y origen hispano. Esos pasos tienen lugar en la siguiente fase a medida que creamos el CEF o Archivo Editado del Censo.
El CEF incluirá la información demográfica completa de cada registro del censo y proporcionará la primera oportunidad para realizar una revisión a fondo de la información sobre las características recopiladas en el censo. EL CEF es un paso crucial para proporcionar los datos para la redistribución legislativa que los estados esperan.
A medida que nos preparamos para la publicación en abril de los primeros resultados del Censo del 2020, lo hacemos con la confianza de que hemos revisado rigurosamente los conteos de la población y hemos hecho todos los esfuerzos razonables para resolver los problemas que hemos identificado para asegurar la calidad de estos resultados.
Al combinar una considerable experiencia en el tema con poderosas herramientas analíticas, estamos realizando una de las revisiones más completas en la historia reciente del censo.