Censos que aprenden a gobernar

Datos poblacionales, simulación social y la reconfiguración de las asimetrías de conocimiento en la inteligencia artificial estatal

Raúl Dubón

Junio de 2026

Resumen

La incorporación de datos censales al desarrollo de sistemas de inteligencia artificial por parte de los Estados suele discutirse bajo la categoría de la privacidad individual. Este artículo argumenta que ese encuadre resulta insuficiente. A partir de la decisión del Estado salvadoreño de derivar una base de “personas sintéticas” de las distribuciones estadísticas del VII Censo de Población y VI de Vivienda 2024, se sostiene que el problema sociológicamente decisivo no es la exposición de datos personales —que la sintetización precisamente neutraliza— sino la concentración de la capacidad de modelar, predecir y simular poblaciones en actores que reúnen simultáneamente acceso a datos, infraestructura computacional, modelos y competencia interpretativa. El trabajo adopta un enfoque teórico-reflexivo y articula tres tradiciones: los estudios de gubernamentalidad y biopolítica, los estudios sociales de la ciencia y la tecnología, y la sociología crítica de la cuantificación. Se examinan la naturaleza y los límites predictivos de los datos censales, su condición de representación estadística de la estructura social, el desplazamiento del dato hacia la simulación poblacional, y la sedimentación de supuestos conceptuales en las categorías que los algoritmos aprenden. El caso salvadoreño se trata como configuración empírica documentada, no como denuncia, identificando escenarios plausibles a la luz de la literatura internacional. Se concluye que la gobernanza democrática de estas capacidades exige desplazar el debate desde la protección del dato hacia la distribución social del poder analítico, y se propone una agenda de investigación sobre auditoría, reproducibilidad y acceso público a las infraestructuras de modelización.

Palabras clave: gubernamentalidad algorítmica; datos censales; datos sintéticos; simulación social; asimetrías de conocimiento; El Salvador.

1. Introducción

El 3 de junio de 2026, la Agencia Nacional de Inteligencia Artificial de El Salvador anunció el lanzamiento de Nemotron-Personas-El-Salvador, una base compuesta por aproximadamente un millón de perfiles sintéticos —“ciudadanos virtuales”— construidos a partir de distribuciones estadísticas derivadas del VII Censo de Población y VI de Vivienda 2024 (Cruz Rojas, 2026). La agencia subrayó un rasgo que conviene tomar en serio desde el inicio: la base no contiene información de personas reales, sino perfiles generados computacionalmente con un enfoque de “privacidad desde el diseño”. El anuncio, formulado en clave de soberanía tecnológica, desactiva de entrada la objeción más previsible —la exposición de datos personales— y, al hacerlo, vuelve visible un problema distinto y de mayor alcance sociológico.

Ese problema es el siguiente. Si lo que se pone en circulación no son los datos de los individuos sino una representación operativa de la población —un modelo capaz de reproducir las regularidades demográficas, económicas y territoriales del país y de generar escenarios sobre ellas—, entonces el objeto del análisis no puede ser la intimidad vulnerada, sino la capacidad de simular sociedades y quién la detenta. La pregunta que organiza este artículo es, en consecuencia: ¿cuáles son las implicaciones epistemológicas, políticas, éticas y democráticas del uso de datos censales para el desarrollo de sistemas de inteligencia artificial por parte de los Estados?

La hipótesis que se desarrolla sostiene que el desafío principal no se agota en la privacidad individual, sino que reside en la concentración de capacidades analíticas, predictivas y de simulación social en actores que poseen acceso privilegiado a datos, infraestructura tecnológica y recursos computacionales, lo que genera nuevas asimetrías de conocimiento y, por esa vía, de poder. El argumento no presupone que la inteligencia artificial estatal sea intrínsecamente perjudicial. Presupone, más modestamente, que la capacidad de modelar una sociedad es un recurso de poder, y que la sociología tiene algo preciso que decir sobre cómo se distribuye ese recurso.

Esta discusión adquiere un relieve particular cuando se la sitúa desde América Latina. La región ha sido históricamente receptora de tecnologías y de categorías producidas en otros centros, y los actuales programas de soberanía tecnológica prometen invertir esa posición. Examinar críticamente esa promesa no equivale a rechazarla; equivale a preguntar bajo qué condiciones la autonomía sobre los datos se traduce —o no— en autonomía sobre la capacidad de producir conocimiento social y en una distribución democrática de esa capacidad. Para una sociología latinoamericana atenta a las relaciones entre conocimiento y poder, el caso ofrece un objeto privilegiado: permite observar, en tiempo real y en un Estado del Sur, la constitución de una nueva infraestructura de modelización social cuyas consecuencias institucionales aún no están fijadas.

El texto procede en tres movimientos. El primero establece qué son y qué no son los datos censales, y por qué su valor para la inteligencia artificial reside menos en predecir individuos que en modelar poblaciones (secciones 3 a 5). El segundo desplaza el eje del debate desde la privacidad hacia las asimetrías de conocimiento y las inscribe en la discusión sobre gubernamentalidad algorítmica y sobre la construcción social de las categorías estadísticas (secciones 6 a 8). El tercero examina las condiciones democráticas de gobernanza de estas capacidades y analiza el caso salvadoreño como configuración empírica documentada (secciones 9 y 10), antes de la discusión y las conclusiones.

2. Aproximación, corpus y estatuto de la evidencia

Este es un artículo teórico-reflexivo, no un estudio empírico de campo. Su corpus se compone de dos materiales heterogéneos cuyo estatuto conviene explicitar. El primero es la literatura académica sobre cuantificación estatal, vigilancia, gubernamentalidad y crítica de los sistemas algorítmicos, que opera como marco analítico. El segundo es la documentación pública del caso salvadoreño: el marco normativo (la Ley de Fomento de la Inteligencia Artificial y Tecnologías y la creación de la Agencia Nacional de Inteligencia Artificial), los resultados oficiales del censo de 2024 y las comunicaciones institucionales y de prensa sobre el lanzamiento de la base sintética en junio de 2026.

Esta heterogeneidad impone cautelas. El caso salvadoreño es un acontecimiento reciente sobre el que todavía no existe literatura académica revisada por pares; su tratamiento se apoya, por tanto, en fuentes institucionales y periodísticas, que aquí cumplen la función de documentar un hecho público, no la de sustentar afirmaciones interpretativas. Las inferencias sobre los efectos del dispositivo se formulan como escenarios plausibles a la luz de la literatura comparada, y se distinguen tipográfica y argumentativamente de los hechos documentados. No se atribuyen intenciones a los actores ni se postulan consecuencias no observadas como si fueran constatadas. Donde la evidencia disponible no permite sostener una afirmación, el texto lo señala en lugar de completar el vacío.

3. Qué son —y qué no son— los datos censales

Conviene comenzar por una distinción que el debate público tiende a borrar. Un censo de población y vivienda no es una colección de datos personales en el sentido en que lo son un historial clínico o un registro de navegación. Es un instrumento diseñado para producir una imagen agregada de una población en un momento determinado. Las categorías de datos que intervienen en este campo no son intercambiables. Los datos personales identifican o permiten identificar a un individuo. Los datos administrativos se generan como subproducto de la relación entre el ciudadano y el Estado —registros tributarios, sanitarios, educativos— y suelen ser longitudinales. Los datos conductuales registran acciones y trazas de comportamiento, frecuentemente en plataformas digitales. Los metadatos describen las condiciones de producción de otros datos. Los datos sociodemográficos agregados, que son los que produce un censo en su forma publicable, describen distribuciones —cuántas personas de tal edad residen en tal territorio, qué proporción de hogares accede a cierto servicio— sin singularizar a nadie.

Esta distinción tiene una consecuencia que el alarmismo tecnológico suele pasar por alto. Un censo no registra preferencias políticas, estados emocionales, decisiones de consumo ni trayectorias individuales. Registra atributos estructurales: edad, sexo, escolaridad, ocupación, composición del hogar, localización, acceso a servicios, condiciones de la vivienda. Por eso, un sistema entrenado exclusivamente sobre información censal posee límites predictivos estrictos respecto del comportamiento individual. No puede anticipar qué votará una persona ni qué comprará, porque esa información no está —ni puede estar— en el dato de origen. La tendencia mediática a atribuir a la inteligencia artificial una capacidad de penetración en la intimidad casi ilimitada confunde el poder de inferencia estadística sobre poblaciones con una clarividencia sobre individuos que el sustrato de datos no autoriza.

Esta sobreestimación no es inocua. Al imaginar la inteligencia artificial como una mente capaz de leer al individuo, el debate público desplaza la atención hacia un peligro espectacular y, en buena medida, ficticio, mientras desatiende el poder real y menos visible del dispositivo: su capacidad de modelar agregados, ordenar poblaciones y ensayar intervenciones a escala. El alarmismo y la fascinación comparten el mismo error de óptica: sobredimensionan la potencia individual de la herramienta y subdimensionan su potencia poblacional. Una sociología que pretenda intervenir con precisión en este debate debe deshacer ambos espejismos y devolver la discusión a su nivel propio, que es el de la estructura social y su gobierno.

El punto, sin embargo, no es tranquilizador, sino analítico. Reconocer los límites individuales del dato censal obliga a localizar su poder en otro nivel: el de la población como objeto de conocimiento. Conviene añadir una salvedad que el argumento exige por honestidad: el límite predictivo del dato censal es estricto cuando se usa de forma aislada. La combinación de datos censales con datos administrativos longitudinales o con trazas conductuales —un proceso técnicamente denominado vinculación o enriquecimiento— puede erosionar esa frontera y aproximar el sistema a inferencias sobre individuos. El presente análisis se circunscribe al caso del dato censal sintetizado y aislado, que es el documentado; señalar el riesgo de vinculación delimita el alcance del argumento y, a la vez, marca dónde la vigilancia analítica debería extenderse en investigaciones ulteriores. Es ahí, y no en el espantajo de la vigilancia individual omnisciente a partir del censo, donde el análisis debe concentrarse.

4. El censo como representación de la estructura social

El censo moderno es uno de los grandes artefactos epistémicos del Estado. Anderson (1991) mostró que el censo, junto con el mapa y el museo, fue una de las tecnologías mediante las cuales el Estado colonial y luego el nacional imaginaron y delimitaron la población que pretendían administrar: clasificar es, simultáneamente, constituir el objeto que se clasifica. Desrosières (1998) llevó esta intuición a la historia de la estadística y demostró que la producción de magnitudes sociales —tasas, promedios, categorías ocupacionales— es inseparable de las operaciones de equivalencia que las hacen posibles. No se cuenta lo que está dado; se cuenta lo que previamente se ha vuelto contable. Hacking (1990) describió el siglo XIX como una era de “avalancha de números” en la que el cálculo de regularidades estadísticas no solo describió poblaciones, sino que generó las categorías bajo las cuales las personas pasaron a comprenderse a sí mismas.

Scott (1998) ofreció la formulación política de esta idea con su concepto de legibilidad. El Estado moderno, sostuvo, necesita volver legible a la sociedad que pretende gobernar, y para ello la simplifica: impone apellidos fijos, unifica medidas, traza catastros, normaliza lenguas y produce censos. Estas operaciones no describen una realidad preexistente; la reorganizan para hacerla administrable. La simplificación tiene un costo epistémico: al hacer legible lo que cabe en sus categorías, el Estado vuelve invisible lo que no cabe —el conocimiento práctico y situado que Scott llama mētis—, y las intervenciones de planificación de “alto modernismo” fracasan, en su análisis, precisamente cuando confunden el mapa simplificado con el territorio que pretende representar. Un censo es, en estos términos, el instrumento por excelencia de la legibilidad estatal; y una población sintética derivada de él es la legibilidad llevada a su forma más manejable, una sociedad que cabe entera en la memoria de una máquina y que puede, por ello, ser intervenida sin la resistencia de lo real.

Latour (1987) añadió la dimensión material de esta operación. El censo produce inscripciones —tablas, cifras, mapas— que tienen la propiedad de ser móviles e inmutables: pueden trasladarse a un centro sin alterarse, acumularse y combinarse allí. Ese centro, que Latour llama centro de cálculo, adquiere poder no porque esté más cerca de la realidad, sino porque concentra las inscripciones que permiten actuar sobre ella a distancia. El poder de quien dispone del censo no reside en haber visto a cada habitante, sino en poseer el lugar donde las representaciones de todos se reúnen y se procesan. Una base de datos poblacional entrenable es la versión contemporánea del centro de cálculo: un punto donde la sociedad entera se vuelve disponible para el ensayo y la combinación.

A la luz de esta tradición, un censo es una representación estadística de la estructura social: un sistema de variables que, combinadas, permiten reconstruir los principales ejes de diferenciación de una sociedad. Edad, sexo, nivel educativo, ocupación, composición del hogar, localización geográfica, acceso a servicios, discapacidad, migración y fecundidad no son atributos sueltos; articulados, dibujan un mapa de posiciones sociales y de su distribución en el territorio. El censo salvadoreño de 2024 recogió, además de los atributos demográficos básicos, información sobre los materiales de la vivienda, el nivel académico de cada miembro del hogar, dificultades de salud, uso de dispositivos electrónicos e ingresos del hogar (Revista E&N, 2024). Ese conjunto de variables habilita, en principio, la construcción de tipologías de hogares, de gradientes territoriales de bienestar y de perfiles de privación articulados.

De aquí se sigue la tesis central de este apartado: la potencia de un sistema de inteligencia artificial entrenado con datos de esta naturaleza no radica en predecir individuos, sino en modelar poblaciones. Un modelo así no necesita saber quién es cada quién para reproducir, con notable fidelidad, cómo se distribuyen los atributos sociales en el espacio y cómo covarían entre sí. Esa capacidad —representar la estructura, no al sujeto— es la que conviene examinar, porque es la que se transfiere cuando se sintetiza una población.

5. Del dato a la simulación: poblaciones sintéticas y gemelos digitales

El paso de la representación a la simulación es el desplazamiento decisivo. Una base de población sintética no almacena a las personas: las genera. A partir de las distribuciones marginales y conjuntas observadas en el censo, un procedimiento computacional produce individuos artificiales cuyas características —edad, localización, ocupación, condiciones socioeconómicas— reproducen, en el agregado, las del universo real (Cruz Rojas, 2026). El resultado es un sustrato sobre el que pueden ensayarse intervenciones sin tocar a ningún ciudadano: una población de prueba, infinitamente disponible, sobre la que se puede experimentar.

Esta operación tiene un linaje técnico preciso. La microsimulación —el modelado de poblaciones a nivel de unidades individuales sintéticas para estimar el efecto de políticas, por ejemplo fiscales o de transferencias— es una herramienta consolidada en la planificación pública desde hace décadas. Su lógica consiste en aplicar reglas (una reforma impositiva, un cambio en una transferencia condicionada) a una población de microunidades y agregar después los resultados, lo que permite estimar quién gana y quién pierde antes de legislar. La modelización basada en agentes desplaza el foco desde las reglas hacia las interacciones: dota a cada agente sintético de comportamientos y observa cómo, de su interacción, emergen fenómenos colectivos —difusión de enfermedades, segregación residencial, congestión— que no son deducibles de las propiedades individuales. Más recientemente, la noción de gemelo digital —una réplica computacional de un sistema sobre la que se ensayan escenarios— se ha extendido desde la ingeniería hacia el urbanismo y la gestión territorial. Un gemelo digital poblacional es, en rigor, lo que una base de personas sintéticas hace posible: un laboratorio sobre el cual modificar variables —subir la cobertura educativa en un territorio, alterar la pirámide etaria, redistribuir el acceso a servicios— y observar los escenarios resultantes. Estos dispositivos alimentan sistemas de apoyo a la decisión y, de manera más amplia, una gobernanza basada en datos que Kitchin (2014a) analizó como el horizonte de la “revolución de los datos”: la promesa de gestionar lo social en tiempo real a partir de su representación digital.

Conviene situar este horizonte en la transformación estructural que Castells (1996) denominó el ascenso de la sociedad red y de un modo informacional de desarrollo, en el que la productividad y el poder dependen crecientemente de la capacidad de procesar información y generar conocimiento. La modelización poblacional es una expresión madura de esa lógica: el valor estratégico ya no reside en la posesión del recurso —el dato— sino en la capacidad de transformarlo en conocimiento accionable. Esta capacidad, sin embargo, no es inmaterial. Crawford (2021) insistió en que toda inteligencia artificial descansa sobre una infraestructura física —centros de datos, procesadores especializados, consumo energético, cadenas de suministro y trabajo— cuya distribución es profundamente desigual. Simular una población requiere capacidad de cómputo de gran escala, y esa capacidad está concentrada geográfica y económicamente. La aparente ligereza del modelo oculta un sustrato pesado: quien no dispone del cómputo no dispone, en la práctica, de la capacidad de modelizar, por más que posea el dato.

Las ventajas son tangibles y no deben minimizarse. Un entorno sintético robusto permite a la administración pública diseñar y probar servicios de asistencia ciudadana, optimizar la asignación de recursos sanitarios o planificar intervenciones territoriales sin exponer datos reales (Cruz Rojas, 2026). En contextos de capacidades estatales limitadas, la posibilidad de simular antes de implementar puede reducir errores costosos y mejorar la focalización del gasto social. La literatura sobre urbanismo de datos, sin embargo, ha documentado también los riesgos (Kitchin, 2014b): el modelo puede confundirse con el territorio, las decisiones pueden delegarse en sistemas cuya lógica los decisores no comprenden, y la aparente neutralidad del cálculo puede sustraer del debate público opciones que son, en el fondo, políticas. La simulación no elimina la incertidumbre: la reorganiza y, con frecuencia, la oculta tras una interfaz de precisión.

El núcleo del problema aparece aquí con nitidez. Cuando una población se vuelve simulable, la pregunta relevante deja de ser “¿están seguros mis datos?” y pasa a ser “¿quién dispone del modelo y con qué fines puede ensayar escenarios sobre la sociedad?”. Es el tránsito de la privacidad a la capacidad analítica.

6. De la privacidad a las asimetrías de conocimiento

El debate público sobre datos e inteligencia artificial gravita casi gravitatoriamente hacia la privacidad. Es comprensible: la intimidad es una categoría jurídica establecida, intuitivamente apropiable y políticamente movilizable. Pero su centralidad produce un efecto de desplazamiento. Al concentrar la preocupación en si el dato individual está protegido, el debate deja en la sombra una cuestión de orden distinto: la distribución desigual de la capacidad de hacer cosas con los datos. El caso de las poblaciones sintéticas lo evidencia con claridad analítica: justamente porque resuelve la privacidad —no hay individuos reales que exponer—, obliga a formular la pregunta que la privacidad encubría.

Esa pregunta puede desglosarse en una cadena de interrogantes que recorre el ciclo completo del conocimiento social. ¿Quién posee los datos de origen? ¿Quién posee los modelos entrenados sobre ellos? ¿Quién posee la infraestructura computacional capaz de entrenarlos y ejecutarlos? ¿Quién posee la competencia técnica para interpretar sus resultados? ¿Y quién está en condiciones de auditar los algoritmos y verificar que hacen lo que dicen hacer? La concentración simultánea de estas cinco capacidades en un mismo actor —típicamente, el Estado en alianza con grandes corporaciones tecnológicas— configura una asimetría de conocimiento cualitativamente nueva. No se trata solo de que un actor sepa más, sino de que solo él puede producir cierto tipo de conocimiento sobre la sociedad y, a la vez, es el único capaz de evaluar la validez de ese conocimiento.

Esta cadena de interrogantes no es retórica; cada eslabón designa una capacidad distinta y socialmente escasa. La posesión del dato es la condición más fácilmente distribuible, y de hecho puede liberarse, como muestra la apertura de bases bajo licencias de uso libre. La posesión de los modelos entrenados es ya más restringida, porque un modelo incorpora trabajo experto, decisiones de diseño y ajustes que no se transfieren con el dato. La infraestructura computacional capaz de entrenar y ejecutar modelos de gran escala está concentrada en pocos actores y pocos territorios, y su acceso depende de recursos financieros y energéticos considerables. La competencia interpretativa —saber qué significa un resultado, qué puede y qué no puede concluirse de él— es un capital cultural que se distribuye de manera tan desigual como cualquier otra forma de pericia. Y la capacidad de auditoría, que requiere las cuatro anteriores más una posición de independencia respecto del actor auditado, es la más escasa de todas. Quien reúne las cinco no solo sabe más: ocupa una posición desde la cual el conocimiento social que produce es, para los demás, a la vez indispensable e inverificable.

Lyon (2007) propuso entender la vigilancia contemporánea menos como observación y más como clasificación social: el rasgo decisivo de los sistemas de datos no es que vean, sino que ordenan, asignan a las personas a categorías y distribuyen oportunidades y riesgos según esa asignación. Una capacidad de modelización poblacional concentrada es, en estos términos, un poder de clasificación social a escala: la facultad de decidir qué categorías estructuran la mirada estatal sobre la sociedad y, por esa vía, qué grupos resultan visibles, prioritarios o sospechosos. La asimetría no se reduce, pues, a una desigualdad de información, sino que es una desigualdad en el poder de organizar la realidad social en categorías operativas. Bourdieu (2014) sostuvo que el Estado moderno se constituye históricamente como concentración de un capital específico —el capital estadístico y simbólico— que le confiere el monopolio de la nominación legítima: el poder de decir, con autoridad reconocida, qué es la sociedad y cómo se compone. La inteligencia artificial entrenada sobre datos poblacionales potencia ese capital y lo desplaza desde la descripción hacia la simulación prospectiva: no solo el poder de nombrar lo que la sociedad es, sino el de modelar lo que sería bajo distintas intervenciones. Cuando ese poder se vuelve técnicamente opaco —cuando los modelos y la infraestructura escapan al escrutinio externo—, la asimetría deja de ser una diferencia de grado de información y se convierte en una diferencia de naturaleza: una clase de conocimiento social disponible para unos pocos e inverificable para el resto.

7. Gubernamentalidad algorítmica

La administración de poblaciones mediante el cálculo no es una invención digital. Foucault (2006) describió el surgimiento, entre los siglos XVII y XVIII, de una forma de poder cuyo objeto deja de ser el territorio o el cuerpo individual y pasa a ser la población como entidad biológica y económica gobernable a través de regularidades estadísticas: natalidad, morbilidad, longevidad, productividad. Esta “gubernamentalidad” opera mediante saberes —la estadística, la demografía, la economía política— que hacen la población visible, calculable y, por tanto, gobernable. Foucault distinguió esta racionalidad de la disciplina: mientras la disciplina actúa sobre el cuerpo individual prescribiendo una norma, los dispositivos de seguridad actúan sobre la población gestionando probabilidades, calculando riesgos y modulando entornos para que las regularidades deseadas se produzcan sin coacción directa.[1] La inteligencia artificial aplicada a datos poblacionales se inscribe en esta genealogía, pero introduce una mutación que la teoría reciente ha intentado conceptualizar: la capacidad de calcular y ensayar esas regularidades antes de intervenir, sobre una réplica de la población.

Rouvroy y Berns (2013) propusieron el concepto de gubernamentalidad algorítmica para nombrar un modo de gobierno que no opera ya sobre sujetos reflexivos a los que se interpela y normaliza, sino sobre perfiles y correlaciones extraídos de datos, que anticipan comportamientos y modulan entornos sin pasar por la conciencia ni por la deliberación de los gobernados. El sujeto deja de ser el destinatario del poder para volverse el punto de aplicación de operaciones estadísticas que lo preceden. Lo distintivo no es la vigilancia —la observación de lo que la gente hace— sino la preempción: la organización del medio a partir de predicciones sobre lo que hará. Una población simulable es el sustrato ideal de esta racionalidad: permite ensayar la modulación antes de aplicarla.

Las contribuciones recientes de la crítica anglófona han documentado las formas concretas de esta racionalidad. Zuboff (2019) analizó cómo el “capitalismo de la vigilancia” convierte la experiencia humana en materia prima para predecir y modificar conductas, desplazando el poder hacia quienes controlan los medios de modificación del comportamiento. Eubanks (2018) mostró que los sistemas algorítmicos de asignación de servicios sociales en Estados Unidos no son neutrales respecto de la clase: tienden a vigilar, clasificar y castigar a los pobres con una intensidad que las poblaciones acomodadas no experimentan. Pasquale (2015) acuñó la imagen de la “sociedad de la caja negra” para describir la opacidad sistemática de los algoritmos que toman decisiones consecuentes sobre las personas sin que estas puedan conocer sus criterios. Crawford (2021) insistió en que la inteligencia artificial no es un artefacto inmaterial, sino una infraestructura de poder —con sus costos materiales, energéticos y laborales— que reconfigura quién decide sobre quién. O’Neil (2016) documentó cómo modelos defectuosos, opacos y a escala —“armas de destrucción matemática”— amplifican desigualdades bajo la apariencia de objetividad técnica.

A esta crítica del poder algorítmico subyace una crítica epistemológica que boyd y Crawford (2012) formularon como interrogación de la mitología del big data: la creencia, difundida y rara vez examinada, de que los grandes volúmenes de datos ofrecen una forma superior de conocimiento, más objetiva y exhaustiva, que haría innecesarias la teoría y la interpretación. Los autores mostraron que los datos masivos no hablan por sí solos: están situados, son producto de decisiones de diseño, y su tamaño no garantiza ni representatividad ni verdad. Aplicada a las poblaciones sintéticas, esta advertencia es pertinente: la magnitud de un millón de perfiles puede producir una impresión de exhaustividad que oculta que el modelo solo reproduce lo que sus categorías de origen permitían ver, y que su realismo aparente es un artefacto de las distribuciones con que fue construido, no una propiedad del mundo.

El hilo que recorre estas obras no es la denuncia de la tecnología, sino la identificación de un desplazamiento de poder: cuando la administración de poblaciones se vuelve algorítmica, el lugar de la decisión migra hacia quienes controlan los modelos, y la legitimidad de las decisiones se desacopla de la deliberación pública para anclarse en la autoridad del cálculo. Aquí la noción de opacidad institucional resulta operativa: no la mera falta de transparencia coyuntural, sino una opacidad inscrita en la arquitectura misma de los dispositivos, que vuelve estructuralmente inaccesible el escrutinio externo del modo en que se produce el conocimiento sobre la sociedad.

8. El problema epistemológico: las categorías que aprenden las máquinas

Hay un nivel del problema más profundo que la opacidad, y es epistemológico. Los sistemas de inteligencia artificial entrenados sobre datos censales no aprenden de la realidad social: aprenden de categorías que ya contienen supuestos teóricos e históricos. Conceptos como empleo, desempleo, informalidad, pobreza, ruralidad, dependencia económica o jefatura de hogar no son reflejos neutrales de hechos sociales. Son construcciones —productos de decisiones conceptuales, disputas técnicas y relaciones de poder— que delimitan qué cuenta y cómo cuenta.

Bowker y Star (1999) demostraron que toda clasificación es a la vez un instrumento de conocimiento y un dispositivo moral y político: clasificar implica decidir qué diferencias importan, y esa decisión tiene consecuencias para quienes caen dentro o fuera de cada categoría. La categoría de “jefatura de hogar”, por ejemplo, codifica supuestos sobre la estructura familiar y la autoridad doméstica que no son universales. La frontera entre “empleo” e “informalidad” depende de definiciones operativas que varían entre sistemas estadísticos y que arrastran teorías implícitas sobre el trabajo. La “ruralidad” se define por umbrales administrativos que pueden no corresponder a las formas de vida que pretenden capturar. Desrosières (1998) llamó a este proceso la construcción de equivalencias: para que algo sea contable, debe primero volverse comparable, y esa operación nunca es inocente.

Conviene detenerse en un ejemplo para que el argumento no quede en abstracto. La categoría de “informalidad” laboral, central en cualquier censo latinoamericano, no captura un hecho natural: es el resultado de una definición operativa que traza una frontera —según el registro, el tamaño de la unidad productiva, la afiliación a la seguridad social— y que deja fuera o dentro realidades heterogéneas. Un trabajador por cuenta propia con ingresos elevados y un jornalero sin contrato pueden compartir la etiqueta “informal” pese a ocupar posiciones sociales opuestas. La categoría “jefatura de hogar”, por su parte, presupone que cada hogar tiene una cabeza identificable y, en muchas tradiciones censales, ha tendido a asignarla por defecto a un varón adulto, invisibilizando arreglos domésticos en los que la autoridad y el sostén económico se distribuyen de otro modo. Cada una de estas categorías incorpora una teoría implícita sobre el trabajo o sobre la familia, y cada teoría tiene consecuencias distributivas, porque de la clasificación dependen el diagnóstico y, con frecuencia, la asignación de recursos públicos.

La consecuencia para la inteligencia artificial es directa. Cuando un modelo aprende sobre estas categorías, no aprende la realidad social: aprende la teoría implícita que la categoría incorpora. Si la categoría contiene un sesgo —si invisibiliza el trabajo de cuidado no remunerado, si subestima formas de privación que sus umbrales no capturan, si naturaliza una estructura familiar particular—, el modelo no corrige ese sesgo: lo aprende, lo sistematiza y, al operar a escala, lo amplifica. Benjamin (2019) y Noble (2018) han documentado cómo los sistemas algorítmicos reproducen y profundizan jerarquías raciales y de género precisamente porque heredan las categorías y los datos de un mundo desigual. El riesgo no es que la máquina invente prejuicios, sino que estabilice y dote de apariencia técnica los que ya están sedimentados en sus insumos.

Esta crítica adquiere una dimensión adicional desde el pensamiento latinoamericano. De Sousa Santos (2014) y, antes, Quijano (2000) advirtieron sobre la colonialidad del saber: la imposición de categorías producidas en los centros como universales, que invisibilizan las formas de conocimiento y las realidades sociales del Sur global. Una base sintética construida sobre categorías censales heredadas, y desarrollada técnicamente mediante modelos y arquitecturas diseñados en otros contextos, corre el riesgo de reproducir esa colonialidad bajo la bandera de la soberanía tecnológica: una autonomía nominal sobre los datos que coexiste con una dependencia profunda respecto de las categorías, los modelos y la infraestructura. La pregunta decolonial no es solo de quién son los datos, sino de quién son las categorías con las que los datos fueron pensados.

El caso de la población sintética agudiza esta crítica por una razón estructural: hereda categorías dos veces. Las hereda primero del censo, cuyas variables y umbrales incorporan las teorías implícitas ya descritas; y las hereda de nuevo de las arquitecturas de modelización con que se la construye, diseñadas en otros contextos y portadoras de supuestos sobre qué es un “perfil”, qué atributos definen a una “persona” y qué relaciones entre ellos son verosímiles. Una población sintética no es, por tanto, un espejo neutro de la sociedad salvadoreña, sino el producto del encuentro entre dos capas de categorías heredadas. El realismo demográfico de los perfiles puede ser alto y, sin embargo, la base puede reproducir y estabilizar una determinada manera —históricamente situada— de concebir el trabajo, la familia o la privación. El riesgo epistemológico no se resuelve con más datos ni con mayor fidelidad estadística, porque no reside en la cantidad sino en la teoría sedimentada en las categorías.

9. Democracia y acceso al conocimiento estratégico

Si la capacidad de modelar la sociedad es un recurso de poder, su gobernanza es un problema democrático, no meramente técnico. La discusión normativa pertinente gira en torno a un conjunto de condiciones que la literatura ha ido precisando: la transparencia algorítmica, entendida no como divulgación del código sino como capacidad efectiva de comprender y cuestionar los criterios de decisión; la existencia de auditorías independientes con acceso real a modelos y datos; la reproducibilidad científica de los procedimientos, que permita verificar los resultados; el acceso abierto a las bases y a las herramientas; y mecanismos de supervisión ciudadana que no dependan de la buena voluntad del actor supervisado.

Cada una de estas condiciones tiene un correlato técnico preciso que conviene no diluir en buenas intenciones. La transparencia significativa no se satisface con publicar el código, que para la mayoría es ilegible, sino con la capacidad de explicar y contestar los criterios que llevan a un resultado consecuente. La auditoría independiente requiere acceso efectivo a los datos de entrenamiento, a los modelos y a la documentación de sus decisiones de diseño, además de una posición institucional que no dependa del auditado. La reproducibilidad exige que terceros puedan rehacer el procedimiento y obtener resultados equivalentes, lo que supone documentar y liberar no solo los datos sino los métodos. El acceso abierto, finalmente, debe entenderse en sentido fuerte: no solo al insumo, sino al conjunto de elementos que hacen efectiva la capacidad analítica. La distancia entre la versión nominal y la versión efectiva de cada una de estas condiciones es, precisamente, el espacio donde la opacidad institucional se reproduce.

La pregunta que articula este apartado es deliberadamente normativa: ¿debe la capacidad de modelar la sociedad estar concentrada exclusivamente en el Estado y en las grandes corporaciones tecnológicas? La respuesta que sugiere el análisis precedente es que una concentración tal resulta difícilmente compatible con la deliberación democrática, porque sustrae del debate público la producción misma del conocimiento sobre el cual se decide. Si solo un actor puede modelar la sociedad y solo él puede evaluar sus modelos, la ciudadanía queda en la posición de aceptar o rechazar conclusiones cuyo proceso de producción no puede examinar.

De ahí la relevancia de los actores capaces de contrapesar esa concentración. Las universidades y los centros de investigación pueden ejercer una función de auditoría epistémica si disponen de acceso a los datos y a las herramientas; sin ese acceso, su capacidad crítica es puramente declarativa. Los observatorios ciudadanos y las organizaciones de la sociedad civil pueden traducir la opacidad técnica en términos públicamente discutibles, siempre que cuenten con capacidades técnicas propias. La apertura de la base sintética bajo una licencia de uso libre —como la adoptada en el caso salvadoreño— es, en este sentido, un dato ambivalente: democratiza el acceso al insumo, pero no necesariamente a los modelos entrenados sobre él, ni a la infraestructura computacional requerida para explotarlo, ni a la competencia para auditarlo. El acceso al dato no equivale al acceso a la capacidad analítica. Una gobernanza democrática de la modelización social exigiría distribuir las cinco capacidades —datos, modelos, infraestructura, interpretación y auditoría—, no solo la primera.

Esto admite formulaciones institucionales concretas que la investigación comparada permite imaginar sin abandonar la cautela. Cabe pensar en registros públicos de los modelos de uso estatal que documenten sus propósitos, sus datos de entrenamiento y sus decisiones de diseño; en figuras de auditoría algorítmica independiente con mandato legal y acceso garantizado, separadas de la agencia que desarrolla los sistemas; en esquemas de acceso reglado para universidades y centros de investigación que habiliten la verificación sin comprometer fines legítimos de reserva; y en una separación funcional entre las tareas de fomento, regulación y supervisión, de modo que ningún actor sea simultáneamente desarrollador, regulador y evaluador de su propia obra. Ninguna de estas figuras es una garantía por sí sola, y todas suponen capacidades técnicas y voluntad política que no pueden darse por descontadas. Pero su mención cumple una función analítica: muestra que la concentración de la capacidad de modelización no es un destino tecnológico, sino el resultado de una arquitectura institucional que podría ser de otro modo.

10. El caso salvadoreño

El Salvador ofrece una configuración empírica particularmente articulada para examinar estas tensiones, y conviene tratarla con precisión documental y sin atribuciones especulativas. En febrero de 2025, la Asamblea Legislativa aprobó la Ley de Fomento de la Inteligencia Artificial y Tecnologías (Decreto Legislativo n.º 234), que creó la Agencia Nacional de Inteligencia Artificial (ANIA) como entidad rectora en materia de promoción, investigación y aplicación de la inteligencia artificial, adscrita a la Presidencia de la República (Asamblea Legislativa de El Salvador, 2025). Una reforma posterior, en julio de 2025, amplió su autonomía y le dotó de patrimonio propio y de la facultad de fijar precios por los servicios que preste (Diario El Mundo, 2025). El diseño institucional adopta un modelo de “ventanilla única” orientado a agilizar trámites, con garantías a la propiedad intelectual y entornos de prueba controlados.

El sustrato de datos proviene del VII Censo de Población y VI de Vivienda 2024, levantado por el Banco Central de Reserva como ente rector del Sistema Estadístico Nacional, que registró una población de 6.029.976 habitantes (UNFPA El Salvador, 2025). Sobre las distribuciones estadísticas de ese censo, la ANIA —en alianza con NVIDIA y con la empresa WideLabs— construyó la base Nemotron-Personas-El-Salvador: aproximadamente un millón de perfiles sintéticos con cobertura de los catorce departamentos del país, presentada como insumo para entrenar, evaluar y desarrollar sistemas de inteligencia artificial adaptados al contexto nacional, liberada bajo una licencia abierta CC BY 4.0 y disponible para instituciones públicas, universidades, centros de investigación y empresas (Cruz Rojas, 2026). La iniciativa se inscribe en el programa global Nemotron-Personas de NVIDIA, en el que participan también otras economías. El desarrollo se apoya, además, en una capacidad computacional reciente: en noviembre de 2025 el país recibió procesadores NVIDIA B300, destinados al entrenamiento y ejecución de modelos de gran escala, y se ha anunciado el uso de energía geotérmica para alimentar los clústeres de cómputo (Cruz Rojas, 2026).

Tres rasgos de esta configuración merecen lectura sociológica, formulada como interpretación y no como constatación de efectos. Primero, la sintetización resuelve explícitamente la cuestión de la privacidad —no hay personas reales en la base—, lo que vuelve improcedente el encuadre habitual y confirma la pertinencia de desplazar el análisis hacia la capacidad de simulación. Segundo, la concentración institucional es notable: una agencia única, adscrita a la Presidencia, dotada de autonomía y de un mandato simultáneo de fomento, regulación y supervisión, reúne en un mismo punto funciones que en otros diseños se separan deliberadamente para permitir el contrapeso. Esta concentración no implica, por sí misma, un uso indebido; sí configura una estructura en la que el actor que desarrolla la capacidad de modelización es también quien la regula y quien evaluaría su corrección, lo que reduce los puntos de auditoría externa. Tercero, la apertura de la base bajo licencia libre democratiza el insumo, pero coexiste con una asimetría persistente en el acceso a la infraestructura de cómputo —los procesadores de alta gama— y a la competencia técnica para explotarla, de modo que la capacidad analítica efectiva permanece desigualmente distribuida.

La dimensión material e infraestructural merece una lectura específica, porque tensiona el lenguaje de soberanía con que el dispositivo se presenta. El desarrollo descansa sobre procesadores de alta gama provistos por un fabricante extranjero, sobre la colaboración de empresas tecnológicas externas y sobre el programa global de un proveedor internacional en el que el país es uno entre varios participantes. La energía geotérmica nacional alimenta los clústeres de cómputo, lo que aporta una autonomía energética real; pero la arquitectura de los modelos, los procesadores y los marcos técnicos provienen de fuera. Se configura así una soberanía de geometría desigual: plena sobre el dato y la energía, dependiente sobre el cómputo de frontera y las arquitecturas. Leída con Crawford (2021), esta configuración recuerda que la inteligencia artificial es siempre una infraestructura de poder materialmente situada, y que la autonomía declarada en un eslabón de la cadena puede coexistir con la dependencia en los eslabones donde se concentra el valor estratégico.

Los escenarios plausibles que la literatura comparada permite anticipar son ambivalentes. Por un lado, un entorno sintético de alta fidelidad demográfica puede mejorar el diseño de servicios públicos, la planificación sanitaria y territorial y la focalización del gasto social en un contexto de recursos limitados, sin exponer datos personales (Cruz Rojas, 2026). En un Estado con capacidades estadísticas históricamente restringidas, disponer de un instrumento para ensayar políticas antes de implementarlas no es trivial. Por otro lado, la experiencia internacional documentada por Eubanks (2018) y O’Neil (2016) advierte que los sistemas de decisión basados en modelos poblacionales tienden a recaer con mayor intensidad sobre los grupos más vulnerables y a operar con una opacidad que dificulta la impugnación. La concentración de las funciones de desarrollo, regulación y supervisión en una misma agencia reduce, además, los puntos de auditoría externa que en otros diseños permiten detectar y corregir esos efectos. Cuál de estos escenarios predomine no es una propiedad de la tecnología, sino de las condiciones institucionales de su gobernanza: la existencia o ausencia de auditoría independiente, de reproducibilidad verificable y de capacidades analíticas distribuidas más allá del actor que controla el dispositivo.

11. Discusión

El recorrido confirma, matiza y extiende la hipótesis inicial. La confirma en su núcleo: el problema sociológicamente decisivo del uso de datos censales para la inteligencia artificial estatal no es la privacidad individual, sino la concentración de la capacidad de modelar y simular poblaciones. El caso de las poblaciones sintéticas es, en este sentido, un experimento natural particularmente ilustrativo, porque resuelve la privacidad y, al hacerlo, deja al descubierto que esta nunca fue el problema central. La matiza en un punto importante: la concentración relevante no es de datos —que pueden incluso liberarse abiertamente— sino del conjunto articulado de capacidades que van del dato a la auditoría, pasando por los modelos, la infraestructura y la interpretación. Y la extiende al incorporar la dimensión epistemológica: la capacidad de modelar no es solo un poder de cálculo, sino un poder de imponer categorías, con el riesgo correlativo de amplificar sesgos sedimentados y de reproducir formas de colonialidad del saber bajo el lenguaje de la soberanía.

El diálogo con el marco teórico arroja una convergencia y una tensión. La convergencia: la gubernamentalidad algorítmica de Rouvroy y Berns (2013), leída sobre la genealogía foucaultiana de la población (Foucault, 2006), ofrece la lente más precisa para entender qué se desplaza cuando una población se vuelve simulable —el tránsito de la normalización del sujeto a la preempción del entorno—. A esa lente, las tradiciones de la legibilidad estatal (Scott, 1998), de los centros de cálculo (Latour, 1987) y del capital estadístico del Estado (Bourdieu, 2014) aportan una continuidad histórica que evita el espejismo de la novedad absoluta: la población sintética no inaugura el poder de modelar la sociedad, sino que radicaliza una capacidad que el Estado moderno persigue desde su constitución. Lo nuevo no es la voluntad de hacer legible y calculable a la población, sino la posibilidad técnica de ensayar intervenciones sobre una réplica de ella antes de aplicarlas sobre la sociedad real.

La tensión: buena parte de la literatura crítica anglófona (Zuboff, 2019; Eubanks, 2018; Pasquale, 2015) fue formulada para el capitalismo de plataformas del Norte global, donde el actor dominante es corporativo y el dato es conductual. El caso analizado invita a desplazar ese marco hacia un Estado del Sur que combina soberanía declarada, dependencia infraestructural y dato sociodemográfico sintetizado. Esta tensión es productiva: obliga a no aplicar mecánicamente categorías importadas y a precisar qué de ellas resiste el traslado y qué requiere reformulación. La noción de opacidad institucional —entendida como una opacidad inscrita en la arquitectura de los dispositivos y no como mera reticencia coyuntural— resulta útil precisamente porque nombra el rasgo común a ambos contextos sin borrar sus diferencias: tanto la plataforma corporativa como la agencia estatal pueden volver estructuralmente inaccesible el escrutinio de cómo producen conocimiento sobre la sociedad.

Conviene, por último, delimitar el alcance del argumento.

Un punto requiere precisión técnica para no exceder lo que la evidencia autoriza. La fidelidad demográfica de una población sintética —su capacidad de reproducir las distribuciones del censo— no equivale a representatividad de la realidad social. Un modelo puede ajustar con exactitud las proporciones de edad, sexo, ocupación o territorio y, simultáneamente, omitir aquello que el censo nunca capturó o capturó mal: las economías de subsistencia, las formas de trabajo no registradas, las trayectorias de quienes habitan los márgenes de las categorías. La advertencia de boyd y Crawford (2012) opera aquí con fuerza: la apariencia de completitud que confiere el gran número puede encubrir las ausencias estructurales del instrumento de origen. Por ello, evaluar una base sintética solo por su ajuste estadístico es insuficiente; la pregunta sociológicamente pertinente es qué realidades quedaron fuera del censo y, en consecuencia, fuera del modelo, y con qué consecuencias para las decisiones que sobre él se ensayen.

Este análisis no demuestra que la inteligencia artificial estatal produzca daño, ni que el caso examinado vaya a derivar en abuso. No dispone de evidencia sobre los usos concretos que se darán a la base ni sobre sus efectos, que son por ahora inexistentes o no observados. Lo que el análisis sostiene es de orden estructural: la configuración institucional descrita concentra capacidades cuya distribución es un problema democrático, y la ausencia de mecanismos robustos de auditoría externa y reproducibilidad deja ese problema sin resolver. La afirmación es condicional, no predictiva.

12. Conclusiones

La incorporación de datos censales al desarrollo de inteligencia artificial estatal exige reformular el problema que comúnmente se le asocia. La protección del dato personal, aunque legítima, opera como un señuelo analítico: concentra la atención pública en una dimensión —la intimidad— que las técnicas de sintetización pueden neutralizar, mientras deja intacta la cuestión sustantiva, que es la distribución social de la capacidad de modelar y simular sociedades. El significado teórico de este desplazamiento es que el poder algorítmico contemporáneo se juega menos en la posesión del dato que en el control articulado del ciclo que va del dato a la auditoría. El significado empírico es que las garantías de privacidad, por sólidas que sean, no responden a la pregunta democrática pertinente, que es quién puede producir y quién puede verificar el conocimiento sobre la sociedad.

De ello se desprende una implicación para la práctica institucional, formulada con cautela epistémica. Una gobernanza democrática de estas capacidades no se satisface con liberar el insumo ni con asegurar la privacidad; requiere distribuir las capacidades de modelización, interpretación y auditoría, y separar institucionalmente las funciones de desarrollo, regulación y supervisión, de modo que existan puntos de contrapeso externos al actor que controla el dispositivo. La soberanía tecnológica, entendida como autonomía respecto de los proveedores externos, es un objetivo defendible; pero no debe confundirse con la democratización del poder analítico, que es una cuestión distinta y exige condiciones propias. Un Estado puede ser soberano en sus datos y, simultáneamente, monopólico en su capacidad de modelarlos.

La reconfiguración de las relaciones entre conocimiento, poder y democracia que estas tecnologías introducen no está determinada de antemano. Depende de decisiones institucionales que aún pueden tomarse, y que la investigación social tiene la responsabilidad de iluminar antes de que se sedimenten en infraestructuras difíciles de revertir.

13. Agenda futura de investigación

La investigación pendiente puede precisarse en cuatro direcciones, evitando la fórmula genérica del llamado a “más estudios”. Primero, se requiere investigación metodológica sobre la fidelidad y los límites de las poblaciones sintéticas derivadas de censos: en qué medida preservan las covarianzas relevantes, qué distorsiones introducen sobre los grupos minoritarios o de baja frecuencia, y bajo qué condiciones la sintetización garantiza efectivamente la no reidentificación. Segundo, se necesita investigación institucional comparada sobre los arreglos de gobernanza de las agencias nacionales de inteligencia artificial, atendiendo específicamente a la separación o concentración de las funciones de fomento, regulación y auditoría, y a los mecanismos de supervisión externa disponibles. Tercero, es pertinente una agenda de investigación-acción sobre las capacidades de auditoría algorítmica de las universidades y los observatorios ciudadanos en contextos del Sur global, orientada a establecer qué condiciones de acceso a datos, modelos e infraestructura harían efectiva su función crítica. Cuarto, conviene desarrollar una sociología histórica de las categorías censales nacionales y de su transferencia a los sistemas algorítmicos, que identifique qué supuestos conceptuales se trasladan, se estabilizan y se amplifican en el paso del cuestionario al modelo. El caso salvadoreño, por su carácter reciente y documentado, ofrece un terreno propicio para las cuatro líneas.

Referencias

Anderson, B. (1991). Imagined communities: Reflections on the origin and spread of nationalism (Ed. rev.). Verso.

Asamblea Legislativa de El Salvador. (2025, 26 de febrero). Ley de Inteligencia Artificial ayudará a mejorar los servicios públicos e impulsar la economía. https://www.asamblea.gob.sv/node/13492

Benjamin, R. (2019). Race after technology: Abolitionist tools for the new Jim Code. Polity Press.

Bourdieu, P. (2014). Sobre el Estado: Cursos en el Collège de France (1989-1992). Anagrama.

Bowker, G. C., & Star, S. L. (1999). Sorting things out: Classification and its consequences. MIT Press.

boyd, d., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662–679.

Castells, M. (1996). The rise of the network society (The information age: Economy, society and culture, Vol. 1). Blackwell.

Crawford, K. (2021). Atlas of AI: Power, politics, and the planetary costs of artificial intelligence. Yale University Press.

Cruz Rojas, Á. (2026, 4 de junio). El Salvador crea su primer banco de datos para desarrollar inteligencia artificial propia. Diario El Mundo. https://diario.elmundo.sv/economia/el-salvador-crea-su-primer-banco-de-datos-para-desarrollar-inteligencia-artificial-propia

De Sousa Santos, B. (2014). Epistemologies of the South: Justice against epistemicide. Paradigm Publishers.

Desrosières, A. (1998). The politics of large numbers: A history of statistical reasoning (C. Naish, Trad.). Harvard University Press.

Diario El Mundo. (2025, 16 de julio). Agencia de IA tendrá patrimonio y autonomía administrativa. https://diario.elmundo.sv

Eubanks, V. (2018). Automating inequality: How high-tech tools profile, police, and punish the poor. St. Martin’s Press.

Foucault, M. (2006). Seguridad, territorio, población: Curso en el Collège de France (1977-1978). Fondo de Cultura Económica.

Hacking, I. (1990). The taming of chance. Cambridge University Press.

Kitchin, R. (2014a). The data revolution: Big data, open data, data infrastructures and their consequences. SAGE.

Kitchin, R. (2014b). The real-time city? Big data and smart urbanism. GeoJournal, 79(1), 1–14.

Latour, B. (1987). Science in action: How to follow scientists and engineers through society. Harvard University Press.

Lyon, D. (2007). Surveillance studies: An overview. Polity Press.

Noble, S. U. (2018). Algorithms of oppression: How search engines reinforce racism. NYU Press.

O’Neil, C. (2016). Weapons of math destruction: How big data increases inequality and threatens democracy. Crown.

Pasquale, F. (2015). The black box society: The secret algorithms that control money and information. Harvard University Press.

Quijano, A. (2000). Colonialidad del poder, eurocentrismo y América Latina. En E. Lander (Ed.), La colonialidad del saber: Eurocentrismo y ciencias sociales. Perspectivas latinoamericanas (pp. 201–246). CLACSO.

Revista E&N. (2024, 29 de octubre). Censo poblacional: El Salvador tiene 6.029.976 habitantes. https://www.revistaeyn.com

Rouvroy, A., & Berns, T. (2013). Gouvernementalité algorithmique et perspectives d’émancipation: Le disparate comme condition d’individuation par la relation? Réseaux, 177(1), 163–196.

Scott, J. C. (1998). Seeing like a state: How certain schemes to improve the human condition have failed. Yale University Press.

UNFPA El Salvador. (2025). Censo El Salvador 2024: Un hito en calidad y tecnología. https://elsalvador.unfpa.org/es/news/censo-el-salvador-2024

Zuboff, S. (2019). The age of surveillance capitalism: The fight for a human future at the new frontier of power. PublicAffairs.

La distinción es relevante para el argumento. Una población sintética no es un dispositivo disciplinario —no vigila ni corrige individuos— sino un dispositivo de seguridad llevado al límite: un instrumento para calcular y gestionar las regularidades de una población en su conjunto. Esto explica por qué la objeción de la privacidad, anclada en el modelo disciplinario de la vigilancia del individuo, no alcanza a capturar lo que está en juego. ↑