Hacia un sistema de monitoreo sociopolítico basado en ciencia de datos:

Fundamentos teórico-metodológicos para la predicción de tendencias en contextos de polarización

José Raúl Dubón Huezo[1]

Resumen

El presente artículo desarrolla un planteamiento teórico-metodológico orientado al diseño de un sistema de monitoreo sociopolítico capaz de identificar y anticipar tendencias de comportamiento social y político en contextos estructuralmente polarizados, con especial atención al caso salvadoreño y su proyección hacia la región centroamericana. Partiendo de una problematización sociológica de la polarización —entendida simultáneamente como construcción discursiva, mecanismo de dominación simbólica y estrategia de reconfiguración del campo político—, se articulan los aportes de la sociología computacional y la ciencia de datos con tradiciones teóricas críticas que incluyen a Bourdieu, Gramsci y Habermas, así como la reflexión epistemológica de la Escuela de Frankfurt sobre los límites de la racionalidad instrumental. Se propone una arquitectura analítica que integra fuentes de datos heterogéneas, un índice compuesto multidimensional de tensión sociopolítica y modelos predictivos probabilísticos, al tiempo que se problematiza el riesgo de determinismo algorítmico, los sesgos inherentes a los datos y la opacidad de los modelos. El artículo concluye con una propuesta de gobernanza institucional basada en consorcios universitarios centroamericanos y un modelo de sostenibilidad dual que articula la función de bien público con servicios especializados, sin eludir las consideraciones éticas relativas a la privacidad, la vigilancia y el uso político de la información.

Palabras clave: monitoreo sociopolítico, polarización, ciencia de datos, sociología computacional, predicción social, El Salvador, Centroamérica.

1. Introducción

La polarización política constituye uno de los fenómenos más disruptivos en las democracias contemporáneas. Lejos de tratarse de un mero desacuerdo entre posiciones ideológicas, la polarización opera como un mecanismo de reestructuración del campo político que reconfigura las condiciones de producción del discurso público, fragmenta la esfera deliberativa y erosiona los fundamentos del consenso institucional. En Centroamérica, y particularmente en El Salvador, este fenómeno adquiere rasgos derivados de una historia de conflicto armado, desigualdad estructural persistente, fragilidad institucional y ciclos recurrentes de crisis de representación que no encuentran paralelo exacto en las democracias consolidadas del Norte global ni, incluso, en las trayectorias del Cono Sur (Levitsky y Ziblatt, 2018; Mouffe, 2013). La transición democrática salvadoreña, inaugurada con los Acuerdos de Paz de 1992, configuró un sistema político bipartidista cuya erosión progresiva ha dado paso a dinámicas de concentración del poder, debilitamiento de contrapesos institucionales y una reconfiguración profunda de las lealtades electorales que desafía las categorías analíticas convencionales. La creciente digitalización de la comunicación política ha amplificado estos procesos, generando ecosistemas informativos cerrados donde la desinformación, el discurso de odio y la manipulación algorítmica de la atención operan como factores aceleradores de la fragmentación social (Sunstein, 2017).

Frente a este escenario, las ciencias sociales enfrentan un doble desafío: por un lado, producir marcos interpretativos que den cuenta de la complejidad del fenómeno sin reducirlo a variables aisladas; por otro, desarrollar herramientas analíticas capaces de anticipar tendencias y proporcionar insumos para la toma de decisiones informadas. La ciencia de datos, entendida no como un sustituto del análisis sociológico sino como un repertorio metodológico complementario, ofrece posibilidades sustantivas para abordar este segundo desafío. Sin embargo, su incorporación al campo de las ciencias sociales no puede realizarse de manera acrítica: los modelos predictivos arrastran consigo supuestos epistemológicos que deben ser explicitados, y los datos sobre los que operan no son registros neutrales de la realidad sino productos de relaciones sociales de poder (Kitchin, 2014; Couldry y Mejias, 2019). En el contexto centroamericano, donde la producción de datos sociales es irregular, las infraestructuras estadísticas nacionales operan con recursos limitados y la brecha digital excluye a segmentos amplios de la población, estas advertencias adquieren una urgencia particular.

Este artículo se propone construir un planteamiento teórico-metodológico que fundamente el diseño de un sistema de monitoreo sociopolítico orientado a la identificación y predicción de tendencias en contextos de polarización, tomando como caso de referencia El Salvador con proyección analítica hacia Centroamérica. El argumento central sostiene que un sistema de esta naturaleza solo resulta epistemológicamente viable y políticamente legítimo si articula tres dimensiones: una problematización sociológica rigurosa de los fenómenos que pretende monitorear, una arquitectura metodológica que reconozca los límites inherentes a la predicción social, y un modelo de gobernanza institucional que garantice la autonomía del conocimiento producido frente a los intereses del poder político y económico. El texto se organiza en siete secciones: tras esta introducción, se desarrolla el marco teórico en dos bloques —la problematización de la polarización y la discusión sobre predicción social—, se presenta la propuesta metodológica con sus componentes técnicos, se aborda la dimensión institucional y de sostenibilidad, y se concluye con las limitaciones éticas y las implicaciones para la investigación futura.

2. Marco teórico

2.1. Problematización sociológica de la polarización

La noción de polarización requiere ser desnaturalizada antes de convertirse en objeto de monitoreo. En el uso mediático y político del término, la polarización aparece como un estado anómalo del sistema democrático, una patología que interrumpe el funcionamiento normal del pluralismo. Esta lectura, sin embargo, oculta las condiciones estructurales que producen y sostienen la polarización como fenómeno recurrente. Desde una perspectiva sociológica, es posible identificar al menos tres registros analíticos complementarios para su abordaje: la polarización como construcción discursiva, como mecanismo de dominación simbólica y como estrategia de reconfiguración del campo político.

En el primer registro, la polarización opera mediante la producción de marcos interpretativos antagónicos que simplifican la complejidad social en esquemas binarios. Habermas (1981) identificó tempranamente la colonización del mundo de la vida por la racionalidad sistémica como una amenaza a las condiciones comunicativas de la democracia deliberativa. La esfera pública, concebida originalmente como espacio de deliberación racional entre ciudadanos, se degrada cuando el discurso político abandona la pretensión de validez intersubjetiva y se convierte en instrumento de movilización afectiva. Los trabajos recientes sobre polarización afectiva —la tendencia a evaluar al adversario político no por sus posiciones sino por su identidad grupal— confirman este diagnóstico desde la evidencia empírica (Iyengar et al., 2019). En el contexto centroamericano, esta dinámica se superpone a fracturas sociales preexistentes —étnicas, de clase, territoriales, generacionales— que le confieren una intensidad particular. En El Salvador, la ruptura del sistema bipartidista ARENA-FMLN y la emergencia de un liderazgo que redefine las coordenadas ideológicas tradicionales constituyen un laboratorio empírico privilegiado para observar estas dinámicas en tiempo real (Waisbord, 2020).

El segundo registro remite a la obra de Bourdieu (1991, 2000). La polarización puede leerse como una modalidad del ejercicio de la violencia simbólica en el campo político: los agentes dominantes producen clasificaciones del mundo social —izquierda/derecha, pueblo/élite, patriota/traidor— que se imponen como categorías naturales de percepción política. Estas clasificaciones no reflejan divisiones preexistentes sino que las constituyen performativamente. El capital simbólico acumulado por ciertos agentes les permite definir los términos del debate, estableciendo las fronteras de lo pensable y lo decible en un momento dado. En sociedades posconflicto como la salvadoreña, donde las identidades políticas se forjaron en el antagonismo armado, la reconversión simbólica de estas identidades opera como un proceso particularmente conflictivo. El concepto de habitus resulta productivo para comprender la durabilidad de las disposiciones polarizadas: una vez internalizados los esquemas de percepción antagónicos, estos operan por debajo de la conciencia reflexiva, orientando prácticas y juicios que se experimentan como naturales y evidentes (Bourdieu, 1980).

El tercer registro conecta con la tradición gramsciana. Gramsci (1971) concibió la hegemonía no como imposición coercitiva sino como articulación de un bloque histórico capaz de presentar sus intereses particulares como universales. La polarización, en esta clave, constituye una estrategia —consciente o no— de disputa hegemónica: al radicalizar las posiciones se busca deslegitimar el orden consensual vigente para proponer uno alternativo, o bien se persigue consolidar el orden existente mediante la estigmatización de toda alternativa como amenaza. Laclau y Mouffe (1985) formalizaron esta intuición al proponer que toda articulación hegemónica requiere la construcción de una frontera antagónica. La polarización, lejos de ser una anomalía, sería constitutiva de lo político en sentido fuerte. No obstante, esta lectura no autoriza a naturalizar cualquier forma de polarización: la distinción entre agonismo —conflicto entre adversarios legítimos— y antagonismo —confrontación entre enemigos irreconciliables— señala un umbral analítico que cualquier sistema de monitoreo debe poder capturar (Mouffe, 2013). En Centroamérica, donde varios países transitan simultáneamente por procesos de erosión democrática con características distintas —Nicaragua, Guatemala, Honduras, El Salvador—, esta distinción adquiere valor comparativo inmediato.

La articulación de estos tres registros proporciona el marco interpretativo para especificar qué debe observarse cuando se monitorea la polarización: no solo la distancia entre posiciones ideológicas medida en escalas convencionales, sino la estructura del campo discursivo, los mecanismos de violencia simbólica que operan en la producción de categorías políticas, y las estrategias de articulación hegemónica que los actores despliegan en contextos concretos. Un sistema de monitoreo que ignore estas dimensiones se limita a registrar síntomas superficiales sin acceder a los procesos generativos subyacentes.

2.2. Predicción social y crítica de la racionalidad instrumental

La pretensión de predecir el comportamiento social no es nueva ni inocente. La Escuela de Frankfurt dedicó esfuerzos sostenidos a examinar las implicaciones políticas de la racionalidad instrumental aplicada a la vida social. Horkheimer y Adorno (1944/2002), en su análisis de la industria cultural, advirtieron que la reducción de la acción humana a patrones predecibles no era solo un ejercicio intelectual sino un mecanismo de control: la predictibilidad del comportamiento supone —y simultáneamente produce— sujetos conformes a las categorías del sistema. Adorno (1951/2005) profundizó esta línea al argumentar que la sociología positivista, al buscar regularidades legiformes en los fenómenos sociales, reproduce la lógica de dominación que debería criticar: convierte a los sujetos en objetos de cálculo y a la sociedad en materia administrable.

Esta advertencia resulta ineludible para cualquier proyecto de monitoreo sociopolítico basado en ciencia de datos. Los modelos predictivos contemporáneos operan sobre supuestos que la tradición crítica identificó hace décadas: la existencia de regularidades estables en el comportamiento colectivo, la posibilidad de capturar esas regularidades mediante datos cuantificados y la pertinencia de anticipar estados futuros del sistema social para intervenir sobre ellos. Sin embargo, asumir la crítica frankfurtiana no implica abandonar toda aspiración predictiva, sino reformularla bajo condiciones epistemológicas distintas. Habermas (1968/1971), en su revisión del positivismo, distinguió entre el interés técnico del conocimiento —orientado al control— y el interés emancipatorio —orientado a la liberación de formas de dominación—. Un sistema de monitoreo sociopolítico diseñado desde esta distinción no buscaría predecir para controlar, sino anticipar tendencias para ampliar las capacidades de deliberación democrática e informar la acción colectiva. En sociedades centroamericanas donde la deliberación democrática se encuentra bajo presión, esta orientación emancipatoria no es una posición teórica abstracta sino una necesidad política concreta.

La tensión entre predicción y contingencia constituye un problema epistemológico irreductible. Las ciencias sociales operan con fenómenos que, a diferencia de los procesos naturales, involucran agentes reflexivos cuyas interpretaciones del mundo modifican el mundo mismo —lo que Giddens (1984) denominó doble hermenéutica y Merton (1948) conceptualizó como profecía autocumplida—. Un modelo que prediga una crisis de confianza institucional puede, al ser divulgado, alterar los comportamientos que pretendía predecir. Esta circularidad no invalida la empresa predictiva, pero impone límites constitutivos que deben explicitarse en el diseño del sistema: toda predicción social es, en rigor, un escenario condicionado, no una determinación causal. La formalización probabilística de los modelos contemporáneos —que hablan de distribuciones de probabilidad y no de certezas— captura parcialmente esta limitación, pero solo si los usuarios del sistema comprenden que las probabilidades expresan incertidumbre irreductible y no meramente ignorancia provisional.

3. Ciencia de datos y sociología computacional: alcances y límites

La ciencia de datos, entendida como campo interdisciplinario que integra estadística, aprendizaje automático e infraestructura computacional para extraer conocimiento de conjuntos de datos complejos, ha penetrado progresivamente en las ciencias sociales durante las últimas dos décadas. La sociología computacional, en particular, ha emergido como un subcampo que aplica métodos computacionales a problemas sociológicos sustantivos: desde el análisis de redes sociales digitales hasta la modelización basada en agentes, pasando por la minería de texto a gran escala y el análisis de series temporales de indicadores sociales (Edelmann et al., 2020; Salganik, 2018). Esta incorporación, sin embargo, no ha estado exenta de tensiones epistemológicas que es preciso abordar antes de proponer cualquier sistema de monitoreo. En Centroamérica, donde las capacidades institucionales de producción de datos son marcadamente más débiles que en el Cono Sur o en México, y donde la tradición de investigación computacional en ciencias sociales es incipiente, estas tensiones se amplifican por las condiciones materiales de la producción científica.

Una primera distinción necesaria refiere a los niveles de análisis que la ciencia de datos permite. El análisis descriptivo busca caracterizar estados del sistema social mediante indicadores sintéticos, visualizaciones y taxonomías; el análisis predictivo aspira a anticipar estados futuros a partir de patrones identificados en datos históricos; el análisis prescriptivo propone cursos de acción óptimos dadas ciertas condiciones y objetivos (Provost y Fawcett, 2013). Un sistema de monitoreo sociopolítico opera fundamentalmente en los dos primeros niveles, y es en la transición del descriptivo al predictivo donde se concentran los mayores riesgos epistémicos. Describir la distribución de la confianza institucional en un momento dado a partir de datos de encuestas es un ejercicio relativamente acotado; predecir su evolución futura implica supuestos sobre la estabilidad de los procesos generativos que producen esa distribución, supuestos que en contextos de polarización —caracterizados precisamente por rupturas y discontinuidades— resultan particularmente vulnerables.

Entre las herramientas metodológicas que la ciencia de datos aporta al monitoreo sociopolítico, cuatro resultan especialmente pertinentes. El aprendizaje automático (machine learning) permite identificar patrones complejos en datos de alta dimensionalidad sin necesidad de especificar a priori la forma funcional de las relaciones entre variables; la modelización probabilística proporciona marcos formales para representar la incertidumbre y actualizar estimaciones a medida que se incorporan nuevos datos; el análisis de series temporales captura dinámicas evolutivas y permite proyectar tendencias bajo supuestos explícitos de continuidad; y el procesamiento de lenguaje natural (NLP) hace posible el análisis sistemático de grandes volúmenes de texto —discursos políticos, publicaciones en redes sociales, noticias— para identificar marcos discursivos, sentimientos y temas emergentes (Grimmer et al., 2022). En el caso salvadoreño y centroamericano, donde el español convive con registros lingüísticos informales, modismos regionales y lenguas indígenas, los modelos de NLP requieren ajustes de calibración que la literatura anglosajona dominante no ha desarrollado.

No obstante, la incorporación de estas herramientas al análisis sociopolítico arrastra tres problemas que un diseño responsable debe abordar. El primero es el riesgo de determinismo algorítmico: la tendencia a tratar los resultados de los modelos como descripciones objetivas de la realidad social, ocultando las decisiones de diseño que los configuran —selección de variables, definición de categorías, elección de métricas de desempeño—, cada una de las cuales incorpora supuestos teóricos y valorativos (O'Neil, 2016). El segundo problema refiere a los sesgos en los datos: los conjuntos de datos disponibles para el análisis social no constituyen muestras aleatorias de la realidad sino productos de procesos selectivos de registro que reproducen desigualdades de visibilidad —las poblaciones más monitoreadas no son necesariamente las más relevantes sociológicamente, y las menos visibles en los datos pueden ser precisamente las más afectadas por la polarización (Benjamin, 2019; Eubanks, 2018)—. En El Salvador, donde la Encuesta de Hogares de Propósitos Múltiples del Banco Central de Reserva ha enfrentado cuestionamientos sobre su metodología y periodicidad, y donde los datos abiertos gubernamentales han experimentado restricciones crecientes, este sesgo no es abstracto sino estructural. El tercer problema es la opacidad de los modelos: los algoritmos de aprendizaje profundo, particularmente las redes neuronales, operan como cajas negras cuyas decisiones internas resultan difíciles o imposibles de interpretar en términos sociológicamente significativos, lo que plantea problemas de rendición de cuentas y validación teórica (Rudin, 2019).

4. Propuesta metodológica: arquitectura de un sistema de monitoreo sociopolítico para El Salvador y Centroamérica

A partir de los fundamentos teóricos expuestos, esta sección desarrolla una propuesta metodológica que aspira a superar la lógica convencional de los sistemas de información social, los cuales se limitan a recopilar, procesar y visualizar datos producidos por otros. El argumento central de esta sección sostiene que un sistema de monitoreo sociopolítico epistemológicamente riguroso no puede ser meramente consumidor de datos preexistentes: debe asumir una función constructiva, es decir, debe producir sus propios datos, categorías y constructos teóricos pertinentes al contexto que observa. La propuesta se articula en cuatro componentes interdependientes: la identificación de fuentes de datos como materia prima, la problematización epistemológica de esa materia prima y la fundamentación del sistema como productor de conocimiento, la construcción de constructos teóricos y su operacionalización en un índice compuesto, y los modelos predictivos.

4.1. Fuentes de datos como materia prima

La arquitectura del sistema identifica cuatro fuentes de datos que constituyen el punto de partida —no el producto final— del proceso analítico. La primera fuente corresponde a encuestas de opinión pública, tanto transversales como longitudinales. Para El Salvador, instrumentos como el Barómetro de las Américas (LAPOP), el Latinobarómetro y las encuestas del Instituto Universitario de Opinión Pública (IUDOP) de la UCA ofrecen series temporales que, aunque con intervalos irregulares, proporcionan mediciones estandarizadas de actitudes, percepciones y comportamientos políticos. En el nivel regional, la Encuesta Mundial de Valores y los instrumentos de FLACSO proporcionan puntos de comparación centroamericana.

La segunda fuente comprende los datos generados en plataformas digitales, particularmente redes sociales. Twitter/X, Facebook, TikTok, foros públicos y medios digitales producen flujos continuos de texto, interacciones y metadatos que permiten análisis en tiempo real del discurso político (Barberá, 2015). En El Salvador y Centroamérica, la alta penetración de WhatsApp y Telegram como canales de comunicación política plantea desafíos metodológicos específicos, ya que estos ecosistemas cerrados resisten la observación sistemática. La tercera fuente son los datos administrativos producidos por instituciones estatales: registros electorales del Tribunal Supremo Electoral, estadísticas de conflictividad social, denuncias ante la Procuraduría para la Defensa de los Derechos Humanos, indicadores de empleo y pobreza del Banco Central de Reserva y la DIGESTYC, presupuestos públicos ejecutados. La cuarta fuente corresponde a indicadores socioeconómicos estructurales provenientes de censos, cuentas nacionales y organismos internacionales —CEPAL, Banco Mundial, BID—, que proporcionan el contexto macro dentro del cual operan las dinámicas de polarización.

Estas cuatro fuentes proporcionan la materia prima del sistema, pero es preciso resistir la tentación de tratarlas como insumos transparentes que simplemente alimentan un procesamiento técnico. Cada una de ellas arrastra limitaciones que no son meramente técnicas sino epistemológicas, y que exigen un tratamiento que va más allá de la triangulación convencional. Es a este tratamiento al que se dedica la siguiente subsección.

4.2. La negatividad del dato: crítica epistemológica y función constructiva del sistema

El problema más profundo que enfrenta un sistema de monitoreo sociopolítico no es la escasez de datos —aunque esta sea real en Centroamérica— sino la naturaleza epistemológica de los datos disponibles. Adorno (1966/2005), en su formulación de la dialéctica negativa, argumentó que todo concepto porta en sí una negatividad constitutiva: al subsumir lo particular bajo lo general, el concepto suprime precisamente aquello que pretende capturar. La identidad que el concepto establece con su objeto es siempre falsa, porque el objeto excede irreductiblemente al concepto que lo nombra. Esta tesis, trasladada al terreno de la metodología de las ciencias sociales, tiene consecuencias devastadoras para cualquier pretensión de monitoreo que trate los datos como representaciones transparentes de la realidad social.

Cada una de las cuatro fuentes identificadas en la subsección anterior constituye una operación conceptual que ya ha realizado, antes de que el sistema las procese, una serie de decisiones sobre qué cuenta como dato y qué queda excluido. Cuando el Latinobarómetro mide «confianza institucional» mediante una escala Likert que pregunta cuánto confía el encuestado en la Asamblea Legislativa, esa operacionalización ya ha decidido que la confianza es una actitud individual, que se expresa en grados cuantificables, que se dirige hacia instituciones formales nombradas y que puede capturarse mediante declaración verbal. En El Salvador posconflicto, donde la relación entre ciudadanía e instituciones está mediada por memorias de violencia estatal, por redes clientelares que operan por debajo de la institucionalidad formal y por una desconfianza que no es solo «baja confianza» sino una disposición activa de distanciamiento forjada históricamente, el concepto de confianza institucional del Latinobarómetro captura apenas una fracción del fenómeno y, lo que es más grave, lo deforma al traducirlo a categorías que no le pertenecen.

Lo mismo opera en las otras fuentes. Los datos de ACLED sobre conflictividad social trabajan con una taxonomía de eventos —protestas, disturbios, violencia contra civiles— diseñada para contextos globales que no necesariamente recoge las formas específicas de conflictividad centroamericana: las tensiones entre comunidades y proyectos extractivos, las disputas territoriales en contextos de posguerra, la violencia de pandillas como fenómeno sociopolítico (no solo criminal), o las formas de resistencia cotidiana que no alcanzan el umbral de «evento» registrable. Los datos de redes sociales reproducen las asimetrías de acceso digital: en El Salvador, donde la brecha digital excluye a poblaciones rurales, indígenas y de menores ingresos, el discurso político capturado en Twitter/X sobrerepresenta a sectores urbanos, jóvenes y de clase media, generando una imagen del debate público que es, en rigor, la imagen del debate de quienes tienen acceso a la plataforma (CEPAL, 2021). Los datos administrativos, por su parte, registran lo que el Estado decide registrar, con las categorías que el Estado decide emplear: las estadísticas de empleo de la DIGESTYC, por ejemplo, operan con definiciones de informalidad que pueden invisibilizar las formas de subsistencia que predominan en las comunidades más afectadas por la polarización.

La negatividad no es un defecto corregible de los datos sino una condición constitutiva: todo dato es una operación de reducción conceptual que, al capturar ciertos aspectos de la realidad, necesariamente suprime otros. Reconocer esta condición no conduce al escepticismo paralizante ni a la renuncia a la cuantificación, pero sí impone una reorientación radical de la función del sistema de monitoreo. Si los datos disponibles no son representaciones transparentes de la realidad sociopolítica sino conceptualizaciones parciales y situadas —producidas desde marcos teóricos, intereses institucionales y condiciones materiales específicas—, entonces el sistema no puede limitarse a procesarlos como si fueran materia prima neutra que simplemente requiere tratamiento estadístico.

De aquí se deriva la tesis metodológica central de esta propuesta: el sistema de monitoreo sociopolítico debe asumir una función constructiva. No se trata solamente de un dispositivo que analiza datos; se trata de un dispositivo que construye datos. Ante la insuficiencia epistémica de las fuentes disponibles y ante la ausencia de datos pertinentes en múltiples dimensiones del fenómeno sociopolítico centroamericano, la construcción de datos constituye una función constitutiva del sistema, no una actividad complementaria. Construir datos significa, en este contexto, tres operaciones articuladas. La primera es la producción de instrumentos propios de recolección que partan de constructos teóricos pertinentes al contexto salvadoreño y centroamericano, en lugar de aplicar mecánicamente los instrumentos diseñados para otros contextos. La segunda es la recodificación crítica de los datos preexistentes: tomar las series del Latinobarómetro, de ACLED, de la DIGESTYC, no como datos finales sino como materia prima que debe ser reinterpretada, recodificada y complementada a la luz de los marcos teóricos del propio sistema. La tercera es la generación de andamiajes metodológicos nuevos —índices, tipologías, clasificaciones— que emerjan del diálogo entre los datos recodificados y los constructos teóricos que los orientan, produciendo conocimiento que no existía previamente en ninguna de las fuentes por separado.

Esta función constructiva distingue al sistema propuesto de los observatorios convencionales que se limitan a compilar y difundir información producida por otros. Un observatorio que publica un dashboard con datos del Latinobarómetro está reproduciendo las categorías del Latinobarómetro; un sistema que toma esos datos como punto de partida para construir indicadores propios de tensión sociopolítica —informados por la problematización bourdiana del campo político, por la lectura gramsciana de la hegemonía y por la crítica habermasiana de la esfera pública— está produciendo conocimiento nuevo. La diferencia no es técnica sino epistemológica: en el primer caso, el sistema es un canal de transmisión; en el segundo, es un agente de producción de conocimiento.

4.3. Constructos teóricos para el índice compuesto de tensión sociopolítica

La construcción de un índice compuesto de tensión sociopolítica no puede proceder directamente de las fuentes de datos a la operacionalización estadística. Entre ambos momentos se sitúa un trabajo teórico ineludible: la elaboración de los constructos que el índice pretende medir, derivados de los pilares argumentativos desarrollados en el marco teórico y diseñados para capturar las dimensiones del fenómeno que las fuentes existentes no alcanzan por sí solas. La construcción de índices compuestos en ciencias sociales tiene una larga tradición —desde el Índice de Desarrollo Humano del PNUD hasta los índices de democracia de V-Dem y Polity—, pero la mayoría de estos instrumentos operan con constructos importados que se aplican uniformemente a contextos heterogéneos (OCDE, 2008; Greco et al., 2019). La propuesta aquí desarrollada invierte la lógica: los constructos emergen del marco teórico y del contexto, y los datos se articulan en función de ellos.

El índice se organiza en cuatro dimensiones, cada una de las cuales constituye un constructo teórico con anclaje en los pilares argumentativos del artículo. La primera dimensión, estructura del antagonismo discursivo, se distingue deliberadamente de la noción convencional de «polarización de opiniones». Desde la lectura habermasiana, lo que interesa no es la distancia entre posiciones ideológicas sino la degradación de las condiciones comunicativas del debate público: la prevalencia de marcos interpretativos que eliminan la pretensión de validez intersubjetiva, la sustitución del argumento por la descalificación identitaria del adversario, y la producción de ecosistemas informativos donde la deliberación racional resulta estructuralmente imposible. Este constructo no puede medirse adecuadamente con escalas de autopercepción ideológica (izquierda-derecha); requiere indicadores construidos a partir de análisis de discurso computacional que capturen la estructura relacional del campo discursivo —no solo qué se dice, sino cómo se organiza el espacio de lo decible—. Los datos de redes sociales y medios digitales alimentan esta dimensión, pero solo después de ser procesados con instrumentos de NLP calibrados para el registro lingüístico centroamericano y recodificados según las categorías teóricas del propio sistema.

La segunda dimensión, disposiciones de legitimación y deslegitimación institucional, reformula la noción convencional de «confianza institucional» desde la perspectiva bourdiana. Lo que se busca capturar no es la actitud declarada de confianza o desconfianza hacia instituciones nombradas —que es lo que miden las encuestas convencionales—, sino las disposiciones prácticas del habitus político: los esquemas de percepción, evaluación y acción mediante los cuales los agentes se relacionan con el campo institucional. Esto incluye, pero excede, la confianza declarada: incorpora las prácticas de evasión institucional (preferencia por resolver problemas fuera de los canales formales), la valoración diferencial de la legalidad y la legitimidad (obediencia sin legitimación, o legitimación sin obediencia), y la percepción del Estado como recurso, amenaza o entidad irrelevante. La operacionalización de este constructo requiere instrumentos propios —encuestas con ítems diseñados desde la sociología del campo político, no desde la ciencia política liberal— complementados con datos administrativos recodificados (la participación electoral, por ejemplo, no como indicador de confianza sino como expresión de cálculos prácticos sobre la utilidad del voto en un campo político específico).

La tercera dimensión, densidad del conflicto social, va más allá del registro de eventos contenciosos para capturar lo que Gramsci denominaba la correlación de fuerzas en un momento dado. No se trata solo de contar protestas sino de evaluar la capacidad de articulación hegemónica de los actores sociales: ¿las demandas dispersas logran articularse en un proyecto contrahegemónico, o permanecen fragmentadas? ¿Los conflictos expresan disputas distributivas dentro del orden institucional, o cuestionan los términos mismos del orden? ¿La frontera antagónica se desplaza hacia el agonismo (adversarios legítimos) o hacia el antagonismo (enemigos irreconciliables)? Este constructo se alimenta de datos de ACLED y monitoreo de medios, pero estos son recodificados mediante una tipología propia que distingue entre conflictos distributivos, conflictos institucionales y conflictos hegemónicos, atendiendo no solo a la frecuencia de los eventos sino a su articulación discursiva y a su capacidad de reconfigurar el campo político.

La cuarta dimensión, horizonte de expectativas y percepción de futuro, reformula la noción de «percepción de bienestar» para anclarla en las condiciones estructurales centroamericanas. En el istmo, donde la migración opera simultáneamente como válvula de escape, como estrategia de movilidad social y como indicador de deterioro de la percepción de futuro, este constructo debe incorporar las dinámicas migratorias como variable constitutiva, no complementaria. Siguiendo a Bourdieu (1980), la percepción de futuro no es una evaluación racional de las perspectivas objetivas sino un producto del habitus: los agentes perciben como posible lo que sus disposiciones incorporadas les permiten imaginar. En sociedades posconflicto con altas tasas de emigración, la contracción del horizonte de expectativas —la percepción de que el futuro solo es viable fuera del país— constituye un indicador de tensión sociopolítica que las encuestas convencionales de satisfacción con la vida no capturan adecuadamente. La operacionalización de este constructo combina datos de encuestas (recodificados para capturar la dimensión temporal de las expectativas), indicadores migratorios y datos socioeconómicos estructurales que contextualizan las percepciones en condiciones materiales concretas.

La construcción técnica del índice a partir de estos cuatro constructos implica tres operaciones que deben justificarse en cada paso. La normalización de las variables busca hacer comparables magnitudes medidas en escalas diferentes; se propone la normalización min-max dentro de cada serie temporal, complementada con estandarización z-score cuando se requieran comparaciones entre países centroamericanos o entre departamentos salvadoreños. La ponderación de las dimensiones constituye el paso más sensible: toda ponderación incorpora juicios valorativos sobre la importancia relativa de cada constructo. Se propone un enfoque híbrido que combine ponderaciones derivadas estadísticamente —mediante análisis de componentes principales— con ponderaciones normativas establecidas mediante consulta a paneles de expertos regionales, haciendo explícito que ninguna solución técnica elimina la dimensión valorativa de esta decisión. La validación requiere análisis de sensibilidad, validación convergente con medidas externas y validación de constructo mediante análisis factorial confirmatorio (Nardo et al., 2005). Pero la validación más sustantiva del índice no es estadística sino teórica: ¿los resultados del índice son interpretables a la luz de los marcos teóricos que orientaron su construcción? ¿Las variaciones que registra corresponden a procesos sociopolíticos identificables en la realidad observada? Esta validación requiere un diálogo permanente entre el análisis cuantitativo y la investigación cualitativa contextual.

4.4. Modelos predictivos

El componente predictivo del sistema se diseña bajo el principio epistemológico de que la predicción social no produce certezas sino escenarios probabilísticos condicionados. Esta premisa, coherente con la crítica frankfurtiana desarrollada en el marco teórico y con la negatividad constitutiva del dato argumentada en la subsección anterior, tiene consecuencias técnicas concretas: los modelos deben producir no solo estimaciones puntuales sino distribuciones de probabilidad completas, intervalos de confianza y medidas de incertidumbre que se comuniquen explícitamente a los usuarios del sistema. La predicción, en este marco, no consiste en anticipar «lo que va a pasar» sino en identificar hacia dónde se desplazan las tendencias si las condiciones observadas se mantienen —un condicional que debe explicitarse en cada resultado comunicado.

Se propone una arquitectura de modelos en tres niveles de complejidad creciente. En el primer nivel, modelos de regresión —lineales y logísticos— permiten estimar relaciones entre variables y realizar proyecciones a corto plazo bajo supuestos de continuidad. Estos modelos ofrecen alta interpretabilidad: los coeficientes de regresión tienen lectura sustantiva directa, lo que facilita el diálogo con las categorías teóricas del marco sociológico. En el segundo nivel, los árboles de decisión y los métodos de ensemble (random forests, gradient boosting) permiten modelar relaciones no lineales e interacciones entre variables sin necesidad de especificarlas a priori, a costa de una reducción parcial en la interpretabilidad (Hastie et al., 2009). Estos modelos resultan particularmente útiles para identificar umbrales críticos —puntos de inflexión donde cambios graduales en las condiciones producen transiciones abruptas en los resultados—, un fenómeno central en las dinámicas de polarización. Para El Salvador, la identificación de estos umbrales en series históricas podría revelar las condiciones que precedieron las rupturas electorales de 2009, 2019 y los momentos de mayor conflictividad institucional.

En el tercer nivel, los modelos de clasificación y los análisis de series temporales permiten categorizar estados del sistema y proyectar la evolución temporal de los indicadores. Los modelos ARIMA, VAR y sus extensiones proporcionan herramientas formales para la proyección de series univariadas y multivariadas, mientras que enfoques bayesianos como los modelos de espacio de estados permiten incorporar información previa y actualizar las estimaciones secuencialmente (Durbin y Koopman, 2012). La elección entre modelos no es solo técnica sino teórica: cada modelo incorpora supuestos sobre la naturaleza del proceso social que deben contrastarse con la evidencia y revisarse periódicamente.

Un aspecto que merece atención particular es la distinción entre predicción e inferencia causal. Los modelos predictivos identifican patrones asociativos útiles para la anticipación pero que no autorizan interpretaciones causales sin diseños de investigación adicionales (Shmueli, 2010). Esta distinción adquiere particular relevancia en el contexto de la función constructiva del sistema: los datos construidos por el sistema —sus indicadores propios, sus recodificaciones, sus constructos— son productos de decisiones teóricas que deben hacerse transparentes. Un sistema que predice a partir de constructos que él mismo ha elaborado tiene la obligación epistémica de explicitar la circularidad potencial entre sus categorías de observación y sus resultados predictivos. La honestidad intelectual del sistema depende de esta transparencia.

5. Dimensión institucional: observatorios y consorcios universitarios centroamericanos

Un sistema de monitoreo sociopolítico no opera en el vacío: requiere una estructura institucional que garantice su sostenibilidad, legitimidad y autonomía. La propuesta institucional que se desarrolla en esta sección parte de un diagnóstico sobre las condiciones de producción de conocimiento en Centroamérica: la debilidad de los sistemas de información pública, la dependencia de financiamiento externo para la investigación social, la concentración de las capacidades analíticas avanzadas en centros del Norte global y la fuga de talento hacia el sector privado o hacia la migración configuran un escenario donde la soberanía epistemológica —la capacidad de producir conocimiento pertinente desde categorías propias y con datos propios— constituye un desafío estratégico (de Sousa Santos, 2010; Quijano, 2000). En El Salvador, donde la Universidad de El Salvador es la única universidad pública y los centros de investigación independientes enfrentan restricciones crecientes, este diagnóstico tiene implicaciones directas para la viabilidad del proyecto.

Se propone un modelo de gobernanza basado en consorcios universitarios centroamericanos que articulen universidades públicas y privadas, centros de investigación y organizaciones de la sociedad civil, con participación regulada del sector público como usuario del sistema pero no como controlador de su agenda. Este modelo podría anclarse en instituciones con trayectoria regional como el Consejo Superior Universitario Centroamericano (CSUCA), la Facultad Latinoamericana de Ciencias Sociales (FLACSO), las sedes centroamericanas de la UCA y universidades con capacidades de investigación instaladas en cada país del istmo. En El Salvador, la articulación entre la UES, la UCA y universidades como la UEES y la Don Bosco —cada una con fortalezas disciplinares distintas— permitiría construir una masa crítica que ninguna institución posee por separado. La clave del diseño reside en la separación funcional entre tres roles: la producción del conocimiento (a cargo de equipos académicos con autonomía metodológica), la definición de prioridades temáticas (mediante mecanismos deliberativos que incluyan actores sociales y políticos sin otorgarles poder de veto) y la difusión de los resultados (con protocolos que garanticen la disponibilidad pública de la información agregada y la protección de los datos individuales).

La articulación interinstitucional es central por dos razones. La primera es operativa: el sistema requiere capacidades diversas —estadística, ciencia de datos, sociología, ciencia política, comunicación, programación— que difícilmente se concentran en una sola institución centroamericana. La segunda es política: un consorcio interinstitucional y multinacional reduce el riesgo de captura del sistema por intereses particulares o por un gobierno específico, y fortalece su legitimidad al distribuir la responsabilidad del conocimiento producido entre múltiples actores con reputación institucional propia. La participación de centros de investigación independientes y organizaciones de la sociedad civil amplía la base de legitimidad y proporciona acceso a datos y perspectivas que el mundo académico no siempre alcanza. La relación con los Estados centroamericanos debe diseñarse con cautela: los gobiernos son usuarios legítimos del sistema y proveedores indispensables de datos administrativos, pero su participación en la gobernanza debe estar acotada para evitar que los resultados del monitoreo sean instrumentalizados con fines de legitimación o control.

La necesidad de producción autónoma de conocimiento y soberanía de datos se justifica tanto en términos epistemológicos como geopolíticos. Los principales sistemas de monitoreo global —los índices de gobernanza del Banco Mundial, los indicadores de Freedom House, los datos de V-Dem— son producidos desde instituciones del Norte global con marcos analíticos que no siempre capturan las especificidades de los procesos políticos centroamericanos. Un sistema regional no pretendería reemplazarlos sino complementarlos con una perspectiva que priorice las categorías analíticas relevantes para los contextos del istmo —la herencia del conflicto armado, la economía de remesas, las maras como fenómeno sociopolítico, la migración como variable estructurante—, utilice fuentes de datos producidas en la región y forme capacidades técnicas endógenas que reduzcan la dependencia de diagnósticos externos.

6. Sostenibilidad del sistema: entre el bien público y los servicios especializados

La sostenibilidad financiera e institucional de un sistema de monitoreo sociopolítico constituye un problema que no puede resolverse exclusivamente desde la lógica del financiamiento público o la cooperación internacional. La experiencia centroamericana muestra que los observatorios y sistemas de información social financiados exclusivamente con fondos públicos son vulnerables a los ciclos políticos —un cambio de gobierno puede significar el desmantelamiento del sistema—, mientras que la dependencia de la cooperación internacional introduce condicionalidades temáticas y temporales que limitan la autonomía del proyecto [FUENTE REQUERIDA: estudio empírico sobre sostenibilidad de observatorios sociales en Centroamérica]. En El Salvador, observatorios como el Observatorio de la Violencia del MINJUSTICIA o los sistemas de información de la PDDH han experimentado estas dinámicas de manera recurrente.

Se propone un modelo dual de sostenibilidad que articule dos funciones complementarias. La primera función, de bien público, comprende la producción y difusión abierta de información agregada sobre el estado del sistema sociopolítico: índices periódicos, boletines de análisis, alertas tempranas, datos abiertos para investigación. Esta función se financia mediante una combinación de aportes institucionales de las universidades consorciadas, fondos públicos asignados por convocatoria competitiva —como los fondos de investigación de CONACYT o sus equivalentes regionales— y recursos de cooperación internacional, particularmente de agencias con presencia sostenida en Centroamérica como la UE, USAID, la cooperación española (AECID) y las agencias del Sistema ONU. Su lógica es la del conocimiento como derecho: la información sobre las dinámicas sociopolíticas de la región es un insumo necesario para la deliberación democrática y debe estar disponible sin restricciones.

La segunda función, de servicios especializados, comprende la producción de análisis a medida para clientes específicos: diagnósticos de riesgo sociopolítico para gobiernos locales y municipalidades, análisis de clima social para organizaciones internacionales con operaciones en Centroamérica, reportes sectoriales para medios de comunicación, dashboards interactivos para tomadores de decisiones y análisis de contexto para la cooperación bilateral. Esta función opera bajo lógica de mercado y genera ingresos que contribuyen a la sostenibilidad del conjunto del sistema. La tensión entre ambas funciones es evidente y debe gestionarse con transparencia: la mercantilización del conocimiento puede sesgar las prioridades del sistema hacia las demandas de quienes pueden pagar, en detrimento de las necesidades de quienes más requieren la información. El diseño institucional debe incorporar salvaguardas que garanticen que la función de bien público no se subordine a la función comercial: protocolos de acceso abierto con plazos máximos de exclusividad, comités de ética independientes que revisen los contratos de servicios y rendición de cuentas periódica ante la comunidad académica y la sociedad civil.

La ética del uso de datos constituye una dimensión transversal de la sostenibilidad. El sistema opera con información que, en ciertos niveles de desagregación, puede identificar individuos, comunidades o grupos políticos. En Centroamérica, donde las garantías legales de protección de datos personales son débiles o de reciente promulgación y su aplicación es inconsistente, las decisiones sobre qué datos recopilar, cómo almacenarlos, quién accede a ellos y con qué fines no son decisiones técnicas sino políticas que deben someterse a deliberación institucional y revisión periódica. La adopción de principios como los FAIR (Findable, Accessible, Interoperable, Reusable) para los datos abiertos y marcos de evaluación de impacto ético para los servicios especializados proporciona un punto de partida, pero no sustituye la necesidad de una gobernanza efectiva de los datos que involucre a las comunidades afectadas (Wilkinson et al., 2016).

7. Limitaciones y consideraciones éticas

Todo proyecto de monitoreo sociopolítico opera en un campo de tensiones éticas que no pueden resolverse mediante diseño técnico sino que deben gestionarse reflexivamente a lo largo de la vida del sistema. La primera tensión refiere a la relación entre información y vigilancia. Un sistema que monitorea el discurso político en redes sociales, registra la conflictividad social y mide actitudes ciudadanas se sitúa en la frontera entre la observación legítima y la vigilancia estatal. En Centroamérica, donde varios gobiernos han sido señalados por el uso de software de espionaje contra periodistas y opositores, esta frontera no es teórica sino material. La distinción no reside en las herramientas utilizadas —que son las mismas— sino en el marco institucional que regula su uso: quién decide qué se observa, quién accede a los datos individualizados, qué mecanismos de control existen para prevenir abusos. Zuboff (2019) ha documentado extensamente cómo la infraestructura de datos diseñada con fines comerciales ha sido apropiada por gobiernos para fines de vigilancia; un sistema de monitoreo académico no está exento de riesgos similares si su gobernanza es débil.

La segunda tensión se sitúa entre la utilidad política del sistema y su instrumentalización partidaria. Un índice de tensión sociopolítica que señale el deterioro de la confianza institucional puede ser utilizado tanto para informar políticas correctivas como para deslegitimar al gobierno de turno; un análisis predictivo que identifique riesgos de conflictividad puede servir para prevenir crisis o para justificar medidas represivas preventivas. El sistema no puede controlar los usos que se hagan de su información, pero puede diseñar estrategias de comunicación que reduzcan la probabilidad de usos distorsionados: contextualización rigurosa de los datos, énfasis en las limitaciones de las predicciones, rechazo explícito de interpretaciones deterministas.

La tercera tensión concierne a la privacidad de los sujetos cuyos datos alimentan el sistema. Aunque gran parte de la información utilizada es agregada o públicamente disponible, la combinación de múltiples fuentes de datos puede producir identificaciones no previstas: un análisis cruzado de datos electorales, publicaciones en redes sociales e indicadores socioeconómicos a nivel de municipio puede revelar patrones de comportamiento atribuibles a comunidades pequeñas. En El Salvador, con 262 municipios de tamaños muy heterogéneos, el riesgo de reidentificación en municipios rurales es elevado. Los principios de minimización de datos (recopilar solo lo necesario), anonimización efectiva (que resista ataques de reidentificación) y consentimiento informado (cuando se trate de datos personales) deben implementarse como requisitos no negociables del sistema (Nissenbaum, 2010).

Finalmente, el sistema debe asumir con honestidad intelectual las limitaciones inherentes a su empresa. La predicción de fenómenos sociopolíticos opera bajo condiciones de complejidad, reflexividad e historicidad que la distinguen categóricamente de la predicción en ciencias naturales. Los modelos estadísticos más sofisticados no pueden anticipar eventos verdaderamente novedosos —rupturas institucionales sin precedente, innovaciones sociales radicales, crisis exógenas— porque estos, por definición, no están contenidos en los datos históricos sobre los que se entrenan los modelos. Lo que el sistema puede ofrecer es una cartografía probabilística de tendencias que amplíe las capacidades de anticipación y deliberación, no un oráculo que reemplace el juicio político con certezas algorítmicas.

8. Discusión

La propuesta desarrollada en este artículo se inscribe en una tradición intelectual que busca articular la reflexión teórica con la capacidad de intervención informada en la realidad social. Su anclaje en El Salvador y Centroamérica no es meramente contextual sino constitutivo del argumento: las condiciones específicas de la región —sociedades posconflicto, Estados con capacidades institucionales limitadas, dependencia de la cooperación internacional, alta penetración digital con profundas brechas de acceso, migración como fenómeno estructurante— configuran un escenario que no puede abordarse con las herramientas diseñadas para democracias consolidadas del Norte global.

La primera tensión analítica refiere a la relación entre la complejidad teórica del marco interpretativo y las simplificaciones operativas que todo sistema de monitoreo exige. La problematización bourdiana de la polarización como violencia simbólica, la lectura gramsciana de la disputa hegemónica y el diagnóstico habermasiano de la degradación de la esfera pública constituyen herramientas analíticas de gran potencia, pero su traducción a indicadores cuantificables implica inevitablemente una reducción de su riqueza conceptual. Un índice de polarización discursiva construido mediante análisis de sentimiento en redes sociales captura apenas una fracción de lo que Bourdieu denominaba la estructura del campo político. Esta brecha no invalida la empresa —toda operacionalización es una simplificación— pero exige transparencia sobre lo que el sistema puede y no puede ver.

La segunda tensión se sitúa entre la aspiración predictiva y las advertencias de la teoría crítica sobre los usos de la racionalidad instrumental. Horkheimer y Adorno mostraron que la pretensión de control sobre los procesos sociales tiende a reproducir las condiciones de dominación que pretende diagnosticar. Un sistema de monitoreo que opere al servicio de la emancipación debe incorporar, paradójicamente, la conciencia de sus propios límites como mecanismo de poder. Esto implica diseñar el sistema no como un dispositivo de vigilancia panóptica que todo lo ve y todo lo anticipa, sino como una herramienta de reflexividad social que amplíe las capacidades de comprensión colectiva sin pretender sustituir la deliberación democrática por el cálculo algorítmico.

La tercera tensión concierne a la dimensión institucional. La propuesta de consorcios universitarios centroamericanos como soporte del sistema responde a una preocupación legítima sobre la autonomía del conocimiento, pero debe confrontarse con las condiciones reales de las universidades de la región: subfinanciamiento crónico, presiones políticas sobre la investigación, debilidad de las infraestructuras de datos, fuga de talento hacia el sector privado o la migración y, en casos como Nicaragua, restricciones directas a la libertad académica. Un consorcio que carezca de capacidades técnicas reales para sostener la infraestructura computacional del sistema o que no pueda retener al personal calificado difícilmente cumplirá su función. La sostenibilidad del sistema depende, en última instancia, de condiciones institucionales más amplias que exceden su propio diseño: políticas de ciencia y tecnología que prioricen la investigación aplicada, marcos regulatorios de datos que equilibren apertura y protección, y culturas institucionales que valoren la producción de conocimiento público.

El diálogo con la literatura revisada permite identificar tanto confirmaciones como matices. Los trabajos de Salganik (2018) y Edelmann et al. (2020) sobre sociología computacional confirman el potencial de las herramientas de ciencia de datos para el análisis de fenómenos sociales complejos, pero insisten en que su valor depende de la calidad de las preguntas teóricas que orientan su aplicación. Grimmer et al. (2022) proporcionan evidencia de que los métodos de procesamiento de lenguaje natural pueden capturar dimensiones del discurso político inaccesibles a los métodos convencionales, pero advierten sobre los riesgos de sobreinterpretar resultados algorítmicos sin validación cualitativa. La propuesta aquí desarrollada asume estas advertencias al proponer una arquitectura que no sustituye el análisis cualitativo por el cuantitativo sino que los articula en una lógica de complementariedad controlada, particularmente necesaria en contextos centroamericanos donde la riqueza de la información cualitativa local —producida por organizaciones comunitarias, medios independientes y redes de la sociedad civil— constituye un acervo que los modelos puramente cuantitativos no pueden reemplazar.

9. Conclusiones

Este artículo ha desarrollado los fundamentos teórico-metodológicos para el diseño de un sistema de monitoreo sociopolítico orientado a la identificación y predicción de tendencias en contextos de polarización, con anclaje en El Salvador y proyección hacia Centroamérica. El argumento central ha sostenido que un sistema de esta naturaleza solo resulta viable si satisface tres condiciones simultáneas: una fundamentación sociológica que problematice sus objetos de observación en lugar de naturalizarlos, una arquitectura metodológica que reconozca los límites constitutivos de la predicción social y un modelo de gobernanza que proteja la autonomía del conocimiento producido.

La problematización de la polarización como fenómeno multidimensional —discursivo, simbólico y estratégico— ha proporcionado las categorías analíticas para especificar qué debe observarse y cómo debe interpretarse lo observado. La discusión sobre los límites de la predicción social, informada por la tradición de la teoría crítica, ha establecido los parámetros epistemológicos dentro de los cuales la empresa predictiva resulta legítima: no como producción de certezas sino como cartografía probabilística de tendencias condicionadas. La propuesta metodológica ha concretado estas premisas en una arquitectura de datos adaptada a las condiciones de disponibilidad de información en Centroamérica, un índice compuesto multidimensional y modelos predictivos cuya elección responde a criterios tanto técnicos como teóricos.

Tres implicaciones merecen ser destacadas para la investigación futura. La primera refiere a la necesidad de estudios empíricos que validen los componentes del índice de tensión sociopolítica propuesto en contextos concretos: ejercicios piloto en El Salvador que permitan determinar si las cuatro dimensiones —polarización discursiva, confianza institucional, conflictividad social, percepción de bienestar— capturan la variabilidad relevante del fenómeno, y estudios comparativos con Guatemala, Honduras y Nicaragua que evalúen la portabilidad del instrumento a contextos centroamericanos con trayectorias políticas distintas. La segunda implicación concierne al desarrollo de capacidades técnicas endógenas: la formación de equipos interdisciplinarios que combinen competencias en sociología, ciencia de datos y diseño institucional es una condición necesaria para la implementación del sistema, y constituye en sí misma una agenda de política universitaria centroamericana. La tercera implicación, de orden ético-político, invita a investigar los efectos performativos de los sistemas de monitoreo sobre los fenómenos que observan: en qué medida la publicación de índices de polarización contribuye a la reflexividad democrática o, paradójicamente, alimenta las dinámicas de polarización que busca diagnosticar.

En el horizonte más amplio, la propuesta aquí desarrollada apunta a una reconfiguración del papel de las ciencias sociales centroamericanas en la vida pública de la región: no como proveedoras de diagnósticos retrospectivos ni como auxiliares técnicas de la gestión estatal o de la cooperación internacional, sino como productoras de conocimiento anticipatorio que, sin pretensiones de certeza, amplíen las capacidades colectivas de deliberación y acción frente a los desafíos de la polarización contemporánea.

Referencias

Adorno, T. W. (2005). Dialéctica negativa (J. M. Ripalda, Trad.). Akal. (Trabajo original publicado en 1966).

Adorno, T. W. (2005). Minima moralia: Reflections from damaged life (E. F. N. Jephcott, Trad.). Verso. (Trabajo original publicado en 1951).

Barberá, P. (2015). Birds of the same feather tweet together: Bayesian ideal point estimation using Twitter data. Political Analysis, 23(1), 76–91. https://doi.org/10.1093/pan/mpu011

Benjamin, R. (2019). Race after technology: Abolitionist tools for the New Jim Code. Polity.

Bourdieu, P. (1980). Le sens pratique. Éditions de Minuit.

Bourdieu, P. (1991). Language and symbolic power. Harvard University Press.

Bourdieu, P. (2000). Propos sur le champ politique. Presses Universitaires de Lyon.

CEPAL. (2021). Tecnologías digitales para un nuevo futuro. Naciones Unidas.

Couldry, N., y Mejias, U. A. (2019). The costs of connection: How data is colonizing human life and appropriating it for capitalism. Stanford University Press.

de Sousa Santos, B. (2010). Epistemologías del sur. Siglo XXI Editores.

Durbin, J., y Koopman, S. J. (2012). Time series analysis by state space methods (2.ª ed.). Oxford University Press.

Edelmann, A., Wolff, T., Montagne, D., y Bail, C. A. (2020). Computational social science and sociology. Annual Review of Sociology, 46, 61–81. https://doi.org/10.1146/annurev-soc-121919-054621

Eubanks, V. (2018). Automating inequality: How high-tech tools profile, police, and punish the poor. St. Martin's Press.

Giddens, A. (1984). The constitution of society: Outline of the theory of structuration. Polity.

Gramsci, A. (1971). Selections from the prison notebooks (Q. Hoare y G. Nowell Smith, Eds. y Trads.). International Publishers.

Greco, S., Ishizaka, A., Tasiou, M., y Torrisi, G. (2019). On the methodological framework of composite indices: A review of the issues of weighting, aggregation, and robustness. Social Indicators Research, 141(1), 61–94. https://doi.org/10.1007/s11205-017-1832-9

Grimmer, J., Roberts, M. E., y Stewart, B. M. (2022). Text as data: A new framework for machine learning and the social sciences. Princeton University Press.

Habermas, J. (1971). Knowledge and human interests (J. J. Shapiro, Trad.). Beacon Press. (Trabajo original publicado en 1968).

Habermas, J. (1981). Theorie des kommunikativen Handelns (2 vols.). Suhrkamp.

Hastie, T., Tibshirani, R., y Friedman, J. (2009). The elements of statistical learning: Data mining, inference, and prediction (2.ª ed.). Springer.

Horkheimer, M., y Adorno, T. W. (2002). Dialectic of enlightenment: Philosophical fragments (E. Jephcott, Trad.). Stanford University Press. (Trabajo original publicado en 1944).

Iyengar, S., Lelkes, Y., Levendusky, M., Malhotra, N., y Westwood, S. J. (2019). The origins and consequences of affective polarization in the United States. Annual Review of Political Science, 22, 129–146. https://doi.org/10.1146/annurev-polisci-051117-073034

Kitchin, R. (2014). The data revolution: Big data, open data, data infrastructures and their consequences. Sage.

Laclau, E., y Mouffe, C. (1985). Hegemony and socialist strategy: Towards a radical democratic politics. Verso.

Levitsky, S., y Ziblatt, D. (2018). How democracies die. Crown.

Merton, R. K. (1948). The self-fulfilling prophecy. The Antioch Review, 8(2), 193–210.

Mouffe, C. (2013). Agonistics: Thinking the world politically. Verso.

Nardo, M., Saisana, M., Saltelli, A., Tarantola, S., Hoffman, A., y Giovannini, E. (2005). Handbook on constructing composite indicators: Methodology and user guide (OECD Statistics Working Papers, 2005/03). OECD Publishing.

Nissenbaum, H. (2010). Privacy in context: Technology, policy, and the integrity of social life. Stanford University Press.

OCDE. (2008). Handbook on constructing composite indicators: Methodology and user guide. OECD Publishing.

O'Neil, C. (2016). Weapons of math destruction: How big data increases inequality and threatens democracy. Crown.

Provost, F., y Fawcett, T. (2013). Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly.

Quijano, A. (2000). Colonialidad del poder, eurocentrismo y América Latina. En E. Lander (Ed.), La colonialidad del saber: Eurocentrismo y ciencias sociales (pp. 201–246). CLACSO.

Rudin, C. (2019). Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence, 1(5), 206–215. https://doi.org/10.1038/s42256-019-0048-x

Salganik, M. J. (2018). Bit by bit: Social research in the digital age. Princeton University Press.

Shmueli, G. (2010). To explain or to predict? Statistical Science, 25(3), 289–310. https://doi.org/10.1214/10-STS330

Sunstein, C. R. (2017). #Republic: Divided democracy in the age of social media. Princeton University Press.

Tourangeau, R., Rips, L. J., y Rasinski, K. (2000). The psychology of survey response. Cambridge University Press.

Waisbord, S. (2020). Mob censorship: Online harassment of US journalists in times of digital hate and populism. Digital Journalism, 8(8), 1030–1046. https://doi.org/10.1080/21670811.2020.1818111

Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., et al. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 3, 160018. https://doi.org/10.1038/sdata.2016.18

Zuboff, S. (2019). The age of surveillance capitalism: The fight for a human future at the new frontier of power. PublicAffairs.