¿La ciencia de datos nos puede ayudar a saber quién va a ganar las elecciones 2024?

Lun, 22 Abr 2024
Especialistas de la IBERO desarrollaron un algoritmo que analiza los comentarios que hacen las y los usuarios respecto de las personas candidatas a la presidencia
Un equipo de investigación de la IBERO pretende aplicar este programa para los siguientes dos debates, así como el día de la elección

Con los avances tecnológicos que estamos viviendo, surgen nuevas herramientas como la ciencia de datos, que nos pueden ayudar a facilitarnos tareas que antes requerían mayor esfuerzo. Por ejemplo, ahora que estamos en pleno período de elecciones 2024, nos puede apoyar para conocer la tendencia del voto, indicó el Dr. Mauricio Flores Gerónimo, Académico de tiempo completo en la Coordinación de Ingeniería en Ciencia de Datos en la Universidad Iberoamericana (IBERO) Ciudad de México.

El investigador contó en entrevista que, con este objetivo, se formó un equipo con especialistas en lingüística, politología y ciencia de datos, quienes desarrollaron un algoritmo capaz de analizar los comentarios que se hacen respecto de las y los candidatos en las redes sociales.

Inicialmente consideramos sacar los datos de la red social X, antes Twitter, pero desde que cambiaron algunas reglas en donde tienes que pagar para poder descargar información, optamos por comenzar con YouTube”. Recordó que fue en las elecciones presidenciales de 2018 cuando aplicaron por primera vez este programa, así como en las del año pasado en el Estado de México, con el objetivo de analizar el proceso y los resultados obtenidos de esas jornadas electorales para que en las de 2024 el algoritmo funcionara de mejor manera.

Explicó que antes del primer debate presidencial de este 2024 aplicaron el programa en YouTube para analizar las opiniones que pusieron las y los usuarios sobre las personas candidatas a la presidencia y así dar un primer pronóstico, el cual presentaron ante el Congreso de Ciencia Política Midwest Political Science Association (MPSA), en Chicago, donde especialistas en el tema les ayudaron para mejorar el proceso.

“Presentamos los resultados del algoritmo para evidenciar que hacemos trabajo de ciencia de datos y política en la IBERO. Además, nos ofrecieron retroalimentación de cómo poder mejorar, asimismo nos preguntaron de dónde sacamos los datos, qué lenguaje de programación usamos y qué herramientas aplicamos”.

Imagen: La gráfica de la izquierda se hizo antes del primer debate, dando un resultado de 77% de preferencia para Claudia Sheinbaum y un 23% para Xóchitl Gálvez. La gráfica de la derecha se hizo posterior al debate, y dio procentajes muy cercanos al pronóstico, con un 79% para la candidata de la Coalición Sigamos Haciendo Historia, mientras que para la candidata de la Coalición Fuerza y Corazón por México dio 21%.

 

“Este es el resultado del algoritmo que nosotros codificamos y programamos. Tenemos un equipo de lingüistas que analizan todos los textos, esas estructuras gramaticales me las pasan a mí, yo las codifico en un lenguaje de programación y obtenemos este resultado”, explicó el investigador.

Ya para el primer debate, explicó que a través de la aplicación API de YouTube descargaron en texto todos los comentarios que se realizaron respecto de las candidatas, para posteriormente aplicarle el algoritmo que crearon y saber de qué manera las personas se referían a ellas.

Tras el primer debate, algunas de las palabras con las que más asociaron a Claudia Sheinbaum son: presidenta, viva, plan c, voto masivo, morena, entre otras.

Mientras que para Xóchitl Gálvez son: futura presidenta, PRI, corrupta, vergüenza, mentiras, etc.

 

“Queremos trabajar dos cosas principales, una es la tendencia y otra es la precisión. Ahorita lo que llevamos bien es la primera, es decir, por ejemplo, ahorita Claudia es la que se percibe como ganadora, mientras que la precisión es que estos resultados coincidan con los de las encuestas o los resultados del Instituto Nacional Electoral (INE).

Respecto de los debates que faltan, adelantó que para el segundo seguirán la misma metodología, pero para el tercero y el día de las elecciones ya integrarán los datos de X. “Ya para estos dos eventos logramos obtener el apoyo del Instituto de Investigación Aplicada y Tecnología (InIAT) de la IBERO, que nos ayudará a financiar el pago para obtener los datos de esta red social: Tenemos la hipótesis de que cuando tengamos una mayor cantidad de datos va a mejorar en precisión”.

Por último, agradeció a la IBERO y a su colega, el Dr. Ulises Cruz Valencia, por ayudar a destacar cómo la universidad está haciendo trabajo de investigación en este tipo de ámbitos, sumando un esfuerzo multidisciplinario, donde expertas y expertos de diferentes carreras pueden ayudar a este cometido.

Texto: Alberto Elihú Cortés Hernández

Notas relacionadas: 

 

 

Las opiniones y puntos de vista vertidos en este comunicado son de exclusiva responsabilidad de quienes los emiten
y no representan necesariamente el pensamiento ni la línea editorial de la Universidad Iberoamericana.

Para mayor información sobre este comunicado llamar a los teléfonos: (55) 59 50 40 00, Ext. 7594, 7759
Comunicación Institucional de la Universidad Iberoamericana Ciudad de México
Prol. Paseo de la Reforma 880, edificio F, 1er piso, Col. Lomas de Santa Fe, C.P. 01219