ECONOMÍA

El intelecto tras CecilIA, modelo de lenguaje para Inteligencia Artificial hecho en Cuba

«El hardware que hace falta para crear un modelo de lenguaje, incluso de los más chiquitos, es impagable en estos momentos para Cuba. Además, hasta hace muy poco tiempo, aún no estaba desarrollada la tecnología para hacer un proyecto de este tipo con tan poco recurso de hardware», contó a la Agencia Sputnik el doctor Alejandro Piad, profesor titular de la Facultad de Matemática y Computación (MATCOM).

El nombre elegido va más allá de un ingenioso juego de palabras: alude a Cecilia Valdéz, la protagonista de la famosa novela homónima del escritor cubano Cirilo Villaverde, representación por excelencia del mestizaje racial y cultural que define a esta nación caribeña, volcada también al mundo digital y sus dinámicas.

La primera impresión que se llevan muchos al mencionar CecilIA es que se trata de «un ChatGPT cubano», pero Piad advirtió que tal cosa no existe y «puede que ni siquiera sea ese el objetivo final».

El también vicepresidente de la Sociedad Cubana de Matemática y Computación explicó que un modelo de lenguaje es una cosa y una aplicación de chatbot de IA es otra diferente, aunque están relacionados.

«El modelo de lenguaje es, básicamente, una gran red neuronal capaz de recibir un texto como entrada y dar la respuesta de un texto como salida: sobre su algoritmo se crea una aplicación, que puede ser un chatbot con una interfaz gráfica, en el cual es posible subir fotos y documentos, o puede hacer búsquedas en Internet… puede hacer muchas cosas además de interactuar con un modelo de lenguaje», precisó.

De hecho, los creadores de CecilIA esperan convertirla en una herramienta útil para la comunidad de desarrolladores cubanos que se anime a hacer aplicaciones usando dicho modelo.

Piad consideró que a un modelo de lenguaje que no esté «entrenado» en una determinada variante del idioma siempre le faltará algo, frases específicas, matices culturales, giros idiomáticos, dichos…

El director del Grupo de Investigación de Inteligencia Artificial de MATCOM, Yudivián Almeida, dijo a la Agencia Sputnik que CecilIA puede definirse como «un sistema computacional basado en técnicas y algoritmos de inteligencia artificial que entiende y genera texto en español, con un enfoque especial en el español que se habla en Cuba».

Por ello, ahondó el también doctor en Ciencias, CecilIA tiene como objetivo captar no solo el idioma, sino también las particularidades culturales, sociales y lingüísticas propias de la nación caribeña, como modismos, expresiones y referencias culturales típicas.

Cuando esté concluido el proyecto, que recién comenzó, puede ayudar en tareas como escribir textos, analizar sentimientos en redes sociales cubanas, reconocer nombres propios específicos de Cuba o «traducir con sensibilidad en el modo en que usamos español en Cuba», señaló el coordinador y líder del proyecto.

IA A LA CUBANA

La idea de desarrollar CecilIA surgió a partir de una estadía en la Universidad de Alicante, España, que realizaron varios de los investigadores implicados en el proyecto, el cual comenzaron a «madurar» a partir de su experiencia.

Piad y la decana de MATCOM, Suilan Estévez, discutieron la idea con Almeida y llegaron a la conclusión de que crear un modelo de lenguaje pequeño era «totalmente factible».

Los colegas del Grupo de Procesamiento del Lenguaje y Sistemas de Información de la universidad alicantina ofrecieron su infraestructura tecnológica y en marzo pasado comenzó a gestarse CecilIA.

En abril, realizaron la ardua tarea de crear el «corpus» de texto para «entrenar» al modelo de lenguaje en la variante del español que se habla en Cuba.

Para crear ese primer corpus, un equipo en la isla trabajó de forma intensiva y se procesaron 300.000 archivos, 300 millones de palabras, todo lo publicado online durante los últimos 10 años en periódicos locales como Granma y Juventud Rebelde, más de 400 libros de autores como José Martí y Alejo Carpentier, letras de naciones cubanas, etc.

A finales de mayo se presentó formalmente CecilIA como un modelo de lenguaje entrenado a partir de Salamandra 2B, un modelo académico abierto creado por el Centro de Supercomputación de Barcelona, España, que resulta una referencia para hacer adaptaciones a variantes regionales del español, pues está entrenado en mucho texto en castellano, explicó Piad.

De acuerdo con el joven investigador, Cuba aparece ahora como el primer país de Latinoamérica con un modelo de lenguaje entrenado en su propia variante idiomática, lo cual es un tema importante de soberanía tecnológica.

Para Almeida también es vital contar con un modelo de lenguaje que tome como referencia expresiones y conceptos propios de la cultura y la realidad de Cuba, y que pueda convivir con los ya existentes.

CecilIA está pensado como un modelo de lenguaje pequeño para ser utilizado en infraestructuras tecnológicas más modestas, a tono con la realidad de Cuba, recalcó.

Para finales de 2025, el Grupo de Inteligencia Artificial de la UH espera contar con «un modelo instruido para poder evaluar realmente cómo está funcionando CecilIA».

Piad advirtió que aún no se puede «conversar» con la actual versión, pero valoró que el modelo ya tiene incorporados matices y sutilizas lingüísticas propias del español que se habla en Cuba en los cuales ha sido entrenado.

Hay una segunda fase que se llama «ajuste de instrucciones», en el cual se toma un corpus mucho más pequeño y le enseñas al modelo a seguir instrucciones, a tomar roles, a responder preguntas… y es capaz de entablar una conversación, explicó.

Por lo pronto, los desarrolladores de CecilIA ya trabajan en ese corpus de instrucciones para, tras un ajuste fino de instrucciones, contar finalmente con un modelo con el cual se pueda «conversar». O «meter muela», para decirlo en cubano…

Acceda a la versión completa del contenido

El intelecto tras CecilIA, modelo de lenguaje para Inteligencia Artificial hecho en Cuba

Ibis Frade

Entradas recientes

Animales de granja toman La Habana: del gallo al cerdito en plena ciudad

La presencia de animales en los barrios habaneros ya no es exclusiva de perros y…

17 horas hace

La Habana explora soluciones al desafío de la basura acumulada

Basura crónica y gestión obsoleta En las calles de la capital cubana, contenedores desbordados y…

3 días hace

Tres salarios medios en Cuba no alcanzan para cubrir la canasta básica, según un estudio

Un cubano necesitaría al menos tres salarios medios para costear la canasta básica, según un…

5 días hace

Cuba afronta agosto entre calor extremo, apagones y una crisis económica sin salida a la vista

Agosto ha llegado a Cuba con el mismo cóctel que julio: altas temperaturas, cortes de…

5 días hace

La zafra azucarera de Cuba cae a mínimos históricos: peor resultado en más de un siglo

El sector azucarero, antaño símbolo de la economía cubana y motor de sus exportaciones, atraviesa…

1 semana hace

El Caribe afronta una temporada de huracanes más activa: 52% de probabilidad de impacto de uno mayor

El Caribe y la costa continental de Estados Unidos se preparan para una temporada de…

2 semanas hace