El machine learning aplicado a la cerámica arqueológica: IberianGAN e IberianVoxel

Recuerdo cuando estudiábamos cerámicas en la universidad. El proceso del dibujo cerámico, su posterior digitalización y por último, usar las guías de cerámica para identificar la tipología. Para cuando transité la facultad ya existían trabajos estadísticos en donde se utilizaban clústeres para poder desentrañar las derivaciones de los diseños cerámicos así como las influencias de las diferentes culturas. Trabajos como los de Contreras Cortés (1984) nos acercaban a esta colaboración entre el estudio cerámico y las técnicas estadísticas. Desde entonces han pasado ya cuarenta años y la pregunta obligada es, ¿cuánto hemos avanzado en los métodos para clasificar cerámica desde la década de los 80? En este trabajo vamos a continuar con la línea de artículos anteriores donde destacábamos trabajos que reflejan cómo la inteligencia artificial está ayudando a las humanidades digitales a responder a viejas preguntas y generar nuevas. Por ello, si en el primer artículo profundizamos en los conceptos introductorios para poder diferenciar entre inteligencia artificial (IA), Machine Learning (ML) y deep learning (DL) (Luengo, 2023) y posteriormente hemos abordado la aplicación de algoritmos, como el algoritmo Ithaca en el material epigráfico (Luengo, 2024), en esta ocasión nos centraremos en la cerámica ibérica con los algoritmos denominados IberianGAn e IberianVoxel.

Empecemos por el primero, ¿qué es exactamente IberianGAn y a qué debe su nombre?

De forma concisa, IberianGAN es un modelo de aprendizaje profundo que utiliza Redes Generativas Antagónicas (GAN) para reconstruir perfiles de cerámica ibérica a partir de fragmentos. Y obviamente de ahí su nombre: «Iberian» porque está especializado en cerámica ibérica y «GAN» porque usa Generative Adversarial Networks. Vayamos un paso más allá, ¿qué entendemos por cerámica ibérica y qué por un GAN?

La cerámica ibérica se refiere a la cerámica creada por la cultura ibérica, un conjunto de pueblos que habitaron principalmente en el sur y el este de la península, incluyendo la región del valle alto del río Guadalquivir (Navarro et al., 2022, p. 3).

Por otro lado, las Redes Generativas Antagónicas (GANs) son un tipo de modelo de aprendizaje profundo que puede generar nuevos datos similares a los datos con los que se entrenó. Se puede entender su funcionamiento utilizando la analogía del falsificador y el policía. En esta analogía el falsificador (codificador) busca crear copias de objetos, como perfiles de cerámica ibérica en este caso, tan convincentes que puedan pasar como auténticas (esquema mostrado en la figura 1). Por su parte, el policía (decodificador) se encarga de analizar los objetos y determinar si son reales o falsificaciones (Gunasekaran, 2023).

Figura 1. Resumen del enfoque propuesto: (A) Arquitectura de IberianGAN, donde el generador G(x) utiliza una estructura de codificador-decodificador que recibe un fragmento y genera el fragmento faltante; el discriminador D(x) recibe el perfil completo para determinar si es real o falso. (B) Criterios de partición del perfil en borde y base. (C) Ejemplos de muestras generadas por IberianGAN a partir de fragmentos para formas abiertas y cerradas (en color claro). (D) Análisis de semi-puntos de referencia y valores de RMSE comparando muestras reales y generadas. Fuente: Navarro et al., 2022, fig 1.. Licencia: CC BY 4.0

Pero esto nos lleva a la siguiente pregunta, ¿por qué querríamos usar un modelo generativo que sea capaz de crear o más bien, inventar, piezas cerámicas aparentemente fieles a las existentes? ¿Cómo ayuda eso a la identificación de la cerámica ibérica que encontramos en los yacimientos arqueológicos?

La razón principal radica en la posibilidad de reconstruir virtualmente piezas fragmentadas y extraer información valiosa de la pieza original. Así pues, las GANs contribuyen de diferentes maneras en este aspecto:

Por un lado, completando la información faltante: en los yacimientos arqueológicos, la mayoría de las cerámicas se encuentran fragmentadas, lo que dificulta su análisis. Las GANs, como IberianGAN (Navarro et al., 2022) e IberianVoxel (Navarro et al., 2023), entrenadas con una base de datos extensa de perfiles completos y fragmentos de cerámica ibérica, pueden generar las partes faltantes de un perfil basándose en la información del fragmento disponible. Esto permite a los arqueólogos visualizar la pieza completa, aunque no se haya encontrado íntegra. Esta reconstrucción ayuda al análisis morfológico, que es crucial. La forma de una pieza cerámica ofrece información sobre su función, la época a la que pertenece e incluso su región de origen. La reconstrucción virtual de la pieza permite analizar sus características morfológicas y compararlas con las de otras cerámicas, facilitando su identificación. Por ejemplo, IberianGAN ha sido evaluado mediante análisis morfométricos, confirmando su capacidad para generar fragmentos con formas realistas (Navarro et al., 2022, p. 4). Con todo ello, ayudamos a definir mejor el estilo ibérico. Los modelos generativos, entrenados con ejemplos de cerámica ibérica, aprenden las características que definen este estilo particular. Al generar nuevas piezas, estas características se mantienen, lo que permite a los arqueólogos determinar si un fragmento pertenece a este estilo. Finalmente,,, este modelo permitiría la creación de una base de datos virtual más amplia. Las GANs pueden generar miles de perfiles de cerámica virtual, creando una base de datos mucho más extensa que la de los perfiles reales. Probablemente este sea uno de los factores más importantes a nuestro entender, como ya comentamos de forma paralela en el artículo sobre las reconstrucciones epigráficas (Luengo, 2024). Como consecuencia, esta base de datos virtual puede utilizarse para buscar fragmentos coincidentes, analizar la variabilidad de formas y decoraciones, e identificar patrones que podrían pasar desapercibidos con un conjunto de datos limitado.

Pero no podemos simplemente aceptar que las reconstrucciones realizadas por el modelo son válidas o que sus deducciones son factibles, necesitamos verificar, cuantificar y en definitiva confirmar (con mayor o menor precisión) la confianza en los datos y conclusiones generados. Así pues, ¿cómo podemos llegar a evaluar las reconstrucciones generadas por la GAN para indicar su calidad? Para ello los investigadores han hecho uso de diferentes métricas incluyendo la distancia de inicio de Frechet (FID), la raíz del error cuadrático medio (RMSE) en el análisis de semi-hitos, la evaluación cualitativa por parte de expertos arqueólogos, entre otros (Navarro et al., 2022, p. 4). Estas métricas ayudan a determinar la similitud entre las cerámicas generadas y las reales, tanto en términos de forma general como de estilo ibérico específico y ayudan a acotar el grado de certeza en las conclusiones obtenidas.

A todo esto, creo que es importante resaltar que se han usado únicamente752 imágenes para entrenar IberianGAN. Y si lo destacamos es porque si con un número tan limitado de perfiles cerámicos es posible abordar el entrenamiento de un modelo como IberianGAN con semejantes resultados, es evidente que los descubrimientos que puede arrojarnos el machine learning aplicado a la arqueología es inmenso si pudiéramos aumentar las bases de datos. Es además de agradecer que el equipo que lideró estos estudios haya compartido el dataset del que se nutre el modelo así como el código en Github y los modelos necesarios no sólo para contrastarlo sino para, ya dentro del mundo Open source, poder avanzar y mejorar contribuyendo a la investigación.

Pero si hablamos de IberianGAN no podemos evitar hablar de IberianVoxel. Si bien IberianGAN utiliza en todo momento imágenes en 2D, IberianVoxel se atreve con el mundo tridimensional. Así pues, si el primero trata de recrear los perfiles bidimensionales el segundo intenta recrear todo el volumen tridimensional. ¿Usando el mismo diseño de modelo? Mayormente sí. Aunque ambos modelos utilizan una arquitectura de codificador-decodificador, la implementación específica de esta arquitectura difiere. IberianGAN utiliza una GAN con un codificador que procesa una imagen de entrada (el fragmento) y un decodificador que genera el fragmento faltante. IberianVoxel, por otro lado, utiliza una 3D AE-GAN, donde el codificador procesa una matriz de vóxeles de 32x32x32 y el decodificador genera una matriz de vóxeles similar que representa la cerámica completa. Con respecto a los datos utilizados para el entrenamiento tienen cierta semejanza. En este caso, IberianVoxel utilizó 1001 muestras voxelizadas (Navarro et al., 2023, p. 5834). Las métricas para la evaluación del modelo fueron principalmente el índice de Sorensen-Dice y el ECM (Error Cuadrático Medio), entre otras.

Figura 2. Validación de formas: en naranja, perfil generado con borde real; en azul, perfil ibérico completo; en rosa, k vecinos más cercanos del fragmento real (sin incluir el borde de entrada); dr es la distancia entre el borde real y el generado, dg es la distancia mínima entre el fragmento generado y sus k vecinos en el espacio morfométrico de bordes. Fuente: Navarro et al., 2022, fig 2.. Licencia: CC BY 4.0

Todo lo tratado, como vemos, está enfocado en la cerámica ibérica. Procede la pregunta de, y más allá de esta tipología cerámica, ¿existen trabajos al respecto? La respuesta es un contundente sí. Existen multitud de trabajos, y cada día más, que a raíz de estos puntos de partida tratan de aplicar las utilidades del machine learning a diferentes conjuntos cerámicos. Tenemos ejemplos con la cerámica china de la cultura Miaozigou (Pang et al., 2024) o las ánforas lusitanas de época romana (Santos et al., 2024), entre muchísimos otros ejemplos.

La conclusión principal de este texto es que la inteligencia artificial y, en particular, las Redes Generativas Antagónicas (GANs) están teniendo un impacto significativo en el campo de la arqueología, especialmente en la reconstrucción de artefactos fragmentados, como la cerámica ibérica. Modelos como IberianGAN y IberianVoxel demuestran que es posible no sólo recrear perfiles bidimensionales de cerámica, sino también reconstruir objetos tridimensionales a partir de fragmentos. Todo parece indicar que la bibliografía se inundará en poco tiempo de muchos trabajos en donde se apliquen estas técnicas a los diferentes conjuntos cerámicos. Ojalá poco a poco esos conjuntos se vayan compartiendo y podamos contar con un corpus digital cerámico lo más amplio y accesible posible que facilite la investigación y permita análisis más ambiciosos.

Bibliografía

Cintas, C., Lucena, M., Fuertes, J. M., Delrieux, C., Navarro, P., González-José, R., & Molinos, M. (2020). Automatic feature extraction and classification of Iberian ceramics based on deep convolutional networks. Journal of Cultural Heritage, 41, 106-112. https://doi.org/10.1016/j.culher.2019.06.005

Contreras Cortés, F. (1984). Clasificación y tipología en arqueología. El camino hacia la cuantificación. Cuadernos de Prehistoria y Arqueología de la Universidad de Granada, 9, 327–385. https://doi.org/10.30827/cpag.v9i0.1240

Gunasekaran, A. (2023). Generative Adversarial Networks: A Brief History and Overview. Journal of Student Research, 12(1). https://doi.org/10.47611/jsr.v12i1.1848

Luengo Gutiérrez, F. J. (2023). Inteligencia Artificial (IA) en la arqueología. ArqueoTimes. Recuperado de https://arqueotimes.es/inteligencia-artificial-ia-en-la-arqueologia/

Luengo Gutiérrez, F. J. (2024). El algoritmo Ithaca de DeepMind al servicio de la arqueología. ArqueoTimes. Recuperado de https://arqueotimes.es/el-algoritmo-ithaca-deepmind-al-servicio-de-la-arqueologia/

Navarro, P., Cintas, C., Lucena, M., Fuertes, J. M., Segura, R., Delrieux, C., & González-José, R. (2022). Reconstruction of Iberian ceramic potteries using generative adversarial networks. Scientific reports, 12(1), 10644. https://doi.org/10.1038/s41598-022-14910-7

Navarro, P., Cintas, C., Lucena, M., Fuertes, J. M., Rueda, A., Segura, R., Ogayar-Anguita, C., González-José, R., & Delrieux, C. (2023). IberianVoxel: Automatic completion of Iberian ceramics for cultural heritage studies. En Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence (pp. 5833-5841). International Joint Conferences on Artificial Intelligence Organization (IJCAI). https://doi.org/10.24963/ijcai.2023/647

Pang, H., Qi, X., Xiao, C., Xu, Z., Ding, G., Chang, Y., Yang, X., & Duan, T. (2024). Pottery evolution pattern discovery based on deep learning: case study of Miaozigou culture in China. Herit Sci 12, 352. https://doi.org/10.1186/s40494-024-01468-y

Santos, J., Nunes, D. A. P., Padnevych, R., Quaresma, J. C., Lopes, M., Gil, J., … Casimiro, T. M. (2024). Automatic ceramic identification using machine learning. Lusitanian amphorae and Faience. Two Portuguese case studies. STAR: Science & Technology of Archaeological Research, 10(1). https://doi.org/10.1080/20548923.2024.2343214

Francisco Javier Luengo Gutiérrez

Director en ArqueoTimes. Licenciado en Historia por la Universidad de Sevilla. Máster de Arqueología en la Universidad de Sevilla y posteriormente Máster de Arqueología del Cuaternario y Evolución Humana en la Universitat Rovira i Virgili de Tarragona y en el Musée National d’Histoire Naturelle de París. Máster en Big Data y Data Science por la UNED en 2022. Su línea de investigación se ha ligado a las últimas tecnologías de documentación fotogramétrica, recreación histórica tridimensional, análisis estadístico y simulación multifísica.
Ver todas las entradas

Entradas recientes

Entrevista a Edward Cecil Harris

El machine learning aplicado a la cerámica arqueológica: IberianGAN e IberianVoxel

El algoritmo Ithaca. DeepMind al servicio de la Arqueología

Las Cañadas Reales en España: Aproximación (I)

El mosaico onírico: Un análisis intercultural de la interpretación de los sueños (I)