Título del Capítulo: «La IA en la gestión documental de los medios de comunicación: innovación, automatización y ética»
Autoría: Fernando Sánchez-Pita; Rafa Ramiro; Belén Puebla-Martínez
Cómo citar este Capítulo: Sánchez-Pita, F.; Ramiro, R.; Puebla-Martínez, B. (2025): «La IA en la gestión documental de los medios de comunicación: innovación, automatización y ética». En Fieiras-Ceide, C.; Túñez-López, M.; Maroto-González, I. (eds.), Bots, Trols y PSM. Cómo la IA va a cambiar los medios públicos. Salamanca: Comunicación Social Ediciones y Publicaciones.
ISBN: 978-84-10176-14-0
d.o.i.: https://doi.org/10.52495/c7.emcs.40.p116
Capítulo 7. La IA en la gestión documental de los medios de comunicación: innovación, automatización y ética
Fernando Sánchez-Pita
Universidad Internacional de La Rioja
Rafa Ramiro
Universidad Rey Juan Carlos
Belén Puebla-Martínez
Universidad Rey Juan Carlos
La documentación desempeña un papel central en el ámbito del periodismo y los medios de comunicación, al constituirse como una disciplina clave para la organización, recuperación y preservación de la información que estos generan. En los entornos periodísticos, las unidades de documentación están presentes a lo largo de todo el ciclo informativo, contribuyendo tanto a la producción de contenidos como a su gestión.1 Su labor asegura la calidad del mensaje periodístico y garantiza la trazabilidad de la información, al tiempo que actúan como garantes de la memoria informativa. La documentación en medios requiere equilibrar rigor técnico con conocimientos específicos. Esto ha posicionado al documentalista como mediador clave entre quienes producen los contenidos y quienes los gestionan.
La evolución tecnológica acompañó a la actualización de los procesos documentales en los medios, aunque según Caldera-Serrano (2025), muchos avances previstos inicialmente, como la automatización total de archivos audiovisuales, no se han implementado aún plenamente. En épocas pasadas, los medios dependían de sistemas de almacenamiento que requerían grandes espacios físicos, con formatos que iban desde las fichas en papel hasta los soportes audiovisuales. Con la irrupción de la digitalización en los años noventa, estos procesos comenzaron a variar, pasando de los microfilmes y los soportes magnéticos a los medios de almacenamiento óptico, como el cd-rom, y, posteriormente, a servidores de almacenamiento remoto. Sin embargo, esta transición también trajo consigo desafíos de gran calado, como el crecimiento exponencial del volumen de contenidos que se generan en la actualidad. Actualmente los profesionales afrontan grandes volúmenes de información en múltiples formatos, como textos, vídeos o imágenes, lo que pone a prueba los sistemas tradicionales de documentación. Esta complejidad favoreció que desde los medios se diera paso a tecnologías novedosas, entre las que destaca sobremanera la inteligencia artificial (IA), que ha permitido revisar tareas específicas de documentación, como la clasificación automática o la recuperación inteligente de información, impactando todo el ecosistema mediático (Bazán-Gil, 2023). La gestión documental de medios mediante IA aún está en desarrollo académico, pero ya existen investigaciones destacadas como la de Bazán-Gil (2023), que analiza aplicaciones concretas de IA en archivos audiovisuales internacionales, que ofrece una panorámica internacional sobre el uso de la IA orientada a los archivos de televisión, las organizaciones preservadoras del patrimonio audiovisual, y agencias de prensa; o la de Sánchez-García et al. (2023), que entre sus objetivos plantea la elaboración del primer catálogo de recursos basados en IA para la documentación, producción y distribución de la información hechos en España.
Como señala Chan-Olmsted (2019), la IA se ha convertido en un recurso clave para los medios de comunicación, influyendo directamente en fases específicas como la producción, gestión y distribución de contenidos. Tecnologías como el procesamiento del lenguaje natural, el reconocimiento de voz o los sistemas de recomendación modifican de forma sustancial los flujos de trabajo e incluso vienen a redefinir el rol del documentalista dentro del contexto mediático. El uso de herramientas basadas en IA permite ir más allá de la ya establecida automatización de tareas, abriendo nuevas posibilidades en el análisis y la reutilización de grandes volúmenes de documentación. No obstante, estos procesos generan controversias. Como advierten Colavizza et al. (2021), la automatización en la gestión de los sistemas documentales de los medios obliga a reflexionar sobre el equilibrio que debiera darse entre, por una parte, la búsqueda de la eficiencia técnica y, por otra, la atención de valores de carácter fundamental como la integridad, la representatividad de los contenidos, la transparencia de los propios sistemas y la protección de los datos, sin llegar a olvidar la confianza que los medios deben generar en sus audiencias.
La documentación en los medios de comunicación se centra en la gestión de sistemas documentales, con especial atención sobre las tareas de organización y recuperación. Estas funciones desempeñadas por los documentalistas tradicionalmente recurren a técnicas propias de la documentación, así como de la archivística y, durante gran parte del siglo XX, se llevaron a cabo mediante herramientas analógicas con el apoyo de recursos mecánicos. En los años noventa, la automatización y la digitalización impulsaron cambios que culminaron en lo que López-García y Vizoso (2021) denominan periodismo hi-tech. Fue entonces cuando los medios de comunicación emprendieron actualizaciones que también supusieron cambios para la gestión de sus fondos documentales, incorporando sistemas digitales que evolucionaron al ritmo del desarrollo tecnológico. En este contexto, el documentalista se mantuvo como una figura central en el proceso documental-informativo dado su papel mediador (García-Gutiérrez; Martínez-Ávila, 2014).
La consolidación de Internet a comienzos del siglo XXI modificó radicalmente las prácticas documentales en los medios, multiplicando los formatos y acelerando el ritmo de producción informativa. La aparición de los medios digitales, las redes sociales y las plataformas de distribución masiva de contenidos favoreció el crecimiento exponencial de contenidos que, consecuentemente, llegó acompañado de nuevas necesidades en el ámbito documental. Así, aparecieron nuevos retos para las unidades de documentación, que se vieron desbordadas ante el volumen y la variedad de datos, así como a la velocidad que estos se generan. En la tercera década del siglo XXI, la accesibilidad creciente a herramientas basadas en IA produjo un cambio significativo en cómo se abordan las tareas documentales en los medios. Mientras la automatización se limitaba a tareas repetitivas, la IA permite a los sistemas documentales clasificar automáticamente contenidos, identificar personas en vídeos o imágenes, extraer entidades clave en textos, e incluso tomar decisiones como etiquetar, recomendar o priorizar contenidos específicos. Esta etapa supone un salto cualitativo en el ámbito de la documentación en medios, ya que permite abordar el análisis y la clasificación de grandes volúmenes de información. Como señala Bazán-Gil (2023), la IA interviene en la producción de contenidos y está adquiriendo un papel protagonista en todo el ciclo de la gestión documental, como por ejemplo en acciones de recuperación e identificación, con aplicaciones en el reconocimiento de rostros y voces, pudiendo identificar locutores, los idiomas que estos hablan e incluso características del habla. Esta transformación impacta directamente en el rol del documentalista, que ha pasado de realizar tareas manuales a utilizar tecnologías avanzadas en su trabajo cotidiano. Ya en las dos primeras décadas del siglo XXI se discutía la necesidad de adaptar este perfil profesional a entornos híbridos (Green; Grupta, 2019), y hoy, con la IA en escena, esta reflexión adquiere una nueva dimensión.
El impacto de la IA en los contextos periodísticos también ha favorecido la aparición de iniciativas de colaboración entre medios de comunicación y empresas del sector tecnológico, así como universidades y centros de investigación. A través de proyectos han surgido herramientas y plataformas que han impulsado la integración de la IA en los procesos de documentación de los medios. No obstante, persisten desafíos relevantes como los sesgos en algoritmos de recomendación, la dificultad para gestionar datos heterogéneos (textos, audios, vídeos en distintos formatos), o la transparencia en cómo se selecciona y prioriza automáticamente el contenido. A pesar de ello, las posibilidades que ofrece la IA para el tratamiento masivo de contenidos son prometedoras. Se abre la puerta a modelos dinámicos para el archivado, donde los registros, además de conservarse, pueden ser transformados y resignificados en función de su uso, así como de criterios definidos por los responsables de los sistemas.
Como se ha venido señalando, el desarrollo e implementación de tecnologías basadas en la IA impulsa cambios de gran calado en las unidades de documentación y en los propios medios donde estas se integran. Esta evolución ha generado conceptos nuevos en torno al uso de algoritmos y aprendizaje automático en medios, gestión documental y archivos, planteando soluciones tecnológicas avanzadas para estas áreas. Estos términos buscan ofrecer una base conceptual sólida para nuevas formas de gestionar y acceder a contenidos periodísticos. En el contexto de unidades de documentación de los medios comienzan a proliferar herramientas basadas en IA para el procesamiento del lenguaje natural, los procesos de identificación, o la creación de sistema de recomendación, requiriendo todos ellos de entrenamiento y supervisión por parte de profesionales.
El procesamiento del lenguaje natural es una de las áreas más avanzadas dentro de la IA aplicada a la documentación periodística, permitiendo etiquetar automáticamente noticias, extraer entidades clave (personas, lugares, eventos) y generar resúmenes breves a partir del análisis de contenidos. En buena medida, esto incide en los textos referenciales con los que se trabaja en las unidades de documentación, que se basan en datos extraídos de los documentos y que tradicionalmente elaboraban los documentalistas de un modo manual. Estos textos referenciales, tradicionalmente elaborados manualmente por documentalistas mediante lecturas selectivas, ahora pueden generarse automáticamente mediante herramientas de IA que extraen los aspectos clave del contenido original (García-Gutiérrez; Martínez-Ávila, 2014). En España destaca la herramienta Gabriele, desarrollada por la empresa Narrativa, que utiliza IA para crear contenidos periodísticos a partir de datos estructurados, facilitando además el etiquetado automático y la clasificación semántica del material generado (Sánchez-García et al., 2023).
Otro subcampo de la IA con avances notables, y que ya era objeto de interés hace casi una década (Armstrong, 2016), es el análisis automatizado de contenidos visuales, especialmente aquello orientado al reconocimiento facial o a la detección de objetos. A nivel europeo, destaca el proyecto Trombinos, desarrollado por el Institut National de l’Audiovisuel2 (INA) en Francia, donde se han entrenado modelos para identificar a miles de figuras públicas, utilizando para ello contenidos provenientes de documentación de archivo.3 También en el ámbito de los medios audiovisuales, la herramienta INA Speech Segmenter, junto con Vocapia, permiten el tratamiento de piezas sonoras para su segmentación y transcripción respectivamente, facilitando así el desarrollo de análisis basados en texto. Estas soluciones están siendo adoptadas por empresas de medios públicos como France Télévisions o RTVE; en el caso de RTVE, estas tecnologías se han aplicado a la gestión del archivo sonoro de Radio Nacional de España, permitiendo transcripciones automáticas, clasificación de contenidos e identificación de entidades.
Por otra parte, los sistemas de recomendación también han cobrado protagonismo. Sistemas como Subscription Accelerator Content o Konstellation utilizan aprendizaje automático para segmentar usuarios y personalizar el acceso documental según sus patrones previos de búsqueda y consumo.
El uso de herramientas basadas en IA ha permitido mejoras significativas en la gestión de los sistemas de información de los medios, mejorando la eficacia del conjunto de las de tareas documentales. Sin embargo, su impacto va más allá de la eficiencia técnica: la IA se ha integrado en las dinámicas cotidianas de las redacciones periodísticas y de las unidades de documentación, convirtiéndose en un elemento clave, tanto para la producción como para la explotación de contenidos. Ahora bien, junto a estas oportunidades emergen desafíos. Más allá de los dilemas éticos que habitualmente se asocian al uso de algoritmos, como la opacidad, los sesgos o la discriminación, también surgen interrogantes con relación a la dependencia tecnológica. Muchos de estos sistemas requieren infraestructuras externas y servicios de terceros, lo que plantea dudas sobre la autonomía tecnológica y la sostenibilidad a largo plazo.
La incorporación de herramientas basadas en IA en los procesos de documentación y archivo de los medios de comunicación, tal y como se ha esbozado en el apartado anterior, conlleva variaciones que van mucho más allá de las ventajas técnicas más evidentes. Este cambio exige abordar dilemas éticos concretos, como la transparencia en las decisiones algorítmicas o la reproducción y amplificación de sesgos culturales en la documentación automatizada. Uno de los puntos de mayor preocupación gira en torno a la reproducción de sesgos por parte de los algoritmos. A menudo se asume, de forma errónea, que las herramientas basadas en IA son neutras, pero su desempeño depende de los datos con los que han sido entrenadas, así como de las decisiones que toman los equipos humanos que las diseñan. De este modo, por ejemplo, si los algoritmos se entrenan con bases de datos periodísticas predominantemente occidentales, podrían subrepresentar o excluir información relevante de regiones periféricas o colectivos minoritarios. En el contexto de los medios, esto puede afectar de manera crítica a los principios éticos y profesionales que rigen su labor. Un ejemplo de estas implicaciones particularmente ilustrativo es la escasa presencia de minorías étnicas o regiones periféricas en los datos utilizados para entrenar a los modelos de IA (García-Ull; Melero-Lázaro, 2023). Esto puede derivar en la invisibilidad de ciertos contenidos que no se alinean con los patrones dominantes, con consecuencias negativas para la pluralidad informativa y para la preservación de la memoria colectiva. Tal situación, en el contexto de sistemas documentales de los medios, compromete la representatividad de los conjuntos documentales, y también limita el acceso a miradas diversas y necesarias para favorecer la comprensión integral de la realidad. Este riesgo se agrava en herramientas como los sistemas de recomendación de contenidos, adoptados de forma amplia en las plataformas digitales de acceso a contenidos. Así, puede suceder que los algoritmos prioricen la visibilidad de ciertos contenidos en función de criterios de relevancia que, aunque efectivos desde la lógica del consumo, pueden llegar a entrar en conflicto con requerimientos profesionales. Así, a modo de ejemplo, una hemeroteca que debiera ofrecer acceso equitativo a sus contenidos podría convertirse en un espacio que no actúe de tal modo y que esté regido por decisiones opacas.
Otro desafío clave es la falta de transparencia de las herramientas basadas en IA. Estos sistemas suelen carecer de transparencia, impidiendo que los profesionales comprendan plenamente cómo toman decisiones específicas relacionadas con clasificación o recomendación. Desde el prisma de la documentación, esta opacidad puede llegar a representar un obstáculo para la trazabilidad de las acciones y dificulta la posibilidad de auditar procesos. Como señalan Jaillant y Caputo (2022), se debe avanzar hacia modelos de IA más comprensibles y transparentes, capaces de justificar sus decisiones, sobre todo en procesos que afectan al patrimonio cultural y a datos sensibles.
Estos planteamientos han llevado al desarrollo de iniciativas orientadas a establecer marcos normativos y éticos. Organizaciones como AI4LAM y la EBU han promovido iniciativas específicas, como estándares para auditar algoritmos y prácticas obligatorias de transparencia en la documentación de contenidos. También cabe destacar el papel de los medios, como la BBC, que ha explorado a través de distintos proyectos las potencialidades de la IA. En septiembre de 2018, el canal BBC Four utilizó IA durante dos días para seleccionar automáticamente documentales históricos y reportajes adaptados a los intereses específicos de su audiencia. En este contexto, se entiende como esencial que los medios de comunicación, especialmente aquellos con mayores responsabilidades documentales, eduquen sobre el manejo de la IA a sus profesionales, así como a sus audiencias (Túñez et al., 2021), y que adopten políticas claras que alineen el uso de la IA con los valores fundamentales del periodismo.
Otra cuestión relevante en el debate es la dependencia que tiene el entrenamiento de los modelos de IA con respecto a grandes volúmenes de datos y a su disponibilidad. En el caso de los medios de comunicación, estos datos pueden extraerse de sistemas internos con los que se lleva a cabo la gestión documental. En este marco, además, se debe tener en cuenta el uso de datos personales o confidenciales, lo cual plantea un reto adicional, e incide de forma especial allí donde la documentación nace en entornos digitales, como correos electrónicos, formularios, mensajería instantánea, etc. Frente a estos y otros dilemas, la necesidad de supervisión es ineludible; se trata de aplicar soluciones tecnológicas sofisticadas y de construir marcos y normas sólidas que garanticen un uso ético de la IA. Para ello, la elaboración de guías de buenas prácticas, códigos de conducta y mecanismos de auditoría se presenta como un paso firme en esta dirección.
En definitiva, la integración de la IA en los procesos de documentación y archivo abre un escenario ambivalente. Por una parte, promete eficiencia, agilidad y nuevas formas de acceder y analizar la información. Por otro, plantea retos de calado ético, legal y profesional que deben abordarse de forma crítica y con una visión a largo plazo. La tecnología, por sí sola, no garantiza la equidad ni la justicia; son las decisiones humanas, los marcos regulatorios y los valores institucionales los que pueden orientar su desarrollo hacia fines socialmente valiosos. Para lograrlo es clave mantener la colaboración entre los distintos profesionales de la información, así como con aquellos perfiles más técnicos. En este sentido, se entiende que solo desde un enfoque interdisciplinar, en el que participen diferentes áreas de trabajo, será posible construir sistemas que, además de funcionar correctamente, también sean justos.
El impacto de la IA en los sistemas documentales de los medios ya no se encuentra en el campo de futuro: se trata de una realidad vigente que está reconfigurando las dinámicas de producción, archivo y acceso a los contenidos. La velocidad con la que emergen las herramientas, el volumen descomunal de contenidos que se generan a diario, y la complejidad creciente en la que se envuelven los medios conforman un escenario volátil en cambio permanente —en línea con las tesis de Bauman (2000)—, en el que la IA está llamada a desempeñar un papel central.
La IA generativa permite aplicaciones prácticas claras, como formular preguntas concretas sobre archivos periodísticos históricos, generar resúmenes personalizados y mantener diálogos interactivos con periodistas que exploren contenidos documentales. Esta expansión abre un abanico de posibilidades para todos los profesionales que trabajan con la información, pero también plantea interrogantes en cuanto a la creación y reutilización de contenidos debido a cuestiones éticas inherentes a los propios procesos de creación. También es particularmente prometedor el uso de IA para la gestión de fondos documentales históricos. La aplicación de IA en investigación histórica permitiría identificar automáticamente relaciones temáticas o evoluciones discursivas en amplios fondos hemerográficos, revelando patrones ocultos como cambios en el tratamiento informativo de eventos políticos o sociales. Así, mediante técnicas de aprendizaje profundo, la IA permitiría escudriñar los documentos y sus contenidos para desarrollar análisis que, de otro modo, difícilmente podrían llegar a tener lugar. Para ello, las herramientas basadas en IA tendrán que ser capaces de identificar y operar sobre esta documentación, para así alcanzar niveles de descripción suficientes con los que garantizar su recuperación y análisis posterior. Algunas redacciones de gran tamaño, como la del The New York Times, ya aplican tecnologías de este tipo sobre sus fondos, desarrollando modelos que facilitan el análisis de documentos con el objetivo de reconstruir narrativas históricas.
También se están perfeccionando los sistemas de reconocimiento de patrones, lo que permite mejorar la visibilidad y exploración de archivos, especialmente tras los procesos de digitalización de colecciones analógicas o en soportes digitales obsoletos. La automatización que ofrece la IA agiliza estos procesos, y los enriquece mediante la generación automática de metadatos. Otra aplicación concreta es la integración de IA con blockchain para garantizar la autenticidad documental, registrando automáticamente quién accede, modifica o consulta documentos sensibles en medios digitales. De este modo, la tecnología permite establecer cadenas de bloques que registran cada interacción que se realiza sobre los fondos, lo cual cobra especial relevancia en contextos donde distintos profesionales con perfiles diferenciados acuden a los mismos documentos y los manipulan de forma recurrente.
A la par de estas innovaciones, se consolida una generación de interfaces de acceso enriquecidas con recursos como los asistentes conversacionales o los sistemas de recomendación, que vienen a transformar la manera en que los profesionales y la ciudadanía acceden a los contenidos. Estas herramientas, basadas en principios de diseño centrado en el usuario y accesibilidad universal, sirven para democratizar el acceso, y también abren la posibilidad de redefinir los modelos de gobernanza documental; en lugar de mantener estructuras cerradas y centralizadas, se vislumbra la opción de plantear sistemas colaborativos donde medios de comunicación, universidades, bibliotecas y otras instituciones afines puedan compartir datos y recursos gracias a la interoperabilidad.
No obstante, todo ello tiene por delante el reto de acomodarse con las condiciones regulatorias y de carácter político del momento, que es donde se enmarcará el uso de la IA. Así, el futuro de estas tecnologías no dependerá exclusivamente de su desarrollo técnico, sino que también estará marcado por las normativas que rijan su implementación y por las decisiones políticas que determinen su alcance. Además, medios pequeños o locales podrían quedarse rezagados por limitaciones presupuestarias o geográficas, dificultando su acceso a tecnologías avanzadas como IA generativa o plataformas de almacenamiento en la nube. Tal y como señala Bazán-Gil (2023), se pueden identificar experiencias relevantes en medios de peso, pero el uso de la IA todavía no está tan extendido en los medios como se pudiera suponer. En esta línea, Túñez et al. (2021) señalan que la incidencia de la IA será mayor en aquellos medios que trabajan sobre temáticas basadas en datos estructurados más que en eventos del ámbito local, debido esto a la necesidad de disponer de grandes volúmenes de datos para el entrenamiento de los modelos. Ante este panorama, es necesario promover políticas que impulsen el acceso equitativo a tecnologías de carácter abierto, así como a planes de formación para los profesionales.
En este nuevo ecosistema, el documentalista deberá adquirir nuevas competencias específicas como supervisar algoritmos, validar resultados generados por IA, y definir criterios éticos claros para el tratamiento automatizado de información sensible. Su labor se amplía y exige nuevas competencias, de carácter técnico y ético, en un equilibrio que combina el valor del criterio humano con el potencial de las herramientas. La IA, por tanto, llega para reconfigurar los sistemas documentales de los medios desde el punto de vista tecnológico, pero también interpela a los fundamentos epistemológicos sobre los que se sustenta la actividad de todos los profesionales que trabajan con la información. Así, la documentación se encuentra en un momento clave: debe integrar estas herramientas de forma crítica, consciente y con visión estratégica, con el fin de asegurar la eficiencia operativa, así como la calidad y la confianza en los propios medios.
La irrupción de la IA ha reformulado los procesos de trabajo de los periodistas y los documentalistas de los medios de comunicación, tanto en la dimensión técnica como en sus implicaciones éticas. Esta tecnología ha introducido dinámicas novedosas en la producción y en la distribución de contenidos, y también ha reforzado el papel de la documentación y el de sus profesionales, al entenderse como garantes de la memoria de los medios.
La IA se incorpora y se desarrolla en un contexto de generación masiva de contenidos, donde la velocidad de circulación y la diversidad de formatos dificultan el tratamiento tradicional. Así, los sistemas basados en la IA se presentan como soluciones capaces de asumir tareas hasta ahora manuales o semiautomatizadas, al tiempo que la eficiencia que aportan los algoritmos convive con los riesgos asociados a la opacidad de los sistemas, la reproducción de sesgos, o la descontextualización de los contenidos. Para ello, es recomendable que los medios desarrollen auditorías externas periódicas de sus sistemas automáticos, establezcan mecanismos internos de supervisión, y capaciten continuamente a sus profesionales sobre las implicaciones éticas del uso de estas tecnologías.
De cara al futuro, todo apunta a que la evolución impulsada por la IA será cada vez mayor, pero no uniforme. Se prevé la consolidación de equipos interdisciplinares en los que especialistas de distintas áreas colaboren en el diseño, supervisión y validación de los sistemas. Esto no supone una pérdida de protagonismo del profesional de la documentación, sino una reconfiguración de su rol hacia perfiles híbridos, capaces de integrar saberes tradicionales propios de la disciplina con nuevas competencias tecnológicas. El verdadero alcance de los cambios dependerá en gran medida de la voluntad de los medios y de su compromiso con una implementación ética y responsable. Para lograrlo, resulta imprescindible que promuevan activamente la formación interdisciplinar, generando espacios donde documentalistas, periodistas y tecnólogos colaboren estrechamente en la adaptación crítica y estratégica de la IA.
7.