Friday, May 13, 2022

Treinta años de ADMYTE

El Archivo Digital de Manuscritos y Textos Españoles ha cumplido treinta años. Publicado originalmente en CD-ROM, sigue a disposición de los investigadores, en línea, por suscripción, en el portal de la empresa que participó al 50% en su creación, Micronet S.A.  https://www.admyte.com/admyteonline/home.htm. El disco 0 (que se publicó en segundo lugar) contenía programas, transcripciones del Hispanic Seminary of Medieval Studies de la universidad de Madison, Wisconsin y bases de datos, el disco 1 incunables de la Biblioteca Nacional de España, con imágenes y transcripciones completas de todos los textos, más programas específicos y bases de datos filológicas. Era la primera vez, para cualquier lengua, que se ofrecían digitalmente textos completos, con imágenes de todas sus páginas, transcripciones completas y un programa de recuperación que era capaz de asociar el texto buscado con la página e imagen correspondiente. Constituyó, por ello, una gran innovación y tuvo una muy buena acogida. ADMYTE introdujo muchas novedades; pero las dos básicas, iniciales, fueron su producción y venta en CD-ROM y su uso en el sistema Windows, entonces en la versión 3.0. Habrá que recordar que un PC tenía entonces una memoria máxima de 4 Mb y que la novedad en pantalla era una VGA, que permitía pasar de la pantalla tradicional de escritura verde sobre negro, a la presentación en color. A partir de las 612 K era preciso definir instrucciones para la memoria complementaria, para superar el límite inicial del sistema operativo MS-DOS. Es oportuno explicar todo esto, a fin de entender cuán necesaria era la cooperación entre filólogos e informáticos y que los filólogos comprendieran bien la parte digital, para poder explicar a su contraparte ingenieril lo que había que desarrollar. Era mucho más exigente y, a juicio de este crítico, mucho más divertido de lo que puede ser hoy manejar interfaces de programas de mucha mayor capacidad y menor exigencia informática para el usuario.

FMM y CBF (2016)
ADMYTE fue posible gracias a la amistad iniciada en 1986, en el Congreso de la Asociación Internacional de Hispanistas, en Berlín, entre Charles B. Faulhaber, de la Universidad de California, Berkeley, y este autor, entonces en la Universidad Autónoma de Madrid. En el otoño de 1990 se encontraba Charles Faulhaber en Madrid, en una estancia relacionada con las investigaciones para la creación de la base de datos de textos antiguos BOOST, de construcción digital y originariamente publicada en papel, que se estaba reorganizando en tres sectores: catalanes BITECA, castellanos BETA y gallego portugueses BITAGAP. El profesor Faulhaber propuso visitar a Carlos Wert en la Sociedad Estatal para el desarrollo de programas del Quinto Centenario y pedir el apoyo de esa institución. En los preparativos y en la visita tomó cuerpo la idea de desarrollar un Archivo Digital de Manuscritos y Textos Españoles, ADMYTE, en un soporte entonces nuevo, CD-ROM. Originariamente se trataba de hacer un disco con imágenes completas de incunables de la BN de España, transcripciones según el sistema de codificación de Madison, el Hispanic Seminary of Medieval Studies,  HSMS, con participación de un equipo dirigido por Ángel Gómez Moreno, más las bases de datos de textos antiguos, el programa de ediciones unificadas UNITE y una versión de un programa de recuperación de información textual, TACT, de la Universidad de Toronto, adaptado a la codificación del HSMS. Era la primera vez en la historia, para cualquier lengua, que se desarrollaba un archivo digital de texto e imagen de textos completos. Los retos eran múltiples, porque toda la parte tecnológica informática era nueva. Por fortuna, Micronet, propiedad entonces de Gerardo Meiro, aceptó el 50% de la gestión económica y del desarrollo informático y se publicó un disco I, con los incunables, sus imágenes, su transcripción y el sistema de recuperación y un disco 0 con programas y el conjunto de los textos del HSMS transcriptos hasta entonces y alguno nuevo. Carlos Wert me ofreció dirigir el área de Industrias de la Lengua de la Sociedad Estatal, lo que facilitó mucho la dirección científica y su coordinación con los trámites administrativos, con la eficaz ayuda de Aurora Martín de Santaolalla. Todo ello permitió llevar a cabo también otras muchas actividades. Así se pudieron realizar. entre otros proyectos, los corpus de Argentina (con Verónica Zumárraga) y Chile (con Ernesto Evans) o el corpus oral centro-peninsular (dirigido por mí en la U.A.M.), además de tres años de la Escuela de Verano de Industrias de la Lengua en colaboración con la Fundación Duques de Soria, con la ayuda técnica del ingeniero Antonio Fernández Martínez y el apoyo en hardware y comunicaciones de IBM y Telefónica.

Técnicamente, ADMYTE innovó técnicas de tratamiento de imágenes fotográficas analógicas y digitales. El sistema había sido iniciado por la NASA en los años setenta y aplicado a estudios de ciencias biológicas y astronomía especialmente. En las Humanidades el paso a imágenes digitalizadas desde celuloide se utilizaba en Historia del Arte. En 1990 el costo de una máquina digital de cierta fiabilidad, no superior a un buen teléfono inteligente actual, se cifraba en unos treinta mil dólares. Para ADMYTE se utilizó inicialmente el sistema analógico, con una película reversible de color en formato 24 x 36, de grano ultrafino, que da una resolución muy superior a la capacidad de digitalización del momento. Para la digitalización se recurrió a escáneres de diapositivas con una resolución de 4096 puntos por pulgada, 3850 x 5800 puntos en cada diapositiva, capaces de diferenciar 16.777.216 colores (24 bit por punto, 8 por cada color RGB). Resumiendo, cada página ocupa 16,75 Mb. Esto ha permitido almacenar estas imágenes y que sigan siendo aceptables muchos años después. De este modo se pudieron realizar procesos de corrección del color y corrección de imagen sin pérdidas apreciables de la calidad. La BNE dispuso desde entonces de una base de datos de incunables con imágenes de alta resolución. Para almacenar estas imágenes fue preciso desarrollar nuevos algoritmos de compresión de imágenes en color, basados en procesos matemáticos que utilizan la transformada rápida de Fourier. Gracias a ello cada imagen se pudo reducir de 16,75 Mb a unos 800 Kb, lo que permitía proyectarlas en pantalla, con la tecnología disponible en 1992. Téngase en cuenta que, para el tratamiento posterior, en el proceso previo a la edición del CD-ROM, las imágenes se guardaban en discos ópticos WORM de 940Mb, en los que se almacenaban 1100 imágenes por disco. Al tratarse de incunables, es decir, de impresos anteriores a 1501, la mayor parte de las imágenes son en blanco y negro. Para el tratamiento de las imágenes en color se desarrollaron procedimientos especiales. 

Además de la información textual, ADMYTE incluía programas complementarios y la nueva versión, mejorada, de las bases de datos de BOOST, Bibliography Of Old Spanish Texts. Dos de los programas complementarios eran externos, UNITE y TACT. El primero era la última versión de una serie de programas para la edición crítica electrónica que se había aplicado en la edición unificada del Libro de Alexandre. En esa edición se unificó por primera vez digitalmente un texto completo conservado en diversdas variantes, con todas las fases de la collatio, la comparación entre manuscritos y la información para la recensio, es decir, los datos que el crítico necesita para editar críticamente (https://www.cervantesvirtual.com/obra-visor/libro-de-alexandre--0/html/.) El segundo era el sistema de recuperación textual de la Universidad de Toronto, que incluía una ampliación, una novedad muy útil para la filología española: entre los sistemas de codificación textual reconocidos se incluía el del HSMS, lo que permite trabajar con los textos de Madison y los incunables de la BNE incluidos en ADMYTE. 

Hoy día estamos tan acostumbrados a trabajar con versiones digitales y tantas bibliotecas ofrecen buena parte de sus catálogos en formato digital, que es difícil darse cuenta de lo que ADMYTE supuso hace treinta años. No existía nada ni siquiera parecido. Tampoco existía la web. Hace ya muchos años que MICRONET ofrece ADMYTE en la red; pero los obstáculos para llegar a ello fueron numerosos, empezando por la resistencia de las bibliotecas a poner sus fondos a disposición de todo el público, por temor a la pérdida del control. Ha hecho falta crear toda una legislación de protección de datos y derechos para llegar al estado actual. También pueden recordarse algunos de esos obstáculos. Hoy lo hacemos con humor; pero en su momento hubo que convencer a los políticos de turno de que sus asesores se equivocaban cuando decían que el CD-ROM era un medio que nunca podría triunfar, por su precio, o que Windows era un sistema operativo que "como todo el mundo sabía", no tenía ningún futuro. Dios nos guarde siempre de los falsos profetas.

Los cuatro filólogos que estuvimos en el desarrollo de ADMYTE, Charles B. Faulhaber, de la Universidad de California en Berkeley, John Nitti, del HSMS de la de Madison, Wisconsin, Ángel Gómez Moreno, de la Complutense y yo mismo, de la Autónoma de Madrid y la Sociedad Estatal, coincidiríamos en que, después de treinta años, la necesidad que motivó ADMYTE es la que se ha adaptado perfectamente a las exigencias y posibilidades digitales actuales. ADMYTE se desarrolló a partir de la idea de ampliar y mejorar BOOST, la Bibliografía de textos españoles antiguos. Hoy día las lenguas romances ibéricas cuentan con PhiloBiblon, en la Universidad de California, Berkeley, https://bancroft.berkeley.edu/philobiblon/, con la colaboración de dos universidades españolas, Pompeu Fabra y Barcelona y la Fundación Ignacio de Larramendi, además de investigadores de universidades de todo el mundo. A BETA, BITAGAP y BITECA se ha añadido BIPA, la Bibliografía de la Poesía Áurea. El objetivo inicial, por tanto, se ha cumplido y superado ampliamente. 


ADMYTE(R) y UNITE(R) son marcas registradas propiedad de Francisco Marcos Marín.