Monday, December 4, 2023

Puntos de partida para analizar los inicios del español

En octubre de 2023 presenté mi segunda tesis doctoral, en el programa de Ciencias de las Religiones de la Universidad Complutense, Pueblos, lenguas y cambio cultural en el Mediterráneo Occidental de los siglos V al X. Se publicó en Valencia, por Ultreia, el libro Dominio y lenguas en el Mediterráneo Occidental hasta los inicios del español. Con ello traté de dar respuesta a una serie de preguntas que me habían quedado desde la presentación de mi primera tesis doctoral, también en la Universidad Complutense, en 1969, en aquella ocasión en el área de Filología Románica y publicada como Poesía narrativa árabe y épica hispánica por editorial Gredos. Podría valer como indicación de la continuidad de la investigación el hecho de que ambas tesis fueron dirigidas por arabistas, ambos miembros de la Real Academia de la Historia; la primera por Elías Terés Sádaba, la segunda por María Jesús Viguera Molíns. Estos años también me han permitido ampliar notablemente mi formación en arqueología, en Tejas con el magisterio de Carolyn Boyd y el grupo de Shumla y en Jerusalén con el apoyo del Instituto Español Bíblico y Arqueológico y de Polis. Me han convencido también, sobre todo, de que la necesidad de aprender lleva siempre a nuevas simas de desconocimiento y, de nuevo, hacia arriba, no como Sísifo, sino como los maestros que nos enseñan el camino.

Tuve ocasión de ofrecer en este cuaderno de bitácora una descripción del contenido del libro Dominio y lenguas, por lo que no volveré sobre ella (Francisco A Marcos-Marín: July 2023 (fmarcosmarin.blogspot.com). Como mi investigación no ha terminado, me ha parecido oportuno recoger en este mismo marco de referencia un resumen de los puntos que, de momento, parecen suficientemente consolidados y que sirven de partida para continuar el estudio sobre los inicios del español.

Esta enumeración resultará excesivamente sucinta a quien no lea Dominio y lenguas y puede que en ese caso resulte menos útil. En cambio, confío en que sirva de guía para la reflexión de quienes conozcan ese libro. Por supuesto, lo que se enuncia como “bases” requiere el uso de la bibliografía incluida en esa obra y es más amplio de lo que aquí se resume.

1.     Estrato anatólico a través de Cerdeña de la población del Norte de Iberia en el fin de la Edad del Bronce. Inmediatamente después la cultura celta se constituye como la principal cultura indoeuropea en Iberia y se amplía con la formación de la cultura celtíbera.

BASES: Investigación propia apoyada en DNA, Arsuaga, Martín Almagro Gorbea.

2.     A partir del 200 a.J.C. se incrementa el contacto entre bereber y latín en el Norte de África. La influencia del latín es muy superior a lo que se pensaba tradicionalmente y hay que tener en cuenta propuestas propias para la explicación de la sustitución posterior de préstamos latinos o griegos por árabes.

BASES: Bibliografía sobre el bereber que amplía y corrige los escritos tradicionales de Schuhardt y Wagner. Investigación propia, con la adaptación al español y su inclusión en una amplia tabla comparativa de español, bereber, latín y romances italianos.

3.     La cristianización de Hispania se produjo sobre todo desde África.

BASES; Historia de la iglesia española, investigación propia sobre santos africanos en Hispania y lugares de culto.

4.     La lengua fenicio-púnica perduró en el N. de África hasta el siglo V J.C.

BASES: Investigación propia apoyada en testimonios de San Agustín, De Vita, Historia de la Iglesia Norteafricana.

5.     A finales del siglo V los hablantes de euskera se desplazan desde la Aquitania francesa, ocupan el territorio céltico de los vascones y toman el nombre de éstos.

BASES: Lingüística: Michelena, para la división dialectal, Abaitua y Unzueta, González Ollé. Histórica: crónicas visigóticas y textos literarios que pueden reinterpretarse. Bio-Arqueológica: excavaciones de tumbas de guerreros euskéricos, DNA, Arsuaga: “No es que los vascos tengamos un gen que los demás no tienen, es que no tenemos un gen que tienen otros pueblos del área”.

6.     La lengua latina (incluyo los posteriores romances afrorrománicos e iberorrománicos), además de en Hispania, se instala y se mantiene en el Norte de África, desde la Africa Prouincia hasta la Mauretania Tingitana (parte de la diocesis Hispaniae de Diocleciano), es lengua de la administración, el comercio, la epigrafía, la literatura y amplias zonas geográficas bilingües hasta el Atlas. El bilingüismo con el bereber está activo en el siglo VIII y se mantiene en algunos lugares hasta los siglos XI y XII.

BASES: Actas de la iglesia vándala, estudios bizantinos, literatura latina, patrística, tesis de Villanueva para Mauritania, epigrafía, noticias de geógrafos árabes.

7.     Los bereberes norteafricanos conformaron la mayor parte de los movimientos humanos que acompañaron la conquista de Hispania y la formación de Alandalús. Estos bereberes hablaban bereber y romance afrorrománico y la mayoría no hablaba árabe. Las hablas afrorrománicas estuvieron activas en la península ibérica al menos hasta el último tercio del siglo VIII y deben tenerse en cuenta para estudiar la formación de los romances ibéricos, especialmente el andalusí y para los estudios antroponímicos y toponímicos.

BASES: La investigación propia se apoya en arqueología, toponimia, Oliver Asín, Zozaya, María Jesús Viguera e historiadores en número creciente.

8.     A principios del siglo VIII la construcción del islam como religión se encontraba en estado incipiente, recién terminada la edición del Alcorán por los Omeyas. La construcción del Islam como institución, realizada sobre todo por los abbasíes, apenas había comenzado. El proceso de arabización, islamización y orientalización de Alandalús fue un proceso lento y gradual, que sólo toma forma a finales del siglo VIII con el emirato omeya y no se consolida hasta el X con el califato omeya.

BASES: La investigación propia se apoya en la numismática (Ariza Armada, Tawfiq Ibrahim), textos cristianos en árabe y latín (investigación propia en la Biblioteca Apostólica Vaticana apoyada en D’Ottone Rambach y Monferrer), economía (Chalmeta), historiadores (Viguera, Fierro, Manzano, González Ferrín, entre muchos), léxico (Simonet, Asín, Corriente, Ferrando).

9.     En la primera mitad del siglo VIII los bereberes, hablantes bilingües de afrorrománico, llegan a Pancorbo y son contenidos por los vascones euskerizados. No pueden ir hacia el Este, dominado por los hispano-andalusíes Beni Qasi (hijos de Casio) y se extienden hacia el oeste, al norte del Duero.

BASES: investigación propia sobre el terreno, para precisar datos de arqueología, arquitectura y toponimia.

10.  En la zona alta del Ebro, entre la Bureba y la Rioja, entran en contacto afrorrománico, iberorrománico y vascorrománico y se inicia el romance castellano, con variantes dialectales tan diferenciadas como la riojana, la soriana y la burgalesa.

BASES: modificaciones de conclusiones de la Filología tradicional por investigación propia sobre el terreno con apoyos en Oliver Asín y Alarcos Llorach.

11.  Parece oportuno ampliar los datos sobre el romance andalusí teniendo en cuenta la presencia del afrorrománico en su etapa inicial. También hay que tener en cuenta que el romance andalusí, mal llamado mozárabe, pervivió hasta el siglo XII y el árabe andalusí hasta el XV-XVI y que en esos siglos necesariamente pasaron por procesos de cambio.

BASES: Las investigaciones propias se apoyan en autores tradicionales como González Palencia y modernos como Corriente y Ferrando.

12.  En el último capítulo se exponen algunos rasgos del afrorrománico que constituyen un primer esbozo de gramática histórica del mismo. Puede destacarse que los datos fonéticos, los mejor conocidos, permiten pensar en una división dialectal del afrorrománico, aunque en la tesis no se postula un número posible de dialectos. También se señalan rasgos propios del iberorromance, especialmente de la primera etapa del castellano, anterior al siglo XIII. Lo más destacable fonéticamente es que se trataba de una lengua isoacentual, no isosilábica como el español moderno, con siete timbres vocálicos, en los que las vocales medias abiertas tónicas alternaban con diptongos ascendentes con segundo elemento variable como variantes combinatorias. En la sintaxis, la tipología pasa a ser SVO o, quizás más precisamente, VO, porque el verbo puede preceder o no al sujeto. Este rasgo, que se ha intentado explicar por influencia del árabe, es también celta, por lo que puede corresponder a un sustrato latino anterior. En el léxico destacan los romancismos en el árabe andalusí, con incidencia literaria y, especialmente desde el siglo X, los arabismos en los iberorromances.

BASES: Este capítulo, junto con la investigación sobre latín y bereber, es probablemente el más debido a investigación propia, basada sobre todo en Corriente, en investigadores italianos sobre el afrorrománico y en Emilio Alarcos Llorach. En nota se señalan algunas de las razones por las que este gran filólogo no desarrolló más sus puntos de vista, para evitar confrontaciones con la Filología establecida. Ahora me satisface ampliar esas ideas o apuntes suyos, deliberadamente moderados, que no llegaron a propuestas, celebrar su memoria y cerrar con ella el cuaderno de 2023, el centenario de su nacimiento.

Sunday, September 10, 2023

Amando de Miguel, recuerdos comunes

"Cuanto más recuerdas, más profunda es la oscuridad que te envuelve". Comprendo estas palabras del cirujano Kighare Menka, protagonista de la novela de Wole Soyinya Crónicas desde el país de la gente más feliz de la tierra. Las comprendo; pero no las comparto. El recuerdo de las personas perdidas, de queridos amigos, como en este caso, no me hace sentirme en ninguna oscuridad. Es posible que sea debido a la diferencia entre un cirujano nigeriano y un profesor euro-americano. Puede que se deba a que no hay puntos que hayan quedado en negro tras estos años de amistad. Las amistades de la madurez también tienen un sentido de la vida más realista. ¿Se refiere esa oscuridad al presente? Parece que sí, como si nos dejáramos envolver por la sensación creciente de vacío que aumenta con la pérdida de tantas personas queridas; pero tampoco estoy de acuerdo, posiblemente porque pienso que con la edad cobra más fuerza la esperanza, mientras que se va debilitando la biología. Esos valores del ser humano, de los que tantas veces hablé con Amando, se hacen más vivos y más claros tras su falta. No, definitivamente la oscuridad no me envuelve.

Como para muchos de mis coetáneos, mi primer encuentro con Amando de Miguel se remonta a la época universitaria, a los sesentayocho. En esa época la relación fue sobre todo por medio de Jorge Urrutia, mucho más integrado en ese grupo, como demuestra la interesante fotografía que incorporo. Para empezar, nuestra amistad tuvo que esperar mucho más tiempo, hasta un congreso organizado en Venecia por Luis Luque, con la presencia de otro añorado amigo, Manuel Alvar Ezquerra. Una de las participantes resumió en ese congreso, en 2007, si no recuerdo mal, la sensación que en muchas personas dejaban las intervenciones de Amando: "No sé si tienes razón o no; pero lo dices tan bien..." Ese elogio retórico me llamó la atención como lingüista y contribuyó a un acercamiento que me llevó, de común acuerdo, a gestionar su invitación como profesor visitante en la Universidad de Tejas en San Antonio, donde yo ejercía en esos años. Nunca es fácil convencer de estas cosas a un rector norteamericano; pero con la ayuda de la Fundación Rafael del Pino, en 2008 lo hicimos posible. No había un doctorado de español. El marco del Máster fue suficiente para que Amando iniciara un curso repartido entre una clase de Sociología en inglés y una fenomenal clase en español. En ella los alumnos iban leyendo los libros de su nuevo profesor y éste discutía y aclaraba con ellos tres horas por semana lo que había detras de todas esas páginas. Es una memoria permanente y, en estos días tristes, he recibido testimonios de ese recuerdo de aquellos alumnos y de colegas de San Antonio. 

Nuestro acuerdo con la Fundación del Pino incluía la escritura entre ambos de un libro sobre nuestra visión del español actual. Así lo hicimos en Se habla español, que publicó en 2009 la desaparecida editorial Biblioteca Nueva, dirigida por Antonio Roche y que hoy está disponible en internet. Sin ninguna duda, lo mejor del libro fue lo bien que nos lo pasamos al escribirlo, repartiendo charlas entre California y Georgia, México incluido, visitando a viejos amigos, paseando por sitios estupendos y tomando centenares de fotografías, una afición común. Una escritura divertida no es el equivalente de una escritura fácil. Cada capítulo o cada medio capítulo iba y venía entre uno y otro hasta que llegaba el consenso. Colaborar no es estar de acuerdo en todo y, a veces, la visión previa de Norteamérica de Amando chocaba con la que la nueva realidad, años después de su primera estancia, le iba mostrando. Las intervenciones del público después de nuestras presentaciones también ejercían su influencia. No se ve el español igual en Tejas, Arizona o Georgia.

Las conversaciones cotidianas en estos quince años han compendiado muchas enseñanzas, bien recibidas. Amando escuchaba a su "lingüista de cabecera", como me llamaba y yo luchaba contra mucho de lo establecido, empezando por la metáfora biologicista, que no era tan fácil de borrar. Nos unía el rechazo al politiqués, tan ridículo, por otra parte. En cambio, no nos preocupaba tanto el anglicismo, porque sabíamos que todas las lenguas pasan siempre por esas alteraciones de su léxico debidas al contacto estrecho con otras. Esa alteración es más superficial que profunda, en la mayoría de los casos. Claro que el español de los Estados Unidos añadía una nota más, la de que el inglés es la lengua dominante. Esa condición marca de manera peculiar al español de los Estados Unidos, que se debate entre la necesidad de integrar las diferentes variantes dialectales o normas de los hispanos y los calcos del inglés, como el citadísimo, pero muy interesante, "llámame p'atrás" 'call me back', o "le pongo la puerta p'atrás", equivalente a 'le vuelvo a poner la puerta', entre muchos otros. Amando se hizo más consciente de la otra cara del problema, la alteración del inglés por los calcos de lenguas en contacto en los Estados Unidos. En 2023 Phillip M. Carter y Kristen D’Alessandro Merii han publicado un estudio sobre ese fenómeno en el dialecto inglés de Miami; pero los ganaderos anglos de Tejas hace muchos años que publicaban ya manuales sencillos para ayudar a los propietarios a entenderse con sus peones hispanohablantes. No se dice en Miami (o en otros lugares), por ejemplo, "to get out of a car", como es esperable en inglés, sino "to get down", en español de la zona 'bajarse del carro '. Más peligroso es "to marry with", como el español 'casarse con', en vez del general "to marry to". En su referencia a ese trabajo de Carter y Merii en The New York Times, John McWhorter amplía a otras lenguas la influencia de esos calcos en el inglés. Por ejemplo, al dialecto judeo-alemán yiddish se deben usos de "by" en lugar de "at": "We are going to be by Lenore's", 'estaremos en casa de L.', en lugar de "at Lenore's". Se trata de fenómenos bien conocidos y documentados en todas las lenguas en contacto, que pueden ser muy llamativos; pero que no son exclusivos.

Quizás porque en su vida había conocido muchos sinsabores y porque hasta el final sufrió las persecuciones de un siempre envidioso sector de la sociedad española, Amando desarrolló una alegría de vivir y un sentido del humor muy contagiosos. Apoyado en datos, con ese profundo conocimiento de la sociología cuantitativa que introdujo con gran éxito en España, me enseñó a ver mi país de nacimiento con un sentido crítico diferente, apoyado en la realidad, no en los deseos. No muy dado a la esperanza ingenua, todo hay que decirlo, pero siempre basado en que la maldad requiere mucho más esfuerzo intelectual que la incompetencia, sostenía que, por ello, España siempre acaba salvándose. Que así sea.


Sunday, July 30, 2023

Dominio y lenguas en el Mediterráneo Occidental, hasta los inicios del español

 

Para trazar el camino que condujo a los inicios de la lengua española y los romances ibéricos este libro repasa la historia lingüística y cultural del Mediterráneo Occidental. Se combinan datos novedosos de la Lingüística, la Arqueología, la Historia, la Biología y la Ciencia de las Religiones. Desde el debido respeto a una honda tradición cultural, se replantean esos inicios como el resultado del contacto de lenguas y pueblos en esa área geográfica, con propuesta de soluciones diferentes que permiten una mejor comprensión de lo ocurrido en el devenir histórico. Se resalta la importancia de los contactos permanentes entre el norte y sur del Mediterráneo, la pervivencia del latín en el norte de África y el desarrollo de los dialectos afrorrománicos, la vasquización tardía o el contacto del latín ibérico y el norteafricano en los inicios de Alandalús. La caracterización del espacio andalusí dentro del mundo árabe e islámico, tras un lento proceso de instalación, permite conocer mejor las relaciones entre el romance andalusí y los demás romances ibéricos y africanos, en un marco románico más amplio.

El objetivo principal de este libro es recoger y transmitir reflexiones y resultados de una investigación que ha evolucionado en paralelo a la vida profesional de su autor. Arranca de la pregunta sobre cómo era la situación lingüística de la Península Ibérica tras la llegada de los sarracenos, en qué ambientes se iniciaron las lenguas romances iberorrománicas y con qué contactos. Para disponer de una base suficiente para ese objetivo era necesario remontarse a siglos atrás y plantearse también reflexiones técnicas que requerían el auxilio de otras ciencias, como la Arqueología o la Biología, además de las ciencias históricas, como la Historia general o la Historia de las lenguas. También había que situar la investigación en un marco geográfico, más amplio que la Península Ibérica, porque a lo largo de los siglos son muchas las migraciones de un extremo a otro del Mediterráneo. Por eso, aunque se ha tratado de restringir la exposición de los datos sobre todo al Mediterráneo occidental, es preciso expandir ese marco y abarcar otras áreas en las que se producen fenómenos que pueden iluminar aspectos más grises del estudio. Todo ello se ha tratado de presentar y razonar en la primera parte de la obra, que está compuesta de dos capítulos. El primero se dedica sobre todo a los principios metodológicos de la investigación, a veces con la exposición de conceptos y referencias básicos, porque se trata de escribir un libro legible para el público interesado, no sólo para los especialistas. Por eso se presentan en él términos que forman parte del acervo conceptual de la Lingüística desde hace mucho tiempo y que hacen la comprensión y el manejo del texto más sencillo, como pueden ser los relacionados con la estructura y el cambio, lengua, norma, dialecto, diacronía, dominio. También se exponen de modo sencillo las relaciones de Lingüística y Arqueología o Lingüística y Biología aplicadas al objeto de estudio. Para facilitar la comprensión se acude a ejemplos concretos con repercusiones en Hispania, como pueden ser las migraciones indoeuropeas o la vasquización. Indoeuropeos y vascos representan su papel en la historia de la lengua española y es recomendable aclarar algunas ideas.

El segundo de los dos capítulos metodológicos acerca al lector al marco geográfico y cultural más reducido, para mostrar cómo la historia de la Península Ibérica es inseparable de la del Norte de África, con la que tiene lazos antropológicos, culturales, sociales y lingüísticos constantes y fuertes. Si bien se tiene en cuenta ese mundo desde antes de 218 a. JC, fecha del inicio de la presencia romana, se procura extenderse más a partir del siglo V d. JC, hasta el siglo X. En esa época se producen dos fenómenos lingüísticos constitutivos y definidores de ese dominio: la latinización, primero y la arabización, después. También se producen dos fenómenos sociales o culturales constituyentes, la cristianización y la islamización. De latín y su pervivencia depende la formación de los romances ibéricos, conservados en su mayoría, y también de los romances africanos, el afrorrománico perdido. Junto a la Romania emergente hay una Romania submersa que cada vez se conoce mejor y que merece más profundo estudio. También pueden discutirse conceptos históricos, como el de Alandalús o España. Filología e Historia se intercomunican, como la semántica y la historia cultural. Para ayuda del lector esta parte metodológica termina con un cuadro en el que se relacionan cronológicamente, datos antropológicos, lingüísticos, históricos y culturales.

La segunda parte es el producto o el desarrollo de las ideas que se presentan o sugieren en la primera. El capítulo tercero trata de llevar al lector a una descripción de los dominios lingüísticos en la Africa prouincia romana y su evolución antes del siglo VIII. Se elige este siglo porque la fecha de 711 es una fecha simbólica de un gran cambio, el derivado de la arabización e islamización, triunfante o fallida, del dominio geográfico que nos ocupa. Por ello hay que dar un lugar a lenguas como el bereber o el fenicio-púnico, que preceden y coexisten con el latín durante largos períodos, en cualquier caso. La interrelación entre latín y bereber merece bastantes páginas y lleva a conclusiones que pueden ser de interés sobre el proceso de préstamo léxico. Lo mismo ocurre sobre la lengua de los vándalos, de cuyo uso del latín se aduce un testimonio indiscutible. Como la investigación sobre varios de estos aspectos ha estado sometida a ideas y conceptos de las potencias europeas y su presencia en África, se ha insistido en lo que ha cambiado en la perspectiva de la investigación reciente, que trata de liberarse de ciertos complejos que, por otra parte, no son propios ni marcados en el africanismo o el arabismo españoles (aunque a veces puedan aparecer), lo cual, ciertamente, constituye una ventaja. El cristianismo y su mundo cultural, latino, merecen también un lugar aquí.


Alandalús no se formó de la noche a la mañana, ni era igual en 750 o en 950 o en 1492. Su historia muestra el desarrollo de cambios muy profundos, con una creciente orientalización, que está ya constituida entre los siglos IX y X. Ese proceso de orientalización andalusí se muestra en tres aspectos distintos, con ejemplos concretos, que pueden resultar anecdóticos inicialmente; pero que se presentan consolidados en esos tres aspectos, el administrativo de sellos y monedas, el cotidiano que puede representar la cerámica y el trascendente del más allá, que los cementerios recogen con certeza. Todo ello va acompañado, textualmente, del crecimiento del árabe como lengua litúrgica de los cristianos, proceso consolidado y bien conocido en Oriente y que tiene también sus ejemplos e instalación en Alandalús.

Objetivo necesario era llegar a los inicios del español. A ello se dedica el quinto capítulo desde una metodología y epistemología predominantemente lingüísticas. Es preciso consolidar la idea de que el latín tuvo un largo proceso hasta que dejó de usarse en el Norte de África, por ello la respuesta a la pregunta de qué lengua usaban para comunicarse los hispanos y los bereberes sarracenos tiene una respuesta sencilla, el latín, en sus variantes iberorrománicas y afrorrománicas. Esa facilidad de entendimiento ayuda a explicar el proceso de conquista y formación de Alandalús. Se repasan también, para crear una descripción completa que permita llegar a conclusiones sostenibles, el dominio de los vascos, desde la tesis de la vasquización tardía, el papel de los germanos y el del púnico y el latín o el bereber y el latín, todo ello en los marcos que ofrecen la Arqueología, la Toponimia y la Lingüística. Se llega así al punto final, la visión de los inicios del español dentro de un marco en el que interrelacionaron afrorrománico, iberorrománico, vascorrománico y romance andalusí. Ese dominio lingüístico inicial fue complejo y presenta facetas que abren vías de investigación que podrán cambiar lo que se sabe de los orígenes y evolución de las lenguas peninsulares.


Más información: Ultreia (ucv.es) : https://ultreia.ucv.es/index.php/ultreia 

Saturday, February 11, 2023

Inteligencia Artificial (AI) y Humanidades

 En los últimos meses asistimos a un crecimiento exponencial de las informaciones, comentarios y temores sobre la Inteligencia Artificial (AI, por sus siglas en inglés). Algunos de los últimos productos son ciertamente llamativos y han gozado de gran aprecio de usuarios. La Inteligencia artificial se está aplicando desde hace muchos años y quizás ha llegado el momento de darle la importancia que tiene, mucha, por cierto, y no más. Recuérdese que el ser humano tiene al menos dos capacidades que, hasta el presente, no se dan en la máquina. La primera puede que se consiga, la capacidad de ponerse a hacer algo que no ha hecho nunca, como jugar un juego nuevo, incorporarse a una actividad ya en marcha sin instrucciones previas, adaptándose a las exigencias que tenga. La segunda capacidad parece todavía muy lejos del mundo mecánico, la de la autoconciencia, saber quién es uno, dónde está y asumir las circunstancias como parte del propio ser. En el momento en que una máquina pueda decir, con conocimiento real “yo sé quién soy” habrá culminado el proceso de creación de un nuevo ser. Mientras tanto, se trata de un objeto, cada vez más complejo y capaz de hacer más cosas y más complejas.

Un campo, por definición y denominación, típicamente humano es el de las Humanidades, el estudio de las características y la producción humana en todas las áreas de su actividad. Dos de sus manifestaciones más características son el Arte y la Lengua. Nos limitaremos aquí a la segunda. La Lengua permite categorizar y expresar la percepción humana del Universo. Como se realiza en distintas variantes, los diversos idiomas o lenguas naturales, ha sido una preocupación histórica, bien documentada, saber pasar de una lengua a otra, es decir, traducir. La aplicación de la informática a la traducción se inició muy pronto, animada por el éxito de las máquinas en la descodificación, se abandonó un tiempo, para retomarse con fuerza luego y continuar hasta hoy.

La aplicación de la AI a los estudios sobre la traducción es un área de investigación y desarrollo que crece deprisa. La AI se aplica al campo de estudio de la traducción de varias maneras, que incluyen:

1)      El procesamiento de la lengua natural (NLP). Este campo de la AI se enfoca en la habilidad de los computadores para comprender, interpretar y producir expresiones o textos en lenguas naturales, lenguas humanas. Se usa en los estudios de traducción para desarrollar sistemas de traducción computacionales más exactos y eficaces. También se aplica al análisis de sentimientos, la clasificación de textos y la producción, comprobación y evaluación de modelos lingüísticos, que llegan hasta el autoaprendizaje computacional o informático.

2)      La traducción mecánica o computacional (MT). Es la aplicación más conocida. Por traducción computacional se entiende el uso de algoritmos computacionales para traducir un texto desde una lengua fuente a una lengua meta. Los sistemas de MT han mejorado mucho en los últimos años; pero todavía requieren un trabajo de edición posterior, realizado por humanos, si se quieren lograr traducciones de buena calidad.

3)      La traducción asistida o ayudada por computador (CAT). Consiste en el uso de instrumentos computacionales para asistir a los traductores humanos en su trabajo. Estos instrumentos de CAT pueden ayudar a los traductores en el manejo de la terminología, las memorias de traducción o los contenidos repetitivos. Pueden acceder a grandes bases terminológicas, que proporciona estándares para las equivalencias del vocabulario científico-técnico. Permiten al traductor almacenar en esas “memorias de traducción” sus soluciones personales o corporativas para mantener traducciones homogéneas y tratan del mismo modo todo aquello que en muchos tipos de textos se repite sin o con escasas variaciones.

4)      La traducción mecánica o computacional neuronal (NMT). Este tipo de traducción usa algoritmos de aprendizaje avanzado para traducir textos. Los sistemas de NMT son los más populares hoy día al usarlos en sus productos grandes compañías como Google, Microsoft o Amazon. Son capaces de mejorar su rendimiento por autoaprendizaje, producen traducciones de gran calidad y pueden tratar estructuras lingüísticas complejas.

5)      La traducción mecánica o computacional neuronal multilingüe (MNNMT). Se trata de un sistema de MT que usa sistemas neuronales, NMT, para traducir entre varias lenguas, sin limitarse a un par de lenguas. Los sistemas de MNNMT son cada vez más importantes, porque la necesidad de comunicación multilingüe sigue en aumento.

     

El gran avance se ha producido gracias a la sustitución progresiva del método estadístico, apoyado en grandes bases de datos de donde extraer construcciones paralelas traducibles entre sí, por el método neuronal, basado en redes neuronales. Estas redes imitan la red de neuronas humanas y se construyen a partir de corpus o colecciones textuales enormes, de miles o centenares de millones de palabras. Las redes neuronales consisten en capas de nudos interconectados, cada uno de los cuales realiza una operación simple. Las redes neuronales se aplican a grandes cantidades de datos para estudiar los esquemas y relaciones en los datos y se pueden usar entonces para hacer predicciones o decisiones que se basen en ese conocimiento.

     


Cada elemento de la red, que trata por igual lo dividido tradicionalmente en léxico y gramatical, vocablos y frases, se conforma como un vector, en el sentido informático, que lo hace equivalente a una lista. En esa lista el vocablo definido se configura en el centro y tiene sobre él y bajo él los restantes elementos de corpus con los que tiene relaciones definidas por la presencia de esos otros vocablos en concordancias (contextos lineales) extraídas del corpus. Se codifica el vector según las palabras o frases que aparezcan más veces cerca en las concordancias extraídas del corpus. Se pueden construir gramáticas basadas en vectores que pueden producir frases nuevas con base en una gramática o traducir un texto de una lengua a otra. Algunos modelos de gramáticas basadas en vectores serían los siguientes:

1)      Word2Vec. Representa las palabras como vectores. Word2Vec usa una red neuronal para aprender las relaciones entre palabras en un amplio corpus textual y usa esas relaciones para producir un vector para cada palabra. Se designan los vectores para calcular el significado de las palabras y sus relaciones con otras palabras y se usan en tareas como homonimia, analogía y clasificación de textos.

2)      Modelo del Saco de Palabras Continuo (CBOW). Representa oraciones como una serie de vectores. En el modelo CBOW cada palabra de una oración se representa por un vector y se recogen las relaciones entre palabras por medio de las relaciones entre sus vectores. Este modelo puede utilizarse para clasificación de textos y análisis de sentimientos.

3)      Skip-Gram Model. Éste es otro tipo de gramática basada en vectores que representa las oraciones como una serie de vectores. En el modelo Skip-Gram cada palabra de una oración se representa como un vector y se recogen las relaciones entre palabras por medio de las relaciones entre sus vectores, como en el modelo anterior.  Este modelo se diseñó para combinarse con CBOW y se usa en desarrollo de estudios de homónimos, analogía y clasificación de textos.

4)      Gramáticas de vectores basadas en árboles. Este tipo representa la estructura de las oraciones de forma arbórea. Cada nudo del árbol representa un constituyente (por ejemplo, una frase nominal o una frase verbal). Las relaciones entre constituyentes se recogen por las relaciones entre sus vectores. Esta aproximación se puede usar para realizar tareas cual el análisis o parsing, la traducción y la producción de textos.      


Como puede verse, se desarrolla una investigación muy compleja y activa, que proporciona resultados que pueden ser atractivos para el público, como CHAT-GPT, un sistema de preguntas y respuestas que es capaz de dar informaciones complejas y que, por tener una atractiva capacidad de diálogo, permite captar usuarios de pago que sirven, a su vez, para financiar otras investigaciones menos sexys.

Monday, January 23, 2023

Con pocos, pero doctos, libros juntos

 


Así expresaba Quevedo, en un soneto célebre, cómo le ayudaban los libros a soportar los reveses de la vida. Y no es que él viera ese momento de la historia de España como uno de grandeza y orgullo, sino que la decadencia de la patria va pareja a la del propio cuerpo, como expresa en otro soneto, en un movimiento progresivo de concentración y personalización a lo largo de los versos del segundo poema:


Miré los muros de la patria mía,
si un tiempo fuertes, ya desmoronados,
de la carrera de la edad cansados
por quien caduca ya su valentía.

Habría que recordar a tanto ignaro como dirige el destino de nuestros países y desorienta a los jóvenes con consignas de destrucción de la Historia, lo que ésta simplemente es, el espejo que, en su reflejo fino, permite observar nuestras imágenes en los pasos del tiempo. Intentar destruirla es inútil; siguiendo con nuestro autor: 

Arrojar la cara importa,
que el espejo no hay por qué.

Los nuevos talibanes reclaman incongruentes interpretaciones del progreso y se jactan de destruir símbolos, como los antiguos egipcios borraban de sus monumentos los cartuchos con los nombres de aquellos caídos en desgracia. En sus viajes por el mundo, pagados por el generoso bolsillo del erario público, alguno de ellos, por ejemplo, pudo pasar por la puerta del Colegio del Pilar, en Jerusalén, y denunciar lo que su ignorancia le hizo ver como un escudo franquista en la fachada. La piqueta suele ser rápida en el seguimiento de esas denuncias, sin más comprobación y nada extraño sería que un ignorante destruyera el escudo original del Colegio, que en realidad no es franquista, sino conmemorativo del rey Alfonso XIII, visitante ilustre de la Tierra Santa.

¿Qué sentido tiene quejarse a esa tropa del descuido y abandono de las Humanidades? 

Escucho con mis ojos a los muertos

nos sigue diciendo Quevedo; pero en el desierto intelectual de la España oficial se desprecia la lectura, como si fuera la obra la muerta y no sus autores. 


Claro que siempre puede aplicarse la respuesta que nos da un gran autor francés, Pierre Corneille, una generación posterior a Quevedo, en Le Menteur ('el mentiroso'): les gens que vous tuez se portent assez bien, frase que, en la versión española "los muertos que vos matáis gozan de buena salud", ha sido atribuida erróneamente a Zorrilla, en Don Juan Tenorio, donde, por supuesto, no se encuentra, o a Pedro Muñoz Seca, entre otras suposiciones que no importan.

¿Sirve de algo reflexionar sobre el aprecio que se hace de nuestro tesoro humanístico? Si volvemos al soneto quevedesco cuyo primer cuarteto ya conocemos, Miré los muros de la patria mía, podemos ver que el segundo cuarteto nos lleva a una consideración que hoy sería claramente ecológica, la naturaleza, el sufrimiento de los animales por las inclemencias del tiempo o, si se sigue leyendo, cómo la propia decadencia corporal está unida a la de nuestra visión del entorno, del paisaje y de nuestro habitat. ¡Es tan sencillo buscarlo hoy en internet y leerlo completo!

Desprecia cuanto ignora, nos recuerda un poeta al que no parece fácil llamar "facha", Antonio Machado; pero ese texto se aplica hoy, no a una parte geográfica o histórica de la patria, sino a toda una lastimosa clase dirigente, que ni sufre ni padece por su vergonzoso desequilibrio cultural.

Amemos los libros, hoy que es tan fácil que nos acompañen hasta en los teléfonos. La gente lee en el metro de París, así ocurría en el de Madrid hasta no hace tanto. Ahora sólo resuenan fragmentos de conversaciones privadas, sin trascendencia, o los dedos en los jueguecitos, que certifican un descenso, no del vagón, sino de la mente. Recuperemos los libros, en las escuelas, en las calles, en nuestras conversaciones. En sus páginas, en sus píxeles, está el infinito.