jueves, 10 de octubre de 2024

De inteligencia artificial, corrección y edición de textos, y academias de la lengua española

Después de diversas lecturas sobre los avances de la IA generativa en lo relativo a la lengua española/castellana y el camino por recorrer, y teniendo ya mi propia experiencia en el uso de ChatGPT4 en el trabajo textual editorial, me topé en LinkedIn con esta charla de Javier Muñoz-Basols sobre los sesgos lingüísticos digitales en el desarrollo de las IA.

 


Al hilo de lo que se comenta e ilustra en la charla, me atrevo a hacer algunas constataciones y reflexiones sobre el desarrollo de las herramientas de IA para trabajar con el castellano, concretamente para las labores de corrección y edición de textos. No hay mucho que decir al respecto, aparte de que está en mantillas y se le augura un avance lento y complicado.

Este retraso con respecto a otras lenguas internacionales con gran número de hablantes tiene diversas causas estructurales, financieras y técnicas (como la ausencia de una estrategia común de desarrollo entre los países donde el castellano es hegemónico, la insuficiente inversión en IA en y para el castellano, y la inexistencia de una metodología de evaluación comparativa de los modelos de lenguaje de propósito general [usos generales] y específico [usos especializados], entre otros aspectos). Pero sobre todo es la herencia de una carencia que el español viene arrastrando: la insuficiencia de datos (diccionarios, corpus, catálogos de entidades nombradas, terminologías especializadas, anotaciones, gramáticas, etc.) con los que puedan desarrollarse y funcionar los modelos que sirven para entrenar las IA. Sin ellos, no pueden entender la inmensidad de textos en español, aprender a discriminar y reconocer en estos patrones de lengua distintos y a deducir con finura qué uso es el apropiado para un determinado contexto.

Como explicamos diversos autores de El dardo en la Academia —entre otros especialistas que han incidido en este problema—, el español/castellano es una lengua deficientemente descrita y equipada. De hecho, en favor del modelo estándar de «lengua común» (ese ideal político del panhispanismo tan reñido con el avance del conocimiento lingüístico), se ha estado relegando e incluso bloqueando el estudio de los diversos registros técnicos y de la dinámica variedad lingüística social y geográfica de la lengua. Para ilustrar con un solo ejemplo el deficiente equipamiento del castellano, a un nivel lexicológico y lexicográfico es clamorosa la falta de diccionarios descriptivos integrales de las diversas variedades nacionales de lengua (sólo hay tres: el de España, el de Argentina y el de México).

Incluso limitándonos al modelo estándar de lengua correcta (el académico), no diré nada nuevo al afirmar que contiene numerosas contradicciones, inconsistencias, errores y asistematicidades metodológicas, y que presenta múltiples huecos. Dado, además, el aún insuficiente conocimiento de la llamada norma culta del español, el estándar panhispánico es incapaz de definir qué es aceptable o no en la variedad culta (escrita o hablada) de un país en un momento dado, con lo que su aportación a la nutrición de las IA para que redacten, localicen o corrijan es también muy limitada. La escasa utilidad de estas herramientas para la corrección —⁠que se reduce a la detección y enmienda de ciertos aspectos normativos de algunas variedades— es algo que puede comprobarse simplemente intentando que ChatGPT4 mejore la redacción y corrija, adecuándolo a un lector de perfil geolectal variado, un texto extenso en una de esas variedades nacionales mal descritas y con pocos equipamientos (por ejemplo, el chileno santiagueño). Aun cuando se le informe de qué variedad y tipo de texto es y de qué resultado se quiere obtener, ChatGPT4 no da pie con bola o se inventa soluciones disparatadas o fuera de lugar. Eso sí, pide reiteradas disculpas por no haber sido útil.

En este punto, hago un breve apunte sobre el papel de las academias de la lengua en el desarrollo de la IA en y para el castellano. Estas instituciones (la RAE, particularmente) sí pueden proveer corpus y otros materiales útiles para este fin, pero su celo por controlar su obra y sus derechos de explotación es bien conocido. El material que pueden ofrecer no se emplearía tal cual es, sino que pasaría procesos de revisión, modificación y refinamiento que escaparían al control de las academias y a sus fines, por lo que personalmente dudo de que vayan a ceder nada fácilmente. De hecho, el único proyecto de las academias relacionado con la IA es el proyecto Leia, patrocinado por Telefónica y en colaboración con Google, Amazon, Microsoft, Twitter y Facebook (patrocinio y colaboraciones nada altruistas) y con una dotación de 5 millones de euros por parte del Gobierno español, cuyas líneas principales son «velar por el buen uso de la lengua española en las máquinas» y «crear herramientas que fomenten el uso correcto del español [o sea, el modelo estándar escrito] en los seres humanos». A ver qué pasa si las máquinas pensantes empiezan no sólo a usar el estándar académico, sino a detectar sus fallos...

En consecuencia y recapitulando: si no se hace el trabajo lingüístico pendiente, ni se ponen los datos existentes a disposición de los proyectos públicos en marcha, ni estos se centran también en la lengua y se coordinan internacionalmente, las IAs en y para el español no evolucionarán bien —y que lo hicieran tampoco sería ni fácil ni rápido—, con lo que será imposible que resulten útiles para el trabajo con la lengua en todos sus niveles y en todos los territorios de uso del castellano.

Finalmente, yendo a mi campo profesional, la pregunta que cabe hacerse es: ¿Cómo afecta al ámbito de la edición de textos esta limitación de las herramientas de IA de uso más común? Pues de diversas maneras. Combinada con la concentración geográfica de la edición en castellano, la escasa utilidad de las IA está teniendo dos efectos: o peores publicaciones, o una revaloración del trabajo humano y la descentralización de la labor editorial. Me explico. Como es sabido, España —y concretamente Barcelona⁠— es el centro de publicación mundial en esta lengua, y no sólo en la variedad peninsular central. Autores de todo origen, de ficción y no ficción, publican en Barcelona o en Madrid, pero los editores y correctores locales no tienen recursos para tratar sus textos adecuadamente, y las IA tampoco les son de ayuda. El resultado es o un tratamiento improvisado y chapucero de estas obras o, si se quieren hacer bien las cosas, el recurso a un colaborador nativo de la variante del texto que se edita, con lo que el trabajo editorial en España se externaliza a otros países.

En cualquier caso, las deficiencias que presentan las IA conducen, de momento, a la continuidad de una labor exclusivamente humana en este campo, seguramente durante años. Por el simple hecho de que un corrector humano bien formado conoce bien su propia lengua (al menos, diversas variedades de ella) y porque es también capaz de apreciar y analizar la complejidad de cada obra que pasa por sus manos, es a día de hoy todavía más ágil, adecuado y eficaz que la máquina pensante. Y en cuanto al editor, un profesional serio siempre conocerá mejor que una entidad digital —⁠que ni siquiera vive en la sociedad humana— a los receptores (lectores) potenciales de cada obra y a sus autores y, por supuesto, preferirá seguir sus propios objetivos, criterios e intuiciones en cuanto al peculiar producto editorial que quiere obtener. 

En fin, desde este blog, seguiremos observando.



lunes, 7 de octubre de 2024

El uso del artículo ante los años. (Píldoras de estilo editorial, 4)


 

El asunto del empleo u omisión del artículo ante los años es una cuestión que las academias han embrollado hasta lo indecible desde que se fue acercando el año 2000 y a alguien se le ocurrió formularles una duda sobre este particular en el sitio de internet de la RAE. Según comenta José Martínez de Sousa en su Ortografía y ortotipografía del español actual (OOTEA3, 2014, p. 278), como respuesta nada reflexionada a esta duda, la Academia española recomendó el uso sin el artículo para los años posteriores al 1999. Pero ante el empecinado empleo del artículo por parte del hablante y las críticas recibidas, se vio obligada a rectificar. Como particularmente la RAE no lleva bien reconocer los errores, lo que ocurrió es que rectificó a medias, y así es como se inició un camino errático sobre este asunto en la obra académica. Sigámoslo paso a paso para intentar llegar a buen puerto. 

En la primera edición del Diccionario panhispánico de dudas (DPD2005, s. v. «Fecha», § 4c), las academias decían:

a) Del año 1 al 1100 es más frecuente el empleo del artículo, al menos en la lengua hablada: Los árabes invadieron la Península en el 711. Pero no faltan abundantes testimonios sin artículo en la lengua escrita: «Ya en 206 a. de J. C. tiene lugar la fundación de Itálica»(Lapesa Lengua [Esp. 1942]). b) Del año 1101 a 1999 es claramente mayoritario el uso sin artículo:Los Reyes Católicos conquistaron Granada en 1492, si bien no dejan de encontrarse ejemplos con artículo: «Nací en el 1964» (RdgzJuliá Cruce [P. Rico 1989]). Si se menciona abreviadamente el año, suprimiendo los dos primeros dígitos, es obligatorio el empleo del artículo: En el 92 se celebraron las Olimpiadas de Barcelona. c) A partir del año 2000, la novedad que supuso el cambio de millar explica la tendencia mayoritaria inicial al uso del artículo: Fui al Caribe en el verano del 2000 o La autovía estará terminada en el 2010. Sin embargo, en la datación de cartas y documentos no son tan marcadas las fluctuaciones antes señaladas y se prefiere, desde la Edad Media, el uso sin artículo: 14 de marzo de 1420. Por ello, se recomienda mantener este uso en la datación de cartas y documentos del año 2000 y sucesivos: 4 de marzo de 2000. Esta recomendación no implica que se considere incorrecto, en estos casos, el uso del artículo: 4 de marzo del 2000. Naturalmente, si se menciona expresamente la palabra año, resulta obligado anteponer el artículo: 5 de mayo del año 2000.
 

En su OOTEA3 ( 2014, pp. 278-279), Martínez de Sousa expuso diáfanamente las evidentes objeciones que suscitan estos párrafos a cualquier mente racional (las negritas son mías):

1. «No se entiende por qué la Academia asegura que la tendencia al uso del artículo se debe a la novedad que supuso el cambio de millar. La razón no es esa, sino la mayor comodidad de los usuarios de la lengua para expresarse con el artículo que sin él. Tampoco se entiende que si la tendencia mayoritaria era el uso del artículo, la Academia colocase una nota en su sitio de Internet para recomendar el uso sin el artículo.» De hecho, como el mismo Martínez de Sousa anota, si se dice en el 3000 antes de Cristo y no en 3000 antes de Cristo, la simple analogía lleva a decir espontáneamente en el 2002 después de Cristo y no en 2002 después de Cristo.

2. «No hay ninguna razón gramatical clara por la cual esto [el uso del artículo ante el año] deba ser de una manera o de otra; solo podemos basarnos en el uso y la tradición, mayoritariamente favorables al artículo en fechas anteriores a Cristo hasta el 1100 después de Cristo y desde el 2000 en adelante».  

3. «Sorprende que la Academia hable del uso sin artículo en cartas y documentos cuando a) las cartas son también documentos; b) no se adivina cómo ha llegado a la conclusión de que, cuando se cambió de siglo y de milenio, en la datación de cartas y documentos la tendencia a la escritura con artículo fluctuó, puesto que la Academia no tuvo ni siquiera tiempo de analizar el uso. Sorprende también que diga que desde la Edad Media se prefiere el uso sin artículo, “consolidando en la práctica —dice⁠— una fórmula establecida” […] ¿Qué fórmula? ¿Quién la había establecido? ¿Qué práctica invoca la Academia y a quién la atribuye?» Y añade este eminente ortógrafo: «Hay que recordar que en la Edad Media difícilmente se dedicaba nadie a vaticinar cómo se escribirían las fechas en el cambio del siglo xx al xxi.».  

4. «Con esta última norma [“Esta recomendación no implica que se considere incorrecto, en estos casos, el uso del artículo”] habría suficiente y se habría ahorrado el marasmo creado artificial e injustificadamente en la escritura de las fechas. En cualquier caso, la fuerza de la recomendación académica (tomada como norma en forma absoluta) solo afecta a las fechas completas, no a las referencias a un determinado año en que ha sucedido o sucederá algo: La carretera se construirá en el 2008; El puente no estará terminado hasta el 2005; En el 2050 España tendrá menos habitantes que en el 2002.»

 

Dándose un poco de tiempo, las academias habrían podido confirmar que la tendencia espontánea entre los hablantes era al uso del artículo —algo perfectamente rastreable y verificable en los primeros años del nuevo milenio⁠— e incorporarlo a su obra, ya que tanto alardean de que la norma simplemente recoge el uso. Pues no sólo no lo hicieron, sino que su improvisación e incoherencia condujo a que, incluso entre profesionales de la lengua (particularmente periodistas, traductores y hasta correctores), empezara a cundir la idea (y la práctica) de que había que omitir sistemáticamente el artículo ante los años posteriores al 2000.  

Por fortuna, una de las pocas obras académicas que tienen detrás un trabajo concienzudo de estudio y análisis del uso, la Nueva gramática de la lengua española (NGLE2009), intentó poner un poco de orden y racionalidad en el asunto. Así, la NGLE14.8p) observa la falta de naturalidad en la elisión del artículo en los siguientes casos (la negrita también es mía):


14.8p La estructura del numeral que designa el año es también pertinente para la elección del artículo. Se ha observado que la presencia de artículo es más frecuente cuando se trata del año 2000 o los posteriores a él, exceptuadas las oraciones copulativas a las que se hizo referencia en el § 14.8ñ. Resultaría, en efecto, forzada la omisión del artículo que se subraya en estas oraciones:


Hablar del 2000 era hablar de un año tan remoto que el mundo tal vez estaría de cabeza para entonces (Tiempo [Col.] 7/4/1997); El2000 supuso una ruptura en la evolución creciente del nuevo empleo (Norte Castilla 6/2/2001),


o en pares como los siguientes: {1974 ~ El 2000} transcurrió sin demasiados contratiempos; Dejemos {1930 ~ el 2002} a un lado; Agradezco {a 1930 ~ al 2002} todo lo que me dejó. La variante con artículo es mucho más frecuente si el año está comprendido entre el 1 y el 1100, pero se percibe mayor alternancia en estos contextos: Algunos autores lo dan como inaugurado en el año 692 a. de C., otros en el 980, y aun en 1050 (Tagarano, San Bernardo). Cuando la referencia al año se hace por sus dos últimas cifras, se emplea siempre con artículo: Stroessner cayó en el 89.



Un año después, la también académica Ortografía de la lengua española (OLE2010) no hizo ninguna alusión a este asunto, aunque siguió omitiendo el artículo en los ejemplos de las fechas. Para rematar la confusión, la revisión en curso del DPD (s. v. «Años» § 3) obvia lo expuesto en la NGLE2009 y vuelve a sus trece:


A partir del año 2000, la novedad que supuso el cambio de millar explica la tendencia mayoritaria inicial al uso del artículo: Fui al Caribe en el verano del 2000 o La autovía se terminó en el 2010, pero hoy la mención de estos años ya se ha asimilado a la del resto y es más habitual omitir el artículo [sic]: En 2023 se espera una fuerte bajada de la inflación.

En la datación de cartas y documentos se prefiere el uso sin artículo: 14 de marzo de 1420, 5 de noviembre de 2021. Naturalmente, si se menciona expresamente la palabra año, resulta obligado anteponerlo: 5 de mayo del año 2000.


Es mucho decir que «hoy la mención de estos años ya se ha asimilado a la del resto y es más habitual omitir el artículo». Pero, desde luego, los casos en que esto se da son consecuencia del empeño académico en no rectificar sus errores. Es este, por cierto, un mecanismo de creación de nueva norma panhispánica demasiado común. Como decía un querido colaborador de este blog:

Lo malo es que mucha gente toma en serio, con total buena fe, lo primero que la RAE publica. Luego,la RAE cantará victoria diciendo: «Está en el uso». Y así se construye lo que llaman burocráticamente norma panhispánica pluricéntrica.

Ante este panorama, no sólo Martínez de Sousa sino no pocos autores, profesionales y redactores de libros de estilo optamos por la tendencia realmente más común en la lengua: utilizar el artículo el ante los años anteriores al 1101 y posteriores a 1999 (incluso en la datación no abreviada). Así:


De/en + año

el/del/en el + año

Entre 1101 y 1999:

América fue descubierta en 1492.

(Con las excepciones mencionadas por la NGLE2009 en el párrafo 14.8p, anteriormente citado.)

En fechas anteriores a Jesucristo (a. C.):

Esto sucedió en el 3000 a. C.

Entre el año 1 y el 1100:

Los árabes llegaron a España en el 711.

Desde el 2000 en adelante:

Esta ley no entrará en vigor hasta el 2002.

A 27 de noviembre del 2024.

domingo, 9 de junio de 2024

Los catalanismos en las publicaciones. (Píldoras de estilo editorial, 3)

 


 

El hecho de que Barcelona (capital de Cataluña, cuya lengua propia es el catalán) sea el centro mundial de la edición en castellano y de que, en muchos casos, los editores y colaboradores del gremio tengan diversas variedades nativas del catalán, hace demasiado presente en los libros la interferencia del catalán en el castellano (un fenómeno distinto del de las voces del castellano históricamente procedentes del catalán). Y digo «demasiado presente» porque el mercado del libro en español es muy amplio y muy variado idiomáticamente y, salvo en las obras literarias, tiende en lo posible a la neutralización para evitar problemas de comprensión en el lector (lo que no resulta fácil debido a la escasez y a la deficiente disponibilidad de herramientas lexicográficas contrastivas y de bases de datos sobre variación geográfica).

Para ayudar a neutralizar un texto también en lo relativo a las consecuencias del contacto lingüístico catalán-castellano, se ofrece aquí un compendio de los catalanismos léxicos, morfológicos y morfosintácticos más frecuentes:

1. Catalanismos léxicos

Son catalanismos léxicos (términos o locuciones) frecuentes:

 

a más a más por además;

abrir por encender/prender o conectar;

aburrir por aborrecer: De tanto verlo lo tengo aburrido [cat. el tinc avorrit];

aparador por escaparate;

bambas por (zapatillas) deportivas o tenis;

cerrar por apagar o desconectar;

chafardear por cotillear;

clapa por mancha , o por calva, o por claro:

cuello por garganta o gaznate;

encontrar a faltar por echar de menos, echar en falta;

escaparse el tren/el avión/etc. por perder el tren/el avión;

estar en la cama por guardar / hacer cama;

estarse de por abstenerse de;

explicar por contar, narrar;

encante por baratillo, rastro, tienda de ocasión;

grande por mayor: Su marido es más grande que ella; Mi hijo grande tiene los ojos azules, pero el pequeño, los tiene marrones;

gritar más por levantar la voz, hablar más alto;

hacer por estudiar: Los jueves hago piano;

hacer años por cumplir años;

hacer asco por dar asco;

hacer bondad por portarse bien;

hacer un café (u otra bebida) por tomar un café (u otra bebida);

hacer buena / mala cara por tener / poner buena / mala cara;

hacer una conferencia por dar una conferencia;

hacer el efecto (algo a alguien) por dar la impresión (algo a alguien);

hacer gasolina por poner gasolina

hacer gracia por hacer ilusión, apetecer;

hacer miedo por dar miedo;

hacer una mirada por echar un vistazo o mirar;

hacer una película por echar / dar  / poner / proyectar una película

hacer la siesta por echar / dormir la siesta

hacer tarde/ hacérsele tarde (a alguien) por retrasarse ;

hacer vacaciones por estar de/ tomarse unas vacaciones;

haber por estar: Más abajo hay los pinares y el mar;

hablar flojo por hablar bajo, hablar en voz baja;

hablar fuerte por hablar alto, hablar en voz alta;

horno por panadería o tahona;

ir haciendo por ir tirando, salir adelante;

lampista por fontanero;

las cosas, como sean por las cosas como son;

mal por daño;

mirar de por intentar: Miraré de hablar con el director esta tarde;

natural por del tiempo: Ponme un agua natural;

oreja(s) por oído(s): Tiene la oreja fina;

paleta por albañil;

parada por puesto, tenderete;

paradista por comerciante ambulante o por expositor (refererido a una persona);

parado/a por pasmado/a;

paradoxal por paradójico:

parlante por hablante: Los catalanoparlantes suelen usar muchos catalanismos en castellano;

pensarse por creerse: ¿Quién te piensas que eres?

pequeño por menor;

pescatero por pescadero;

pesebre por belén, nacimiento;

pica por fregadero, pila;

plantar cara por revolverse, enfrentarse;

plegar por acabar de trabajar;

por descontado por por supuesto;

pote por bote, tarro;

primero de todo por antes que nada, en primer lugar;

¿quieres decir? por ¿estás seguro/a?;

rampa por calambre;

remarca por énfasis;

ropa por tela;

rustido por asado o por tostado;

saber mal (algo) por lamentar (algo);

sucar por mojar o mojar en/de;

tanca por cierre (de un vestido, etc.);

talón por tacón;

tirar por echar: Cuando salgas, tira esta carta al buzón;

tornavís por destornillador;

torre por chalet, casa de campo;

venir por ir: ¡Ya vengo!; Te vendré a ver pronto;

visitarse por ir al médico;

yo de usted/  por yo que usted/ tú;

¡y tanto! por ¡ya lo creo!

2. Catalanismos morfológicos y morfosintácticos

Son catalanismos morfológicos y morfosintácticos habituales:

1. El uso de sin con un valor adverbial que tiene en catalán, pero no en castellano, donde sólo es preposición:

Con bigote tiene más cara de policía que sin (en lugar de Con bigote tiene más cara de policía que sin bigote / sin él).
2. El uso del adjetivo indefinifo cada —que en castellano es distributivo— cuando el texto pide un sentido de frecuencia:
Los días de cada día voy a trabajar (en lugar de Los días de diario voy a trabajar).
Olga va cada semana a misa (en lugar de Olga va todas las semanas a misa).

Nota normativa: Este último uso es aceptable en castellano cuando, después de cada, se aplica un numeral (cf. <https://dle.rae.es/cada#6a9NObu>, acepción 2):

Su hijo la visita cada tres meses. 

3. La supresión de la preposición a delante de complemento directo de persona:

Hemos pasado de nombrar Messi balón de oro y pichichi a lanzarle las más duras críticas (en lugar de Hemos pasado de nombrar a Messi balón de oro y pichichi a lanzarle las más duras críticas).
Advertencia: Supone una ultracorrección (o un error, simplemente), añadir la preposición a delante de complemento directo de cosa:
Los primeros tipos emulaban a la caligrafía (palabra que, en griego, significa ‘escribir con letra hermosa’) y la escritura manuscrita cotidiana. 

4. El uso de la preposición de en estructuras partitivas impropias del castellano:

En Barcelona, de museos hay un montón (en lugar de En Barcelona hay museos a porrillo / En Barcelona hay muchos museos / En Barcelona hay museos a montones).
Ya basta de esto (en lugar de ¡Ya basta! ¡Es suficiente!)
5. El uso de que expletivo en oraciones interrogativas:
¿Que se ha roto? (en lugar de ¿Se ha roto?)
¿Que vendrás mañana? (en lugar de ¿Vendrás mañana?)
6. El uso del que galicado (también muy común en el español de América):
Fue entonces que noté que no estaba en su habitación (en lugar de Fue entonces cuando noté que no estaba en su habitación).
Fue por eso que recurrí a una gran amiga suya (en lugar de Fue por eso por lo que recurrí a una gran amiga de ella).
7. La supresión de que en la locución conjuntiva una vez que ‘cuando, después de que’:
Los bomberos solamente actúan una vez se produce el fuego. 

8. Cuando en la oración de relativo se repite la preposición de la oración principal, la supresión del artículo entre la preposición y el pronombre relativo:

En la ciudad en que vivo hay mucha contaminación sonora y atmosférica (en lugar de En la ciudad en la que vivo hay mucha contaminación sonora y atmosférica).

Hay muchos más casos de interferencia del catalán-valenciano en el castellano a todos los niveles. Para un conocimiento más profundo, se recomiendan esta obra:

Rodríguez Vida, Susana: Catalán-castellano frente a frente. Errores más habituales de los hablantes bilingües (pról. de J. Ruaix), Barcelona: Inforbook’s, 1997.



lunes, 3 de junio de 2024

Por qué la RAE no tiene razón al situar el punto siempre fuera de las comillas. (Píldoras de estilo editorial, 2)

A pesar de que en la última edición de la ortografía académica (2010) se indique (§ 3.4.8.3) que el punto final se coloque siempre fuera de las comillas de cierre, esta indicación parte de un error conceptual sobre la naturaleza ortográfica y semántica de las comillas.

En realidad, existe una razón de peso para poner el punto dentro de las comillas de cierre cuando lo entrecomillado es una frase independiente, es decir, no inserta dentro de otra de la que dependa, como en:

«Tenemos —dijo el director— que resolver estos problemas lo más pronto posible.»
La independencia de esta cláusula entrecomillada se ve mucho más clara cuando ella misma incluye otra cita:
Jorge me citó en el monumento de la Plaza Mayor a la cinco de la tarde. «No llegues tarde, que dicen que a las seis lloverá —me advirtió—. Ya sabes lo que dice el refrán: “En abril, aguas mil”.»
La necesidad de cerrar la oración entrecomillada poniendo el punto dentro se debe al hecho de que las comillas no son signos de puntuación, como los considera la Real Academia Española, sino signos auxiliares de la puntuación (así los clasifica Martínez de Sousa, en su OOTEA3, 2011, p. 300) con valor metalingüístico, que no forman sintácticamente parte de la oración. Es decir, las comillas acotan una oración completa (punto dentro) o parte de una oración (punto fuera) para marcarla metalingüísticamente como cita (voz distinta a la que enuncia el texto principal), algo que se traslada al lenguaje de marcado, como el html, con las etiquetas demarcativas <q> y /<q>. Pero, a efectos sintácticos, es como si no existieran; de hecho, las comillas de cita principal desaparecen si la cita es larga y se dispone en párrafo aparte y en cuerpo menor, sangrada incluso en bloque por la izquierda. En este caso, en html se demarcan como <blockquote> y /<blockquote>.

Por tanto, en coincidencia con las comillas:

❶ El punto se pone dentro de las comillas de cierre cuando lo entrecomillado es una frase independiente, es decir, no inserta dentro de otra de la que dependa:

«Tenemos —dijo el director— que resolver estos problemas lo más pronto posible.»
❷ El punto se pone fuera de las comillas si lo entrecomillado depende de una oración que empieza antes del entrecomillado, caso en el cual las comillas de apertura suelen ir precedidas de dos puntos, coma u otro signo que no ejerza las funciones de punto:
El director dijo: «Tenemos que resolver estos problemas lo más pronto posible».

(Todo esto y muchíiisimo más en mi curso para AulaSIC ᴏʀᴛᴏ(ᴛɪᴘᴏ)ɢʀᴀꜰɪ́ᴀ ᴅᴇʟ ᴇꜱᴘᴀɴ̃ᴏʟ ʏ ᴄᴏᴍᴘᴀʀᴀᴅᴀ: <https://www.aulasic.org/es/de-especializacion/ortotipografia-comparada.html>.)

domingo, 18 de febrero de 2024

¿Qué hacer con las redenominaciones toponímica?​ (Píldoras de estilo editorial, 1)


Por razones políticas, los nombres de lugar de la toponimia tanto mayor como menor sufren de cierta labilidad. Así, es común que, una vez emancipados, los territorios ocupados o colonizados en procesos bélico-políticos expansionistas, cuya toponimia original ha sido sustituida por el ocupante por denominaciones nuevas o deturpadas, recuperen oficialmente sus nombres geográficos originales o les apliquen una nueva denominación más acorde con la propia tradición. O que, acabado un determinado período político, generalmente dictatorial, un mismo país soberabo y sus territorios recuperen su toponimia anterior.

Así, por ejemplo, Maputo, nombre oficial desde 1976 de la capital de Mozambique, sustituyó al topónimo colonial Lourenço Marques (traducido al castellano como Lorenzo Márquez). Ceilán cambió el nombre colonial del país en 1972 por Sri Lanka. Desde 1995, los nombres oficiales de Bombay y Calcuta son las formas más autóctonas Mumbai y Kalkota. La República Democrática del Congo (también conocida como Congo-Kinsasa) se llamó República del Zaire (y el Zaire) entre 1971 y 1997, durante la dictadura de Mobutu Sese Seko, y recuperó su denominación histórica tras el cambio político. Igualmente, la ciudad rusa de Tsaritsin se convirtió en Stalingrad (Stalingrado) durante la etapa soviética (de 1925 a 1961), para convertirse después en Volgograd (‘ciudad del Volga’, Volgogrado en castellano). La antigua capital de Birmania (hoy Myanmar) cambió el nombre colonial inglés de Rangoon (castellanizado como Rangún) por el de Yangon. Y el topónimo Yugoslavia desapareció tras la caída del bloque soviético y la guerra de los Balcanes, dando lugar, después de diversas reconfiguraciones, a la creación de siete países: Bosnia y Herzegovina, Croacia, Eslovenia, Macedonia del Norte, Montenegro, Servia y Kosovo.

Cuando se da el caso de que el topónimo del período imperial, colonial, dictatorial, unitarista, etc., es el que inspira el exónimo e incluso el gentilicio en castellano, y no existe un exónimo ni un gentilicio para el topónimo recuperado o nuevo, surgen dudas y polémicas sobre qué forma usar. La recomendación de las entidades de regulación toponomástica y geográfica (las academias de la lengua no lo son) es adaptarse a las nuevas denominaciones, no sólo por respeto, sino porque son las que aparecen en nomenclátores y mapas y las que nos facilitan su identificación y localización. Durante el período inicial de implantación del nuevo topónimo, para facilitar la transición se aconseja poner entre paréntesis el exónimo anterior. Esta adaptación incluye propuestas de algunos libros de estilo como la de crear un nuevo exónimo adaptado; por ejemplo, tildando la nueva forma: «Mumbái (antigua Bombay)» o «Yangón (antigua Rangún)».

El mismo criterio afecta a transliteraciones al sistema latino de escritura. Por ejemplo, en las romanizaciones de los nombres de Ucrania, hoy se recomienda usar las formas transliteradas del ucraniano, en lugar de las formas rusas anteriores a la disolución de la Unión Soviética en 1991 que se recogen en atlas y mapas previos a esta fecha; así, se usará Cherníhiv (ucraniano: Чернігів) en lugar de Chernigov (ruso: Чернигов) y Odesa (Одеса) en lugar de Odessa (en ruso: Одесcа).

La recomendación de adaptarse a las nuevas denominaciones también responde a una tendencia a usar cada vez menos el recurso de la exonimia. A consecuencia de la globalización y del aumento del poliglotismo entre la población, las distancias son mucho menores, el contacto con nombres extranjeros es mayor y la dificultad de pronunciarlos también se ha reducido.


martes, 21 de noviembre de 2023

¿Un final del túnel para la crisis de los oficios de la edición?


Con la irrupción de la autoedición en el mundo editorial a principios de la década de 1990, que propició una aceleración y abaratamiento de los costes de producción, mayor productividad y un margen más amplio de beneficios en el sector (el habitual era hasta entonces de un 6 %), aterrizaron en el mundo del libro grandes conglomerados de empresas que empezaron a adquirir editoriales y a concentrarlas en pocas manos, aplicando prácticas empresariales muy extractivas, impropias de la industria cultura. A raíz de ello, el sector editorial sufrió, de manera acelerada, profundos desequilibrios y transformaciones estructurales, que han repercutido de forma decisiva en los procesos de producción de impresos. Una de las consecuencias más graves de este «ultracapitalismo» que vino de la mano de la primera revolución tecnológica digital fue la drástica reducción de las plantillas editoriales. Salvo en algunas editoriales médicas y en las de libro de texto —cuyo producto exige un especial control de calidad, para adaptarse a normativas de diversa índole, incluidas las lingüísticas—, los departamentos de corrección, donde se desarrollaban las tareas de preparación, edición y corrección de textos (antes y después de componerse) desaparecieron de las editoriales, y muchos departamentos de edición han acabado también externalizando la labor de edición de textos y a los editores de mesa.

Como consecuencia, procedimientos laboriosos, como la preparación y corrección de originales y el editing, se realizan siempre —en los dos primeros casos— o muy a menudo —en el segundo— externamente, a menudo sin criterio ni control algunos, o incluso llegan a obviarse. Digo «sin criterio ni control algunos» por dos razones:

1. Hasta las década de 1990, el tipo de aprendizaje de estas profesiones era gremial. Se ingresaba en una editorial, habitualmente desde cualquier carrera de letras (o desde el mundo de las artes gráficas, o como traductor con una cierta experiencia en la traducción de libros), y los jefes de departamento se encargaban de ir formando a sus aprendices. En esa época, los correctores —que también ejercían de preparadores de originales y correctores de pruebas, siempre en plantilla— eran gente muy bregada en el trabajo con todo tipo de textos y verdaderos pozos de sabiduría, que se trataban de tú a tú con académicos de la lengua. 

Ni que decir tiene que el gran ortógrafo, ortotipógrafo y bibliólogo José Martínez de Sousa ha sido casi toda su vida corrector editorial y editor de mesa (él mismo acuñó este término). Pero un ejemplo menos conocido y paradigmático de la tradicional erudición de estos profesionales lo tenemos en las Normas para correctores y compositores tipográficos encargadas por Espasa-Calpe a uno de sus correctores (José Fernández Castillo) en principio para uso de la propia empresa, pero que finalmente hizo públicas en 1959. Como explica su introducción, José Fernández Castillo se limitó a presentar una lista, por orden alfabético, de aquellas palabras que, según su experiencia, solían dar lugar a dudas, con el objeto de que los demás correctores presentaran las modificaciones que estimaran oportunas. Estos, a su vez, presentaron un pliego de enmiendas y adiciones, al cual contestó el autor de la propuesta con una réplica. Finalmente, para dirimir los asuntos más controvertidos, Espasa-Calpe requirió la intervención del académico y lexicógrafo Julio Casares, que accedió amablemente al requerimiento y que, después de leer la argumentación y razonamientos de ambas partes, dio su opinión a título puramente personal. El resultado fue una obrita realmente erudita, que mantiene la estructura del suculento debate que le dio origen: «Propuesta», «Pliego de enmiendas y adiciones», «Réplica al “Piego de enmiendas y adiciones”» y «Dictamen».

Algo así, hoy, es imposible. Cuesta incluso encontrar a personas capacitadas para redactar libros de estilo. Y esto es así porque la reducción drástica de plantillas y departamentos interrumpió, de la noche a la mañana, este tipo de transmisión directa, experta y, por supuesto, aplicada del conocimiento, dando lugar a un nuevo negocio: la formación editorial, con propuestas formativas a menudo independientes del sector, de calidad muy dispar, cuyo objetivo era llenar este hueco. 

En el grado universitario, las carísimas maestrías de edición que empezaron a proliferar en esa década y que aún continúan, dejaron pronto de contemplar los procesos editoriales, para centrarse en las cuestiones que interesan a un editor (publisher) o a un director editorial, pero no a un asistente editorial, a un editor de mesa o a un técnico editorial.

En este negocio han entrado las propias editoriales, desde sellos pequeños (como Ático de los Libros) hasta los grandes grupos (como Santillana, con un máster ya de varias vidas, o como Grupo Planeta con su maestría editorial auspiciada por la Universitat de València y enfocada a directivos de Latinoamérica, o como Penguin Random House Mondadori con su escuela Cursiva), que así han pasado de formar gratuitamente a sus empleados, a cobrar a los aspirantes por una formación cara e incluso por lo que parece trabajo real encubierto («oportunidad de trabajar con un texto inédito»). La mayor ventaja de algunas de estas ofertas la tienen los trabajadores que ejercen como docentes, sacándose un sobresueldo a la vez que explican lo que saben de las labores que hacen a diario.  

En consecuencia, tareas como la edición de textos o la corrección editorial suelen aprenderse deficientemente por falta de una formación adecuada y por requerir muchas horas de rodaje, que ninguna formación ofrece ni puede ofrecer. Caso excepcional, al menos en España, son los certificados de profesionalidad, casi siempre gratuitos, dirigidos a personas con experiencia en el sector o a personas en paro, que incluyen una formación muy completa en el campo de la asistencia a la edición, pero que fallan, como cualquier otra formación, en la parte práctica. 

Así pues, se puede elegir la mejor y más completa formación posible, con los expertos más destacados y experimentados, pero el aprendizaje aplicado que formaba parte de la formación gremial previa al 1990 ya no existe ni lo pueden suplir las prácticas en empresas. De hecho, debido a la sobrecarga de trabajo que sufre hoy en día el personal de los departamentos editoriales o de las editoriales pequeñas (estructuralmente minimalistas, con personal todoterreno), una persona en prácticas suele suponer un estorbo más que una ayuda, y en lugar de enseñarle, suelen encomendarle tareas mecánicas o pseudoadministrativas.

2. Por esta falta de formación externa regulada, equilibrada y de calidad consistente, por la práctica imposibilidad de aprender estos oficios debidamente solo con formación, y por la escasez de personal interno y sobrecarga de trabajo en los departamentos de edición, redacción y producción, lo cierto es que durante las tres últimas décadas ha sido corriente en el sector encontrarse con profesionales con una capacitación muy dispar, que a menudo no sabían en qué consistía su oficio ni cómo actuar, o que no tenían tiempo para guiar el trabajo de sus colaboradores externos.

 

Esta situación empezó a cambiar con la segunda gran revolución digital, que afectó al soporte de lectura y no solo a la tecnología de producción: la aparición del libro digital, e-libro o ebook. La enorme facilidad no solo de producción, sino de difusión que suposo el e-libro conllevó la aparición de nuevos actores en la escena editorial: empresas y plataformas de autoedición y autopublicación, a las que los autores acuden directamente para sufragar la edición y difusión en línea de su obra, con resultados muy irregulares; empresas de coedición, que «teóricamente» no cobran a los autores pero que resultan no pocas veces fraudulentas, e incluso agentes literarios que empezaron a publicar en formato digital a sus representados. 

Para hacer frente a esta nueva competencia y distinguirse de ella, los editores tradicionales han tenido que recuperar tres elementos que permiten reposicionarse en el mercado con un lavado de cara: 

1) el juego limpio con el autor, los proveedores y los colaboradores editoriales (que les evita sufrir estafas editoriales);

2) la capacidad de selección (que permite descubrir talento y cubrir necesidades de conocimiento y disfrute cultural);

3) y la calidad y buena técnica editorial (es decir, el oficio que ahorra al lector el fraude editorial y una mala experiencia de lectura). 

Gracias a ello, parece que empieza a valorarse de nuevo a los profesionales bien preparados para gestionar cualquier fase del proceso editorial y desarrollar cualquiera de sus tareas, con lo que, en este momento, la cualificación y la experiencia vuelven a estar presentes en este sector, combinadas aún con la baja calidad heredera de la época previa.

Bregar por que esta incipiente tendencia se afiance, poniéndola en valor, debería ser uno de los objetivos de cualquiera que haga o consuma libros, en el soporte que sea. Porque el principal beneficiario es el lector, y el beneficiario indirecto, cada editor que hace brillar su oficio para enriquecer el mundo y crear y fidelizar lectores.


martes, 7 de noviembre de 2023

S​obre la (relativa) utilidad de Google Books Ngram Viewer para la corrección de textos

Google Books Ngram Viewer es un buscador en línea que permite representar en un gráfico la frecuencia anual de cualquier grupo de búsquedas con formato de texto delimitado por comas, desde el año 1500 hasta el 2019 (por el momento). El buscador utiliza como base de datos el corpora de texto de Google Books en inglés, chino (simplificado), francés, alemán, hebreo, italiano, ruso o español.

El programa es capaz de ejecutar búsquedas por palabra(s) o por frase. Para utilizarlo, deben seguirse los siguientes pasos:

❶ Ingresar en el buscador: https://books.google.com/ngrams/

❷ Introducir un término o una serie de términos separados por comas (los llamados n-gramas).

❸ Si se desea, acotar el período de la búsqueda.

❹ Elegir el corpus idiomático que se quiere consutar.

❺ Si se desea, activar la opción de ortografía case-sensitive (que compara el uso exacto de las mayúsculas y minúsculas).

❻ Elegir el factor de precisión (smoothing) entre 0 y 50, con 3 como valor por defecto. Mientras más grande sea el factor, más suave es la curva de la gráfica que se obtiene.

❼ Una vez obtenida la gráfica, podemos ver datos más concretos moviéndonos sobre ella con el cursor, y consultar también en qué obras en concreto se ha hecho la búsqueda clicando en las opciones temporales del recuadro inferior.

Sobre su utilidad para la corrección de textos, nos permite hacernos una cierta idea de los usos más frecuentes en un período determinado de tiempo, y compararlos. Si, por ejemplo, se hace una búsqueda entre 1900 y el 2019 de los términos <parqué,parquet,parket> en español, sin activar case sensitive y con la precisión por defecto, veremos que, en la mayor parte del siglo pasado, el uso escrito preferente (y aún sostenido) de este término era parquet, mientras que parqué y parquet tenían un empleo similarmente bastante inferior. Parqué empieza a ascender cuando aparece por primera vez como adaptación del francés parquet en el DRAE1970, pero despega claramente con la edición del 2001 del DRAE (la primera digital; https://www.rae.es/drae2001/parqu%C3%A9) y especialmente con la del Diccionario panhispánico de dudas en el 2005 (https://www.rae.es/dpd/parqu%C3%A9).  

No podemos, sin embargo, obtener ninguna información sobre la pronunciación de este término, ni tampoco sobre la distribución geográfica de las tres variantes escritas más comunes en textos en castellano. Pero sí se puede intuir el poder de la obra normativa sobre los usos escritos, particularmente desde su difusión masiva en la red. Eso sí: si se hace una búsqueda sobre palabras de exclusivo cuño académico, como el puentismo que se sacó de la manga el DPD (https://www.rae.es/dpd/puentismo) para desplazar al híbrido puenting, se comprueba que el largo brazo de la RAE tiene ciertas limitaciones cuando la Docta contraría el uso real.