jueves, 10 de octubre de 2024

De inteligencia artificial, corrección y edición de textos, y academias de la lengua española

Después de diversas lecturas sobre los avances de la IA generativa en lo relativo a la lengua española/castellana y el camino por recorrer, y teniendo ya mi propia experiencia en el uso de ChatGPT4 en el trabajo textual editorial, me topé en LinkedIn con esta charla de Javier Muñoz-Basols sobre los sesgos lingüísticos digitales en el desarrollo de las IA.

 


Al hilo de lo que se comenta e ilustra en la charla, me atrevo a hacer algunas constataciones y reflexiones sobre el desarrollo de las herramientas de IA para trabajar con el castellano, concretamente para las labores de corrección y edición de textos. No hay mucho que decir al respecto, aparte de que está en mantillas y se le augura un avance lento y complicado.

Este retraso con respecto a otras lenguas internacionales con gran número de hablantes tiene diversas causas estructurales, financieras y técnicas (como la ausencia de una estrategia común de desarrollo entre los países donde el castellano es hegemónico, la insuficiente inversión en IA en y para el castellano, y la inexistencia de una metodología de evaluación comparativa de los modelos de lenguaje de propósito general [usos generales] y específico [usos especializados], entre otros aspectos). Pero sobre todo es la herencia de una carencia que el español viene arrastrando: la insuficiencia de datos (diccionarios, corpus, catálogos de entidades nombradas, terminologías especializadas, anotaciones, gramáticas, etc.) con los que puedan desarrollarse y funcionar los modelos que sirven para entrenar las IA. Sin ellos, no pueden entender la inmensidad de textos en español, aprender a discriminar y reconocer en estos patrones de lengua distintos y a deducir con finura qué uso es el apropiado para un determinado contexto.

Como explicamos diversos autores de El dardo en la Academia —entre otros especialistas que han incidido en este problema—, el español/castellano es una lengua deficientemente descrita y equipada. De hecho, en favor del modelo estándar de «lengua común» (ese ideal político del panhispanismo tan reñido con el avance del conocimiento lingüístico), se ha estado relegando e incluso bloqueando el estudio de los diversos registros técnicos y de la dinámica variedad lingüística social y geográfica de la lengua. Para ilustrar con un solo ejemplo el deficiente equipamiento del castellano, a un nivel lexicológico y lexicográfico es clamorosa la falta de diccionarios descriptivos integrales de las diversas variedades nacionales de lengua (sólo hay tres: el de España, el de Argentina y el de México).

Incluso limitándonos al modelo estándar de lengua correcta (el académico), no diré nada nuevo al afirmar que contiene numerosas contradicciones, inconsistencias, errores y asistematicidades metodológicas, y que presenta múltiples huecos. Dado, además, el aún insuficiente conocimiento de la llamada norma culta del español, el estándar panhispánico es incapaz de definir qué es aceptable o no en la variedad culta (escrita o hablada) de un país en un momento dado, con lo que su aportación a la nutrición de las IA para que redacten, localicen o corrijan es también muy limitada. La escasa utilidad de estas herramientas para la corrección —⁠que se reduce a la detección y enmienda de ciertos aspectos normativos de algunas variedades— es algo que puede comprobarse simplemente intentando que ChatGPT4 mejore la redacción y corrija, adecuándolo a un lector de perfil geolectal variado, un texto extenso en una de esas variedades nacionales mal descritas y con pocos equipamientos (por ejemplo, el chileno santiagueño). Aun cuando se le informe de qué variedad y tipo de texto es y de qué resultado se quiere obtener, ChatGPT4 no da pie con bola o se inventa soluciones disparatadas o fuera de lugar. Eso sí, pide reiteradas disculpas por no haber sido útil.

En este punto, hago un breve apunte sobre el papel de las academias de la lengua en el desarrollo de la IA en y para el castellano. Estas instituciones (la RAE, particularmente) sí pueden proveer corpus y otros materiales útiles para este fin, pero su celo por controlar su obra y sus derechos de explotación es bien conocido. El material que pueden ofrecer no se emplearía tal cual es, sino que pasaría procesos de revisión, modificación y refinamiento que escaparían al control de las academias y a sus fines, por lo que personalmente dudo de que vayan a ceder nada fácilmente. De hecho, el único proyecto de las academias relacionado con la IA es el proyecto Leia, patrocinado por Telefónica y en colaboración con Google, Amazon, Microsoft, Twitter y Facebook (patrocinio y colaboraciones nada altruistas) y con una dotación de 5 millones de euros por parte del Gobierno español, cuyas líneas principales son «velar por el buen uso de la lengua española en las máquinas» y «crear herramientas que fomenten el uso correcto del español [o sea, el modelo estándar escrito] en los seres humanos». A ver qué pasa si las máquinas pensantes empiezan no sólo a usar el estándar académico, sino a detectar sus fallos...

En consecuencia y recapitulando: si no se hace el trabajo lingüístico pendiente, ni se ponen los datos existentes a disposición de los proyectos públicos en marcha, ni estos se centran también en la lengua y se coordinan internacionalmente, las IAs en y para el español no evolucionarán bien —y que lo hicieran tampoco sería ni fácil ni rápido—, con lo que será imposible que resulten útiles para el trabajo con la lengua en todos sus niveles y en todos los territorios de uso del castellano.

Finalmente, yendo a mi campo profesional, la pregunta que cabe hacerse es: ¿Cómo afecta al ámbito de la edición de textos esta limitación de las herramientas de IA de uso más común? Pues de diversas maneras. Combinada con la concentración geográfica de la edición en castellano, la escasa utilidad de las IA está teniendo dos efectos: o peores publicaciones, o una revaloración del trabajo humano y la descentralización de la labor editorial. Me explico. Como es sabido, España —y concretamente Barcelona⁠— es el centro de publicación mundial en esta lengua, y no sólo en la variedad peninsular central. Autores de todo origen, de ficción y no ficción, publican en Barcelona o en Madrid, pero los editores y correctores locales no tienen recursos para tratar sus textos adecuadamente, y las IA tampoco les son de ayuda. El resultado es o un tratamiento improvisado y chapucero de estas obras o, si se quieren hacer bien las cosas, el recurso a un colaborador nativo de la variante del texto que se edita, con lo que el trabajo editorial en España se externaliza a otros países.

En cualquier caso, las deficiencias que presentan las IA conducen, de momento, a la continuidad de una labor exclusivamente humana en este campo, seguramente durante años. Por el simple hecho de que un corrector humano bien formado conoce bien su propia lengua (al menos, diversas variedades de ella) y porque es también capaz de apreciar y analizar la complejidad de cada obra que pasa por sus manos, es a día de hoy todavía más ágil, adecuado y eficaz que la máquina pensante. Y en cuanto al editor, un profesional serio siempre conocerá mejor que una entidad digital —⁠que ni siquiera vive en la sociedad humana— a los receptores (lectores) potenciales de cada obra y a sus autores y, por supuesto, preferirá seguir sus propios objetivos, criterios e intuiciones en cuanto al peculiar producto editorial que quiere obtener. 

En fin, desde este blog, seguiremos observando.



lunes, 7 de octubre de 2024

El uso del artículo ante los años. (Píldoras de estilo editorial, 4)


 

El asunto del empleo u omisión del artículo ante los años es una cuestión que las academias han embrollado hasta lo indecible desde que se fue acercando el año 2000 y a alguien se le ocurrió formularles una duda sobre este particular en el sitio de internet de la RAE. Según comenta José Martínez de Sousa en su Ortografía y ortotipografía del español actual (OOTEA3, 2014, p. 278), como respuesta nada reflexionada a esta duda, la Academia española recomendó el uso sin el artículo para los años posteriores al 1999. Pero ante el empecinado empleo del artículo por parte del hablante y las críticas recibidas, se vio obligada a rectificar. Como particularmente la RAE no lleva bien reconocer los errores, lo que ocurrió es que rectificó a medias, y así es como se inició un camino errático sobre este asunto en la obra académica. Sigámoslo paso a paso para intentar llegar a buen puerto. 

En la primera edición del Diccionario panhispánico de dudas (DPD2005, s. v. «Fecha», § 4c), las academias decían:

a) Del año 1 al 1100 es más frecuente el empleo del artículo, al menos en la lengua hablada: Los árabes invadieron la Península en el 711. Pero no faltan abundantes testimonios sin artículo en la lengua escrita: «Ya en 206 a. de J. C. tiene lugar la fundación de Itálica»(Lapesa Lengua [Esp. 1942]). b) Del año 1101 a 1999 es claramente mayoritario el uso sin artículo:Los Reyes Católicos conquistaron Granada en 1492, si bien no dejan de encontrarse ejemplos con artículo: «Nací en el 1964» (RdgzJuliá Cruce [P. Rico 1989]). Si se menciona abreviadamente el año, suprimiendo los dos primeros dígitos, es obligatorio el empleo del artículo: En el 92 se celebraron las Olimpiadas de Barcelona. c) A partir del año 2000, la novedad que supuso el cambio de millar explica la tendencia mayoritaria inicial al uso del artículo: Fui al Caribe en el verano del 2000 o La autovía estará terminada en el 2010. Sin embargo, en la datación de cartas y documentos no son tan marcadas las fluctuaciones antes señaladas y se prefiere, desde la Edad Media, el uso sin artículo: 14 de marzo de 1420. Por ello, se recomienda mantener este uso en la datación de cartas y documentos del año 2000 y sucesivos: 4 de marzo de 2000. Esta recomendación no implica que se considere incorrecto, en estos casos, el uso del artículo: 4 de marzo del 2000. Naturalmente, si se menciona expresamente la palabra año, resulta obligado anteponer el artículo: 5 de mayo del año 2000.
 

En su OOTEA3 ( 2014, pp. 278-279), Martínez de Sousa expuso diáfanamente las evidentes objeciones que suscitan estos párrafos a cualquier mente racional (las negritas son mías):

1. «No se entiende por qué la Academia asegura que la tendencia al uso del artículo se debe a la novedad que supuso el cambio de millar. La razón no es esa, sino la mayor comodidad de los usuarios de la lengua para expresarse con el artículo que sin él. Tampoco se entiende que si la tendencia mayoritaria era el uso del artículo, la Academia colocase una nota en su sitio de Internet para recomendar el uso sin el artículo.» De hecho, como el mismo Martínez de Sousa anota, si se dice en el 3000 antes de Cristo y no en 3000 antes de Cristo, la simple analogía lleva a decir espontáneamente en el 2002 después de Cristo y no en 2002 después de Cristo.

2. «No hay ninguna razón gramatical clara por la cual esto [el uso del artículo ante el año] deba ser de una manera o de otra; solo podemos basarnos en el uso y la tradición, mayoritariamente favorables al artículo en fechas anteriores a Cristo hasta el 1100 después de Cristo y desde el 2000 en adelante».  

3. «Sorprende que la Academia hable del uso sin artículo en cartas y documentos cuando a) las cartas son también documentos; b) no se adivina cómo ha llegado a la conclusión de que, cuando se cambió de siglo y de milenio, en la datación de cartas y documentos la tendencia a la escritura con artículo fluctuó, puesto que la Academia no tuvo ni siquiera tiempo de analizar el uso. Sorprende también que diga que desde la Edad Media se prefiere el uso sin artículo, “consolidando en la práctica —dice⁠— una fórmula establecida” […] ¿Qué fórmula? ¿Quién la había establecido? ¿Qué práctica invoca la Academia y a quién la atribuye?» Y añade este eminente ortógrafo: «Hay que recordar que en la Edad Media difícilmente se dedicaba nadie a vaticinar cómo se escribirían las fechas en el cambio del siglo xx al xxi.».  

4. «Con esta última norma [“Esta recomendación no implica que se considere incorrecto, en estos casos, el uso del artículo”] habría suficiente y se habría ahorrado el marasmo creado artificial e injustificadamente en la escritura de las fechas. En cualquier caso, la fuerza de la recomendación académica (tomada como norma en forma absoluta) solo afecta a las fechas completas, no a las referencias a un determinado año en que ha sucedido o sucederá algo: La carretera se construirá en el 2008; El puente no estará terminado hasta el 2005; En el 2050 España tendrá menos habitantes que en el 2002.»

 

Dándose un poco de tiempo, las academias habrían podido confirmar que la tendencia espontánea entre los hablantes era al uso del artículo —algo perfectamente rastreable y verificable en los primeros años del nuevo milenio⁠— e incorporarlo a su obra, ya que tanto alardean de que la norma simplemente recoge el uso. Pues no sólo no lo hicieron, sino que su improvisación e incoherencia condujo a que, incluso entre profesionales de la lengua (particularmente periodistas, traductores y hasta correctores), empezara a cundir la idea (y la práctica) de que había que omitir sistemáticamente el artículo ante los años posteriores al 2000.  

Por fortuna, una de las pocas obras académicas que tienen detrás un trabajo concienzudo de estudio y análisis del uso, la Nueva gramática de la lengua española (NGLE2009), intentó poner un poco de orden y racionalidad en el asunto. Así, la NGLE14.8p) observa la falta de naturalidad en la elisión del artículo en los siguientes casos (la negrita también es mía):


14.8p La estructura del numeral que designa el año es también pertinente para la elección del artículo. Se ha observado que la presencia de artículo es más frecuente cuando se trata del año 2000 o los posteriores a él, exceptuadas las oraciones copulativas a las que se hizo referencia en el § 14.8ñ. Resultaría, en efecto, forzada la omisión del artículo que se subraya en estas oraciones:


Hablar del 2000 era hablar de un año tan remoto que el mundo tal vez estaría de cabeza para entonces (Tiempo [Col.] 7/4/1997); El2000 supuso una ruptura en la evolución creciente del nuevo empleo (Norte Castilla 6/2/2001),


o en pares como los siguientes: {1974 ~ El 2000} transcurrió sin demasiados contratiempos; Dejemos {1930 ~ el 2002} a un lado; Agradezco {a 1930 ~ al 2002} todo lo que me dejó. La variante con artículo es mucho más frecuente si el año está comprendido entre el 1 y el 1100, pero se percibe mayor alternancia en estos contextos: Algunos autores lo dan como inaugurado en el año 692 a. de C., otros en el 980, y aun en 1050 (Tagarano, San Bernardo). Cuando la referencia al año se hace por sus dos últimas cifras, se emplea siempre con artículo: Stroessner cayó en el 89.



Un año después, la también académica Ortografía de la lengua española (OLE2010) no hizo ninguna alusión a este asunto, aunque siguió omitiendo el artículo en los ejemplos de las fechas. Para rematar la confusión, la revisión en curso del DPD (s. v. «Años» § 3) obvia lo expuesto en la NGLE2009 y vuelve a sus trece:


A partir del año 2000, la novedad que supuso el cambio de millar explica la tendencia mayoritaria inicial al uso del artículo: Fui al Caribe en el verano del 2000 o La autovía se terminó en el 2010, pero hoy la mención de estos años ya se ha asimilado a la del resto y es más habitual omitir el artículo [sic]: En 2023 se espera una fuerte bajada de la inflación.

En la datación de cartas y documentos se prefiere el uso sin artículo: 14 de marzo de 1420, 5 de noviembre de 2021. Naturalmente, si se menciona expresamente la palabra año, resulta obligado anteponerlo: 5 de mayo del año 2000.


Es mucho decir que «hoy la mención de estos años ya se ha asimilado a la del resto y es más habitual omitir el artículo». Pero, desde luego, los casos en que esto se da son consecuencia del empeño académico en no rectificar sus errores. Es este, por cierto, un mecanismo de creación de nueva norma panhispánica demasiado común. Como decía un querido colaborador de este blog:

Lo malo es que mucha gente toma en serio, con total buena fe, lo primero que la RAE publica. Luego,la RAE cantará victoria diciendo: «Está en el uso». Y así se construye lo que llaman burocráticamente norma panhispánica pluricéntrica.

Ante este panorama, no sólo Martínez de Sousa sino no pocos autores, profesionales y redactores de libros de estilo optamos por la tendencia realmente más común en la lengua: utilizar el artículo el ante los años anteriores al 1101 y posteriores a 1999 (incluso en la datación no abreviada). Así:


De/en + año

el/del/en el + año

Entre 1101 y 1999:

América fue descubierta en 1492.

(Con las excepciones mencionadas por la NGLE2009 en el párrafo 14.8p, anteriormente citado.)

En fechas anteriores a Jesucristo (a. C.):

Esto sucedió en el 3000 a. C.

Entre el año 1 y el 1100:

Los árabes llegaron a España en el 711.

Desde el 2000 en adelante:

Esta ley no entrará en vigor hasta el 2002.

A 27 de noviembre del 2024.

domingo, 9 de junio de 2024

Los catalanismos en las publicaciones. (Píldoras de estilo editorial, 3)

 


 

El hecho de que Barcelona (capital de Cataluña, cuya lengua propia es el catalán) sea el centro mundial de la edición en castellano y de que, en muchos casos, los editores y colaboradores del gremio tengan diversas variedades nativas del catalán, hace demasiado presente en los libros la interferencia del catalán en el castellano (un fenómeno distinto del de las voces del castellano históricamente procedentes del catalán). Y digo «demasiado presente» porque el mercado del libro en español es muy amplio y muy variado idiomáticamente y, salvo en las obras literarias, tiende en lo posible a la neutralización para evitar problemas de comprensión en el lector (lo que no resulta fácil debido a la escasez y a la deficiente disponibilidad de herramientas lexicográficas contrastivas y de bases de datos sobre variación geográfica).

Para ayudar a neutralizar un texto también en lo relativo a las consecuencias del contacto lingüístico catalán-castellano, se ofrece aquí un compendio de los catalanismos léxicos, morfológicos y morfosintácticos más frecuentes:

1. Catalanismos léxicos

Son catalanismos léxicos (términos o locuciones) frecuentes:

 

a más a más (calco de a més a més), por además;

abrir (calco de obrir), por encender / prender o conectar: Abre la luz, que está oscureciendo;

aburrir (calco de avorrir), por aborrecer: De tanto verlo lo tengo aburrido [cat. el tinc avorrit];

al mediodía (calco de al migdia), por a mediodía;

aparador (calco de aparador), por escaparate;

atabalar(se) (calco de atabalar(-se), por alterar(se), atolondrar(se), agobiar(se);

atrotinado (calco de atrotinat), por destartalado, desvencijado;

badar (calco de badar), por despistarse, andar despistado: Iba badando con el móvil y se chocó con otro transeúnte;

bambas (calco del epónimo bambes), por (zapatillas) deportivas o tenis;

biquini / bikini (calco del epónimo bikini), por (sándwich) mixto;

bajo (calco de baix), por flojo (referido al volumen de sonido): Habla más flojo, vas a despertar al niño;

cacaolat (calco del epónimo cacaolat), por batido de chocolate;

cerrar (calco de tancar), por apagar o desconectar: Cierra el ordenador cuando acabes de trabajar;

chafardear (calco de xafardejar), por cotillear;

chocolate deshecho (calco de xocolata desfeta), por chocolate a la taza;

chucho (calco de xuxo), por pepito (en el caso del bollo largado relleno de crema o chocolate);

clapa (calco de clapa), por mancha, o por calvero, o por claro;

clapar (calco de clapar), por dormir, sobar (etc.);

cuello (calco de coll), por garganta o gaznate;

de largo (calco de de llarg), por de sobra, con creces;

dejar(se) ir (calco de deixar-se anar), por soltar(se), desamarrar(se), abandonar(se), dejar(se) llevar;

descuidarse (calco de descuidar-se), por olvidarse: Me he descuidado las llaves en casa y ahora no puedo abrir;

el año de la picor (calco de l’any de la picor), por el año de la nana, el año de la polca, el año de la pera;

el trabajo fue mío / nuestro (para) (calco de la feina va ser nostra [per a]), por trabajo me / nos costó, trabajo tuve (de / en / para): El trabajo fue nuestro para convencerlo de que tenía que ir al médico;

empreñar (calco de emprenyar), por molestar, hacer enojar (a alguien);

empreñarse (calco de emprenyar-se), por enfadarse, enojarse;

encontrar a faltar (calco de trobar a faltar), por echar de menos, echar en falta;

escaparse el tren / el avión / (etc.) (calco de escapar-se [el tren / l’avión / etc.]), por perder el tren / el avión / etc.;

estar (calco de estar), por ser: Ha estado el peor año mi vida.

estarse de (calco de estar-se de), por abstenerse de;

estarse en la cama (calco de estar-se al llit), por guardar / hacer cama;

estirar (calco de estirar), por tirar de;

estirarse (calco de estirar-se), por tenderse, echarse, tumbarse;

explicar (calco de explicar), por contar, narrar;

encante (calco de encant), por baratillo, rastro, tienda de ocasión;

en un pim pam / en un pinpán (calco de en un pim-pam), por en un santiamén, en un periquete;

fregar(se) (algo) (calco de fregar-se), por frotar(se) (algo) o restregar (algo): El ojo me picaba tanto que no podía parar de fregármelo; Para preparar pan con tomate hay que fregar bien un tomate maduro sobre una rebanada de pan, que puede ser tostado, y añadir sal y aceite de oliva al gusto.

fuerte (referido al volumen de sonido, calco de fort), por alto: La música está muy fuerte;

girar la cabeza (calco de girar el cap), por volver la cabeza, voltear la cabeza;

girarse (calco de girar-se), por volverse, voltearse;

grande (calco de gran), por mayor: Su marido es más grande que ella; Mi hijo grande tiene los ojos azules, pero el pequeño, los tiene marrones;

gritar más (calco de cridar més), por levantar la voz, hablar más alto;

haber (calco de haver), por estar: Más abajo hay los pinares y el mar;

hacer (en el caso de realizar actividades, calco de fer), por estudiar, practicar: Los jueves hago piano; En el gimnasio hago pesas;

hacer años (calco de fer anys), por cumplir años;

hacer asco (calco de fer fàstic / angúnia), por dar asco;

hacer bondad (calco de fer bondat), por portarse bien, tener buena conducta;

hacer buen efecto (calco de fer bon efecte), por causar buena sensación;

hacer buena / mala cara (calco de fer bona / mala cara), por tener / poner buena / mala cara o buen / mal semblante;

hacer campana (calco de fer campana), por hacer novillos, faltar a clase (o fumarse las clases (España central); hacer piardas (Andalucía); palmar, latar, pirar (Galicia); hacer la vaca (Perú); irse de pinta (México); irse de capiura (El Salvador, Honduras); comer jobos (Puerto Rico); echar o hacerse la pera (Ecuador); hacer la cimarra (Chile); hacerse la rabona (Argentina, Paraguay y Uruguay), y hacerse rata (Argentina);

hacer(me) el efecto (algo) (calco de fer l’efecte), por dar(me) la impresión (de algo), dar(me) la sensación (de algo);

hacer gasolina (calco de fer benzina), por poner gasolina, repostar gasolina, cargar el tanque de gasolina;

hacer gracia (calco de fer gràcia), por hacer ilusión, apetecer;

hacer la siesta (calco de fer la migdiada) por echar / dormir la siesta;

hacer la trabanqueta/la traveta (calco de fer la trabanqueta / fer la traveta), por poner la zancadilla;

hacer mal efecto (calco de fer mal efecte), por causar mala sensación;

hacer miedo (calco de fer por), por dar miedo;

hacer servir (calco de fer servir), por usar, utilizar, emplear (etc.)

hacer tarde / hacérsele tarde (a alguien) (calco de fer tard / fer-se tard), por retrasarse;

hacer un café (u otra bebida) (calco de fer un cafè / etc.), por tomar un café (u otra bebida);

hacer una conferencia / charla (calco de fer una conferència/xerrada) por dar o impartir una conferencia / charla;

hacer una mirada (calco de fer un cop d’ull / una ullada), por echar un vistazo o mirar;

hacer una película (calco de fer un pel·lícula), por echar / dar / poner / proyectar una película

hacer vacaciones (calco de fer vacances), por estar de / tomarse unas vacaciones;

horno (calco de forn), por panadería o tahona;

ir arriba y abajo (calco de anar amunt i avall), por ir de un lado a otro, ir de aquí para allá;

ir de bólido (calco de anar de bòlit), por ir de cabeza, andar estresado;

ir haciendo (calco de anar fent), por ir tirando, salir adelante;

lampista (calco de lampista), por fontanero;

las cosas como sean (calco de les coses com siguin), por las cosas como son;

las escaleras (calco de les escales), por la escalera: Siempre baja las escaleras a todo correr;

limpieza (calco de neteja), por aseo: No hay que descuidar nunca la limpieza personal;

mal (calco de mal), por daño: Me he hecho mal en el brazo al levantar esa caja tan pesada;

mediana (referente al tamaño del envase de una bebida, esp. de la cerveza, calco de mediana), por tercio;

mirar de (calco de mirar de), por intentar, procurar (una cosa): Miraré de hablar con el director esta tarde;

natural (referente a la temperatura de una bebida, calco de natural), por del tiempo : Ponme un agua natural;

no viene de aquí (calco de no ve d’aquí), por qué mas da: Ponme otra copa, va, ¡no viene de aquí!;

ojos (abiertos) como naranjas (calco de ulls (oberts) com a taronges), por ojos (abiertos) como platos;

oreja(s) (calco de orelles), por oído(s): Tiene la oreja fina;

paleta (calco de paleta), por albañil;

para acabar de arreglarlo (calco de per acabar d’adobar-ho), por para colmo, para acabar de rematarlo, para remate;

parada (calco de parada), por puesto, tenderete, barraca;

paradista (refererido a una persona, calco de paradista), por comerciante ambulante o por expositor;

paradoxal (calco de paradoxal), por paradójico;

parar (calco de parar), por estar, hallarse, encontrarse: No encuentro mi blusa verde, no sé dónde para;

parar atención (calco de parar atención), por prestar atención;

parar cuenta (calco de parar compte), por tener cuidado, estar alerta;

parlante (calco de parlant), por hablante: Los catalanoparlantes suelen usar muchos catalanismos en castellano;

pasado de vueltas (calco de passat de voltes), por pasado de rosca;

pasta (calco de pasta), por bollo;

pastas (calco de pastes), por bollería, factura (Ar.);

patio (calco de pati), por recreo: Los niños salieron en tropel a la hora del patio;

pencar (calco de pencar), por trabajar, currar;

pencas (calco de penques), por caradura;

pensarse (calco de pensar-se), por creerse: ¿Quién te piensas que eres?

pensárselo (bien) (calco de pensar-s’ho [bé]), por pensarlo (bien);

pequeño (calco de petit), por menor: Joan es mi hermano pequeño; 

pescatero (calco de peixater), por pescadero;

pesebre (calco de pessebre), por belén, nacimiento;

pieza de ropa (calco de peça de roba), por prenda de ropa;

pica (calco de pica), por fregadero, pila;

picar (calco de picar), por golpear, llamar, tocar: Estuve un buen rato picando al timbre / a la puerta, y ni te enteraste;

picarse clases (calco de picar-se classses), por hacer novillos (etc.; v. hacer campana);

plantar cara (calco de plantar cara), por revolverse, enfrentarse;

plegar (calco de plegar), por acabar de trabajar, acabar la jornada de trabajo;

por descontado (calco de per descomptat), por por supuesto;

pote (calco de pot), por bote, tarro;

primero de todo (calco de primer de tot), por antes que nada, en primer lugar;

puestos a hacer (calco de posats a fer), por ya puestos: Puestos a hacer, visitamos la ermita también;

¿quieres decir? (calco de vols dir?), por ¿estás seguro/a?;

quinto (referente al tamaño del envase de una bebida, esp. de la cerveza, calco de quinto), por botellín;

rampa (calco de rampa), por calambre;

rachola (calco de rajola), por baldosa o azulejo;

remarca (calco de remarca), por énfasis;

repensárselo (calco de repensar-s’ho), por pensarlo dos veces, pensarlo mejor;

ropa (calco de roba), por tela;

rustido, rostado (calco de rostit), por asado o por tostado;

saber mal (algo) (calco de saber greu), por lamentar (algo);

sentir (calco de sentir), por oír;

señora de hacer faenas (calco de senyora de fer feines), por limpiadora, asistente del hogar, asistenta; 

sucar (calco de sucar), por mojar o mojar en/de; Prefiero el pan con tomate sucado que pincelado;

tanca (de un vestido, etc., calco de tanca), por cierre;

talón (calco de taló), por tacón;

tener (algo) por la mano (calco de tenir per la mà), por dominar (algo), saber hacer (algo);

tirar (calco de tirar), por echar, desechar, verter, arrojar: Cuando salgas, tira esta carta al buzón; En esa partida me tocó a mí tirar las cartas;

tirar(se) florecitas (calco de tirar(-se) floretes), por echarse flores, halagar(se), alabar(se);

todo junto (calco de tot plegat), por en resumidas cuentas, en resumen;

tornavís (calco de tornavís), por destornillador;

torre (calco de torre), por chalet, casa de campo;

trempar (calco de trempar), por empinarse, empalmarse;

venir (calco de venir), por ir: ¡Ya vengo!; Te vendré a ver pronto;

visitarse (calco de visitar-se), por ir al médico;

yo de usted /  tú (calco de jo de vós /  jo de vostè /   jo de tu), por yo que usted/  tú, yo en su/  tu lugar;

¡y tanto! (calco de i tant /  oi tant!), por ¡ya lo creo!

2. Catalanismos morfológicos y morfosintácticos

Son catalanismos morfológicos y morfosintácticos habituales:

1. El uso de sin con un valor adverbial que tiene en catalán, pero no en castellano, donde sólo es preposición:

Con bigote tiene más cara de policía que sin, en lugar de Con bigote tiene más cara de policía que sin bigote / sin él.
2. El uso del adjetivo indefinifo cada —que en castellano es distributivo— cuando el texto pide un sentido de frecuencia:
Los días de cada día voy a trabajar, en lugar de Los días de diario voy a trabajar.
Olga va cada semana a misa, en lugar de Olga va todas las semanas a misa.

Nota normativa: Este último uso es aceptable en castellano cuando, después de cada, se aplica un numeral (cf. <https://dle.rae.es/cada#6a9NObu>, acepción 2):

Su hijo la visita cada tres meses. 

3. La supresión de la preposición a delante de complemento directo de persona:

Hemos pasado de nombrar Messi balón de oro y pichichi a lanzarle las más duras críticas, en lugar de Hemos pasado de nombrar a Messi balón de oro y pichichi a lanzarle las más duras críticas.
Advertencia: Supone una ultracorrección (o un error, simplemente), añadir la preposición a delante de complemento directo de cosa:
Los primeros tipos emulaban a la caligrafía (palabra que, en griego, significa ‘escribir con letra hermosa’) y la escritura manuscrita cotidiana. 

4. El uso de la preposición de en estructuras partitivas impropias del castellano:

En Barcelona, de museos hay un montón, en lugar de En Barcelona hay museos a porrillo / En Barcelona hay muchos museos / En Barcelona hay museos a montones.
Ya basta de esto, en lugar de ¡Ya basta!, ¡Es suficiente!, ¡Punto!
5. El uso de que expletivo en oraciones interrogativas:
¿Que se ha roto?, en lugar de ¿Se ha roto?
¿Que vendrás mañana?, en lugar de ¿Vendrás mañana?
6. El uso del que galicado (también muy común en el español de América):
Fue entonces que noté que no estaba en su habitación, en lugar de Fue entonces cuando noté que no estaba en su habitación.
Fue por eso que recurrí a una gran amiga suya, en lugar de Fue por eso por lo que recurrí a una gran amiga de ella.
7. La supresión de que en la locución conjuntiva una vez que ‘cuando, después de que’:
Los bomberos solamente actúan una vez se produce el fuego. 

8. Cuando en la oración de relativo se repite la preposición de la oración principal, la supresión del artículo entre la preposición y el pronombre relativo:

En la ciudad en que vivo hay mucha contaminación sonora y atmosférica, en lugar de En la ciudad en la que vivo hay mucha contaminación sonora y atmosférica.

Hay muchos más casos de interferencia del catalán-valenciano en el castellano a todos los niveles. Para un conocimiento más profundo, se recomienda esta obra:

Rodríguez Vida, Susana: Catalán-castellano frente a frente. Errores más habituales de los hablantes bilingües (pról. de J. Ruaix), Barcelona: Inforbook’s, 1997.