martes, 7 de noviembre de 2023

S​obre la (relativa) utilidad de Google Books Ngram Viewer para la corrección de textos

Google Books Ngram Viewer es un buscador en línea que permite representar en un gráfico la frecuencia anual de cualquier grupo de búsquedas con formato de texto delimitado por comas, desde el año 1500 hasta el 2019 (por el momento). El buscador utiliza como base de datos el corpora de texto de Google Books en inglés, chino (simplificado), francés, alemán, hebreo, italiano, ruso o español.

El programa es capaz de ejecutar búsquedas por palabra(s) o por frase. Para utilizarlo, deben seguirse los siguientes pasos:

❶ Ingresar en el buscador: https://books.google.com/ngrams/

❷ Introducir un término o una serie de términos separados por comas (los llamados n-gramas).

❸ Si se desea, acotar el período de la búsqueda.

❹ Elegir el corpus idiomático que se quiere consutar.

❺ Si se desea, activar la opción de ortografía case-sensitive (que compara el uso exacto de las mayúsculas y minúsculas).

❻ Elegir el factor de precisión (smoothing) entre 0 y 50, con 3 como valor por defecto. Mientras más grande sea el factor, más suave es la curva de la gráfica que se obtiene.

❼ Una vez obtenida la gráfica, podemos ver datos más concretos moviéndonos sobre ella con el cursor, y consultar también en qué obras en concreto se ha hecho la búsqueda clicando en las opciones temporales del recuadro inferior.

Sobre su utilidad para la corrección de textos, nos permite hacernos una cierta idea de los usos más frecuentes en un período determinado de tiempo, y compararlos. Si, por ejemplo, se hace una búsqueda entre 1900 y el 2019 de los términos <parqué,parquet,parket> en español, sin activar case sensitive y con la precisión por defecto, veremos que, en la mayor parte del siglo pasado, el uso escrito preferente (y aún sostenido) de este término era parquet, mientras que parqué y parquet tenían un empleo similarmente bastante inferior. Parqué empieza a ascender cuando aparece por primera vez como adaptación del francés parquet en el DRAE1970, pero despega claramente con la edición del 2001 del DRAE (la primera digital; https://www.rae.es/drae2001/parqu%C3%A9) y especialmente con la del Diccionario panhispánico de dudas en el 2005 (https://www.rae.es/dpd/parqu%C3%A9).  

No podemos, sin embargo, obtener ninguna información sobre la pronunciación de este término, ni tampoco sobre la distribución geográfica de las tres variantes escritas más comunes en textos en castellano. Pero sí se puede intuir el poder de la obra normativa sobre los usos escritos, particularmente desde su difusión masiva en la red. Eso sí: si se hace una búsqueda sobre palabras de exclusivo cuño académico, como el puentismo que se sacó de la manga el DPD (https://www.rae.es/dpd/puentismo) para desplazar al híbrido puenting, se comprueba que el largo brazo de la RAE tiene ciertas limitaciones cuando la Docta contraría el uso real.

 


No hay comentarios:

Publicar un comentario

Este blog no publicará los comentarios de personas no identificadas.