www.economiadehoy.es

El IIC se une al Instituto Cervantes de la Universidad de Harvard para buscar anglicismos en el español de EEUU a través de Twitter

El IIC se une al Instituto Cervantes de la Universidad de Harvard para buscar anglicismos en el español de EEUU a través de Twitter
Ampliar
viernes 14 de julio de 2017, 10:54h
El IIC ha puesto en marcha un proyecto de búsqueda de préstamos lingüísticos del inglés para completar el Diccionario de anglicismos en español (DAEE).
El IIC (Instituto de Ingeniería del Conocimiento) ha puesto en marcha un proyecto de investigación junto con el Instituto Cervantes de la Universidad de Harvard que combina el conocimiento experto de los lexicógrafos y de los lingüistas computacionales para detectar anglicismos en el uso del español en Estados Unidos en las redes sociales. A través del Observatorio de la lengua española y las culturas hispánicas, la institución estadounidense y el IIC han configurado proyecto para ampliar el Diccionario de anglicismos en español (DAEE) que tiene como objetivo detectar los anglicismos que utilizan los hablantes hispanos de EEUU que están en contacto con ambas lenguas.

Antonio Moreno Sandoval, Investigador senior del IIC y Director del Laboratorio de Lingüística Informática de la UAM, y Francisco Moreno Fernández, Director ejecutivo del Instituto Cervantes en la Universidad de Harvard y catedrático de la Universidad de Alcalá han estado al frente del proyecto que han bautizado como “Búsqueda de anglicismos en el español estadounidense a través de Twitter”.

Para llevar a cabo la investigación el IIC ha empleado una nueva metodología para la búsqueda de anglicismos. El material para la investigación fue recopilado de entre todos los tweets emitidos desde los Estados Unidos por usuarios que tienen identificado en su perfil que hablan español, hispanos o procedentes de un país hispano, recogidos en dos momentos diferentes: entre agosto-diciembre de 2014 y entre enero-febrero de 2016. En total, se superan los 850.000 mensajes y más de 15 millones de palabras, con cerca de 175.000 palabras diferentes.

El proceso comprende tres fases. La primera de compilación en la que se han empleado herramientas informáticas para realizar un filtro en la red social con el fin de obtener el corpus de mensajes. En segundo lugar se ha producido una limpieza exhaustiva de los mensajes eliminando todo ruido para la investigación, url, emoticonos, menciones de usuarios, signos de puntuación, tweets íntegros en inglés… Y por último, se procede a la extracción de candidatos para analizar, eliminando casos que no sean de interés. En este estadio se aplican una serie de filtros automáticos para detectar palabras desconocidas, descartar nombres propios, onomatopeyas, risas, diminutivos o palabras con sufijos. Del total de casi 175.000 palabras recopiladas en la primera fase se ha llegado con este proceso a una lista de 3.800 de la que los especialistas han estudiado casi 600 términos.

Twitter resulta un excelente medio para observar cómo se está produciendo la adaptación gráfica de los préstamos lingüísticos que genera dudas tanto entre los hablantes como entre los lexicógrafos. “La red social de microblog se presenta como el medio idóneo para este tipo de investigación porque recoge el habla espontánea e inmediata. Se observa la innovación lingüística de forma masiva, general y rápida”, señala Antonio Moreno Sandoval.

Todo este proceso de investigación ha concluido, tras pasar el análisis lingüístico por Observatorio de la lengua española y las culturas hispánicas en los Estados Unidos, con varias decenas de nuevos anglicismos. Términos como bróder, coworker, fangirlear, favear, gossipeo o chin son ejemplos de las voces que engrosarán próximamente el DAEE.

¿Te ha parecido interesante esta noticia?    Si (0)    No(0)


+
0 comentarios