La mayor parte de las actividades de investigación en el campo de la lingüística informática y de obra, y de las tecnologías lingüísticas en la Rep. de Croacia, son patrocinadas por el Ministerio de Ciencias, Educación y Deporte, a través de proyectos relacionados con tecnologías de lingüística, y por el Ministerio de Cultura, a través de proyectos de digitalización del patrimonio cultural.
El Instituto de Idioma Croata y Lingüística, junto con la Facultad de Filosofía de Zagreb, se ha transformado en esta última década en un centro nacional de relevancia para el desarrollo de las tecnologías lingüísticas y una fuente digital gratuita que incluye diccionarios y manuales de gramática y ortografía.
Las tecnologías lingüísticas innovadoras (JT) son los medios que posibilitan la participación de todos los ciudadanos croatas en el curso social y económico de las ciencias en Europa y en el mundo. A mediados de este año, a partir del 1 de julio, el idioma croata se transformará en el 24° idioma oficial de la Unión Europea. En la actualidad, una veintena de idiomas europeos, hablados por menos de diez millones de hablantes, entre los que está el idioma croata, se encuentran en peligro de muerte digital, a causa de su representación insuficiente en línea, y por el desarrollo pobre de los recursos lingüísticos, es decir, las fuentes de los textos lingüísticos almacenados en forma de texto electrónico, y por aplicaciones para el uso de los recursos digitales existentes. Debido a que ante nosotros se abren posibilidades enormes en los mercados regionales, que aún no están aprovechadas a causa de las limitaciones idiomáticas, vale la pena que los desafíos del JT sean colocados en la lista de prioridades nacionales, como lo es la infraestructura de transporte. Desearíamos, a pesar de la crisis económica, salir del círculo de aquellos ciuadanos de la Unión Europea, que se encuentran limitados social y económicamente debido a que hablan sólo su idioma materno. Las JT multilingües se han transformado en canales para una comunicación e interacción inmediata, simple y económica, atravesando las barreras lingüísticas, como lo es el servicio de traducción de Google Translate.
El Instituto de Idioma Croata y Lingüística se transformó en esta última década en un centro nacional líder para el desarrollo de nuestras tecnologías lingüísticas y una fuente digital gratuita que incluye diccionarios y manuales de gramática y ortografía. El dominio se complementa con los especialistas informáticos de la Facultad de Filosofía de Zagreb, también conocidos por la introducción pionera de innovaciones lingüísticas para el idioma croata al mismo tiempo que Ralph Gorin, de la Universidad de Stanford, establecía la primera corrección lingüística en un ordenador, el English Spell Check, 42 años atrás. De la misma manera, en el Instituto de Lingüística de la Facultad de Filosofía de Zagreb, Željko Bujas elaboró el primer corpus informático croata. Durante las siguientes décadas, dicha institución – a partir de 1980 – asumió el dominio de la lingüística computarizada, al procesar las obras de los antiguos escritores croatas. La compilación del millón de obras de la lengua literaria croata comenzó en 1976, bajo la dirección del académico Milan Moguš. La compilación de las obras nacionales croatas, que cuenta con 101,2 millones de palabras hasta el momento, comenzó en 1998, bajo la dirección del investigador Dr. Marko Tadić, quien entretanto se perfiló como uno de los especialistas líderes en obras e informática lingüística en Croacia. La compilación más grande y más actual – hrWaC – se elaboró en la misma facultad en 2010, y contiene un total de 1,3 mil millones de palabras – fichas, recolectadas del dominio de Internet hr. A comienzos del siglo XXI, en la misma facultad, paralelamente se desarrolla en la red el portal del idioma croata, dirigido por el Dr. Damir Boras, y la digitalización de diccionarios multilingües disponibles en el portal del patrimonio de la palabra croata. Por otra parte, el Instituto de Idioma Croata y Lingüística comenzó, en 2004, con la compilación detallada titulada Patrimonio Lingüístico Croata, que incluye textos escritos a partir del siglo XI y hasta la actualidad. Este tesoro se divide en tres compilaciones principales (croata antiguo, croata del medioevo, croata actual) que resuelve, para las dos primeras, los problemas claves de la recopilación diacrónica que, en en caso del idioma croata significa la transcripción con tres tipos de escritura (glagolítica, cirilica y latina), la resolución de las soluciones de ortografía desestandarizada, y las variaciones individuales en el uso de ciertos escritos, según nos informó el Dr. Željko Jozić, Director del Instituto que asimismo mantiene un asesoramiento lingüístico muy práctico y en línea.
La mayor parte de las actividades de investigación en el campo de la lingüística informática y de obra, y de las tecnologías lingüísticas en la Rep. de Croacia, son patrocinadas por el Ministerio de Ciencias, Educación y Deporte, a través de proyectos relacionados con tecnologías de lingüística, y por el Ministerio de Cultura, a través de proyectos de digitalización del patrimonio cultural, a diferencia de los mercados comerciales de JT como lo son el americano y algunos asiáticos.
De la misma fuente presupuestaria, hace cinco años se dio comienzo a proyectos individuales relacionados con el desarrollo de recursos lingüísticos croatas en la Facultad de Filosofía. Se trata de programas como los Modelos lingüístico-informáticos y tecnologías lingüísticas para el idioma croata, donde se compone y mantiene una amplia variedad de recursos lingüísticos y herramientas como lo son la Recopilación Nacional Croata, la Recopilación Paralela Croato-Inglesa, el Diccionario Enciclopédico Morfológico Croata, el Banco de la Sintaxis Croata y similares. Los programas mencionados incluyen la digitalización de los datos lingüísticos recolectados y aumentan la cantidad de recursos disponibles para el idioma croata.
Las nuevas posibilidades y el JT abren un capítulo en la red en cuanto a la protección de la lengua croata entre la millonaria diáspora políglota croata, desde Alaska hasta Tierra del Fuego, el sur de África, hasta Australia y Nueva Zelandia. El acceso de los recursos lingüísticos del idioma croata a través de la red es una fuente de esperanzas hacia el aumento de hablantes de nuestro idioma en la emigración.
(ZKVH)
Texto: Vesna Kukavica