Economía digital | Artículos | 01 OCT 1998

Filólogos y lingüistas de voces

Piedad Bullón.
La frontera entre filología y lingüística no está clara. Si nos ceñimos a la etimología, todos son filólogos; si nos atenemos a la función, un filólogo, término clásico, trabaja en la gramática y en la lengua compaginada con el estudio textual y literario de una época concreta. Pero también todos son lingüistas, porque su objeto es la lengua y el habla. Véase el María Moliner. Disquisiciones aparte, hoy por hoy, la información que aparece en Internet es muy valiosa y útil para el trabajo de los filólogos y lingüistas hasta el punto de que muchos hablan de que les ha cambiado la perspectiva de su profesión; otros, sin embargo, opinan que se está empezando, aunque ya hay hitos como el de Real Academia, que puede ser un acicate para los más reacios y una confirmación de las ventajas de la red para los ya convencidos.

Un corpus de 125 millones de palabras
Los profesionales de la lengua española y, por qué no, los muchos aficionados a su evolución, van a disponer a partir de este mes de una nueva fuente de consulta que estará disponible a través de Internet. Se trata del Corpus Diacrónico del Español (CORDE), un banco de textos que reunirá, cuando esté concluido, 125 millones de palabras. Este proyecto se inscribe en la nueva filosofía de la Academia de la Lengua (www.rae.es), que ha ido introduciendo desde hace algunos años en su hacer diario las herramientas informáticas y los nuevos soportes, como atestigua la versión en CD-ROM del más popular de los diccionario de la institución, el DRAE.
Abraham Madroñal (madronal@rae.es). doctor en Filología Hispánica, especializado en literatura del Siglo de Oro, trabajó en su día en el Diccionario Histórico de la Lengua Española, otra de las obras capitales de la Academia, y en la actualidad se ocupa del diseño del conjunto de obras que van a engrosar el CORDE. “Hemos tratado de obtener el mayor número posible de textos en formato electrónico, con el objeto de facilitar el trabajo a las personas que tienen que introducirlos en el corpus –dijo Madroñal a iWorld– y, por esa razón, utilizamos Internet desde hace bastante tiempo. Gracias a la Red hemos conseguido encontrar algunos textos muy interesantes, que no han de ser tecleados ni pasados por un escáner. Las obras que se encuentran en Internet proceden tanto de universidades como de particulares, y sobre ellas se puede trabajar porque su disponibilidad es total, aunque no necesariamente se trata de versiones fiables”.
Por esta última razón, los textos que van a formar parte del corpus son analizados minuciosamente, y antes de introducirlos en el CORDE se cotejan con la edición que dicen haber manejado las fuentes. “Se busca ante todo la calidad de los textos –afirma– así como que no hayan perdido nada en la conversión al formato que utilizamos. Los textos que se encuentran en la red también son seleccionados por ediciones, prefiriendo en general las primeras y, si no, las más fiables. Hay casos en los que las ediciones en formato electrónico no ofrecen las garantías necesarias. Cuando esto sucede, prescindimos de la obra y usamos las ediciones en papel que se reproducen con un escáner. Al final del año 2000 deberán estar recogidas los 125 millones de palabras, aunque esta es una obra abierta, a la que se deberán incorporar nuevos textos. En la Academia, hay otro proyecto, el Corpus de Referencia del Español Actual, que abarca los 25 últimos años de la historia de nuestra lengua y que también va tener que actualizarse a medida que vayan apareciendo nuevas obras”.
Todos los filólogos con los que ha hablado iWorld están esperando como agua de mayo la aparición del CORDE. Para ellos, dicen, será una herramienta fundamental que va a facilitar mucho su tarea. El corpus en sí mismo no es un fin, es un medio magnífico, cuyo uso puede servir a los investigadores para confeccionar un diccionario o anotar un texto clásico. “Este trabajo –subraya Madroñal– aun siendo posible sin Internet, se hubiera dilatado en el tiempo mucho más que de esta manera. Afortunadamente, hay suficientes textos en español y algunos de ellos muy significativos. No hay que olvidar que el corpus pretende abarcar toda la historia de la lengua española, desde las primeras Glosas Silenses y Emilianenses. Todo lo que es significativo en nuestra lengua, porque la obra recoge, también, aquellos textos que son raros pero que se han leído mucho en una época concreta como las novelas semanales, las novelas de cordel o romances de ciego. Hoy pueden parecer textos disparatados, pero en su momento todo el mundo los conocía y representan una forma del habla que no puede estar fuera de esta obra. Su validez reside en que tiene que ser representativa para que aquellos filólogos que se interesen por una época, encuentren en el corpus una representación de la misma”.
Para Miguel Angel Pineda, profesor titular de la Universidad de Sevilla, (mpined
@siff.us.es) el corpus es capital para el mundo hispano. Pineda no ahorra calificativos. “Lo que ha hecho la Academia con el Corpus –dijo a esta revista– supone un avance de la investigación filológica española que la sitúa a primer nivel mundial. Cuando esté disponible va a ser asombroso. Nosotros estamos en esa línea y el equipo de investigación que dirijo va a poner en la red todo el corpus del habla de Sevilla, tanto en crudo como la obra de referencia, lo que permitirá, entre otras po

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios