fran@orcero.org
irbis@orcero.org
La sociolingüística es un área en la que la informática aún no ha penetrado completamente. Los autores de este trabajo hemos intentado informatizar una investigación sociolingüistica completa usando software libre en todos los lugares donde esto ha sido posible, incluso implementando software en alguno de los pasos. En este trabajo estudiaremos las ventajas de la informatización con software libre de la sociolingüsitica, qué software está disponible, cual ha sido nuesta experiencia, y aquellos puntos donde todavía no existe reemplazo al software propietario.
La sociolingüística se encuentra con dos problemas serios en la investigación de campo, que son la grabación y el almacenamiento de datos del audio. Hasta ahora, la grabación y el almacenamiento de datos de investigaciones de campo en lingüística se ha realizado por medio de las cintas cassettes. Esto hace al procedimiento de transcripción fonética extremadamente complejo y engorroso, debido al ruido propio de las cintas, a la pérdida de calidad de las grabaciones por su uso, con la pérdida de datos invaluables para la ciencia de hablas, de acentos y hasta de lenguas que han desaparecido o están en vias de desaparición, y las cintas con las conversaciones con los hablantes se estan degradando, perdiendo toda la información.
La propia investigación y transcripción fonética de las cintas es destructiva: el movimiento de ir y venir con la cinta cassette, muchas veces, causa la ruptura de la cinta y la pérdida irrecuperable de los datos grabados. Hacer copias múltiples de las cintas cassettes presenta disminuciones de la calidad de la cinta original, además de que la copia es siempre de peor calidad que el original; además de esto, las cintas son vulnerables al moho con el tiempo cuando no son bien conservadas. Dependiendo del alcance de la investigación, el número de cintas puede llegar a cantidades realmente enormes y la gestión de estos grandes volúmenes de datos de audio se complica mucho.
Por último, a pesar de que automatizáramos el proceso de recogida de datos, el procesamiento de los datos es aún engorroso y propenso a fallos. El único programa existente que estudia las correlaciones entre datos lingüisticos, el VARBRUL, es un programa de MS-DOS de código cerrado, lento y muy poco amigable para el usuario.
Este trabajo también corresponde al aspecto informático de una investigación realizada sobre un dialecto hablado en Caxias, Brasil, una pequeña ciudad de 40000 habitantes, la mayor parte de ellos ancianos, por un impresionante flujo migratorio de los jóvenes a ciudades que presentan posibilidad de empleo, que ha hecho que la población de la ciudad caiga a su tercera parte en quince años. Este trabajo de investigación ha sido realizado en su integridad con herramientas libres, para analizar la posibilidad de informatizar todo el proceso de colecta y gestión de datos, así como publicación de los resultados usando solo software libre.
Este trabajo ha sido financiado parcialmente por la FAPESP, organización de la que MFRASO es becaria de investigación.
Siguiente | ||
Descripción del problema de las cintas |