QUECHUA CORPUS NO ANOTADO

En Siminchikkunarayku soñamos con una América políglota orgullosa de sus idiomas autóctonos. Creemos que la lingüística computacional es la herramienta clave para conseguirlo y dicha herramienta necesita corpus en cantidades industriales.
Estamos construyendo corpora; publicamos este corpus no anotado(157 horas, 15 GB) con la esperanza que mas investigadores y/o voluntarios se sumen a la tarea de procesar esta data.
Este corpus es de libre acceso pero necesitamos que quien quiera acceder a él; descargue el documento, llene los datos (el archivo pdf es editable) y firme la licencia que se adjunta y enviar la licencia firmada a qichwa@pucp.pe luego de lo cual se le brindará el enlace de descarga.

Te animamos a sumarte a esta iniciativa