
X Congreso Internacional de la Lengua Española
La Asociación de Academias de la Lengua Española publica la versión de prueba del Corpus ASALE
16 de Octubre de 2025Este primer prototipo cuenta con algo más de 7 millones de formas ortográficas, procedentes de textos escritos.
En el año 2017, la RAE se dirigió a todas las Academias de la ASALE para ofrecer la posibilidad de añadir obras que considerasen importantes para el mejor conocimiento de la variedad correspondiente y que no podían figurar en el CORPES por cuestiones derivadas de su diseño. Con los textos recibidos se construyó el Corpus Complementario del DLE.
Dado el interés de lo realizado hasta ese momento, en el Congreso de la ASALE celebrado en Quito en noviembre de 2024 se aprobó la creación del Corpus ASALE, cuyo objetivo es ofrecer a las Academias interesadas la posibilidad de seleccionar y codificar textos de acuerdo con la metodología del CORPES para poder utilizar los recursos de anotación y consulta ya desarrollados y, al mismo tiempo, avanzar hacia la conformación de corpus propios consultables en una plataforma común.
El Corpus ASALE se encuentra ahora mismo en fase de pruebas, en la que participan seis Academias:
Academia Boliviana de la Lengua
Academia Ecuatoriana de la Lengua
Academia Peruana de la Lengua
Academia Puertorriqueña de la Lengua Española
Academia Dominicana de la Lengua
Academia Nacional de Letras de Uruguay
Su primer prototipo será presentado en el Congreso Internacional de la Lengua Española, que se celebra en Arequipa, Perú, del 14 al 17 de octubre. A partir de ese momento se ofrecerá a todas las demás Academias la posibilidad de incorporarse al proyecto, con lo que la ASALE estará en disposición de ofrecer una plataforma única para la construcción, procesamiento y consulta de corpus textuales de todos los países hispánicos.
Este primer prototipo cuenta con algo más de 7 millones de formas ortográficas, procedentes de textos escritos.
Incluye libros de ficción (novelas, relatos, obras de teatro) y de no ficción (ciencias sociales, actualidad, política, cultura…).
En cuanto a su distribución geográfica, los textos proceden de las Academias que han aportado materiales en esta fase piloto: Bolivia, República Dominicana, Ecuador, Perú y Uruguay.
Las fechas de los textos abarcan desde finales del siglo xix hasta la actualidad.