Corpus

En 1999 la RAE publicó la Ortografía de la lengua española, en la que aparecen por primera vez como coautoras las corporaciones que conforman la Asociación de Academias de la Lengua Española. Desde entonces, todas las obras se desarrollan y firman conjuntamente, así como los proyectos panhispánicos de distinta índole en los que se trabaja por la unidad de la lengua española.

Los corpus lingüísticos son esenciales para la consecución de estos proyectos. Estos son dos de los principales en el ámbito panhispánico:

Proyectos panhispánicos

Corpus ASALE

Versión 0.3

En el Congreso de la ASALE celebrado en Quito en noviembre de 2024 se aprobó la creación del Corpus ASALE, cuyo objetivo es ofrecer a las Academias interesadas la posibilidad de seleccionar y codificar textos de acuerdo con la metodología del CORPES para poder utilizar los recursos de anotación y consulta ya desarrollados y, al mismo tiempo, avanzar hacia la conformación de corpus propios consultables en una plataforma común.

La primera versión del Corpus ASALE, integrada por más de siete millones de formas ortográficas, se presentó el 16 de octubre de 2025 en el X Congreso Internacional de la Lengua Española (CILE), celebrado en Arequipa (Perú). La versión 0.2, con más de doce millones de formas, se publicó en diciembre de 2025.

Esta nueva versión, la 0.3, de abril de 2026, incluye más de dieciséis millones de formas.

Saber más

CORPES XXI

Corpus del Español del Siglo XXI

El Corpus del Español del Siglo XXI (CORPES XXI) es, al igual que CREA, un corpus de referencia. En lingüística, se llama corpus a un conjunto formado por miles de textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y cientos o miles de millones de formas. Son empleados habitualmente para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. Dado el tamaño que poseen, los corpus tienen que estar en formato electrónico.

Saber más

CORDIAM

Nuevo proyecto panhispánico

El Corpus Diacrónico y Diatópico del Español de América contiene solo textos escritos en América. Por su especificidad americana, constituye una base robusta para hacer una gramática histórica comprehensiva del español y, dada su amplia diversidad geográfica, permite investigar la dialectología histórica de la lengua española en América. Por su amplitud cronológica y geográfica y por contener numerosos documentos de diverso tema y naturaleza, posibilita también estudiar o repensar fenómenos sociales, históricos y culturales de Hispanoamérica manifestados a través de la lengua española.

El CORDIAM tiene como objetivo enriquecer el conocimiento de la lengua española y de la historia general, interna y externa, de esta lengua. Permite además fortalecer el conocimiento y memoria del devenir histórico de la vida en América «contada» en lengua española. Las características de este corpus posibilitan, asimismo, estudiar y matizar fenómenos lingüísticos que hasta ahora estaban faltos de suficiente evidencia documental. Además, posee cuatro siglos de profundidad histórica.

Saber más

Arriba

Buscador general ASALE

Diccionarios

Otros Recursos

Diccionarios
Banco de datos
- CORPES XXI
- CDH
- CREA
- CREA anotado
- CORDE
- Fichero general
- Corpus ASALE
Gramática
Ortografía
Biblioteca
Archivo
Boletines
- BILRAE
- BRAE
Lenguaje claro
Enclave
- Enclave de Ciencia
Enlaces externos