El CORPES supera los 455 millones de formas
29 de Junio de 2026La Real Academia Española (RAE) ha publicado la versión 1.5 del Corpus del Español del Siglo XXI (CORPES), que cuenta con casi 420 000 documentos y 455 millones de formas ortográficas, procedentes tanto de textos escritos como de transcripciones orales. Esta nueva entrega supone un incremento de más de diez millones de formas con respecto a la versión anterior, publicada en diciembre de 2025.
Además se ha continuado el proceso de revisión de posibles coincidencias textuales, proceso que continúa en la actualidad.
Distribución temática y tipológica del corpus
El CORPES mantiene su enfoque equilibrado. En esta versión:
- Más de 114 millones de formas corresponden al bloque de ficción, que incluye novelas, relatos, guiones y obras de teatro.
- Más de 336 millones de formas proceden de textos de no ficción, como libros especializados y publicaciones periódicas relacionadas con ciencias sociales, salud, política, tecnología y cultura.
- Los textos de libros aportan más de 201 millones de formas.
- Las publicaciones periódicas suman cerca de 238 millones de formas.
- Más de 10 millones de formas provienen de contenidos digitales diversos: blogs, entrevistas en línea, redes sociales y textos misceláneos.
Cobertura cronológica y geográfica
En cuanto a la distribución temporal, el corpus refleja el uso del español en las últimas décadas.
Por lustros:
- 2001-2005: casi 104 millones de formas
- 2006-2010: más de 109 millones
- 2011-2015: más de 92 millones
- 2016-2020: más de 79 millones
- 2021-2025: más de 63 millones
- 2026 cuenta ya con casi un millón y medio de formas
En términos geográficos, el CORPES mantiene el equilibrio previsto del 30 % para textos procedentes de España y 70 % para textos de América, con casi 290 millones de formas producidas en el ámbito americano, lo que refuerza su carácter panhispánico y representativo de la diversidad del español actual. Desde sus primeras versiones, el CORPES, además, incorpora textos de Filipinas y de Guinea Ecuatorial.
Una herramienta en continua expansión
Esta nueva versión del CORPES continúa afianzando su papel como recurso esencial para la investigación lingüística y el análisis del uso del español. Su disponibilidad a través del portal de la RAE lo convierte en una herramienta de referencia para lingüistas, traductores, docentes, periodistas y todos aquellos interesados en el estudio del español contemporáneo.