Asociación de Academias de la Lengua Española

   

Versión beta

Parámetros de selección de textos

Parámetros de selección de textos

El CORPES pretende ser un corpus de referencia que se mueva en los parámetros utilizados actualmente en esta línea de trabajo: 25 millones de formas por año y una distribución general del 70 % para textos americanos y el 30 % para textos españoles. Se concibe como un corpus semiabierto, un corpus que se irá incrementando en los próximos años con las cantidades previstas.

Los textos que integran el CORPES han sido seleccionados de acuerdo con los siguientes parámetros:
 

Medio

El 90 % de los textos corresponde a la lengua escrita y el 10 % a la lengua oral.

Los materiales escritos proceden en un 40 % de libros, publicaciones periódicas (40 %), material de Internet (7,5 %) y miscelánea (2,5 %).
 

Geográfico

La distribución general del CORPES asigna un 30 % del total a formas procedentes de España y un 70 % a formas procedentes de América. La correspondiente a las grandes áreas lingüísticas del mundo hispánico se establece mediante el cruce de criterios diferentes, entre los que figuran la población, el volumen de publicaciones, la cantidad de ediciones digitales de periódicos y revistas, etc. El material producido en América se clasifica, a su vez, en las zonas lingüísticas habituales: andina, antillas (caribeña), caribe continental, chilena, Estados Unidos, México y Centroamérica y Río de la Plata.

Es importante señalar, como una de las novedades en los corpus académicos, que el  CORPES incluye también textos correspondientes a Guinea Ecuatorial y a Filipinas.
 

Temático

Todos los textos, escritos y orales, siguen una clasificación común, lo que posibilitará la búsqueda temática de una forma independientemente de su realización oral o escrita. La clasificación contempla dos grandes bloques temáticos (Ficción y No ficción) que se distribuyen en diferentes áreas temáticas: ciencias y tecnología, ciencias sociales, creencias y pensamiento, política, economía, comercio y finanzas, artes, ocio, vida cotidiana, salud, novela, teatro, relatos y guiones.
 

Tipología

Además de las asignaciones procedentes del medio y el soporte, los textos reciben una caracterización por tipo o género textual: novela, cuento, teatro y guiones para los textos de ficción; noticias y reportajes, opinión para periódicos y revistas; prosa académica y no académica; entrevistas, conversaciones, etc. para orales; texto escrito para ser leído (noticias de radio o televisión), etc.

El cruce de los géneros con los medios, los soportes y las áreas temáticas producirán una riquísima tipología textual que permitirá a los investigadores afinar considerablemente la recuperación selectiva de la información.

Diccionarios

Gonzalo Ortiz, Miembro de Número de la AEL (foto: AEL)
15.11.2019

Desde el año 2016 pertenece a la AEL en calidad de miembro correspondiente.

El académico de la RAE Francisco Rico y el director de la RAE, Santiago Muñoz Machado, hacen entrega a los reyes de España de las obras completas de Cervantes (foto: Casa Real)
8.11.2019

El académico de la RAE Francisco Rico y el director de la RAE, Santiago Muñoz Machado, han hecho entrega a los reyes de España de las Obras completas de Cervantes de BCRAE.

Foto de familia de LEIA (foto: Casa Real)
8.11.2019

Tiene por objeto la defensa, proyección y buen uso de la lengua española en el universo digital y, especialmente, en el ámbito de la inteligencia artificial y las tecnologías actuales. 

Ida Vitale (foto: RAE)
8.11.2019

Como parte del ambicioso programa cultural del Congreso de la ASALE, la poeta uruguaya, ganadora del Premio Cervantes en 2018, habló de su vida y obra.

Los reyes de España junto a los directores de las Academias de la Lengua Española (foto: Casa Real)
8.11.2019

Se presentaron las Obras completas de Cervantes, que cuenta con el apoyo de la Obra Social “la Caixa” y se anunció el proyecto LEIA.

Margarita Salas, «inventora europea» de 2019. Foto: UC3M.
7.11.2019

Pionera en el campo de la investigación, en 2007 se convirtió en la primera mujer española que ingresó en la Academia Nacional de Ciencias de Estados Unidos.

La 23.ª edición del «Diccionario de la lengua española».
7.11.2019

Estas son las nuevas voces que han entrado al diccionario, obra que es posible gracias al compromiso con la cultura de obra social "la Caixa".

Tuits de @ASALEinforma

Formulario de búsqueda