Foto: Conacyt
Foto: Conacyt
Investigadores del IPN crean acervo histórico del español antiguo. Foto: Conacyt

Especialistas del Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN) desarrollaron un software para mostrar cómo se usaban diferentes palabras del español antiguo, a través de un acervo de más de 3 mil documentos.

El programa Corpus Diacrónico y Diatópico del Español de América (Cordiam), cuenta con una base de datos de 3 millones de palabras extraídas de archivos de 19 países de Hispanoamérica, así como el sur y oeste de Estados Unidos, Jamaica, Haití y Guyana.

El Cordiam sirve para organizar las bases de datos y proporcionar la búsqueda de las palabras que se quieren analizar con facilidad en los textos, los cuales son escritos de América Latina de los orígenes del español en la región.

También permite construir una gramática y dialectología histórica del español en el continente americano, así como estudiar fenómenos sociales y culturales.

Este acervo comenzó a desarrollarse hace más de cinco años por los investigadores Alexander Gelbukh y Griogori Sidorov, en conjunto con lingüistas, que transcriben, marcan los textos y los preparan para ser agregados al sistema.

Asimismo, Gelbukh dijo que la siguiente etapa será agregar 30 mil documentos y explicó que la base de datos actual se divide en cuatro tipos textuales, que son cronísticos, administrativos, jurídicos y particulares.

El investigador agregó que los tres primeros tipos textuales corresponden a documentos públicos, mientras que los particulares son parte de colecciones privadas.

Editados por: Carlos Rodrigo Balcázar Placeres

incendios forestales