Marcado TEI y API de JLR

¿Para qué sirven esos links que se encuentran en cada texto de JLR, en la sección “Detalles”, con la etiqueta “TEI”?

TEI (Text Encoding Initiative) es una iniciativa internacional que desarrolla y mantiene pautas para la codificación de textos digitales en humanidades y ciencias sociales. Un lenguaje de marcado es una manera de agregar información en documentos por medio de etiquetas. Un lenguaje muy conocido es HTML, que sirve para definir parámetros relacionados con la estructura de una publicación. HTML no se ocupa de aspectos semánticos de la publicación cosa que sí hace TEI, que permite utilizar etiquetas que señalen desde palabras clave, pasando por nombres propios hasta puntuaciones relacionadas con estilos. En el caso de JLR, el alcance del marcado TEI es básico: los textos poseen palabras clave asociadas a un vocabulario controlado, en donde se define una estructura temática y se avanza sobre ideas generales del autor. Esto significa que la clasificación analítica de la obra de José Luis Romero está estructurada por un conjunto de palabras clave. Su número puede ampliarse y toda la obra puede recategorizarse porque este modo de comprensión es analítico: no está afincado en una clasificación ensayada por el propio Romero, y permite ordenar el conjunto de materiales que se incluyen como “textos de”. Esto es lo que habilita TEI: facilita el intercambio de datos y la construcción de corpus en la investigación humanística. Los links de la etiqueta “TEI”, cuando existen, apuntan al archivo xml-tei del texto en cuestión.

¿Pero cómo podemos utilizarlos sin tener que descargarlos uno por uno?

Podemos utilizar un servicio para comunicarnos directamente con el servidor, denominado API. ¿Qué es una API? Una Interfaz de Programación de Aplicaciones es un conjunto de reglas para comunicarse con un sistema o entre sistemas. Por medio de esas reglas es posible interactuar con una plataforma, en este caso con las obras completas de José Luis Romero. Modificando ligeramente la API de WordPress podemos solicitar información sobre los textos publicados, bajarlos y analizar el corpus en línea.

Hagamos una prueba en Google Colab con Python.
Link a JLR_tei_01.ipynb https://colab.research.google.com/drive/1aYg_0-nGd93RaJAyN2hYY_cbuLugous9?usp=sharing