Está en la página 1de 195

El lenguaje Ministerio

de Educacin, Cultura
y Deporte

sobre el patrimonio
Estndares documentales para la descripcin
y gestin de colecciones

eLP
El lenguaje
sobre el patrimonio

Estndares documentales para la descripcin y gestin de colecciones


Catlogo de publicaciones del Ministerio: www.mecd.gob.es
Catlogo general de publicaciones oficiales: publicacionesoficiales.boe.es

Edicin 2016

MINISTERIO DE EDUCACIN, CULTURA


Y DEPORTE
Edita:
Secretara general TCnica
Subdireccin General
de Documentacin y Publicaciones

De los textos y las fotografas: sus autores


NIPO (electrnico): 030-16-459-0
NDICE

Pg.

Prlogo................................................................................................................................................................... 6

Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros


del patrimonio cultural de Espaa del Ministerio de Educacin, Cultura y Deporte ........................ 7
Mara Carrillo Tundidor

Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT .................................. 15
Reem Weda

Normas y estndares para la elaboracin de tesauros de patrimonio cultural ................................... 29


Javier Garca Marco

Los tesauros en la web semntica: SKOS y la norma ISO 25964 ........................................................... 47


Juan Antonio Pastor Snchez

El control terminolgico en el Museo Arqueolgico Nacional: evolucin histrica,


situacin actual y perspectivas de futuro .................................................................................................... 63
Javier Rodrigo del Blanco

La memoria recuperada: la bsqueda del nombre. La construccin del Tesauro


de Denominaciones de Bienes Culturales .................................................................................................. 76
Isabel Trinidad Lafuente

Tesauros, vocabularios y listas de control terminolgico. Fuentes para la construccin


de tesauros culturales ...................................................................................................................................... 93
Miguel ngel Marzal Garca-Quismondo

Una ontologa para la gestin del conocimiento: el Tesauro de la UNESCO y su aplicacin


en el Portal sobre Aprendizaje Learning Portal del Instituto Internacional de
Planeamiento de la Educacin de la UNESCO ............................................................................................ 105
Asuncin Valderrama Pareja

Construccin y uso de terminologas, categoras de descripcin y estructuras


semnticas vinculadas al patrimonio en la sociedad global de datos ................................................... 115
Nuria Rodrguez Ortega
La normalizacin terminolgica aplicada a la conservacin y restauracin
del patrimonio cultural .................................................................................................................................... 131
Ana Mara Calvo Manuel

Dimensin poltica y cultural en la armonizacin terminolgica multilinge:


la experiencia del tesauro para la Red de Informacin del Patrimonio Europeo (HEREIN) ........... 140
Teresa Abejn Pea

Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses:


las tipologas arqueolgicas ........................................................................................................................... 147
Jos Fabre Murillo

El listado de autoridades y la normalizacin terminolgica en el Museo del Prado ......................... 157


Jos Luis Cueto Martnez-Pontrmuli

Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos


de gnero/forma en la Biblioteca Nacional ................................................................................................ 169
Pascual Jimnez Huerta

PARES hacia la web semntica: autoridades y tesauros en los archivos estatales ............................. 181
Arnzazu Lafuente Urin
6

Prlogo
Miguel ngel Recio Crespo
Director General de Bellas Artes y Bienes Culturales y de Archivos y Bibliotecas

Los tesauros de patrimonio cultural son recursos que permiten normalizar el vocabulario y los
conceptos utilizados para la identificacin, descripcin y clasificacin de los bienes culturales,
facilitando el uso de un lenguaje comn que permite el intercambio de informacin entre di-
ferentes tipos de instituciones gestoras de patrimonio. Se trata de instrumentos fundamentales
para todos los profesionales que se ocupan de la documentacin, investigacin y gestin del
patrimonio, y tambin constituyen un elemento que permite y facilita el acceso del pblico a la
informacin.
La Subdireccin General de Museos Estatales trabaja desde hace aos en la elaboracin y
construccin de vocabularios normalizados. Por su parte, el Instituto del Patrimonio Cultural de
Espaa lleva a cabo en la Escuela de Patrimonio Histrico de Njera (La Rioja) un programa
anual de actividades formativas sobre diversos aspectos relacionados con la conservacin y estu-
dio del patrimonio. Dentro de dicho programa el IPCE organiz en noviembre de 2015, el
curso: El lenguaje del patrimonio. Estndares documentales para la descripcin y gestin de
colecciones.
El curso ha permitido reunir aportaciones de especialistas de la universidad, la adminis-
tracin pblica y de instituciones nacionales e internacionales que trabajan en la actualidad en
el tratamiento tcnico de los vocabularios, as como en su normalizacin, difusin y aplicacin
prctica a los sistemas de informacin de los diferentes repositorios patrimoniales actualmente
disponibles. La publicacin de los resultados supone, por tanto, una excelente oportunidad para
acercarse a las diferentes iniciativas que se estn desarrollando en este mbito.

El lenguaje sobre el patrimonio | Pg. 6


7

Un vocabulario comn para un patrimonio diverso: el


proyecto de tesauros del patrimonio cultural de Espaa del
Ministerio de Educacin, Cultura y Deporte
Mara Carrillo Tundidor
Jefa del Servicio de Documentacin. Ministerio de Educacin, Cultura y Deporte

En el ao 2016 se cumplen veinte aos de la publicacin del informe Normalizacin documen-


tal de museos: elementos para una aplicacin informtica de gestin museogrfica (Carretero et
alii, 2006), con la que se present en sociedad el proyecto de normalizacin documental del Mi-
nisterio de Educacin, Cultura y Deporte. Esta publicacin, que sent las bases para el desarrollo
posterior del proyecto de normalizacin documental y el de tesauros que tratamos aqu, recoga
el anlisis que haba desarrollado la Comisin de Normalizacin Documental de Museos creada
en 1994 sobre la situacin en la que se encontraba la documentacin en los museos estatales,
e inclua las funcionalidades y requisitos que deba cumplir la aplicacin informtica que se de-
sarrollara a partir de la publicacin del informe y que con el tiempo se denominara DOMUS.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
8

Veinte aos es un tiempo suficiente para valorar las cualidades evidentes que el pro-
yecto, en general, y la publicacin que mencionamos, en particular, han tenido para el eficaz
desarrollo de un sistema documental compartido en los museos. Durante estos aos el pro-
yecto ha ido creciendo en nmero de instituciones y, gracias a las aportaciones de los tcnicos
de los museos de diferentes titularidades, se ha ido enriqueciendo con ms funcionalidades
y evoluciones tcnicas. Muchas de las cuestiones bsicas sobre las que se asent el proyecto
continan vigentes a da de hoy, y una de ellas es, sin duda, la necesidad de establecer un
control terminolgico sobre las tareas de catalogacin, inventario y gestin de las colecciones
de los museos.
Textualmente, la publicacin mencionaba que deba procederse a la unificacin de nor-
mas descriptivas y terminolgicas de las diversas reas cientficas, tcnicas y administrativas. Y
sealaba que este control terminolgico deba aplicarse a la denominacin de los tems, sus
materias primas, tcnicas de fabricacin, denominacin de componentes, etc., y avanzaba ya la
necesidad de constituir grupos de trabajo para las reas que podran resultar ms problemticas,
refirindose concretamente a las clasificaciones genricas, contextos culturales, clasificaciones
geogrficas e iconografa. Es curioso comprobar cmo esta profeca que adivinaba dificultades
en el horizonte de algunos campos de informacin concretos se ha visto cumplida, si tenemos
en cuenta que a da de hoy, a pesar del gran nmero de vocabularios aparecidos, siguen sin
completarse los tesauros de clasificaciones genricas, iconografa y contextos culturales (aunque
esperamos que este ltimo est pronto en la calle).
Dado que la publicacin era tremendamente explcita en las herramientas de control ter-
minolgico que utilizara la futura aplicacin informtica (tesauros, listas y tablas de control de
trminos), tras su publicacin se pusieron en marcha los grupos de trabajo que deban desarro-
llar estos tesauros, para lo cual se cont con reconocidos expertos en cada rea de estudio, que
comenzaron a elaborar tesauros especficos por especialidades. Fruto de este trabajo se publica-
ron el Diccionario de materiales cermicos en el ao 2002 (Cabrera et alii, 2002), el Diccionario
de mobiliario en el ao 2006 (Rodrguez, 2006) y el Diccionario de numismtica en el ao 2009
(Alfaro et alii, 2009).
Aunque redactadas por especialistas de museos diferentes, estas tres publicaciones com-
parten dos objetivos fundamentales: por un lado, servir como herramienta de trabajo a la hora
de catalogar las colecciones patrimoniales de cada uno de los mbitos de estudio y, por otro,
aportar una sistematizacin terminolgica que limite el empleo del lenguaje espontneo en la
catalogacin. Y es precisamente la conjuncin de estos dos objetivos, complementarios pero
diferentes, lo que ha convertido estas publicaciones en herramientas indispensables para la ca-
talogacin, el estudio y el conocimiento de las colecciones.
Para ello, estas publicaciones siguen un mismo esquema de contenidos, que haba sido
previamente fijado en el Diccionario del dibujo y la estampa (Blas et alii, 1996), una publicacin
que, al igual que las tres que mencionamos, se haba iniciado en el seno de la comisin de nor-
malizacin documental constituida en 1994 y que fue finalmente publicado por la Real Academia
de Bellas Artes de San Fernando en el ao 1996. En esta primera publicacin se haban fijado los
elementos esenciales que iban a seguir el resto de diccionarios, pasando todos ellos a incluir a
partir de entonces una introduccin, el diccionario de trminos alfabticamente ordenados con
las definiciones asociadas a cada uno de ellos y el tesauro propiamente dicho, compuesto, por
una parte, por la estructura general y, por otra, por el cuerpo del tesauro. En el cuerpo del te-
sauro de cada uno de los diccionarios publicados se incluyen los descriptores y no descriptores
con las relaciones que establecen entre ellos, identificndose trminos genricos (TG), trminos
especficos (TE), trminos relacionados (TR), trminos usado por (UP) y trminos use (USE).
Las publicaciones aportan adems informacin adicional de inters para el catalogador: normas
generales de catalogacin, ejemplos de fichas de catalogacin, figuras, lminas y bibliografa. Se
empez a trabajar en ese momento con otros mbitos, por ejemplo, los textiles, el vidrio o el
material cientfico, pero son tesauros que an no han visto la luz y que se encuentran en vas
de elaboracin.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
9

Aunque estos tesauros y diccionarios han supuesto una aportacin indiscutible para el
conocimiento y estudio de las colecciones de los museos, el Ministerio de Educacin, Cultura y
Deporte inici, al tiempo que la aplicacin DOMUS se instalaba en los museos, otros trabajos
en el rea del control terminolgico que completaban los ya mencionados. Efectivamente, como
ya hemos mencionado, muchos de los campos de informacin de DOMUS estaban controla-
dos por tesauros y listas de control terminolgico, lo que quiere decir que, en el momento de
cumplimentar cualquier registro de catalogacin, es necesario que el trmino que queremos
utilizar haya sido introducido previamente en alguno de estos tesauros y listas. La publicacin
Normalizacin Documental inclua algunas listas que podran emplearse a la hora de empezar a
trabajar, pero se referan sobre todo a campos de informacin administrativa, como, por ejemplo,
las formas de ingreso de fondos, tipos y unidades de medida, tipos de movimiento de fondos
o las series documentales del archivo administrativo.
La utilidad de estas listas ha sido fundamental y su publicacin temprana fue un buen empuje
para el objetivo de normalizacin que se quera conseguir: por poner un ejemplo, los archivos de
los museos siguen en la actualidad un mismo esquema de organizacin documental, independiente-
mente de su organizacin interna, contenido o incluso administracin gestora. No obstante, fuera del
mbito de la publicacin, haban quedado un gran nmero de campos cientficos empleados a la
hora de catalogar un fondo: clasificacin genrica, denominacin del objeto, ttulo, tcnica, materia,
iconografa Todos los museos empezaron a trabajar en los tesauros adaptndolos a las necesidades
de sus colecciones y a la informacin que ya se contena en las herramientas documentales que cada
museo haba utilizado con anterioridad y que se migr o se volc en la nueva aplicacin. El resultado
fue que los museos fueron elaborando tesauros de forma interna a espaldas del resto de institucio-
nes, con el nico objetivo de racionalizar la informacin contenida en sus propias bases de datos.
Para paliar esta situacin que se haba empezado a producir con la instalacin de la nueva
aplicacin DOMUS, a partir del ao 2001 el Ministerio de Educacin, Cultura y Deporte inici
una segunda va de actuacin en la normalizacin terminolgica, dirigida a elaborar tesauros
generales que sirvieran para cualquier tipo de coleccin, mediante la contratacin externa de
personal especializado. Para ello, se escogieron reas de trabajo que tuvieran su corresponden-
cia en determinados campos de informacin de DOMUS: clasificacin genrica, materias, tcni-
cas, autores, iconografa, lugares geogrficos y toponimia histrica, denominaciones de bienes
culturales (para el campo objeto), iconografa y contextos culturales.

Fruto de este trabajo, han visto la luz hasta ahora: el Diccionario de materias en el
ao 2008 (Kroustallis, 2008); el Diccionario de objetos asociados a ritos, cultos y creencias en

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
10

2011 (Trinidad, 2011); el Diccionario de objetos asociados a la expresin artstica en el ao


2012 (Trinidad, 2012), y el Diccionario de tcnicas en el ao 2016 (Kroustallis, 2016). Est
ya ultimando su aparicin el Diccionario de objetos asociados a la arquitectura y estructu-
ras, que se publicar tambin en el ao 2016, y que, junto con los otros dos diccionarios
de objetos ya publicados, forman parte del ambicioso Diccionario de denominaciones de
objetos culturales, cuya inabarcable dimensin ha obligado a publicarlo por ramas. Se prev
que en el ao 2017 se publiquen el Diccionario de toponimia histrica y el Diccionario de
contextos culturales.
El conjunto de todos los tesauros que se iban elaborando, tanto los especficos de
cada rea como los generales, requeran de herramientas informticas que permitieran su
construccin, elaboracin, publicacin y posterior distribucin en las bases de datos insta-
ladas en los museos usuarios de DOMUS. Para ello, el Ministerio de Educacin, Cultura y
Deporte puso en marcha en el ao 2004 el diseo de dos herramientas informticas deno-
minadas Jerartes y Convertes (Alquzar; Carrasco, 2005). Al igual que haba sucedido con
DOMUS, el objetivo era contar con un software que se ajustara a las necesidades especficas
del proyecto, por lo que fue el Ministerio el que desarroll las dos aplicaciones, de las que
es propietario.
Jerartes es la aplicacin que se emplea para la construccin de los tesauros, controla los
trminos que se incluyen en los mismos y las relaciones que se establecen entre ellos. Permi-
te elaborar tesauros en paralelo, estableciendo para cada uno de ellos grupos diferenciados
con bases de datos independientes. Para la elaboracin de la jerarqua, pueden darse de alta
tanto descriptores como indicadores clasificatorios. Estos ltimos solo se introducen para
facilitar la agrupacin de los descriptores, por lo que no forman parte del tesauro en el que
se est trabajando. Los descriptores establecen entre ellos relaciones, por lo que cada uno de
ellos puede designarse, con respecto a otro descriptor incluido en el tesauro, como trmino
genrico, trmino especfico y trmino relacionado. Cada descriptor incluido lleva asociados
diferentes campos de informacin: la definicin del trmino, nota de alcance (condiciones de
utilizacin del trmino o notas para su reconocimiento o diferenciacin), referencia bibliogr-
fica (publicaciones de las que procede la definicin ofrecida, o que tengan especial inters
para el conocimiento o estudio del trmino o aspectos directamente relacionados con l),
observaciones (anotaciones sobre contexto histrico, particularidades de uso, etc.), fuente
(persona o institucin que propone la inclusin del trmino o a partir de cuya informacin
se incluye) y fecha de incorporacin o modificacin del trmino en la base de datos. Por otra
parte, la aplicacin permite incluir la traduccin de cada descriptor a otros idiomas, lo que
facilita la elaboracin de diccionarios multilinges, y la inclusin de imgenes asociadas a
cada trmino.
Una vez finalizado un tesauro, se procede a su distribucin en las bases de datos de los
museos usuarios de DOMUS mediante la aplicacin Convertes. Dado que, como hemos expli-
cado anteriormente, los museos han ido trabajando en sus propios tesauros, Convertes compara
las dos versiones de un mismo tesauro (la que tiene el museo y la que el Ministerio ha dado
como finalizada) para determinar las coincidencias e incidencias. Para ello, los trminos proce-
dentes de los museos se importan a Convertes en formato XML. La aplicacin iguala los trmi-
nos procedentes de los museos con los trminos que estn en el tesauro finalizado, y el resto
de trminos que no coincidan quedan englobados en una lista de trminos candidatos que hay
que procesar manualmente. Los trminos candidatos son estudiados y son objeto de dos tipos
de acciones: rechazo o igualacin con otro trmino. En este proceso se producen incidencias
fciles de resolver (por ejemplo, igualar singulares y plurales, cambios de gnero, errores tipo-
grficos), y otros que son ms lentos de determinar: trminos que no son aceptados, trminos
que pueden ser igualados a otros y que pasan a ser no descriptores y trminos que pueden ser
incluidos en la versin definitiva del tesauro. La aplicacin genera un fichero de cambios nico
para cada tesauro y museo, compuesto por aquellos trminos que hayan sido igualados y por
los que hayan sufrido baja.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
11

Pero el objetivo del proyecto de normalizacin terminolgica no se limita a la eviden-


te utilidad que este trabajo tiene para la catalogacin en DOMUS, sino que se dirige a un
pblico mucho ms extenso. Para ello, el Ministerio de Educacin, Cultura y Deporte puso
en marcha en el ao 2011 el Portal de Tesauros del Patrimonio Cultural de Espaa (Alonso,
2012), que engloba tanto las publicaciones de cada uno de los tesauros como una aplicacin
que permite la bsqueda jerrquica y alfabtica de los trminos de cada uno de ellos. En la
actualidad, el Portal de Tesauros del Patrimonio Cultural de Espaa ofrece en lnea ms de
60000 descriptores y ms de 16000 no descriptores pertenecientes a siete tesauros diferentes:
materias, tcnicas, mobiliario, numismtica, cermica, lugares geogrficos y denominaciones
de objetos culturales (con tres ramas publicadas hasta ahora: objetos asociados a ritos, cultos
y creencias, objetos asociados a la expresin artstica y objetos asociados a la arquitectura y
estructuras).

En los ltimos meses esta aplicacin ha sido objeto de una completa renovacin, convir-
tindose en el primer proyecto que la Subdireccin General de Museos Estatales acomete en
el mbito de la web semntica y la publicacin en datos abiertos, un camino que empiezan a
recorrer muchas instituciones culturales y en el que los museos y colecciones espaolas tienen
mucho que aportar dada la cantidad y calidad de la informacin que se contiene en sus bases
de datos.
El objetivo es publicar como Linked Open Data el amplio caudal de informacin que
aportan los tesauros. Obviamente, la informacin ya estaba a disposicin del pblico desde el
ao 2011 gracias al Portal, pero en el ao 2013 empez a verse la necesidad de que esta infor-
macin estuviera a disposicin no solo de las personas usuarias del portal, sino tambin de los
rastreadores automatizados, a fin de que la informacin contenida en el Portal fuera accesible
para otros recursos de informacin. Para la publicacin de los tesauros en Linked Open Data era
necesario, primero, convertir la informacin a un formato reconocible y aceptado, cumpliendo
los requisitos establecidos en el Word Wide Web Consortium. Se eligi el SKOS por ser el ms
adecuado para la publicacin en LOD de vocabularios y ontologas, siendo el sistema que haba
elegido previamente la Lista de Encabezamiento de Materias desarrollada por la Subdireccin
General de Coordinacin Bibliotecaria del Ministerio de Educacin, Cultura y Deporte, as como
otras instituciones que haban empezado a trabajar en datos abiertos, como los tesauros de Getty
Research Institute o el British Museum.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
12

Los datos se han modelado a SKOS siguiendo las directrices definidas por el W3C
para las Cool URIs, mediante la asignacin a cada uno de los trminos de un identificador
o URI persistente. Cada uno de los tesauros se ha generado con el siguiente esquema: Es-
quema del tesauro (skos:Scheme); Concepto (skos:Concept); Facetas (skos:Collection). Por
cada descriptor se ha creado un concepto SKOS, mapeando sus campos a tripletas RDF:
skos:prefLabel (trmino); skos:inScheme (tesauro al que pertenece); skos:definition (defini-
cin); dct:bibliographicCitation (referencias bibliogrficas); skos:scopeNote (nota de alcance)
y dct:created (fecha de creacin del trmino). A cada trmino relacionado se le ha asignado
la etiqueta skos:related; a los trminos genricos, skos:broader y skos:topConceptOf; y a los
trminos jerrquicamente dependientes, skos:narrower y skos:hasTopConcept. Por cada no
descriptor se han formado tripletas en el concepto SKOS, creado para su descriptor asociado
con la etiqueta skos:altLabel.
En una primera fase, se encarg a la empresa Digibs el modelado en SKOS del Dicciona-
rio de materias y una primera aplicacin para su gestin. Posteriormente, la empresa Serdoc ha
realizado el modelado en SKOS del resto de diccionarios y ha definido la aplicacin definitiva de
gestin de los tesauros en LOD. Para ello, la empresa ha utilizado una aplicacin denominada
BRJULA, una plataforma de desarrollo de la propia empresa en la que se combina software
open source con herramientas y programas de desarrollo propio.
La nueva pgina de Tesauros del Patrimonio Cultural tiene, por tanto, esta duplicidad
en el tipo de cliente que debe atender. Por una parte, la nueva aplicacin ofrece al usuario
humano una experiencia de uso similar al de la aplicacin antigua: cuando la persona usuaria
realiza una peticin (por ejemplo, la consulta en el apartado de estadsticas), el sistema reco-
pila la informacin que se puede mostrar y devuelve la pgina al usuario. Del mismo modo,
cuando el usuario realiza la peticin de consultar un trmino de alguno de los vocabularios,
el sistema responder a la peticin redirigiendo al usuario a la URI del trmino elegido en un
formato HTML. Al igual que en el Portal anterior, la bsqueda de trminos se puede realizar
alfabticamente, eligiendo la letra inicial del trmino que se quiere recuperar, o bien jerrqui-
camente, escogiendo el trmino en un rbol desplegable. Del mismo modo, se mantiene la
redireccin a la Red Digital de Colecciones de Museos de Espaa (CER.ES), a la que se puede
acceder a travs de la imagen asociada al trmino (y que devolver el registro completo que
tiene ese objeto en CER.ES), o lanzando una bsqueda que recuperar todos los resultados de
CER.ES del trmino que se elija.
Adems de la funcionalidad de la consulta de los diccionarios y sus trminos a los
usuarios finales, el sistema ofrece otro tipo de informacin: enlaces de descargas de datos,
estadsticas, punto de consulta SPARQL, y aporta un mecanismo de negociacin de con-
tenido / redireccin 303 para el acceso a recursos LOD (Cool URIs). Para los rastreadores
automatizados, los datos se devolvern siempre en formato RDF (rdf/xml, Notation3, rdf/
Json y Json-ld).
La nueva presentacin de los tesauros como LOD permite, por tanto, que recursos de
informacin ajenos puedan vincular sus propios registros de forma automatizada con los datos
que ofrece el Portal de Tesauros, si bien este quiere a su vez convertirse en un recurso de infor-
macin vinculado con otras fuentes. Para ello, los tesauros incluidos en el Portal han sido enlaza-
dos con vocabularios externos que ya se han publicado en Linked Open Data. Hasta el momen-
to, se han realizado vinculaciones con la Lista de Encabezamientos de Materia para Bibliotecas
Pblicas del Ministerio de Educacin, Cultura y Deporte, la Llista de Encapalaments de Matria
de la Biblioteca de Catalunya, Bibliothque nationale de France, Getty Art and Architecture
Thesaurus, Library of Congress, Deutsche Nationalbibliothek, as como con Dbpedia, Geonames
y Getty Thesaurus of Geographic Names (estos ltimos en el caso del Diccionario geogrfico).
En total, se han establecido 54710 enlaces SKOS closeMatch. El proceso de conversin a SKOS
y de vinculacin a recursos externos no ha sido automtico en su totalidad, ha requerido de la
intervencin humana para analizar previamente la definicin, estructura y relaciones internas de
cada tesauro que se skosifica.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
13

El proyecto de normalizacin terminolgica intenta, por tanto, adaptarse a los nuevos


retos tecnolgicos y a las nuevas oportunidades de mejorar la calidad de la informacin que se
ofrece a los usuarios. La incorporacin de nuevos vocabularios al Portal y su distribucin entre
los museos usuarios de DOMUS permitirn mantener vigente el continuado esfuerzo que se ha
desarrollado en este campo durante los ltimos aos.

Bibliografa
Alfaro Asins, C.; Marcos Alonso, C.; Otero Morn, P., y Graeda Min, P. (2009): Diccionario de
numismtica. Madrid: Ministerio de Cultura.
Alonso Sez, R. (2012): Tesauros de Patrimonio Cultural: Conocimiento en lnea al servicio del ciu-
dadano, Siam. Series Iberoamericanas de Museologa. Edicin de Asensio; Cabrera; Asenjo y
Castro, vol. 1.
Alquzar Yez, E. M., y Carrasco Garrido, R. (2005): JERARTES, CONVERTES y DOMUS. Herra-
mientas para la construccin, distribucin y utilizacin de tesauros en los museos, Museo, n.
10, pp. 1-10.
Blas Benito, J.; Ciruelos Gonzalo, A., y Barrena Fernndez, C. (1996): Diccionario del dibujo y la
estampa. Madrid: Real Academia de Bellas Artes de San Fernando. Calcografa Nacional.
Cabrera Bonet, P.; Maicas Ramos, R., y Padilla Montoya, C. (2002): Diccionario de materiales cermi-
cos. Madrid: Ministerio de Educacin, Cultura y Deporte.
Carretero Prez, A.; Chinchilla Gmez, M.; Barraca de Ramos, P.; Adellac Moreno, M. D.; Pesquera
Vaquero, I., y Alquzar Yez, E. M. (1996): Normalizacin documental de museos: elementos
para una aplicacin informtica de gestin museogrfica. Madrid: Ministerio de Educacin y
Cultura.

El lenguaje del patrimonio | Pgs. 7-14


Un vocabulario comn para un patrimonio diverso: el proyecto de tesauros del patrimonio cultural de Espaa...
14

Kroustallis, S. K. (2008): Diccionario de materias y tcnicas (I. Materias). Madrid: Ministerio de Cultura.
(2016): Diccionario de materias y tcnicas (I. Tcnicas). Madrid: Ministerio de Educacin,
Cultura y Deporte.
Rodrguez Bernis, S. (2006): Diccionario de mobiliario. Madrid: Ministerio de Cultura.
Trinidad Lafuente, I. (2011): Diccionario de objetos asociados a ritos, cultos y creencias. Madrid: Mi-
nisterio de Cultura.
(2012): Diccionario de objetos asociados a la expresin artstica. Madrid: Ministerio de Edu-
cacin, Cultura y Deporte.

El lenguaje del patrimonio | Pgs. 7-14


15

Presentation RKD terminologies, RKDartists, Iconclass and


(the Dutch) AAT
Reem Weda
Information specialist terminologies

Introduction
I was invited here to tell you something about the controlled vocabularies that are maintained by
my institute the RKD. These being: RKDartists, Iconclass and the Dutch translation of the AAT. I
am honored and happy to be here.
Something about myself: I studied History in Groningen. I was assistant for the provincial
museum consultant on the matters of collection registration and documentation. In this job I
came across the issues concerning terminologies and thesauri when I talked to museum regis-
trars and while giving the a course for standard registration and documentation in museums. The
content of the course being sanctioned by the Museum Association of the Netherlands. In this
course the use AAT was promoted to museums.
Since I started working on the Dutch AAT six years ago, I became more aware of the
systematics behind thesauri, besides the usage as a terminology in which the terms reside that
museum registrars need to describe collections. A thesaurus can be more than just a list of terms.
For instance a knowledgebase and an great access point for browsing through collections. They
are important for shared and connected data especially.
I know now that trying to connect all knowledge about heritage and art in a single the-
saurus is probably not a task that any heritage organization can do solely by herself. It might
not be possible at all, you might think, and maybe youre right. On the other hand: the AAT
does already seem to be to connect an awful lot of generic concepts together, and the overlap
with most other heritage terminologies is quite substantial. Linking the best and most important
terminologies with the AAT should be able to provide a big improvement to semantically linking
hiritage data.
Question remains: Who will do this work? It still cannot be automated completely.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
16

Content
Introduction
The RKD
RKD vocabularies
RKDArtists
Iconclass
Dutch Art & Architecture Thesaurus
The Getty Vocabularies in LOD
Discussion

RKD Netherlands Institute for Art History


But first something about where I work. The RKD is located in The Hague, location of the Dutch
parliament, and home to the international criminal court. The building you see here is our home,
we share the building with the Royal Library among other, so its not all ours. The RKD is a
knowledge institute and the central resource for the study of Dutch and Flemish art in an inter-
national context. The RKD opened as a state funded institute to the public in 1932. Since 1995
the RKD has been a private foundation. However, the collections managed by the foundation
remain state property. We have about 60 full time employees working at the RKD.

RKD collections
The RKD manages a unique collection of archive, documentation and library material relating to
Western art from the late Middle Ages to the present. The nucleus of the collections is made up
of documentation on Netherlandish art.
The other parts of the collection are the extensive library with more than 4500000 items;
The RKDs Archival Collection contains 1100 meters of documents; the datasets of the RKd are
being published online through the web portal RKD explore RKD. It provides access to the col-
lections: visual and press documentation, the library and archives as is the biographical data in
RKDartists&, and the attributions of works of art in RKDimages. New information is added to the
databases every day.
Besides these collections we host several vocabularies, RKDArtists as a name authority,
Iconclass and we maintain the Dutch version of the AAT.

Controlled vocabularies RKD


Here we see our vocabularies.
RKDartists: biografical info 250000 persons related to the arts.
Iconclass: 28000 classifications for art subjects.
Dutch AAT: 36000 generic concepts for heritage collections.
I would first like to show you how the vocabularies are situated in the Dutch heritage world.

RKD in the Cloud


Here we see a visualization that I made of the RKD terminologies in the cloud of Heritage data.
They are connected to users in the field art like museums, but also other standards and reposito-
ries like Europeana and also Wikipedia/wikidata. Most users are only using one vocabulary, while
some might use all three. This is not a complete picture but merely a suggestion of the situation.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
17

RKDexplore
For our collections we have a search and discovery portal called RKD explore. To improve the
search results and the user experience is an ongoing challenge.

We use local thesauri in all databases, we try to link as much as possible to the AAT, but
RKD has build up a distinct local thesaurus over the years. Besides AAT for we use Iconclass
to index iconographical subjects on the older artworks in our Images database. In this example
you see a record of a painting by Frans Hals, of a portrait of a man dressed as Mars. This images
shows the subject keywords and iconclass codes used.
RKDartists is available through Explore and is used by RKD as an index and access point
to the other datasets and also the analog art documentation (which is still situated in card board
boxes for the large part).

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
18

Why still the need?


Here are some examples for identifying synonyms and homonyms.

For describing and cataloging cultural objects


Vocabularies necessary for:
More effective exploration and use of collections
People find more of what they want and what they need
Standardised cataloging is the key to better acces to collections; it helps people to unders-
tand and use other collections that are working the same way.

Example Picasso, five female nudes


Here are some examples of what we do with terminologies
Work Record
Class [controlled]: paintings Twentieth Century art
Title:Les Demoiselles dAvignon Title Type: repository
Title:Five Female Nudes Title Type: descriptive

Bust by Rombout Verhulst, Jacob van reigersberg


Work Type [link]: statue bust
Title: Bust of Jacob van Reygersberg
Creator Display: Rombout Verhulst (Flemish, 1624-1698)

CCO
Within metadata standards (like CCO) vocabularies and thesauri have a important place. Cata-
loging Cultural Objects: A Guide to Describing Cultural Works and Their Images (CCO) is a

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
19

published manual for describing, documenting, and cataloging cultural works and their visual
surrogates. Its a Cross-community standard.

CC principles on vocabularies
I mention the CCO because here the vocabularies are integrated as a essential part in the practice
of cataloging. Two of the ten principles of CCO are: use controlled vocabularies AND Create lo-
cal authorities that are populated with terminology from standard published controlled vocabu-
laries as well as with local terms and names. (Structure local authorities as thesauri whenever
possible. Record and document decisions about local authorities).

RKDartists
The content of RKDartstist&
This is our database with biographical data for Dutch and non-Dutch artists from the Mid-
dle ages till present. Other persons that are of importance to art, like scholars, collectors, and
traders are also added to the dataset. First reason for the RKD to develop this controlled list is
that it functions as an index to the collection of art historical documentation (pictures, library,
archives).
Another important reason was that here we could make persons to one another and to im-
ages and documents through a relational database. Since then a lot of useful information about
persons related to the arts in the Netherlands where and is being recorded in RKDartists.
At present, the database contains recordsof approximately250,000 biographical records.
Most of the artistsfor whom the RKD has documentation have been incorporated, but this is true
for relatively few of the art collectors, art dealers and art historians. New records are added daily.
We are looking into the possibilities of having trusted partners from outside the organization also
work on the data, and even add new records themselves.

Content of a RKDartists record: Rembrandt


Some records have been worked on in greater detail than others. Here we see the example of
the record for our most famous Dutch master Rembrandt. There are five name variants registered
for him. But the preferred name is simply Rembrandt (with DT). The Artists record is not meant
as an comprehensive article about a certain person, but in this case the most noteworthy events
in Rembrandts life have been added to the record. Most of the work has been put in connecting
the record to other parts of the collection, to books, documentation and documents but also to
other artists records, for instance to those that followed in Rembrandts footsteps.

Webservice Open Search


Recently we have made available a web service for RKDartists data.
It is meant for application developers e.g. collection management systems, websites and
apps. Ands is based on: Encoded Archival Context for Corporate Bodies, Persons, and Families
(EAC-CPF). Not all the data has been made available for search in this service. The Search meth-
ods are on a limited set of elements from RKDartists. Unfortunately we havent put the docu-
mentation for the service online yet, and its in Dutch, but if youre interested we can provide it.
Perhaps translate it.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
20

Search on Paulus Potter


It works through a set of standard search methods, for instance on a part of a name, or full name,
you will retrieve information from the Artists set. Now if we want to find the data for Paulus Pot-
ter, a master in animal paintings, who died quite young. We will find the following data.

EAC-CPF data on Paulus Potter (1625-1654)


Here we see the EAC-CPF data on Paulus Potter. The information is based on a limited set of
data, but the biographical core data and the name variants are there. You can search on periods
and locations as well as on qualifications like printmaker, painter, draftsman Also the Unique
ID and the link to the full record on Explore are provided.

Authority file Wikipedia wikidata authorithy control


These days the world of terminologies is changing rapidly with multiple datasets becoming avail-
able online and often being connected. Combining the information from these sources would
be beneficial for all. You see something like this happening on Wikipedia and the Wikidata ele-
ments that are becoming more important. Here the data is not yet connected as such but the
RKD data is used as an authority file. Together with several other databases, like Worldcat, VIAF,
LCSH and such. When these sets are made Open Data (if they arent already) then the combining
of information could really take off.

Iconclass
Iconclass is a classification system designed for art and iconography. It is a widely accepted
scientific tool for the description and retrieval of subjects represented in images (works of art,
book illustrations, reproductions, photographs, etc.) and is used by museums and art institutions
around the world.
Iconclass is a subject-specific classification system. It is a hierarchically ordered col-
lection of definitions of objects, people, events and abstract ideas that serve as the subject of an
image.
And as a research tool, Iconclass is also used to identify the significance of entire scenes
or individual elements represented within an image. This is done with Alfa-numerical codes with
text correlates.
Alphabetical Index: 14,000 keywords used for locating the notation and its textual correlate
needed to describe and/or index an image.
Bibliography: 40,000 references to books and articles of iconographical interest (not yet
online).
Multilingual (English, German, French, Italian, Finnish and Portuguese, a small part even
in Chinese).
Spanish translation is being worked on by La Direccin de Bibliotecas, Archivos y Museos
(Dibam) El patrimonio de Chile, by Lina Nagel and Marisol Richter. Dutch is being worked on
by RKD at the moment, but not structurally. If youre interested in joining the work please let
me, or them know.
Needles to to say with some many languages its Internationally used. Among others: the
Deutsches Dokumentationszentrum fr Kunstgeschichte - Bildarchiv Foto Marburg (the German
Counterpart of RKD), Centre dtudes Suprieures de la Renaissance (CESR Tours), Glasgow
University and also the Rijksmuseum and Royal Dutch Library.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
21

Main divisions of iconclass


The unique elements of the Iconclass system are its alphanumeric classification codes, called
notations. Notations always begin with one of the digits 0 - 9, corresponding with the ten main
divisions of Iconclass.
The main divisions of the Iconclass system are represented by digits 0 to 9. Of these ten
main divisions, the numbers 1 to 5 are general topics, designed to comprise all the principal
aspects of what can be represented. Divisions 6 through 9 accommodate special topics, coher-
ent subject matter of a narrative nature, with an emphasis on the Bible (7) and Classical Mythol-
ogy (9). A tenth division, represented by the number 0, was added in 1996 at the request of
Iconclass users, to accommodate abstract art.
The text explaining the meaning of an Iconclass notation is the notations textual corre-
late. Several notations can be used to describe complex subjects.

Iconclass browser
The multilingual Iconclass Browser has an educational and a practical goal, which is to show how
Iconclass works. At the same time, it serves as a search tool that allows an indexer to find the concepts
to tag an image. Needless to say, it can also be used to establish the correct meaning of a notation.
You can search on keywords and text correlates to find the notation you are looking for.
You can also follow the hierarchal path to come to the topic you need. But this might not show
you every option there is. The hierarchy is functional as a thesaurus, with Every notation part of
a hierarchical structure and, as such, incorporates all of its iconographical broader terms.
For instance 71D12 Joseph sold into slavery and taken to Egypt. The notations 7 (bible),
71 (old testament), 71D (genesis, the story of Joseph) 71D1 (story of Joseph part 1) are all inte-
grated in this notation. You dont have to use the other notations if you use the Iconclass system.
In the past there where images shown from several collections with a notation, this was
disabled unfortunately but we want to bring it back in a new version of the browser we hope
to make next year.

Example images from the Bible: 71D12 Joseph sold into slavery and taken to Egypt
Some images that where indexed with this notation.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
22

Examples subjects
The notations not only represent stories but also to themes, motifs, stories, situations, activities,
gestures, events, ideas, messages, miracles. For instance: Also contains codes for gestures, posi-
tions, state of mind and feeling.

The AAT
The AAT is a structured vocabulary containing terms and other information about concepts. The Art
& Architecture Thesaurus is a reference of over 250,000 generic terms attached to 36000 concepts.
Terms in AAT may be used to describe art, architecture, decorative arts, material culture,
and archival materials. The target audience includes museums, libraries, visual resource collec-
tions, archives, conservation projects, cataloging projects, and bibliographic projects.

Here we see the concept of chapels, with its attached terms in several languages.

Terms for any concept may include the plural form of the term, singular form, natural
order, inverted order, spelling variants, scientific and common forms, various forms of speech,
and synonyms that have various etymological roots. Among these terms, one is flagged as the
preferred term, or descriptor. There may be multiple descriptors reflecting usage in multiple
languages.

The other Getty Vocabularies


The AAT is part of the Getty Vocabulary Program which consists of the following products.
TGN, ULAN, CONA.
The four Getty vocabularies are intended to provide terminology and other information
about the objects, artists, concepts, and places important to various disciplines that specialize in
art, architecture, and material culture.
TGN is a structured vocabulary currently containing around 2 million names and other
information about places. Names for a place may include names in the vernacular language,
English, other languages, historical names, names and in natural order and inverted order.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
23

The ULAN is a structured vocabulary currently containing around some 640000 names and
other information about artists. Names in ULAN may include given names, pseudonyms, variant spell-
ings, names in multiple languages, and names that have changed over time (e.g., married names).
CONA contains titles and other information about architecture and movable works, which
include paintings, sculpture, and a wide range of other objects. In CONA the other Getty vocabu-
laries are systematically linked in the records for the unique items..
Catalogers and indexers who use the vocabularies typically access them by using them
as implemented in a collection management system (either purchased off-the-shelf through a
vendor or custom-built for their local requirements) or by copying-and-pasting from the online
databases on the Getty Web site.
The data is also available via Web services, where it is updated every two weeks. The licensed
files include no user interface. As of February 2014, the AAT is available as Linked Open Data (LOD).

What is the AAT?


Work on the AAT began in the late 1970s from the perspective of art libraries and art journal
indexing services. Soon catalogers of museum objects and visual resource collections also ex-
pressed a need for similar controlled vocabulary to encourage consistency in cataloging and
more efficient retrieval of information.
From its inception, the AAT was intended to satisfy a variety of user groups. The initial core
of the AAT was gathered from terminology already being used in authority lists and the literature
of art and architectural history; this terminology was approved and supplemented by a scholarly
advisory team comprising people from the whole heritage spectrum. Reaching consensus among
these various groups required long discussions and difficult negotiations, with the goal of creating
a resource applicable to their diverse interests and requirements that would allow cross-collection
retrieval. The AAT grows and changes via contributions from the user community and editorial
work of the Getty Vocabulary Program. They do this using well-established editorial rules.
First publication on paper in 1990.
The AAT contains generic terms; it contains no iconographic subjects and no proper names.
That is, each concept is a case of many (a generic thing), not a case of one (a specific thing).
For example, the generic term cathedral is in the AAT, but the specific proper name Chartres
Cathedral is out of scope for the AAT
There are about 100 languages in the AAT, but There are only three (almost) full transla-
tions of the AAT, From English, into Dutch and Spanish. Work is being done on a Chinese and
German translation. I understand that Portuguese and Polish are starting up. A French translation
is a long excising wish, and might be taken on in Belgium in the near future.
AAT is developed in line with ISO 25964 and NiSO norms. The AAT is truly a standard
thesaurus what that matters.

CONA record, Eiffel tower


A critical feature that makes the vocabularies useful as authorities is that each vocabulary record
is identified by an unique, persistent identifier. In this CONA record we see the concepts being
linked to the other vocabularies.

Structure of AAT
Within its given scope of art, architecture, and material culture, the AAT is organized for general
use; it is not organized for one particular use or according to any specific discipline.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
24

For example, a user asked, why arent communion cups and chalices narrower terms to
church plate? This happens because church plate is a collective term for many different types
and forms of objects used for ecclesiastical purposes, thus it is placed in the Object Genres
hierarchy. Individual examples of church plate, such as communion cups and chalices or can-
dlesticks, for instance, are found in various other places in the AAT, because the AATs organi-
zation stresses function and form over the context in which an object is used. For this reason,
communion cups and chalices are placed in Containers, and candlesticks in Furnishings, under
lighting devices.
However, the AAT can link them to liturgical vessels as an alternate parent using poly-
hierarchical relationships

Definition of Thesaurus
Lets get back to the basic for a minute: what is a thesaurus?
Modern: a semantic network for retrieval and connecting (collection) data. Thesauri may
be monolingual or multilingual
ISO 25964: controlled and structured vocabulary in which (unique) concepts are repre-
sented by terms, that are organized in hierarchic, equivalent and associative relationships that are
made explicit, and preferred terms are accompanied by lead-in entries for synonyms or quasi-
synonyms.
Relations: The defining characteristic of a thesaurus, that which distinguishes it from a flat
list of terms such as a glossary, is the network of relationships among its terms and concepts.
These relationships are semantic relationships, based on logical connections among the con-
cepts, activities, and objects represented by the terms. Thesaurus construction standards identify
three kinds of relationships, all of which are included in the AAT:

The Equivalence Relationship; flying buttreses


Multiple terms may refer to the same concept. The relationship between terms that represent the
same concept is the equivalence relationship. Among terms that refer to a single concept, one is
chosen as the preferred term or descriptor. This is the term that is most often used to refer to the
concept in scholarly or professional literature.
All equivalence relationships in Getty Vocabularies are true synonyms = exact equivalents.
Partial synonyms are related terms. In the AAT the terms include Descriptors, Alternate Descrip-
tors, and Use For Terms.

Hierarchy for hacienda


The hierarchical relationship links concepts to broader and narrower contexts. In the AAT, hi-
erarchical relationships link generic classes of objects, actions, or concepts to their members or
species.
Here we see the hierarchy from the facet all the way down to the concept of Haciendas.
Its a Spanish concept by origin, but because it is known in other languages also it needs to be
disambiguated for each language

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
25

The sources and contributors are always add to the concept details. In this case we see
DIBAM as contributor for the Spanish equivalent and the sources that were used.

Associative Relationship
Associative relationships or related terms are used primarily for retrieval. only when the concepts
are directly and uniquely related, but where hierarchical relationships are inappropriate. If a
thesaurus is bound together by too many associative relationships between entities that are only
loosely or indirectly related, the value of the relationships in retrieval is lost.
For example, linking brushes to the hundreds of activities that could involve a brush should
be avoided. However, linking watercolor brushes to watercolor painting (technique) would be a
direct, unique, and appropriate Associative Relationship.
Values for relations.
Values are chosen from a controlled list comprising a code and phrase. Each code-plus-
phrase is linked to another code, which is the reciprocal relationship.

The 7 facets
Facets constitute the major subdivisions of the AAT hierarchical structure. A facet contains a
homogeneous class of concepts, the members or children of which share characteristics that
distinguish them from members of other classes.
For example, marble refers to a substance used in the creation of art and architecture, and
it is found in the Materials facet.
Impressionist denotes a visually distinctive style of art, and it is found in the Styles and
Periods facet.

Dutch translation: website


Here we see the dutch browser for the AAT. All accepted concepts and the candidates are pub-
lished here. The users can make comments or suggest another term if they want to. These com-
ments are also shown to make clear that the vocabulary can be edited and improved with the
help of the public.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
26

The AAT-Ned or Dutch AAT is a translation of the Getty AAT and in an way extended
version of it. Extended in the sense that AAT-Ned also hosts several thousand Dutch candidate
concepts that are used in the Dutch heritage field. We are working together with an editorial
board consisting of Flemish and Dutch professionals to get these terms validated and translated
to have them accepted by the Getty.

Dutch translation organization


RKD handles translation of Getty AAT
We have translated 360000 of the now 43000 concepts in the Getty AAT.
There is a difference in content between the Dutch and the American AAT, in number of
concepts but also scope notes and hierarchy can differ.
Reason: work continued on both sides and we dont have a regular way of exchanging
data yet (perhaps soon).
We strive to make the difference as small as possible. Soon well work in an updated ver-
sion.
New concepts via the editorial group and then send to Getty Vocabs.
Slow process... But recently the 600th concept was added!

Spanish translation
I would like to mention the Spanish translation is being maintained by the same institute and
people that work on the Iconclass translation, namely the La Direccin de Bibliotecas, Archivos
y Museos (Dibam) El patrimonio de Chile, by Lina Nagel and Marisol Richter. They are also al-
most completely synchronized with the English AAT. Im sure they are open for any input from
the Spanish institutes to improve their translations.

LOD cloud
Here we have to all too familiar image of the LOD-cloud (2011). I guess nowadays it not even
possible anymore to show a readable presentation of the cloud like this.

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
27

Roughly speaking, yesterday your digital resources where simple and blindly connected
(on the web), today their connections with the network can have explicit meaning. The hyper-
link is becoming semantic. Because the Semantic web is a world of connected pieces of knowl-
edge rather than a network of pieces of information.

Getty web service


Data structures like JSON and OWL are available
The base URI is <http://vocab.getty.edu/>
SPARQL-endpoint (SPARQL Protocol and RDF Query Language)
Standard presentation is SKOS or SKOS-XL Simple Knowledge Organization System. But
Several other xml
Mappings and ontology based on RDF/XML and Turtle
Published versions of lookup lists e.g., languages, roles, nationalities, place types, and
bibliographic sources).

Europeana and AAT (and Iconclass)


Europeana is using the AAT and Iconclass in its datamodel. So when you send in data with links
to the concepts, Europeana can switch between languages and might even be able to provide
an end-user thesaurus in the future. Here we see the example of records from Erfgoeplus.be, a
Belgian initiative and local aggregator for heritage. The example records is about stereographs
or estereogramas (hope that is correct).

Discussion topic
When I started working on the Dutch AAT, I wondered why so many terminologies existed in
the heritage field and why they kept being made? Isnt it more practical to use one standard
terminology and work on expanding the one already made?
Of course this is no new idea, and it has been tried to promote in the Netherlands. But
before the internet, digitized collections and linked data this was not very successful.
One reason why it didnt work: the not invented here syndrome, people want their own
terminology to reflect their thinking and knowledge about a topic. Even when they dont really
know how to construct a well organized thesaurus. Thats why local terminologies that I have
seen usually do not have a good thesaurus structure.
Reason two: Apparently not one terminology is perfect, or complete enough to be used
by another professional or institute. There will always be reasons to dismiss the ready-made
terminology. Like the term we use for this type of object is not there. Or: there are mistakes in
this terminology.
The resulting new terminology usually fixes some issues for the users, but it will have its
own limitations an errors just like the discarded one.
So, we keep on working on new terminologies that suit our needs. And we keep on in-
venting the wheel and quite often eventually getting stuck. To me, Its a shame we dont have
a good way to bring the knowledge of terminologies together. Improve existing structures,
expand them structurally with concepts from different knowledge domains, so that everyone
can benefit. I know this centralized idea has its drawbacks, and it might not be possible to
achieve.
Now, considering connecting knowledge, there might be hope on the horizon with the
promise of LOD. It provides a method for connecting concepts between knowledge systems

El lenguaje del patrimonio | Pgs. 15-28


Presentation RKD terminologies, RKDartists, Iconclass and (the Dutch) AAT
28

through SKOS labels (CloseMatch and ExactMatch). The only problem is that this wont hap-
pen automatically. We, the domain experts and data experts, have to make the connections
ourselves.
Its an impossible amount of work to connect everything to everything manually, I would
say. But apparently there is already a lot to be gained if parts of the concepts between datasets
are mapped. We have to start somewhere. Another solution could be, that we use a master the-
saurus to use as the backbone for our terminologies, one that is maintained and developed by
a trusted and structurally funded party and keeps its content in line with thesaurus construction
guidelines. This idea is slowly growing on people. But there are still a lot of hurdles to be taken.
In the Netherlands there is a movement that wants to bring terminologies together in a
joint SKOS based environment where users are free to make these connections between termi-
nologies. Its certainly a interesting thought to be able to search throughout all the connected
terminologies at once and be able to make use of all the content and making semantic connec-
tions. If this approach will be a successful one still remains to be seen.

Information
RKDexplore (and RKDArtists): <www.rkd.nl>
Website AAT-Ned: <www.aat-ned-nl>
Iconclass: <www.iconclass.nl>
Getty Vocabularies: <http://www.getty.edu/research/tools/vocabularies/index.html>

Spanish AAT: <www.aatespanol.cl>

El lenguaje del patrimonio | Pgs. 15-28


29

Normas y estndares para la elaboracin de tesauros de


patrimonio cultural
Javier Garca Marco
Universidad de Zaragoza

1. Introduccin
El objetivo del presente captulo es analizar los recientes proyectos internacionales de reforma
y ampliacin de las normas sobre tesauros para su adaptacin a los nuevos contextos de inte-
gracin e interoperabilidad en el entorno digital; as como sus implicaciones para la elaboracin
de tesauros en el mbito del control, la conservacin, la proteccin y la difusin del patrimonio
cultural.
El resultado de estos esfuerzos ha sido la nueva norma ISO 25964 sobre Los tesauros y su
interoperabilidad con otros vocabularios1, que consta a su vez de dos partes: la primera sobre
tesauros para la recuperacin de informacin, publicada en 2011; y la segunda sobre La intero-
perabilidad con otros vocabularios, publicada en 2013 (ISO, 2011, 2013).
En este captulo se comenzar contextualizando la nueva norma en la historia de los tesau-
ros, y, de forma ms general, en la de la organizacin del conocimiento, analizando su papel en
la reconstruccin de la conexin entre indizacin alfabtica y sistemtica. Gracias a la limpieza,
solidez y simplicidad con la que se consigui este objetivo, los tesauros se han asegurado du-
rante dcadas un papel fundamental en los esfuerzos por organizar el conocimiento registrado
y por hacerlo disponible para su aprovechamiento en sistemas de recuperacin de informacin.
Adems, han influido de forma decisiva en otros lenguajes documentales, como los sistemas de

Los estndares ISO pueden adquirirse a travs de su web: <http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.


1

htm?csnumber=53657> y <http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=140&ics3=
20&csnumber=53658>. Asimismo se pueden conseguir a travs de la agencia nacional en Espaa, AENOR, que distribuye tam-
bin la primera parte en espaol, en <http://www.aenor.es/aenor/normas/normas/fichanorma.asp?tipo=N&codigo=N0053960#.
Vkoq-4RnlZ8>. Igualmente, se pueden consultar en varias bibliotecas universitarias espaolas y algunas pblicas, para lo que
se recomienda la consulta del catlogo de REBIUN y el catlogo colectivo del Ministerio de Educacin, Cultura y Deporte.
Finalmente, el modelo de datos y el esquema XML estn disponibles de forma abierta en el sitio web de NISO, en la direccin
<http://www.niso.org/schemas/iso25964/schema-intro/>.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
30

encabezamientos de materia, las listas de control de autoridades y las propias clasificaciones


bibliogrficas y archivsticas.
En segundo lugar, se examinan los determinantes que exigan una revisin de las normas
existentes. Bsicamente, las nuevas normas buscan abordar la revolucin provocada por la gene-
ralizacin de Internet y lo que esto significa: la interconexin o interoperabilidad de diferentes
fuentes de informacin en formato digital, de modo que puedan tener acceso de forma integrada
por los usuarios, y que estos consigan una experiencia de uso similar a la de los portales de
Internet a travs de bsquedas centralizadas y simplificadas; pero, en el caso de la fuentes de
informacin documentales, sin perjuicio de sus ventajas, ligadas a un control preciso y exhausti-
vo de la informacin que contienen. En particular, esta necesidad de adaptacin de los tesauros
para su interoperabilidad en Internet ha encontrado un entorno amigable y frtil en el proyecto
de la Web Semntica (Berners-Lee; Hendler y Lassila, 2001).
En tercer lugar, se desglosa detalladamente el avance hasta la ISO 25964 a travs de los
proyectos de norma estadounidense y britnico, as como las nuevas aportaciones realizadas en
la norma internacional de tesauros. A continuacin, se describen las dos partes de la norma, la
primera dedicada a los tesauros propiamente dichos y la segunda, a su interoperabilidad. Final-
mente, se explica la situacin en Espaa, donde se ha constituido un grupo de trabajo dentro
del Comit 50 de la Asociacin Espaola de Normalizacin y Certificacin (AENOR), el cual ha
realizado ya la traduccin y adaptacin al espaol de la primera parte de la norma, y se encuen-
tra en el proceso de culminar la segunda parte.
La historia de los tesauros y su evolucin hasta su forma actual ha sido desarrollada por
un amplio conjunto de autores (entre otros, Foskett, 1982; Lancaster, 1986; Gilchrist, 1991; Dahl-
berg, 1991, 1992, 1995; Currs, 1991, 1992, 1998; Williamson, 1996; Gilchrist, 2003; Aitchison and
Dextre Clarke, 2004; Dextre Clarke, 2008), en particular el camino hasta el nuevo estndar ISO
25964, resumido recientemente por Dextre Clarke and Zeng (2012).

2. Los paradigmas sistemtico y alfabtico en la organizacin y


recuperacin del conocimiento
La clasificacin es una funcin cognitiva que est en la raz del pensamiento humano (Garca y
Esteban, 1993). La informacin que le llega al ser humano es desbordante para las limitaciones
de su sistema cognitivo. Por ello, el ser humano selecciona de la realidad los aspectos que son
accesibles para su sistema cognitivo y relevantes para su accin. Precisamente la clasificacin es la
estrategia que utiliza la mente para optimizar su capacidad de procesamiento, que en el caso de
la memoria de trabajo ronda los siete conceptos (Miller, 1956). Parte del proceso de clasificacin
est regulado por mecanismos innatos, que producen una categorizacin natural. Por encima
de esta capa de conceptos naturales se desarrollan conceptos ms generales (supraordenados)
y ms especficos (subordinados) (Lloyd y Rosch, 1978), que dependen del aprendizaje cultural.
Otro aspecto clave del ser humano es la capacidad de recordar y de compartir esa me-
moria con otros miembros de los grupos a los que pertenece o con los que se relaciona. Por
ello, una parte notable de la evolucin cultural ha sido el desarrollo de tcnicas para mejorar el
funcionamiento de la memoria, necesarias para incrementar la cantidad de conocimientos que
pueden ser recordados por un grupo social. Un hito fundamental en esta evolucin es la inven-
cin de memorias externas, los documentos (Pinto, Garca y Agustn, 2002, cap. 4).
El desarrollo de la representacin del conocimiento sobre superficies externas se apoya
tambin en procesos de clasificacin. Para ganar complejidad sin perjuicio de su accesibilidad,
los documentos se estructuran en partes y se relacionan unos con otros. Conforme el nmero
de documentos prolifera, se hace necesario tambin clasificar y organizar estos de una manera
sistemtica, y surgen los sistemas de organizacin del conocimiento.
Los sistemas de organizacin ms antiguos son los temticos y los cronolgicos (registros).
Sin embargo, conforme los conocimientos proliferan, los rboles de conceptos que surgen de los

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
31

procesos de clasificacin avanzados se vuelven cada vez ms inmanejables; y, al extenderse los


registros cronolgicos, estos tambin se vuelven difciles de manejar para bsquedas que no se
basen en claves temporales. Por suerte, en el marco de un cuerpo cultural consolidado y estable,
existen clasificaciones compartidas que permiten un acceso estable al conocimiento. Sin embar-
go, en las pocas de gran expansin del conocimiento como ocurri en poca helenstica, tras
la invencin de la imprenta, durante la revolucin cientfica del siglo xix, durante las guerras
mundiales del siglo xx o en la expansin de Internet, resulta difcil actualizar esas estructuras
conceptuales, e incluso puede ocurrir que sus mismas bases sean puestas en cuestin.
Precisamente en poca helenstica se invent una tecnologa capaz de ofrecer acceso a
la informacin sorteando los requisitos de la organizacin conceptual sistemtica. Se trata de
la aplicacin del orden alfabtico, inventado con fines didcticos para el aprendizaje de la es-
critura fenicia, a la ordenacin de conceptos por sus trminos. De esta manera, si se conoce el
trmino que expresa un concepto, se puede rescatar la informacin de inters porque es posible
predecir su lugar en cualquier lista ordenada. La forma ms fcil de aplicar este principio es a
los autores o los ttulos. La utilizacin de la ordenacin alfabtica se documenta por primera vez
en la Biblioteca de Alejandra (Daly, 1967). Las ventajas de la ordenacin alfabtica en el campo
de la eficiencia son enormes: mientras que la clasificacin u ordenacin sistemtica requiere
un conocimiento profundo del campo del saber en cuestin, la ordenacin y recuperacin al-
fabtica se puede delegar en cualquiera que conozca el sistema, en la prctica por cualquier
persona alfabetizada. Eventualmente, como sucede en la actualidad, la ordenacin alfabtica se
puede delegar en mquinas, automatizndola totalmente y amplindola con otras herramientas
de recuperacin.
No obstante, la predictibilidad que ofrece el sistema alfabtico en la recuperacin se li-
mita al propio orden alfabtico. No permite recuperar por otras dimensiones conceptuales, en
particular a travs de las relaciones con otros conceptos, por ejemplo, buscando trminos ms
especficos, genricos o relacionados. Es decir, solo permite recuperar trminos que comparten
la misma raz, limitando extraordinariamente las posibilidades de navegacin por la informa-
cin. Sin embargo, hemos visto que la mente humana, cuando encuentra un problema, utiliza
la especificacin y agrupacin de conceptos como estrategia fundamental en sus procesos de
inferencia, y, por lo tanto, tambin en los propios procesos de bsqueda documental.
Por esa razn, ambos sistemas son complementarios y necesarios, y en diferentes mo-
mentos de la historia de los sistemas de organizacin del conocimiento se ha buscado la inter-
conexin entre ambos. La sntesis ms conocida anterior a los tesauros es la que consigui el
bibliotecario norteamericano Charles Ammi Cutter en el ltimo tercio del siglo xix al interco-
nectar el diccionario alfabtico con las clasificaciones bibliogrficas, en su caso la clasificacin
expansiva que haba desarrollado.

3. El reto de la explosin de la informacin cientfico-tcnica y el origen de


los tesauros
Sin embargo, esta primera sntesis entre los dos monumentos de la biblioteconoma del siglo
xix las listas de encabezamientos y las clasificaciones bibliogrficas colaps ante el enorme
crecimiento de las ciencias que se evidencia ya a finales del siglo xix, pero que se potencia
durante la primera mitad del siglo xx, en particular durante los esfuerzos de investigacin apli-
cada que precedieron, acompaaron y siguieron a las dos guerras mundiales. En este contexto
de explosin del saber, la era del libro dej paso de forma decidida a la del artculo cientfico,
caracterizado por su mayor especificidad e interdisciplinariedad.
Como consecuencia, los cientficos naturales y los tecnlogos manifestaron su frustracin
con la rigidez y falta de precisin de las clasificaciones existentes, y aplicaron las nuevas tecnolo-
gas de ordenacin automtica y de clculo basado en la lgica de Boole, como las mquinas de
IBM, para solventar sus problemas de organizacin y recuperacin del saber. La idea era marcar

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
32

los documentos con cuantos descriptores fuera necesario, y dejar su coordinacin para el mo-
mento de la bsqueda, utilizando las capacidades de clculo booleano de los nuevas mquinas
ordenadoras. Por ello, se hablaba de postcoordinacin (de los trminos en la bsqueda), frente
a la precoordinacin de los trminos que ocurra en el momento de la indizacin en el caso de
las clasificaciones o encabezamientos de materia.
Entre las diversas propuestas que se hicieron por entonces, destacan como antecedente
directo de los tesauros los descriptores de Moers (1950, 1951). Este autor propuso combinar
una matriz de anlisis de contenido propia para cada disciplina o campo especializado de do-
cumentacin que guiara la seleccin de conceptos de inters, la codificacin no precoordinada
de los descriptores en una tarjeta perforada para cada artculo, y el ajuste de las bsquedas a
las necesidades mediante un ordenador basado en el lgebra de Boole. Los descriptores podan
constar de tantas palabras como fuera necesario para codificar conceptos lo suficientemente es-
pecficos, y se podan asignar a cada artculo tantos descriptores como se considerara adecuado
para representar todas las necesidades de recuperacin previstas.
Entre los nuevos sistemas basados en la ordenacin alfabtica que se propusieron, el
sistema que se apartaba de forma ms radical de los anteriores fue, posiblemente, el de los uni-
trminos de Taube (1953). El sistema de unitrminos se basaba en extraer trminos relevantes
y muy especficos de los textos, y marcar las tarjetas perforadas de cada artculo. Los trminos
deban ser simples, por lo que no haba ninguna precoordinacin, de ah uni-trminos. Aunque
el sistema era adecuado para mbitos muy especficos con un vocabulario muy tcnico, se mos-
tr ineficaz para mbitos ms amplios, interdisciplinares o con una base lxica muy compartida
con el lenguaje cotidiano u otras especialidades, por lo que fue muy criticado fuera de los m-
bitos muy especializados en los que se aplic con xito (Moers, 2003: 818; Aitchinson & Clarke,
2004: 7). Sin embargo, el enfoque de los unitrminos abri el camino a los actuales sistemas de
recuperacin de la informacin en texto libre, que actan bajo los mismos principios pero sin
seleccin a priori de los trminos y con un conjunto de rdenes de bsqueda ms amplio.
Por otra parte, los esfuerzos desde la tradicin bibliotecaria no se haban interrumpido.
Mientras los documentalistas optaban por la postcoordinacin, algunos expertos bibliotecarios
crticos con las clasificaciones bibliogrficas haban estado trabajando en sistemas alternativos
para hacerlas ms hospitalarias al crecimiento de las disciplinas cientficas y la propia produc-
cin cientfica. Los ms conocidos de esos pioneros son dos bibliotecarios universitarios, muy
expuestos al crecimiento de la produccin bibliogrfica: el britnico Henry E. Bliss (1929, 1932,
1935) y el indio Shiyali Ramamrita Ranganathan (1933, 1937), cuyas formaciones les proporcio-
naban una perspectiva fuera de lo comn y que realizaron aproximaciones muy originales a la
clasificacin bibliogrfica. Ambos llegaron a una aproximacin semejante a la de los postcoor-
dinacionistas, pues consideraban que cada documento poda recibir clasificaciones alternativas
desde distintos puntos de vista. Estas perspectivas diferentes fueron denominadas por Ranga-
nathan facetas, y se aproximan a los puntos de vista de Moers, pero con un sentido universal
en vez de disciplinario. Sin embargo, frente a los postcoordinacionistas, tanto Bliss como Ran-
ganathan eran clasificacionistas, esto es, crean que los procesos de indizacin deban generar
clases con un orden de cita estable y predecible, de manera que se pudieran generar listados e
ndices sistemticos.
En este contexto, los tesauros surgieron a partir de las listas de descriptores por la necesi-
dad de proporcionar el contexto de los trminos, tanto para facilitar la expansin o restriccin
de las bsquedas como para proporcionar contexto a los indizadores y recuperadores cuando
no se conoce con precisin el potencial trmino de bsqueda. El modelo utilizado fue el de los
diccionarios conceptuales o tesauros utilizados para mejorar los procesos de escritura, lo que
no debera resultar extrao, pues la bsqueda de informacin es tambin un uso productivo del
lenguaje que se apoya en inferencias categoriales, entre otros recursos. En particular, se tom
como modelo el tesauro en lengua inglesa ms conocido, el Rogets Thesaurus.
El primer autor que propone utilizar el modelo del tesauro para organizar los vocabularios
estructurados para la recuperacin de informacin fue H. P. Luhn (1957), en el marco de un pro-

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
33

yecto de investigacin de IBM. En 1959 se construy el primer tesauro para controlar trminos
en un sistema de recuperacin para Dupont, y los primeros tesauros publicados aparecieron
en el cambio de dcada: el Thesaurus of ASTIA Descriptors del Defense Documentation Center
de los Estados Unidos (1960), y el Chemical Engineering Thesaurus del Institute of Chemical
Engineers (1961). Estos primeros tesauros estaban ordenados alfabticamente, con las relaciones
especificadas detrs de cada trmino.
El modelo estndar de tesauro que conocemos hoy en da surgi en 1967 con el Thesaurus
of engineering and scientific terms; a list of engineering and related scientific terms and their
relationships for use as a vocabulary reference in indexing and retrieving technical information
del Engineers Joint Council y el Department of Defensa (1967). El ao anterior, el Panel de Voca-
bulario de la Ingeniera del Engineers Joint Council (1967) haba aprobado una recomendacin
especfica de reglas y convenciones para el proyecto, que se public como apndice I del tesau-
ro. Estas reglas contienen todas las relaciones de equivalencia, jerrquicas y asociativas de los
tesauros modernos y sus abreviaturas en ingls (USE, UF, BT, NT, RT), recomendaciones para la
seleccin de los trminos preferentes entre un conjunto de sinnimos y cuasisinnimos, y sobre
la forma de los trminos. Sin embargo, la perspectiva sistemtica se limitaba a una presentacin
de las veintids categoras principales con un solo nivel de desarrollo. En esta dcada de de-
sarrollo de los tesauros hasta la consolidacin de su modelo fue decisivo el trabajo de Eugene
Wall (Krooks y Lancaster, 1993).
A partir de este trabajo, Derek Austin, el creador de PRECIS, y P. Dale escribieron las reco-
mendaciones de la UNESCO en 1970 (UNESCO, 1973), en el marco de un trabajo conjunto con
el comit de documentacin de la ISO (TC 46). Austin promovi la incorporacin del concepto
de tesauro sistemtico y el anlisis de facetas en las recomendaciones sobre tesauros, integrando
as tanto la tradicin de los clasificacionistas clsicos como de los revisionistas, y proponien-
do reglas ms claras para el tratamiento de trminos compuestos, que se derivaban en buena
parte del propio anlisis de facetas. Por entonces, el tesauro se estaba transformando ya en un
lenguaje koin, que incorporaba tanto los principios de los nuevos sistemas postcoordinados
basados en la lgica booleana y la utilizacin de ordenadores, como la tradicin de las grandes
clasificaciones bibliogrficas y los avances producidos en dicho campo durante la primera mitad
del siglo xx. En 1974 apareci tambin la primera versin de la norma ISO 2788 sobre tesauros
monolinges (ISO, 1974).
Conjuntamente con las recomendaciones de la UNESCO e ISO, comenzaron a surgir las
primeras normas nacionales. En 1974 apareci tambin la ANSI Z39.19-1974 titulada Thesaurus
Structure, Construction and Use, publicada por el American National Standards Institute (ANSI,
1974). Fue revisada por primera vez en 1980, y en 1993 cambi su ttulo, tras una segunda revi-
sin, a Guidelines for the Construction, Format, and Management of Monolingual Thesauri, que
fue a su vez revisada y confirmada en 1998, aunque con la recomendacin de que se revisara lo
antes posible para acomodarse a los cambios que Internet haba producido en el mbito de la
informacin y la documentacin.
As pues, en el crisol de las organizaciones internacionales se producen avances decisivos
para los tesauros. Se consolida la sntesis entre el enfoque postcoordenado y sistemtico de los
tesauros, y se realizan algunas aproximaciones al diseo de tesauros de alcance universal, in-
tentando tambin el acercamiento entre la perspectiva orientada a dominios especficos, propia
de la documentacin, y la enfocada a la organizacin bibliogrfica universal, ms caracterstica
de bibligrafos y bibliotecarios. En 1972 se public la primera edicin del Macrothesaurus de la
OCDE realizado por Jean Viet (Organisation, 1972), adoptado luego por las Naciones Unidas;
y en 1977 del UNESCO Thesaurus, de Jean Aitchison (1977), seguidos de varios otros durante
finales de los aos setenta y la dcada de los ochenta. En la mayora de estos tesauros inter-
nacionales, la presentacin sistemtica se despliega ya de una forma madura, en consonancia
con su enfoque ms clasificacionista. Un papel destacado de liderazgo en esta sntesis la tuvo el
British Classification Group, que conect las ideas de Bliss y Ranganathan y el movimiento de la
indizacin postcoordinada con notable xito.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
34

Fruto de este esfuerzo de aplicacin de los tesauros a mbitos de cooperacin interna-


cional fueron las recomendaciones para tesauros multilinges de la UNESCO en 1980, seguidas
del estndar ISO 5964 en 1985. Franceses, ingleses, alemanes y espaoles, entre otros pases,
tambin fueron adoptando las nuevas normas internacionales.

4. El impacto de la revolucin digital: la competencia de los modelos


alternativos y la crisis de los tesauros
Sin embargo, los tesauros que durante los aos sesenta y setenta se haban destacado como la
tecnologa lder en recuperacin de informacin, y no haban dejado de adaptarse y crecer co-
menzaron su declive precisamente en la poca en que la consolidacin de las normas interna-
cionales pareca marcar un futuro prometedor, a mediados de los aos ochenta.
La razn estriba en el triunfo de dos tecnologas competitivas que se haban estado desa-
rrollando precisamente en esa poca, y que descansaban el esfuerzo de bsqueda en sistemas
altamente automatizados y en los propios usuarios. Por un lado, los sistemas de recuperacin
basados en ndices inversos y clculo booleano se comoditizaron, y recibieron un gran refuerzo
del clculo vectorial y de la estadstica, contribuyendo a mejorar la relevancia de sus bsquedas
y presentaciones mediante la cuantificacin de la semntica latente en grandes conjuntos de
informacin (modelos vectorial y probabilstico). Por otro lado, la navegacin a travs de refe-
rencias intra, inter y extratextuales se automatiz mediante el hipertexto y su gran aplicacin en
red, la World Wide Web. Eventualmente, ambas tendencias confluyeron a finales de los noventa
en el nuevo entorno digital con el surgimiento de los grandes buscadores, un mbito en el que
ahora Google es hegemnico.
Por debajo de estos procesos, se situaba una corriente an ms general, la gran globaliza-
cin, que se retroaliment con la propia revolucin de Internet. No es casual que en noviembre
de 1989 cayera el muro de Berln, y ese mismo ao Tim Berners-Lee propusiera la World Wide
Web como medio transparente de publicacin y recuperacin de informacin. En los aos si-
guientes, EE. UU. abri Internet al resto del mundo, la World Wide Web despeg (1993) y se
transform en el medio de comunicacin por excelencia de la nueva globalizacin, derribando
fronteras y barreras entre pases y culturas. Tras varios intentos previos de xito ms limitado
por parte de otras empresas, Google cre a partir de 1996 un catlogo mundial para acceder a
Internet, liderando la monetarizacin de la recuperacin de informacin con valor comercial y
poltico, que es otro de los signos del nuevo paradigma en el que vivimos.
En este ambiente los tesauros parecan para muchos reliquias de un pasado casi lejano
(con ser tan reciente), y su valor solo se apreciaba plenamente en entornos muy especializados,
como las grandes bases de informacin qumica, farmacolgica, biomdica, econmica, legal
o relacionadas con la preservacin del patrimonio cultural o natural. Se trata de mbitos todos
ellos en los que se requiere gran precisin y exhaustividad en las bsquedas, cuyos profesiona-
les tienen un alto coste por hora, y en los que las consecuencias de pasar por alto informacin
relevante pueden ser muy graves.
Sin embargo, toda crisis conlleva una oportunidad; y una gran crisis como la que estamos
tratando, grandes oportunidades. En primer lugar, se planteaba la necesidad de conectar y unir
todos esos recursos especializados con el resto de la Internet, esto es, de hacerlos interoperables
en la red global. Efectivamente, la mayora de los recursos ms valiosos disponibles en Internet
estn organizados con herramientas muy diferentes, lo que dificulta su recuperacin conjunta:
la Clasificacin Decimal Universal, la Clasificacin Decimal de Dewey, la clasificacin de Yahoo,
los Encabezamientos de Materia de la Library of Congress y sus derivados en otras lenguas, las
Medical Subject Headings, y diferentes tipos de tesauros, listas de encabezamientos, cuadros de
clasificacin de archivos, etc.
En segundo lugar, pronto qued claro que, a pesar del nfasis del hipertexto en las rela-
ciones asociativas, los sitios web y por ende la propia Internet necesitaban estructura, no solo

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
35

enlaces, y que esas estructuras eran muchas veces incompatibles, impidiendo su explotacin
conjunta.
En tercer lugar, los datos de diferentes fuentes se acumulaban en Internet gracias al gran
esfuerzo de publicacin y digitalizacin (movimiento de los documentos y datos abiertos), pero
en gran parte segua siendo necesario un costoso procesamiento manual para cruzarlos y com-
patibilizarlos.
Por fin, los propios creadores de la World Wide Web se dieron cuenta de que, conforme
la red creca, era ms difcil separar el grano de la paja, y que era necesario dotar a los ordena-
dores de la red de una mayor compresin del significado de la informacin para los humanos,
de manera que pudieran auxiliarles en el desbordante universo de la informacin digital hasta
alcanzar el nivel del dato, que era muchas veces el objeto de la necesidad de informacin. Por
ello, en 2001 Tim Berners-Lee y sus colaboradores propusieron una nueva arquitectura de la
web en la que los documentos y los datos pudieran ser procesables de forma autnoma por las
mquinas para optimizar la utilizacin de la informacin disponible. Precisamente este proyecto,
al que denominaron web semntica, proporcion una infraestructura desde la que aprovechar
este conjunto de oportunidades que se abran a los tesauros. En concreto, los tesauros y otros
sistemas de organizacin del conocimiento enseguida se mostraron tiles como materia prima
para modelar la capa ontolgica de la futura web semntica, que ocupa el estrato intermedio
del modelo la definicin de las entidades y sus relaciones, especialmente a travs de formali-
zaciones claras como SKOS.
En definitiva, aunque Internet constituye efectivamente un increble y potentsimo entorno
de informacin global, sin embargo, est fraccionada en multitud de culturas tnicas y corpo-
rativas, lenguas y lenguajes tcnicos, agentes y repositorios inconexos, lo que impide que se
realice plenamente todo su potencial. Para convertir Internet en un entorno de recuperacin y
computacin realmente integrado, se requiere un gran esfuerzo para asegurar la interoperabili-
dad de los diferentes recursos y agentes; una interoperabilidad que tendr que ser horizontal o
distribuida por la propia naturaleza de la red.

5. La adaptacin de los tesauros al mundo digital


La respuesta en el campo de los tesauros ha sido realizar un esfuerzo internacional concertado
para desarrollar una nueva propuesta normativa en el campo de los vocabularios estructurados
para la recuperacin de la informacin, capaz de fortalecer la interoperabilidad de los recursos
de informacin en Internet. Dicho esfuerzo se enmarca en el objetivo ms amplio de adaptar
las herramientas documentales desarrolladas en los dos ltimos siglos al entorno digital, y en
particular los tesauros, por su capacidad de integrar las diferentes perspectivas que existen en la
organizacin del conocimiento: conceptual frente a alfabtica, universal frente a local, categori-
zacin frente a taxonomizacin, asignacin frente a extraccin, y perspectiva de experto frente
a perspectiva de usuario.
Los nuevos estndares sobre tesauros se conciben, desde esta perspectiva, como una pieza
ms dentro del conjunto de estndares que han ido apareciendo para hacer la Internet posible,
eficaz y eficiente (HTTP, REST), en particular dentro del marco creado por la Web Semntica
(XML, RDF, OWL, SPARQL) y los esfuerzos ms especializados que se enmarcan en ella, en
concreto el campo especfico de la informacin y la documentacin (Z39.50, SRU, ISO 2709,
MARC 21) y ms concretamente en el propio campo de los tesauros y vocabularios estructurados
(Z39.19, BS 8723, SKOS, ZThes).
Aunque Internet ha hecho ms acuciante el problema y lo ha convertido en una gran
oportunidad, la interoperabilidad de vocabularios de recuperacin no es un problema nuevo,
sino que se enmarca dentro de la tradicin de discusiones sobre la heterogeneidad y compati-
bilidad de las herramientas de organizacin del vocabulario. En particular, uno de los proble-
mas ms agudos dentro de este campo de trabajo fundamental es el de la compatibilidad entre

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
36

diferentes lenguas, esto es, el multilingismo. El reto del multilingismo se ha incrementado


con redoblada fuerza en Internet, donde el problema del acceso a la informacin en diferentes
lenguas y sistemas de recuperacin se presenta de forma contigua e inmediata.
Por otra parte, la capacidad de Internet de integrar los dos principales paradigmas de la
organizacin del conocimiento el precoordinacionista y el postcoodinacionista se adapta muy
bien a la propia naturaleza de la bsqueda de la informacin en la World Wide Web, en la que la
recuperacin propiamente dicha esto es la localizacin de informacin mediante ecuaciones de
bsqueda, en general sencillas y asistidas a partir de cajas de texto coexiste con la navegacin
en listas, esquemas, mapas y otros recursos semejantes (browsing, mapping).

6. Un repaso a los principales estndares actuales


La primera norma de tesauros en ser adaptada al nuevo entorno digital fue la americana Z39.19.
Como se ha mencionado, ya en la revisin de 1998 se haba constatado la necesidad de ponerla
al da ante los cambios que se estaban produciendo en el marco de la informacin electrnica
y de la World Wide Web. Atendiendo a esta necesidad, la National Information Standards Orga-
nization (NISO) organiz un taller de trabajo nacional el ao siguiente denominado Workshop
on Electronic Thesauri, que se celebr el 4 y 5 de noviembre de 1999, con el objetivo explcito
de investigar la conveniencia y posibilidad de desarrollar un estndar para los tesauros electr-
nicos. Dicha reunin fue apoyada por la American Psychological Association (APA), la American
Society of Indexers (ASI) y la Association for Library Collections and Technical Services (ALCTS)
de la American Library Association (ALA).
A partir del consenso y las recomendaciones del taller sobre tesauros electrnicos, se
desarroll la cuarta edicin de la norma Z39.19, cuyo ttulo se modific a Guidelines for the
construction, format and management of monolingual controlled vocabularies (ANSI, 2006). Se
trata de un extenso documento de 172 pginas que se inicia con un anlisis preliminar de la
necesidad del control de vocabulario; presenta los objetivos, conceptos, principios y estructura
de los tesauros; y define las normas de tratamiento terminolgico seleccin, alcance y forma
de los trminos simples y complejos, las relaciones, las tcnicas de presentacin, los aspectos
relacionados con la interoperabilidad, y las cuestiones referidas a su construccin, prueba, man-
tenimiento y gestin.
La norma americana innov en tres frentes principales: en primer lugar, pretenda abarcar
todo tipo de recursos de informacin, tanto tradicionales como electrnicos; en segundo lugar,
ampliaba su alcance a todos los vocabularios controlados adems de los tesauros propiamen-
te dichos, incluyendo concretamente las listas de trminos controlados, anillos y sinnimos,
taxonomas y tesauros; y, finalmente, abordaba por primera vez en una norma el problema de
la interoperabilidad de vocabularios en el marco de Internet. Sin embargo, tambin qued con
algunas limitaciones importantes: trataba nicamente el caso de los vocabularios monolinges y
dejaba de lado herramientas de vocabulario controlado muy importantes, cuya interoperabilidad
con los tesauros podra resultar tambin clave para los fines pretendidos.
La reforma de las normas britnicas sobre tesauros monolinges y multilinges BS 5723 y
BS 6732, idnticas a la ISO 2788 y ISO 5964, respectivamente se puso en marcha algo despus,
con el objetivo de integrar las dos normas anteriores y abordar los aspectos de interoperabilidad,
apoyndose en los conceptos desarrollados para el tratamiento del multilingismo (Aitchison y
Dextre Clarke, 2004; Gilchrist, 2007). El resultado, la norma BS 8723, ha sido un documento muy
amplio que consta de cinco partes, que se fueron publicando entre 2005 y 2008. La primera par-
te (BSI, 2005) establece las definiciones y conceptos comunes a todos los tipos de vocabularios
controlados para la recuperacin de la informacin en sistemas de informacin. La segunda parte
(BSI, 2005) trata de los tesauros propiamente dichos siendo equivalente a la norma precedente
BS 5723 (ISO 2788), pero aade adems pautas sobre su uso y gestin digital. La parte tercera
(BSI, 2007) analiza otros vocabularios estructurados, notablemente los esquemas de clasificacin,

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
37

los tesauros, las listas de encabezamientos, las taxonomas y las ontologas. La cuarta parte (BSI,
2007) trata en general la interoperabilidad entre vocabularios, as como el mapeo entre ellos; y
aborda la cuestin del multilingismo como un caso especial de interoperabilidad, por lo que esta
parte abarca los aspectos considerados en la anterior norma sobre tesauros multilinges BS 6723
(ISO 5964). Por fin, la quinta parte (BSI, 2008) trata los protocolos y formatos para el intercambio
de datos sobre vocabularios controlados, mediante el uso del XML y otras tecnologas semnticas.
En su conjunto, la norma britnica consigue varios avances notables sobre la estadouni-
dense. Entre ellos se debe destacar la consideracin de la interoperabilidad lingstica, la distin-
cin clara entre trminos y conceptos, el desarrollo de un modelo de datos, el anlisis de facetas
que resulta central en la moderna teora de la clasificacin y los tesauros, el tratamiento de los
sistemas de clasificacin como herramientas complementarias de los tesauros y puntos clave de
una estrategia de interoperabilidad entre los lenguajes documentales en conjunto, y el abordaje
de otros lenguajes como las listas de encabezamientos de materia, cada vez ms tesaurizadas, y
de algunos sistemas de organizacin y codificacin del conocimiento especialmente utilizados
en Internet, como las ontologas, adems de las taxonomas y anillos de sinnimos ya tratados
en la ltima edicin de la ANSI Z39.19.
Dentro de los esfuerzos de revisin y actualizacin de las normas de tesauros, se debe re-
saltar tambin la labor del grupo de trabajo de la International Federation of Library Associations
(IFLA), que se puso especficamente en marcha con el objeto de poner al da las recomendacio-
nes para tesauros multilinges (IFLA, 2006), y que trabaj en estrecha coordinacin con los otros
dos grupos estudiados en sus respectivos proyectos.
Finalmente, por iniciativa del British Standard Institution y bajo el liderazgo de la coordina-
dora de su grupo de trabajo de vocabularios, Stella Dextre Clarke, la norma britnica se ofreci a
la International Organization for Standardization como base para desarrollar un nuevo estndar
internacional, la futura ISO 25964, dedicada a los tesauros y su interoperabilidad con otros vo-
cabularios que actualizara las normas ISO 2788:1974, 1986 e ISO 5964:1985.
El grupo de trabajo se puso en marcha en 2008, en el que participaron representantes
de quince pases con ayuda de una secretara sostenida por la NISO. Una de las labores ms
importantes del grupo de trabajo ha sido simplificar y desarrollar la norma britnica en dos
nicas partes: la primera dedicada a los tesauros, Parte 1: Tesauros para la recuperacin de la
informacin (publicada en agosto de 2011), que trata tanto los tesauros monolinges como los
multilinges; y la segunda dedicada a la interoperabilidad con otros sistemas de organizacin
del conocimiento: Parte 2: Interoperabilidad con otros vocabularios (publicada en 2013), que
avanza notablemente en la definicin de los modelos de mapeo.

Figura 1. Genealoga de la norma ISO 25964.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
38

7. La primera parte de ISO 25964


Los avances ms importantes que se producen en la primera parte de la norma ISO 25964 se re-
fieren, sobre todo, a tres aspectos: el multilingismo y la multiculturalidad; la construccin, man-
tenimiento y difusin de los tesauros; y el aseguramiento de la interoperabilidad de los tesauros.
Un aspecto clave de la primera parte de la norma es que reunifica el tratamiento de los
tesauros monolinges y multilinges en un solo cdigo. En este sentido, supone la culminacin
del proceso iniciado en las dos normas anteriores, y la integracin definitiva de la experiencia
conseguida en los organismos internacionales por los expertos en organizacin del conocimien-
to a lo largo de varias dcadas. Por otra parte, el contexto no poda ser ms propicio: tanto la
creciente globalizacin como la naturaleza internacional de la ciencia, la tcnica y las humanida-
des, y el propio carcter multicultural de Internet exigan el pleno desarrollo del multilingismo
de forma natural.
Para facilitar la reconceptualizacin del tratamiento del multilingismo, la nueva norma
entroniza al concepto como unidad bsica de los tesauros. Frente al nfasis en el trmino que
se realiz durante los aos setenta y ochenta, cuando diversas tradiciones en la organizacin
temtica de la informacin situaban el nfasis terico en el control terminolgico o el control del
vocabulario, el cambio de siglo ha trado la recuperacin de los conceptos como ncleo del tra-
bajo de organizacin del conocimiento. Ciertamente, aunque la terminologa es una herramienta
fundamental, el centro de la organizacin del conocimiento son aquellos conceptos que son
objeto el inters de una comunidad para recuperar informacin. Y los conceptos van cambiando
en su expresin a lo largo del tiempo y, sobre todo, se expresan de formas diversas entre los
distintos idiomas, para lo que la terminologa resulta una herramienta limitada.
Adems, la nueva norma ha mejorado su tratamiento del multilingismo de una ma-
nera sustancial, lo que se aprecia en la ampliacin del inventario de etiquetas en diferentes
idiomas que ahora se incluyen en espaol, ingls, francs, alemn, dans, fins, noruego,
sueco, chino y ruso, en el incremento del nmero de ejemplos en diversas lenguas todava
fundamentalmente en las principales europeas, as como en las continuas referencias a los
factores culturales y lingsticos en numerosos apartados de la norma. El captulo nueve de-
dicado a la relacin de equivalencia interlingstica integra y simplifica la anterior norma de
construccin de tesauros multilinges. En l, partiendo de los cuatro grados de equivalencia
exacta, inexacta (cuasiequivalencia), parcial (genrico-especfica) y la no equivalencia, se
abordan los diferentes tipos de problemas cuasisinnimos, homgrafos y la ausencia de tr-
minos equivalentes en una o ms lenguas, actualizando sobre todo los ejemplos, adoptando
trminos ms actuales.
Otro gran avance de la nueva norma ha sido clarificar y desarrollar tambin la doctrina
sobre la construccin, mantenimiento y uso de los tesauros. En primer lugar, se ampla el trata-
miento de las facetas y se establecen claramente las fronteras entre la ordenacin jerrquica y
por facetas. Adems, los ejemplos de presentaciones se desarrollan de forma bilinge, en ingls
y espaol. En el captulo trece se abordan cuidadosamente las polticas previas, la formacin y
mantenimiento de los equipos de trabajo y los recursos necesarios, enfatizando el requisito de
un compromiso a largo plazo por parte de directivos y expertos. Tambin destaca la importancia
que se concede al respeto de los derechos intelectuales en el caso muy frecuente de la reutiliza-
cin de tesauros, y a la necesidad de depositar los tesauros en repositorios especializados como
la Subject Analysis Systems Collection de la Universidad de Toronto o el registro de terminolo-
gas de la Dublin Core Metadata Initiative para facilitar su aprovechamiento, reconocimiento y
preservacin.
Como la difusin y explotacin de los tesauros se realiza hoy en da tanto por agentes
humanos como informticos, la norma desarrolla especialmente estas cuestiones, que hacen que
los tesauros requieran hoy en da un cuidado administrativo mucho mayor y un control absoluto
de todos los procesos de actualizacin y distribucin, tanto del tesauro completo como de partes
del mismo, sean rboles, conceptos, trminos o relaciones.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
39

En el captulo catorce se especifican cuidadosamente los requisitos mnimos que debe


cumplir un software de gestin de tesauros, sin el cual no cabe hoy en da plantearse la creacin
y sobre todo el mantenimiento de un tesauro, especialmente si va a ser sostenido por una red
amplia de personas y centros cooperantes para su explotacin y mantenimiento en Internet, lo
cual es cada vez ms la realidad cotidiana.
Por ltimo, la ltima parte de ISO 25964-1 se dedica a la interoperabilidad de los tesau-
ros, uno de sus objetivos clave, como hemos visto. Precisamente, uno de los puntos fuertes que
poseen los tesauros como instrumento de recuperacin de la informacin y de organizacin del
conocimiento es su capacidad de integrar cdigos, lenguas, terminologas y sistemas diferentes.
La norma se vuelca en que los tesauros puedan seguir disfrutando de esta ventaja competitiva
en el nuevo entorno caracterizado por Internet y la creciente globalizacin.
En el captulo quince, se ofrece el modelo de datos, que constituye, sin duda, una de sus
aportaciones ms importantes. Por una parte, se modelizan formalmente en UML (Unified Mo-
delling Language) las clases, atributos y asociaciones de los tesauros, de manera que se puedan
instanciar sin ambigedad sistemas y aplicaciones a partir de l aunque no se especifican los
comportamientos y mtodos de clase. Adems, la descripcin formal del modelo facilita el in-
tercambio de datos entre sistemas de forma automatizada, asegurando la interoperabilidad.
En el captulo diecisis se aborda la integracin de los tesauros dentro de y con las apli-
caciones que desarrollan funciones de recuperacin de informacin. Se explicitan los requisitos
para navegar por el tesauro, cuando este est disponible para el usuario, y para que sea utiliza-
ble durante el proceso de recuperacin de los documentos.
El captulo diecisiete presenta los formatos de intercambio de tesauros: los formatos MARC
en particular, los de intercambio de autoridades, SKOS, Zthes desarrollado inicialmente para
Z39.50 y ampliado a SRU (Search/Retrieve via URL) y DD 8723-5 desarrollado para la norma
britnica. Como ninguno de ellos se consider adecuado para expresar todas las caractersticas
de un tesauro de acuerdo con el modelo expresado en el captulo quince, se desarroll un for-
mato XML ad hoc, que se describe en el Anexo B y est disponible en Internet en la direccin
http://www.niso.org/schemas/iso25964.
Finalmente, el captulo dieciocho aborda los protocolos de comunicacin entre sistemas,
otro de los aspectos fundamentales para asegurar la interoperabilidad. En particular, se revisan
tres protocolos desarrollados especficamente para tesauros el SWAD-E SKOS API, varios pro-
tocolos basados en SOAP y REST, y el desarrollado por la Alexandria Digital Library (ADL) as
como otros de propsito general en particular, OASIS, SPARQL y Z39.50.

8. La segunda parte de ISO 25964: interoperabilidad con otros vocabularios


La segunda parte de la norma ISO 25964 aborda la interoperabilidad de los tesauros no solo en
lo que se refiere a sentar sus bases durante el proceso de diseo, mantenimiento y difusin, sino
con respecto a su integracin en un entorno de sistemas abiertos con otros sistemas de organi-
zacin del conocimiento para facilitar bsquedas y servicios federados. Constituye un trabajo
de gran envergadura que se apoya en el xito conseguido en la normalizacin de los tipos de
mapeos (Dextre, 2011, 2012). Adems, la interoperabilidad se aborda en el contexto de la web
semntica y los datos abiertos, gracias al estrecho trabajo conjunto que realizaron los equipos de
desarrollo de la ISO 25964 y del estndar W3C SKOS, Simple Knowledge Organization Systems
on the Web.
Sin entrar en la descripcin de cada uno de los mapeos particulares, s que es importante
trazar la problemtica general del mapeo entre vocabularios. La norma acepta tres modelos estruc-
turales de mapeo: el de unidad estructural (en el que los conceptos y las estructuras relacionales
son equivalentes), el de enlace directo (en el que todos los vocabularios se enlazan entre s), y el
de hub (en el que los vocabularios se mapean en ambas direcciones con respecto a uno central).
Se contempla, adems, un mapeo selectivo, entre partes de los vocabularios. Como se puede ver

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
40

en la Figura 2, el mapeo transitivo est desaconsejado, pues requiere mucha carga computacional
para aprovecharlo y produce errores en cadena, multiplicando las fuentes de ruido y silencio.

Figura 2. Tipos de mapeo previstos en ISO 25964-2.

Con respecto a las relaciones, se prevn tres tipos de mapeo bsicos: de equivalencia, jerr-
quico y asociativo (Tabla 1). Opcionalmente, se pueden realizar tambin otros mapeos ms especfi-
cos. En el caso del mapeo de equivalencia, se prevn dos grandes tipos: la equivalencia simple, en-
tre pares de conceptos; y la equivalencia compuesta, en la que un concepto puede relacionarse con
ms de un concepto del otro vocabulario o viceversa. La equivalencia simple puede ser exacta, esto
es, entre conceptos exactamente iguales en alcance semntico; o inexacta, es decir, aproximada.

Tabla 1. Tipos de mapeo previstos en ISO 25964-2.


Tipos Subtipos Etiqueta en ingls Ejemplo
Equivalencia Simple Ordenadores EQ Computadores
exacta =EQ Aubergines =EQ Egg-plants
inexacta ~EQ Horticultura ~EQ Jardinera
compuesta Intersectiva + Ejecutivas EQ Mujeres + Ejecutivos
Acumulativa | Vas de agua interiores EQ Ros | Canales
Jerrquico Hiperonmica BM Calles BM Vas
Hiponmica NM Vas NM Calles
Asociativo RM e-Learning RM Educacin a distancia

A su vez, la equivalencia compuesta puede resolverse mediante una interseccin de con-


ceptos (intersectiva), o mediante la unin de los campos semnticos (acumulativa). Se presenta
un ejemplo en la Figura 3.

Figura 3. La equivalencia intersectiva frente a la acumulativa.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
41

El mapeo compuesto es fundamental para asegurar la interoperabilidad de los tesauros,


que estn diseados para la bsqueda postcoordinada, con los sistemas precoordinados, orienta-
dos a la bsqueda en listas jerrquicas o alfabticas, como las que resultan respectivamente de la
aplicacin de clasificaciones bibliogrficas o archivsticas, taxonomas o de listas de autoridades.
Por ejemplo:

59974271(084.12) fotografas de leones (UDC)


AutomobilesAir conditioningMaintenance and repair (LCSH)

Tras presentar las reglas generales del mapeo, ISO 25964 aborda la interoperabilidad con
varios de los sistemas de organizacin del conocimiento ms importantes, en particular, con las
clasificaciones bibliogrficas y archivsticas, taxonomas, sistemas de encabezamientos de mate-
ria, ontologas, terminologas, listas de control de autoridades y anillos de sinnimos. Para cada
tipo de vocabulario se proporcionan sus caractersticas fundamentales, sus componentes y rela-
ciones semnticas, y un anlisis de cmo realizar el mapeo en ambas direcciones. Es importante
sealar que ISO 25964 es un estndar sobre tesauros. Las descripciones de los dems sistemas de
organizacin del conocimiento son informativas, y no se pretenden estandarizar otros tipos de
sistemas de organizacin del conocimiento. Solo ofrece recomendaciones con carcter normati-
vo para la interoperabilidad entre estos y los tesauros. En la Tabla 2 se presentan los resultados
esperados del mapeo con algunos de los sistemas ms importantes (Dextre Clarke, 2011), que,
como se puede ver, ofrecen posibilidades muy diferentes.

Tabla 2. Resultados esperados del mapeo de los tesauros con otros sistemas de organizacin del conocimiento
Sistema objeto Resultados esperados
Tesauros El mapeo es relativamente sencillo
Clasificaciones bibliogrficas El mapeo conceptual resulta til para la recuperacin de informacin
Clasificaciones archivsticas La precoordinacin es muy frecuente
Taxonomas
Listas de encabezamientos de materia
Listas de autoridades de nombres El mapeo es normalmente fcil, pero los conceptos comunes son escasos
Relaciones instanciativas
Anillos de sinnimos El mapeo conceptual no suele ser til
Terminologas Suele ser ms til prever usos complementarios
Ontologas

9. La situacin en Espaa
Los tesauros llegaron a Espaa de forma muy temprana. Fueron presentados en un libro de
Lasso de la Vega de 1966, pionero de la amplia labor de difusin realizada posteriormente
por Emilia Currs (ref. Garca, 2006). Sin embargo, la adopcin formal de las normas fue rela-
tivamente tarda respecto de lo ocurrido en otros pases (Garca Marco, 2002). En concreto, la
aprobacin de las correspondientes adaptaciones por la Agencia Espaola de Normalizacin y
Certificacin (AENOR) de las recomendaciones aprobadas por la Sociedad Internacional para la
Normalizacin (ISO) se produjo con diez aos retraso en la dcada de los noventa. El borrador
de las Directrices para el establecimiento y desarrollo de tesauros monolinges UNE 50-106-90,
equivalente a la ISO 2788:1986, una correccin de la ISO 2788 de 1975, a su vez inspirada en las
recomendaciones de la UNESCO de 1970 se public en la Revista Espaola de Documentacin
Cientfica en los aos 1989 y 1990 (AENOR, 1989, 1990a). Finalmente, la norma fue efectiva-
mente aprobada ese mismo ao (AENOR, 1990b). Los borradores directrices para la creacin
y desarrollo de tesauros multilinges UNE 50-125, un trasunto de la ISO 5964, publicada en
1985 fueron publicados en la Revista Espaola de Documentacin Cientfica en 1996 y 1997

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
42

(AENOR, 1996, 1997a), y aprobadas y publicadas en julio de 1997 (AENOR, 1997b). Ambas pue-
den consultarse fcilmente en el recopilatorio de normas UNE sobre documentacin publicado
por la AENOR (1999).
Sin embargo, la Asociacin Espaola de Normalizacin y Certificacin (AENOR) se ha
sumado con rapidez a los esfuerzos internacionales para revisar y ampliar el alcance de las
normas sobre tesauros, y para facilitar su adaptacin al entorno espaol. En junio de 2006 se
constituy oficialmente el grupo de Vocabularios Controlados para la Recuperacin de Informa-
cin del Comit 50, siguiendo la estela de la iniciativa norteamericana ANSI/NISO Z39.19-2005,
y, especialmente, de la ms completa propuesta por el British Standard Institution. El grupo ha
participado en la elaboracin de las normas ISO 25964, ha culminado la traduccin y adaptacin
al espaol de la primera parte de la norma, que se public en noviembre de 2014, y se encuentra
trabajando en la versin espaola de la segunda parte de la norma.

10. Conclusiones
A lo largo del presente captulo se ha analizado cmo el proceso de digitalizacin y puesta en
red de una enorme cantidad de recursos de informacin que ha supuesto Internet constituye a
la vez un gran reto y una oportunidad extraordinaria para los lenguajes documentales en general
y para los tesauros en particular.
Los usuarios reclaman y premian el acceso integrado a los recursos de informacin, espe-
cialmente si se resuelven los molestos y frecuentes resultados de recuperacin indiscriminados,
aportando mayor precisin y un grado de exhaustividad ajustado a las diferentes necesidades;
y si se les ayuda a superar las barreras idiomticas, culturales y disciplinares que tantas veces
limitan su acceso a la informacin.
En este sentido resulta necesario trabajar tanto desde la perspectiva de los grandes bus-
cadores de Internet, que funcionan como los portales efectivos para la mayora de los usuarios,
como desde el esfuerzo de integrar y hacer interoperables la multitud de bases de datos y ca-
tlogos de alta calidad que quedan ocultos, fuera del alcance de una gran parte de su pblico
objetivo. La interoperabilidad de los sistemas de organizacin del conocimiento en Internet
podra ser tiles a los grandes portales, como Google, para acceder con efectividad a fuentes de
informacin indizadas con vocabulario controlado, para asegurar la interoperabilidad con bases
de datos especializadas y para filtrar sus propios resultados. Recprocamente, las bases de datos
especializadas podran tener acceso a travs de portales interoperables, favoreciendo el trnsito
hacia los sistemas ms integrados y amigables que los usuarios reclaman.
No obstante, es necesario mantener una visin clara sobre la dificultad de la tarea. En
muchos casos, como se ha visto, la interoperabilidad solo se puede conseguir de forma limitada.
Adems, ISO 25964 no es propiamente un estndar en el sentido ms estricto de la palabra, sino
que ms bien ofrece una herramienta ms. Como afirma Gilchrist (2007): It should be stressed
here that it is only by historical accident that these publications appear as standards; and, as
such, they differ markedly from normal standards. And while they are guidelines rather than
standards, nor are they textbooks. In essence they are attempts to discover best practice through
a process of consensus building, made far harder by the existence of different communities of
information professionals working in this area. Queda por tanto, un esfuerzo notable por delan-
te para promover su aceptacin, conjuntar voluntades, establecer alianzas y generalizar su uso.
Sin embargo, esta crtica no debe oscurecer el valor de las nuevas normas sobre tesauros,
que constituyen una gran oportunidad para hacer visible la gran experiencia acumulada por la
comunidad LIS en la resolucin de problemas relacionados con el acceso y organizacin del
conocimiento. Las funciones del tesauro como sistema de organizacin del conocimiento van
ms all de la recuperacin, si bien es esta su funcin fundamental. Cuando se construyen con
la suficiente exhaustividad y sistematicidad, los tesauros permiten organizar o mapear el conoci-
miento utilizado en un campo de prctica o investigacin, de manera que la comunidad que lo

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
43

cultiva tenga una referencia clara y sistemtica de su dominio de trabajo y, a partir de ella, pueda
organizar mejor su trabajo, capturar y gestionar de forma organizada su conocimiento comparti-
do, gestionar la informacin independientemente de su forma, formato o canal, y organizar sus
relaciones entre s y con otros colectivos y personas. Por ello, su uso en mbitos aplicados, ms
all de su xito en el marco de la red global, seguir siendo un proceso clave de las estrategias
de gestin del conocimiento en las organizaciones.
La proteccin y difusin del patrimonio cultural es uno de esos mbitos privilegiados, y
el xito de los tesauros como herramienta de control del vocabulario para la recuperacin de la
informacin y de gestin compartida y organizacin del conocimiento no deja de manifestarse
en la actualidad en la multitud de proyectos que se estn acometiendo en muchos pases, de
los que dan testimonio otros captulos de este libro. Siguen la estela de algunos de los tesauros
ms seeros, que precisamente han surgido del mundo del patrimonio y que han acompaado
el desarrollo de esta herramienta documental desde casi sus albores.

Bibliografa
Aitchison, J., y Dextre Clarke, S. (2004): The thesaurus: a historical viewpoint, with a look to the fu-
ture, en Roe, S. K., y Thomas, A. R., The Thesaurus: Review, Renaissance, and Revision. Nueva
York: Haworth Press, pp. 5-21.
Aitchison, J., y UNESCO (1977): UNESCO thesaurus: a structured list of descriptors for indexing and
retrieving literature in the fields of education, science, social science, culture and communica-
tion. Pars: UNESCO.
American Institute of Chemical Engineers (1961): Chemical engineering thesaurus: a wordbook for
use with the concept coordination system of information storage and retrieval. Nueva York: The
Institute.
American National Standards Institute (1974): American National Standard guidelines for thesaurus
structure, construction and use. Nueva York: American National Standards Institute, 1974.
(1980): American national standard guidelines for thesaurus structure, construction and
use: approved June 30, 1980. Nueva York: ANSI.
Asociacin Espaola de Normalizacin y Certificacin (1985): Documentacin. Directrices para la
creacin y desarrollo de tesauros multilinge. Madrid: AENOR, D. L. 1997, 77 p. Normas UNE
50125. Norma equivalente a ISO 5964:1985.
(1989): Documentacin. Directrices para el establecimiento y desarrollo de tesauros mono-
linges: parte 1, Revista Espaola de Documentacin Cientfica, vol. 12, n. 4, pp. 463-483.
(1990): Directrices para el establecimiento y desarrollo de tesauros monolinges. Madrid:
AENOR, D. L. 1990, 47 p. UNE 50-106-90. Equivalente a ISO 2788-1986.
(1990): Documentacin. Directrices para el establecimiento y desarrollo de tesauros mono-
linges: parte 2, Revista Espaola de Documentacin Cientfica, vol. 13, n. 1, pp. 601-629.
(1995): Documentacin. Directrices para el establecimiento y desarrollo de tesauros mono-
linges. Madrid: AENOR, D. L. 1995. UNE 50106:1995 ERRATUM.
(1996): Documentacin. Directrices para la creacin y desarrollo de tesauros multilinges:
ISO 5964-1985, UNE 50-125, Revista Espaola de Documentacin Cientfica, vol. 19, n. 4,
pp. 439-467.
(1997): Documentacin. Directrices para la creacin y desarrollo de tesauros multilinges:
ISO 5964-1985, UNE 50-125: continuacin, Revista Espaola de Documentacin Cientfica,
1997, vol. 20, n. 1, pp. 63-82.
(1999): Documentacin: recopilacin de normas UNE, 3 ed. Madrid: AENOR, D. L. 1999, 580 p.
(2014): Informacin y documentacin Tesauros y su interoperabilidad con otros vocabu-
larios Parte 1: Tesauros para la recuperacin de informacin. Madrid: AENOR, D. L. 2014,
47 p. UNE 25964-1. Equivalente a ISO 25964-1.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
44

Berners-Lee, T.; Hendler, J., y Lassila, O. (2001): The semantic web, Scientific American, 284(5), pp.
76-88.
Bliss, H. E. (1933): The organization of knowledge in libraries and the subject-approach to books.
Nueva York: H. W. Wilson.
(1935): A system of bibliographic classification. Nueva York: Wilson.
Bliss, H. E., y Wheeler, W. M. (1929): The organization of knowledge and the system of the sciences.
Nueva York: Henry Holt and Company.
British Standards Institution (1978): Draft standard guidelines for the establishment and develop-
ment of monolingual thesauri. Londres: British Standards Institution.
(1985): British standard guide to establishment and development of multilingual thesauri.
Londres: British Standards Institution.
(1987): British standard guide to establishment and development of monolingual thesauri.
Londres: British Standards Institution.
(2005-2008): BS 8723, Structured vocabularies for information retrieval. Londres: British
Standards Institute.
Currs, E. (1998): Tesauros: Manual de construccin y uso. Madrid: Kaher II.
(2005): Ontologas, taxonoma y tesauros: manual de construccin y uso, 3 ed. Gijn: Trea.
Currs, E.; Aitchison, J., y Gilchrist, A. (1991): Thesaurus: lenguajes terminolgicos. Madrid: Paraninfo.
Dahlberg, I. (1991): Knowledge organization, thesauri and terminology, International Classifica-
tion, 18(3), p. 133.
(1992): Knowledge organization and terminology - philosophical and linguistic bases, In-
ternational Classification, 19(2), pp. 65-71.
(1995): Current trends in knowledge organization, en Organizacin del conocimiento
en sistemas de informacin y documentacin: actas del I Encuentro de ISKO-Espaa, Ma-
drid, 4 y 5 de noviembre de 1993. Zaragoza: [ISKO-Espaa: Universidad de Zaragoza], 7-26.
http://www.iskoiberico.org/wp-content/uploads/2014/07/007-026_Dahlberg.pdf.
Daly, L. W. (1967): Contributions to a history of alphabetization in Antiquity and the Middle Ages.
Bruselas: Latomus.
Defense Documentation Center (U.S.) (1960): Thesaurus of ASTIA descriptors, 1 ed. Arlington, VA:
Armed Services Technical Information Agency.
Dextre Clarke, S. G. (2008): The last 50 years of knowledge organization: a journey through my
personal archives,JournalofInformationScience,34(4),pp.427-437.DOI:10.1177/0165551508089225.
(2011): In Pursuit of Interoperability: Can We Standardize Mapping Types?, en Concepts in
Context Cologne Conference on Interoperability and Semantics in Knowledge Organiza-
tion; 19-20 July 2010. Edicin de Boteram, F., Goedert, W., y Hubrich, J. Colonia, Alemania:
Ergon Verlag.
Dextre Clarke, S. G., y Zeng, M. L. (2012): From ISO 2788 to ISO 25964: the evolution of thesaurus
standards towards interoperability and data modeling (2012), Information standards quar-
terly, 24(1), pp. 20-26.
Engineers Joint Council; United States. Department Of Defense (1967): Thesaurus of engineering
and scientific terms; a list of engineering and related scientific terms and their relationships for
use as a vocabulary reference in indexing and retrieving technical information, 1. ed. Nueva
York: Engineers Joint Council; Department of Defense of the United States.
Engineers Joint Council; Engineering Vocabulary Panel; Task Group, y Dodds, R. (1967): Thesaurus
rules and conventions: approved November 9, 1966. Nueva York: [s.n.].
Foskett, A. C. (1982): The subject approach to information, 4. ed. Londres: Bingley.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
45

Garca Marco, F. J., y Esteban Navarro, M. A. (1993): On some Contributions of the Cognitive Sciences
and Epistemology to a Theory of Classification, Knowledge Organization, 20(3), pp. 126-132.
Gilchrist, A. (1991): The Standards Jungle, in Standards for the International Exchange of Biblio-
graphic Information: Papers Presented at a Course Held at the School of Library, Archive and
Information Studies, University College London, 3-18 August 1990. Edicin de Mcllwaine, L. C.
Londres: Library Association.
(2003): Thesauri, taxonomies and ontologies - an etymological note, Journal of Documen-
tation, 59(1), pp. 7-18. DOI: 10.1108/00220410310457984.
(2007): Revisin de las Normas Britnicas BS5723 y BS6723 para el diseo y uso de tesau-
ros: un breve informe de progreso, Scire, vol. 13, n. 1.
International Federation Of Library Associations, Classification And Indexing Section, Working
Group On Guidelines For Multilingual Thesauri (2005): Guidelines for Multilingual Thesauri.
IFLA, abril de 2005. URL: http://www.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf.
ISO (1974): ISO 2788:1974. Documentation, guidelines for the establishment and development of
monolingual thesauri = documentation, principes directeurs pour letablissement et le develop-
pement de thesaurus monolingues, 2. ed. Ginebra: ISO, 1974.
(1985): ISO 5964:1985. Documentation, Guidelines for the establishment and development of
multilingual thesauri. Ginebra: ISO, 1985.
(1986): ISO 2788:1986. Documentation, guidelines for the establishment and development of
monolingual thesauri = documentation, principes directeurs pour letablissement et le deve-
loppement de thesaurus monolingues. 2. ed. Ginebra: ISO, 1986.
(2011): ISO 25964-1:2011. Information and documentation. Thesauri and interoperability
with other vocabularies. Part 1: Thesauri for information retrieval. Ginebra: International
Society for Standardization.
(2013): ISO 25964-2:2013. Information and documentation. Thesauri and interoperability
with other vocabularies. Part 2: Interoperability with other vocabularies. Ginebra: Interna-
tional Society for Standardization.
Krooks, D. A., y Lancaster, F. W. (1993): The Evolution of Guidelines for Thesaurus Construction,
Libri, 43(4), pp. 326-342. DOI: 10.1515/libr.1993.43.4.326.
Lancaster, F. W. (1986): Vocabulary control for information retrieval, 2. ed. Arlington, Virginia: In-
formation Resources Press.
Lasso De La Vega, J. (1966): Organizacin de la documentacin por palabras y descriptores especfi-
cos de materias: los thesaurus. Racionalizacin 19(6), pp. 433-45.
Lloyd, B. B., y Rosch, E. (1978): Cognition and categorization. Hillsdale, N. J. Nueva York; Londres:
Lawrence Erlbaum; Halsted Press division of Wiley distributor.
Luhn, H. P. (1957): A Statistical Approach to Mechanized Encoding and Searching of Literary Infor-
mation, IBM Journal of Research and Development, 1(4), pp. 309-316.
Miller, G. A. (1956): The magical number seven, plus or minus two: Some limits on our capacity for
processing information, Psychological Review, 63, pp. 81-97.
Mooers, C. N. (1950): Zatocoding for punched cards, Zator Technical Bulletin, 30.
(1951): Zatocoding applied to the mechanical organization of knowledge, American Do-
cumentation, 2(1), pp. 20-32.
(2003): Descriptors, en Encyclopedia of Library and Information Science. Marcel Dekker,
pp. 813-821. DOI: 10.1081/E-ELIS 120008981.
National Information Standards Organization (Estados Unidos); American National Standards Ins-
titute (1994): Guidelines for the construction, format, and management of monolingual the-
sauri: an American national standard. Bethesda, Md.: NISO Press.

El lenguaje del patrimonio | Pgs. 29-46


Normas y estndares para la elaboracin de tesauros de patrimonio cultural
46

(1995): Developing the Next Generation of Standards for Controlled Vocabularies and The-
sauri. Bethesda, Md.: National Information Standards Organization. URL: <http://www.niso.
org/committees/MT-info.html>.
(2005): Guidelines for the construction, format, and management of monolingual controlled
vocabularies: an American national standard. Bethesda, Md.: National Information Stan-
dards Organization, 2006. ANSI/NISO Z39.19-2005. Approved July 25, 2005 by the American
National Standards Institute.
Organisation For Economic Co-Operation And Development (1972): Macrothesaurus; a basic list of
economic and social development terms, 1. ed. en ingls. Pars.
Pinto Molina, M., Garca Marco, F. J., y Agustn Lacruz, M. C. (2002): Indizacin y resumen de docu-
mentos digitales y multimedia: tcnicas y procedimientos. Gijn: Trea.
Ranganathan, S. R. (1933): Colon classification. Madrs: Madras Library Association; Londres: E.
Goldston.
(1937): Prolegomena to library classification. Madras: Madras Library Association; London:
E. Goldston.
Rogets International Thesaurus (1946): Nueva York, Thomas Y. Crowell Co.
Taube, Mortimer & Associates (1953): Studies in coordinate indexing. Washington: Documentation Inc.
Unesco, Unisist (1973): Principes directeiurs pour ltablissement et le dveloppement de thsaurus
monolingues. Pars: UNESCO, 34 p. (SC/WS/555).
(1980): Principes directeiurs pour ltablissement et le dveloppement de thsaurus multilin-
gues. Pars: UNESCO, 88 p. (PGI/80/WS/12).

El lenguaje del patrimonio | Pgs. 29-46


47

Los tesauros en la web semntica: SKOS


y la norma ISO 25964
Juan Antonio Pastor Snchez
Universidad de Murcia

1. Introduccin
En 1992 Tim Berners-Lee present la Web, que con el paso del tiempo se convertira en la tec-
nologa que cambi la percepcin y el desarrollo de los servicios de informacin digital. Tanto
es as que hoy da son infinidad de aplicaciones y sistemas los que utilizan la plataforma Web
como un entorno de desarrollo e intercambio de datos (Guinard; Trifa y Wilde, 2010). Redes so-
ciales, repositorios de objetos digitales, servicios financieros, blogs o comercio electrnico son,
entre otros, algunos buenos ejemplos de la heterogeneidad de las aplicaciones de la web como
cliente-servidor universal.
Sin embargo, actualmente estamos viviendo una revolucin de la web que, al contrario de
la Web 2.0, puede que no resulte visible para el gran pblico. El paradigma del desarrollo de la
web ya no es el documento (en sus diferentes formatos), sino la publicacin de datos estructura-
dos (Heath y Bizer, 2010). Para ello se han propuesto y desarrollado mltiples estndares y tec-
nologas para publicar datos estructurados en la web bajo la denominacin de web semntica
(Berners-Lee; Hendler y Lassila, 2001). Denominaciones como Linked Open Data, Hyperdata o
Data on the Web se refieren a distintos sabores de una misma realidad: la publicacin de gran-
des volmenes de datos altamente estructurados en la web. En este sentido, la web semntica
ha dejado de ser un proyecto de futuro para ser un hecho del presente. El principio subyacente
sigue permaneciendo: el intercambio de informacin. Pero con una sutil diferencia: en la web
original las personas generan y consumen los contenidos, mientras que en la web semntica son
las mquinas1 en primera instancia a quienes van dirigidos los datos.

En la jerga de los especialistas de la web semntica el trmino mquina se utiliza para referirse a un software o aplicacin
1

informtica. Esta distincin es importante, puesto que mquinas y personas comparten un mismo sistema (la web) y proto-
colo de Internet (http) para el intercambio de informacin.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
48

Si se desea que las mquinas sean capaces de procesar los datos, es preciso que estos se
encuentren en un formato y una estructura adecuados para ello. El concepto subyacente es el
de interoperabilidad: la capacidad de un sistema de informacin para compartir datos de modo
que sea posible el intercambio de informacin con otros sistemas directamente, ya sea existen-
tes o futuros, y sin restriccin de acceso o implementacin (Sheth, 1999). La interoperabilidad
supera los procesos de importacin y exportacin que conllevan la transformacin de los datos
previo mapeado de su estructura. La interoperabilidad tambin es una salvaguarda para que los
sistemas de informacin que se desarrollen en un futuro no encuentren problemas de compa-
tibilidad con los datos gestionados por sistemas que con el paso del tiempo quedan obsoletos.
Tambin es el primer paso para la reutilizacin de los datos donde se tienen en cuenta, entre
otros, aspectos tales como el acceso, la calidad, la utilidad o las licencias de uso. Interoperabili-
dad y reutilizacin conforman un binomio en el que los datos se erigen en un recurso para crear
nuevos productos, servicios y modelos de negocio, en el que los conjuntos datos estructurados
son la materia prima (Ramos Simn et alii, 2012).
Los datos estructurados precisan de modelos conceptuales que permitan representar abs-
tracciones de ideas u objetos del mundo. Los modelos descriptivos cumplen esta funcin y per-
miten caracterizar los objetos de informacin mediante atributos y relaciones lgicas (Solodovnik,
2011). En el mbito de la web semntica lo anterior se sustancia en la aplicacin vocabularios
de esquemas de metadatos y ontologas. Mientras que los metadatos describen recursos de in-
formacin mediante pares de atributo-valor, las ontologas clasifican dichos recursos en clases y
especifican de un modo muy detallado cmo se relacionan entre s.
En la web semntica se hace un uso intensivo de las ontologas y algunas de ellas, como
SKOS, ha resultado ser esenciales en su evolucin. Ello es debido a que en la web semntica es
imprescindible disponer de vocabularios controlados que permitan describir el contenido de los
conjuntos de datos. De este modo es posible la desambigacin terminolgica y la organizacin
semntica de conceptos, recursos y datos (Montalvo-Montalvo, 2011). SKOS permite representar,
en forma de conjuntos de datos RDF, lenguajes documentales del tipo tesauros, clasificacio-
nes, encabezamientos de materia, glosarios, etc. (Pastor-Snchez; Martnez-Mndez y Rodrguez-
Muoz, 2009 y 2012). As pues, con SKOS es posible representar sistemas de organizacin del
conocimiento de forma interoperable para su posterior reutilizacin.

2. Arquitectura y tecnologas de la web semntica


Todo entorno tecnolgico precisa de una arquitectura que describa y presente la estructura or-
ganizativa que define las interrelaciones y roles de los diferentes elementos que lo conforman.
La web semntica no es ajena a lo anterior y la Figura 1 ofrece una panormica de dicha arqui-
tectura.
La web semntica no es una tecnologa nueva. Sigue basndose en la plataforma web con-
vencional y utiliza, por tanto, el protocolo HTTP para transmitir peticiones y datos entre clientes
y servidores. UNICODE es el estndar utilizado para la definir los smbolos de cualquier alfabeto
o de otro tipo (matemticos, fonticos, etc.) y codificarlos mediante alguna de las variantes del
formato UTF2. Mediante referencias URI3 se dispone de un mecanismo para referenciar de forma
inequvoca recursos de informacin y elementos de vocabularios descriptivos. La variante IRI
(Internationalized Resource Identifier) permite el uso de caracteres UNICODE para representar
dicho identificador. Se dice que una URI es derreferenciable cuando puede utilizarse para acce-

UTF: UNICODE Transformation Format. Formato de codificacin de caracteres UNICODE con tres posibles variantes de 8,
2

16 y 32 bits (segn los bits utilizados para representar un carcter) denominados UTF-8, UTF-16 y UTF 32, respectivamente.
URI (Uniform Seource Identifier): son cadenas de caracteres estandarizadas [RFC3986] que conforman espacios de identifi-
3

cadores, que permiten referenciar cualquier tipo de recurso abstracto o localizable en Internet.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
49

der a un recurso mediante una conexin HTTP como si se trata de una URL4 normal o corriente.
En otros casos el recurso no est accesible en lnea, por lo que se identifica mediante una URN5.

Figura 1. La arquitectura de la web semntica. Traducido y adaptado de:


<http://bnode.org/blog/2009/07/08/the-semantic-web-not-a-piece-of-cake>.

La familia de tecnologas XML (eXtensible Markup Language) aporta una sintaxis que
permite el intercambio y procesamiento de datos. Dentro de este conjunto de tecnologas los
espacios de nombres XML (XML namespaces)6 permiten utilizar varios vocabularios en un mis-
mo documento XML resolviendo posibles conflictos entre nombres. De este modo, se puede
reutilizar de forma conjunta varios esquemas de metadatos, configurando diferentes soluciones
ajustadas a dominios de datos o aplicaciones especficas.
Tambin se precisa un modelo de datos que identifique recursos y describa sus propiedades
y relaciones con otros recursos. Mediante RDF dicha descripcin se realiza en forma de tripletas
del tipo recurso-propiedad-valor o recurso-relacin-recurso. Cada recurso se identifica de manera
unvoca mediante una URI y se describe asignando valores a determinados atributos o establecien-
do relaciones entre dos recursos (W3C, 2014). En el primer caso los recursos se vinculan con los
valores mediante propiedades de datos. En el segundo caso los recursos se relacionan entre s a
travs de propiedades de objeto. Cada propiedad est asociada con una URI, de manera que, al

URL (Uniform Resource Locator, Localizador Uniforme de Recurso) [RFC2718]. URL es un subconjunto de URI que permiten
4

localizar y acceder a un recurso cuya aplicacin est muy extendida debido a su uso en la web convencional.
5URN (Uniform Resource Name) subconjunto de URI [RFC1737] que permite identificar recursos pero sin que impliquen su

disponibilidad en red, como, por ejemplo, urn:isbn:0-123-45678-9.


6Ms informacin en: <http://www.w3.org/TR/xml-names/>.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
50

igual que los recursos, se identifican de manera unvoca. Por lo tanto, las tripletas de descripciones
conforman grafos, en donde los recursos se representan como nodos, los valores como literales y
las propiedades mediante arcos. Las referencias URI pueden acortarse con prefijos (ver Figura 2).

Figura 2. Ejemplo de grafo RDF. Fuente: elaboracin propia.

Los grafos de sentencias RDF tienen un alto grado de expresividad para las personas, pero
lo cierto es que, para que se puedan intercambiar y procesar por mquinas7, es preciso utilizar
una representacin textual. Este proceso de codificacin (serializacin) precisa aplicar un forma-
to para expresar las sentencias RDF segn una sintaxis normalizada. Existen diversas alternativas
para la serializacin de RDF, tales como RDF/XML8, Turtle9, JSON-LD10 o RDFa11, entre otros.

Figura 3. Formatos para la serializacin de RDF. Fuente: elaboracin propia.

7 En este contexto por mquina se entienden programas informticos capaces de tomar ciertas decisiones de forma aut-
noma durante el procesamiento de datos en funcin del contenido de los mismos.
8  <http://www.w3.org/TR/rdf-syntax-grammar/>.
9  <http://www.w3.org/TR/turtle/>.
10 <http://www.w3.org/TR/json-ld/>.

11 <https://www.w3.org/TR/rdfa-primer/>.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
51

Es posible establecer jerarquas de recursos mediante la definicin de clases y crear nue-


vas propiedades a partir de otras utilizando RDF Schema (RDFS). Los desarrollos que utilizan
RDF y RDFS permiten el desarrollo de lo que se conoce como ontologas ligeras. Para elaborar
ontologas con mayor contenido semntico y nivel de formalizacin, se precisa adems el uso
de OWL (Web Ontology Language). Una de las principales aplicaciones de las ontologas es la
ejecucin de procesos de inferencia para descubrir informacin mediante la definicin de re-
glas. RIF (W3C, 2013) es un lenguaje que permite expresar este tipo de reglas para que puedan
intercambiarse.
Con estas premisas, la seleccin y obtencin de informacin acerca de descripciones indi-
viduales de recursos requiere un lenguaje de bsqueda especfico. Algo parecido al papel que
desempea SQL cuando se representa la informacin siguiendo el modelo relacional de bases
de datos. En la web semntica esta tarea se basa en la bsqueda y recuperacin de patrones de
tripletas RDF a travs de SPARQL (W3C, 2013b). SPARQL define tanto el lenguaje de recupera-
cin como el formato en el que se obtienen los datos recuperados. Una persona o una mquina
puede utilizar unos servicios web especficos conocidos como SPARQL Endpoint para enviar una
consulta y recuperar la informacin solicitada.
Una caracterstica de las aplicaciones realizadas bajo el paraguas de la web semntica es
la transparencia que para el usuario supone la combinacin y uso de todas estas tecnologas.
Tal vez el xito de la web semntica es que el usuario es ajeno a su existencia, percibiendo
nicamente la existencia de nuevos y mejores servicios de informacin. Adems, estas tecnolo-
gas son escalables en funcin de las necesidades de un determinado proyecto, siendo posible
utilizar RDF y RDFS sin que sea obligatorio desarrollar o aplicar una ontologa OWL o implentar
un SPARQL Endpoint.

3. SKOS
SKOS es una ontologa OWL-Full (W3C, 2009) para representar sistemas de organizacin del
conocimiento mediante RDF. En SKOS los recursos RDF pueden ser de tres clases:
Conceptos (skos:Concept). Son los elementos fundamentales de SKOS. Se trata de enti-
dades abstractas, existentes en nuestra mente con independencia de los trminos (unida-
des lxicas) usados para etiquetarlos. Pueden contemplarse como una idea, una nocin,
una referencia a un objeto u hecho real, etc.
Esquemas de conceptos (skos:ConceptScheme). Es una agregacin de conceptos.
Aunque pueden definirse como entidades independientes, suelen reunirse en vocabula-
rios como tesauros, clasificaciones, etc. Los esquemas de conceptos permiten identificar el
vocabulario en su totalidad o en parte.
Colecciones (skos:Collection / skos:OrderedCollection). SKOS permite definir grupos
o colecciones de conceptos cuando un conjunto de estos comparten uno o varios as-
pectos en comn. En estos casos es conveniente agruparlos bajo una etiqueta propia. En
ciertas colecciones los conceptos pueden ordenarse segn un criterio determinado.

Con respecto a los conceptos que tienen asignadas etiquetas en uno o varios idiomas,
existen diferentes tipos de propiedades para el etiquetado:
Etiquetas preferentes (skos:prefLabel). Un recurso nicamente puede tener una eti-
queta preferente en cada idioma. Dos conceptos tampoco deberan compartir la misma
etiqueta en un mismo idioma. En la terminologa de tesauros podran identificarse con los
descriptores.
Etiquetas alternativas (skos:altLabel). Permiten expandir la asignacin de una sola
etiqueta preferente en un idioma para un concepto. Esto resulta de gran utilidad para re-
presentar sinnimos, cuasisinnimos, abreviaturas, acrnimos, etc. En la terminologa de
tesauros podran identificarse con los no descriptores.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
52

Etiquetas ocultas (skos:hiddenLabel). Es una cadena de caracteres accesible para las


aplicaciones que procesan un vocabulario SKOS, pero no es visible directamente para los
usuarios. Las etiquetas ocultas permiten incluir variantes u errores ortogrficos de otras
etiquetas lxicas. De esta forma, si el usuario comete un error al teclear una consulta, el
sistema podra encontrar conceptos relevantes si hay alguna correspondencia entre el tex-
to introducido y una etiqueta oculta.

Tambin existen una serie de propiedades que permiten vincular conceptos a travs de la
definicin de relaciones semnticas:
Relaciones jerrquicas (skos:broader / skos:narrower). Permiten establecer cundo
el significado de un concepto es ms genrico o especfico que otro. Son propiedades
inversas entre s. Es decir, cuando un concepto X es ms genrico que el concepto Y, en-
tonces el concepto Y es ms especfico que el concepto X.
Relaciones jerrquicas transitivas (skos:broaderTransitive / skos:narrowerTransitive).
Las propiedades skos:broader y skos:narrower no estn definidas explcitamente como
transitivas. Esto significa que su semntica no soporta inferencias de manera formal.
Para aplicaciones que precisen este tipo de semntica, SKOS dispone de las propiedades
skos:broaderTransitive y skos:narrowerTransitive.
Relaciones asociativas (skos:related). Representa no jerrquicas como las que se de-
finen entre un tipo de evento y las entidades que participan en l. Esta propiedad es si-
mtrica, de forma que si un concepto X est relacionado con un concepto Y, entonces el
concepto Y est relacionado con X. SKOS no define esta propiedad como transitiva.

@Prefix ex: <http://www.example.org/>.


@Prefix skos: <http://www.w3.org/2004/02/skos/core#>.
@Prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>.

ex:America rdfs:type skos:Concept;


skos:narrower ex:NAmerica;
skos:narrower ex:SAmerica.

ex:SAmerica rdfs:type skos:Concept;


skos:broader ex:America;
skos:narrower ex:Brazil.

ex:Brasil rdfs:type skos:Concept;


skos:prefLabel Brazil@en;
skos:prefLabel Brasil@es;
skos:altLabel Federative Republic of Brazil@en;
skos:altLabel Repblica Federativa do Brasil@es;
skos:broader ex:SAmerica.

Figura 4. Ejemplo de grafo SKOS con su correspondiente serializacin. Fuente: elaboracin propia.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
53

Los conceptos pueden vincularse a uno o ms esquemas de conceptos utilizando skos:inScheme.


Para indicar que un concepto es cabecera dentro de un esquema de conceptos, se utiliza la propie-
dad skos:topConceptOf, mientras que para definir el sentido inverso de la relacin, es decir, aque-
llos conceptos cabecera del esquema, se usa skos:hasTopConcept. Para establecer los conceptos que
pertenecen a una coleccin o a una coleccin ordenada, se utilizan las propiedades skos:member y
skos:memberList, respectivamente.
SKOS dispone de diversas propiedades de documentacin:
Notas de alcance (skos:scopeNote). Proporcionan informacin sobre la aplicacin y lmites del
concepto generalmente durante el proceso de indizacin.
Definiciones (skos:definition). Permite ofrecer una explicacin completa del significado de un
concepto.
Ejemplos (skos:example). Mediante esta propiedad es posible representar ejemplos concretos a
los que se refiere el concepto.
Notas editoriales (skos:editorialNote). Ofrece informacin sobre procesos administrativos y
trabajo de edicin y validacin del vocabulario.
Notas histricas (skos:historyNote). Proporciona a los usuarios del vocabulario cambios sustan-
ciales en el significado o la forma del concepto.
Notas sobre cambios (skos:changeNote). Permite describir cambios sobre un concepto con
fines de administracin y mantenimiento.

En algunos casos es necesario definir relaciones entre etiquetas. Sin embargo, las propiedades de
etiquetado lxico de SKOS (skos:prefLabel, skos:altLabel, skos:hiddenLabel) no pueden ser sujeto de nin
guna sentencia RDF, puesto que son cadenas literales y no recursos RDF. Por tanto, no es posible definir
relaciones entre ellos. SKOS eXtension for Labels (SKOS-XL) permite identificar, describir y definir vncu-
los entre entidades lxicas. Para ello hay que utilizar la clase skosxl:Label, que permite definir etiquetas
como si fueran recursos RDF. A los recursos de dicha clase se asigna una etiqueta literal mediante la
propiedad skosxl:literalForm. Para vincular conceptos SKOS con recursos de la clase skosxl:Label, se
utilizan las propiedades skosxl:prefLabel, skosxl:altLabel y skosxl:hiddenLabel. Con esta propie-
dad pueden definirse relaciones entre recursos skosxl:Label. De esta forma es posible definir relaciones
personalizadas, como subpropiedades de skosxl:labelRelation, entre recursos de la clase skosxl:Label.

@Prefix rdf: <http://id.sgcb.mcu.es/Autoridades/>.


@Prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>.
@Prefix skos: <http://www.w3.org/2004/02/skos/core#>.
@Prefix skosxl: <http://www.w3.org/2008/05/skos-xl#>.
@Prefix ex: <http://www.example.org/>.

ex:C04221 rdf:type skos:Concept;


skosxl:prefLabel ex:lab04221_1;
skosxl:altLabel ex:lab04221_2.

ex:lab04221_1 rdf:type skosxl:Label;


skosxl:literalForm USA@en.
ex:lab04221_2 rdf:type skosxl:Label;
skosxl:literalForm United States of America@en.

ex:acronym rdfs:subPropertyOf skosxl:labelRelation.


ex:lab04221_1 ex:acronym ex:lab04221_2.

Figura 5. Ejemplo de SKOS-XL con su correspondiente serializacin. Fuente: elaboracin propia.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
54

SKOS tambin dispone de un conjunto de propiedades que permiten configurar redes


entre diferentes KOS mediante relaciones de mapeado que se establecen entre conceptos de
diferentes esquemas:
Equivalencia jerrquica (skos:broadMatch / skos:narrowMatch): se utiliza cuando
se desea indicar que un concepto de un esquema tiene un significado ms genrico o
especfico que un concepto de otro esquema.
Equivalencia asociativa (skos:relatedMatch): cuando dos conceptos de diferentes es-
quemas estn relacionados semnticamente.
Equivalencia exacta (skos:exactMatch): usado cuando dos conceptos tienen un signifi-
cado prcticamente idntico siendo intercambiables en una gran variedad de aplicaciones
de recuperacin de informacin. Es una propiedad transitiva.
Equivalencia cercana o prxima (skos:closeMatch): usado cuando dos conceptos tienen sig-
nificado similar siendo intercambiables en ciertas aplicaciones de recuperacin de informacin.

Adicionalmente, SKOS define una serie de condiciones de consistencia y reglas espe-


cialmente referidas a la transitividad de las relaciones semnticas que delimitan el mbito de
aplicacin de los vocabularios en procesos lgicos de inferencia.

4. La norma ISO 25964


La nueva norma ISO 25964 sobre tesauros actualiza y reemplaza a las anteriores normas ISO
5964:1985 e ISO 2788:1986. Se basa en los trabajos de la norma britnica, contemplando y armo-
nizando las propuestas que se realizaron en la misma (Garca-Marco, 2014). La norma ISO 25964
se estructura en dos partes:
Parte 1: Tesauros para la recuperacin de la informacin (ISO 25964-1:2011).
Parte 2: Interoperabilidad con otros vocabularios (ISO 25964-2:2013).

Como puede verse en la Figura 6, la primera parte de ISO 25964 engloba las normas origi-
nales ISO 2788 y 5964. De igual forma, se corresponde con las dos primeras partes de la norma
britnica BS 8723. La segunda parte se centra en la interoperabilidad entre vocabularios, y en tal
sentido adopta el enfoque de las partes tercera, cuarta y quinta de la BS 8723.

Figura 6. Correspondencia de ISO 25964 en el contexto normativo previo. Traducido


y adaptado de: <https://www.reseau-canope.fr/savoirscdi/uploads/pics/image4_01.png>

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
55

El alcance de la norma ISO 25964 es realmente amplio, puesto que define detalladamente
la estructura de los tesauros, sus elementos, los diferentes tipos de equivalencias intralingsticas e
interlingsticas o las relaciones semnticas. Tambin se centra en los aspectos de gestin, como la
creacin y mantenimiento de los tesauros, su aplicacin, visualizacin, el uso de formatos y el ma-
peado e interoperabilidad con otros vocabularios. Uno de los aspectos ms relevantes es que tam-
bin se define un modelo de datos basado en UML y un esquema XML para representar tesauros.
Segn el modelo de datos de ISO 25964 (Figura 7), un tesauro (Thesaurus) est formado
por conceptos (ThesaurusConcept) que pueden agruparse en grupos de conceptos (Concept-
Group) o listas de conceptos hermanos (ThesaurusArray). Tanto los grupos de conceptos como
los arrays de trminos pueden etiquetarse y anidarse. Asimismo, es posible definir diferentes
versiones de un tesauro (VersionHistory). Los conceptos pueden relacionarse entre s mediante
relaciones semnticas jerrquicas (HierarchicalRelationship), asociativas (AssociativeRelation-
ship) o con sus correspondientes conceptos cabecera de nivel superior (TopLevelRelationship).
Las relaciones jerrquicas y asociativas pueden especializarse a travs del atributo role, que
permite definir distintos subtipos de relaciones semnticas de estos tipos. Pueden definirse atri-
butos personalizados para los conceptos (CustomConceptAttribute) y establecer de esta forma
caractersticas adicionales para los mismos.

Figura 7. Modelo de datos de ISO 25964 para la representacin de tesauros.


Fuente: <http://www.niso.org/schemas/iso25964/Model_2011-06-02.jpg>

Los trminos preferentes y no-preferentes pueden relacionarse directamente con un con-


cepto. Tambin es posible definir equivalencias entre los propios trminos. Se pueden definir

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
56

equivalencias compuestas para los casos en los que un trmino no-preferente tenga ms de un
trmino preferente. Las tareas de definicin y mantenimiento del nivel lxico de un tesauro con
la nueva norma ISO 25964 pueden resultar relativamente complejas, debido a las relaciones
de equivalencia entre trminos (USE/USE+ y UF/UF+), que complementan las que se estable-
cen entre trminos y conceptos (isNonPreferredLabelFor, isPreferredLabelFor). Dichas relaciones
permiten la equivalencia de un trmino compuesto no-preferente (SplitNonPreferredTerm) con
varios trminos preferentes (PreferredTerm) mediante una relacin de equivalencia compuesta
(CompoundEquivalence).
La segunda parte de la norma ISO 25964 aborda la interoperabilidad de los tesauros con
otros vocabularios, definiendo una amplia tipologa de equivalencias entre conceptos de dife-
rentes vocabularios:
Exactas: conceptos que representan exactamente la misma idea. Por ejemplo: enfermedad
de las vacas locas, encefalopata espongiforme bovina.
Inexactas: conceptos que pueden ser equivalentes en determinados contextos o tener di-
ferencias de connotacin. Por ejemplo: sillas y asientos.
Parciales: conceptos con un significado muy cercano, aunque uno de ellos es ligeramente
ms genrico o especfico que otro. Por ejemplo: Aeronave y Aeroplanos.
Jerrquicas: un concepto es claramente ms genrico o especfico que otro. Por ejemplo:
Pases Bajos es ms genrico que Holanda.
Asociativas: los conceptos no son equivalentes pero estn relacionados entre s. Por ejem-
plo: Fotografas y Fotgrafos.

Las equivalencias pueden definirse entre dos conceptos de tesauros diferentes (equiva-
lencia simple) o entre un concepto de un tesauro y varios de otro (compuesta). En este ltimo
caso la equivalencia puede establecerse a partir de la interseccin o la unin del significado
de los conceptos del tesauro de destino. Las relaciones de equivalencia no se reflejan de forma
explcita en el modelo de datos de la norma, aunque pueden derivarse a partir de relaciones
jerrquicas y asociativas.

5. Representacin de tesauros mediante ISO-THES


Tal y como se ha expuesto anteriormente, existen muchas similitudes entre la nueva norma ISO
25964 y SKOS:
1. Ofrecen modelos de representacin aplicables para el desarrollo de aplicaciones inform-
ticas de recuperacin de informacin, como puede observarse en la Figura 2.
2. Contemplan un nivel conceptual y un nivel terminolgico (lxico).
3. Permiten definir estructuras superiores de agrupacin de conceptos: Thesaurus, Concept-
Group o ThesaurusArray, para representar tesauros, grupo de conceptos y arrays de con-
ceptos en el caso de ISO 25964. Con respecto a SKOS, estas estructuras son las colecciones
y los esquemas de conceptos.
4. Los elementos de anotacin son casi idnticos: notas generales (Note), notas de alcance
(ScopeNote), notas de historial (HistoryNote), definiciones (Definition), notas de edicin
(EditorialNote) y notas personalizadas (CustomNote).

Sin embargo, SKOS carece de elementos nativos para la composicin de equivalencias,


grupos y arrays de conceptos y personalizacin de relaciones semnticas. En cualquier caso hay
que considerar que la nueva norma ISO se publica en un momento de amplio despliegue de
SKOS para publicar vocabularios controlados.
Para facilitar la interoperabilidad entre ambas propuestas, se ha desarrollado la ontologa
ISO-THES que reutiliza ciertos elementos de SKOS para representar tesauros en el mbito de

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
57

la web semntica conforme a ISO 25964 (Isaac y De Smedt, 2015)12. ISO-THES reutiliza SKOS y
SKOS-XL y define nuevas propiedades y clases para representar tesauros conformes al modelo
de datos establecido por la norma ISO 25964. De este modo, define una serie de elementos pro-
pios que permiten expresar la riqueza semntica del modelo de la norma ISO. Las caractersticas
generales de esta ontologa podran resumirse en los siguientes puntos:
Se reutilizan las clases de SKOS para representar conceptos, esquemas de conceptos y
colecciones. Se definen las clases iso-thes:ConceptGroup e iso-thes:ThesaurusArray
para representar los grupos de conceptos y los arrays.
Se reutilizan las propiedades de objeto que permiten representar las relaciones semnticas
entre conceptos. No obstante, se especifica que para alcanzar el potencial del modelo de
datos de la norma ISO es necesario definir subpropiedades a partir de skos:broader,
skos:narrower y skos:related para representar de forma flexible diferentes tipos de re-
laciones jerrquicas y asociativas.
Se definen relaciones jerrquicas genricas, partitivas e instanciales. Son relaciones que
expresan una semntica ms precisa que skos:broader/skos:narrower, contemplada
directamente por la norma ISO.
Las propiedades de etiquetado de SKOS se reutilizan para el etiquetado simple de los con-
ceptos, mientras que SKOS-XL se usa para definir las equivalencias simples o compuestas
entre etiquetas y la asignacin de las mismas a los conceptos.

Para plantear un caso prctico para la aplicacin de SKOS y la ontologa ISO-THES, se


puede recurrir a un escenario clsico en el que un tesauro se modela mediante una estructura
de reas o micro-tesauros como la del siguiente modelo:

Figura 8. Modelo de representacin de un tesauro estructurado en reas


y micro-tesauros mediante SKOS e ISO-THES. Fuente: elaboracin propia.

Existe un trabajo previo en el que se definen las correspondencias entre SKOS y los elementos del modelo de ISO 25964:
12

<http://www.niso.org/schemas/iso25964/correspondencesSKOS/>.

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
58

Los tesauros se representaran como esquemas de conceptos (skos:ConceptScheme),


mientras que las reas y los micro-tesauros como grupos de conceptos (skos:ConceptGroup).
Los conceptos, independientemente que fueran conceptos cabecera o no, se representa-
ran mediante skos:Concept. Las reas se vincularan con el tesauro a travs de la propie-
dad iso-thes:microThesaurusOf. A su vez los micro-tesauros se vincularan con las reas
utilizando iso-thes:superGroup, al tiempo que se usara iso-thes:subGroup para dicho
vnculo pero en sentido inverso (desde el rea al micro-tesauro). Para expresar los conceptos
que pertenecen a un micro-tesauro, se usara la propiedad skos:member. La pertenencia de
los conceptos al tesauro se representara con skos:inScheme. La definicin de los concep-
tos cabecera se realizara mediante las correspondientes propiedades skos:topConceptOf y
skos:hasTopConcept.
Tomando como ejemplo el Tesauro de la Unesco:

TESAURO CIENCIA BIOLOGA



DE LA UNESCO (rea de conocimiento) (micro-tesauro)

Se podra realizar la representacin del siguiente modo, expresado en sintaxis Turtle:

@Prefix ex: <http://www.example.org/>.


@Prefix skos: <http://www.w3.org/2004/02/skos/core#>.
@Prefix iso-thes: <http://purl.org/iso25964/skos-thes#>.
@Prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>.

ex:tesauroUnesco rdfs:type skos:ConceptScheme.

ex:areaCiencia rdfs:type skosthes:ConceptGroup;


iso-thes:microThesaurusOf ex:tesauroUnesco
iso-thes:subGroup ex:microtesBiologa.

ex:microtesBiologa rdfs:type iso-thes:ConceptGroup;


iso-thes:superGroup ex:areaCiencia.

ISO 25964 permite la composicin de conceptos complejos mediante la combinacin de


trminos. La ontologa ISO-THES reutiliza SKOS-XL para definir las clases y propiedades que
permiten desarrollar esta funcionalidad. El siguiente ejemplo:

Minera del Carbn Carbn Minera



USE Carbn + Minera UP+ Minera del carbn UP+ Minera del carbn

Se expresara en Turtle como se indica a continuacin:

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
59

@Prefix ex: <http://www.example.org/>.


@Prefix skos: <http://www.w3.org/2004/02/skos/core#>.
@Prefix iso-thes: <http://purl.org/iso25964/skos-thes#>.
@Prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>.
@Prefix skosxl: <http://www.w3.org/2008/05/skos-xl#>.

ex:carbon rdfs:type iso-thes:PreferredTerm;


skosxl:literalForm Carbn@es;
iso-thes:plusUFTerm ex:mineriaCarbon.

ex:mineria rdfs:type iso-thes:PreferredTerm;


skosxl:literalForm Minera@es;
iso-thes:plusUFTerm ex:mineriaCarbon.

ex:mineriaCarbon rdfs:type iso-thes:SplitPreferredTerm;


skosxl:literalForm Minera del Carbn@es;
iso-thes:plusUseTerm ex:carbon;
iso-thes:plusUseTerm ex:mineria.

Sin duda, ISO-THES complementa en gran medida a SKOS, pero ambos tienen ciertas limita-
ciones de representacin, en especial cuando se aborda el modelado para el consumo de RDF por
parte de aplicaciones basadas en el descubrimiento de datos a partir de las relaciones entre recursos.

Tabla 1. Comparativa de limitaciones de SKOS e ISO-THES.


Aspecto analizado SKOS ISO-THES
Representar micro-tesauros o subdivisiones del esquema de conceptos NO S
Composicionalidad de etiquetas lxicas de un concepto NO S
Enlace desde un concepto hacia la coleccin a la que pertenece NO NO
Definicin explcita de jerarquas de colecciones En un solo sentido S
Enlace desde el esquema de conceptos hacia las colecciones que contiene NO NO
Enlace desde una coleccin hacia el esquema de conceptos al que pertenece De forma no estndar S
Definicin explcita de conceptos como puntos de acceso en una coleccin NO NO
Fuente: elaboracin propia.

En consecuencia, con ISO-THES contina siendo imposible averiguar:


Cules son los conceptos cabecera de un recurso de la clase iso-thes:ConceptGroup,
puesto que la propiedad skos:hasTopConcept y skos:topConceptOf nicamente per-
mite representar los trminos cabecera de un esquema de conceptos, y en el caso de iso-
thes:ConceptGroup estamos ante una subclase de skos:Collection.
Cul es el micro-tesauro al que est asociado un concepto. Es importante distinguir este
hecho de la posibilidad de indicar los conceptos que contiene un micro-tesauro, para lo
cual se utiliza skos:member.

Una posible solucin a las anteriores limitaciones podra consistir en el uso del vocabula-
rio UNESKOS (Pastor-Snchez, 2016). Dicho vocabulario incluye un conjunto de propiedades
desarrolladas en un contexto para la representacin del Tesauro de la Unesco, pero que podran
aplicarse a cualquier proyecto que precise de ciertas relaciones inversas de las que carecen tanto
SKOS como ISO-THES13. Dichas propiedades son las siguientes:

Namespace y vocabulario RDF: <http://purl.org/umu/uneskos>. Especificacin: <http://skos.um.es/TR/uneskos>.


13

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
60

uneskos:contains: vincula un esquema de conceptos con cualquier elemento de SKOS.


uneskos:hasMainConcept: identifica desde una coleccin aquellos conceptos que son
puntos de acceso a una coleccin.
uneskos:hasMicroThesaurus: identifica desde un esquema de conceptos aquellos gru-
pos de conceptos que contiene.
uneskos:mainConceptOf: identifica desde un concepto aquellas colecciones de las que
es un punto de acceso.
uneskos:memberOf: desde un concepto identifica aquellas colecciones a las que pertenece.

Con el uso conjunto de SKOS, ISO-THES y UNESKOS, el modelo de representacin de un


tesauro de la Figura 9 quedara del siguiente modo:

Figura 9. Modelo de representacin de un tesauro estructurado en reas y micro-tesauros mediante SKOS e ISO-THES,
y complementado con el vocabulario UNESKOS. Fuente: elaboracin propia.

6. Conclusiones
La nueva norma ISO 25964, en sus dos partes, plantea nuevos retos para la representacin de
estos instrumentos mediante tecnologas de la web semntica. Sin ninguna duda, la ontologa
ISO-THES, pese a encontrarse en una fase de desarrollo, posee suficientes elementos para mo-
delar tesauros conforme a dicha norma. En este sentido, ISO-THES ofrece soluciones totalmente
vlidas para representar una tipologa de tesauros muy amplia, en especial aquellos que se or-
ganizan en torno a micro-tesauros, facetas o reas de conocimiento.
Sin embargo, SKOS presenta serias limitaciones para representar el mapeado compuesto
entre conceptos de diferentes vocabularios. Estas limitaciones se unen a otras relacionadas con
el consumo de datos mediante clientes RDF. La imposibilidad de definir las relaciones desde los
conceptos hacia las colecciones (o grupos de conceptos) a los que pertenecen o los conceptos
superiores en la estructura jerrquica de grupos de conceptos obligan a utilizar tecnologas,

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
61

como SPARQL, que en ocasiones puede que no estn a disposicin de los editores de los con-
juntos de datos de los tesauros.
Es posible definir vocabularios ad hoc, como UNESKOS, que permitan solventar estas limi-
taciones y que puedan utilizarse en diferentes contextos. No obstante, es posible que SKOS pue-
da ser revisado, como tantas otras tecnologas de la web semntica, para incluir algunas nuevas
clases y propiedades que permitan modelar los sistemas de organizacin del conocimiento para
facilitar su reutilizacin a partir de la estructura de conexiones entre elementos.
Finalmente, SKOS ofrece varios caminos para representar un mismo tesauro. Resultara de
gran utilidad trabajar sobre el establecimiento de un conjunto de buenas prcticas a partir del
anlisis de diferentes alternativas para modelar elementos concretos del tesauro.

Bibliografa
Berners-Lee, T.; Hendler, J., y Lassila, O. (2001): The semantic web: A new form of Web content that
is meaningful to computers will unleash a revolution of new possibilities, Scientific American,
v. 284, n. 5, pp. 28-37.
Garca-Marco, F. J. (2014): La nueva norma de tesauros UNE ISO 25964-1, Anuario ThinkEPI, v. 8,
pp. 159-163.
Guinard, D.; Trifa, V., y Wilde, E. (2010): A resource oriented architecture for the Web of Things,
Proceedings of Internet of Things (Tokyo, 29 noviembre-1 diciembre, 2010). DOI: 10.1109/
IOT.2010.5678452. <https://vs.inf.ethz.ch/publ/papers/dguinard-things-2010.pdf> [Consulta:
10 de diciembre de 2015].
Heath, T., y Bizer, C. (2010): Linked Data: Evolving the Web into a Global Data Space. Morgan &
Claypool publishers, 2011. DOI: 10.2200/S00334ED1V01Y201102WBE001. <http://linkeddata-
book.com/book>. [Consulta: 10 de diciembre de 2015].
Isaac, A., y De Smedt, J. (2015): ISO 25964 SKOS extension (iso-thes). <http://pub.tenforce.com/sche-
mas/iso25964/skos-thes/>. [Consulta: 10 de diciembre de 2015].
ISO (2011): ISO 25964-1:2011. Thesauri and interoperability with other vocabularies. Part 1: Thesauri
for information retrieval. Ginebra: International Organization for Standarization.
(2013): ISO/DIS 25964-1:2013 Thesauri and interoperability with other vocabularies. Part 2:
Interoperability with other vocabularies. Ginebra: International Organization for Standarization.
Montalvo-Montalvo, M. (2011): LCSH, FAST y DELICIOUS: vocabularios normalizados y nuevas for-
mas de catalogacin temtica, Anales de Documentacin, v. 14, n. 1. <http://revistas.um.es/
analesdoc/article/view/120141>. [Consulta: 10 de diciembre de 2015].
Pastor-Snchez, J. A. (2016): Proposal to represent the UNESCO Thesaurus for the Semantic Web
applying ISO-25964, Brazilian Journal of Information Studies: Research Trends, v. 10, n. 1,
pp. 1-8. <http://www2.marilia.unesp.br/revistas/index.php/bjis/article/view/5684>. [Consulta:
15 de enero de 2016].
Pastor-Snchez, J. A.; Martnez-Mndez, F. J., y Rodrguez-Muoz, J. V. (2009): Advantages of the-
saurus representation using the Simple Knowledge Organization System (SKOS) compared
with proposed alternatives. Information Research, v. 14, n. 4, paper 422. <http://InformationR.
net/ir/14-4/paper422.html>. [Consulta: 10 de diciembre de 2015].
(2012): Aplicacin de SKOS para la interoperabilidad de vocabularios controlados en el
entorno de linked open data, El profesional de la informacin, v. 21, n. 3, pp. 245-253.
Ramos Simn, L. F., et alii (2012): De la reutilizacin de la informacin del sector pblico a los porta-
les de datos abiertos en Europa, BiD: textos universitaris de biblioteconomia i documentaci,
n. 29. <http://bid.ub.edu/29/pdf/ramos2.pdf>. [Consulta: 10 de diciembre de 2015].

El lenguaje del patrimonio | Pgs. 47-62


Los tesauros en la web semntica: SKOS y la norma ISO 25964
62

Sheth, A. P. (1999): Changing focus on interoperability in information systems: from system, syntax,
structure to semantics, en Interoperating geographic information systems. Edicin de Good-
child, M. F. et alli. Kluwer Academic Publishers, pp. 5-29. <http://knoesis.wright.edu/library/
download/S98-changing.pdf>. [Consulta: 10 de diciembre de 2015].
Solodovnik, I. (2011): Metadata issues in Digital Libraries: key concepts and perspectives, JLIS.it Ita-
lian Journal of Archives and Information Science, v. 2, n. 2. DOI: 10.4403/jlis.it-4663. <http://
dialnet.unirioja.es/descarga/articulo/3945416.pdf>. [Consulta: 10 de diciembre de 2015].
W3C (2009): SKOS Simple Knowledge Organization System Reference. W3C Recommendation 18 Au-
gust 2009. <http://www.w3.org/TR/skos-reference>. [Consulta: 10 de diciembre de 2015].
(2013): RIF Primer (Second Edition). W3C Working Group Note 5 February 2013. <http://
www.w3.org/TR/rif-primer> [Consulta: 10 de diciembre de 2015].
(2013b): SPARQL 1.1 Query Language. W3C Recommendation 21 March 2013. <http://www.
w3.org/TR/sparql11-query/>. [Consulta: 10 de diciembre de 2015].
(2014): RDF 1.1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014.
<http://www.w3.org/TR/rdf11-concepts/>. [Consulta: 10 de diciembre de 2015].

El lenguaje del patrimonio | Pgs. 47-62


63

El control terminolgico en el Museo Arqueolgico


Nacional: evolucin histrica, situacin actual y perspectivas
de futuro
Javier Rodrigo del Blanco
Museo Arqueolgico Nacional

Existen muchas definiciones de documento, pero todas coinciden en que se trata de informacin
contenida en un soporte fsico o electrnico. Los sistemas documentales son tan antiguos como
la propia escritura, pues esta surge por la necesidad de crear documentos que eviten la prdida
de informacin y hagan posible su posterior recuperacin. As, los primeros documentos escritos
son asientos contables relacionados con el pago de impuestos, lo que supone una estructura-
cin de la informacin por la necesidad de saber, al menos, quin, cunto y por qu concepto
se debe tributar ante una autoridad determinada. Y esta idea de organizar la informacin no es
ajena a un concepto que creemos mucho ms actual: la base de datos.
No comenzaremos esta evolucin histrica desde un momento tan temprano de nuestra
historia, sino que lo haremos desde el siglo xix, cuando se formaliza la profesionalizacin del
personal que presta sus servicios en archivos, bibliotecas y museos a partir de tres normas:
1. Real Decreto de 7 de octubre de 1856 (Gaceta de Madrid de 9 de octubre), por el que se
crea la Escuela Diplomtica, con la funcin de ensear los conocimientos necesarios para
jefes y oficiales de archivos y bibliotecas.
2. Real Decreto de 17 de julio de 1858 (Gaceta de Madrid de 18 de julio), por el que se crea
el Cuerpo Facultativo de Archiveros-Bibliotecarios.
3. Real Decreto de 12 de junio de 1867 (Gaceta de Madrid de 15 de junio), por el que se
aade una Seccin de Anticuarios al Cuerpo Facultativo de Archiveros-Bibliotecarios, que
pasa a denominarse Cuerpo Facultativo de Bibliotecarios, Archiveros y Anticuarios, a cuyo
cargo estarn las bibliotecas pblicas, los archivos generales y los museos de antigedades
o arqueolgicos.

Entre estos museos de antigedades se encontraba el Museo Arqueolgico Nacional


(MAN), que se haba creado por Real Decreto de 20 de marzo de 1867 (Gaceta de Madrid de 21
de marzo) y cuyas colecciones iniciales fueron los objetos arqueolgicos o numismticos exis-

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
64

tentes en la Biblioteca Nacional, el Museo de Ciencias Naturales y la Escuela Diplomtica. Este


real decreto tambin prevea la creacin de museos arqueolgicos en aquellas provincias que
contaran con numerosos e importantes objetos de esta naturaleza.
Es relevante que en todas estas normas se haga referencia exclusiva a museos con obje-
tos arqueolgicos, definidos como los pertenecientes a la Antigedad, a los tiempos medios y
al Renacimiento, que sirvan para esclarecer el estudio de la historia, del arte o de la industria
en las indicadas pocas (Real Decreto de 20 de marzo de 1867, artculo 2). Y lo es porque todas
las normas relacionadas con la Seccin de Anticuarios no afectarn a museos de bellas artes, de
antropologa o de ninguna otra especialidad distinta de la arqueolgica. Es ms, la profesiona-
lizacin del personal al servicio de museos no arqueolgicos va a ser un hecho relativamente
reciente, salvo en lo que hoy denominamos departamentos de investigacin, lo que explica la
distinta importancia que se otorga a cuestiones documentales dentro de los distintos museos.
A lo largo de la segunda mitad del siglo xix, y comenzando desde el propio Real Decreto
de 12 de junio de 1867, se van a ir dictando instrucciones para regular la actividad del Cuerpo
Facultativo de Bibliotecarios, Archiveros y Anticuarios1. Sin embargo, estos reglamentos no van a
aportar nada en el campo que nos ocupa, pues en todos ellos se habla de una necesaria norma-
lizacin para homogeneizar los instrumentos documentales existentes en cada centro (catlogos,
ndices e inventarios) y hacer que todos los de una misma clase (archivos, bibliotecas y museos
arqueolgicos) tuvieran los mismos2. Reiterativa es tambin la llamada a la labor que en este
sentido deba hacer la Junta Consultiva de Archivos, Bibliotecas y Museos, tarea que nunca vio
la luz3. La consecuencia evidente es que cada centro adopt los instrumentos documentales que
estim convenientes, organizando en ellos la informacin de acuerdo con las necesidades de
cada establecimiento.
Por Real Orden de 12 de septiembre de 1901 (Gaceta de Madrid de 13 de septiembre) se
dispone que la Junta Facultativa de Archivos, Bibliotecas y Museos redacte reglamentos indepen-
dientes para cada Seccin, as como que dicte instrucciones para la redaccin de los catlogos
que deba haber en cada clase de establecimiento, tanto generales como especiales. Esta mayor
especializacin se plasma en:
1. Real Decreto de 22 de noviembre de 1901 (Gaceta de Madrid de 26 de noviembre), por el
que se aprueba el reglamento para el rgimen y gobierno de los Archivos del Estado.
2. Real Decreto de 29 de noviembre de 1901 (Gaceta de Madrid de 3 de diciembre), por el
que se aprueba el reglamento para el rgimen de los Museos Arqueolgicos del Estado.
3. Real Orden de 31 de julio de 1902 (Gaceta de Madrid del 5 al 19 de agosto), por la que se
aprueban las instrucciones para la redaccin de los catlogos en las Bibliotecas Pblicas
del Estado.

De estas tres disposiciones, las dos ms completas fueron las de archivos y bibliotecas,
pues no solo especificaban mejor la denominacin y finalidad de los distintos instrumentos do-
cumentales, sino que adems proporcionaban modelos de los mismos. En el mbito biblioteca-
rio, estas instrucciones fueron el primer intento serio para normalizar la catalogacin de fondos
bibliogrficos en Espaa y tuvieron una larga vida, pues se mantuvieron en vigor hasta el ao
1985, cuando el Ministerio de Cultura public la primera parte de las Reglas de catalogacin,
adaptacin nacional de las normas ISBD (International Standard Bibliographic Description). Y la

Se trata de los reglamentos orgnicos, que incluyen cuestiones de naturaleza tcnica y administrativa y que se van a ir
1

sucediendo en el tiempo: 1871, 1881, 1884, 1885 y 1887.


En todos estos reglamentos se habla de inventarios y de ndices circunstanciados de los fondos de cada institucin, as
2

como de libros de entrada y salida de material cientfico, libros que estaban a cargo de los secretarios de cada estable-
cimiento.
Esta Junta quedar disuelta por Real Decreto de 16 de abril de 1875 (Gaceta de Madrid de 17 de abril), siendo sustituida por
3

la Junta Facultativa de Archivos, Bibliotecas y Museos. Con este cambio, se quera dotar a este rgano de un carcter ms
ejecutivo, si bien no tuvo efectos prcticos en el terreno documental.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
65

normalizacin de contenidos tambin haba recibido mayor atencin en este mbito que en el
de los archivos y museos4.
En cambio, el reglamento para museos arqueolgicos se limitaba a enumerar los
instrumentos documentales (libro de entrada de objetos por compra o donacin, libro de
entrada de objetos en depsito, inventario general, catlogo sistemtico y catlogo mono-
grfico) y, en el mejor de los casos, dar unas indicaciones genricas acerca de su contenido
y finalidad, pero sin ofrecer ningn modelo que pudieran seguir los distintos museos. Por
ello, los cambios que esta norma supuso en la documentacin de estos centros fueron in-
apreciables.
Habr que esperar a 1942 (75 aos despus de la creacin del MAN y de la Seccin de
Anticuarios) para tener una definicin exacta de cmo deban ser los instrumentos documentales
enumerados en el reglamento de 1901. Se aprobaron por Orden del Ministerio de Educacin
Nacional, de 16 de mayo de 1942 (BOE de 6 de junio) y sern conocidas como Instrucciones de
Navascus5, en honor a su redactor. Sobre su importancia, simplemente decir que ms del 90%
de los campos contenidos en los sistemas documentales actuales ya estn recogidos en estas
Instrucciones.
Llegados a este punto, es necesario preguntarse cmo documentaban los museos sus co-
lecciones antes de 1942, que es cuando reciben instrucciones claras y concretas acerca del modo
de proceder en este mbito por primera vez. En el MAN, esa documentacin va a estar estrecha-
mente relacionada con la organizacin de los fondos, ya que se estableca una primera divisin
de los mismos en funcin de su naturaleza y cronologa, que explican las cuatro Secciones en
que se divida el MAN:
Seccin 1.: objetos arqueolgicos desde la Prehistoria a la Edad Antigua.
Seccin 2.: objetos arqueolgicos y artsticos de la Edad Media y de la Edad Moderna.
Seccin 3.: objetos numismticos, con independencia de su cronologa.
Seccin 4.: objetos etnogrficos, tambin con independencia de su cronologa.

A partir de esta primera clasificacin, todos los objetos arqueolgicos y artsticos van a
organizarse por su edad (Edad de Piedra, Edad del Bronce, Edad Media); por su industria,
cultura o estilo artstico (magdaleniense, hispano-romana, visigoda, gtico, barroco); por su
yacimiento de procedencia (solo para materiales arqueolgicos, no para los artsticos); por
cuestiones materiales (piedra, metal), tcnicas (textiles), funcionales (iluminacin, recipientes,
caza, minera) o tipos de produccin (cermica, cestera); y por su tipologa. Los objetos
numismticos se ordenarn principalmente por emisores, incluyendo la clasificacin por periodo
histrico y sustituyendo el yacimiento de procedencia por la ceca productora; en tanto que los
etnogrficos se agruparn por fuente de ingreso y por materiales o lugares de procedencia

Clasificar significa describir contenidos en el mbito bibliotecario. Las clasificaciones universales o enciclopdicas tra-
4

tan de abarcar todo el conocimiento humano, sistematizndolo en entradas concretas. Entre estas clasificaciones hay
que destacar la Clasificacin Decimal de Dewey (1876), la expansiva de Cutter (1891), la de la Library of Congress (1897,
aunque su plan general no se public hasta 1942), la Clasificacin Decimal Universal (1905) y la bibliogrfica de Bliss
(1935).
Su denominacin oficial era Instrucciones para la formacin y redaccin del inventario general, de los catlogos y re-
5

gistros en los museos servidos por el Cuerpo Facultativo de Archiveros, Bibliotecarios y Arquelogos dependientes del
Ministerio.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
66

Ficha de inventario anterior a 1942. Museo Arqueolgico Nacional (N.I. FA50401).

Esta ordenacin obedece a cuestiones prcticas de investigacin y de conservacin, pues


se diferencian los materiales orgnicos de los inorgnicos, cada uno con sus propias necesida-
des. Y el hecho de tener reunidos unos objetos con unas caractersticas comunes en cuanto a
tipologa, tcnica, materia y cronologa facilita su comparacin y estudio. Son estos criterios los
que van a seguir las Instrucciones de Navascus a la hora de clasificar los fondos en el catlo-
go sistemtico, cuyo fin era conocer los objetos del Museo en relacin con el cuadro artstico,
arqueolgico o histrico del territorio o comarca a que alcanza el rea de accin del Museo
(instruccin 39). Dado que ese orden cientfico no se poda establecer para todos los museos,
Navascus ofrece ejemplos de clasificacin para fondos arqueolgicos y numismticos, estable-
ciendo los niveles recogidos en la siguiente tabla, del ms general al ms especfico6:

Niveles Fondos arqueolgicos Fondos numismticos


1 Edad Edad
2 Cultura Serie
3 Seccin Grupo
4 Serie Soberano, Estado o ciudad

Los trminos recogidos bajo estos conceptos son los que componen dos de los campos
ms complejos a la hora de abordar su normalizacin: clasificacin genrica y contexto cultural.
Sin embargo, el control terminolgico iba ms all, pues se establece el empleo del vocablo en
castellano para denominar los objetos seguido, en su caso, del nombre erudito entre parntesis
(instruccin 12)7.

Para la definicin de cada trmino, ver la instruccin 40 de Navascus.


6

Antecedentes directos de los actuales campos Nombre comn y Nombre especfico del mdulo Fondos museogrfi-
7

cos de la aplicacin DOMUS.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
67

Anverso de la ficha del catlogo sistemtico. Museo Arqueolgico Nacional.

Aplicadas en un principio a museos arqueolgicos, las Instrucciones de Navascus van a


ser la norma documental de museos de otras especialidades a medida que estos vayan pasando
a depender de la Direccin General de Bellas Artes, en cuyo seno se crea el organismo aut-
nomo Patronato Nacional de Museos por Decreto 2764/1967, de 27 de noviembre (BOE de 28
de noviembre). Eran lgicas las crticas de estos centros hacia estas Instrucciones por el carcter
excesivamente arqueolgico de las mismas, pero tambin es cierto que se redactaron pensando
en los museos arqueolgicos, que eran los nicos servidos por miembros del Cuerpo Facultativo
de Archiveros, Bibliotecarios y Arquelogos en el momento de su redaccin. Por ello, estas Ins-
trucciones tuvieron un desigual cumplimiento en museos artsticos o etnogrficos, que muchas
veces siguieron utilizando sus propios instrumentos documentales.
La dcada de 1980 fue importante porque asistimos a los comienzos de la informatizacin
en los museos, que afectar enormemente al mbito documental. No obstante, antes de introdu-
cir la informtica ya se estaban planteando cuestiones acerca de la normalizacin terminolgica,
como las listas de trminos ms o menos jerarquizados para el contenido de algunos campos
y la elaboracin de unas fichas con trminos aceptados para nombres de objetos (Porta et alii,
1982). Y las Instrucciones de Navascus tambin haban adelantado algo al respecto, como al
tratar la referencia a las fotografas (instruccin 11) o la elaboracin de un ndice de grabadores
como complemento al catlogo sistemtico de medallas (instruccin 58).
Otro proyecto que plante cuestiones sobre normalizacin terminolgica fue el denomina-
do Documentacin Etnogrfica Espaola, iniciado en 1983 y concebido como un amplio plan
de actuacin en el campo etnogrfico, que, por diversas causas, qued reducido al estableci-

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
68

miento de unas normas generales para la recogida y sistematizacin de documentacin de inte-


rs para la realizacin de futuros estudios etnogrficos en Espaa (Carretero, Quinto y Timn,
1993: 9). Entre sus aportaciones, de gran inters por tratarse de una visin de la documentacin
desde un punto de vista distinto del arqueolgico, estuvo la de tratar de establecer unos tesauros
e ndices clasificatorios comunes para catalogar todos los fondos: objetos, publicaciones, foto-
grafas, filmaciones, etc.
El Reglamento de Museos de titularidad estatal, aprobado por Real Decreto 620/1987, de
10 de abril (BOE de 13 de mayo), introdujo cambios mnimos con respecto a las Instrucciones
de Navascus, si bien volva a una prctica que ya vimos en el siglo xix: la remisin a futuras
normas tcnicas para la elaboracin de inventarios y catlogos (art. 13). Las modificaciones se
centraban ms en cuestiones administrativas, por el nuevo reparto competencial en materia de
cultura, que en aspectos tcnicos8. Lo que s introdujeron estos libros de registro fue una cierta
confusin, pues se indic que el campo Objeto se cumplimentara de acuerdo a la naturaleza
del mismo (pintura, escultura, mosaico, arca, etc.), mezclando clasificaciones genricas con
nombres comunes, conceptos que antes aparecan bien diferenciados9.
El gran cambio en los sistemas documentales llegar con las bases de datos inform-
ticas, que unificarn los distintos repertorios documentales en una nica aplicacin, lo que
incrementar su volumen. Esta informatizacin agilizar la introduccin de datos, su edicin
y la recuperacin de registros, tanto en formatos de salida impresos como en pantalla, pero
obligar a una mayor exactitud en las cadenas de bsqueda para ofrecer los resultados espe-
rados. Esto supone un cambio radical en el modo de realizar las consultas, pues antes se iba
a un repertorio documental concreto y se buscaban registros fsicos. Con las bases de datos
informticas, se pueden hacer bsquedas por uno o ms campos de manera simultnea, pero
el trmino introducido debe coincidir con el contenido en los distintos registros de esa base
de datos, pues, de lo contrario, los registros que no lo contengan de la misma manera no
aparecern entre los resultados de nuestra consulta. La normalizacin terminolgica pasaba a
ser una necesidad.
Los primeros sistemas documentales informatizados aparecieron a finales de la dcada de
1980 en el Museo Arqueolgico Nacional (Cacho et alii, 1995) y en el Museo del Pueblo Espaol
(Carretero, 1990). En ambos casos, la normalizacin terminolgica estaba presente en unos cam-
pos muy concretos y sus descriptores eran fiel reflejo de sus sistemas anteriores: el sistema del
Museo del Pueblo Espaol aprovechaba el trabajo realizado con motivo del proyecto Documen-
tacin Etnogrfica Espaola, en tanto que las diversas aplicaciones instaladas en el MAN eran
herencia directa de las Instrucciones de Navascus, con el aadido administrativo impuesto tras
el Reglamento de Museos de titularidad estatal de 1987. En estos sistemas, especialmente en los
del MAN, se diferencian completamente los trminos que responden a la clasificacin genrica
de los fondos y a su contexto cultural, que aparecan entrelazados en el catlogo sistemtico de
Navascus y que se configuran ahora como dos campos distintos.
Consciente de los problemas derivados de la adopcin de una aplicacin informtica dis-
tinta para cada museo, la Direccin General de Bellas Artes y Conservacin y Restauracin de
Bienes Culturales reuni a una serie de tcnicos con la triple misin de 1) definir y unificar los
procesos documentales museogrficos y administrativos, 2) la normalizacin de terminologas, y
3) el desarrollo de su aplicacin informtica. Este grupo, denominado Comisin de Normaliza-
cin Documental de Museos, se constituy oficialmente el 25 de octubre de 1994, aunque vena
reunindose desde 1993. Los resultados de su trabajo quedaron plasmados en una publicacin

El libro de registro de entradas en propiedad quedaba como estaba, pero el libro de registro de depsitos deba desglo-
8

sarse en dos: uno para bienes depositados por otros rganos e instituciones de la Administracin General del Estado y otro
para bienes depositados por otras personas fsicas y jurdicas, tanto pblicas (comunidades autnomas y corporaciones
locales) como privadas.
9Ver las instrucciones dictadas al respecto por la Direccin General de Bellas Artes y Archivos del Ministerio de Cultura y

comunicadas a los museos en marzo de 1988 (Caballero, 1988).

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
69

(Carretero et alii, 1996) y en la aplicacin DOMUS para la gestin documental integral en los
museos dependientes de dicha Direccin General.
De los trabajos de esta Comisin nos interesan ahora los dos ltimos puntos: la norma-
lizacin terminolgica y su plasmacin en un sistema documental informtico. Esta Comisin
tom como punto de partida las experiencias que ya se haban hecho realidad en el MAN y en
el Museo Nacional del Pueblo Espaol. A partir de esas experiencias, se configuraron tres herra-
mientas principales para el control terminolgico:
1. Tesauros. Listados de descriptores y de indicadores clasificatorios, con distintas relaciones
entre ellos: jerrquica, asociacin y sustitucin. Empleados en campos con contenidos
complejos, como los de clasificacin genrica, contexto cultural o nombres de objeto.
2. Tablas. Listados de descriptores con una relacin jerrquica rgida entre ellos. Se emplean
en estructuras que difcilmente cambian, como las que indican ubicaciones.
3. Listas. Relacin de descriptores ordenados alfabticamente. Estas listas pueden ser de dos
tipos: abiertas o cerradas, en funcin del grado de libertad que se quiera dar al usuario a la
hora de introducir trminos. Sern listas abiertas aquellas que sean difciles de sistematizar,
como los ttulos de las obras o sus lugares especficos de procedencia, pero sern cerradas
aquellas para las que puedan definirse unas entradas predeterminadas, como las formas
de ingreso o los departamentos en que se estructura cada museo.

Hay un sistema adicional de control terminolgico y es el de aquellos campos que toman


sus contenidos de campos existentes en otros mdulos del sistema. As, por ejemplo, se estable-
cen relaciones entre los campos Inventario o Expediente, que estn contenidos en distintos
mdulos: Archivo administrativo, Documentacin grfica, Fondos museogrficos
En cuanto a la normalizacin terminolgica, se planteaba la creacin de un rea de
Vocabularios Tcnicos en el seno de la Comisin para la unificacin de normas descriptivas
y terminolgicas de las diversas reas cientficas, tcnicas y administrativas (Carretero et alii,
1996: 5-6). En esta publicacin aparecen recogidas ya muchas de las tablas y listas cerradas de
la aplicacin DOMUS, pero se remite a los resultados de grupos de trabajo especficos que ya
estaban tratando este asunto sobre distintas materias. El trabajo de estos grupos ha ido viendo la
luz bajo la denominacin de Diccionarios DOMUS10, en los que distintos especialistas abordan
un campo concreto.
No obstante, y salvo el de Kroustallis, estos Diccionarios DOMUS no pueden tomarse sin
ms como herramientas para control terminolgico, pues cada uno de ellos aborda su mbito
de estudio sin tener en cuenta la distribucin de los trminos que contienen en distintos campos
del sistema. Por ello, es imprescindible un proceso de depuracin que identifique un significa-
do con un nico significante11 y que ajuste los descriptores a los campos que realmente deban
contener esa informacin12.
El MAN inici la revisin de diversas herramientas de control terminolgico de DOMUS en
2010, pues los descriptores contenidos en ellas no son solamente fruto de la herencia recibida
del pasado, sino tambin de migraciones informticas desde otros sistemas, que han introducido
no pocos errores de volcado. La primera actuacin en este sentido consisti en la actualizacin
de todo lo relacionado con la gestin de reproducciones, que implicaba a distintos instrumentos:
1. Tesauro Series documentales, incorporando entradas adaptadas a la normativa vigente
en materia de procedimiento administrativo, ya que los expedientes se agruparan por la

10Se han publicado hasta el momento los siguientes: dibujo y estampa (Blas, 1996), cermica (Padilla, Maicas y Cabrera,
2002), mobiliario (Rodrguez, 2006), materias (Kroustallis, 2008), numismtica (Alfaro et alii, 2009), objetos asociados a
ritos, cultos y creencias (Trinidad, 2011) y objetos asociados a la expresin artstica (Trinidad, 2012).
11Recipientes en el diccionario de cermica, Mobiliario contenedor en el de mobiliario y Elementos para almacenamiento

numismtico en el de numismtica son tres descriptores que hacen referencia a un mismo significado: el de un objeto cuya
finalidad es guardar o almacenar otros objetos o sustancias.
12Trinidad (2011) incluye nombres comunes, nombres especficos y tipologas en un vocabulario destinado a nombres de
objetos, cuando estos elementos aparecen en tres campos distintos y tienen sus tesauros diferenciados.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
70

forma de finalizacin de dichos procedimientos: caducidad, desistimiento o renuncia y


resolucin favorable o denegada. Adems, se aada otra serie para recoger los pedidos
que el MAN haca a otras instituciones.
2. Listas cerradas13 Estado de reproduccin, Estado de tramitacin, Finalidad de reproduc-
cin, Formatos, Tarifas de reproduccin y Tipos de reproduccin, adaptndose a la
normativa vigente sobre propiedad intelectual y precios pblicos.

La primera gran depuracin se hizo con la lista cerrada Formas de ingreso, que contena
entradas distintas con el mismo significado. Tomando como base los modos de adquisicin re-
cogidos por la Comisin de Normalizacin Documental (Carretero et alii, 1998: 17-23), se asign
una entrada nica a cada forma de ingreso, eliminando duplicados14; se mantuvieron algunas
entradas, que habr que tratar con mayor detenimiento para evitar la prdida de informacin15;
y se crearon otras nuevas para responder a realidades existentes hoy da, como los ingresos de
fotografas como contraprestacin por haber permitido su toma en el Museo a fotgrafos profe-
sionales ajenos al mismo.
La segunda gran depuracin afect a instrumentos documentales vinculados con el m-
dulo Fondos bibliogrficos, en especial las listas abiertas Bibliografas autores y Bibliografas
ttulos. Con respecto a los autores, haba una pluralidad de entradas (hasta cinco) que hacan
referencia a una misma persona, aunque variaban elementos como utilizar acentos o no, po-
ner uno o sus dos apellidos, el nombre completo o su abreviatura, separar apellidos y nombre
mediante coma o no, o finalizar la entrada con un punto o sin l. Se dieron de alta 84 nuevos
autores y se editaron 73 entradas, que quedaron reducidas a 3116.
Con los ttulos ocurra algo similar a lo descrito para los autores: distintas entradas para
un mismo ttulo por diferencias en el modo de transcribirlo. Sin embargo, en este caso era ms
evidente el peso de una migracin realizada de manera incorrecta, pues una gran cantidad de
ttulos llevan incorporadas unas comillas [x], herencia de sus bases de datos de origen, que no
fueron eliminadas antes de dicha migracin. El problema aqu es que DOMUS est configurado
para incluir el contenido de este campo entre comillas, por lo que dicho contenido aparece con
dobles comillas [x] en los formatos de salida de datos: unas corresponden a las del sistema y
otras a las del contenido del campo. Se han ido eliminando estas comillas a lo largo del tiempo,
pero quedan an cerca de 2000 ttulos con ellas, de los 4489 existentes actualmente.
Desde entonces, se ha venido trabajando sobre tesauros concretos, a fin de contar con la
terminologa necesaria para el registro, inventario y catalogacin de los fondos, tanto documenta-
les como museogrficos. En este sentido, Fernando Fontes ha trabajado sobre el mdulo Directo-
rio y el tesauro Autoridades para, al igual que se hizo con los autores de bibliografa, normalizar
nombres de personas y de instituciones y evitar duplicados y registros incompletos, unificando
toda la informacin disponible sobre una persona en un registro. Tambin a Fernando Fontes
se debe la agrupacin de descriptores del tesauro Lugares geogrficos bajo unos indicadores
clasificatorios concretos, enorme labor que facilitar la posterior depuracin de este instrumento.

Los usuarios no podemos eliminar algunas entradas de las listas cerradas, con independencia del nivel de permisos. No
13

parece lgico que solo los informticos que mantienen DOMUS tengan esta facultad.
Por ejemplo, las entradas Adquisicin por compra, Asignacin por compra y Compra quedaron unificadas en un nico
14

descriptor, eliminndose los dos sobrantes.


Donacin por excavacin anterior a 1985 nos indica que un objeto ha sido donado, pero es importante no perder el dato
15

de procedencia de ese objeto: una excavacin cientfica. El motivo es que hasta la Ley de 13 de mayo de 1933, relativa al
Patrimonio Artstico Nacional (Gaceta de Madrid de 25 de mayo), se permita que los objetos procedentes de hallazgos
fortuitos o de excavaciones arqueolgicas legales quedaran en poder de sus descubridores (art. 40). En cambio, la Ley
16/1985, de 25 de junio, del Patrimonio Histrico Espaol (BOE de 29 de junio), impone que todo objeto arqueolgico debe
ser entregado a la Administracin, con independencia de si fue descubierto en el transcurso de excavaciones o prospec-
ciones arqueolgicas autorizadas (art. 42) o de un hallazgo fortuito (art. 44).
Este trabajo se hizo en el ao 2011, en el marco de una campaa de revisin de datos de fondos museogrficos a partir
16

de catlogos de 96 exposiciones. La campaa fue coordinada por quien suscribe y en ella participaron cinco licenciados,
contratados por el Servicio Pblico de Empleo Estatal.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
71

Se ha hecho una primera revisin del tesauro Tipologa, que alimenta el campo Tipologa /
Estado17. Este campo debera desglosarse en dos, tipologa y estado, pues hace referencia a dos cuestio-
nes totalmente distintas. Hasta ese momento, se agrupan los trminos propuestos bajo dos indicadores
clasificatorios bien diferenciados dentro de este tesauro. El que hace referencia al estado, a la condicin
de la obra, no ofrece mayores problemas; pero el de tipologa obliga a plantear una divisin entre:
Tipologas normalizadas. Clasificaciones sistemticas de un objeto o de un grupo de ob-
jetos, normalmente expresadas con notaciones codificadas, realizadas por investigadores
y publicadas. Se aplica tambin a denominaciones codificadas de productos comerciales.
Este indicador respondera a lo que la Comisin de Normalizacin Documental citaba
como clasificacin cientfica y denominacin comercial.
Tipologas no normalizadas. Denominaciones de tipos, generalmente formales, decorativos
o funcionales, que se han impuesto por su uso a lo largo del tiempo pero que no han sido
objeto de normalizacin, clasificacin y publicacin por parte de ningn especialista, pese
a que su uso est extendido y aceptado por la mayora de los investigadores. Este indica-
dor respondera a lo que la Comisin de Normalizacin Documental de Museos defina
como subcategora funcional o formal y formas adjetivadas u otros elementos de preci-
sin que permiten precisar el nombre o las caractersticas del objeto dentro de su grupo.

Ejemplo para tipologas normalizadas y no normalizadas. Museo Arqueolgico Nacional.

Y llegamos a los dos grandes tesauros sobre los que se ha trabajado en el MAN y para los que
ya la propia Comisin avanzaba que sera necesaria la creacin de grupos de trabajo especficos:
Clasificacin genrica y Contexto cultural (Carretero et alii, 1996: 6). Este ltimo fue facilitado
por la Subdireccin General de Museos Estatales para su revisin y adaptacin por parte del MAN,

Este campo recoge la clasificacin cientfica, subcategora funcional o formal, condicin de la obra (copia, impronta, etc.),
17

denominacin complementaria o comercial, formas adjetivadas u otros elementos de precisin que permiten precisar el
nombre o las caractersticas del objeto dentro de su grupo (Carretero et alii, 1996: 73).

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
72

tarea que coordin Fernando Fontes con los departamentos de investigacin de este Museo18. Este
tesauro se encuentra en una fase muy incipiente, pues, pese a la enorme diversidad de nuestras
colecciones, ser imprescindible la aportacin de tcnicos de museos de otras especialidades para
completarlo. En su nivel ms general, este tesauro debera contar con las siguientes entradas:
reas culturales. Definidas como mbitos geogrficos en los que se desarrollan culturas
con unas caractersticas similares, son fundamentales a la hora de contextualizar objetos
etnogrficos, aunque su uso puede extenderse a otro tipo de objetos, como los arqueol-
gicos de poca prerromana en el caso de nuestro pas.
Creencias. La importancia que tienen los distintos sistemas de creencias en los grupos
humanos hace que muchos objetos hayan sido fabricados para su empleo dentro de un
sistema concreto, pudiendo ser especficos de determinados ritos. El carcter ritual de un ob-
jeto se define en su clasificacin genrica, pero aqu se recoge a qu sistema pertenece y
con qu ritos se asocia dicho objeto.
Cronologa geolgica. Complementaria de la histrica en algunas fases, como en poca pre-
histrica, es bsica a la hora de tratar restos minerales, paleobotnicos y paleontolgicos.
Cronologa histrica. Convencionalismos en los que dividimos la historia de la humanidad,
desde sus inicios hasta nuestros das. Estas divisiones sern vlidas para mbitos geogrfi-
cos concretos (Amrica prehispnica, Europa, Extremo Oriente), pues se deben respetar
las particularidades que presenta cada uno de ellos.
Estilos artsticos. Objetos vinculados a determinados periodos, estilos y movimientos arts-
ticos se definen por sus caractersticas culturales en esta entrada.
Grupos tnicos. Al igual que las reas culturales, la determinacin del grupo tnico es vital
a la hora de contextualizar un objeto etnogrfico, especialmente de aquellos de proceden-
cia extraeuropea, aunque tambin puede aplicarse a pueblos prerromanos y germnicos.

Esquema general del tesauro de contexto cultural. Museo Arqueolgico Nacional.

El campo Contexto cultural debe contener periodo geolgico o histrico, grupo cultural, estilos, u otros hechos o indica-
18

dores histricos o culturales con los que se vincula el objeto (Carretero et alii, 1996: 87).

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
73

El trabajo realizado sobre este tesauro en el MAN se ha centrado fundamentalmente en la crono-


loga histrica del mbito denominado Culturas Euromediterrneas y del Oriente Prximo. Esta deno-
minacin ya plantea algunos interrogantes, pues las culturas de Europa septentrional, atlntica, central u
oriental no pueden depender jerrquicamente del trmino euromediterrneo, mbito con el que poco
tienen que ver. Adems, si queremos englobar las culturas mediterrneas, nos sobra el prefijo euro o nos
falta el referido a frica, pues Asia quedara incluida en Oriente Prximo. No obstante, este mismo tr-
mino es tambin conflictivo, pues expresa conceptos distintos en nuestro pas y en el mundo anglosajn.
El segundo problema fue la denominacin de fases o culturas, ya que existen distintas pro-
puestas y no hay unanimidad entre los especialistas a la hora de decidirse por una en concreto
en detrimento de las dems. Por ejemplo, Bronce A, Bronce I o Bronce Inicial.
El tercer problema consista en diferenciar unos periodos comunes con caractersticas re-
gionales distintas, como, por ejemplo, Edad del Bronce o Edad del Hierro. La solucin vino de la
mano de indicadores clasificatorios que permitieran distinguir entre una periodizacin general,
para recuperar todos los fondos de un periodo concreto, y una periodizacin regional, de la que
ya pudieran depender jerrquicamente los descriptores referidos a cada fase o cultura concreta
(Tercera dinasta de Ur, Hallstatt, Ibrica). Quiz el indicador clasificatorio reas culturales
podra contribuir a mejorar la organizacin de los descriptores en este sentido.
Y la cuarta cuestin era decidir el nivel al que se quera descender (jefaturas de Estado) y
cmo incluir otros acontecimientos de enorme relevancia histrica, como la Revolucin francesa
o las guerras carlistas, que haran ms completo el tesauro, pero tambin mucho ms complejo.
Con respecto al tesauro Clasificacin genrica, conviene decir que presentaba la misma
falta de relaciones entre sus trminos que los dems, fruto de las migraciones masivas y del tra-
bajo de personal eventual con escasa supervisin en esta parte de sus tareas, pues introducan
trminos para poder utilizarlos, no para crear un tesauro estructurado19. Analizados los trminos
del tesauro, estos se agruparon bajo las siguientes entradas:

Esquema general del tesauro de clasificacin genrica. Museo Arqueolgico Nacional.

El campo Clasificacin genrica est destinado a contener informacin sobre categoras superiores al nombre del objeto
19

o documento (Carretero et alii, 1996: 72).

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
74

Artes, producciones y oficios. Clasificacin empleada para artes (arquitectura, escultura,


pintura), producciones (eboraria, glptica, joyera) y oficios (alfarera, cantera), in-
cluyendo producciones muy especficas de una poca, como Arte mueble o Industria
ltica, que seran casi imposibles de agrupar sin estos descriptores.
Ciencias y disciplinas. Agrupacin de bienes culturales en funcin del tipo de disciplina
que se encarga de su estudio, ya que tradicionalmente han servido como elemento de cla-
sificacin para los mismos, como ocurre con los materiales numismticos o los epigrficos.
Contenidos del MAN. Agrupacin de bienes culturales por la temtica que abordan o los
contenidos que tratan o representan. Se aplica fundamentalmente a documentos escritos,
grficos, sonoros o audiovisuales.
Formas de presentacin. Agrupacin de bienes culturales por la forma en que se nos
presentan. Tambin se aplica generalmente para documentos escritos, grficos, sonoros o
audiovisuales.
Materias elaboradas. Se incluyen en esta categora los objetos que se encuentran en una
fase intermedia entre la materia prima y la configuracin final del mismo una vez finaliza-
da su produccin. Es una entrada transitoria, que debe desaparecer con el tiempo.
Materias primas. Restos orgnicos. Agrupacin de objetos naturales que adquieren un valor
cultural por ser indicadores de la evolucin de las especies o por ser usados en su estado
natural por un grupo humano. Este apartado contiene lo que Kroustallis (2008) estableca
como materias primas de origen natural, pues los productos realizados con las materias
elaboradas ya se incluyen en otras entradas.
Uso o funcin. La clasificacin funcional es quiz uno de los criterios ms claros a la hora
de agrupar bienes culturales20. Los descriptores incluidos en esta categora se estructuran
bajo dos indicadores clasificatorios, dependiendo de la pregunta a que respondan:
Por contextos de uso, esto es, dnde se utilizan?, en qu mbito dentro de una
sociedad?
Por finalidad, es decir, por y para qu se fabrican o se usan?

Conclusin
La normalizacin documental es una de las grandes asignaturas pendientes que tenemos los mu-
seos. Han sido muchos aos los que los tcnicos de museos hemos tenido que hacernos nues-
tros propios instrumentos documentales, o adaptarlos a nuestras necesidades, y solo desde la
implantacin de DOMUS se han compartido normas y estndares entre un nmero significativo
de museos. Adems, el control terminolgico solo ha sido efectivo desde que los administrado-
res del sistema somos las nicas personas con permisos para creacin, edicin y eliminacin de
entradas en tesauros y listas cerradas.
Una vez se haya hecho la primera gran depuracin de entradas en las herramientas de
control terminolgico y se hayan establecido las relaciones correctas entre sus contenidos, ten-
dremos entonces que poner ese trabajo en comn, para ver su aplicacin en los distintos mu-
seos, e ir construyendo instrumentos comunes pero vlidos para todos ellos. Y, superada esta
fase, llegar el momento de revisar estos instrumentos con especialistas procedentes de otras
instituciones y especialidades (universidades, centros de investigacin), a fin de conseguir
unas herramientas tiles, no solo para el personal de cada museo, sino tambin para personas
ajenas al mismo, ya que nuestro trabajo no tiene ningn sentido si no se pone a disposicin de
la sociedad, tanto de especialistas e investigadores como del pblico en general.

Existe el campo Uso / Funcin, que debera quedar para un contenido ms descriptivo del modo en que se manejan los
20

bienes culturales.

El lenguaje del patrimonio | Pgs. 63-75


El control terminolgico en el Museo Arqueolgico Nacional
75

Bibliografa
Alfaro Asins, C. et alii (2009): Diccionario de numismtica. Madrid: Ministerio de Cultura.
Blas Benito, J. (coord.) (1996): Diccionario del dibujo y la estampa: vocabulario y tesauro sobre las
artes del dibujo, grabado, litografa y serigrafa. Madrid: Real Academia de Bellas Artes de San
Fernando.
Caballero Zoreda, L. (1988): La documentacin museolgica, Boletn de ANABAD, vol. XXXVIII, n.
4, ANABAD, pp. 455-496.
Cacho Quesada, C.; Mart, J.; Maicas Ramos, R., y Armada, M. (1995): Informatizacin y documenta-
cin en el Museo Arqueolgico Nacional. Madrid: ANABAD.
Carretero Prez, A. (1990): Informatizacin y catlogos documentales del Museo Nacional del Pue-
blo Espaol, Anales del Museo del Pueblo Espaol, tomo III. Madrid: Ministerio de Cultura, pp.
239-293.
Carretero Prez, A.; Quinto Romero, M. L. de; Timn Tiemblo, M. P. (1993): Sistema de clasificacin
de documentacin etnogrfica espaola, Anales del Museo del Pueblo Espaol, tomo V. Madrid:
Ministerio de Cultura, pp. 7-376.
Carretero Prez, A. et alii (1996): Normalizacin documental de museos: elementos para una aplica-
cin informtica de gestin museogrfica. Madrid: Ministerio de Educacin y Cultura.
Kroustallis, S. K. (2008): Diccionario de materias y tcnicas (I): materias. Madrid: Ministerio de
Cultura.
Padilla Montoya, C.; Maicas Ramos, R., y Cabrera Bonet, P. (2002): Diccionario de materiales cermi-
cos. Madrid: Ministerio de Educacin, Cultura y Deporte.
Porta, E.; Monserrat, R. M.; Morral, E. (1982): Sistema de documentacin para museos. Barcelona:
Departament de Cultura de la Generalitat de Catalunya.
Rodrguez Bernis, S. (2006): Diccionario de mobiliario. Madrid: Ministerio de Cultura.
Trinidad Lafuente, I. (2011): Tesauro y diccionario de objetos asociados a ritos, cultos y creencias.
Madrid: Ministerio de Educacin, Cultura y Deporte.
(2012): Tesauro y diccionario de objetos asociados a la expresin artstica. Madrid: Ministe-
rio de Educacin, Cultura y Deporte.

El lenguaje del patrimonio | Pgs. 63-75


76

La memoria recuperada: la bsqueda del nombre.


La construccin del Tesauro de Denominaciones de Bienes
Culturales
Isabel Trinidad Lafuente

A pesar del poder de las imgenes, o tal vez por ello, rara vez los pueblos, culturas o civilizacio-
nes pasadas o presentes han creado sus objetos simplemente para ser vistos; cada uno de ellos
suele tener un significado, un porqu, un para qu, un mensaje que puede estar ms o menos
velado pero que siempre existe. Porque la cultura es creacin, no una mera copia de la realidad,
sea cual sea su motivacin: cultural, ritual, artstica o esttica. Pero para llegar a comprenderla
y estimar el valor de conservar el producto de esta creacin, es necesario recuperar de nuestra
memoria y de la de aquellos que nos han precedido la historia de cada uno de estos objetos,
conocer los diferentes avatares que han sufrido y que han quedado grabados en su estructura
como parte de su memoria impresa. Y no podra ser de otra forma, porque, como deca Adolfo
Colombres (1991), sin ella la cultura acabara por convertirse en una parodia de s misma, en
algo que se exhibe, no que se vive, y afortunadamente hoy ya los museos han dejado atrs
para siempre la sacralidad del museo mausoleo dirigido a unos pocos para convertirse en un
espacio vivo, dinmico, cuyo fin es la investigacin, el disfrute, participacin y enriquecimiento
de todos, un espacio que permite el desarrollo de una educacin no formal, porque el correcto
conocimiento del pasado nos permitir una mejor comprensin del presente.
Para ello es necesario no solo ver los objetos sino aprender a mirarlos y sobre todo, a escu-
charlos. Porque ellos hablan y cuentan historias, tantas como pocas, culturas, hbitos y lugares
han atravesado desde que fueron creados por sus artfices, hombres y mujeres. Pero para que
esa herencia que hemos recibido de nuestros antepasados podamos seguir legndola a genera-
ciones futuras en las mejores condiciones, debemos transmitirla con su propio nombre, y cada
objeto tiene el suyo propio, aquel con el que en su da fueron bautizados, porque solo as noso-
tros y los que nos sucedan podrn y podremos identificar cada uno de ellos para comprenderlo,
conservarlo, documentarlo, estudiarlo, clasificarlo y comunicarlo como hoy est demandando a
los museos la sociedad del conocimiento.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
77

Figura 1. Alegora de la atencin. Weiss, Rosario. Museo Nacional del Romanticismo, n. inv.: CE7126.

Ya en 1737, el taxonomista sueco Carl von Linn manifestaba que si ignoras el nombre de
las cosas, desaparece tambin lo que sabes de ellas.
Por eso, el Tesauro de Denominaciones de Bienes Culturales elaborado por la Subdirec-
cin General de Museos Estatales de la Direccin General de Bellas Artes y Bienes Culturales
y de Archivos y Bibliotecas, compuesto por todos aquellos objetos museables o susceptibles
de serlo de cualquier rea o disciplina, muebles e inmuebles, se propuso desde un principio
recuperar no solo aquellos nombres genricos (TG), sino tambin los de su larga familia, visua-
lizndolos con su nombre especfico (TE). As, por ejemplo, el trmino ms amplio de mscara
englobar otros ms concretos, y estos, a su vez, a terceros con el nombre dado por cada una
de las culturas a la que pertenezcan:

TG Mscara
TE1 Mscara-casco
TE2 Mscara apasa
TE2 Mscara banda
TE2 Mscara janus
TE2 Mscara egungun

Y nos propusimos recuperar su nombre especfico porque no nos podamos quedar en un


simple contenedor de ofrendas, porque estaramos amputando parte de la rica cultura material
que a lo largo de los siglos y de las culturas ha ido modulando el ser humano para acercarse a
lo divino; y tenamos que darles nombre para que el kernos griego del siglo iv a. C. o el panch
patra hinduista del xix tuvieran tambin su sitio en nuestra memoria.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
78

Figura 2. (Izquierda) Kernos. Museo Arqueolgico Nacional, n. inv. 11621; (derecha)


Panch Patra. Museo Nacional de Antropologa, n. inv. CE1999/3/55.

Tesauro es una palabra de origen griego (thesauros) que significa tesoro, especialmente
el tesoro de un templo. Referido tanto al continente como al contenido, es decir, tanto al templo
construido en Delfos por los atenienses en el siglo v a. C., como a las armas conservadas en su
interior y que estos toman de los persas durante la batalla de Maratn para ofrecerlas a Apolo.

Figura 3. Saqueo del Templo de Delfos. Coelemans, Jacques. Museo Lzaro Galdiano, n. inv. 11196.

Y si thesauros significa tesoro, thesaurizar significa atesorar, amasar riquezas y, en sentido


figurado, acumular bienes culturales, amasar informacin y, por lo tanto, conocimiento. Y eso
es lo que pretendemos mientras construimos y damos forma al Tesauro de Denominaciones de
Bienes Culturales. Desde un principio, el objetivo fue el de convertirlo en un acceso temtico,
en la memoria del museo, una memoria con un lenguaje jerarquizado y normalizado, para que, en
una segunda fase, termine siendo la herramienta ms eficaz en el mbito musestico compartida
por todos y de la misma forma a travs de la web del conocimiento.
El Tesauro de Denominaciones de Bienes Culturales est compuesto, hasta el momento,
por 12900 descriptores y por 4260 no descriptores. Objetos relacionados con los cultos, pasan-
do por juegos o juguetes, armas, circo, cine, fotografa, instrumentos musicales, dibujo, pintura
o escultura, la arquitectura y sus elementos o estructuras, herramientas y tiles o todo aquello

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
79

que hombres y mujeres hayan podido crear para el disfrute propio o el ajeno, para la ofrenda,
promesas o proteccin natural, humana o divina.

Figura 4. De izquierda a derecha y de arriba abajo: Urna funeraria, Museo de Amrica, n. inv. 02589; Navidad en el circo, Paredes Jardiel,
Jos, Museo del Teatro, n. inv. Es-1; Livia de Paestum, Museo Arqueolgico Nacional, n. inv. 2737; Colotipo, Museo Nacional del Romanticis-
mo, n. inv. CE36190; Lampadoscopio, Museo del Traje, CIPE, n. inv. CE038021A; El accidente, Ponce de Len, Alfonso, Museo Nacional
Centro de Arte Reina Sofa, n. inv. AS00745; Zanfoa, Museo del Traje, CIPE, n. inv. CE085722; Capitel romnico, Museo Arqueolgico
Nacional, n. inv. 50004.

Y todo ello sin limitaciones temporales, culturales ni geogrficas, desde el dolo oculado
del III milenio a. C. hasta las instalaciones o performances del siglo xxi. Pero siempre a travs
de un camino comn capaz de aunar disciplinas o manifestaciones temporales e histricas tan
diferentes, un camino comn, un hilo conductor que no poda ser sino el propio objeto, nico
elemento en el que coinciden los yoruba de Nigeria, los griegos del siglo iv a. C. o los cristianos
de hoy.
Es decir, nuestro Tesauro deba abarcar el universo, pero intentar englobarlo de una sola
vez es cuanto menos complejo y adems sus resultados se veran a muy largo plazo. Por esta
razn, se decidi publicar el trabajo por ramas conforme estas fueran completadas. En la actua-
lidad, el Ministerio de Educacin, Cultura y Deporte est estudiando los medios tcnicos para
volcarlas a los museos, con el fin de que estos puedan tener as acceso a los tesauros a medida
que las diferentes disciplinas vayan siendo terminadas, como ya se ha hecho con otros tesauros,
como el de Materias o el Geogrfico.
Hasta ahora la Subdireccin General de Museos Estatales ha publicado:
Tesauro y Diccionario de objetos asociados a ritos, cultos y creencias, sistematizando, des-
cribiendo y contextualizando los objetos de cultos animistas, precolombinos, los clsicos
(Grecia, Roma, Etruria o los pueblos beros), Egipto, los relativos a las conocidas como las
religiones del libro (ortodoxos, catlicos o protestantes), musulmanes y judos, as como
las religiones asiticas: budistas o hinduistas. Compuesto por un total de 1671 descriptores
y por 739 no descriptores.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
80

Figura 5. Portada del Tesauro y Diccionario de objetos asociados a ritos, cultos y creencias.

Tesauro y Diccionario de objetos asociados a la expresin artstica, compuesto por un total


de 2356 descriptores y por 770 no descriptores y que rene objetos vinculados a las:
Artes de la imagen: cine, fotografa y arte grfico.
Artes escnicas: msica, artes de la representacin (como teatro o danza) y el circo.
Artes plsticas: dibujo, escultura y pintura.

Figura 6. Portada del Tesauro y Diccionario de objetos asociados a la expresin artstica.

Ambos consultables en lnea <http://tesauros.mecd.es/tesauros/tesauros>.

Por ltimo, en fase de publicacin, el Tesauro y Diccionario de arquitectura y estructuras,


compuesto por 2296 descriptores y por 1179 no descriptores. En el que se sistematizan
los trminos desde su elaboracin y preparacin, como el dibujo tcnico o las maquetas
arquitectnicas, pasando por los relacionados con su realizacin y creacin, como las
construcciones jerarquizadas segn su funcin: civil (pblicas o privadas), conmemora-
tivas, funerarias, militares o religiosas, o los elementos arquitectnicos, como aperturas

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
81

y vanos, cierres o separaciones, circulacin, cubricin o techado, de fbrica y obra, de


revestimiento, sustentacin u ornamentos, hasta las estructuras no edificatorias, como los
jardines.

Figura 7. Maqueta de la portada del Tesauro y Diccionario de arquitectura y estructuras.

Por otra parte, y con respecto a los criterios de eleccin para ir acometiendo las dife-
rentes ramas o especialidades, estos han sido en primer lugar su carcter prctico, es decir,
que pudieran ser de utilidad para la mayor parte de los museos. Caso evidente en los dos
primeros tesauros, ya que la mayor parte de las colecciones estables de fondos musesticos,
en cualquiera de los diferentes tipos de museos, sean estos antropolgicos, arqueolgicos,
casas museo, de artes decorativas o de bellas artes o incluso de ciencia y de tecnologa,
cuentan entre sus fondos con objetos que pueden ser incluidos en cualquiera de los dos
primeros casos.
Al primero de ellos, el Tesauro y Diccionario de objetos asociados a ritos, cultos y creen-
cias, se le una adems el hecho de que, hasta ese momento, no exista en el mbito cientfico
un tesauro del conjunto de creencias con esta amplitud y, sobre todo, que tuviera como prota-
gonista al objeto y no a la historia de la religin o de la iconografa religiosa.
Tras los dos primeros, especialmente importante a la hora de seleccionar de entre el resto
de las ramas abordables de bienes culturales fue el carcter pluridisciplinar del escogido, el
Tesauro y Diccionario de arquitectura y estructuras, adems de por su aportacin a labores tan
importantes como las desarrolladas por los Planes Nacionales para la defensa del Patrimonio
Cultural inmueble. Ya que, partiendo del estudio y de la unificacin de estructuras descriptivas
y clasificatorias de las colecciones y de la terminologa tcnica utilizada, se facilita un ptimo
intercambio y recuperacin de informacin en la red, permitiendo as racionalizar y optimizar
los recursos destinados a su catalogacin, conservacin y difusin. Objetivos estos persegui-
dos por los diferentes Planes Nacionales desde su puesta en marcha en la segunda mitad de
la dcada de 1980: Plan Nacional de Catedrales, Patrimonio Industrial, Arquitectura Defensiva,
Paisaje Cultural, Abadas, Monasterios y Conventos, Arqueologa Subacutica o Arquitectura
tradicional.
As, buscando el nombre de nuestros vestigios ms antiguos o recientes, salimos esta vez
extramuros de los museos.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
82

Figura 8. Scaena. Museo Nacional de Arte Romano, n. inv. 55-XVI-8.

Con el desarrollo de esta tercera rama se ha dado un paso ms en el apoyo de la filoso-


fa con la que se crearon los grupos de trabajo para la elaboracin de los tesauros, perseguida
desde que, en 1993, se iniciara el proyecto a travs de la Comisin de Normalizacin Documental
de Museos, con vistas ya no solo a su utilizacin como herramientas de control terminolgico
en DOMUS, sino tambin enmarcada en el proyecto Sistemas de Informacin del Patrimonio
Histrico en la Red, que condujo a la actual CERES. Ello posibilita una tercera va de utilizacin
de los tesauros enmarcados en la Web Semntica (web del conocimiento), unindose as a la co-
munidad cientfica mundial, aportando el trabajo desarrollado en este campo y enriquecindose,
a su vez, con la experiencia de otros.

Pero han sido varias las fases y mltiples las dificultades con las que nos hemos ido encon-
trando en su desarrollo. As, antes de la elaboracin propiamente dicha, se tuvieron en cuenta
las siguientes consideraciones.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
83

En primer lugar, las necesidades de los museos, donde nos encontramos con la primera
dificultad, su gran heterogeneidad. No tenamos que elaborar tesauros para un museo con una
disciplina concreta, sino para todos aquellos integrados en el sistema DOMUS o que lo fueran
en un futuro, es decir, un tesauro que sirviera igual a un museo arqueolgico con colecciones
desde la prehistoria hasta la Edad Moderna, cada una de ellas con una terminologa especfica,
como a otro de artes decorativas, ofreciendo as un lenguaje normalizado, elaborado y aceptado
por todos, desde antroplogos a arquelogos de la prehistoria o medievalistas, pasando por
especialistas en Bellas Artes.
El segundo paso fue el de analizar el volumen y naturaleza de la documentacin. En
cuanto a su volumen, y teniendo presente que la coleccin de un museo puede seguir incre-
mentndose bajo distintas frmulas, los tesauros necesariamente no deben ni pueden ser algo
cerrado, sino ofrecer la posibilidad de la incorporacin de nuevos trminos a medida que estos
vayan siendo propuestos por los centros1. En relacin con su naturaleza y teniendo presente la
diversidad de las instituciones a las que van dedicados, los objetos podan ir desde una punta
de flecha calcoltica hasta una pintura contempornea de Luis Gordillo, por lo que el tratamien-
to de su estructura deba desarrollarse de manera homognea en su estructura general, con el
objeto de dar la coherencia que demanda todo trabajo cuyo fin es el de la normalizacin para la
mejor comprensin y comunicacin; aunque y al mismo tiempo heterognea en su desarrollo,
para contemplar la especificidad que requieren cada una de las disciplinas que nos conciernen.
El tercer punto abordado fue la seleccin del software para la construccin del tesauro; en
nuestro caso, Jerartes, herramienta elaborada exprofeso para tesauros de colecciones musesticas
y que nos permite:
Dar de alta nuevos descriptores (trminos aceptados) o eliminar los no pertinentes.

Cualquier propuesta de incorporacin para la actualizacin y mejora de los tesauros elaborados por la Subdireccin Ge-
1

neral de Museos Estatales puede ser enviada a la siguiente direccin de correo electrnico: tesauros.museos@mecd.es

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
84

Dar de alta no descriptores o trminos no preferentes, sin informacin pero que nos remi-
ten a los anteriores.

Crear relaciones entre los trminos de equivalencia, jerrquicas y asociativas.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
85

Crear indicadores clasificatorios y relacionar los descriptores con estos.

Jerarquizarlos y ver dicha jerarqua en la ficha de cada descriptor o generar informes de


estas jerarquas.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
86

Vincular imgenes con cada uno de los descriptores.

Generar todos los informes en formato texto necesarios para su publicacin: cuerpo del
tesauro, donde se reflejan todas las relaciones creadas entre nuestros trminos y el Dic-
cionario.

Cuerpo del tesauro


Acetre
UP Caldereta
Cubo de agua bendita
TG Objetos rituales y ceremoniales
TE Stula
TR Hisopo

En cuanto a la construccin propiamente dicha del tesauro, se establecieron las siguientes fases:
El primer paso fue el de la delimitacin del campo terminolgico: Tesauro de Denomina-
ciones de Bienes Culturales, Muebles e Inmuebles.
El segundo, el de la determinacin de campos temticos, es decir, las distintas ramas del
tesauro, as como la distribucin de descriptores dentro de estas. El mtodo de trabajo ha
sido el mismo para cada uno de ellos, evidentemente y como ya se ha mencionado, cada
uno tratado con las especificidades propias de cada disciplina que nos conduce a la crea-
cin de relaciones y campos temticos propios.

En aras de una mayor claridad, nos centraremos en un ejemplo concreto, el de Ritos, cul-
tos y creencias. En un principio, contamos con un sinfn de piezas procedentes de los distintos
museos e instituciones, a los que le buscamos y acordamos el trmino aceptado (descriptor)

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
87

y los no descriptores, desarrollando as las relaciones de equivalencia: USE (Use) / UP (Usado


por), y ello mediante la consulta y consenso con distintas fuentes: especialistas en cada una de
las culturas tratadas, instituciones musesticas, centros de investigacin, universidades y fuentes
bibliogrficas2.
Ya tenamos los descriptores (piezas) y las fuentes (los museos o instituciones que nos
proporcionaban estos objetos). El siguiente paso fue el desarrollo de la estructura jerrquica
bsica del tesauro, es decir, determinar las grandes reas temticas (macrocategoras) o familias
semnticas en que quedara dividido. De esta manera se delimit el campo de trabajo y se dis-
tribuy este por reas ms especficas, lo que permiti agrupar los descriptores de forma precisa
en el contexto semntico correspondiente, as como desarrollar las relaciones jerrquicas de
manera precisa. Comenzamos entonces a elaborar las relaciones de jerarqua: Trmino Genrico
(TG) / Trmino Especfico (TE). Para ello se crearon cuatro Trminos Genricos, que agruparan
los TE en cuatro grandes familias: Instrumentos de msica ceremonial y ritual, Mobiliario cultual,
Objetos rituales y ceremoniales y Ornamentos sagrados.
Llegado a este punto, se plante la siguiente dificultad: aunque algunas piezas pertenecan
de manera exclusiva a un culto determinado, muchas otras podan ser utilizadas, prcticamente
con el mismo carcter o funcin, por diferentes cultos; recordemos los contenedores de ofren-
das. As, se decidi crear dos grandes indicadores clasificatorios: comunes y especficos3.

El siguiente paso consisti en crear los indicadores dentro de los cuales pudiramos orga-
nizar los descriptores segn la funcin que tuvieran en sus respectivos cultos; por ejemplo, en
el caso de los objetos relacionados con el animismo.

A lo largo de todos estos aos han sido innumerables los museos, instituciones y, sobre todo, personas las que nos han
2

brindado su apoyo y asesoramiento y que han colaborado con nosotros. Ricardo Olmos (CSIC), Alfonso Rodrguez Guti-
rrez de Ceballos (UAM), Juan Miguel Snchez Vigil (UCM), Pedro Rocamora (Consejo Estatal de las Artes Escnicas y de la
Msica), Juan Antonio Prez Milln (Filmoteca de Castilla y Len), musiclogos como Eduardo Paniagua; arquitectos como
Juan Gimeno o circlogos como Jos A. Gallego; y, por supuesto, tcnicos de museos: Francisco de Santos, Pilar Romero
de Tejada, Araceli Snchez, Ana Verde, Marigel Castellano, Paloma Cabrera, Margarita Moreno Conde, ngela Franco,
Asuncin Cardona, Carolina Miguel, Lorena Delgado, Concha Garca-Hoz, Vctor Cageao y tantos otros sin los cuales jams
hubiramos podido culminar este trabajo.
Los indicadores clasificatorios son en realidad como los cajones de nuestro escritorio, que nos permiten ordenar de manera
3

coherente y precisa nuestras pertenencias, o los archivadores en los que podemos normalizar los distintos expedientes por
fecha correlativa de ingreso o por agrupaciones, lo que facilita y acorta el tiempo de bsqueda.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
88

Por otra parte, los tesauros nos permiten utilizar distintas opciones que evitan el vaco de
informacin. Para ello creamos las relaciones asociativas: Trminos Relacionados (TR). De esta
forma, un objeto clasificado en el culto animista cuya funcin sea la magia o proteccin estar
ligado a otro hinduista con el mismo uso, dando as al investigador la posibilidad de ampliar o
enriquecer el sujeto de su trabajo. A veces puede llegar a sorprender que los inuit de Alaska
tengan las mismas motivaciones para modelar un objeto que los antiguos senadores romanos
cuando protegan a sus hijos con bullae de oro.
Evidentemente, una mscara ceremonial participa de distintas creencias, por lo tanto se
agrupar en el Indicador Clasificatorio Comunes, pero a su vez se le da la opcin al investiga-
dor de encontrar, a travs de ella y de sus Trminos Relacionados, las diferentes mscaras que,
con este mismo carcter, reciben un nombre especfico segn el rito, pueblo o cultura a la que
pertenezcan. La mahkla es una mscara ceremonial protectora del budismo tibetano, como la
ekeke lo es para la cultura fang africana.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
89

As, lo que en un principio nos lleg como un maremgnum de palabras y de objetos, se


fue ordenando de manera jerarquizada y normalizada para que todos y todas podamos recu-
perar nuestros objetos al llamarlos con el mismo nombre, hasta conformar la estructura de la
presentacin del tesauro, ltimo de los pasos de su elaboracin.

De esta forma le pudimos poner de manera correcta sus rostros a nuestros trminos, a
nuestros nombres.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
90

Figura 9. (Izquierda) Kylix. Museo Arqueolgico Nacional, n. inv. 10942; (derecha) Ritn. Museo Arqueolgico Nacional, n. inv. 1999/99/130.

Pero lo novedoso y enriquecedor de este proyecto, que en su da emprendiera la Subdirec-


cin General de Museos Estatales, fue la integracin en el tesauro de un diccionario que permite,
tanto al especialista como al nefito, obtener un conocimiento descriptivo y contextual de cada
uno de los objetos integrantes de cada una de las reas tratadas. De este modo, la aplicacin
nos permite: describir el objeto, contextualizarlo en su nota de alcance, adems de sealar las
citas de las fuentes bibliogrficas utilizadas. Y todo ello acompaado con la riqueza visual de
un anexo grfico.

Figura 10. De izquierda a derecha y de arriba abajo: Mscara Banda, Museo Nacional de Antropologa, n. inv. CE19005; Byeri, Museo
Nacional de Antropologa, n. inv. CE947; Cabeza de Marco Aurelio, Museo Arqueolgico Nacional, n. inv. 2009/36/1; Mscara Mbuya, Museo
Nacional de Antropologa, n. inv. CE11778; Mscara Ngontang, Museo Nacional de Antropologa, n. inv. CE11058; Busto de Antino, Museo
Nacional del Prado, n. inv. E00060.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
91

En cualquier caso, siempre se ha de tener en cuenta, como ya hemos sealado a lo largo


del texto, que un tesauro no es una lista cerrada, es algo vivo, dinmico, que necesita de una
constante actualizacin, en el que se podran incluir los trminos propuestos por los museos o
instituciones a los que este va dirigido, modificarlos o incluso eliminarlos. Se trata de establecer
una herramienta integradora que favorezca la interconexin de sistemas, que sea lo suficiente-
mente amplia en su cobertura y, al mismo tiempo, especfica en la materia como para permitir
conceptualizar una temtica concreta, posibilitando as mejorar la organizacin, la comunicacin
y la difusin de las colecciones del museo. En definitiva, convertirlo, de este modo, en una he-
rramienta til para todos aquellos que tengan la inmensa suerte de trabajar con ellos, con los
objetos, a los que ya conocemos y podemos llamar con su propio nombre y apellidos. Porque
esa es la importancia de cualquier tesauro cuyo fin sea el de conservar, enriquecer y facilitar la
contextualizacin de los bienes culturales: recuperar esos nombres del pasado y los de su filia-
cin, quedando as ya para siempre impresos como parte de nuestra memoria histrica.

Figura 11. Alegora de la atencin. Weiss, Rosario. Museo Nacional del Romanticismo, n. inv. CE7126.

Bibliografa
Harpring, P. (2010): Introduction to Controlled Vocabularies: Terminology for Art, Architecture and
Other Cultural Works. Los ngeles: The Paul Getty Trust.
Nagel,L. (2008): Manual de Registro y Documentacin de Bienes Culturales. Santiago de Chile: Cen-
tro de Documentacin de Bienes Patrimoniales (Dibam).
Nagel,L., y Miller, Ch. (2013): The Tesauro de Arte & Arquitectura and Tesauro Regional Patrimonial:
Tools for Describing and Enhancing Access to Latin American Cultural Resources Online, Getty
Research Journal, n.5. Los ngeles: The Paul Getty Trust, pp. 149-156.

El lenguaje del patrimonio | Pgs. 76-92


La memoria recuperada: la bsqueda del nombre
92

Perrin, J. (1999): Thesaurus des objets religieux du culte catholique. Edicin trilinge: ingls, francs
e italiano. Pars: Editions du Patrimoine.
VV. AA. (2002): Thesaurus multilingue del corredo ecclesiastico. Istituto Centrale per il Catalogo e la
Documentazione.

Webgrafa
Arte & Architecture Thesaurus Nederlandstalig: <http://browser.aat-ned.nl/> [Consulta: 4 de febrero
de 2016].
British Museum: <http://www.collectionstrust.org.uk/assets/thesaurus_bmon/Objintro.htm>.
Centro de Documentacin de Bienes Patrimoniales, Direccin de Bibliotecas, Archivos y Museos
(Dibam): <http://www.aatespanol.cl/taa/publico/buscar.htm> [Consulta: 4 de febrero de 2016].
Historic England, Forum on Information Standards in Heritage (FISH) Thesauri: <http://thesaurus.
historicengland.org.uk/newuser.htm> [Consulta: 4 de febrero de 2016].
Iccd, Istituto Centrale per il Catalogo e la Documentazione: <http://www.iccd.beniculturali.it/index.
php?it/1/home> [Consulta: 4 de febrero de 2016].
Ministre de la Culture et de la Communication: <http://www.culture.fr/Ressources/Bases-du-patrimoine/
(theme)/54944> [Consulta: 4 de febrero de 2016].
Ministerio de Educacin, Cultura y Deporte: <http://tesauros.mecd.es/tesauros/tesauros> [Consulta:
4 de febrero de 2016].
Tesauro Regional Patrimonial de Chile: <http://www.tesauroregional.cl/trp/publico/buscar.htm>
[Consulta: 4 de febrero de 2016].
The Getty Research Institute: <http://getty.edu/research/tools/vocabularies/> [Consulta: 4 de febrero
de 2016]; <http://getty.edu/research/tools/vocabularies/aat/index.html>; [Consulta: 4 de febre-
ro de 2016].
UNESCO: <http://unesdoc.unesco.org> [Consulta: 4 de febrero de 2016].

El lenguaje del patrimonio | Pgs. 76-92


93

Tesauros, vocabularios y listas de control terminolgico.


Fuentes para la construccin de tesauros culturales
Miguel ngel Marzal Garca-Quismondo
Profesor Titular de Biblioteconoma y Documentacin. Universidad Carlos III de Madrid

1. Introduccin
No cabe duda de que las TIC han transformado, y van a revolucionar, todo el entorno humano
en casi todas sus facetas. Entre los proyectos de investigacin que se estn desarrollando en el
Instituto del Futuro de la Humanidad, de la Universidad de Oxford, uno de ellos se denomina
Global Priorities Project (<http://globalprioritiesproject.org/>), cuyo objetivo es reflexionar y
analizar los mayores desafos que en el futuro inmediato amenazan la supervivencia de la huma-
nidad, y al menos dos tienen relacin directa con las TIC: la Inteligencia Artificial con la Rob-
tica y la Nanotecnologa. El modo de aprender, conocer y saber del ser humano, naturalmente,
tambin se ver radicalmente alterado.
Como es bien sabido, en todo proceso cognitivo los datos y la informacin son elementos
primordiales. Para la efectividad de este proceso, ambos elementos necesitan una corporeiza-
cin en un producto u objeto, que son los documentos en soporte material, digital o virtual, de
los que se nutren las unidades de informacin (bibliotecas, archivos, centros de documentacin),
clsicas, hbridas, digitales o virtuales. A veces estos documentos u objetos no solo soportan y
transmiten datos e informacin para conocer y saber, sino que portan valores estticos, erigin-
dose en objetos artsticos, cuya unidad, en este caso, es el museo. Se constituye as una amplia
y variopinta coleccin documental que se proyecta en un patrimonio histrico, artstico y
documental. Precisamente las TIC, tal como venimos argumentando, han alterado la nocin de
documento, con el desarrollo del hipertexto, los hipermedia, la realidad virtual y la aumentada,
pero tambin de forma muy notable al objeto artstico, como demuestra la eclosin del Media
Art, derivado de la convergencia de los medios con los soportes digitales y que utilizan materia-
les y las TIC para crear, presentar y difundir el arte.
La evolucin expuesta ha llevado a plantearse el Museo Virtual, entendido como aquel
que utiliza los medios digitales para mostrar, preservar, diseminar, guardar y reconstruir la cul-
tura material e inmaterial de la humanidad. En el proceso, ha ido emergiendo el concepto, muy

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
94

interesante, de Museografa Web. Es muy importante sealar, adems, que este proceso tambin
est afectando a la evolucin de los archivos y su coleccin documental, que tambin est expe-
rimentando una evolucin hacia la virtualizacin de sus fondos, que precisan de vocabularios
y lenguajes web propios para su comunicacin, difusin y virtualizacin. Este ser el objetivo
de este trabajo.

2. Contexto para las fuentes en la construccin de los lenguajes


documentales: tesauros y cultura
Consecuencia de lo que llevamos argumentado es el creciente inters por la elaboracin y apli-
cacin inteligente de los lenguajes documentales, especialmente el tesauro, sobre la coleccin
de archivos y museos. Caso prototpico ha sido la publicacin el 19 de octubre de 2015 por
parte de CER.ES del Ministerio de Educacin, Cultura y Deportede dos vocabularios para el
patrimonio cultural, elDiccionario de lugares geogrficos y el Diccionario y Tesauro de materias
(<http://tesauros.mecd.es/tesauros>), mediante una versin endatos abiertos enlazados. Voca-
bulario y tesauro nacen con el objetivo de representar por descripcin y catalogacin los bienes
culturales, para ser compartido por la comunidad profesional y cientfica por los datos abiertos,
adems permite enlazar con las colecciones de otras poderosas instituciones, con unos tesauros
y vocabularios sumamente poderosos. Otros museos y archivos estn en un proceso de simila-
res caractersticas y proporciones, como ha quedado de manifiesto en el curso El lenguaje del
patrimonio: Estndares documentales para la descripcin y gestin de colecciones, celebrado en
Njera entre los das 18 y 20 de noviembre de 2015.
Es evidente que el campo de estos proyectos es la Web semntica, el objeto son los do-
cumentos y objetos musesticos, el objetivo es la virtualizacin, y el mtodo, la generacin de
tesauros para su representacin y elaboracin, un mtodo que reclama unas fuentes terminol-
gicas de construccin apropiadas, un proceso de seleccin que debe atender a un contexto con
sus condicionantes, algo fundamental en cualquier sistema de comunicacin.

2.1 El valor en la sociedad del conocimiento

La informacin como materia prima y fuente energtica, un recurso insoslayable dentro de la


economa digital, ha subvertido una de las leyes de bronce del mercado capitalista de oferta
y demanda: si, en este caso, el valor de las cosas tiene como variable bsica la superioridad
de su demanda, convirtindola en escasa, siendo un objeto ms precioso cuanto ms raro y
escaso; en la economa digital el valor de un objeto va en relacin directa con su mayor (uni-
versal) disponibilidad y acceso. Los objetos y documentos de archivo, en este contexto, cuanto
ms representados, visibles y capturables en web ms valiosos se hacen y, con ellos, su museo
y archivo.
Se abre paso con fuerza, pues, la cultura de la evaluacin, impulsando, entre otros as-
pectos, la relevancia del impacto. Todo objeto digital se ve evaluado y medido su valor por la
cantidad de accesos, visitas, referencias, citas que recibe: la unidad de medida es el indicador
y el anlisis de datos se efecta en el contexto de rankings. Cientficos e investigadores deben
permanecer muy atentos a su impacto, de modo que las bibliotecas que los apoyan suelen ofre-
cer un servicio muy elaborado para asegurarse el impacto y gestionarlo para su currculo, visible
en bibliotecas universitarias, caso de la biblioteca de la Universidad Carlos III de Madrid <http://
www.uc3m.es/ss/Satellite/Biblioteca/es/TextoMixta/1371212970020/Indices_de_impacto>.
La comunicacin en medios y la socializacin adquieren as una dimensin nueva y di-
ferente mediante la constitucin de comunidades digitales en torno a un tpico en web, que
tienen como principios bsicos el trabajo y aprendizaje colaborativo, la innovacin y constante
generacin de contenidos mediante las herramientas de la web social (wikis, blogs, folksono-

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
95

mas, etc.). J. Sowa (Sowa, 2000) llegaba as a la nocin de Red Semntica a partir de un sistema
de notaciones grficas que permiten definir un conjunto de relaciones asociativas de trminos
en los textos. La Red Semntica determina la significacin de conceptos, palabras, frases, a travs
de nodos y palabras conceptuales conectadas la una a la otra, un autntico clster semntico,
un modo de adaptarse a las estrategias que el cerebro utiliza para aprender, entre ellas la aso-
ciacin y la mediacin, esta ltima una competencia que trata de transformar algo complejo en
algo ms sencillo de recordar a travs de enlaces, asociaciones y estructuras organizadas, como,
por ejemplo, taxonomas jerrquicas.
Derivacin lgica de las redes semnticas es la Red de Conocimiento, entendida como un
mecanismo y confluencia social de organizaciones o individuos para promover el intercambio
de informacin, compartir tcnicas, metodologa y buenas prcticas de trabajo, cooperar en ac-
ciones propias para la capacitacin, investigacin e innovacin, acumular conocimiento tcito
y explcito basado en la complementariedad y reciprocidad (Malerba et alii, 1999). Para su ms
sano desarrollo, ha ido emergiendo el Conectivismo y sus principios (Siemens, 2010).
El escenario apropiado para la adquisicin e intercambio de conocimiento es la red so-
cial. De acuerdo con la teora de redes sociales, tanto la imbricacin (embeddedness) estructural
como la relacional determinan la estructura de la red y la forma de la transferencia de conoci-
miento. Las redes sociales sin un adiestramiento, una competencia en lectura digital, pueden
tener efectos indeseados (Carr, 2011), como dispersin, hiperactividad o una pobre asimilacin.
En las redes sociales prima la lectura digital de comunicacin, que busca noticias (nunca dis-
cursos), busca tpicos (nunca argumentaciones), busca novedades (nunca una reflexin). No
cabe duda de que la lectura digital en redes reclama sus propias competencias como primar los
conectores del discurso (vnculos, enlaces, navegacin) y generar su propia secuencia lectora
(multisecuencialidad de los hiperdocumentos) etiquetando los tags, etiquetas semnticas del
discurso electrnico, como puede permitirnos el software NodeXL.
Esta constatable evolucin hacia un conocimiento en redes ha tenido tres inmediatos
efectos para su mejor desarrollo: a) para las organizaciones la reputacin en Web, una tcnica
de marketing que busca el modo de proyectar ms y mejor la influencia en la red, convertirse
en autoridad y referencia, as como prevenir tendencias, para lo que existen software utilizables
como Social Mention (<http://www.socialmention.com/>), Whos Talkin (<http://whostalkin.
com/>) o SamePoint (<http://www.genbeta.com/web/samepoint-buscador-de-conversaciones-
en-internet>); b) la identidad digital, que no solo pretende mecanismos para distinguir al
individuo en la red, sino que desarrolla competencias contra la permanencia indeseada de infor-
macin propia en red, as como evitar los excesos de la copia (Cerezo, 2011); c) los marcadores
sociales que, mediante el uso de tags, permiten categorizar la informacin de la web de forma
organizada para luego recuperarla, reutilizarla o compartirla. Sin duda, son efectos que determi-
nan el progreso, caracteres y propiedades de los lenguajes y vocabularios en red.

2.2 La concepcin cambiante de cultura

Otro factor contextual para seleccionar fuentes en la elaboracin de tesauros culturales es, sin
duda, la concepcin de cultura, no desde una perspectiva antropolgica y filosfica (debate
en el que no parece adecuado entrar ahora), sino como dominio para un tesauro, tratndose
adems de un concepto cambiante en esta faceta.
En un contexto terminolgico para la elaboracin de lenguajes documentales web, el
debate se desarrolla desde un planteamiento dicotmico, entre la definicin por binomios bien
diferenciados: a) la distincin entre civilizacin, asentada sobre mentalidades, tradiciones, cate-
goras vitales, y cultura, en tanto que comportamientos, actitudes, manifestaciones y expresio-
nes del espritu; b) la diferencia entre educacin, entendida como la transmisin de principios,
valores y cdigos de conocimientos, deslocalizado y ubicuo, y enseanza, sistema curricular y
reglado de aprendizaje de conocimientos y saberes, bajo el diseo y control de instituciones de

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
96

enseanza; la divisin de conocimiento, como conjunto ordenado y asimilado de conceptos y


nociones cognitivas en la mente del individuo, y saber, que es una manifestacin del conoci-
miento, por su aplicacin para la toma eficaz de decisiones en la resolucin de un problema o
hiptesis determinado en un momento y ambiente concretos.
Desde un anlisis comunicativo, la comunidad cultural, tambin es importante abordar
la alteridad, esto es, la representacin del otro en el contexto comunicativo no solo como tole-
rancia a sus manifestaciones, sino como aceptacin igualitaria, simbitica y sinalagmtica, en un
contexto de globalizacin (Bernab, 2012). El concepto de cultura y su terminologa, por tanto,
se ha enriquecido con las nociones y precisiones de diversidad cultural, como multiplicidad de
expresiones culturales, pluralismo cultural, como instrumento de cohesin social por la diversi-
dad cultural, multiculturalidad por coexistencia diferenciada de diversas culturas en un mismo
espacio, interculturalidad, que da a la cultura un sentido dinmico (no un valor eterno inmu-
table), pues se entiende como la presencia e interaccin equitativa de diversas culturas, con la
posibilidad de generar expresiones culturales compartidas, por medio del dilogo y el respeto
mutuo (Cantle, 2013).

2.3 Dimensin polidrica del contenido en un corpus documental

Tradicionalmente, un texto quedaba manifestado y corporeizado en un documento bajo dis-


tintos soportes y tipologas. Las TIC, sin embargo, fueron aadiendo a esta nocin inicial los
conceptos de documento electrnico, documento digital, documento virtual, hasta llegar al
hipertexto (hipermedia si incorpora cdigos audiovisuales de toda naturaleza) e hiperdocumen-
to, expresin de unos contenidos que nos interesan especialmente a efectos de este trabajo.
Hipertexto puede entenderse como una estructura digital consistente en una red de nodos
interconectados, que contiene conexiones predefinidas con otros documentos, pero su navega-
cin y generacin depende completamente de las necesidades y estrategias de su usuario. Esta
nocin del hipertexto como infraestructura tecnolgica se ve implementada por el concepto
de hiperdocumento, conjunto de documentos digitales soportados por una red hipertextual. El
hiperdocumento sera un conjunto de documentos interconectados con un diseo de volumen
polidrico en el ciberespacio, un objeto digital, utilizado en diferentes contextos y cdigos se-
miticos segn los objetivos, las estrategias y las necesidades del usuario. Esta perspectiva prio-
riza el contenido (el almacenamiento de informacin en documentos digitales, que contienen
nodos), percibiendo el hiperdocumento como una funcin.
El concepto de hiperdocumento apuntado implica su naturaleza dinmica por integrar
textos de diferentes cdigos semiticos, como la escritura, imagen esttica y mvil, y sonido (re-
clama un conjunto de signos que procesen su imagen), as como integrar enlaces e hipervncu-
los a los que remite y por los que es enlazado, como tambin estar compuesto por un conjunto
de tomos o mosaico de informacin digital, que le convierten en reusable. Estas propiedades
hacen que el hiperdocumento precise sus propios signos de representacin, que no son otros
que los metadatos, otorgados en el cdigo fuente o adscritos externamente, as como sus pro-
pios vocabularios derivados de los lenguajes de marcado, a lo que se unen, naturalmente, las
nubes de etiquetas, tags y dems formas de etiquetacin de contenidos en redes sociales (Marzal
y Gonzales, 2010).
Las potencialidades de la edicin en web han ido impulsando con fuerza la inoculacin
de la imagen como elemento semntico fundamental, incorporando un lenguaje icnico por el
desarrollo de la 3D, la realidad virtual y la realidad aumentada. Desde el principio, la virtuali-
dad en web fue una base de datos grficos interactivos, explorable y visualizable en tiempo real
mediante imgenes tridimensionales de sntesis, capaces de provocar la sensacin de inmersin
en la imagen mediante la visin estereoscpica y la propioceptiva. La Realidad Virtual supone
incorporar la simulacin multisensorial para la comprensin de procesos difcilmente visualiza-
bles. Este sistema se ha visto implementado por la Realidad Aumentada, que permite mejorar la

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
97

visin del mundo real recibiendo informacin adicional computerizada sobre el objeto y tarea en
la que est trabajando, lo que implica la fusin de dos imgenes, una proporcionada por el vdeo
en el entorno real y otra proporcionada por una videocmara enfocada al mundo virtual que se
solapa con la imagen captada del mundo real. Sus interesantes aplicaciones se hacen patentes
en software como LearnAr (<http://www.learnar.org/>), Wikitude World Browser (<http://www.
wikitude.com/>), Layar (<https://www.layar.com/>), ARToolkit (<http://artoolkit.org/download-
artoolkit-sdk>), Junaio, entre otros. Los big data estn ampliando con fuerza los horizontes.
Estas potencialidades de edicin en web han impulsado la conversin de los documentos
de archivo y de los objetos musesticos en objetos digitales y virtuales en web, entre otros, lo que
plantea el atractivo desafo de su difusin y diseminacin en el ciberespacio, un desafo que pre-
cisa responder tanto a la representacin en web (cmo se edita y publica el objeto musestico
y documento de archivo), como a la recuperacin (cmo es buscado y cmo capturarlo por los
motores y buscadores en web). El problema, pues, se plantea dentro del mbito de las Ciencias
de la Documentacin, la formulacin, elaboracin y uso de unos vocabularios y lenguajes docu-
mentales que permitan la representacin y la recuperacin de manera apropiada y eficaz. Estos
vocabularios y lenguajes documentales deben responder a los lenguajes de especialidad de los
dominios (archivstico y musestico) donde se aplicarn, por lo que un uso especializado de las
fuentes para su elaboracin es esencial.

3. Campo y objeto para las fuentes terminolgicas en la construccin de


tesauros

3.1 El corpus documental

La edicin de un tesauro necesita un estudio de oportunidad, la determinacin de un domi-


nio bien definido (rea de conocimiento, especialidad, etc.), adscripcin a las normas uni-
versales, por tanto interoperables, de elaboracin (para establecer la forma de presentacin,
partes, extensin, idioma, los tipos de relaciones, visualizacin, uso, gestin y mantenimiento,
tipologas). El tesauro, en tanto que lenguaje documental convencional, arbitrario, coherente,
postcoordinado, subidiomtico, comienza con un inflexible diseo apriorstico. Esta naturaleza,
que le convierte en un poderossimo lenguaje documental, se asienta sobre un elemento esen-
cial: el descriptor.
El descriptor es la parte sustantiva en la definicin del tesauro, porque es producto de una
metdica depuracin semntica para su ptima efectividad en la recuperacin y representacin
de contenidos. La depuracin semntica reconoce unas fases para la relevancia y pertinencia
semnticas: los textos son la suma de palabras, que sometidas a un anlisis de especificidad
semntica en un contexto determinado, permite establecer cules son las palabras semntica-
mente ricas, que son categorizadas en asociaciones o clsteres semnticos. Cada clster queda
representado por una palabra y as se convierte en palabra clave. Cuando esta palabra clave,
sometida a un proceso de homologacin y normalizacin, es interpretada bajo el prisma de
lenguajes de especialidad de un dominio determinado (glosarios, diccionarios, enciclopedias,
etc.), se convierte en trmino de indizacin. Por fin, cuando estos trminos de indizacin se ven
sometidos a las reglas anteriormente apuntadas para la elaboracin de tesauros, pero sobre todo
se les dota de unas relaciones fijas y bien definidas, entonces llegamos al descriptor.
Este proceso, sin embargo, es un esfuerzo metdico que acometen los documentalistas
desde sus tcnicas, pero, por la misma razn, su funcionalidad no se hace visible a los usuarios
y se origina una brecha entre la funcionalidad que tienen las listas terminolgicas para unos y
otros, lo que ha provocado una tendencia a determinar con eficacia la funcionalidad semntica
en KO (Organizacin del Conocimiento) de listas de trminos, taxonomas, tesauros y ontologas
(Pieterse y Kourie, 2014).

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
98

De otro lado, el proceso de depuracin semntica para lograr la coherencia del lenguaje
mediante el control de vocabulario ha debido adaptarse, necesariamente, a la estructura hori-
zontal y asociativa de la web. Si el mtodo antes reposaba ms en un sistema jerrquico, ahora
se ensayan modos ms conectivistas a travs de un listado de palabras clave y trminos, que se
convierten en el fundamento de un tesauro, y solo despus los descriptores pueden ser enlaza-
dos por metadatos con los cdigos de la CDU, lenguaje clasificatorio por excelencia (Von Doorn
y Polman, 2010).
El corpus documental como materia prima para la elaboracin de lenguajes documentales
tambin ha tenido que al valor de estos lenguajes en la web social y web semntica, especial-
mente referido a tres funcionalidades: a) la atencin fundamental a las estrategias de bsqueda
del usuario (pieza clave en la web), lo que ha llevado a una presencia cada vez mayor del len-
guaje natural (por la facilidad de uso) por su mayor eficacia a causa de las TIC, pero tambin
ha llevado a considerar las bsquedas como una expresin de comportamiento, por lo que se
hacen muy relevantes los anlisis y estudios de las consultas como pilar para las bsquedas
semnticas (Sancho; Fernndez y Boulat, 2012); b) la evolucin de los lenguajes documentales,
entre ellos, el tesauro, desde su carcter de instrumento para recuperar informacin a recuperar
conocimiento mediante un adecuado control de la gestin de los contenidos digitales ( Junior;
Carvalho y Azevedo, 2013); c) la expansin de la reusabilidad de los objetos digitales en web,
para lo que necesitan instrumentos adecuados en lenguajes documentales, razn por la que su
elaboracin va derivando desde la palabra convertida en trmino-descriptor a la extractacin de
los contenidos digitales basndose en la frase como elemento bsico del lenguaje documental,
y, con este sesgo, surgen herramientas como GenEx, MLP, KP-Miner o KEA (Martn-Moncunill;
Garca-Barriocanal; Sicilia y Snchez-Alonso, 2015).

3.2 Los lenguajes del corpus

Algo que determina a los lenguajes documentales en general y a los tesauros en particular es
su referencia a un dominio para su uso y aplicacin; por ello, para la seleccin terminolgica
a partir del corpus, son por tanto muy tiles las lenguas de especialidad, esto es, el lenguaje
que es propio de un rea de conocimiento o profesin, cuyos trminos pueden derivar de la
lengua natural, pero que en esa rea tienen una semntica especfica. Estas lenguas aluden
al lenguaje especfico que utilizan los profesionales y expertos para transmitir informacin y,
cuando es preciso, para refinar los trminos, los conceptos y los saberes de una determinada
rea de conocimiento, confirmando los ya existentes, matizando el mbito de su aplicacin
o modificndolos total o parcialmente; son, por tanto, variedades de una determinada lengua
destinadas a cumplir un fin comunicativo en un marco profesional o acadmico concreto
(Var, 2006). Tienen como principales caracteres: a) un vocabulario muy singular; b) unas
tendencias sintcticas y estilsticas muy idiosincrsicas; c) unos gneros profesionales propios
e inconfundibles.
Las lenguas de especialidad, dentro del mtodo de transformacin de las palabras clave a
trmino y su preparacin y depuracin semntica hacia descriptor, cumplen dos funcionalidades
muy relevantes: su poder de desambiguacin, ya que permiten establecer una relacin semn-
tica biunvoca muy poderosa entre la nocin-concepto y una voz-palabra; y, dependiendo de
la lengua de especialidad, la determinacin de las reas o zonas de mayor densidad semntica
dentro de la organizacin de un texto.
La argumentacin textual, modo de organizar el mapa mental del autor reflejado en un
texto, junto con el valor indudable del anlisis de los conectores de discurso, precisa detenerse
en un anlisis apropiado del discurso electrnico, con su propia sintaxis y gramtica, derivadas
tambin de los requisitos tecnolgicos en las conexiones del discurso, en el que sus actores se
comunican en entornos digitales, dentro de los que adems el discurso incorpora imgenes au-
diovisuales, en su ms lata tipologa (Celis, 2012).

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
99

Esta percepcin del discurso electrnico inclusiva de imgenes audiovisuales ha hecho


considerar desde la ptica de la lingstica de Corpus al iconismo, el lenguaje icnico y su lec-
tura propia. La lectura icnica es aquella que se practica sobre el hipermedio, entendido como
aquel hiperdocumento cuya estructura hipertextual asocia imgenes en todas sus manifestacio-
nes as como sonidos. La lectura icnica se orienta a comprender, asimilar, conocer y aprender
en red su discurso visual, en el que coexisten distintos cdigos semiticos y no solo el textual.
El corpus y sus lenguajes deben ampliarse, pues, a la eclosin y desarrollo de imgenes 3D,
YouTube, Realidad Virtual y Aumentada, GIS y otros entornos emergentes donde la imagen y
sonido son los vehculos bsicos (incluso privativos) de los contenidos y conocimiento. Sobre
el impacto de esta nueva lectura y entornos existen estudios interesantes, como los llevados a
cabo por C. Ramn en 2014 en su tesis doctoral, L. Martnes en 2012 y E. G. Insuasty (2013), una
interesante reflexin, recogida en su tesis doctoral, sobre la inoculacin de esta lectura en los
objetos de aprendizaje y, por ende, en la obtencin de conocimiento.
Los contenidos digitales se convierten tambin en contenidos digitales icnicos, donde la
imagen y sonido no apoyan (o no solo) al texto escrito, sino que la imagen audiovisual es el
texto. Se hacen necesarios, entonces, nuevos modos para etiquetar semnticamente estos conte-
nidos para representarlos, identificarlos, recuperarlos y extractarlos, configurndose en un len-
guaje documental especfico. Las tcnicas documentales han debido evolucionar rpidamente,
desde los mtodos de anlisis de la imagen en el texto propios del anlisis de contenido, que
reconoca un nivel identificativo (soporte, formato, extensin, presentacin, luz, color, plano, n-
gulo, posicin, derechos), un nivel descriptivo (contenido, descripcin onomstica, toponmica
y de materia), y otro nivel interpretativo con los mismos tems del descriptivo pero desde una
perspectiva de anlisis contextual.
Un paso adelante, para el tratamiento educativo de la imagen la dara, en 1999, J. A. Or-
tega, en La alfabetizacin visual y su incidencia en el desarrollo de capacidades perceptivo-
cognitivas, donde estableca un anlisis cognitivo de la imagen a partir del reconocimiento de
cinco niveles de tratamiento: morfolgico (percepcin), morfosintctico (reconocimiento de sus
elementos), semntico (interpretativo), esttico y tico. Un salto cualitativo muy importante lo
dieron Gmez Daz y Agustn Lacruz (2010), cuando propusieron el tratamiento de la imagen
desde un punto de vista documentalista, esto es, reconocer las capacidades y habilidades
necesarias para tratar y comprender la imagen, en tanto que elementos alfabetizadores, como
fundamento de conocimiento en la nueva sociedad y educacin competencial. Profesionales y
sus asociaciones, sea el caso de la Association of College & Research Libraries (ACRL), acusaran
recibo del nacimiento de un nuevo compendio de tcnicas y capacidades para el anlisis y tra-
tamiento de la imagen, la Visual Literacy, para las que editara en 2011 las Visual Literacy Com-
petency Standards for Higher Education, con definicin de las normas y de indicadores ad hoc.

3.3 Fuentes vehiculares para la construccin de tesauros

En Anlisis Documental siempre ha existido el debate sobre ventajas e inconvenientes del uso
de herramientas de control terminolgico para generar un lenguaje documental, o la aplicacin
del lenguaje natural, tratado con las nuevas posibilidades que ofrecen las TIC. Este debate se ha
desplazado tambin a la construccin de tesauros en la web. En este debate, sin ser en modo
alguno exclusivos tal como evolucionan las herramientas, se proponen dos vehculos muy tiles
en esta construccin. La Terminologa y el Procesamiento de Lenguaje Natural (PLN).
Los tesauros precisan de un sistema de significacin cuyos elementos son un lxico (con
trminos depurados), una red paradigmtica (con relaciones esenciales y estables entre los descrip-
tores) y una red sintagmtica (con unas relaciones contingentes destinadas a coordinar descripto-
res). La Terminologa se muestra como un ptimo instrumento para la eleccin de palabras clave
y su evolucin a descriptor (por mtodo de depuracin semntica), la organizacin de los ele-
mentos y redes indicados, de estructuras funcionales de concepto, segn aporta D. Fraga en 2011.

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
100

En palabras de M. Cabr (2000), la Terminologa cumple una doble funcin: representar el conoci-
miento mediante el trabajo descriptivo (ilustracin del discurso) y transmitirlo mediante el trabajo
prescriptivo (garantiza unidades unvocas de expresin y comunicacin). Una mirada ms reciente
y con un sesgo interesante hacia la garanta y la cultura como vectores de la Terminologa en la
Organizacin del Conocimiento lo ofrece M. Barit (2011).
Un uso eficaz del lenguaje natural lo proporciona el Procesamiento de Lenguaje Natural,
entendido como un conjunto de modelos e investigaciones cuyo objetivo es generar instrumentos
de lenguajes documentales capaces de reconocer el lenguaje natural. Su punto de partida es la
definicin de la Lingstica de Corpus, que selecciona una muestra de la lengua a la que se dota
de objetivos definidos, mediante el etiquetado (evidencia morfosintctica), parentizado (evidencia
de sus constituyentes sintcticos) y anlisis (evidencia de sus relaciones sintcticas). Para este come-
tido el PLN acude a tcnicas de ingeniera lingstica orientadas a la desambiguacin y al anlisis
sintctico, atendiendo a: la morfologa, por medio de un analizador morfolgico con definicin
de tagsets (sistema de etiquetas) y de un desambiguador basado en reglas o estadsticas; a la sin-
taxis, bien por analizadores sintcticos parciales o superficiales (chunkers), bien por analizadores
sintcticos completos en treebank; a las redes semnticas para interpretacin de sentidos mediante
ontologas o fuentes lxicas, una dimensin para la que ha tenido una funcin primordial WordNet.
El origen de WordNet se sita en las teoras psicoanalticas y los principios de la Psicolin-
gstica, que buscaban fundamentar un modelo y una base de datos lxico-conceptual, consti-
tuidos tanto por unidades lxicas como por las relaciones entre ellas y estructurados en forma
de red semntica relacional, cuyo objetivo era generar un instrumento idneo para la desambi-
guacin de significados, el etiquetado semntico y la recuperacin de informacin. WordNet se
comporta como una diccionario digital, que integra trminos, bien sean simples o compuestos,
organizados en agrupaciones de sinnimos denominados synsets de glosas, insertando cada
clase de trminos en una glosa definicional. WordNet ha desarrollado una conectividad en tres
sentidos: nominalizaciones, mediante el enlace a pares, morfolgica y semnticamente, entre
sustantivos y verbos; desambiguacin de trminos mediante synsets; organizacin clusterizada
de tpicos, relacionando sentidos de palabras. Cada trmino tiene una breve descripcin y en
ocasiones una frase relacionada que muestra su empleo. Esta frase procede del Brown Corpus.
En funcin del nmero de significados diferentes que tiene un trmino, hace un recuento deno-
minado recuento de la polisemia.
La funcionalidad y tiles aplicaciones de WordNet proceden de su estructura en red lxica,
con un alto nmero de relaciones entre trminos y entre synsets: a) Relacin Temtica a partir de
grandes agrupamientos por temas; b) Relacin de equivalencia mediante relacin entre trminos
sinnimos (synsets) y relaciones de similitud (permite obtener los synsets ms parecidos y los
synsets ms frecuentemente relacionados con determinado trmino; c) Relaciones de jerarqua
entre synsets por hiperonimia, hiponimia, meronimia y holonimia. WordNet incorpora como
trminos no solo al sustantivo, sino tambin a los adjetivos y, algo sumamente importante en la
etiquetacin de imgenes mviles, los verbos.
Estas funcionalidades han sugerido a WordNet como instrumento para la construccin au-
tomtica de tesauros, bien basados en la co-ocurrencia por identificacin estadstica automtica
de relaciones semnticas, bien basados en la asociacin predicado-argumento, identificando las
palabras ms significativas de un entorno (predicado) y aquellas con las que se relaciona para
ser argumentadas. En todo caso, la desambiguacin es la ms abundante y variada aplicacin de
WordNet (Morato; Marzal; Llorens y Moreiro, 2004).
WordNet tambin est teniendo una importante aplicacin en el desarrollo de tesauros
visuales, como Visual Thesaurus (https://www.visualthesaurus.com/) para apoyar su sistema
de navegacin. Existen ya experiencias de uso de WordNet para apoyar tesauros cuyo objetivo
es una indexacin para recuperacin eficaz de repositorios audiovisuales (Hollink; Malais y
Schreiber, 2010), as como estudios sobre el modo de implementar la asociatividad de lenguajes
tan jerrquicos como los tesauros con el apoyo de WordNet (Ali Hadj Taleb; Ben Aouicha y Ben
Hamadou, 2014).

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
101

El desarrollo y aplicaciones del fenmeno de las redes sociales ha impulsado tambin la


eclosin de la etiquetacin social en las redes sociales, siendo particularmente tiles las taxo-
nomas y folksonomas. En definicin de M. Centelles (2005): Una taxonoma es un tipo de
vocabulario controlado en que todos los trminos estn conectados mediante algn modelo
estructural (jerrquico, arbreo, facetado...) y especialmente orientado a los sistemas de na-
vegacin, organizacin y bsqueda de contenidos de los sitios web. Las taxonomas son, por
tanto, un sistema de clasificacin que permite agrupar un conjunto de trminos dentro de unas
categoras predefinidas, contenidas unas en otras o relacionadas. Las folksonomas implican una
categorizacin colaborativa mediante etiquetas simples, sin jerarquas ni relaciones previamente
establecidas, cuyo primer objetivo es realizar bsquedas particularmente activas en las redes
sociales, debido precisamente al etiquetado colaborativo y de iniciativa individual del usuario.
Las folksonomas generan un vocabulario muy apto y adaptado a la naturaleza de los hiperdo-
cumentos en su ms lato sentido y carcter, en su representacin, pero para la recuperacin no
supera el grave inconveniente de la absoluta ambigedad semntica.

4. La indizacin como fuente terminolgica en la construccin de tesauros


Establecido y tratado el corpus, la depuracin semntica al descriptor, debe proceder necesaria-
mente del trmino, un producto de la indizacin, proceso y mtodo que se convierte en muy
relevante para la construccin de tesauros.
La aplicacin de los tesauros en web obliga a reubicar las fuentes de indizacin para su
construccin, dentro de un nuevo mapa semntico, en atencin a distintas dimensiones que
debe contemplar la funcionalidad de los tesauros en web:
Una adaptacin a la horizontalidad, por enlaces y vnculos hiperdocumentales, por lo que
hay una redefinicin de las tres categoras de relaciones jerrquicas reconocidas en los
tesauros (Alexiev; Isac y Lindenthal, 2015).
La incorporacin de la multisecuencialidad en los dominios, mediante el mtodo de enu-
merar clasificatoriamente las caractersticas de contenido, para definir una estructura ter-
minolgica dentro de un dominio (Gubanov; Makarenco y Novikov, 2014).
La adaptacin a etiquetar la dinamicidad y asociatividad de las etiquetas de los contenidos
a travs de verbos (Macura y Lima, 2014).
La socializacin en la definicin de etiquetas y trminos, candidatos a descriptores, me-
diante el desarrollo de clsteres semnticos y participacin societaria de la comunidad de
usuarios (Gibert; Valls y Batet, 2014).
En entornos web, la construccin de tesauros deben desarrollar los mecanismos necesarios
para acometer la actualizacin del control de su corpus documental, tendiendo a fortalecer
su efectividad por medio de la cooperacin con otros lenguajes documentales a travs de
la interoperabilidad de sus elementos (Neelameghan y Lalitha, 2013).
La explosin de los datos en la web y su identificacin mediante metadatos, el fenmeno
denominado big data, que exigen un adecuado tratamiento y disponibilidad, en aras de la
transparencia en la gestin administrativa y de entidades mediante una adecuada gestin
de contenidos digitales, un desafo al que se intenta dar respuesta con la inclusin de vo-
cabularios controlados y tesauros, capaces de anotar los contenidos y generar metadatos
(Wright; Harrison y Whatkins, 2015).

Los procesos de indizacin, evidentemente la automtica, para la construccin de tesau-


ros tambin se adaptan a estas nuevas tendencias. Junto con modelos lingsticos y complejos
procesos de automatizacin mediante modelos cognitivos, de representacin vectorial o redes
neuronales, la Indizacin Automtica pivotaba preferentemente sobre modelos de represen-
tacin probabilstica, como la Indizacin Estadstica de Trminos por Frecuencias o IDF. Es un
sistema de filtrado basado en la ley de Zipf, que establece que las palabras de mayor frecuencia

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
102

no suelen ser significativas, ya que la importancia de un trmino es proporcional a la frecuen-


cia de ocurrencia en el documento e inversamente proporcional al nmero de documentos en
que aparece. Esta tcnica se complementa con el Mtodo N-grams, que calcula la frecuencia no
sobre cada trmino o palabra compuesta, sino con cadenas de caracteres de longitud prede-
terminada y fija. Para lograr la obtencin de relaciones se aplicaban los Clasificadores ciencio-
mtricos, mediante el mtodo de Chen, que analiza el uso de grupos de palabras que aparecen
simultneamente en varios documentos, como tambin el mtodo Algoritmos K-vecinos, que
consiste en mover cada vector al clster cuyo centroide est ms cercano y actualizar despus
los centroides de los clsteres.
Surgen, por tanto, tanto herramientas para indizacin, como motores de bsqueda apo-
yados en sistemas de indizacin que, a las funcionalidades arriba anotadas, unen otras confor-
me a los nuevos requisitos. Es el caso de Carrot2, un motor de bsqueda cuya recuperacin
de recursos de informacin adquiere una semblanza de Google, y para refinar las bsquedas
ofrece unos clsteres de trminos, as como permite una visualizacin de resultados por im-
genes (<http://search.carrot2.org/stable/search>); un sistema de indizacin automtica, Aduna
AutoFocus (<http://www.iskouk.org/sites/default/files/aduna.pdf>), que permite una indiza-
cin probabilstica, pero categoriza los resultados por propiedades, casi hipertextuales, y po-
sibilita recuperar mediante la visualizacin de clsteres y enlaces; sistemas para el tratamiento
automatizado de los textos que producen y visualizan los trminos resultantes, en una red
semntica, como un mapa semntico visual, destacando fundamentalmente la asociatividad
y creacin de redes semnticas, caso de Textexture (<http://textexture.com/>) o Gephi, ms
complejo y polifactico en su aplicacin (<https://gephi.org/>). El control de tendencias y
usos de etiquetas y trminos en redes sociales tambin parece ser un factor muy relevante,
para el que pueden ser especialmente tiles herramientas como NodeXL (<https://nodexl.
codeplex.com/>).
Las tendencias en los requisitos solicitados para las fuentes de construccin de tesauros
se ven reforzadas, sin duda, por las aplicaciones ms diversas y polifacticas de los tesauros
en la web: se convierten en una herramienta muy til para la navegacin (tesauro USGS,
<http://www.usgs.gov/>), como herramienta de etiquetacin y recuperaciones integradas
de textos e imgenes, muy positivas para museos (como el Virtual Museum of Pacific, <http://
australianmuseum.net.au/blogpost/science-bytes/virtual-museum-of-the-pacific>), como ex-
celentes instrumentos en gestin de contenidos digitales, por su exportacin a la web para
bibliotecas digitales y virtuales (como Tematres, o de Omnigator en el caso de su apoyo como
topic map).
Es especialmente interesante la evolucin aplicativa de los tesauros a modo de lenguaje
documental icnico idneo, como atestigua la investigacin, que sigue tres lneas:
La anotacin de imgenes por etiquetacin social, un crowfounding terminolgico, es-
pecialmente efectivo en las recuperaciones (Ionescu; Popescu; Radu; Mller, 2014). Esta
etiquetacin en socialmedia y en el contexto evolutivo de la Web, reclama que las anota-
ciones sean enlazadas, razn por la que existen ya algunas experiencias para un linked
tag, como sistema semiautomtico de anotacin enlazada (Im; Park, 2014), reforzando as
la tendencia en hacer eficaz la comparticin de informacin de imgenes que proporcio-
nan las folksonomas ( Jeong; Hong y Lee, 2013).
La construccin de un lenguaje visual, capaz de lograr un alto nivel de representacin,
mediante una analoga con el sistema de recuperacin textual (El-Sayad; Martinet; Urruty
y Djeraba, 2012).
Una va muy interesante para la etiquetacin de vdeos, especialmente interesante por el
menudeo de tutoriales, visitas virtuales, YouTube y el auge del fenmeno de la Khan Aca-
demy, para un uso didctico de los vdeos de YouTube (Rudinac; Larson y Hanjalic, 2012).

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
103

Bibliografa
Alexiev, V.; Isac, A., y Lindenthal, J. (2015): On Compositionality ISO 25964 Hierearchical Relation-
ships (BTG, BTP, BTI), en Networked Knowledge Organization Systems (NKOS) Workshop.
Londres: DL2014 Conference.
Ali Hadj Taleb, M.; Ben Aouicha, M., y Ben Hamadou, A. (2014): A new semantic relatedness measu-
rement using WordNet features, Knowledge Information Systems, 41, pp. 467-497.
Barit, M. (2011): La garanta cultural como justificacin en sistemas de organizacin del conoci-
miento: aproximacin crtica, Palabra Clave, 1 (1), pp. 2-11.
Bernab, M. (2012): Pluriculturalidad, multiculturalidad e interculturalidad, conocimientos necesarios
para la labor docente, Revista Educativa Hekademos, n. 11, pp. 67-76.
Cabr Castellv, M. (2000): Terminologa y Documentacin, en Documentacin, Terminologa y
Traduccin. Edicin de C. Gonzalo Garca. Madrid: Sntesis, pp. 31-82.
Cantle, T. (2013): Interculturalism as a new narrative for the era of globalisation and super-diversity,
en Interculturalism and multiculturalism: similutudes and differences. Edicin de M. Barrett.
Estrasburgo: Consejo de Europa.
Carr, N. (2011): Superficiales: Qu est haciendo Internet con nuestras mentes? Madrid: Taurus.
Celis, M. A. (2012): Patrones de comportamiento lingstico en el discurso electrnico, una aproxi-
macin terico-prctica con el anlisis de dos obras literarias hipertextuales: Gabriella Infinita
de Jaime Alejandro Rodrguez y Tierra de Extraccin de Domnico Chiappe. [Tesis Doctoral
indita]. Ciudad Real: Universidad de Catilla-La Mancha (Facultad de Letras).
Centelles, M. (2005): Taxonomas para la categorizacin y la organizacin de la informacin en sitios
web, Hipertext.net, 3, [en lnea]: <https://www.upf.edu/hipertextnet/numero-3/taxonomias.
html>. [Consulta: 9 de marzo de 2016].
Cerezo (2011): Identidad digital y reputacin online, Cuadernos de Comunicacin Evoca, n. 5,
<http://www.evocaimagen.com/cuadernos/cuadernos5.pdf>. [Consulta: 22 de febrero de 2016].
Doorn, M. von, y Polman, K. (2010): From Classification to Thesaurus and back? Subject Indexing Tools
at de Library oh the Afrika-Studiecentrum Leiden, Knowledge Organization, 37 (3), pp. 203-208.
El-Sayad, I.; Martinet, J.; Urruty, T., y Djeraba, Ch., (2012): Toward a higher level visual representa-
tion for content-based image retrieval, Multimedia Tools and Applications, 60 (2), pp. 455-482.
Gibert, K.; Valls, A., y Batet, M. (2014): Introducing semantic variables in mixed distance measures:
Impact on hierarchical clustering, Konowledge Information Systems, 40, pp. 559-593.
Gmez Daz, R., y Agustn Lacruz, M. C. (eds.) (2010): Polisemias visuales. Aproximaciones a la alfabe-
tizacin visual en la sociedad intercultural. Salamanca: Ediciones Universidad de Salamanca.
Gubanov, D. A; Makarenco, A. V., y Novikov, D. A. (2014): Analysis methods for the terminological
structure of a Subject area, Automation and Remote Control, 75 (12), pp. 2231-2247.
Hollink, L.; Malais, V., y Schreiber, G. (2010): Thesaurus enrichment for query expansion in audio-
visual archives, Multimedia Tools and Applications, 49 (1), pp. 235-257.
Im, D-H, y Park, G-D. (2015): Linked tag: image annotation using semantic relationships between
image tags, Multimedia Tools and Applications, 74, pp. 2273-2287.
Insuasty, E. G. (2013): Lectura y lecturabilidad icnica en objetos de aprendizaje soportados por
plataformas virtuales, Teoria de la educacion, 25 (1), pp. 239-241.
Ionescu, B.; Popescu, A.; Radu, A., y Mller, H. (2014): Result diversification in social image retrieval:
a benchmarking framework, Multimedia Tools and Applications, 75 (2), pp. 1301-1331.

El lenguaje del patrimonio | Pgs. 93-104


Tesauros, vocabularios y listas de control terminolgico
104

Jeong, J-W; Hong, H-K., y Lee, D-H. (2013): I-TagRanker: an efficient tag ranking system for image
sharing and retrieval using the semantic relationships between tags, Multimedia Tools and
Applications, 62, pp. 451-468.
Junior, J.; Carvalho, R., y Azevedo, A. (2013): Da recuperaao da informao recuperao do con-
hecimento: refelxoes e propostas, Perspectivas em Ciencia da Informaao, 18 (4), pp. 2-17.
Macura, B. C.; Lima, G.A.B.O. (2014): Relacionamentos em tesauros: o valor semntico dos verbos,
Perspectivas em Ciencia da Informaao, 19 (4), pp. 182-201.
Malerba, F.; Nelson, F.; Orsenigo, L., y Winter, S. (1999): History friendly models of industry evolu-
tion: the computer industry, Industrial and Corporate Change, 8 (1), pp. 3-40.
Martn-Moncunill, D.; Garca-Barriocanal, E.; Sicilia, M. A. Y Snchez-Alonso, S. (2015): Evaluating
the Practical Applicability of Thesaurus-Based Keyphrase Extraction in the Agricultural Do-
main: Insights from the VOA3R Project, Knowledge Organization, 42 (2), pp. 76-89.
Marzal, M. A., y Gonzales, A. (2010): Del documento al hiperdocumento: una visin funcional de
un concepto en evolucin. Revista Signo y Pensamiento, vol. 29, n. 57, pp. 84-99.
Morato, J; Marzal, M. A; Llorns, J., y Moreiro, J. (2004): WordNet applications, en GWC 2004: Pro-
ceedings of the Second International WordNet Conference. Edicin de P. Sojka; K. Pala; P. Smrz;
Ch. Fellbaum Y P. Vossen. Brno: Masaryk University, pp. 270-278.
Neelameghan, A., y Lalitha, S. K. (2013): Multilingual Thesaurus and Interoperability, Journal of
Library and Information Technology, 33 (4), pp. 289-294.
Pieterse, V., y Kourie, D. G. (2014): Lists, Taxonomies, Lattices, Thesauri and Ontologies: Paving a
Pathway through a Terminological Jungle, Knowledge Organization, 41 (3), pp. 217-229.
Rudinac, S.; Larson, M., y Hanjalic, A. (2012): Leveraging visual concepts and query performance
prediction for semantic-theme-basic video retrieval, Multimedia Tools and Applications, 1,
pp. 263-280.
Sancho, A.; Fernndez, C., y Boulat, P. (2012): La bsqueda de informacin jurdica: de los tesauros
a la inteligencia artificial, Scire, 18 (1), pp. 73-83.
Siemens, G. (2010): Conociendo el Conocimiento. [s. l.]: Nodos Ele.
Sowa, J. (2000): Knowledge Representation: Logical, Philosophical and Computational Foundatios.
Pacific Grove: Brooks-Cole.
Var, E. A. (2006): La sociedad del conocimiento, marco de las lenguas profesionales y acadmicas,
Las lenguas profesionales y acadmicas. Barcelona: Ariel, pp. 3-12.
Wright, D.; Harrison, K., y Whatkins, J. (2015): Automated tagging of environmental data using a
novel SKOS formatted environmental thesaurus, Earth Science Information, 8, pp. 103-110.

El lenguaje del patrimonio | Pgs. 93-104


105

Una ontologa para la gestin del conocimiento: el


Tesauro de la UNESCO y su aplicacin en el Portal sobre
Aprendizaje Learning Portal del Instituto Internacional de
Planeamiento de la Educacin de la UNESCO
Asuncin Valderrama Pareja
UNESCO - Instituto Internacional de Planeamiento de la Educacin

Cuando en 1946 se crea la UNESCO, la humanidad acaba de salir de uno de los peores conflictos
de su larga historia. En noviembre de 1945, justamente al concluir la guerra, una Conferencia
de las Naciones Unidas para el establecimiento de una organizacin educativa y cultural (ECO/
CONF) rene a los representantes de unos 40 Estados. Con el impulso de Francia y del Reino
Unido, dos pases muy afectados por el conflicto, los delegados deciden crear una organiza-
cin destinada a instituir una verdadera cultura de paz. Dentro de su espritu, esta nueva orga-
nizacin debe establecer la solidaridad intelectual y moral de la humanidad y, de esta manera,
impedir que se desencadene una nueva guerra mundial.
En el momento de su creacin la UNESCO va a recibir un amplsimo mandato, el de
Contribuir a la conservacin de la paz y de la seguridad estrechando, mediante la educacin, la
ciencia y la cultura, la colaboracin entre las naciones con el fin de asegurar el respeto universal
de la justicia, de la ley, de los derechos humanos y de las libertades fundamentales para todos,
sin distincin de raza, de sexo, de idioma o de religin, que la Carta de las Naciones Unidas
reconoce a todos los pueblos. Este mandato queda resumido en el prembulo de su Constitu-
cin: Puesto que las guerras nacen en la mente de los hombres, es en la mente de los hombres
donde deben erigirse los baluartes de la paz.
Durante sus setenta aos de existencia la UNESCO ha funcionado como un laboratorio
de ideas, un organismo normativo para lograr acuerdos mundiales en temas ticos, un centro de
intercambio de informacin, un organismo de desarrollo de capacidades en los Estados miem-
bros y un catalizador de la cooperacin internacional. Se han aadido a su mandato inicial las
ciencias sociales y humanas as como la comunicacin y la informacin. Su misin hoy consiste
en contribuir a la consolidacin de la paz, la erradicacin de la pobreza, el desarrollo soste-
nible y el dilogo intercultural mediante la educacin, las ciencias, la cultura, la comunicacin y
la informacin. La Organizacin se centra particularmente en dos grandes prioridades: frica y la
igualdad entre hombres y mujeres; y en una serie de objetivos globales: lograr la educacin de

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
106

calidad para todos y el aprendizaje a lo largo de toda la vida; movilizar el conocimiento cientfico
y las polticas relativas a la ciencia con miras al desarrollo sostenible; abordar los nuevos pro-
blemas ticos y sociales; promover la diversidad cultural, el dilogo intercultural y una cultura
de paz; construir sociedades del conocimiento integradoras recurriendo a la informacin y la
comunicacin.
Es interesante observar cmo en un plazo tan corto (si lo comparamos con la historia
secular de las instituciones culturales representadas en este curso) los trminos que se han ido
utilizando al cabo de los aos para definir la misin de la UNESCO se han ido modificando
para adaptarse a los cambios de la sociedad. Las referencias al desarrollo sostenible y al dilogo
intercultural son una clara muestra de esta evolucin as como las metas de la erradicacin de
la pobreza o de la igualdad entre hombres y mujeres. En 1946 estas realidades ya existan pero,
o no se tena conciencia de ellas (como en el caso del desarrollo sostenible), o no se les daba
la misma importancia (la igualdad entre hombres y mujeres es una de las dos prioridades de la
Organizacin, mientras que la mencin sin distincin de sexo no es ms que una distincin
entre otras en 1946), o no se imaginaba siquiera que se pudieran alcanzar (como en el caso
de la erradicacin de la pobreza). El elemento que no ha variado es la cobertura geogrfica,
que desde el principio fue la mundial, y la pluralidad de temas cubiertos por el mandato de la
UNESCO, que ha ido incluso aumentando conforme se le aadan nuevas reas, como la comu-
nicacin y las ciencias de la informacin1.

El Tesauro de la UNESCO
Para poder describir los documentos generados por la UNESCO, se necesita un vocabulario
enciclopdico y elaborado desde un punto de vista internacional e intercultural. A partir de
1969 se recopil una lista de descriptores no estructurada partiendo de trminos seleccionados
en el Macrotesauro de la OCDE y en los documentos fundamentales de la UNESCO. Esta lista
constituy la base de la edicin provisional del Tesauro de la UNESCO, que se termin de ela-
borar en abril de 1974 y que contaba con unos 5000 trminos. Se reparti esta lista entre los
especialistas de los distintos programas, que, como era de esperar por parte de especialistas
para quienes su materia nunca queda lo suficientemente bien reflejada, la ampliaron conside-
rablemente hacindole alcanzar unos 11500 trminos. La primera edicin se public en ingls
en 1977, en francs en 1983 y en espaol en 1984; pero la evolucin rpida de la terminologa
empleada en los documentos y las necesidades de los usuarios (cuyo nmero iba creciendo a
la vez que se diversificaba su origen) llevaron a revisarlo en profundidad en 1995. Se aadieron
trminos, se suprimieron muchos, se orientaron los poco utilizados hacia trminos preferidos, se
multiplicaron las notas explicativas y de alcance y se revisaron las relaciones de jerarqua y de
asociacin. Pero, sobre todo, se aplic un enfoque que reflejaba menos las orientaciones de la
investigacin pura y que a partir de entonces describa el contenido de forma ms pragmtica, y
se lleg a reducir el Tesauro a unos 6600 trminos, pasando de dos volmenes por cada idioma
a un solo volumen que contena las tres versiones lingsticas, el famoso volumen rojo que sigue
prestando servicios en algunas bibliotecas [1_Tesauro_Portada]. En esa misma poca se crea ya
una base de datos del Tesauro (en CDS-ISIS) y en el ao 2000 aparece la primera versin online
en ingls (web-ISIS), seguida por las versiones en francs (2003), espaol (2004) y ruso (2005).

Una prueba visual de esta variedad se puede apreciar gracias al proyecto Mosaic of Change <http://mosaicofchange.org> y
1

en particular disfrutando de las imgenes de la proyeccin <https://vimeo.com/146507807> a partir del minuto 3.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
107

Figura 1. Tesauro de la UNESCO, edicin de 1995.

El Tesauro de la UNESCO abarca los principales campos del conocimiento, pero ha sido
diseado para servir como instrumento de referencia para servicios de informacin que quieran
elaborar sus propios vocabularios para responder a necesidades particulares. De all que se haya uti-
lizado y se siga utilizando en el mundo entero tanto en bibliotecas generales como especializadas2.
Es multidisciplinario, abarca las siete reas principales del conocimiento incluidas en el mandato de
la UNESCO: educacin, ciencia, cultura, ciencias humanas y sociales, informacin y comunicacin,
y poltica, derecho y economa. A estas entradas hay que aadir un ltimo grupo: los nombres
de pases y grupos geogrficos, polticos o lingsticos. Estas temticas se dividen a su vez en 88
microtesauros. [2_pantallazo 1] Es monojerrquico excepto para los descriptores geogrficos, ya que
una misma entidad puede pertenecer a varios grupos (por ejemplo, Burkina Faso pertenece a los
grupos frica Occidental, frica de habla francesa, Sahel y Pas islmico) [3_pantallazo 2].

Figura 2. Microtesauros asociados al tema Cultura.

Vase en Garrod (2000) un ejemplo de las ventajas del Tesauro de la UNESCO en relacin con otras clasificaciones.
2

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
108

Figura 3. Estructura multijerrquica de los descriptores geogrficos.

El Tesauro de la UNESCO contiene: 4500 conceptos y 7075 trminos en ingls y en ruso


(8613 trminos en francs y 8629 en espaol), unas 640 notas de alcance y 17050 relaciones. Las
relaciones entre trminos son: las de equivalencia entre un descriptor y un no-descriptor (UP/
EMP); las jerrquicas (TG/TE); las de relacin asociativa entre trminos (TR) y la de inclusin en
un microtesauro (MT). Adems de las definiciones y notas de alcance, el Tesauro de la UNESCO
contiene las equivalencias lingsticas en los cuatro idiomas mencionados excepto para los no-
descriptores.
Se ha ido ampliando y actualizando regularmente y hoy en da la versin disponible en la
web recibe 15000 visitas mensuales, de las cuales ms del 70% para las pginas en espaol. En el
2016 se pondr a disposicin del pblico una versin compatible con la norma ISO 25964 y que se
publicar como Linked Open Data. Podr incluir contenido en alfabeto chino y rabe (compatible
UTF-8) y permitir importar y exportar contenido en formatos SKOS, ZTHES y RDF. Despus de
muchos aos de espera, este proyecto se ha podido al fin concretizar y se podr acceder a la plata-
forma SKOS desde el sitio web del Tesauro <http://vocabularies.UNESCO.org>. El alineamiento del
Tesauro con otros vocabularios y recursos est tambin previsto. Este recurso que tantos servicios
ha prestado en tan distintos centros y lugares del mundo va a permitir nuevas realizaciones en
la web semntica y continuar contribuyendo al enriquecimiento de la bsqueda de informacin.

El Learning Portal del Instituto Internacional de Planeamiento de


la Educacin:
Sin esperar a la publicacin de la versin SKOS y basndose en el desarrollo que el equipo
de la Universidad de Murcia ha publicado en 20133, el Instituto Internacional de Planeamiento de
la Educacin de la UNESCO (IIPE) ha lanzado en 2015 un portal de recursos sobre la mejora
de los logros educativos y la importancia del planeamiento en este proceso. El Portal sobre
el Aprendizaje (o Learning Portal) del IIPE es una ventanilla nica que permite acceder a
informacin completa, actualizada, relevante y neutral sobre el aprendizaje, desde la edu-
cacin pre-primaria hasta la secundaria. El IIPE tiene una larga experiencia en la creacin y
mantenimiento de portales temticos, siendo los ms conocidos Planipolis <http://planipolis.
iiep.UNESCO.org>, un portal internacional de planes y polticas educativos y el Servicio de
Informacin sobre VIH, Salud y Educacin <http://hivhealthclearinghouse.UNESCO.org/>,

<http://skos.um.es/unescothes/?l=es>
3

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
109

un servicio de facilitacin e intercambio de informacin para desarrollar polticas, programas


y acciones de promocin en el rea del VIH y SIDA, de la salud escolar y de la educacin
sexual. Cuando se plante la posibilidad de crear un nuevo portal temtico para cubrir el
dficit de informacin neutral sobre el aprendizaje, se decidi utilizar las posibilidades tec-
nolgicas que brinda la web semntica para desarrollar esta nueva herramienta que es mucho
ms que una biblioteca de ms de 1300 recursos reunidos en una base de datos con un motor
de bsqueda.
El Portal sobre el Aprendizaje se ha diseado para responder a las necesidades de un
pblico muy variado: los planificadores, responsables educativos, actores de la sociedad civil
(padres de alumnos, periodistas, activistas) y donantes de todo el mundo; ofreciendo:
Investigaciones e informes sobre los trabajos realizados para mejorar el aprendizaje, ejem-
plos de polticas llevadas a cabo sobre el tema, debates actuales y una amplia gama de
experiencias sobre las cuestiones del aprendizaje.
Resmenes sobre investigaciones y estudios realizados en torno a formas de mejorar el
aprendizaje.
Una visin panormica sobre los pasos a dar para elaborar un plan para el aprendizaje
mejorado.
Herramientas y mtodos para monitorear el aprendizaje y utilizar de forma prctica los
datos.
Un blog semanal y una seleccin diaria de noticias y de artculos sobre el aprendizaje de
todo el mundo.
Un canal para conocer los temas de debate ms importantes y participar en el e-foro.
Un glosario de los trminos ms importantes y la posibilidad de poder pedir ayuda a un(a)
bibliotecario(a) para encontrar recursos.

Para conseguir dar un acceso fcil y rpido a todas estas distintas informaciones, se de-
cidi interconectar los distintos vocabularios estructurados que ya se venan utilizando en la
Biblioteca del IIPE, es decir:
Tesauro de la UNESCO -> ms de 8600 trminos, entre descriptores y no-descriptores en
los tres idiomas del portal (ingls, francs y espaol).
Clasificacin del IIPE -> 435 temas. Esta clasificacin se ha ido elaborando a lo largo
de los aos y permite a la Biblioteca del IIPE poder estructurar conceptos de una manera
ms coherente con los distintos programas en los que trabaja el Instituto y que pueden no
verse reflejados en el Tesauro. Este sistema ha permitido conservar la armonizacin con el
Tesauro manteniendo al mismo tiempo una flexibilidad en la indizacin. Los temas de la
clasificacin del IIPE suelen ser ms genricos que los descriptores. Un recurso se indiza
con dos o tres temas como mucho y con entre cinco y quince descriptores.
Lista de proyectos -> ms de 600 entradas que corresponden a programas (Educacin
Para Todos), evaluaciones (PISA), sistemas de informacin (EMIS), leyes, etc. Se han nor-
malizado las formas y los acrnimos.
Lista de instituciones -> se han extrado y normalizado ms de 1200 entidades para per-
mitir acceder fcilmente a todos los recursos producidos por los distintos departamentos
de estas instituciones, en particular en el caso de los ministerios y de las agencias interna-
cionales para los que pueden existir ms de 50 formas distintas para una misma entidad
principal.
Lista de pases separada de los descriptores -> el Tesauro de la UNESCO incluye los
pases como una de sus subdivisiones, pero esta presentacin no permite ofrecer una
bsqueda especfica por faceta. A partir de esta se pueden tambin crear agrupaciones ad
hoc (como, por ejemplo, pases participantes en PISA) y es la que genera los matices de
colores que se aprecian en el mapa que figura en esta pgina: <http://learningportal.iiep.
UNESCO.org/en/search/notice>.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
110

La interconexin entre estos distintos vocabularios se ha hecho con la solucin ITM de


Mondeca. Como se trata de un sistema propietario, se ha diseado una arquitectura relativamen-
te compleja pero que permite, en caso de querer recuperar la solucin de entrada y el motor
de indizacin para otro proyecto, disociar los componentes de Mondeca y pasar del mdulo de
entrada de datos (Records management) a la indizacin por SolR sin enriquecer la informacin
con el tratamiento de ITM y a un portal de visualizacin (End-user portal). [4_Esquema_ITM_
SolR_IRI]

Figura 4. Esquema del sistema de entrada, enriquecimiento e indizacin.

Un sistema de alineamiento de vocabularios basado en el Tesauro


A todas estas listas que ya se venan utilizando en la Biblioteca se decidi aadir un Glosario
de casi 500 trminos, extrados de publicaciones o del material de formacin del IIPE. Esta lista,
al no estar estructurada jerrquicamente, se puede actualizar rpidamente, ya que se tiene ms
libertad para incluir nuevas entradas o modificar las existentes. Constituye la puerta de entrada
en lenguaje casi natural para el portal al reunir las expresiones usadas ms frecuentemente en
las textos publicados por el IIPE. Cada entrada del glosario se ha alineado con uno o varios
descriptores del Tesauro as como con un ndice de la clasificacin del IIPE [5_pantallazo 3]. De
esta manera se ha alineado la Clasificacin del IIPE con el Tesauro, pasando por el Glosario y
evitando el tener que seleccionar entre los ms de 8600 trminos que este contiene, aquellos
para los que tendra sentido une interconexin con la Clasificacin. Este procedimiento se llev
a cabo manualmente en un periodo de dos meses (Chick, 2014), tras haber evaluado varias posi-
bilidades y habiendo descartado un tratamiento semiautomtico, que, de todas formas, hubiera
necesitado una revisin posterior.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
111

Figura 5. Entrada del glosario conectada con el Tesauro (corresponding concept) y con la Clasificacin (domain).

En un primer momento se pens incluso en abandonar el uso del Tesauro, pero, tras dis-
cutir con Mondeca y con la agencia web que desarroll el portal final, las ventajas de este instru-
mento quedaron patentes tanto para los que iban a desarrollar la aplicacin como para el usua-
rio final. Para el personal de la Biblioteca, muy acostumbrado al uso del Tesauro, este permita
adems cubrir temticas cuyo campo era en algunos casos ms amplio que los habitualmente
cubiertos por el IIPE. Quedaba, sin embargo, bien claro que el lenguaje del Tesauro, al alejarse
en muchos casos del lenguaje natural, podra entorpecer la bsqueda, tratndose en particular
de un portal que no est pensado slo para especialistas. Para el etiquetado de las pginas de
contenido, se decidi utilizar la Clasificacin del IIPE, por su nmero ms reducido de trminos
y su carcter ms genrico [6_pantallazo 4]. El software permite tambin enlazar el contenido
de las pginas con definiciones del glosario [7_pantallazo 5]. Al existir una interconexin entre
las definiciones del Glosario, los ndices de la Clasificacin y los descriptores correspondientes
del Tesauro, este sistema enriquece todas estas informaciones con las relaciones UP, TE y TG a
las que estn asociados los descriptores. Para resumir, partiendo de un etiquetado relativamente
sencillo y leve de implementar como el que se consigue con la Clasificacin y el Glosario, se
aade la cadena semntica mucho ms compleja y elaborada del Tesauro. Este tratamiento ms
sencillo se aplica a las distintas pginas de contenido, pero a los recursos de tipo bibliogrfico
(artculos, documentos, informes, etc.) se les sigue describiendo con una indizacin completa
con descriptores [8_pantallazo 6]. Las bsquedas que se hacen en lenguaje natural utilizando
el mdulo sencillo devuelven resultados en la Biblioteca, en las pginas web y en el Glosario,
9_[pantallazo 7]. La bsqueda en la biblioteca se hace en lenguaje natural o a travs de facetas
para quien quiera refinar los resultados.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
112

Figura 6. Etiquetado de una pgina de contenido.

Figura 7. Enlace entre contenido de una pgina y definicin del glosario, en este caso educacin bsica.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
113

Figura 8. Descripcin de un documento en la biblioteca de recursos.

Figura 9. Resultados de una bsqueda en lenguaje natural sobre la palabra


docentes (200 respuestas en la Biblioteca, 24 pginas web y 5 entradas en el Glosario).

El Portal sobre el Aprendizaje del IIPE es un proyecto ambicioso, ya que se ha pretendido


combinar contenido e informacin. Permite pasar de las pginas descriptivas a los recursos utili-
zando el etiquetado con metadatos o la lista de recursos pertinentes propuesta por el motor de
bsqueda. Al estar dirigido a pblicos de muy distinta ndole, se ha querido facilitar el acceso
a los recursos bibliogrficos a travs de las pginas de contenido o del Glosario y, a su vez,
permitir realizar bsquedas precisas utilizando facetas, navegacin entre descriptores y criterios
de pertinencia. El reto ha consistido en mantener al mismo tiempo una entrada sencilla con
una navegacin natural adaptada a los criterios actuales y una estructuracin muy precisa de
la informacin que proporciona resultados pertinentes y que se pueden refinar. Basndose en la
estructura del Tesauro y en sus mltiples relaciones y asociaciones, y enriqueciendo un vocabu-
lario sencillo, como el del Glosario, se han podido combinar estas exigencias. Vemos as cmo
un instrumento terminolgico que muchos consideraban totalmente desfasado en la actualidad
puede servir de espina dorsal para un desarrollo en la web semntica.

El lenguaje del patrimonio | Pgs. 105-114


Una ontologa para la gestin del conocimiento
114

Bibliografa
Chikh, S.-A. (2014): Lexploitation des vocabulaires dans un portail web smantique. Le cas du portail
thmatique Plan4Learning de lIIPE-UNESCO. INTD-CNAM. Mmoire, ingnierie documentai-
re <http://memsic.ccsd.cnrs.fr/mem_01128428v2/document>. [Consulta: 16 de marzo de 2016].
Francart, T. (2013): Plan4Learning: Easing access to educational planning resources. Paper presen-
ted to United Nations Library and Information Network for Knowledge Sharing, UN-LINKS,
Ginebra. <http://www.unog.ch/80256EDD006B8954/(httpAssets)/50424CFEF79D053BC125
7BF80040DF3F/$file/Plan4Learning+Easing+Access+to+Educational+Planning+Resources_
Thomas+Francart.pdf>. [Consulta: 16 de marzo de 2016].
Garrod, P. (2000): Use of the UNESCO Thesaurus for Archival Subject Indexing at UK NDAD, Jour-
nal of the Society of Archivists, n. 1, 21, pp. 37-54.
Le Thsaurus de lUNESCO ou la corne dabondance du savoir, <http://gido.iut.u-bordeaux3.fr/evene-
ments/le-thesaurus-de-lUNESCO-ou-la-corne-dabondance-du-savoir/>. [Consulta: 16 de marzo
de 2016].
Pastor Snchez, J. A.; Martnez Mndez, F. J.; Lpez Carreo, R., y Rodrguez Muoz, J. V. (2013):
UNESKOS. Publicacin como Linked Open Data de la Nomenclatura Internacional de Ciencia
y Tecnologa y del Tesauro UNESCO. Actas I Congresso ISKO Espanha Portugal, Porto.
Tesauro de la UNESCO <http://databases.UNESCO.org/thessp/>. [Consulta: 16 de marzo de 2016].
UNESCO Thesaurus <http://skos.um.es/UNESCOthes/?l=es>. [Consulta: 16 de marzo de 2016].
Valderrama Pareja, A. (2013): Plan for learning: a portal on Planning for Improved Learning Outco-
mes. Paper presented to United Nations Library and Information Network for Knowledge Sha-
ring, UN-LINKS, Ginebra. <http://www.unog.ch/80256EDD006B8954/(httpAssets)/BB5C8A9B
A798F445C1257BF80040C5B9/$file/IIEP+Portal+Plan+for+Learning_UNESCO-IIEP.pdf>.

El lenguaje del patrimonio | Pgs. 105-114


115

Construccin y uso de terminologas, categoras


de descripcin y estructuras semnticas vinculadas
al patrimonio en la sociedad global de datos
Nuria Rodrguez Ortega
Universidad de Mlaga

1. Las condiciones de la sociedad global de datos


La emergencia y progresiva consolidacin de una sociedad construida y articulada en torno a
los datos masivos que ella misma produce en un escenario global est dando lugar a profundas
transformaciones en procesos relacionados con la construccin y distribucin del conocimiento,
as como en aquellos vinculados a la interpretacin de sus artefactos sociales, culturales y po-
lticos. Estas transformaciones tambin implican nuevas formas de acceso y de interaccin con
el material cultural digital (o digitalizado), situando el foco de atencin en un orden de proble-
mticas distintas. Aunque estas son muy diversas, para los propsitos de este texto quiero llamar
la atencin sobre las siguientes.
1. En primer lugar, la nocin de apertura de los datos y de los dispositivos asociados a su
descripcin, clasificacin y estructuracin, nocin que va aparejada a la idea de compar-
ticin y de especial inters para la argumentacin que quiero desarrollar a las de uso,
reutilizacin y aprovechamiento, claves del nuevo paradigma epistmico de nuestra con-
temporaneidad. Aunque con diferentes velocidades, es destacable la inversin de tiempo,
dinero y recursos humanos que se est realizando para poner a disposicin pblica datos,
metadatos, vocabularios, ontologas, etc.1.

Este texto es resultado del proyecto de investigacin Generacin de conocimiento sobre exposiciones artsticas tempora-
1

les para su reutilizacin y aprovechamiento multivalente, financiado por la FBBVA; y del proyecto de I+D HAR2014-51915-P:
Catlogos artsticos: gnoseologa, epistemologas y redes de conocimiento. Anlisis crtico y computacional. Europeana,
por ejemplo, tiene un programa especfico para compartir y reutilizar los datos y metadatos registrados en sus sistemas.
Consltese en: <http://labs.europeana.eu/>. [Consulta: 12 de marzo de 2016]. En Espaa, la Biblioteca Nacional acaba de
anunciar la firma de un acuerdo con el Ministerio de Economa, Industria y Turismo para favorecer el acceso y la reutiliza-
cin del fondo digital de la BNE, fomentando la innovacin tecnolgica e impulsando el desarrollo y creacin de nuevos
productos y servicios a partir de los contenidos digitalizados y los conjuntos de datos generados por la Biblioteca. Vase
en: <http://www.bne.es/es/AreaPrensa/noticias2016/0310-convenio-red.html>. [Consulta: 14 de marzo de 2016].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
116

Esta circunstancia est dando lugar a la aparicin de nuevas prcticas relacionadas con el
uso de estos materiales que se alejan de los que haban sido hasta ahora sus objetivos tra-
dicionales: registro, clasificacin y descripcin para el acceso y gestin de las colecciones
digitales asociadas a los acervos patrimoniales.
2. En segundo lugar, el trnsito de la web de los documentos a la web de los datos; esto es, la
irrupcin de una economa del conocimiento que ya no est basada solo en el valor de las
informaciones contenidas en uno o varios documentos, sino en la potencialidad que tiene la
recombinacin de datos hbridos para generar un conocimiento indito (descriptivo o predic-
tivo). Este nuevo escenario lleva implcito el desarrollo de nuevas estrategias de anlisis en las
que la combinacin de metodologas cuantitativas basadas en el procesamiento computacional
de datos y metadatos mediante algoritmos ms o menos complejos, y la exploracin de nuevas
formas de visualizacin desempean un papel central. As pues, la vinculacin entre sociedad
digital y cultura algortmica est danto lugar a una reformulacin de las estrategias de acceso
tradicionales, que ahora se entienden como procesos de descubrimiento, sustancialmente
diferentes de las tcnicas de bsqueda y recuperacin de informacin conocidas hasta ahora.
3. En tercer lugar, hay que resear como una de las claves definitorias de nuestra sociedad digi-
tal la aparicin de nuevos actores en el ecosistema global, circunstancia que est generando
una diversificacin de las prcticas relacionadas con el uso y construccin de materiales para
la descripcin de los acervos culturales. Cules son estos nuevos actores?: comunidades a
gran escala con capacidad para producir datos masivos (Twitter, Instagram, Flickr); discur-
sos colectivos basados en dichos datos (blogs, wikis, modalidades de escritura colaborativa);
los software y algoritmos que los procesan; y los actores globales (Google, Facebook, GLAM,
etc.) que los gestionan y los hacen accesibles (Kaplan, 2015). En consecuencia, debemos
contar con un nuevo escenario transnacional y tecno-social como parte de las narrativas cr-
ticas, y examinar de qu modo estos actores condicionan y modelan los procesos ligados a
la documentacin digital de los acervos culturales y al uso que se realiza de esos materiales
documentales. Dicho de otro modo, la construccin de terminologas y estructuras para el
acceso y la descripcin del patrimonio ya no es prerrogativa exclusiva de los documentalis-
tas, expertos de dominio o instituciones de la memoria (es decir, los actores tradicionales);
por el contrario, en la actualidad encontramos todo un universo de prcticas heterogneas,
descentralizadas y distribuidas que hay que tener en cuenta.

Dado este nuevo contexto, la pregunta a la que trata de responder este texto es la siguien-
te: cules son las nuevas prcticas relacionadas con el uso y construccin de vocabularios, cate-
goras de descripcin y estructuras semnticas vinculadas a la sociedad global de datos que nos
alejan tanto de los usos tradicionales como de los actores hasta ahora habituales?
Tomando pues como horizonte referencial esta pregunta, me propongo abordar desde la
perspectiva del historiador del arte que es el lugar desde el que yo hablo en este texto tres
aspectos: a) qu proyectos, investigaciones o iniciativas ejemplifican modelos de nuevas prcti-
cas relacionadas con el uso y construccin de los lenguajes patrimoniales; b) a qu pensamiento
y discurso crtico nos impelen estas nuevas prcticas; c) qu iniciativas se podran emprender
colaborativamente entre documentalistas, expertos de dominio, desarrolladores informticos,
pblicos, etc., para expandir las potencialidades de estos materiales documentales e incrementar
la calidad de su reaprovechamiento.

2. Construccin, uso y reaprovechamiento en contextos de investigacin


cientfico-acadmica
De acuerdo con lo dicho anteriormente, uno de los retos de nuestro tiempo desde la perspectiva del
historiador del arte es decir, de alguien que est comprometido con proporcionar un mejor y ms
profundo conocimiento de los procesos histrico-artsticos y de las condiciones del patrimonio

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
117

reside en explorar cmo reutilizar todo este material que originariamente se gener para el acce-
so, registro y documentacin de los acervos culturales en los procesos de investigacin histrico-
artstica y patrimonial. Por tanto, me referir, en primer lugar, a un grupo de prcticas que ilustra
cmo los vocabularios y los metadatos que hemos utilizado durante largo tiempo para el registro
y documentacin de los artefactos culturales nos pueden servir ahora para llevar a cabo investiga-
ciones que dibujan marcos de comprensin inditos. Estas prcticas ejemplifican, adems, cmo
las condiciones materiales y tecnolgicas de nuestro tiempo nos permiten estudiar digitalmente
las colecciones patrimoniales desde puntos de vista innovadores. La idea que subyace explcita
o implcitamente a todas estas prcticas es que el trabajo curatorial y documental realizado
durante tanto tiempo en el proceso de registro y descripcin de colecciones ha convertido a las
instituciones de la memoria y a sus grandes bases de datos en repositorios de un conocimiento
estructurado a travs de metadatos que podemos reutilizar para fines diversos.
Las investigaciones llevadas a cabo por Matthew Lincoln en la Universidad de Maryland2 cons-
tituyen un ejemplo de cmo indagar en colecciones especficas de museos a travs del procesamien-
to de sus metadatos y estructuras semnticas para profundizar en determinados procesos artsticos.
Particularmente, su objeto de investigacin estuvo centrado en las colecciones de grabados holan-
deses del British Museum y del Rijksmuseum, que analiz con el objetivo de cartografiar las redes
de relaciones profesionales y artsticas establecidas entre los actores implicados en sus procesos de
produccin y distribucin (grabadores, dibujantes, diseadores, impresores, etc.), para extraer los
patrones sistmicos que rigieron en su establecimiento y evolucin. La descripcin de estas coleccio-
nes de grabados mediante un conjunto exhaustivo de metadatos semnticamente estructurados, y el
hecho de que, estas estn accesibles mediante estructuras de Linked Open Data3 permiti a Matthew
Lincoln, aplicando estrategias de network analysis y determinados ndices estadsticos, construir re-
presentaciones dinmicas de la configuracin de estas redes a lo largo del tiempo (Lincoln, 2015b).

Figura 1. En la imagen superior se muestran las mtricas que indagan sobre el carcter centralizado o descentralizado
de las redes segn nacionalidades. Los resultados por encima de 0 indican una mayor proporcionalidad de conexiones
internacionales, mientras que los resultados por debajo de 0 sealan un mayor nmero de conexiones locales-nacionales.
Obsrvese, por ejemplo, cmo las redes de Italia se definen durante todo el periodo por su carcter domstico. Disponible en:
<http://matthewlincoln.net/2015/05/21/the-art-historians-macroscope.html>. [Consulta: 1 de noviembre de 2015] ( Matthew Lincoln).

< http://matthewlincoln.net/ >. [Consulta: 1 de marzo de 2016].


2

El British Museum ha adoptado el modelo de referencia conceptual desarrollado por el CIDOC (CRM-CIDOC), el cual permite
3

conectar objetos, personas, eventos y conceptos en un modelo de datos enriquecido (Le Boeuf et alii, 2012). Algunos proyec-
tos que estn utilizando este modelo de datos pueden consultarse en la seccin de proyectos de la web Research Space.
Creating the Cultural Heritage Knowledge Graph, espacio desarrollado por el British Museum con el apoyo de The Andrew
W. Mellon Foundation. Disponible en: <http://www.researchspace.org/home/crmprojects>. [Consulta: 1 de noviembre de 2015].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
118

Como se puede observar en la Figura 1, estas representaciones visibilizan aspectos que


seran imposibles de obtener mediante los habituales procesos de bsqueda y recuperacin de
informacin, o simplemente mirando a travs de listas de resultados. El enfoque que presidi
esta investigacin es ya por s mismo innovador al centrar su estudio en las estructuras de rela-
ciones y procesos sistmico a lo largo de amplios periodos de tiempo en vez de en los artefactos
o las praxis individuales. No obstante, lo que aqu nos interesa destacar es cmo los metadatos
utilizados para el registro y la documentacin de las colecciones se transforman en marcadores
que permiten establecer redes y construir mtricas con la finalidad de averiguar cules son las
estructuras que emergen a partir de las interrelaciones establecidas entre actores diversos4.
Otra de las iniciativas que ilustra este tipo de prcticas basadas en el uso de los conjuntos
de metadatos existentes en los grandes repositorios son los anlisis que se estn llevando a cabo
tomando como base el Getty Provenance Index5. El Getty Provenance Index constituye una de
las mayores bases de datos relacionadas con el coleccionismo artstico, que incluye miles de
inventarios, catlogos de venta y libros contables de marchantes en un periodo de tiempo que se
extiende desde el siglo xvi hasta el siglo xx. Sus datos y metadatos, abiertos y accesibles se pueden
utilizar para indagar sobre cuestiones relacionadas con comportamientos del consumo artstico,
procesos de adquisicin de obras, tendencias del mercado, redes entre marchantes y galeristas
o modos de exhibicin de colecciones.

Figura 2. Anlisis estadstico de la distribucin de gneros pictricos en los espacios palaciegos romanos a partir
de los metadatos del Getty Provenance Index. Disponible en: <http://www.getty.edu/research/tools/provenance/faq.html>.
[Consulta: 10 de noviembre de 2015] (J. Paul Getty Trust and Christian Huemer).

Otros resultados derivados de estos anlisis mtricos pueden consultarse en Lincoln, 2015a.
4

El Getty Provenance Index, desarrollado durante ms de tres dcadas, forma parte del programa del Getty Research Institu-
5

te The Project for the Study of Collecting and Provenance (PSCP). Se puede consultar en: <http://www.getty.edu/research/
tools/provenance/index.html>. [Consulta: 10 de noviembre de 2015].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
119

La Figura 2 ilustra, justamente, resultados de una investigacin centrada en este ltimo


aspecto. Su objetivo era analizar la existencia de posibles patrones en la disposicin de las co-
lecciones pictricas en los palacios de Roma entre 1550 y 1750. Para ello, los casi 300 inventarios
romanos que comprenden un total de 65000 registros individuales fueron procesados para mos-
trar la existencia o no de cambios en la distribucin de los gneros pictricos en los espacios
palaciegos en funcin de su naturaleza privados o pblicos o de los diferentes niveles sociales
de sus propietarios6.
Esta investigacin constituye, as, un ejemplo de cmo el procesamiento estadstico de los
trminos descriptivos y clasificatorios utilizados para documentar los objetos inventariados nos
permiten explorar aspectos relacionados con la cultura visual y material de un momento dado,
trascendiendo, de nuevo, los usos habituales de acceso y recuperacin de informacin para los
que fueron originariamente concebidos.
Sin abandonar este tipo de proyectos basados en el reaprovechamiento de materiales y
estructuras documentales ya existentes, encontramos un conjunto de iniciativas que estn cen-
trando su atencin en los metadatos y sistemas de descripcin como objetos de investigacin en
s mismos. En estos casos, los metadatos ya no representan solo un instrumento valioso para
extraer conocimiento indito sobre procesos artsticos como hemos visto en los casos ante-
riores, sino que ellos mismos se convierten en el objeto que hay que explorar y analizar bajo
la premisa de que estos conjuntos de metadatos llevan inscritos discursos sociales, culturales,
tecnolgicos e institucionales al haber sido contribuidos y creados en diferentes eras, momentos
y circunstancias (Battle y Loukissas, 2013). Este tipo de proyectos, pues, atiende a la idea de que
los metadatos y las estructuras de clasificacin son artefactos y construcciones culturales que
derivan de distintos procesos interrelacionados7, y que nos cuentan historias de s mismos, de
las prcticas que han regido sus procesos de creacin y uso; y, por tanto, de los individuos y de
las instituciones que estn detrs de su generacin y gestin.
Una de las iniciativas que, a mi modo de ver, mejor ejemplifica este tipo de enfoque es
el proyecto The Life and Death of Metadata8, que centra su atencin en los metadatos de los
registros de entrada del Arnold Arboretum, una extensa coleccin de especmenes arbreos de
muy heterognea procedencia, que actualmente gestiona la Universidad de Harvard. Coordina-
do por Yanni Alexander Loukissas (Georgia Techs School of Literature, Media, and Communica-
tion), el proyecto combina procesamiento computacional avanzado, visualizaciones complejas y
entrevistas con el personal del Arnold Arboretum para ilustrar cmo los metadatos registran los
cambios locales que se producen en tecnologa, personal y organizacin a lo largo del tiempo
(1872-2012).

<http://www.getty.edu/research/tools/provenance/faq.html>. [Consulta: 10 de noviembre de 2015].


6

Segn Battles y Loukissas (2013), los artefactos de datos (data artifacts) derivan de varios procesos interrelacionados: pue-
7

den ser artefactos de produccin, resultantes de las condiciones materiales de los procesos de creacin de datos; artefac-
tos disciplinarios, que revelan los sistemas de ordenacin especficos de las disciplinas; artefactos vernaculares, resultados
de dialcticas locales o usos del lenguaje; artefactos de clasificacin, ligados a cambios en los esquemas de ordenacin; o
artefactos ontolgicos, producidos por conflictos entre clasificaciones culturalmente especficas.
Vase en: <http://lifeanddeathofdata.org/>. [Consulta: 1 de noviembre de 2015].
8

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
120

Figura 3. Timeline radial en el que se grafican los metadatos correspondientes


a los registros de acceso del Arnold Arboretum (Universidad de Harvard) (captura de pantalla).
Disponible en: <http://lifeanddeathofdata.org/>. [Consulta: 10 de noviembre de 2015].

As, el timeline radial que se muestra en la Figura 3 nos cuenta una historia relacionada
con las prcticas coleccionsticas de la propia institucin. Vase, por ejemplo, el incremento del
nmero de registros a largo de los aos, pero tambin el cambio de temporalidad, pasando de
un modelo de temporalidad en el que los registros se concentran en el periodo de invierno, a
otro modelo de temporalidad en el que, a partir de la mediacin del siglo, los registros se distri-
buyen a lo largo de todo el ao. Tambin se puede observar la coincidencia entre el incremento
de una determinada especie arbrea (en amarillo en el grfico original) y el inicio de la gestin
de un nuevo director (vase Figura 4)9.

Figura 4. Captura de pantalla tomada de la visualizacin dinmica de The Life and Death of Metadata.
Disponible en: <http://lifeanddeathofdata.org/>. [Consulta: 10 de noviembre de 2015].

Un anlisis profundo de sus resultados se encuentra en la web del proyecto indicada en la nota anterior.
9

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
121

Por tanto, estos metadatos nos permiten comprender mejor no solo las colecciones que
ellos describen, sino los propios procesos de registro y documentacin, arrojando luz sobre cu-
les son las prcticas sociales en torno a estos procesos y de qu manera las organizaciones y las
instituciones construyen y sistematizan su conocimiento. En definitiva, nos permiten repensar los
metadatos desde las condiciones de su produccin material.
Por eso, este tipo de proyectos tambin nos confronta con algunas paradojas de la sociedad
global de datos que merece la pena resear. Me refiero, en concreto, a la dialctica entre la aparente
condicin universal de los datos, que implcitamente promueven las iniciativas de open data, las cua-
les ponen a disposicin pblica conjuntos de datos y metadatos que pueden utilizarse en cualquier
lugar del mundo y para cualquier propsito incluso, como hemos visto, para fines muy alejados de
sus intenciones originarias, y el hecho de que la relevancia y el valor de estos datos est siempre
local e histricamente situada en la medida en que son el resultado de las interacciones humanas y
de los objetivos de una comunidad en un determinado contexto socio-cultural y poltico.
Otro conjunto de prcticas se orienta a la creacin ad hoc de terminologas y vocabularios
especficos, necesarios en aquellos proyectos basados, justamente, en el anlisis de datos. Un intere-
sante ejemplo a este respecto es el estudio llevado a cabo por el equipo del laboratorio CulturePlex10
(Western Ontario University) dirigido por Juan Luis Surez en el marco del proyecto The Hispanic
Baroque: Complexity in the First Atlantic Culture. El objetivo de este proyecto era analizar el origen,
la evolucin y la transmisin de patrones de comportamiento y representacin del mundo hispnico
en el espacio transatlntico para examinar si efectivamente podamos hablar de la existencia de una
cultura barroca en este espacio geogrfico y a travs de un eje temporal amplio. Para ello se cons-
truy una base de datos de ms de 13000 registros de obras pictricas producidas a ambos lados del
Atlntico durante tres siglos (1550-1850), que se describieron mediante 211 descriptores o atributos
siguiendo el modelo de una ontologa formal11. El anlisis consisti en observar la evolucin de estos
descriptores/atributos a lo largo del tiempo mediante un algoritmo que configuraba agrupaciones
de pinturas (clsteres) definidas por atributos similares, demostrndose entre otras cosas que el
principal elemento de conexin entre ellas eran los gneros o temas12 (vase Figura 5).

Figura 5. Los grafos que se representan en esta imagen muestran las dinmicas de cambio de los clsteres pictricos
para los dos periodos de estudio, especialmente la variabilidad de las interconexiones establecidas entre ellos, as como la
desaparicin/aparicin de determinados clsteres en uno u otro periodo. Los colores hacen referencia a los distintos gneros pictricos
representados. (Surez et alii, 2013) (imagen cortesa de Juan Luis Surez).

Sitio web: <http://www.cultureplex.ca/>. [Consulta: 1 de noviembre de 2015].


10

Vase en: <http://ontologies.cultureplex.ca/baroqueart/spec/index.html>. [Consulta: 10 de noviembre de 2015].


11

El estudio completo con las distintas mtricas utilizadas en el anlisis se encuentra en Surez et alii, 2013.
12

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
122

Independientemente del resultado de la investigacin, lo que me interesa destacar es


cmo estos vocabularios no se utilizan aqu con el objetivo especfico de documentar el objeto
en el sentido tradicional del trmino (acceder, describir, gestionar), sino como herramientas para
encontrar similitudes o diferencias entre artefactos culturales y asociarlos mediante determina-
dos algoritmos de agrupacin lo que llamamos procesos de clustering, permitindonos, as,
dar nuevas explicaciones sobre sus lgicas de funcionamiento.
Para cerrar esta primera parte, plantear algunas cuestiones importantes que requieren
consideracin.
En primer lugar, parece claro que de nada sirve que se pongan a disposicin pblica datos
y metadatos si no conocemos las tecnologas necesarias para extraerlos y procesarlos. Por tanto,
el conocimiento de estas tecnologas especficas constituye un factor crtico para la viabilidad de
este tipo de prcticas. Si estamos convencidos del enorme potencial que tiene el procesamiento
de todo este material documental generado en torno a los acervos culturales, hemos de estar de
acuerdo tambin en la necesidad de promover una adecuada formacin.
A su vez y sin menoscabo de los conocimientos tcnicos imprescindibles que se deben
adquirir, tambin es preciso desarrollar una intensa colaboracin entre documentalistas, desa-
rrolladores y expertos de dominio para crear interfaces ms amigables y usables, menos dirigidas
a construir preguntas en un cdigo complejo (Figura 6), y ms encaminadas a funcionar como
entornos de estimulacin intelectual mediante la sugerencia de posibles vas de interrogacin.

Figura 6. Consulta construida en SPARQL (ProtocolandRDFQueryLanguage). Captura de pantalla


del SPARQL Endopoint del Europeana Lab. Disponible en: <http://labs.europeana.eu/api/linked-open-data-SPARQL-endpoint>.
[Consulta: 1 de marzo de 2016].

En segundo lugar, promover y apoyar el uso de estndares y estructuras normalizadas en


los proyectos especficos que acometemos los investigadores representa un factor crucial para
poder reutilizar los materiales generados durante su desarrollo en iniciativas futuras. Instaurar
esta cultura como requisito fundamental nos permitira rentabilizar la inversin de tiempo, di-
nero y recursos humanos que se realiza cada vez que en un proyecto se afronta la construccin
de un repositorio o una base de datos. Nuevamente, se requiere aqu una intensa labor de pe-
dagoga y formacin.
En este sentido una estrategia que tambin podra contribuir a este objetivo sera el desa-
rrollo de plataformas en las que, a modo de recolectores o agregadores, estuviesen accesibles
los diversos sistemas, estructuras, vocabularios, ontologas, etc., actualmente disponibles. De este

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
123

modo, los investigadores podramos acudir a esta informacin para discriminar cules de ellos
convienen ms a nuestros propios proyectos. Esta propuesta incluira la publicacin en abierto
de los tesauros que las instituciones de la memoria estn desarrollando para la gestin de sus
propias colecciones13 a fin de que pudiesen ser reutilizados en proyectos especficos, bien em-
pleando las estructuras semnticas y los trminos ya existentes, bien expandindolos con nuevas
incorporaciones.
En tercer lugar, hemos de ser conscientes de que la publicacin en abierto de los datos
y metadatos y su codificacin en estructuras semnticas normalizadas se est desarrollando a
diversas velocidades como ya apunt al inicio de este texto, existiendo importantes desequili-
brios entre pases y comunidades. Esto no constituye un problema menor; por el contrario, ge-
nera un nuevo espacio desde el que seguir ahondando en las desigualdades que tambin estn
asociadas a la expansin de la cultura digital. Si son los pases del bloque Norte los que estn
trabajando con mayor intensidad en polticas de datos abiertos y enlazados, las investigaciones
volvern a centrarse en los recursos materiales y en los bienes patrimoniales de determinadas
instituciones, territorios y contextos aquellos sobre los que se puede investigar utilizando estas
metodologas, quedando el resto conminados a formar parte de una nueva marginalidad.

3. Nuevos contextos y escenarios


Como indiqu al inicio de este texto, nuevos actores se incorporan a la construccin y uso de
vocabularios, categoras y estructuras semnticas para la descripcin de los acervos culturales.
The Art Genome Project, desarrollado por la empresa norteamericana Artsy14, constituye un buen
punto de arranque para la reflexin que quiero proponer en este epgrafe. Artsy es una plata-
forma digital que naci para intermediar en procesos de compra-venta de obras artsticas. Sin
abandonar este propsito, actualmente se ha convertido en un ingente yacimiento de informacin
estratgica sobre el sector. Artsy registra obras artsticas fundamentalmente en venta, pero no
solo, coleccionistas, artistas, galeras, museos, etc. En este contexto se explica el Art Genome,
un vocabulario controlado sobre arte y diseo desarrollado internamente por Artsy que incluye
estilos y movimientos artsticos, conceptos, atributos visuales, contextos geogrficos, materiales
y tcnicas, etc. Actualmente cuenta con ms de 1000 trminos. Es de este vocabulario del que se
toman los metadatos descriptivos que se agregan a las obras de arte y a los artistas registrados en
la plataforma. As pues, el Art Genome es el sistema de clasificacin y la infraestructura tecnol-
gica en la que se sustenta Arsty, siendo la principal va de acceso a su informacin.
Sin duda, resulta interesante explorar este vocabulario para descubrir el establecimiento de
nuevas dimensiones categoriales; por ejemplo, las relacionadas con los atributos visuales o los
efectos sensoriales, que nos permiten acceder a los objetos artsticos desde otras perspectivas. La
exploracin de nuevas perspectivas de acceso no es ajena a los objetivos de Artsy: hacer sus regis-
tros ms accesibles, ms discoverable para sus clientes, de ah que una de sus estrategias sea ex-
plorar las expectativas de sus usuarios, que son principalmente coleccionistas, galeristas y artistas.
Sin embargo, es necesario tambin enfocar este proyecto desde un discurso crtico. Su
filosofa explcitamente declarada es detectar las caractersticas (llamadas genes) que conec-
tan entre s a artistas y obras de arte a lo largo de la historia. Cada una de las palabras del Art
Genome denomina una caracterstica, entendida como gen, por lo que la idea ltima sera re-
construir una especie de ADN de las obras artsticas15. As pues, la clave del Art Genome Project
no reside tanto en el vocabulario en s, sino en el Genome Connection, esto es, en la conexin

Como est haciendo ya el Ministerio de Cultura, Educacin y Deporte con los Tesauros del Patrimonio Cultural de Espaa:
13

<http://tesauros.mecd.es/tesauros/tesauros>. [Consulta: 1 de marzo de 2016].


<http://www.artsy.net>. [Consulta: 10 de noviembre de 2015].
14

Vase en: <https://www.artsy.net/article/theartgenomeproject-genome-connection-three-artists-take-on-the>. [Consulta: 10


15

de noviembre de 2015].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
124

que a travs de este vocabulario se establece entre los distintos elementos registrados. De este
modo, como dicen sus propios desarrolladores: Art Genome Project aims to create a classifica-
tion system that retains the nuances and mysteries within art and allows anyone with an Internet
connection the opportunity to learn about art and art history16. Este propsito resulta muy loa-
ble, pero si tenemos en cuenta el modelo de negocio de Artsy, el Genome Connection que acta
estableciendo conexiones entre obras, artistas y coleccionistas que comparten atributos entre ellos
(genes) constituye sobre todo y fundamentalmente un potente mecanismo de recomendacin
sobre el que se sustenta y expande el negocio de Artsy: la compra-venta de obras de arte. Por
supuesto, el hecho de que los fines subyacentes al proyecto sean comerciales no es en s mismo
un factor repudiable, pero s que nos impele a desplegar un pensamiento crtico, independiente-
mente del valor que le podamos reconocer y que de hecho le reconocemos a este vocabulario
para proponer nuevos conceptos o categoras de clasificacin. En este sentido apunto dos lneas
sobre las que, en mi modesta opinin, se debe reflexionar.
Por una parte, Artsy representa uno de estos nuevos actores globales a los que me refera
al inicio de este texto ligados a los oligopolios del software y de los datos, pues la relevancia de
Artsy radica, realmente, en el desarrollo de potentes dispositivos de computacin para conectar
elementos entre s y en una acumulacin ingente de datos estratgicos, entre los que se englo
ban las interacciones de los usuarios y sus prcticas de bsqueda en la plataforma. Pues bien,
estos nuevos actores, entre los que yo incluyo a Artsy, son susceptibles de convertirse en nuevas
instituciones de legitimacin cultural en convivencia paralela con las instituciones tradicionales.
Esta cuestin no es balad; es importante recordar que estos lenguajes descriptivos y clasificato-
rios de carcter normalizador implican discursos normativos sobre cmo se describen, organizan,
ordenan y clasifican los artefactos culturales. En la medida en que estos emanan de instituciones
a las que les reconocemos un estatuto de autoridad, se convierten en discursos en s mismos le-
gitimadores (Rodrguez Ortega, 2014). Pero qu sucede cuando estas instituciones legitimadoras
ya no son solo las instituciones tradicionales de la memoria, sino actores con intereses ajenos a la
convencional tutela del patrimonio? Es necesario, pues, prestar atencin a la posible influencia
que puedan ejercer en la conformacin de nuevas categoras de descripcin y clasificacin.
Por otra parte, sabemos que el uso del lenguaje y de los vocabularios como herramientas y
estrategias empresariales no es nuevo. De hecho, toda la maquinaria de Google en cuanto agen-
cia de publicidad est basada en ello, esto es, en su capacidad para conferir valor monetario a las
palabras, que quedan as convertidas en mercancas17. La capacidad de Google para transformar
el capital lingstico contribuido por todos en un capitalismo lingstico ha sido ya escrito y
debatido (Kaplan, 2014). No son pocos los estudios que describen las estrategias de Google para
vender sus palabras y que reflexionan sobre los efectos que esto y otras estrategias lingsticas,
como el autocompletado pueden tener en la futura evolucin del lenguaje. No quiero redundar
aqu sobre ello, pero s considero necesario actualizar este debate en el terreno que nos intere-
sa, pues, salvando las diferencias entre uno y otro caso18, la filosofa subyacente es la misma: el
potencial de las palabras del Arte Genome deriva de su capacidad para dinamizar procesos de
recomendacin en el marco de una estrategia empresarial. Dicho de otro modo, se transforma un

[El objetivo del Art Genome Project es crear un sistema de clasificacin capaz de preservar los matices y misterios del arte,
16

y permitir a todo aquel con una conexin a Internet el que pueda aprender sobre el arte y la historia del arte, traduccin
de la autora]. Vase en: <https://www.artsy.net/article/theartgenomeproject-introducing-the-art-genome-project>. [Consulta:
10 de noviembre de 2015].
Las palabras y expresiones lingsticas monetarizadas por Google pueden ser compradas por las empresas en una es-
17

pecie de subasta en la que se dirime su mayor o menor posicionamiento en el sistema de anuncios de Google. Natu-
ralmente, el valor de estas palabras vara a lo largo del ao, por ejemplo durante los periodos vacacionales, en los que
unas palabras adquieren mayor valor que otras. Vase la explicacin del mtodo en: <https://support.google.com/adwords/
answer/1704424?authuser=0>, [Consulta: 1 de noviembre de 2015], especialmente lo relativo al Planificador de palabras
clave.
El funcionamiento es distinto, pues en Google media solo un determinado algoritmo que trabaja sobre el conjunto de pa-
18

labras que el buscador rene diariamente a travs de las interacciones de los usuarios; y en Artsy trabaja un conjunto de
expertos que deciden qu palabras incluir y cules no.

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
125

material lingstico con un valor semntico y con una funcin epistmica en el ms amplio sen-
tido del trmino en un dominio dado (clasificacin, descripcin, generacin de conocimiento,
etc.) en un recurso potencialmente aprovechable desde un punto de vista econmico.
Otro de los escenarios que hay que considerar como contexto diverso a los tradicionales
acadmicos e institucionales es el representado por los colectivos de artistas, comisarios y expertos
que actan de manera autnoma y autogestionada, y que poseen un indudable potencial para pro-
vocar una revulsin en los procesos de construccin de vocabularios y categoras de descripcin.
Como ejemplo de este potencial podemos considerar el principio de intervencin llevado a cabo
en el marco del proyecto Archivos en uso19, comandado por la Red Conceptualismos del Sur20 y el
Grupo de Estudios sobre Arte, Cultura y Poltica en la Argentina Reciente. Archivos en uso, cuyo
objetivo es salvar la memoria de determinados procesos del arte latinoamericano, se enmarca dentro
del inters creciente que la constitucin, visibilidad, socializacin y uso de los archivos relacionados
con las prcticas artsticas en Latinoamrica ha experimentado en la ltima dcada. La preservacin y
acceso a los acervos documentales, muchos de ellos en peligro de prdida, ha dado lugar a diversas
iniciativas que se pueden consultar en la propia web de la Red Conceptualismos del Sur.
Pero, sobre todo, se ha alertado de la tensin que genera la constitucin o, mejor dicho,
apropiacin de estos archivos por parte de las instituciones legitimadoras del sistema del arte
contemporneo (museos, coleccionistas privados, instituciones corporativas). Hay que tener en
cuenta que estos archivos documentan principalmente prcticas de resistencia y disensin res-
pecto de los discursos legitimadores, por lo que su potencia crtica corre peligro de desactivarse
si estas prcticas son documentadas y descritas por las mismas instituciones frente a cuyos dis-
cursos hegemnicos se instituyeron. As pues, la configuracin de regmenes de archivo alter-
nativos emerge como una necesidad crtico-poltica de primer orden. Este posicionamiento se
evidencia en la propia construccin de los vocabularios utilizados para su descripcin, que di-
fieren en determinados casos de los empleados por las instituciones tradicionales. Encontramos,
por ejemplo, categoras denominadas conceptos fetiche o ideas fuerza en las que se recoge un
vocabulario que remite al carcter poltico, crtico y desinstitucionalizador de las prcticas que se
documentan. Asimismo, se observa una mayor relacin con los conceptos clave del discurso del
arte del siglo xx, y con los que han dado forma a la teora crtica de la cultura de nuestro tiempo.

Figura 7. Captura de pantalla de Archivos en Uso. Disponible en: <http://www.archivosenuso.org>. [Consulta: 10 de noviembre de 2015].

19 <http://www.archivosenuso.org>. [Consulta: 10 de noviembre de 2015].


20 Plataforma de investigacin, discusin y toma de posicin colectiva desde Amrica Latina, fundada en 2007. Vase en:
<http://redcsur.net/>. [Consulta: 1 de febrero de 2016].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
126

La diferencia se hace ms significativa si comparamos este tipo de vocabulario con


el empleado por el MNCARS en sus prcticas de documentacin. As, si para buscar en el
sistema del MNCARS utilizamos pongamos por caso los trminos apropiacionismo, for-
malismo, formalidad, poscolonialismo, poscolonialidad, ritual, fetichismo, esto es, con-
ceptos que se alejan de las categoras vinculadas a la descripcin material y a la clasificacin
tradicional de los artefactos culturales, la bsqueda resulta infructuosa. Intuimos, por tanto,
que estos trminos no forman parte de su vocabulario documental21, pese a ser claves en los
discursos del arte de los siglos xx y xxi, y a cuya luz las propuestas artsticas de este periodo
cobran sentido.
Esta circunstancia me lleva a plantear una lnea de reflexin importante: la necesidad de
buscar un acuerdo entre lo que interesa para el registro y documentacin de los artefactos cultu-
rales con vistas a su clasificacin, gestin y acceso, y las expectativas de los usuarios esto que
Arsty ha visto tan claro. Dicho de otro modo, es necesario buscar un reequilibrio entre lo que
los usuarios esperan encontrar y los sistemas que las instituciones necesitan. Es en este escenario
de confluencias en el que es posible establecer relaciones muy productivas entre documenta-
listas, investigadores, artistas, comisarios, desarrolladores informticos, expertos en curadura
digital y ciudadanos en general con el objetivo de explorar nuevas vertientes de vocabulario que
nos permitan ampliar el corpus de preguntas que se pueden plantear a las colecciones digitales
de los acervos culturales. De este modo, estaremos trabajando en el enriquecimiento de sus po-
sibilidades cognitivas y epistmicas; en definitiva, en el incremento de sus posibilidades como
los entornos de descubrimiento que quieren llegar a ser.
Otro modelo de prcticas asociadas al uso y construccin de vocabularios y estructuras
semnticas es el que se relaciona con las plataformas de produccin social, esto es, aquellas
en las que interviene una multiplicidad de actores, con bagajes formativos e intereses muy
diversos, globalmente distribuidos y con dinmicas de participacin flexibles y poco aprio-
rsticas.
Fijmonos en que hasta ahora hemos estado hablando de bases de datos y repositorios
preexistentes o construidos ad hoc para proyectos especficos que han sido estructurados de
manera consistente a travs de procesos consensuados y estndares documentales. Pero si nues-
tro horizonte es la sociedad de datos, tenemos que referirnos irremediablemente tambien a la
web en su globalidad. Por tanto, cuando nos preguntamos cmo funcionan los vocabularios y
los dispositivos utilizados para la descripcin de los artefactos culturales, no podemos circuns-
cribirnos solo al territorio de las bases de datos y los repositorios estructurados es decir, ese
territorio que podemos controlar, sino que hemos de considerar la web en su totalidad, esto
es, ese espacio de contenidos distribuidos, heterogneos, semiestructurados o completamente
desestructurados, y en fluencia continua. En este contexto, quiero aludir a dos tipos de proyec-
tos que nos ofrecen claves interesantes de interpretacin.
Uno de ellos es el llevado a cabo hace un par de aos por un grupo de investigadores de
la Universidad Tecnolgica de Viena (Goldfarb et alii, 2012). Su objetivo era indagar en reposi-
torios de informacin construidos socialmente para examinar cmo se configura su estructura
semntica subyacente a partir de la contribucin descentralizada y distribuida de distintos acto-
res, y especialmente cmo esta estructura contrasta con los repositorios construidos siguiendo
directrices normalizadas establecidas a priori por grupos de expertos. En concreto, el estudio
compara las diferentes estructuras de conocimiento que emergen a partir del mismo conjunto
de biografas segn estas se encuentren en el Union List of Artist Names (ULAN)22 desarrollado
por el Getty Research Institute o en Wikipedia. Lo que se analizan son las conexiones interper-
sonales que aparecen en ambos repositorios: unas, las del ULAN, decididas directamente por el

Digo intuimos porque el vocabulario empleado para la documentacin de las prcticas artsticas y los artefactos cultura-
21

les no est accesible y, por tanto, no se puede consultar.


22Vocabulario controlado que ofrece informacin estructurada sobre artistas y otros actores del dominio artstico. Vase en:
<http://www.getty.edu/research/tools/vocabularies/ulan/>. [Consulta: 1 de noviembre de 2015].

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
127

equipo editorial de acuerdo con unos criterios acordados a priori segn hemos dicho; otras,
las de Wikipedia, deducidas de las interconexiones establecidas sin un plan previo por la di-
versidad de sus participantes.

Figura 8. Distribucin de las distancias de los enlaces establecidos entre los artistas (escala logartmica) ( Doron Goldfarb).

En el grfico de la Figura 8 se observa cmo el ULAN muestra una estructuracin ms


regular y simtrica frente a la mayor irregularidad de los sistemas creados por crowdsourcing.
Dado que los fenmenos culturales y sociales, considerados en su complejidad y diversidad,
difcilmente responden a estructuras tan regulares, estas grficas hacen visible el carcter
construido de este tipo de repositorios, cuyas estructuras nos hablan ms de las prcticas de
los individuos y de las organizaciones que los crean, que de los fenmenos socio-culturales
que estn tericamente describiendo. Por su parte, la visualizacin de las conexiones en Wi-
kipedia (Figura 9) nos proporciona una fotografa de la visin que sobre un determinado fen-
meno tiene una multiplicidad de individualidades pertenecientes a una o varias comunidades.

Figura 9. Visualizacin de los enlaces establecidos en Wikipedia ( Doron Goldfarb).

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
128

Nos encontramos, as, ante la confrontacin de dos modos de construccin semntica que
conviven en nuestro mundo contemporneo, viabilizando, cada una de ellos, una determinada
representacin del conocimiento.
El otro proyecto al que quiero referirme es HuNi. El proyecto australiano HuNi indaga
en la construccin especfica de arquitecturas de la participacin que tratan de cuestionar
los modelos basados en la aplicacin apriorstica de determinadas estructuras o estndares23.
HuNi es una infraestructura tecnolgica que congrega datos de mltiples fuentes (bases de
datos, repositorios, sitios web, etc.) de contenido cultural. Est estructurada siguiendo los
parmetros propios de una ontologa (entidades y relaciones), pero en vez de partir de una
ontologa previamente diseada a la que hay que acomodarse cuando se trata de registrar y
documentar los datos, HuNi deja libertad para que sean los propios usuarios los que esta-
blezcan las relaciones entre las diversas entidades que s estn definidas. Podemos decir,
por tanto, que nos encontramos ante una ontologa producida socialmente, de abajo-arriba,
fluida y adaptativa, que transforma el objetivo tradicional de las ontologas al uso, pues en
vez de tratar de ajustar los datos a un marco normativo preexistente, el propsito ltimo de
HuNi es capturar las diferentes perspectivas de los usuarios a medida que la ontologa se
va construyendo. Este planteamiento se inscribe en la emergente nocin de Social Linked
Data, que viene a revisar las estrategias de Linked Open Data. Es decir, es la idea de que,
frente al tradicional nfasis puesto en el open data la apertura de los datos, el LOD tam-
bin debera ser explorado a travs de un open linking apertura de las relaciones (Ver-
hoeven, 2014: 213).
Sea como fuere, este tipo de proyectos vuelve a incidir en la reflexin planteada en prra-
fos anteriores: la necesidad de contar con las comunidades que estn utilizando y produciendo
esos datos o que estn directamente relacionados con ellos en los procesos asociados a su
construccin, uso y produccin.
Con todo, este tipo de proyectos tambin tiene sus contrapartidas, que no residen tanto
en la mayor o menor dificultad tecnolgica que representa el desarrollo de las infraestructuras
necesariaspara lo cual disponemos de un conocimiento avanzado, sino en la capacidad para
dinamizar la participacin de los potenciales usuarios, sobre todo en comunidades que son poco
dadas a ello. Nos encontramos, as, con un nuevo reto sobre el que trabajar.
La construccin social de vocabularios para la descripcin de los acervos culturales no
es, sin embargo, un hecho nuevo. El denominado etiquetado social (social tagging), entendido
como la prctica descentralizada mediante la cual individuos o comunidades crean, gestionan y
comparten trminos para anotar y categorizar los recursos digitales en un entorno social, lleva
muchos aos desarrollndose. De hecho, en la actualidad ha llegado a convertirse en una praxis
institucionalizada que se ha incorporado como una actividad ms en no pocos museos; en algu-
nos casos de una manera ms libre; en otros, ms controlada a partir de tesauros previos como
sucede en el Centre Pompidou, lo cual, obviamente, limita su capacidad creativa, que es en
donde radica la potencialidad del social tagging para enriquecer la construccin de vocabularios
aportando puntos de vista alternativos.
Es cierto que sobre el social tagging se ha escrito mucho, y no querra yo redundar en co-
sas ya debatidas y que seguramente el lector conocer, pero me gustara mencionar dos aspectos
que, a mi parecer, requieren todava de una atenta consideracin por parte de los historiadores
del arte y de la cultura.
El primero tiene que ver con la formulacin de dos preguntas: hasta qu punto estas prc-
ticas descentralizadoras han supuesto una alternativa a los vocabularios construidos por parte de
las instituciones tradicionales?; y hasta qu punto su potencia crtica, subversiva o simplemente
alternativa se ha visto atemperada por los procesos de institucionalizacin que han experimen-
tado? Ambas preguntas demandan todava una respuesta.

<https://huni.net.au/#/search>. [Consulta: 1 de noviembre de 2015].


23

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
129

El segundo aspecto concierne a la toma de conciencia de la riqueza que este material


contribuido por los ciudadanos en sus interacciones digitales con los acervos culturales nos
proporciona para analizar desde mltiples puntos de vista cmo estos se conceptualizan, entien-
den, recepcionan y experimentan. Sinceramente creo que la aplicacin de tecnologas de social
web mining para analizar todo este material aportara resultados inditos en relacin con estos
procesos, teniendo en cuenta, adems, que ahora podemos analizarlos en un ecosistema global
y multicultural24 (Rodrguez Ortega, 2013).
Finalmente, en este contexto que estamos considerando, quiero llamar la atencin sobre la
fuente extraordinaria que para la construccin de vocabularios desde otras perspectivas semn-
ticas representan los blogs desarrollados por artistas individuales o colectivos, quienes ejercen
una actividad continua de etiquetado de sus propias entradas y publicaciones. La eclosin que la
blogosfera de contenidos artsticos ha experimentado en los ltimos aos se convierte, as, en un
magnfico caudal en el que bucear mediante estrategias de web mining. Adems, hay que tener
en cuenta que estas etiquetas o trminos provienen de los actores que estn directamente impli-
cados en los procesos de produccin artstica, por lo que integrarlos como parte de las fuentes
y materiales que utilizamos en la construccin de vocabularios contribuira tambin a esa nece-
sidad de acuerdo a la que me he estado refiriendo de manera insistente a lo largo de este texto.

Bibliografa
Battles, M., y Loukissas, Y. (2013): Data Artifacts: Visualizing Orders of Knowledge in Mega-Meta
Collections, en Proceedings of the UDC Seminar in Classification and Visualization. Wrz-
burg: Ergon Verlag.
Goldfarb, D. et alii (2012): Comparing Art: Historical Networks, en Arts, Humanities, and Complex
Networks. Edicin de Maximilian Schich et alii. Cambridge: MIT, (Leonardo ebook Series).
Kaplan, F. (2014): Linguistic Capitalism and Algorithmic Mediation, Representations, n. 127, Sum-
mer, University of California, pp. 57-63.
(2015): A Map for Big Data Research in Digital Humanities, Frontiers in Digital Humanities,
April 2015. Disponible en: <http://journal.frontiersin.org/article/10.3389/fdigh.2015.00001/
full>. [Consulta: 20 de julio de 2015].
Le Boeuf, P. et alii (2012): Definition of the CIDOC Conceptual Reference Model. Version 6.2. ICOM/
CIDOC.
Lincoln, M. D. (2015a): The Art Historians Macroscope: Museum Data and the Academy,Matthew
Lincoln (blog), 21 May 2015. Disponible en: <http://matthewlincoln.net/2015/05/21/the-art-
historians-macroscope.html> [Consulta: 1 de noviembre de 2015].
(2015b): DH2015: Modelling the (Inter)national Printmaking Networks of Early Modern Europe,
Matthew Lincoln(blog), 30 Jun 2015. Disponible en: <http://matthewlincoln.net/2015/06/30/
dh2015-modelling-the-international-printmaking-networks-of-early-modern-europe.html>.
[Consulta: 1 de noviembre de 2015].
Lu, C. (2013): Exploiting Social Tagging Network for Web Mining and Search, Philadelphia: Drexel
University.
Rodrguez Ortega, N. (2013): Mediacin digital en los procesos de recepcin, construccin e inter-
pretacin de la herencia cultural, en Memoria y significado. Uso y recepcin de los vestigios del
pasado. Edicin de Luis Arciniega. Valencia: Universidad de Valencia, pp. 443-461.
(2014): Canon, Value and Artistic Culture: Critical Inquiry about the New Processes of As-
signing Value in the Digital Real, en Digital Humanities Annual Conference2014. Books

Sobre las potencialidades de exploracin del etiquetado social puede consultarse: Lu, 2013.
24

El lenguaje del patrimonio | Pgs. 115-130


Construccin y uso de terminologas
130

of abstracts, Lausanne, 9-11 de julio de 2014: Ecole Polytechnique Fderele de Lausanne y


Universidad de Lausanne, pp. 331-333.
Surez, J. L. et alii (2013): Towards a Digital Geography of Hispanic Baroque Art, Literary and Lin-
guistic Computing, n. 13, Oxford University Press, pp. 1-18.
Verhoeven, D. (2014): Doing the Sheep Good. Facilitating Engagement in Digital Humanities and
Creative Arts Research, en Advancing Digital Humanities. Research, Methods, Theories. Edi-
cin de Katherin Bode y Arthur Paul Longley. Hampshire: Palgrave MacMillan, pp. 206-220.

El lenguaje del patrimonio | Pgs. 115-130


131

La normalizacin terminolgica aplicada a la conservacin y


restauracin del patrimonio cultural
Ana Mara Calvo Manuel
Universidad Complutense de Madrid. Facultad de Bellas Artes

A travs de estas lneas nos proponemos ofrecer el panorama de los glosarios y de la normaliza-
cin terminolgica en materia de conservacin y restauracin del patrimonio cultural.
El rea de conocimiento en conservacin y restauracin del patrimonio cultural es un
mbito de muy reciente implantacin, por ello se hace todava ms necesaria la normalizacin
terminolgica. Sin un lenguaje comn, en un espacio que cuenta con tan variadas profesiones
intervinientes (conservadores, historiadores, arquelogos, arquitectos, archiveros, artistas, qu-
micos, bilogos, fsicos, fotgrafos, etc.) debido a la multi y pluridisciplinariedad de los trabajos
que se llevan a cabo, sera difcil el entendimiento y el avance cientfico.
A pesar de los esfuerzos que se han realizado a travs de los diccionarios y glosarios ela-
borados en los ltimos aos, veremos como algunos matices terminolgicos todava no presen-
tan la unidad necesaria. Y esto ocurre no solo en castellano, sino tambin en lenguas como la
inglesa, que se impone actualmente en el contexto de las ciencias experimentales aplicadas al
patrimonio cultural. Por ello, todava estamos lejos de contemplar una normalizacin completa
en este campo.
En relacin con los primeros diccionarios vinculados a la conservacin-restauracin, po-
demos hablar de algunos precedentes en esta materia, como la obra de Gettens y Stout (1966),
Painting Materials. A Short Encyclopaedia. Este libro, a pesar de ser una referencia fundamental
de mediados del siglo xx, no aborda exactamente aspectos especficos de conservacin, sino
que trata fundamentalmente de tcnicas pictricas y materiales de pintura. Con todo, es evi-
dente que el conocimiento de dichos aspectos es fundamental para la conservacin de las
pinturas. Tambin en esa misma lnea, el Getty Conservation Institute public en aos sucesivos
su serie de Looking at A guide to technical terms, como, por ejemplo, Looking at Paintings,
de Dawson W. Carr y Mark Leonard (1992).
Ms cercano al tema que nos ocupa, el proyecto NARCISSE (Network of Art Research
Computer Image Systems in Europe), que tuvo lugar entre los aos 1990 y 1994, coordinado por

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
132

el Laboratoire de Recherche des Muses de France, tena como objetivo crear un banco de datos
de las obras ms importantes de los museos de Europa a base de documentacin tcnica (foto-
grafas con luz visible, ultravioleta e infrarroja, y radiografas), bsicamente centrado en pintura
de caballete. Como resultado del proyecto se edit un CD-ROM con un glosario especializado
sobre el tema.
Sin embargo, desde el punto de vista especfico de conservacin y restauracin, van a
ser, sobre todo, los breves glosarios publicados en los apndices de los libros tcnicos sobre la
materia los que darn las pautas de una terminologa tcnica ms precisa.
As pues, cuando en 1994 recibimos el encargo de realizar un diccionario de trminos
de conservacin y restauracin, para la coleccin Cultura Artstica que iniciaba Ediciones del
Serbal, dirigida por Joan Sureda, el primer gran problema al que nos enfrentbamos era el de
la seleccin de las propias entradas, puesto que se trataba de un mbito en el que debamos
contar con trminos artsticos, qumicos, fsicos, biolgicos y tcnicos especficos. Basndonos
en dichos glosarios que formaban apndices de publicaciones en la materia, y en los libros
precedentes citados, hicimos una propuesta que se concret en el libro Conservacin y restau-
racin. Materiales, tcnicas y procedimientos. De la A a la Z (Calvo, 1997). Esta obra ha tenido
gran repercusin en el mbito profesional y se han llegado a hacer cuatro reediciones (Figura 1).

Figura 1. Ana Calvo. Conservacin y restauracin. Materiales,


tcnicas y procedimientos. De la A a la Z. (1997).

En italiano se haba publicado, en 1992, Lessico del restauro por Cristina Giannini, pero
no se trataba de un diccionario o glosario, sino de un ensayo que relataba la evolucin de la
profesin. Sin embargo, la misma autora, junto con Roberta Roani, editaron en el ao 2000,
la obra Dizionario del restauro e della diagnostica, que fue traducida y publicada en castellano
por la editorial Nerea en 2008. Tambin en italiano se public en 2005 el Glossario delle tech-
niche artistiche e del restauro, a cargo de Claudio Paolini y Manfredi Faldi, en una edicin del
Palazzo Spinelli de Florencia.
En el ao 2003 se publica en Espaa, en la coleccin de diccionarios tcnicos de la edito-
rial Akal, Conservacin y restauracin de bienes culturales. Espaol - Alemn - Ingls - Italiano
- Francs, un diccionario multilinge, dirigido por Celia Martnez Cabetas y Lourdes Rico Mart-
nez, que, aunque no incluye definiciones sino nicamente la correlacin de los trminos en las
lenguas citadas, supuso una afirmacin de la terminologa tcnica en nuestro campo (Figura 2).

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
133

Figura 2. Celia Martnez Cabetas y Lourdes Rico Martnez (coords.). Conservacin


y restauracin de bienes culturales.
Espaol - Alemn - Ingls - Italiano - Francs. (2003).

En Barcelona, Mireia Xarri (2005, 2006a, 2006b, 2007), comenz a trabajar en unos glo-
sarios especializados en conservacin, publicndolos en primer lugar en ingls y, finalmente en
2007, un volumen en castellano.
Mucho ms recientemente han aparecido el Glosario de trminos tcnicos para restaura-
cin y museologa, de Marcos Rivadeneira y Guillermo Narvez, en edicin latinoamericana, en
2013; y Vademcum del conservador. Terminologa aplicada a la conservacin del Patrimonio
Cultural, de Javier Madrona Ortega, en 2015 (Figura 3).

Figura 3. Javier Madrona Ortega. Vademcum


del conservador. Terminologa aplicada a la conservacin
del Patrimonio Cultural. (2015).

Los ttulos citados hasta ahora eran de tipo generalista en torno a conservacin y restau-
racin. Adems, han aparecido a travs de los aos glosarios especializados en algn tipo de
material u objeto artstico y cultural especfico. Por ejemplo, en 1997 se public Conservacin de

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
134

libros y documentos. Glosario de trminos tcnicos. Ingls - Espaol. Espaol - Ingls, de John Mc.
Cleary; en francs, en este caso, contamos con el Petit glossaire lusage du conservateur-res-
taurateur de sculpture, editado en 2006 por el Institut Royal du Patrimoine Artistique de Bruxe-
lles, con la coordinacin de Myriam Serck-Dewaide en el contexto de un proyecto europeo
denominado CRISTAL. Ms recientemente se ha publicado tambin: Diccionario tcnico Akal
de materiales de restauracin, elaborado por Salvador Muoz Vias, Julia Osca Pons e Ignasi
Girons Sarri (2014), centrado, como su nombre indica, en la descripcin y caractersticas de
algunos de los ms importantes materiales que utilizamos en las intervenciones de conservacin-
restauracin (Figura 4); y EWAGLOS European Illustrated Glossary for Conservation Terms of Wall
Painting and Architectonic Surfaces (2015), referido a pinturas murales y superficies arquitect-
nicas, resultado tambin de un proyecto europeo, por lo que aparecen las definiciones en ingls
con traduccin a blgaro, croata, francs, alemn, hngaro, italiano, polaco, rumano, espaol y
turco. Este ltimo se encuentra disponible gratuitamente en internet <http://www.ewaglos.eu>
y cuenta asimismo con edicin impresa en papel. Igualmente est accesible desde 2010 en la
web la publicacin de ICOMOS sobre las formas de alteracin de la piedra: Illustrated glossary
on stone deterioration patterns, en la coleccin Monuments and Sites XV, en versiones en ingls
y en francs. Otro ejemplo, vinculado en este caso a la conservacin de mosaicos, sera el Illus-
trated Glossary: Technician Training for the Maintenance of In Situ Mosaics, disponible desde
2013, tambin online en diferentes idiomas, entre las publicaciones de The Getty Conservation
Institute.

Figura 4. Salvador Muoz Vias, Julia Osca


Pons e Ignasi Girons Sarri. Diccionario tcnico
Akal de materiales de restauracin. (2014).

En Espaa contamos con las publicaciones, en papel pero tambin recientemente digitali-
zadas y disponibles on line, del Ministerio de Educacin, Cultura y Deporte, en sus Colecciones
en Red CERES, con libre acceso a todos los tesauros y diccionarios creados para normalizar el
lenguaje de las bases de datos. Sin embargo, en el mbito especfico de la conservacin-res-
tauracin, cabe destacar el libro Proyecto COREMANS: Criterios de intervencin en materiales
ptreos (Laborde, 2013), tambin del Ministerio pero gestionado por el Instituto del Patrimonio
Cultural de Espaa (Figura 5).

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
135

Figura 5. Ana Laborde (coord.). Proyecto COREMANS:


Criterios de intervencin en materiales ptreos. (2013).

En relacin con los materiales y las tcnicas, es necesario citar asimismo dos glosarios
o enciclopedias accesibles en Internet: CAMEO y Polyevart. La primera ha sido desarrollada
por el Museum of Fine Arts de Boston en ingls: <http://cameo.mfa.org/wiki/Main_Page>; y la
segunda est en espaol, y ha sido creada y ampliada por el Ministerio de Cultura a travs de
proyectos de investigacin: <http://www.mecd.gob.es/cultura-mecd/areas-cultura/patrimonio/
mc/polyevart/ glosario.html>.
Para esas bsquedas de diccionarios y glosarios especficos sobre conservacin y restau-
racin, contamos actualmente con unas amplsimas bases de datos bibliogrficas online que nos
permiten bucear y encontrar ttulos antiguos y modernos sobre este tema. Destacaramos los
Abstracts of International Conservation Literature del Getty - AATA online <http://aata.getty.edu/
Home> (Figura 6) y The Bibliographic Database of the Conservation Information Nerwork - BCIN
<http://www.bcin.ca/> (Figura 7).

Figura 6. Abstracts of International Conservation Literature


del Getty - AATA online <http://aata.getty.edu/Home>.

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
136

Figura 7. The Bibliographic Database of the Conservation Information Nerwork -BCIN <http://www.bcin.ca/>.

Siguiendo la idea de la normalizacin en todos los campos, tambin en la Conservacin


del Patrimonio Cultural se ha creado, por parte del CEN European Committee for Standardiza-
tion, un grupo de trabajo para el mbito de la Conservacin del Patrimonio Cultural, el CENT
TC 346. Entre los diversos documentos ya aprobados, destacamos Principales trminos generales
y definiciones, norma espaola UNE-EN 15898, publicado en castellano en marzo de 2012 (AE-
NOR, 2012).
A pesar de todos los trabajos citados, la terminologa de conservacin y restauracin de-
ber ser continuamente actualizada. Existen trminos como retoque, repinte y reintegracin
cromtica, cuyas interpretaciones han variado a lo largo del tiempo. Incluso contempornea-
mente algunos vocablos, como retouching e inpainting, que se utilizan como sinnimos
en ingls, se han impuesto en pases diferentes, en el primer caso en Gran Bretaa, y en el
segundo en Estados Unidos (Calvo, Bailo, 2014). Publicaciones recientes lo confirman, como
Mixing and Matching. Approaches to Retouching Paintings (Ellison; Smithen y Turnbull, 2010),
editado en Londres; y Painting Conservation Catalog. Volume III: Inpainting (Metzger, 2011),
en Estados Unidos.
Por la palabra retoque se entiende en el mbito artstico como aquellos toques sobre la
obra original, realizados por el propio artista, a modo de toques finales para corregir o perfec-
cionar su obra (Calvo, 1997). Esos toques originales, que deca Francisco de Goya, aportaban
la genialidad a las pinturas. Como tal, siguiendo ese sentido, se emplea tambin para describir
un aspecto de la tcnica de reintegracin del color, que se realiza sobre el barniz en la propia
pintura original, para mitigar el efecto de desgastes que presentan las obras por deterioros del
tiempo. As lo empleaba tambin Vasari, cuando en sus Vidas de artistas ilustres (1568) deca que
sera mejor, algunas veces, quedarse con las cosas hechas por hombres excelentes un poco des-
truidas, que hacerlas retocar por quien sabe mucho menos. Sin embargo, en el contexto profe-
sional denominamos repinte a la aplicacin de color sobre un original con intencin de reparar
u ocultar daos, o de modificar el aspecto que realiza una persona diferente al artista y en una
poca posterior. Casi siempre tiene una connotacin peyorativa. De esta forma, el trmino ac-
tualmente ms apropiado para denominar la restitucin del color en una zona perdida del origi-
nal, que haga posible la integracin esttica del conjunto, sera reintegracin cromtica. Dicho

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
137

trmino se impuso, segn Sgolne Bergeon (1996), en el Instituto del Restauro de Roma por
Cesare Brandi. Anteriormente, Paul Philippot (1959) haba utilizado la expresin integracin.
En mbitos ms genricos podramos citar tambin el Art & Architecture Thesaurus Online,
de The Getty Research Institute, <http://www.getty.edu/research/tools/vocabularies/aat/>, que
est en fase de traduccin a otras lenguas desde Holanda. Mientras que, en contextos ms limi-
tados, como en la docencia en el Grado de Conservacin y Restauracin del Patrimonio Cultural
de la Facultad de Bellas Artes de la Universidad Complutense de Madrid, hemos trabajado en
una base de datos para un glosario que sirviera de base terminolgica para alumnos y docentes
(Calvo et alii,2015). Actualmente, se encuentra publicado online y accesible en pdf. en E-Prints
Complutense <http://eprints.ucm.es/35224/> (Figura 8).

Figura 8. Ana Calvo et alii. Terminologa bsica de conservacin


y restauracin del Patrimonio Cultural 2. Espaol - Ingls - Francs - Italiano -
Alemn. (2016). <http://eprints.ucm.es/35224/>.

As pues, como decamos al inicio, a pesar de tantos avances en materia de publicaciones


de glosarios en conservacin y restauracin, este trabajo debe continuar con objeto de afirmar
los trminos hoy empleados o de incorporar nuevos vocablos de nuestro mbito de trabajo.

Bibliografa
AENOR (2012): Principales trminos generales y definiciones, norma espaola UNE-EN 15898, CENT
TC 346 Conservacin del Patrimonio Cultural.
Alberti, L. et alii (2013): Illustrated Glossary: Technician Training for the Maintenance of In Situ Mo-
saics, Los ngeles: The Getty Conservation Institute, disponible online en <http://www.getty.
edu/conservation/publications_resources/pdf_publications/glossaire_f.html>. [Consulta: 2 de
febrero de 2016].
Bergeon, S. (1996): Couleur et restauration, Techne n. 4. Pars: LRMF, pp. 17-28.
Calvo, A. (1997): Conservacin y restauracin. Materiales, tcnicas y procedimientos. De la A a la Z.
Barcelona: Ediciones del Serbal.

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
138

Calvo, A. et alii (2016): Terminologa bsica de conservacin y restauracin del Patrimonio Cultural
2. Espaol - Ingls - Francs - Italiano - Alemn, disponible en pdf. online en E-Prints Complu-
tense. <http://eprints.ucm.es/35224/> [Consulta: 2 de febrero de 2016].
Calvo, A., y Bailo, A. (2015): Reintegration, integration, inpainting retouching? Question around
terminology, II International Meeting on Retouching of Cultural Heritage - RECH 2, Oporto
(Portugal) 24-25 octubre 2014. Porto: RECH2 PROCEEDINGS, pp. 12-24.
Carr, D. W., y Leonard, M. (1992): Looking at Paintings, (Looking at A guide to technical terms).
Los Angeles: GCI.
Ellison, R.; Smithen, P., y Turnbull, R. (2010): Mixing and Matching. Approaches to Retouching Pain-
tings. Londres: Archetype.
Gettens, R. J., y Stout, G. L. (1966): Painting Materials. A Short Encyclopaedia. Nueva York: Dover
Publications.
Giannini, C. (1992): Lessico del restauro, Florencia: Nardini Editore.
Giannini, C., y Roani, R. (2000): Dizionario del restauro e della diagnostica. Florencia, Nardini Editore.
(2008): Diccionario de restauracin y diagnstico. Guipzcoa: Nerea.
ICOMOS (2010): Illustrated glossary on stone deterioration patterns (Monuments and Sites XV), dis-
ponible online en: <http://www.icomos.org/en/what-we-do/disseminating-knowledge/publi-
cationall/monographic-series/116-english-categories/resources/publications/261-monuments-
asites-xv>. [Consulta: 2 de febrero de 2016].
Laborde, A. (coord.) (2013): Proyecto COREMANS: Criterios de intervencin en materiales ptreos.
Madrid: Secretara General Tcnica, Centro de Publicaciones, Ministerio de Educacin, Cultura y
Deporte. Disponible online en: <https://sede.educacion.gob.es/publiventa/proyecto-coremans-
criterios-de-intervencion-en-materiales-petreos/conservacion-restauracion-patrimonio-historico-
artistico/14516C>. [Consulta: 2 de febrero de 2016].
Madrona Ortega, J. (2015): Vademcum del conservador. Terminologa aplicada a la conservacin
del Patrimonio Cultural. Madrid: Tecnos.
Martnez Cabetas, C., y Rico Martnez, L. (2003): Conservacin y restauracin de bienes culturales.
Espaol - Alemn - Ingls - Italiano - Francs. Madrid: Akal.
Mc. Cleary, J. (1997): Conservacin de libros y documentos. Glosario de trminos tcnicos. Ingls - Es-
paol. Espaol - Ingls. Madrid: Clan Editorial.
Metzger, C. A. (compiler) (2011): Painting Conservation Catalog. Volume III: Inpainting, USA: The
Paintings Specialty Group of the American Institute for Conservation of Historic and Artistic
Works.
Muoz Vias, S.; Osca Pons, J., y Girons Sarri, I. (2014): Diccionario tcnico Akal de materiales de
restauracin. Madrid: Akal.
Paolini, C., y Faldi, M. (2005): Glossario delle techniche artistiche e del restauro. Florencia: Edizioni
Palazzo Spinelli.
Philippot, P. (1959): Le problme de lintegration des lacunes dans la restauration des peintures,
Bulletin de lInstitut royal du patrimoine artistique, II, pp. 5-19.
Rivadeneira, M., y Narvez, G. (2013): Glosario de trminos tcnicos para restauracin y museologa.
Quito: Codeu.
Xarri, M. (2005): Glossary of Conservation I. Barcelona: Balaam.
(2006): Glossary of Conservation II. Barcelona: Balaam.
(2006): Glossary of Conservation III. Barcelona: Balaam.

El lenguaje del patrimonio | Pgs. 131-139


La normalizacin terminolgica aplicada a la conservacin y restauracin del patrimonio cultural
139

(2007): Diccionario de conservacin y restauracin de obras de arte 1 (A-Z). Barcelona:


Balaam.
VV. AA. (2015): EWAGLOS European Illustrated Glossary for Conservation Terms of Wall Painting and
Architectonic Surfaces, disponible online en: <http://projekte.hawk-hhg.de/ewaglos/pages/
download.php>. [Consulta: 2 de febrero de 2016].

El lenguaje del patrimonio | Pgs. 131-139


140

Dimensin poltica y cultural en la armonizacin


terminolgica multilinge: la experiencia del tesauro para la
Red de Informacin del Patrimonio Europeo (HEREIN)
Teresa Abejn Pea
Consejo Superior de Investigaciones Cientficas

El objetivo de este trabajo es comunicar la experiencia adquirida en el proceso de elaboracin


de un lenguaje documental del mbito del Patrimonio Cultural y, en especial, destacar la dimen-
sin poltica y cultural de la armonizacin terminolgica en la elaboracin de tesauros multi-
linges. El artculo se centra en el tesauro de la Red de Informacin del Patrimonio Europeo
(HEREIN), y describe los criterios y la metodologa que se sigui para resolver los problemas
que el contexto poltico y la diversidad cultural plantean en la sistematizacin y normalizacin
contrastiva o multilinge de la terminologa especializada.
En el caso que nos ocupa, el tesauro HEREIN, se planteaba como reto la construccin de
un instrumento comn en el que todas las lenguas tuvieran el mismo estatus. Por otra parte, y
adems de evitar en distintas etapas de elaboracin del tesauro que hubiera lenguas que que-
daran en una posicin de superioridad o prestigio, era importante tratar, respetar y reflejar las
especificaciones propias de cada cultura.

Introduccin
La creacin de la Red europea de informacin sobre el patrimonio cultural estuvo auspiciada
por el Consejo de Europa y su Comit director de Patrimonio. El origen de la creacin de la Red
fue la 4 conferencia europea de ministros responsables de patrimonio cultural organizada en
Helsinki por el Consejo de Europa en 1996, que recomend estudiar la creacin de un sistema
de informacin permanente que permitiera a las administraciones, los profesionales, los inves-
tigadores y los especialistas en formacin conocer la evolucin de la gestin y proteccin del
patrimonio en los distintos pases de Europa, utilizando informes nacionales sobre las polticas
de patrimonio arquitectnico.
La red HEREIN (European Heritage Network o Red de Informacin del Patrimonio Euro-
peo) deba ofrecer al pblico una fuente de datos y de experiencias fundamentales y contrasta-

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
141

das sobre la gestin del patrimonio cultural en Europa; servir como observatorio para analizar y
prever las ventajas que ofrece el patrimonio cultural a una sociedad en rpida mutacin; facilitar
el seguimiento del desarrollo de las polticas de patrimonio y de su conformidad con las con-
venciones; mantener y desarrollar las redes de cooperacin en materia de patrimonio cultural; y
favorecer la cooperacin transnacional.
Se haba solicitado a todos los Estados un primer informe sobre polticas nacionales, pero
esta documentacin, que corresponda al principio a quince pases, constaba nicamente en
papel. Este soporte esttico solo permita una lectura lineal, una difusin limitada y una gestin
centralizada de esta informacin; adems, estaba disponible nicamente en las dos lenguas ofi-
ciales del Consejo de Europa. Para contar con un soporte dinmico, evolutivo y de acceso libre
a esta informacin, se decidi crear un sitio web para la red HEREIN que fuera multilinge y
permitiera contrastar informacin sobre las polticas de proteccin y difusin del patrimonio que
se llevaban a cabo en Europa consultando por pas y tema en una base de datos de informes.
En torno a este recurso se planteaba un sitio web ms completo, mantenido por el Consejo de
Europa, como sistema de informacin permanente e interactivo sobre patrimonio cultural.
Para este sistema de informacin se consider importante elaborar un tesauro multilinge
que ofreciera una sistematizacin terminolgica referida a las polticas nacionales relacionadas
inicialmente con el patrimonio arquitectnico y arqueolgico. El tesauro deba facilitar la nave-
gacin a travs de los distintos informes nacionales accesibles en lnea.
Al apostar por la consulta multilinge y contemplar el desarrollo de un tesauro de estas
caractersticas, el proyecto del Consejo de Europa encontr financiacin en el programa IST de
la Comisin Europea: el programa de Tecnologas de la Sociedad de la Informacin (IST) del V
Programa Marco de IDT (1998-2002) de la Comisin para la comunidad investigadora de la UE.
Este programa inclua lneas de accin como la gestin del conocimiento, un patrimonio para
todos, interactividad natural y plurilinge.
En el comienzo del proyecto, 1998-1999, la idea inicial era construir un tesauro bilinge
en ingls y francs, por ser las lenguas oficiales del Consejo de Europa. El Ministerio de Cultura
de Espaa se interes rpidamente en que el sitio web de la Red tuviera interfaz en espaol y el
tesauro fuera trilinge. As es como se desarroll en una primera etapa (2000-2002) la primera
versin en ingls, francs y espaol.
En una segunda etapa (2003-2004) se decidi ampliar el proyecto a los pases NAS (Newly
Associated States), los recientemente asociados a la Unin Europea, por eso se tradujo el tesauro
HEREIN al hngaro, al polaco, al blgaro, al rumano, al esloveno, etc. Con la financiacin de la
Comisin Europea, el tesauro se ampli incluyendo hasta diez lenguas. El Consejo de Europa
se encarg despus de mantenerlo como sistema permanente de informacin colaborando con
los departamentos ministeriales correspondientes, y financiando la ampliacin a otras lenguas y
su actualizacin hasta el ao 2012. La ltima versin incluye quince lenguas europeas: alemn,
blgaro, croata, esloveno, espaol, fins, francs, griego, hngaro, ingls, neerlands, noruego,
polaco, portugus y rumano.
En cuanto a la participacin espaola en el tesauro HEREIN, el Ministerio de Cultura se
implic en el tesauro desde el inicio del proyecto, pero la Subdireccin General de Proteccin
del Patrimonio Histrico se dirigi al Centro de Informacin y Documentacin Cientfica del
CSIC (CINDOC) en busca de un socio institucional espaol con experiencia en el desarrollo de
tesauros que colaborara con el Ministerio de Cultura. As, el Consejo Superior de Investigaciones
Cientficas comenz a colaborar en el tesauro desde 1999 y sigui participando en su actualiza-
cin hasta el ao 2013.

Objetivos y metodologa del tesauro HEREIN


El tesauro HEREIN, como recurso lingstico multilinge que deba permitir el acceso a
diferentes experiencias y actuaciones nacionales, se tena que desarrollar con una meto-

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
142

dologa apropiada y en un marco de cooperacin internacional. Se concibi como un ins-


trumento comn en el que todas las lenguas deban tener el mismo estatus: la bsqueda
de informacin no poda depender del conocimiento y la utilizacin de una lengua nica
dominante.
La incorporacin de terminologa especfica relativa a las distintas experiencias y actuacio-
nes nacionales era necesaria para contrastar informacin y disponer de un panorama general de
la diversidad europea en la gestin y proteccin del patrimonio. Por esta razn, se admitan con-
ceptos y designaciones especficos, aunque solo se utilizaran en una lengua o un pas, y deban
acompaarse de definiciones. El tesauro deba ser un verdadero reflejo de universos culturales
y polticas diversas.
Quedaba as descartado partir de un solo tesauro monolinge y traducirlo. Igualmente
haba que evitar que el nuevo tesauro multilinge fuera una mera fusin de varios tesauros mo-
nolinges. Haba que considerar adems los aspectos polticos y dar un tratamiento anlogo y
equilibrado a todas las lenguas y a todas las legislaciones nacionales. Por esta razn, y tambin
debido a que no haba un tesauro especializado monolinge que cubriera especficamente las
polticas y los aspectos legales del patrimonio, el tesauro HEREIN se construy ab initio y res-
petando completamente todas las lenguas implicadas, intentando reflejar lo mejor posible las
diferentes estructuras conceptuales y terminolgicas con las cuales podan estar familiarizados
los potenciales usuarios finales: los indizadores y quienes buscan informacin. Esto no quiere
decir que no se atendiera al examen de tesauros como, por ejemplo, el AAT o el Tesauro de
Patrimonio Histrico Andaluz, que incluye un apartado A9 relativo al rgimen jurdico del patri-
monio histrico.
Se pretenda evitar que una lengua fuente se convirtiera naturalmente en la lengua do-
minante. Un tesauro monolinge siempre est culturalmente sesgado, y una traduccin directa
podra conducir a un imperialismo cultural o subordinacin cultural por el dominio de unas
lenguas sobre otras.
Por otra parte, los trminos considerados demasiado especficos de una lengua, o los
trminos que correspondan a las idiosincrasias regionales, no se excluyeron del tesauro, sino
que se incluyeron como trminos equivalentes a un concepto comn en las distintas lenguas.
Despus de esto, el vocabulario inicial se complet con un proceso de retroalimentacin entre
lenguas.
La diversidad de polticas culturales descritas en los trminos del tesauro deba contribuir
a estructurar la herramienta. Los ajustes y las concesiones no se deban hacer siempre a costa de
la misma parte: deba efectuarse una verdadera armonizacin terminolgica.
El corpus inicial para el desarrollo del tesauro estuvo constituido por los informes nacio-
nales y por las convenciones y recomendaciones internacionales en ingls, francs y espaol. Se
aadieron adems algunos textos creados y difundidos por diferentes organizaciones internacio-
nales relacionadas con el patrimonio (especialmente UNESCO y Consejo de Europa). Por otra
parte, para la versin espaola se incluy tambin la normativa especfica estatal (especialmente
la Ley 16/1985, de 25 de junio, del Patrimonio Histrico Espaol). El Consejo de Europa, en todo
el proceso de desarrollo y actualizacin del tesauro, tambin sugiri trminos correspondientes
a nuevos conceptos que consideraba importantes de cara a su implementacin, como, por ejem-
plo, conservacin integrada o patrimonio inmaterial.
En cuanto a las normas de elaboracin de tesauros, para cada idioma, la construccin del
tesauro se bas en el uso de relaciones bsicas entre los trminos (equivalencia, jerarqua y aso-
ciacin), definidas de acuerdo con la norma ISO 2788 - Directrices para la creacin y desarrollo
de tesauros monolinges. Los diferentes niveles de equivalencias lingsticas entre los distintos
idiomas se establecieron segn especifica la norma ISO 5964 - Directrices para la creacin y el
desarrollo de tesauros multilinges.
Los trminos del tesauro se agruparon en nueve grupos o familias y se contempl la po-
sibilidad de reflejar polijerarquas, de manera que un trmino podra ser incluido en dos grupos
si se consideraba necesario para articular la estructura conceptual del tesauro.

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
143

Figura 1. Esquema general del tesauro.

Dificultades para establecer equivalencias interlingsticas


En el proceso de construccin del tesauro HEREIN pudimos constatar muchas dificultades a la
hora de determinar las equivalencias interlingsticas. El establecimiento de este tipo de corres-
pondencia entre trminos es una operacin, como poco, delicada y muchas veces controvertida.
En el grupo 2 del tesauro, que agrupa todos los trminos relativos a los agentes, colectivos
e individuales o, dicho de otro modo, a las instituciones y personas implicadas en la gestin del
patrimonio, hubo dificultades especiales debidas a las diferentes estructuras territoriales de los
pases europeos y a la diversa organizacin administrativa de las competencias. Fue complicado,
por ejemplo, unificar la definicin y establecer la correspondencia entre administracin local y
autonmica (espaol); Lokalverwaltung (alemn), local administration (ingls) y administration
dcentralise (francs). Otras dificultades parecidas hubo con el trmino ingls non state admi-
nistrations, que solo es parcialmente equivalente a collectivits territoriales (francs) y a entes
territoriales (espaol).
En caso del grupo 2, en el que se incluyen los tipos de bienes y los niveles de proteccin,
los principales problemas para determinar las equivalencias se debieron principalmente a las dife-
rencias en los niveles de proteccin. As, para reflejar los distintos niveles europeos en la protec-
cin de los edificios, al trmino presente en la legislacin espaola edificios declarados de inters
cultural (listed buildings en ingls y difices classs en francs), se le aadieron otros: edificios
histricos para reflejar la figura de proteccin inglesa historic properties, y edificios declarados
para que hubiera una correspondencia con difices inscrits, concepto presente en la legislacin
francesa. Todos estos niveles se agruparon bajo el ms general de edificios protegidos.
Tambin se encontraron particularidades en la extensin y las restricciones en las reas
protegidas que hacan necesaria una armonizacin. Fue preciso definir y analizar el alcance
de la proteccin y se comprob que variaban los conceptos, y aunque se solapaban en gran
medida, los trminos no eran exactamente equivalentes. Se trabaj hasta encontrar la mejor
correspondencia, aunque no fuera exacta, para trminos como zonas de respeto o entorno
protegido. En algunos casos un concepto para el que en espaol se utilizaba un solo trmino, se
corresponda con dos trminos diferenciados en otros idiomas. Es el caso de zonas de respeto
y su relacin de equivalencia con contiguous zones y curtilage en ingls. En caso de que en
un mismo idioma la figura de proteccin de un rea llevara distintas denominaciones segn el
pas, se decidi que la correspondencia interlingstica reflejara esta diversidad denominativa
aadiendo tras el trmino un cdigo de pas. As, los equivalentes de zonas de respeto para el
francs son tanto zones de protection (BE) como abords (FR), con un cdigo entre parntesis
para distinguir el trmino usado en Blgica del utilizado en Francia.
En cuanto a elementos protegidos en los bienes inmuebles, en la mayora de las lenguas se
encontraba la distincin entre elementos accesorios del inmueble y elementos consustanciales

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
144

del inmueble o se poda fcilmente ofrecer una traduccin funcional. No obstante, en el


caso del ingls haba dos conceptos ms especficos dentro de los elementos accesorios: movable
fittings y movable furnishings. Este caso se resolvi de manera distinta para no forzar al resto
de las versiones a incluir trminos sin uso real: movable fittings y movable furnishings fueron
considerados trminos no preferentes y reenvan al trmino general fittings.
Algunas denominaciones de categoras de bienes con particularidades en cuanto a la pro-
teccin legal, como las reservas arquitectnicas de Rumana o los monumentos de la historia
de Polonia, finalmente se eliminaron del tesauro para asimilarlas a conceptos y denominaciones
ms genricos, en un intento de no complicar excesivamente la correspondencia entre tipos de
bienes.
Los trminos agrupados en el grupo 3, relacionados con los sistemas de documentacin,
presentaron menos dificultades. Tras definir todos los conceptos se comprob que, a pesar de
la diversidad de denominaciones, haba una mayor homogeneidad en los tipos de documentos
e inventarios, y tambin en los procesos de recogida, anlisis y recuperacin de informacin
sobre los bienes culturales.
En cambio, el trabajo de armonizacin terminolgica tuvo que ser mucho mayor en el caso
del grupo 4, que agrupa los trminos referentes al sistema legal. Las causas principales de estas
dificultades para establecer equivalencias interlingsticas provenan de las particularidades de
cada pas en la propiedad y uso de los bienes, los distintos niveles de proteccin y procedimien-
tos de declaracin, las denominaciones diferenciadas segn el mbito geogrfico, los distintos
procedimientos de adjudicacin de obras, las diferencias en los procesos de transmisin de la
propiedad, y la inclusin de conceptos relevantes en algunas legislaciones nacionales que no
existen otras. As, hubo que encontrar soluciones en las otras lenguas para encontrar equivalen-
tes a Patrimonio Nacional, pues solo en ingls se encontraba un trmino realmente funcional,
crown property, y no tena una correspondencia conceptual total con el trmino en espaol.
En cuanto a procedimientos de declaracin, hubo que incluir en la versin espaola el trmi-
no exclusin. La suspensin de la proteccin legal que sigue a la eliminacin de un bien del
patrimonio cultural del inventario o lista correspondiente no est contemplada o definida en la
legislacin espaola, pero haba que proporcionar un trmino equivalente para este concepto
que s se utiliza en otros sistemas legales europeos: es delisting en ingls y dclassement o
annulation de la protection en francs, por ejemplo. En cuanto a los procesos de transmisin
de la propiedad, los conceptos espaoles derecho de tanteo y derecho de retracto se englo-
ban en otros idiomas en un nico concepto y trmino para designar el derecho reconocido en
determinados casos a la administracin o a entidades privadas que llevan a cabo una misin de
servicio pblico para adquirir con preferencia la propiedad de un bien: droit de premption en
francs, vorkaufsrecht en alemn o right of preemptive purchase en ingls.
Finalmente, es interesante destacar que hubo conflictos en casos en los que los trminos
tienen marcadas connotaciones culturales. Al abordar la terminologa referida a actos ilcitos o
delitos contra el patrimonio, se intent en varias ocasiones que se eliminara el trmino expolio
del tesauro y se dejara nicamente pillaje. Finalmente, dada la relevancia de este concepto en
la legislacin espaola, se logr su inclusin, tras largas discusiones, en todas las versiones lin-
gsticas: plundering en ingls, spoliation en francs y en alemn, espoliao en portugus,
etc. Qued as de manifiesto que cada lenguaje natural es portador de sus propias implicaciones
denotativas, connotativas, valorativas y emocionales.

Variacin terminolgica debida a neologismos y a calcos en las


traducciones de los textos internacionales
En el periodo principal de desarrollo del tesauro (2000-2004), se estaba produciendo una pau-
latina creacin de neologismos en las tipologas del patrimonio, influida de forma determinante
por la evolucin del pensamiento y el cambio en los valores sociales. La produccin neolgica

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
145

se concentraba especialmente en la denominacin de nuevas figuras de proteccin, as como en


los nuevos espacios y modelos para comunicar el patrimonio al pblico visitante. En estos casos
era muy frecuente que la primera denominacin del concepto fuera un calco del ingls o del
francs que apareca en traducciones de recomendaciones o convenciones internacionales. En
ocasiones convivan ambos calcos, pero en el lenguaje natural de los textos escritos originaria-
mente en castellano se poda observar como uno de los dos se iba imponiendo en el uso profe-
sional. Como ejemplo, el calco del ingls patrimonio intangible fue cediendo a favor del calco
del francs patrimonio inmaterial. El tesauro HEREIN refleja estos fenmenos en las relaciones
de equivalencia intralingstica: patrimonio intangible USE patrimonio inmaterial.
La creacin neolgica no solo influy en la necesidad de reflejar en el tesauro los casos en
los que un concepto de introduccin reciente se designa con demasiadas expresiones sinnimas,
como era el caso de la recreacin histrica o historia viva. Tambin la variacin terminolgica,
junto con los calcos, dificultaba el establecimiento de las equivalencias interlingsticas. El caso
ms conflictivo tuvo origen en una traduccin del francs al ingls en un texto internacional:
archologie prventive se tradujo como preventive archaeology sin tener en cuenta cul era la
denominacin real en el uso profesional en ingls. En muchas lenguas esta traduccin al ingls
se tom como referencia y muchos miembros del equipo de desarrollo del tesauro queran que
preventive archaeology constara y fuera el trmino preferente en la versin inglesa. Finalmen-
te, y tras dificultosas negociaciones, solo figura en el tesauro el trmino especializado contract
archaeology.

Valoracin de la experiencia y conclusiones


La experiencia adquirida en el proceso de elaboracin del tesauro HEREIN corrobor que la ela-
boracin de tesauros multilinges supone algo ms que encontrar equivalentes para conceptos
y trminos. Hay una dimensin cultural en el proceso y, de hecho, cuando se aplica la metodo-
loga apropiada, podra ser ms apropiado referirse a construccin de tesauros multiculturales
ms que a tesauros multilinges. Por otra parte, existe una dimensin poltica en la construccin
de tesauros multilinges, especialmente en lo que concierne a lenguas que no estn, contextual-
mente, en la misma condicin de prestigio o reputacin.
La evaluacin externa del tesauro HEREIN en cuanto a metodologa fue muy positiva. Se
reconoci el esfuerzo considerable dedicado a asegurar que en el curso del desarrollo del Tesau-
ro a todos los idiomas se les diera el mismo peso. La defensa de esta pauta supuso un desafo
y fue una tarea compleja, pero el hecho de que ningn idioma fuera tratado como el idioma
principal o de referencia se consider esencial por los evaluadores externos, no solo con el fin
de respetar la diversidad cultural y lingstica subyacente que existe dentro de Europa, sino tam-
bin para garantizar un producto de mejor calidad.
En cambio, la evaluacin externa en cuanto a implementacin en el sitio web no fue tan
positiva, pues se destacaron algunas mejoras necesarias con respecto al diseo y la lgica de la
interfaz de usuario, as como el diseo grfico de las propias pginas. Ciertamente la usabilidad
es un aspecto muy importante en tesauros en lnea multilinges tan complejos como el tesauro
HEREIN.
Estos defectos de diseo se podran haber evitado si se hubieran podido aprovechar en
el momento de desarrollo las ventajas de un gestor de tesauros en el entorno digital. Una herra-
mienta de estas caractersticas puede enriquecer la funcionalidad de la estructura de los tesauros
a partir de la hipertextualidad (establecimiento de hipervnculos entre los trminos y las partes
del vocabulario), y reducir costes de actualizacin y mantenimiento. Tambin estos gestores
permiten integrar al usuario en el proceso de creacin, gestin y optimizacin a travs de tests.
En la experiencia de desarrollo del tesauro HEREIN y otros recursos similares, se ha visto
que es recomendable atender tambin desde el inicio del proyecto a los aspectos de integracin
e interoperabilidad.

El lenguaje del patrimonio | Pgs. 140-146


Dimensin poltica y cultural en la armonizacin terminolgica multilinge
146

En cuanto a integracin en otros sistemas, es importante contemplar la exportacin en


diferentes formatos: texto (txt), Zthes, Skos-Core, TopicMap (xtm), BS8723, IMS Vocabulary De-
finition Exchange (VDEX), Wordpress XML (WXR), Site Map, SQL, etc.
Por otra parte, los protocolos, marcos de metadatos, esquemas XML, etc., estn ya disea-
dos para lograr interoperabilidad en la web semntica.
Finalmente, cabe sealar que es aconsejable en cualquier proyecto de elaboracin de te-
sauros valorar el coste-beneficio del desarrollo de una herramienta tan compleja y estructurada,
prever su sostenibilidad y mantenimiento, as como preparar desde el inicio su integracin total
con el sistema de informacin para el que se crea.

Bibliografa
Benavides, P. (1999): Diccionario razonado de bienes culturales. Sevilla: Padilla editores.
Abejn, T.; Maldonado, ., y Florin, L. (2006): Contribucin al estudio de la terminologa de la
gestin del patrimonio cultural y del turismo cultural a travs de los datos del proyecto ESLEE,
en La terminologa en el siglo xxi. Contribucin a la cultura de la paz, la diversidad, la soste-
nibilidad. Barcelona: Institut Universitari de Lingstica Aplicada, Universitat Pompeu Fabra,
pp. 471-482.
Lafuente, I. T. (2013): Tesauro y Diccionario de objetos asociados a la expresin artstica. Tesauro
y Diccionario para la descripcin y catalogacin de bienes culturales. Madrid: Ministerio de
Educacin, Cultura y Deporte.
Teb, C. (2001): Elementos para la representacin de los conceptos especializados en bases y ban-
cos de datos, en La Terminologa cientfico-tcnica: reconocimiento, anlisis y extraccin de
informacin formal y semntica. Barcelona: Institut Universitari de Lingstica Aplicada, Un-
versitat Pompeu Fabra, pp. 203-208.
Tesauro HEREIN [en lnea] <http://www.european-heritage.net>.

El lenguaje del patrimonio | Pgs. 140-146


147

Creacin, ejecucin y desarrollo de un tesauro temtico


para los museos aragoneses: las tipologas arqueolgicas
Jos Fabre Murillo
Conservador de Arqueologa Museo de Huesca. Coordinador DOMUS Aragn 2011-2015. Dir. Gral. Cultura y Patrimonio,
Gobierno de Aragn

Resumen: Se recoge en la presente comunicacin la evolucin de un proceso de creacin de


un tesauro temtico: el Tesauro de tipologas arqueolgicas en los museos de Aragn. Desde el
diagnstico de un caos terminolgico, pasando por el diseo de una herramienta que permitiera
su uso a travs del sistema DOMUS para, finalmente, ponerla en prctica en los museos arqueo-
lgicos aragoneses. Finaliza el mismo con el acercamiento a la publicacin 2013 que presenta
al pblico en general el trabajo realizado.

Abstract: We are going to explain how we have get to obtain a tematic thesaurus, we talk about
the Tesauro de Tipologas en los museos de Aragn, a thesaurus that includes all archeological
types deposit in the Museums in Aragon. First, we talk about the requierement, sencondly we
will explain how we make it and apply in the museums. Finally we will finish this lecture doing
a brief look to the book published in 2013that shows work done openly.

Srvanos este texto para poner negro sobre blanco y de forma ms o menos ordenada aquellas
ideas, conceptos y reflexiones que se han expresado en torno al tesauro de tipos arqueolgicos.
Herramienta desarrollada para la correcta documentacin de las colecciones de carcter arqueo-
lgico custodiadas en museos aragoneses en el marco del curso El lenguaje del patrimonio:
Estndares documentales para la descripcin y gestin de colecciones.
Si lo que se ha pretendido ha sido mostrar el origen, desarrollo y ejecucin de este pro-
yecto, es preceptivo hacer un par de aclaraciones previas. En primer lugar, en cuanto a la autora
del mismo; como coordinador del proyecto me presento como voz autorizada, una de ellas, para
relatar sus pormenores y detalles, pero sobre todo para cantar las bondades de un buen trabajo

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
148

en equipo1. En segundo lugar, exponer que esta herramienta fue presentada a la comunidad
museogrfica y arqueolgica de forma especfica, desde el punto de vista de la disciplina ar-
queolgica, personalizada, mediante la explicacin de criterios seguidos por cada autor en cada
una de las reas de conocimiento, y en el mbito no excluyente de aplicacin del tesauro,
estos es, para los museos radicados en Aragn2.
Es por ello que asumimos gustosos la invitacin a estas interesantes jornadas de trabajo con
el fin de presentar al otro lado del limes aragonensis el presente proyecto, pero sobre todo contex-
tualizarlo en un foro con amplias miras sobre la documentacin y digitalizacin del saber cultural.

Antecedentes
Y como resulta cmodo empezar por el principio, hemos de referir que esta herramienta ha
nacido para ser usada en un mbito concreto y que, por tanto, su razn de ser es consecuen-
cia de una necesidad. Hablamos de la implantacin en los museos aragoneses del Sistema de
Gestin y Documentacin Museogrfica DOMUS, que desde el ao 2004 viene utilizndose
de forma incremental3.
No es momento de realizar una inmersin en los pormenores de DOMUS, nosotros mis-
mos, y otros antes, mejor que nosotros, lo han hecho ya (Carretero et alii, 1994; Alquzar, 2004;
Fabre y Lorente, 2009, por citar solo algunos), sin embargo, s es positivo destacar que esta-
mos ante un sistema informtico fundamentado en una profunda reflexin terico-prctica que
pretende dar cabida a toda la accin documental generada en un museo no solamente como
mecanismo de salvaguarda de conocimiento museogrfico, sino como herramienta de gestin
diaria. Plantea una gestin integral [interdepartamental] a travs del control de los instrumentos
documentales de carcter tcnico (inventarios y catlogos, archivo de documentacin grfica,
archivo de conservacin-restauracin), administrativos (registros de entrada y salida de fondos
museogrficos, entradas temporales ajenas a la coleccin, directorio, gestin de tienda, material
inventariable, taquilla...) y bibliogrficos. Se basa en tres pilares fundamentales:
Centralizacin e intercomunicacin de esos instrumentos documentales de los distintos
departamentos de un museo.
Normalizacin y sistematizacin de los procesos de documentacin de dichos departa-
mentos.
Normalizacin de la terminologa utilizable en todo el Sistema.

Este tercer punto es el que nos interesa en este momento. A travs de una categorizacin
de los conceptos que ha de referir el sistema en todos sus mdulos (reas de trabajo de cada de-
partamento: conservadores, fotgrafos, restauradores, administrativos, etc.), se establecen cuatro
niveles de control terminolgico (Asn y Fabre, 2009):
1. Campos de libre escritura. Menor nivel de control lingstico para aquellos campos que no
requieran terminologa especfica, e ideados para aquellas parcelas de informacin que necesi-
ten cierta redaccin. En estos casos el cumplimentador es libre en la seleccin del lenguaje
que se utiliza en el sistema.

Los autores tanto del Tesauro tipolgico en faceta de aplicacin en el Sistema de Gestin y Documentacin Museogrfica
1

DOMUS, as como en la publicacin y tipoteca grfica que se editaron en 2011 son en orden alfabtico: C. Aguarod Otal (Uni-
dad de Museos y Exposiciones Ayto. Zaragoza), V. Baldellou (Museo de Huesca), M. Beltrn Lloris (Museo de Zaragoza), R. Eri-
ce Lacabe (Unidad de Museos y Exposiciones, Ayto. Zaragoza), C. Escriche Jaime (Museo de Teruel), B. Ezquerra Lebrn (Mu-
seo de Teruel), J. Fabre Murillo (Dir. Gral. Patrimonio Cultural del Gobierno de Aragn) y J. A. Paz Peralta (Museo de Zaragoza).
2En el marco de las III Jornadas de los Museos Aragoneses desarrolladas en mayo de 2013 y dedicadas a los museos

arqueolgicos, se presentaron hasta cuatro comunicaciones explicativas de este proyecto. Sus actas se encontrarn publi-
cadas en formato digital a partir de 2016.
BOE n. 132 de 1 de junio de 2004 y sucesivas adendas en 2007, 2008 y 2010, hasta el momento, dando cabida a ms de
3

cuatro decenas de museos y colecciones de la ms diversa ndole.

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
149

2. Listas abiertas de trminos. Campos de informacin conceptualizados (el ttulo de


una obra, lugares especficos de procedencia de una pieza...) que han de huir de la
tan temida duplicidad de trminos referentes (Retrato del rey, Retrato del rey Fernando VII,
Fernando VII de Goya, Fernando VII el Deseado, etc.), pero que, sin embargo, re-
quieren cierta capacidad de creacin para el cumplimentador. Se materializa en una
lista de trminos alfabticamente ordenados que permite a cualquier cumplimenta-
dor dar de alta un nuevo trmino si no es preexistente y lanza un mensaje al cum-
plimentador que le hace reflexionar si es estrictamente necesaria dicha creacin del
trmino.
3. Listas cerradas de trminos. A diferencia de las anteriores, estaramos ante aquellas parce-
las de informacin que se estiman normalizadas en cuanto a sus trminos componentes,
que se ordenan alfabticamente, pero que pueden ser innovadas o completadas con nue-
vos trminos si un usuario cualificado, no un simple cumplimentador, lo determina. Las
formas jurdicas por las que una pieza puede ingresar en un museo (donacin, depsito,
hallazgo...) sera un claro ejemplo de aquellas parcelas sujetas, incluso por normativa jur-
dica, a una terminologa muy ajustada. Sin embargo, cuenta con la posibilidad de ampliar-
se llegado el momento y la necesidad.
4. Por ltimo, el tesauro sera el nivel de mayor control que prev el Sistema. El nmero
de trminos que componen una parcela o campo de conocimiento, previsiblemente
mucho mayor que en los casos anteriores, hara necesaria una herramienta ms po-
tente. Sin embargo, la diferencia con una lista alfabtica frreamente controlada no es
el nmero de trminos que contiene sino las relaciones existentes entre esa termino-
loga.

Cada trmino del tesauro es dado de alta por el administrador del sistema en aten-
cin al control y convenciones ortogrficas, lingsticas, etc., y pasando los siguientes
controles:
1. Cada trmino debe estar relacionado jerrquicamente con el resto de trminos del te-
sauro. A travs de una categorizacin de trminos genricos, especficos o relacionados
(subordinacin conceptual). Muy ilustrativo nos resulta el ejemplo del tesauro de lugares
geogrficos en el que Europa, Espaa y Aragn son tres trminos del mismo tesauro que
entre ellos mantienen la siguiente relacin jerarquizada:

Europa
Espaa
Aragn

En ella se han dado de alta tres trminos en los que se establece una relacin de jerarqua
en la que Europa tiene un trmino especfico que es Espaa, el cual a su vez contiene otro
trmino especfico que es Aragn.
2. El hecho de que un mismo concepto pueda ser identificado con distintos trminos se re-
suelve en el tesauro adjudicando a su administrador la posibilidad de crear trminos pre-
ferentes (USE) que recojan el concepto en cuestin sin perder las sinonimias que pueda
presentar (USADO POR).

USE - Huesca USADO POR - Osca / Wasqa / Uesca

3. Por ltimo, el trmino por crear debe estar bien determinado como trmino indicador-
clasificador, es decir, trminos que ayudan a ordenar conceptualmente el tesauro. O bien
como trminos descriptores, que son la parte activa del tesauro. De nuevo, un menguado
tesauro geogrfico nos ayudar a explicar este particular:

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
150

Europa - Trmino descriptor


[Monarqua parlamentaria] - Trmino indicador-clasificador
Blgica - Trmino descriptor
Espaa - Trmino descriptor
Reino Unido - Trmino descriptor
[Repblica] Trmino indicador - Clasificador
Francia
Italia
Portugal

El Tesauro de tipologas arqueolgicas


En el ao 2008, la Coordinacin DOMUS Aragn, asumiendo estas premisas, se enfrent al reto de
abordar la redaccin y puesta en prctica en un tesauro que acogiera las distintas nomenclaturas
recibidas por las variantes de objetos arqueolgicos en nuestras colecciones (Fabre, 2016, en prensa
e.p.). Para ello se cre un grupo de trabajo denominado Comisin de Redaccin del Tesauro de
Tipologas, entre un plantel de directores, conservadores y tcnicos de museos (vase nota n. 1)
cuya caracterstica en comn era su especfica formacin y experimentado conocimiento de la
cultura material procedente del amplio contexto cultural planteado: los objetos hallados o fabrica-
dos por las distintas sociedades desde la prehistoria (Baldellou y Fabre, 2016 e.p.), pasando por
la Edad Antigua (Beltrn et alii, 2016 e.p.) y llegando hasta la Edad Media (Escriche, 2016 e.p.).
El resultado tras cuatro aos de trabajo ha sido la creacin de un tesauro con ms de 4000
trminos y ms del doble de relaciones terminolgicas. El objetivo de la Comisin ha sido desa-
rrollar lenguajes de descripcin homogneos, y establecer claramente el orden en la jerarqua a
la hora de nombrar esos objetos. Por lo tanto, no solamente se asumi un tesauro de tipologas,
es decir, no se han ordenado los trminos que definen la variante de este objeto, sino que para
ello hemos tenido que hacer un ejercicio previo.
Fue necesario prever una estructura terminolgica, un rbol, capaz de seguir creciendo y
que permita albergar cualquier trmino que se pueda incorporar o modificar en un futuro.
Un reto imprevisto, pero predecible al que se enfrent la llamada Comisin, fue crear el
tesauro de nombres comunes. Si hablamos de variantes de objeto, es fundamental que esos ob-
jetos tuvieran una definicin conocida y reconocible. Haba que definir el objeto.

Figura 1. Cuenco TSG Dragendorff 29. Museo del Teatro de Caesar Augusta NIG00071 (foto Jos Garrido).

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
151

Si haciendo un breve experimento presentramos la figura adjunta a un conjunto de ar-


quelogos cualquiera, sera muy probable que la nomenclatura adjudicada a ese objeto fuera
mltiple. Muchos se inclinaran por definirla como Terra sigillata; si tal fuera el caso, estara-
mos acercndonos al trmino que nos definira un aspecto tcnico, un momento concreto, una
tradicin cermica histrica, pero en ningn caso nos define el objeto. Otros podran pensar,
probablemente, en que estn ante una Dragendorff 29, porque conocen los estudios de este in-
vestigador, pero no estaran hablando del nombre del objeto que tienen delante. En ninguno de
los casos de los que hemos formulado se habra dicho que estbamos ante un Cuenco. Y esto,
por muy obvio que pueda parecer a priori, fue uno de los primeros pasos atrs que tuvimos que
dar para poder continuar en nuestro trabajo.
El objeto y su nomenclatura conocida y reconocida era la llave de acceso al ordenamiento
del caos.

Figura 2. Tesauros independientes pero conectados conceptualmente. La informacin relacionada en DOMUS.

Lgicamente, naca as el tesauro de nombres comunes de objetos arqueolgicos de los


museos de Aragn. Se identifican as todas las formas tipo, todos los objetos que tenemos desde
la prehistoria hasta la actualidad con una definicin recogida, en los casos en los que ha sido
posible, en el Diccionario de la Lengua Espaola, para, a continuacin, recoger aquellas defini-
ciones tcnicas, consensuadas, que en cada una de las disciplinas se han podido desarrollar. Es
decir, que hemos intentado tener una definicin exacta por objeto.
Una vez alcanzada esa convencin, lo que tenamos que hacer era crear una serie de cla-
sificadores generales que pudieran albergar a las varias decenas de morfotipos arqueolgicos
identificados.
Se podran haber clasificado genricamente estos objetos en atencin a muchos criterios,
pero, dado que estamos hablando de artefactos, de objetos, que se crean por su utilidad, se
consider oportuno utilizar una serie de trminos indicadores-clasificadores que atienden, pre-
cisamente, al uso que tuvieron en su creacin. Se han consensuado los diecinueve indicadores:

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
152

1 Armamento
2 Indumentaria y complementos
3 Menaje de cocina
3.1. Cocina. Coccin
3.2. Cocina. Preparacin
4 Menaje de mesa
5 til de aseo e higiene
6 til de caza, pesca o recoleccin
7 til de escritura y elaboracin de documentos
8 til de farmacopea y perfumera
9 til de filtrado
10 til de funcin diversa
11 til de iluminacin
12 til de lavado
13 til de perforacin, corte o abrasin
14 til de trabajo domstico
15 til de transporte y almacenaje
16 til de unin, sujecin, enganche o cierre
17 til ldico
18 til ornamental
19 til ritual

Figura 3. Indicadores-clasificadores de morfotipos por funcin.

Adems de ser ampliable con nuevos trminos indicadores-clasificadores, permite que los
morfotipos puedan ser relacionados con ms de un clasificador. De esa manera, el trmino Vaso
se presenta vinculado a Menaje de mesa, til ritual, til de aseo e higiene, etc.
Definido y clasificado el objeto, era cuestin de recoger sus distintas voces a lo largo de
la historia. Por ejemplo, encontramos Lmpara desde la prehistoria hasta nuestros das, y en
muchas ocasiones contamos con el saber necesario para conocer cmo eran denominados esos
tiles por las sociedades que los produjeron, a saber, lmpara, lucerna, candil Crebamos as
el tesauro de nombres especficos.
Seguimos avanzando con el ejemplo de otro objeto: Caja. Le hemos dicho al catalogador
qu es una caja, cmo va a identificar una caja de forma indudable, y, adems, le hemos dicho
que tiene un gran cajn clasificador, en este caso, que es un til de transporte y almacenaje.
Le hemos advertido que puede tener asociado a l el trmino Pixis, que har referencia a la
nomenclatura de ese objeto en un momento muy concreto de la Historia. Y dentro de ellos ya
encontramos la tipologa; las variantes de barniz negro, ibrica, terra sigillata, etctera. Los tr-
minos preferentes as como sus sinnimos para que ningn trmino se perdiera en el camino.

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
153

Figura 4. El Tesauro de tipologas. Vista formato jerrquico.

El da despus
Como herramienta incluida en el sistema DOMUS de los museos arqueolgicos aragoneses, se
plantea al da siguiente de su redaccin la necesidad de ponerla en uso. Por obvio que pueda
resultar, existe la necesidad de adaptar los trminos del nuevo tesauro a las tradiciones indivi-
duales que los distintos museos puedan haber tenido. El procedimiento que se ha llevado al
respecto ha sido el mantenimiento de los trminos preexistes bajo un indicador-clasificador que
contenga los trminos para extinguir conforme los usuarios de cada centro identifiquen un tr-
mino antiguo en uso con uno nuevo normalizado, marcando as el inicio de una fase de revisin.
Por otro lado, el avance de la disciplina arqueolgica y museogrfica hace muy problable
la aparicin de variantes tipolgicas hasta ahora desconocidas; ello conlleva la necesidad de
crear un procedimiento para que los propios museos puedan solicitar la acuacin de nuevos
trminos y que toda la comunidad que se rige por esta herramienta est actualizada terminol-
gicamente hablando. En estos momentos se est trabajando en un formulario que, a la par de
sencillo en su ejecucin, permita, razonada y justificadamente, la creacin o modificiacin
de trminos y que desde la Comisin se pueda valorar y actualizar en el tesauro de todos los
centros si es procedente.
Por ltimo, y siendo plenamente conscientes de que el conocimiento del tesauro es la
nica garanta de su utilizacin, se plante publicarlo para que dentro y fuera del museo todos
los agentes que trabajan con el patrimonio arqueolgico mueble (arquelogos de campo, gesto-
res de patrimonio arqueolgico, personal de museos, divulgadores, etc.) pudieran tener acceso
a la herramienta (Aguarod et alii, 2011)4. Esta publicacin presenta el referido glosario con las
definiciones de la Real Academia Espaola para cada morfotipo as como las variantes de defi-
nicin por poca histrica. A continuacin, le sigue el rbol estructural como antesala al tesauro
en formato ndice, es decir, cualquiera de las voces, ms de 4000 voces, bien sean nombres de
objetos, nombres especficos, clasificadores genricos o, propiamente, las variantes tipolgicas,
se encuentran alfabticamente con sus relaciones jerrquicamente superiores e inferiores. De
este modo, el lector tiene conocimiento a priori de en qu escaln se mueve el objeto o la va-
riante que est buscando. Se consider muy importante en esta labor completar el tesauro con

La publicacin es accesible en el rea de publicaciones electrnicas del Portal de Patrimonio Cultural del Gobierno de
4

Aragn: <www.patrimonioculturaldearagon.es>.

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
154

algunos anexos: un anexo con unas pautas de catalogacin en atencin a las distintas tradiciones
descriptivas por tipos de industria la industria ltica, la industria sea, la industria cermica, la
industria metlica, que vienen a ser unos requisitos mnimos que el catalogador que no co-
nozca la catalogacin de objetos arqueolgicos con fluidez va a tener como apoyo a la hora de
describir una pieza arqueolgica con rigor.

Figura 5. Dos ejemplos de definicin de morfotipos.

Se han incluido todas las fuentes cientficas de las que bebe la obra; en la mayora de los
casos, no hemos creado nuevas tipologas, lo que hemos hecho es decidir cules eran las fuentes
tipolgicas que considerbamos preferentes a la hora de ordenar nuestros objetos.
La obra se cierra con dos anexos grficos: en primer lugar, lo que hemos introducido es
un compendio de las piezas arqueolgicas ms significativas de las colecciones aragonesas, del
orden de cuatrocientas imgenes. Y, adems de ello, se consider oportuno acompaar a esta
publicacin de un apndice grfico que reflejara todos y cada uno de esos trminos que hemos
normalizado. Es decir, los 4000 trminos estn ilustrados en el CD anexo que acompaa a la
publicacin en papel y que prentendemos en un futuro cercano sea accesible, al igual que el
texto, a travs de la red.
Lgicamente, acompaar la publicacin de los 4000 dibujos era, desde el punto de vista
del formato, bastante complicado. Por lo tanto, lo que se propuso fue incorporar una sencilla
aplicacin informtica que viene a ser un navegador de tipos. Este navegador de tipos incorpora
una tipoteca en la que, a travs de la misma estructura conceptual, se puede recuperar hasta la
ltima variante tipolgica que aparece reflejada en el tesauro.

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
155

Figura 6. El navegador de tipos, anexo grfico de la publicacin.

A modo de conclusin, conviene recalcar la bondad de los trabajos en equipo cuyos ob-
jetivos son claros, definidos en el tiempo y cuya practicidad es inmediata. Este ha sido un claro
ejemplo de ello.
En segundo lugar, y especficamente sobre aquellos tesauros de naturaleza temtica am-
plia, como pudiera ser el referido, es imprescindible el consenso, el acercamiento de posiciones
y la asuncin de que son productos intelectuales orgnicos sujetos a cambios y actualizaciones
constantes, pero, sin lugar a dudas, la cotidianeidad en su uso es la prueba irrefutable de su
validez.

Bibliografa
Aguarod Otal, C. et alii (2011): Tesauro tipolgico de los Museos Aragoneses. Colecciones arqueolgi-
cas, vol. I. J. Fabre Murillo (coord.). Zaragoza: Gobierno de Aragn.
Asn Martnez, L., y Fabre Murillo, J. (2009): Tesauros y lenguajes documentales: su elaboracin,
razn de uso y operatividad en el Sistema de Documentacin DOMUS, en Actas de las I Jor-
nadas de Museos de Aragn. Zaragoza: Gobierno de Aragn.
Baldellou, V., y Fabre Murillo, J. (2016): De la tipologa de la prehistoriador a la normalizacin del
museo, en Actas de las III Jornadas de Museos Aragoneses. Los museos arqueolgicos. Museo
de Zaragoza, 7 y 8 de mayo de 2013. Zaragoza: Gobierno de Aragn. En prensa.
Beltrn Lloris, M. et alii (2016): De la tipologa de la Arqueologa Clsica a la normalizacin del
museo, en Actas de las III Jornadas de Museos Aragoneses. Los museos arqueolgicos. Museo
de Zaragoza, 7 y 8 de mayo de 2013. Zaragoza: Gobierno de Aragn. En prensa.

El lenguaje del patrimonio | Pgs. 147-156


Creacin, ejecucin y desarrollo de un tesauro temtico para los museos aragoneses
156

Carretero Prez, A. et alii (1994): La Normalizacin Documental de Museos. Madrid: Ministerio de


Cultura, Subdireccin General de Museos Estatales.
Escriche Jaime, C. (2016): (e.p.). De la tipologa de la Arqueologa Medieval a la normalizacin del
museo, en Actas de las III Jornadas de Museos Aragoneses. Los museos arqueolgicos. Museo de
Zaragoza, 7 y 8 de mayo de 2013. Zaragoza: Gobierno de Aragn. En prensa.
Fabre Murillo, J., y Lorente Algora, M. (2009): Domus en los Museos Aragoneses. Convenciones del
Sistema. V 1.0. Zaragoza: Gobierno de Aragn.
Padilla Montoya, C. et alii (2002): Diccionario de materiales cermicos. Madrid: Ministerio de Cultura.

El lenguaje del patrimonio | Pgs. 147-156


157

El listado de autoridades y la normalizacin terminolgica


en el Museo del Prado
Jos Luis Cueto Martnez-Pontrmuli
Museo Nacional del Prado

Resumen: Se analiza el sistema de informacin del Museo del Prado y se aborda la cuestin del
control terminolgico en las bases de datos del rea de Biblioteca, Documentacin y Archivo
desde una perspectiva global. Mediante la realizacin de un mapeo que compara los campos de
la norma ISAAR (CPF), el formato MARC21 de autoridades y las estructuras de datos del Servicio
de Documentacin, se estudian las posibilidades de convergencia de las autoridades de nombre de
los tres departamentos. A continuacin, se proponen unas pautas iniciales de normalizacin con
el objetivo de disear en el futuro una tabla compartida de autoridades que nos permita ofrecer al
usuario el acceso de forma conjunta a los libros, obras de arte y documentos que conserva
el museo. Este proyecto ha avanzado en paralelo con el diseo de la nueva pgina web del
Museo del Prado, segn los estndares de la web semntica, y con la voluntad de la institucin
de ofrecer en Internet una informacin cada vez ms completa y contextualizada sobre sus
colecciones.

El rea de Biblioteca, Documentacin y Archivo del Museo del Prado:


hacia un sistema global de informacin
El sistema de informacin del Museo del Prado se sustenta sobre tres pilares: la Biblioteca, que
contiene las publicaciones especializadas en historia del arte, abarcando el arco cronolgico
que afecta a las colecciones; el Archivo, donde se custodian los documentos producidos por el
museo a lo largo de su actividad institucional, y el Servicio de Documentacin, encargado de
gestionar la informacin sobre las obras de la coleccin a travs de un sistema integrado.
En 2008 se decidi la unificacin de los tres departamentos dentro del rea de Bibliote-
ca, Documentacin y Archivo en el edificio del Casn del Buen Retiro, que abri sus puertas
en marzo de 2009, poniendo en prctica una concepcin global de la gestin y difusin de la
informacin.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
158

Debido a la importancia creciente de la difusin social del conocimiento generado por el


Museo del Prado, la actividad de sus servicios de informacin tiene una repercusin cada vez
ms notable en la pgina web del museo (Martn; Pantoja, 2013): en un primer momento, segn
las posibilidades de una pgina web creada en 2007; y, posteriormente, con un proceso de adap-
tacin a las nuevas necesidades de normalizacin impuestas por la web semntica.
En los ltimos aos el Museo del Prado ha trabajado, junto con la empresa de software
GNOSS, en el diseo de su nueva pgina web, segn el modelo conceptual CIDOC-CRM, motivo
por el que el rea de Biblioteca, Documentacin y Archivo ha iniciado un proceso de estudio de
sus autoridades de nombre en los tres departamentos, con el objetivo de disear una tabla nica
de autoridades que permita la recuperacin de los contenidos de las tres bases de datos de for-
ma conjunta. A partir del cumplimiento de esta primera fase de normalizacin de las autoridades
de nombre a nivel interno, ser posible plantear en el futuro la existencia en la pgina web de
relaciones semnticas entre las fichas de catalogacin de las obras, los registros de la Biblioteca
y documentos digitalizados del Archivo.

Figura 1. Sala de lectura Luca Giordano.

Servicio de Biblioteca
La Biblioteca del Museo del Prado est formada por ms de 75000 ttulos de monografas y 1300
ttulos de revistas, junto con materiales audiovisuales y una importante coleccin de catlogos de
subastas que est en proceso de catalogacin, adems de manuscritos y un fondo antiguo con
ms de 5500 volmenes anteriores a 1900. Gracias a estos fondos, se consolida en la actualidad
como una de las bibliotecas especializadas en arte ms importantes de nuestro pas.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
159

El Servicio de Biblioteca gestiona, dentro del entorno AbsysNet 2.0, sus registros biblio-
grficos y de autoridad de acuerdo con los principales estndares internacionales de referencia
en mbito bibliotecario:
En la descripcin bibliogrfica se siguen las vigentes Reglas de Catalogacin Espaolas,
que, como es bien sabido, derivan de las pautas marcadas por la Descripcin Bibliogrfica
Internacional Normalizada (ISBD).
En el rea del control de autoridades, se respeta la estructura definida por las Directrices
para Registros de Autoridad y Referencia (GARE, Guidelines for Authority and Reference
Entries) y su revisin publicada en 2001 como GARR, Guidelines for Authority Records
and References.
Se recurre a los formatos MARC21 (MAchine-Readable Cataloging) para adaptar los estn-
dares citados a una estructura informtica comprensible por los ordenadores.

Para crear sus autoridades el Servicio de Biblioteca, utiliza el catlogo propio de autorida-
des, denominado AUTO. Adems, a travs del protocolo Z39.50, la Biblioteca utiliza la descarga
de autoridades de algunas instituciones de referencia, como la Biblioteca Nacional de Espaa
y la Library of Congress. Tambin se emplea como fuente de referencia el Union List of Artist
Names (ULAN) del Getty Research Institute junto con otras importantes fuentes como el Diccio-
nario Bnzit de Artistas, accesible en lnea a travs de la plataforma Oxford Art Online.

Servicio de Documentacin
Otro de los pilares del sistema de informacin del Museo del Prado es su Servicio de Docu-
mentacin, cuya funcin es analizar todo tipo de documento que aporte informacin sobre las
colecciones de la institucin y volcarla posteriormente en una base de datos de consulta general.
Tambin se encarga de coordinar la incorporacin de los datos que llevan a cabo los diferentes
departamentos que estn integrados en la herramienta de mantenimiento SIGMA, Sistema de
Informacin y Gestin Museogrfica (Docampo; Martn, 2009). De esta forma, las informacio-
nes derivadas de la gestin de colecciones por parte de varios departamentos, que han sido
previamente identificadas como relevantes para el usuario final, convergen en SAC, Sistema de
Acceso a las Colecciones, ltimo interfaz de consulta realizado a partir de 2010 por el Servicio
de Informtica.
La integracin de informacin y contenidos procedentes de distintas bases de datos se ha
llevado a cabo de dos formas:
Mediante tablas de trminos controlados que son compartidas por los departamentos im-
plicados en la gestin de colecciones, como la Tabla de Autores utilizada por el Servicio de
Documentacin, Registro, Exposiciones Temporales, Archivo Fotogrfico y Restauracin.
Con la creacin de hipervnculos que conectan los registros del catlogo de Biblioteca y
los documentos digitalizados del Archivo con las fichas de catalogacin de las obras de
arte.

En el diseo de las tablas de control terminolgico del Servicio de Documentacin se si-


gue un modelo de datos propio que tiene en cuenta la Normalizacin Documental de Museos
publicada por el Ministerio de Cultura en 1996, as como los diccionarios terminolgicos desa-
rrollados por los Museos Estatales, por lo que existe una cierta afinidad con la lnea seguida por
estas instituciones con las adaptaciones que se han considerado necesarias para la naturaleza del
Museo del Prado y sus colecciones.
El actual proyecto de normalizacin de autoridades de nombre pretende generalizar el
trabajo con tablas compartidas del Servicio de Documentacin hacia una visin ms amplia en
la que se incluyan la Biblioteca y el Archivo.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
160

Figura 2. Depsito central de monografas.

Servicio de Archivo
El tercero de los pilares del actual sistema de informacin del Museo del Prado es el Archivo,
formado por un conjunto de ms de 4500 cajas que contienen la documentacin producida por
la institucin desde su fundacin, y 10500 registros digitalizados que son accesibles al usuario
desde los terminales de la Biblioteca. En la actualidad todo el fondo del Archivo est informati-
zado hasta nivel de expediente y se est trabajando desde 2010 en la descripcin y digitalizacin
de su fondo antiguo.
El mantenimiento y consulta del Archivo del museo, que tambin se realizaba en el pasado
a travs de una base de datos elaborada por el Servicio de Informtica, se ha actualizado en el
ao 2012 al programa de archivo Albal, y a finales de 2015 se produjo el cambio hacia Albal-
Net, todo lo cual ha permitido una progresiva adaptacin a la Norma Internacional General de
Descripcin Archivstica ISAD (G), al mismo tiempo que los campos que presenta este programa
para el control de autoridades facilitan el trabajo de acuerdo con la Norma Internacional sobre
Encabezamientos Autorizados Archivsticos para Entidades, Personas y Familias ISAAR (CPF).
Para la consulta del Archivo, se ha optado por el recolector MediaSearch, que est prepara-
do para recuperar contenidos de diferentes entornos de datos mediante el protocolo OAI-PMH,
y que ofrece para el Museo del Prado la ventaja de ser compatible tanto con AlbalNet como con
AbsysNet, lo que abre una va en el futuro para la recuperacin de las autoridades de nombre
en los tres servicios de informacin una vez solventada la posible dificultad de conexin con el
modelo de datos propio de Documentacin.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
161

Figura 3. Sala auxiliar de lectura.

Proyecto de Normalizacin de Autoridades


Durante los ltimos aos los Servicios de Biblioteca, Documentacin y Archivo del Museo del
Prado han avanzado en materia de normalizacin terminolgica de forma independiente, si bien
la interconexin de contenidos planteada por el proyecto de web semntica nos ha llevado a
comprender la necesidad de unificar criterios a una escala mayor que la de cada una de estas
tres bases de datos.
Con este objetivo, hemos iniciado el estudio del estado del control terminolgico y los mo-
delos de datos seguidos en los Servicios de Biblioteca, Documentacin y Archivo, comenzando
por las autoridades de nombre de persona. En cuanto al diferente estado del control termino-
lgico en los tres departamentos y la gestin que realizan del control de autoridades, conviene
tener presente los siguientes aspectos:
El Servicio de Biblioteca muestra el mayor grado de normalizacin y adecuacin a los
estndares internacionales dentro del conjunto del sistema de informacin del Museo del
Prado. El seguimiento de las Reglas de Catalogacin Espaolas y su adecuacin a MARC21
lo convierten en punto de referencia para el proyecto de normalizacin.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
162

Hasta 2011 la Biblioteca creaba sus encabezamientos de materia con una cadena nica y
cerrada formada a partir de la suma de los distintos subencabezamientos necesarios para
la autoridad, mientras que con posterioridad a esa fecha se ha empezado a trabajar con
autoridades independientes, que se pueden unir para crear un nuevo encabezamiento
de materia. Este hecho facilitara la recuperacin de la autoridad de nombre desde una
tabla compartida y su incorporacin en la secuencia deseada para el encabezamiento de
materia.
El Servicio de Documentacin mantiene en la actualidad dos tablas compartidas de nom-
bres de persona que parten de un momento previo al nuevo plan de normalizacin de
autoridades, y que sern objeto de la primera fase de unificacin de los nombres de per-
sona en el museo.
A pesar de que la utilizacin de Albal en el Archivo est permitiendo un acercamiento a
las normas ISAD (G) e ISAAR (CPF), la existencia de un volumen importante de autorida-
des procedentes de la migracin de datos del antiguo programa conlleva la existencia de
algunos descriptores compuestos que incluyen la mencin de la actividad o cargo junto
con el nombre de la persona.

Una vez examinada la gestin del control de autoridades que llevan a cabo los Servicios
de Biblioteca, Documentacin y Archivo, es posible plantear un modelo inicial de convergencia
que responde a estas caractersticas:
Realizacin de un mapeo con los campos de informacin de los registros de autoridad de
nombre de los tres departamentos, gracias al cual estamos en disposicin de entender los
puntos de encuentro y las diferencias entre las tres bases de datos a la hora de tratar las
autoridades en una tabla comn.
Los modelos comparados en el mapeo son la norma ISAAR (CPF) de Archivo, el formato
MARC21 de autoridades de Biblioteca y las dos tablas del Servicio de Documentacin para
el control de los nombres de persona.
El formato MARC21 de autoridades se ha completado con los campos aadidos en los
ltimos aos para adaptarse al nuevo cdigo de catalogacin RDA (Lupe, 2012), gracias al
trabajo realizado desde 2008 por el RDA/MARC Working Group. El hecho de que RDA est
pensado ntegramente para el entorno digital y la conexin de los registros bibliogrficos
y de autoridad con los modelos conceptuales FRBR y FRAD en la web semntica, lo con-
vierten en objeto de estudio obligado dentro de nuestro proyecto, si bien por el momento
no est prevista una adaptacin al cdigo RDA por parte del Servicio de Biblioteca.

La organizacin del mapeo se inicia con los campos de la norma ISAAR (CPF) por la cla-
ridad que presenta mostrando las reas de Identificacin, Descripcin, Relacin y Control que
requiere un registro de autoridad. A continuacin, se establecen las equivalencias con el formato
MARC21 de autoridades, con la indicacin diferenciada de los nuevos campos motivados por la
adaptacin a RDA. Por ltimo, se disponen las tablas compartidas del Servicio de Documenta-
cin: la Tabla de Autores, desde la que se gestionan los nombres de los artistas; y la Tabla de
Personas Fsicas, donde se localiza el resto de nombres de persona que han sido incluidos en el
sistema para su asignacin como persona representada o fuente de ingreso.

Anlisis de los resultados


El mapeo de los registros de autoridad de los tres servicios de informacin del Museo del Prado
demuestra que existen unas necesidades similares en la gestin de las autoridades de nombre
en la Biblioteca, el Servicio de Documentacin y el Archivo. A continuacin, destacamos los
principales puntos de convergencia a tener en cuenta en la tabla comn de autoridades:

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
163

rea de Identificacin

Figura 4. Mapeo de autoridades. rea de Identificacin.

En primer lugar, es necesario unificar la forma autorizada del descriptor de persona del Ar-
chivo que contempla ISAAR (CPF) con el campo 100 de MARC21 para el encabezamiento
autorizado, y la forma principal del nombre en las tablas del Servicio de Documentacin.
A continuacin, se podrn indicar las formas variantes del nombre en el Archivo y los
denominados alias del Servicio de Documentacin coincidiendo con el campo 400 de
MARC21 de referencia de envo vase.

rea de Descripcin

Figura 5. Mapeo de autoridades. rea de Descripcin.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
164

Los tres departamentos comparten la necesidad de indicar unas fechas conocidas o aproxi-
madas de nacimiento y muerte de la persona. Es conveniente igualar la utilizacin de es-
tos campos en las tablas del Servicio de Documentacin hacia el modelo normalizado de
ISAAR (CPF) y MARC21/RDA empleando la Norma ISO 8601 de Representacin de fechas
y horas, que especifica un formato AAAA-MM-DD.
Los lugares de nacimiento y muerte, contemplados en los Servicios de Documentacin y
Archivo, pueden adaptarse en el formato MARC21/RDA con el nuevo campo 370 Lugar
Asociado y los indicadores $a para el lugar de nacimiento y $b para el lugar de falle-
cimiento.
Una informacin fundamental para el Servicio de Documentacin es la biografa, que se
corresponde con el campo Historia de ISAAR (CPF) y 678 Datos biogrficos o histricos
de MARC21, respectivamente.
La designacin del Tipo de Autor y Tipo de Autora en el Servicio de Documentacin est
en clara correspondencia con las Funciones, ocupaciones y actividades en los descriptores
de persona del Archivo y los nuevos campos MARC21/RDA 372 Actividad y 374 Ocupa-
cin.
La asignacin de Ttulos de realeza, nobiliarios y honorficos en la tabla de Personas Fsicas
del Servicio de Documentacin tiene un planteamiento diferente a los modelos de Biblio-
teca y Archivo. En el Servicio de Documentacin se trabaja con descriptores asociados al
nombre de persona, mientras que ISAAR (CPF) y el nuevo cdigo de catalogacin RDA
hacen un planteamiento basado en la entidad Familia tal y como aparece recogida en los
Requisitos Funcionales de los Datos de Autoridad FRAD, que se suma a las dos entidades
ya presentes en FRBR Persona y Entidad corporativa. La Genealoga de ISAAR (CPF)
permite explicar un rbol genealgico con las relaciones existentes entre sus miembros,
mientras que el campo 376 Informacin de la Familia en MARC21/RDA incluye datos del
tipo de familia, el miembro prominente de la familia y el ttulo hereditario.

rea de Relacin

Figura 6. Mapeo de autoridades. rea de Relacin.

Los campos para relacionar autoridades de nombre tienen un buen desarrollo en la norma
ISAAR (CPF) y suponen una va importante para enriquecer en el futuro nuestra tabla co-
mn de autoridades con las relaciones asociativas propias de un tesauro.
En un primer momento, se identifica una clara convergencia de los campos de ISAAR
(CPF) para indicar las autoridades relacionadas y el tipo de relacin existente jerrqui-
ca, temporal, familiar o asociativa con los campos del Servicio de Documentacin para
asignar a los nombres otros personajes y obras relacionadas junto con el tipo de relacin
establecida, en este caso maestro, discpulo, familiar, etc.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
165

rea de Control

Figura 7. Mapeo de autoridades. rea de Control.

Es necesario estudiar la unificacin del identificador de persona del Archivo con el nmero
de control de registro del campo 001 de MARC21 y el cdigo informtico que se genera en
la base de datos de Documentacin para los literales de los nombres de persona.
Para avanzar en materia de normalizacin, conviene tambin adaptar el modelo de da-
tos del Servicio de Documentacin al planteamiento de ISAAR (CPF) y MARC21 con los
campos de identificacin de la institucin que crea la autoridad (008-39), las reglas de
catalogacin empleadas (008-10) y otros aspectos relevantes, como el estado del registro
de autoridad y sus fechas de creacin y modificacin.
El ltimo punto imprescindible para la tabla comn de autoridades es la indicacin de
la fuente en la que se localizaron los datos, disponible tanto en ISAAR (CPF) como en
MARC21 en su campo 670, y que hasta ahora se aade como texto libre por el Servicio
de Documentacin. Para adaptarnos a un entorno de web semntica, es recomendable
tener presente el campo MARC21/RDA 368 y los subcampos $v Fuente de informacin
y, especialmente, $u URI, que permite la vinculacin a travs de una URL con fuentes
accesibles electrnicamente.

Interrelacin de contenidos: la web semntica del Museo del Prado


Gracias al trabajo de la institucin para adaptar sus estructuras de datos a las necesidades de
informacin de la sociedad actual, la nueva pgina web del Museo del Prado se present al
pblico el 10 de diciembre de 2015, y supuso la semantizacin de la base de datos de obras de

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
166

arte que gestiona el Servicio de Documentacin, as como su relacin con recursos multimedia
procedentes del anterior canal de vdeos PradoMedia y las voces de la Enciclopedia online de
la Fundacin Amigos del Museo del Prado. En enero de 2016 la web ha alcanzado las 10500
obras disponibles para su consulta en espaol, mientras que ha superado las 2000 obras en su
versin en ingls, como resultado de un reciente proyecto de traduccin tanto de las tablas de
vocabularios controlados como de los amplios textos que explican las obras.

Figura 8. Web del Museo del Prado. Bsqueda combinada por Tipo de obra, Tema y Objeto representado.

Esta nueva web representa la informacin sobre las colecciones de acuerdo con el modelo
conceptual CIDOC-CRM, con una estructura XML y tripletes RDF, que configuran un grafo global
capaz de mostrar las relaciones entre las obras de arte, sus autores y todos los campos de infor-
macin que se han considerado relevantes para su visibilidad en la web. La consulta se lleva a
cabo mediante un buscador facetado que organiza las colecciones atendiendo a los conjuntos
de autor, tema, poca, escuela, materia, soporte, tcnica, tipo de obra, nmero de catlogo,
ubicacin y una serie de descriptores iconogrficos objeto, fauna, flora, ubicacin geogrfica
y personaje representado, todos los cuales responden a las tablas de vocabularios controlados
gestionadas desde el Servicio de Documentacin. De esta forma el usuario puede navegar por
las colecciones en funcin de sus intereses, combinando mltiples criterios de recuperacin de
la informacin e interactuando con un sistema que ofrece contenidos relacionados gracias a una
descripcin detallada de los recursos.

Figura 9. Web del Museo del Prado. Propuesta de obras de un mismo artista. Tiziano.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
167

Entre los criterios ms destacados para relacionar contenidos adems de la agrupa-


cin de resultados en funcin de las facetas seleccionadas por el usuario, encontramos la
propuesta de otras obras del mismo autor; la relacin de artistas coetneos; las obras perte-
necientes a una misma serie o coleccin, as como los contenidos audiovisuales que tratan
aspectos relativos al autor, obra o poca de la ficha en que se encuentre el usuario en cada
caso.

Figura 10. Web del Museo del Prado. Propuesta de contenidos multimedia relacionados con Tiziano.

El modelo CIDOC-CRM, empleado para representar la base de datos de obras de arte, y el


resto de contenidos en la web del Museo del Prado, ha sido diseado por el Comit para la Do-
cumentacin del Consejo Internacional de Museos (ICOM) con la finalidad de expresar de forma
comprensible por las mquinas el conocimiento relativo al patrimonio cultural que conservan
los museos. Su objetivo principal es permitir el acercamiento entre muy diferentes conjuntos de
datos, para lograr armonizar sus descriptores y estructuras de catalogacin dentro de un domi-
nio de conocimiento global sobre el patrimonio cultural, sin perder el carcter especfico y la
personalidad propia de cada tipo de colecciones. La elaboracin del modelo se inici en el ao
1994 con una primera publicacin en 1999; en el ao 2006 ha sido publicado como norma
ISO 21127:2006, y revisado en la norma ISO 21127:2014.
Dentro del mbito internacional, diversas instituciones han adaptado sus bases de
datos a este modelo, como es el caso de la versin semntica del British Museum, lo que
abre nuevas vas de interoperabilidad entre el Museo del Prado y otros museos nacionales
e internacionales. Entendiendo la interoperabilidad desde una perspectiva ms amplia,
otro aspecto fundamental de este modelo es que est siendo el centro de una poltica de
acercamiento entre los modelos conceptuales de museos, bibliotecas y archivos a nivel in-
ternacional, ya que desde el ao 2003 se ha empezado a trabajar en la armonizacin entre
CIDOC-CRM y FRBROO, a lo que se aade desde 2010 los primeros pasos en el diseo de
un modelo conceptual para incluir los datos de archivo en esta ontologa global del patri-
monio cultural.
Gracias a la representacin de sus datos mediante CIDOC-CRM, el Museo del Prado podr
explorar la posibilidad de incluir otros contenidos de la Biblioteca y el Archivo y relacionarlos
con las fichas de catalogacin de las obras de arte, para lo cual se hace imprescindible avanzar
en proyectos de normalizacin a gran escala, como el que estamos desarrollando para las auto-
ridades de nombre.

El lenguaje del patrimonio | Pgs. 157-168


El listado de autoridades y la normalizacin terminolgica en el Museo del Prado
168

Conclusin
En los ltimos aos las instituciones musesticas estn teniendo que hacer frente a nuevos retos
en materia de gestin de la informacin para adaptarse con xito a un entorno de web semnti-
ca. Este hecho viene motivado por la transformacin de la relacin establecida entre la sociedad
y el museo, que ya no se reduce a la visita presencial a sus salas, sino que abarca toda una serie
de peticiones de informacin sobre las colecciones, la historia y el funcionamiento de la institu-
cin. Para dar una respuesta satisfactoria a esta nueva comprensin del museo como un centro
de conocimiento, el Museo del Prado ha optado de forma decidida por potenciar el papel de sus
servicios de informacin as como su presencia en la pgina web.
En este contexto, el rea de Biblioteca, Documentacin y Archivo est ampliando pro-
gresivamente su concepcin de la normalizacin documental hacia una visin que agrupe los
criterios seguidos en los tres departamentos. De esta forma, un proyecto como el de la unifica-
cin de las autoridades de nombre permitir, en primer lugar, facilitar el trabajo y la entrega de
materiales a nivel interno, as como abrir vas en el futuro hacia el establecimiento de nuevas
relaciones semnticas que enriquezcan la consulta de las colecciones.

Bibliografa
Docampo Capilla, F. J., y Martn Bravo, A. (2009): El rea de Biblioteca, Archivo y Documentacin
del Museo Nacional del Prado: hacia una integracin de procesos y servicios, XI Jornadas
de Gestin de la Informacin: Servicios polivalentes, confluencia entre profesionales de archi-
vo, biblioteca y documentacin, 19-20 de noviembre. Madrid: Biblioteca Nacional, pp. 53-66.
<http://eprints.rclis.org/13878/1/XIJGI-Docampo.pdf> [Consulta: 15 de enero de 2016].
ICOM.CIDOC (2015): Definition of the CIDOC Conceptual Reference Model. Version 6.1. CIDOC CRM
Special Interest Group. <http://www.cidoc-crm.org/docs/cidoc_crm_version_6.1.pdf>. [Con-
sulta: 15 de enero de 2016].
IFLA-ICOM.CIDOC (2015): FRBROO. Object-oriented definition and mapping from FRBRER, FRAD and
FRSAD (version 2.1). International Working Group on FRBR and CIDOC CRM Harmonisation.
<http://www.cidoc-crm.org/docs/frbr_oo//frbr_docs/FRBRoo_V2.1_2015February.pdf>. [Con-
sulta: 20 de enero de 2016].
International Council On Archives (2004): ISAAR (CPF). Norma Internacional sobre los Registros
de Autoridad de Archivos relativos a Instituciones, Personas y Familias. Ministerio de Cultura.
Traduccin de ISAAR (CPF). International Standard Archival Autorithy Records for Corporate
Bodies, Persons and Families. <http://www.agn.gob.mx/menuprincipal/archivistica/normas/
pdf/asaar.pdf>. [Consulta: 20 de enero de 2016].
Library Of Congress (2006): Formato MARC21 Conciso para Datos de Autoridad. <http://www.loc.
gov/marc/authority/ecadspa.html>. [Consulta: 27 de enero de 2016].
Lupe Cristn, A. (2012): Elementos de RDA en Registros de Autoridad de Nombre MARC 21. Library
of Congress. Presentacin. <www.loc.gov/catdir/cpso/RDA/temas_especiales_elementos_spa.
ppt> [Consulta: 27 de enero de 2016].
Martn Bravo, A., y Pantoja Ferrari, J. (2013): Integracin de servicios documentales: el nuevo
website del Museo del Prado, Segundas Jornadas sobre Bibliotecas de Museos. Estrategias e
Innovacin, 6-8 de noviembre. Madrid: Museo Nacional del Prado, pp. 96-103. <https://sede.
educacion.gob.es/publiventa/detalle.action?cod=20083C> [Consulta: 27 de enero de 2016].

El lenguaje del patrimonio | Pgs. 157-168


169

Normalizacin terminolgica en bibliotecas: autoridades


de materia y trminos de gnero/forma en la Biblioteca
Nacional
Pascual Jimnez Huerta
Jefe del Servicio de Clasificacin. Biblioteca Nacional de Espaa

Introduccin
La presentacin pretende mostrar los trabajos que ha realizado la Biblioteca Nacional de Espaa
con relacin a la normalizacin de vocabularios de materia y cmo este control terminolgico
ha dado como resultado el fichero de los encabezamientos de materia de la Biblioteca Nacional
de Espaa (EMBNE) as como la elaboracin del fichero de autoridades de materia de dicha en-
tidad. Tambin hace referencia a los trabajos realizados con otros registros de autoridad, como
los de subencabezamientos y de nombres geogrficos. Por ltimo se mencionan los trminos de
gnero/forma que han sido muy tiles en la elaboracin de distintos tesauros en los distintos de-
partamentos que componen la Biblioteca Nacional. Se muestran los pasos que se deben seguir
hasta la elaboracin de un nico vocabulario de trminos de gnero/forma.

1. El control terminolgico. Vocabularios controlados


El lenguaje documental surge a raz del intento de controlar los documentos para su localiza-
cin dentro de un sistema de informacin. Entendemos por lenguaje documental todo sistema
artificial de signos normalizados que facilita la representacin formalizada del contenido de los
documentos para permitir la recuperacin, manual o automtica de la informacin solicitada por
los usuarios. Opera como un lenguaje intermediario entre las informaciones contenidas en los
documentos y las solicitadas por los usuarios, controla la posible ambigedad entre trminos y
resuelve problemas derivados del multilingismo, como el caso de los tesauros multilinges o
las clasificaciones de tipo numrico.
Una de las principales operaciones que se realizan para extraer la informacin del docu-
mento es la de la indizacin. La indizacin es una operacin intelectual donde se aplican tcni-
cas normalizadas a un conjunto de documentos para hacerlos controlables y utilizables, es decir,

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
170

para permitir su recuperacin. En esta fase se realiza una operacin de tipo analtica para re-
presentar los conceptos clave, que implica transformar la informacin para su almacenamiento.

Indizacin por materias

Consiste en la correlacin sucesiva de trminos llamados encabezamientos, que expresan el


tema de un documento. Es, por tanto, un lenguaje precoordinado, de estructura combinatoria,
donde las materias pueden expresarse bien en encabezamientos simples o compuestos (enca-
bezamientos ms subencabezamientos). Es verdad que en ocasiones es un sistema poco flexible
a la hora de representar conceptos muy especficos; sin embargo, sus posibilidades de mostrar
todas las caractersticas de una materia son innegables. El ejemplo ms caracterstico de este tipo
de indizacin son las listas de encabezamientos de materia, que son ampliamente utilizadas en
la mayora de las bibliotecas.

2. EMBNE. Encabezamientos de materia


Los encabezamientos de materia de la Biblioteca Nacional de Espaa son el fruto de una
labor ardua y constante de normalizacin terminolgica para asignar el contenido de los
documentos. Estos encabezamientos son el fruto de una normalizacin exhaustiva en lnea
con las principales bibliotecas del mundo y que determina la eleccin de las materias asig-
nadas a los documentos. Adems, el Servicio de Clasificacin ha elaborado un Manual de
indizacin donde se recogen los acuerdos y directrices llevadas a cabo por los clasificadores
en su trabajo de asignacin de encabezamientos. Estas directrices son fundamentales para
tener la mayor uniformidad posible a la hora de utilizar los encabezamientos siempre de
la misma manera. El Manual est disponible en la pgina web de la Biblioteca Nacional en la
direccin: <http://www.bne.es/es/Micrositios/Publicaciones/MEMBNE/>.

3. Registros de autoridad de materia


Los registros de autoridad reflejan la investigacin llevada a cabo por la Biblioteca Nacional
para establecer de forma normalizada el encabezamiento utilizado en los registros bibliogrficos
como puntos de acceso de:
Ttulos para identificacin de la obra o expresin.
Personas y entidades corporativas en funcin de la responsabilidad intelectual o ar-
tstica de la obra o expresin; responsabilidad en la produccin fsica y distribucin de la
manifestacin; y responsabilidad en la custodia del ejemplar.
Puntos de acceso en funcin del tema o materia tratado en esa obra.

Objetivos del control de autoridades

Entre los objetivos que persigue el control de autoridades est el de dar consistencia e integridad
a la base de datos, conseguir mejorar la precisin en la recuperacin de la informacin, ayudar
en el trabajo de referencia de todo tipo de biblioteca y facilitar el intercambio de informacin
bibliogrfica, y con ello aligerar los costes de la catalogacin.
Los registros de autoridad dan uniformidad a los datos de toda la base de datos de un
catlogo y permite una mayor precisin en las bsquedas de informacin. Por ello, y ms con-
cretamente en el tema de las materias, es indispensable contar con un vocabulario lo ms es-
tructurado posible.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
171

Registros de autoridad de materia

Actualmente el volumen de registros de autoridad de materia de la biblioteca cuenta con los


siguientes datos:
Nmero de registros de autoridad de materia validados 25 000
Registros de autoridad de subencabezamientos 450
Registros de autoridad de nombre geogrfico 10 000
Registros de autoridad de gnero/forma 300

Estos datos se refieren a registros de autoridad de materia completamente estudiados y


validados, con todas sus referencias y fuentes de informacin. Existe, por tanto, una multitud de
registros provisionales que son perfectamente vlidos pero que todava no han sido validados
por los responsables de autoridades de la biblioteca.
Cada registro de autoridad de materia est conformado, como es lgico, con sus corres-
pondientes trminos alternativos, trminos sinnimos o aquellos trminos por los que un usua-
rio podra buscar esa materia.
Tambin se compone de relaciones con otros trminos: Trminos genricos o ms gene-
rales, trminos especficos o ms pequeos y trminos relacionados con el primero que confor-
man una estructura de tesauro dentro del vocabulario, que permite navegar entre las diferentes
materias para hacer bsquedas mucho ms exhaustivas.
Otro de los elementos importantes dentro del registro de autoridad son los campos de
notas, que permiten definir una materia ambigua, o diferenciarla de otras materias que son afines
y que podran confundir tanto al indizador como al usuario a la hora de buscar la informacin
que necesita.
Por ltimo, las fuentes de referencia dan consistencia al catlogo utilizando fuentes que
nos parezcan rigurosas a la hora de establecer las materias. Usando las mismas fuentes, tanto
de carcter general como especfico, tendremos tambin un alineamiento ms preciso con otras
bibliotecas o centros de documentacin.

Valor aadido

Hasta ahora la informacin que he descrito no difiere en gran medida de los registros de au-
toridad de materia de cualquier catlogo de bibliotecas. Lo que yo he llamado valor aadido
es el resultado de un enrichment de informacin en los registros que proporciona un plus de
posibilidades a la hora de obtener informacin sobre la materia buscada.

Campo 024: Enlaces a las URI LCSH, RAMEAU, CSIC y LEMAC

En el campo 024 del formato MARC21 se han aadido las URI de las materias equivalentes
de los catlogos de la Library of Congress, la Biblioteca Nacional de Francia, el Consejo Superior de
Investigaciones Cientficas y los encabezamientos de materia de la Biblioteca de Catalua. Estos
enlaces nos envan a las autoridades de materia de estos catlogos y posibilitarn la bsqueda de
informacin de la misma materia que hemos buscado nosotros en sus respectivos catlogos. Las
posibilidades de la tecnologa de Linked Data permiten enlazar distintos recursos de informacin
con una nica bsqueda desde nuestro catlogo.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
172

CDU: Todas las autoridades de materia tienen incorporada en el campo 080 la notacin
de CDU que le corresponde, de su edicin de 2004. Para el ao 2016 se va a migrar a la ltima
edicin publicada de 2015, con lo que se actualizarn las notaciones de CDU de los registros de
autoridad de materia y de nombre geogrfico. En esta nueva edicin la Biblioteca Nacional ha
colaborado en la revisin de trminos anteriores y en la traduccin de trminos nuevos.
Adems, existe un Convenio de colaboracin entre AENOR y BNE para incorporar los
encabezamientos de materia de la Biblioteca Nacional con las notaciones de la nueva CDU On
Line en espaol que va a salir publicada prximamente. En esta plataforma estarn todas las
notaciones de la CDU original traducidas al castellano y con enlaces a las materias de la Biblio-
teca Nacional, por lo que la herramienta ser muy til para los clasificadores e indizadores que
consulten dicha herramienta.
Transformacin a SKOS: La BNE ha transformado a SKOS todas sus autoridades de mate-
ria, de forma que sean legibles por mquina y se puedan utilizar para diferentes aplicaciones
informticas. La transformacin a SKOS permite traspasar las barreras de los catlogos cerrados
y poder utilizar los datos en distintos mbitos. El vocabulario de EMBNE est tambin subido a
DataHub y se puede consultar desde la plataforma de Datos.bne que ofrece la biblioteca.
Podemos ver un registro cualquiera de materia integrado en datos.bne.es en: <http://datos.
bne.es/resource/XX239890>.
Ver un registro geogrfico: <http://datos.bne.es/resource/XX450834>.
Ver un registro de Gnero-forma: <http://datos.bne.es/resource/XX4843208>.
Ver un subencabezamiento de materia: <http://datos.bne.es/resource/XX4990059>.

4. Registros de subencabezamientos
Independientemente de los registros de autoridad de materia tanto simples como compuestos, la
BNE tambin est creando registros de autoridad de subencabezamientos. Este tipo de registros
de autoridad se nos antojan muy importantes, ya que permiten determinar la utilizacin de estos
trminos en los encabezamientos de materia principales. Posibilitan un control de uso de dichos
subencabezamientos y unifican criterios de actuacin a la hora de clasificar los documentos.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
173

Existen, por tanto, registros de autoridad de subencabezamientos Generales, Cronolgicos


y de Forma. Como en el caso de las materias, los registros de autoridad de subencabezamiento
tienen tambin trminos alternativos; genricos, especficos y relacionados. Fundamentales son
las notas de uso que delimitan su aplicacin y las fuentes consultadas para la realizacin de los
registros de autoridad.
Al igual que las materias, tambin tienen sus enlaces en el campo 024 a LCSH, RAMEAU,
etc., y estn tambin transformados a SKOS.

5. Registros de autoridad de nombre geogrfico


Elche o Elx? Xtiva o Jtiva? Fuenterraba u Hondarribia? Lrida o Lleida?
En este tipo de registros ha habido una enorme labor de normalizacin. En primer
lugar y dado el carcter plurilingstico espaol, la eleccin del punto de acceso principal
de los topnimos espaoles requera de unas directrices claras a la hora de utilizar este tipo de
encabezamientos. Al final, y tras muchas discusiones, se eligi como fuente normalizadora el
Nomencltor Geogrfico Nacional, del Ministerio de Fomento, que es el organismo responsable
de la toponimia en Espaa.
Adems de la eleccin del punto de acceso, estos registros se enriquecieron con enlaces
a LCSH, RAMEAU, VIAF y GeoNames, que es la base de geogrficos ms grande y ms utilizada
en el mundo.
Otro de los puntos en los que se trabaj fue en la inclusin de las coordenadas geogr-
ficas en los topnimos. Las coordenadas geogrficas no solo sirven para deshacer homonimias
entre lugares con el mismo nombre, sino que adems abre una puerta a distintos proyectos de
georreferenciacin. Las posibilidades de manejar informacin geogrfica con las coordenadas
son enormes y prueba de ello es la conexin que hemos realizado con Google Maps a la que
me referir ms adelante.
Por supuesto, los registros cuentan con su CDU actualizada y mantienen las relaciones gen-
rico-especficas como las materias. En este sentido se ha hecho especial hincapi en dibujar la orga-
nizacin territorial del estado en este tipo de relaciones, es decir, que Espaa tiene como trminos
especficos las diferentes comunidades autnomas, que estas a su vez tienen como especficos las
provincias, de las que a su vez cuelgan los municipios y como ltimo punto las entidades locales
menores, de manera que se puede navegar de una entidad territorial a la superior y viceversa.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
174

Un aadido ms es que en cada topnimo se incluye en el campo 781 la estructura de


Pas-CC. AA.-Provincia-Municipio y Entidad local menor que le corresponde.
Por ltimo, y para terminar uno de los proyectos ms interesantes, es la conexin con
Google Maps, en el que se aprovech la informacin de las coordenadas para establecer un
link con Google Maps que muestra el mapa del topnimo en cuestin. Esto abre un abanico de
posibilidades de trabajos de georreferenciacin en los que las autoridades de nombre geogrfico
jugaran un papel intermediador entre los recursos y la visualizacin del topnimo en un mapa.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
175

6. Registros de gnero/forma
Qu es un encabezamiento de gnero/forma?
Los encabezamientos de gnero/forma describen lo que el ejemplar es, no de lo que tra-
ta. La forma se define como una caracterstica de las obras con un formato o propsito concreto
y el gnero se refiere a categoras de obras que se caracterizan por tener argumentos, temas,
escenarios, situaciones o caracteres similares.
Los trminos de gnero/forma sirven para describir cmo es una publicacin, no su con-
tenido temtico.
El objetivo de los encabezamientos de gnero/forma es describir la expresin, no la ma-
nifestacin de la obra, es decir, los encabezamientos se refieren a la expresin intelectual o
artstica de la obra, no al soporte fsico.
Aunque no suponen ninguna novedad, pues ya desde los aos setenta se han venido
utilizando en muchas bibliotecas, sobre todo en aquellas con amplias colecciones de libros an-
tiguos o raros, materiales grficos, audiovisuales, etc., su uso no estaba muy extendido fuera de
dichos mbitos. Es ahora cuando parece que muchas bibliotecas se han sumado a la utilizacin
de estos trminos.
Hasta ahora pocas bibliotecas se haban embarcado en la creacin de sus propios registros
de autoridad de trminos de gnero/forma. Normalmente, aquellas que haban decidido utilizar
este mtodo de indizacin para determinados tipos de materiales especiales se haban decanta-
do por el uso de tesauros especficos. Ahora las grandes bibliotecas han retomado el inters de
utilizar este tipo de puntos de acceso como una herramienta importante en la recuperacin
de informacin que demandan los usuarios.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
176

Se debera asignar el encabezamiento de materia Pelculas de terror a libros que tratan


sobre pelculas de terror. Un catalogador que asigne un encabezamiento a la pelcula Frankens-
tein tambin utilizar un encabezamiento llamado Pelculas de terror pero como encabeza-
miento de gnero/forma, ya que la pelcula es una pelcula de terror.
Qu beneficios supone la utilizacin del gnero/forma?
Nuevo punto de acceso.
Reduccin de utilizacin de tesauros.
Mayor control de vocabulario.
Actualizacin de la terminologa.

Beneficios para los usuarios

Mejoras en la capacidad de bsqueda. Los encabezamientos compuestos a veces inhiban a


los usuarios a descubrir las obras que buscaban. En ocasiones la bsqueda de los usuarios
se refiere exclusivamente a un gnero o una forma ms que a la materia propiamente dicha.
Posibilidad de buscar por gneros o formas exclusivamente.

Es un nuevo punto de acceso, por lo que redunda en beneficio de la recuperacin. La


utilizacin de trminos de gnero/forma reduce la posibilidad de tener que emplear muchos te-
sauros como fuentes. Mejora tambin la cooperacin interbibliotecaria. La posibilidad de utilizar
un tesauro nico favorece el intercambio de informacin.
Principios para el desarrollo de trminos de gnero/forma:
Principio de autoridad literaria para asegurar el uso de la terminologa adecuada dentro de
los encabezamientos de gnero/forma.
Sincronizar la terminologa, significado y estilo dentro de los encabezamientos de gnero/
forma con los de materia tanto como sea posible.
Incluir una nota de uso en el encabezamiento de gnero/forma correspondiente incluyen-
do instrucciones sobre la aplicacin del encabezamiento.
Guardar una estructura consistente entre encabezamientos y tambin entre disciplinas.
Examinar cada disciplina independientemente para determinar si la subdivisin geogrfica
es pertinente.
Investigar la necesidad de generar un top-term para el tesauro en cada disciplina.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
177

7. Diseo del plan de realizacin de registros de autoridad de


gnero/forma en la Biblioteca Nacional

Planteamiento inicial

El Proyecto de Adopcin de Trminos de Gnero/Forma es un proyecto que intenta incorporar


un nuevo punto de acceso a los registros bibliogrficos con relacin a su manifestacin, es decir,
en funcin de lo que los documentos son, en vez de en funcin de lo que tratan.
El proyecto pretende ofrecer nuevas formas de bsqueda a los usuarios de manera que
puedan satisfacer sus demandas informativas a partir de la forma y el gnero del documento.

Antecedentes

Hasta 2009 en la base de datos de la BNE no existan registros de autoridad de trminos de


gnero/forma en su base de datos Unicorn, aunque s se utilizaba el campo 655 de los registros
bibliogrficos como campo para describir los trminos de gnero/forma de algunos departamen-
tos. Estos trminos no estaban normalizados, aunque se utilizaban diferentes listas y tesauros
para justificar su uso. Por supuesto, estos campos aparecan en Unicorn como Unauthorized,
no autorizados, aunque permitan la recuperacin por esos trminos.
Qu tenamos?
El tesauro ms completo lo posea el Departamento de Patrimonio, donde tenan un te-
sauro propio de trminos en el que aparecan trminos relacionados, alternativos y fuentes, pero
funcionaba como un tesauro independiente del resto de la biblioteca.
En Dibujos y Grabados elaboraron una lista de trminos vlidos para utilizar como trmi-
nos de gnero/forma.
En Msica nicamente utilizaban el trmino Archivo de la palabra como trmino de gnero/
forma. El resto aparecan como encabezamientos de materia aunque pudieran ser de gnero/forma.
En Clasificacin no se utilizan este tipo de trminos, siendo todos ellos de materia.
En Cartografa tampoco utilizaban este tipo de trminos.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
178

Pareca claro que, antes de abordar la elaboracin de los registros de autoridad de g-


nero/forma, haba que pulir y estudiar las diferentes listas y tesauros para ver si los trminos
eran coincidentes y no exista incoherencia entre dichos trminos. En otras palabras, habra que
cotejar los trminos de las diferentes listas. Esto implica tambin estudiar los alternativos y com-
pararlos tambin con los encabezamientos de materia.
Otro de los aspectos a tener en cuenta era que haba que normalizar las fuentes que ba-
mos a utilizar en los trminos de gnero forma. Para ello haba que elaborar una lista de tesauros
y fuentes autorizadas que nos permitiera tener un control de los trminos para utilizar como
registros de autoridad, prestar atencin a las definiciones con el fin de acotar las formas y buscar
en otros catlogos y tesauros sus correspondencias.
Tambin haba que tener en cuenta las aportaciones de la Library of Congress de los nue-
vos registros de autoridad que elaboraran y nos sirvieran de referencia para realizar nuestras
autoridades.
Con todo ello, pedimos a los distintos departamentos que nos mandaran las fuentes que
utilizaban para extraer sus trminos de genero/forma y que utilizaban en sus listas. Fue una
labor de recopilacin de fuentes de distintas reas temticas que nos permiti tener un control
exhaustivo del vocabulario utilizado.
Con todas las fuentes disponibles, se estudiaron, cotejaron y se elabor una lista nica de
fuentes para la elaboracin de trminos de gnero/forma. Era una buena base de partida para
la creacin de los registros de autoridad.

Referencias

Encabezamientos alternativos: Se consignan en el rea de Cita de Referencia de Vase


y se refieren a aquellos trminos que sirven para expresar el mismo gnero o la misma for-
ma. (Estos trminos se consignan en el campo 455 del formato MARC). Se recomienda que
los encabezamientos alternativos de gnero/forma sean coincidentes con los de materia.
Encabezamientos asociados: El rea de Referencia de Vase adems recoge los trmi-
nos de gnero/forma relacionados con el encabezamiento principal. (Se consignan en el
campo 555 del formato MARC). Pueden existir relaciones jerrquicas (tanto de tipo gen-
rico como especfico) y asociativas.
Notas de alcance: Las notas de alcance se utilizan para especificar el alcance del encabe-
zamiento, o bien definir el trmino cuando el significado sea poco conocido o ambiguo.
Asimismo se normaliz el texto de la nota de uso para aquellos trminos de gnero-forma
que eran coincidentes con los trminos de materia. Se procedi a separar aquellos regis-
tros bibliogrficos que tenan asignado un encabezamiento de materia errneo cuando
deberan llevar un encabezamiento de gnero-forma.
Nota de fuentes de datos encontrados: Con estas notas se indican las obras de referen-
cia que se han consultado en las que aparece el trmino del encabezamiento de gnero/
forma.

Vocabularios terminados:

Cine (Gneros cinematogrficos): Fue el primer vocabulario en elaborarse. Tras un intenso tra-
bajo, se especificaron los siguientes gneros cinematogrficos:
Accin y aventuras
Animacin
Blico
Ciencia ficcin
Comedia cinematogrfica

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
179

Criminal
Documental
Drama cinematogrfico
Ertico
Fantstico
Histrico
Mudo
Musical
Negro
Oeste (Western)
Pornogrfico
Religioso
Suspense (Thriller)
Terror

Los beneficios y utilidades de los encabezamientos de gnero/forma para los gneros


cinematogrficos son innegables: aportan mayor informacin al documento, favorecen la recu-
peracin de informacin y contemplan las demandas informativas sobre gneros concretos.

Proyectos en Gnero/Forma

Bellas Artes: Incluye Fotografas, Dibujos, Grabados y Ephemera. Como fuentes se han
usado el AAT, TGM, el Tesauro de Isabel Trinidad Lafuente, el Diccionario de Artes Grfi-
cas de la Real Academia de Bellas Artes de San Fernando y otros diccionarios de trminos
artsticos. Se han creado tanto trminos de gnero como de forma, lo que hace que haya
trminos en singular y plural. Se han admitido subencabezamientos geogrficos y cronol-
gicos en los casos en los que se consideraba que aportaba informacin (aunque ha llevado
a un uso generalizado de subencabezamientos).
Fondo antiguo: Exista ya un tesauro creado por el departamento desde 2008/2009. Se
usaba el 655 desde el catlogo con una tabla con unos pocos trminos. La fuente principal
era RBMS (vocabulario de gnero/forma de la Rare books and manuscript section de la
ALA <http://www.rbms.info/vocabularies/>). Ahora se van actualizando fuentes y tambin
la RBMS est revisando trminos.
Cartografa: Se utilizan como fuentes el AAT y TGM, pero sobre todo el Diccionario de
trminos geogrficos del Instituto Cartogrfico de Catalua. Se han eliminado los suben-
cabezamientos de forma de los distintos tipos de mapas, sustituyndolos por los trminos
de gnero/forma.
Literatura: Se usan como fuentes el LCGFT cuando es posible y el AAT. Tambin libros
espaoles especializados en gneros literarios y teora de la literatura, diccionarios de tr-
minos literarios y el de bibliologa de Martnez de Sousa. No se ha implementado en los
bibliogrficos todava, ya que se ha acabado este grupo en agosto. Se espera comenzar a
utilizarlo en 2016.
Msica: Hemos empezado a trabajar con msica, comparando nuestro vocabulario con el
de la LC, pero acabamos de comenzar.
Prximos proyectos: Publicaciones seriadas.

Con esto estaran cubiertos todos los vocabularios de la Biblioteca. Los trminos de gne-
ro/forma al igual que las materias y geogrficos llevan su conexin de Linked data en el campo
024, incluyendo las URI de LCGFT y AAT. Tambin este vocabulario est transformado a SKOS.

El lenguaje del patrimonio | Pgs. 169-180


Normalizacin terminolgica en bibliotecas: autoridades de materia y trminos de gnero/forma...
180

8. La cooperacin en bibliotecas. Proyectos en funcionamiento


Ante la gran demanda informativa de los usuarios y la cantidad ingente de documentos existen-
tes tanto fsicos como electrnicos, cada vez se hace ms patente la importancia de la coope-
racin. No tiene sentido catalogar muchas veces el mismo documento cuando ya lo han hecho
otros. Por ello, hay que tratar de sumar esfuerzos y, para cooperar, es necesario desarrollar las
tecnologas derivadas de datos enlazados que permitan orientar al usuario hacia donde est el
recurso que necesita. En este sentido la plataforma de datos.bne intenta dar el salto de los cat-
logos cerrados y ofrecer la informacin del catlogo de la BNE ms una variedad de recursos en
otras bases de datos y recursos de informacin que posibilitan al usuario satisfacer sus necesida-
des informativas de la manera ms adecuada. Datos.bne se encuentra todava en una fase beta,
pero esperamos que pronto est operativo al cien por cien.

El lenguaje del patrimonio | Pgs. 169-180


181

PARES hacia la web semntica: autoridades y tesauros en


los archivos estatales
Arnzazu Lafuente Urin
Subdireccin General de los Archivos Estatales. MECD

No cabe duda de que el desarrollo de las nuevas tecnologas en el entorno web ha modificado
nuestro trabajo diario. En los archivos se ha pasado de trabajar de manera aislada atendien-
do en persona a investigadores y usuarios, y estos consultando los originales en las salas de
consulta, a encontrarnos inmersos en un entorno en continuo cambio, en ocasiones difcil
de asimilar, con nuevos entornos y lenguajes de intercambio, plataformas colaborativas y gesto-
res documentales, la consulta en lnea desde entornos remotos y cada vez una mayor exigencia
de inmediatez en la respuesta en unas organizaciones que avanzan hacia la e-administracin sin
papel. Sin embargo, estos cambios son a su vez un gran reto, nuestra gran oportunidad para que
el ingente trabajo que se ha venido haciendo en nuestros archivos desde hace siglos, de manera
lenta, constante, pero oculta, pueda ponerse en valor y darle la mayor visibilidad. Visibilidad e
inmediatez. En este sentido, en esta ponencia se tratar de exponer brevemente los desarrollos
que en los ltimos aos estamos desarrollando en el Portal de Archivos Espaoles hacia la web
semntica en torno a dos grandes ejes: las autoridades archivsticas y los vocabularios controla-
dos, ambos imprescindibles para identificar en contexto e interoperar en la red en un entorno
multilinge, donde la reutilizacin, la transparencia o los datos enlazados no son posibles sin
datos de calidad.
Frente al carcter voluntario del coleccionista en la formacin de las colecciones de los
museos y bibliotecas, los documentos que conforman un fondo1 se acumulan de forma org-
nica como reflejo escrito de las actividades de una institucin tanto da si es pblica o priva-
da a lo largo de su vida y de acuerdo con el ejercicio de unas funciones y competencias. Los
documentos creados, reunidos o acumulados o mantenidos para o por una organizacin o un
individuo deben mantenerse unidos y conservados con el orden original en que se han creado
o han sido mantenidos. Esta afirmacin es el principio de procedencia, provenance en ingls

Conjunto de documentos y expedientes generados por una institucin a lo largo de su vida.


1

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
182

y respect des fonds en francs, el principio fundamental en el que est basado todo trabajo
archivstico. Documentar el contexto de produccin de un archivo e identificar y proceder
a la descripcin de los productores creators en ingls es una de las actividades esenciales
de los archiveros o, lo que es lo mismo, supone documentar quin, cmo, cundo y por qu (o de
acuerdo a qu normas o a qu funciones) un fondo de archivo ha sido creado. Con estas premi-
sas se puede comprender la importancia que para el tratamiento archivstico tiene el proceso de
identificacin y control de los nombres de los productores de fondos de archivo, que incluye el
control de las autoridades archivsticas.
El volumen del Patrimonio Documental Espaol custodiado en los archivos es ingente.
El art. 49.2 de la LPHE incluye los fondos archivsticos considerados de especial proteccin por
formar parte del patrimonio documental espaol: todos los producidos por las administraciones
pblicas, los de ms de cuarenta aos de instituciones eclesisticas, sindicatos y partidos, y los
de entidades privadas de ms de cien aos. Solo en nuestros archivos nacionales o estatales,
Espaa posee uno de los patrimonios documentales ms valiosos del mundo, siendo fundamen-
tal para la memoria de Europa, Amrica y el Pacfico al menos hasta el siglo xviii. La difusin
del contenido de los Archivos Estatales es una de las funciones que tiene encomendada nuestra
organizacin y se realiza a travs del Portal de Archivos Espaoles PARES. Sin embargo, PARES,
un sistema propietario de la Subdireccin General de los Archivos Estatales del MECD, es mu-
cho ms que un portal de difusin, es un sistema integral para la gestin de los centros y los
fondos archivsticos, desarrollado en varios mdulos para la gestin de usuarios y las consultas
de fondos en lnea y presencial, la gestin de sala de investigadores, control de prstamos, esta-
dsticas y el mdulo de descripcin. PARES es una base de datos en Oracle, comn para los siete
archivos y los centros dependientes de la SGAE, que incluye adems al Censo Gua de Archivos
Estatales, instrumento jurdico de control y censado establecido en la LPHE (censo que desde
1990 se ha abierto a Iberoamrica, recogiendo el censo de los archivos de este continente).
PARES es un OAI que puede ser abierto en un futuro prximo a archivos de otras administracio-
nes mediante convenios2.
En octubre de 2015 se han finalizado los desarrollos del nuevo mdulo de autoridades y
puntos de acceso, la adaptacin al mismo del mdulo de descripcin, la mejora y el desarrollo
de herramientas de revisin. En estos momentos estamos3 cerrando las pruebas y testeos del
nuevo buscador del portal. Todos estos nuevos desarrollos obedecen a seis grandes objetivos:
Proporcionar datos de calidad adaptando los campos descriptivos a las nuevas normas
internacionales de intercambio, junto con un proceso paralelo de revisin y adaptacin de
los contenidos y operaciones de gestin.
Multilingismo, desarrollando vocabularios de puntos de acceso y, en su caso, autorida-
des adems de traducir etiquetas de elementos y herramientas en cinco lenguas: ingls
y francs, y cataln, gallego y euskera, con el objetivo de hacer los datos interoperables y
ms accesibles en la web.
Interoperabilidad: como resultado del paso anterior, trabajamos en el desarrollo y mejo-
ra de las herramientas y en la conversin de los vocabularios multilinge y las autoridades
en LOD como conceptos SKOS.
Adems de cumplir con los requisitos legales de transparencia y reutilizacin,
Compartimos datos tanto con Iberoamrica a travs del Censo Gua, como con Europa
por medio del Archives Portal Europe, utilizando los perfiles del portal Europeo en fiche-
ros XML, y a travs de este portal con Europeana mediante la conversin de estos ficheros
en formato EAD y EAC-CPF en EDM.

Vase <http://www.mecd.gob.es/cultura-mecd/areas-cultura/archivos/portal-de-archivos-espanoles-pares.html> o el busca-


2

dor en pares.mcu.es. Para ver la evolucin desde 2010, vase el vdeo: <http://www.youtube.com/watch?v=9hbFV7yk_8o>.
Un equipo de tcnicos de PARES y el CIDA y de la SGTI de la Secretara de Estado de Cultura.
3

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
183

Figura 1. Objetivos. (Elaboracin propia).

Quiz uno de los retos ms interesantes en estos desarrollos ha sido aplicar los modelos
tericos a la prctica archivstica en las estructuras y herramientas de descripcin de PARES,
adaptando la primera y segunda parte dedicada a los agentes y las relaciones del Modelo
Conceptual de Descripcin Archivstica de la Comisin de Normas Espaolas de Des-
cripcin Archivstica (CNEDA), publicado en 20124. Mientras se redactaba este texto, se ha
puesto en circulacin para informacin pblica la propuesta de la tercera parte de estas normas
(atributos)5, que deber tambin testearse en su momento en PARES.

Figura 2. Normas de descripcin archivstica. (Elaboracin propia).

Vase Bibliografa.
4

Disponible en <http://www.mecd.gob.es/cultura-mecd/dms/mecd/cultura-mecd/areas-cultura/archivos/mc/cneda/documen-
5

tacion/MCDA-P3--15-01-2016-_borradorIP/MCDA-P3%20(15-01-2016)_borradorIP.pdf >. [Consulta: 27 de enero de 2016].

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
184

En este proceso de adaptacin del MCDA, la parte de las relaciones ha sido crtica, cons-
cientes de que era un elemento esencial y necesario para poder interoperar en RDF. Sin em-
bargo, se ha dado un paso ms all de los modelos de relaciones propuestos por la NEDA.
Las normas EAC-CPF establecen cinco tipos de naturaleza de las relaciones (identidad, familia,
asociativas, jerrquicas y temporales) y deja abierta la posibilidad de establecer localmente
relaciones especficas. Durante el proceso de desarrollo del nuevo mdulo de autoridades, con-
sideramos que necesitbamos identificar dentro de cada tipo de relaciones las denominaciones
de estas relaciones especficas de acuerdo con la direccin de las mismas (directa o inversa)
cuando estas son asimtricas. Tngase en cuenta que nicamente los tipos de relacin de identi-
dad y asociativas son simtricas, es decir, una relacin entre A y B se denomina igual que entre
B y A por ejemplo, A es socio de B, y B es socio de A. Sin embargo, las relaciones jerrqui-
cas, familiares o temporales implican mayor precisin: por ejemplo, A es padre de B, pero B es
hijo, o hija, natural o legtima de B, es decir, cuatro tipos diferentes de relaciones especficas
de B con respecto a A. As, durante este proceso se documentaron todas las relaciones existen-
tes entre las autoridades en PARES, se cotejaron los ejemplos de relaciones de las NEDA, de las
ISAAR-CPF, EAD-CPF y tambin los modelos funcionales FRAD y de otros modelos, como los
apndices J y K de las RDA6. El xito de esta iniciativa nos permite en la actualidad presentar
relaciones pertinentes y concretas, y generar materiales y grafos de gran calidad: genealogas
ascendentes o descendentes de una persona (relaciones familiares), pero tambin organigramas
para las relaciones jerrquicas entre instituciones, o esquemas de evolucin de organismos para
las relaciones temporales.

Figura 3. Detalle de la lista controlada de relaciones especficas con las relaciones inversas de PARES. (Elaboracin propia).

Otra de las claves en todo este complejo proceso de desarrollo del mdulo de descripcin
de autoridades y puntos de acceso ha sido, sin duda, el encaje y la adaptacin de los requeri-
mientos de la nueva norma internacional de intercambio (EAC-CPF) con la norma internacio-
nal de estructura (ISAAR-CPF) y con nuestra norma propia de contenido para el caso de las

Vase Resource Description and Access: <http://www.rda-jsc.org/archivedsite/docs/6JSC-CILIP-rep-3-Appendix-1.pdf>.


6

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
185

autoridades de personas, familias, instituciones, materias y lugares. La Subdireccin General de


Archivos Estatales public en 2010 las Normas para la elaboracin de puntos de acceso
normalizados de instituciones, personas, familias, lugares y materias en el sistema
de descripcin archivstica de los Archivos Estatales (NPA). Las Normas tienen como
objetivos proporcionar reglas y/o recomendaciones para la elaboracin de puntos de acceso
normalizados de instituciones, personas, familias, lugares y materias, designados como Forma(s)
autorizada(s) del nombre, en el caso de instituciones, familias y personas, o como Trmino(s)
preferente(s), en el caso de lugares y materias. Asimismo, pretenden facilitar determinadas reglas
o recomendaciones para la cumplimentacin de otros elementos o componentes estructurales
de los registros de autoridad (de instituciones, familias y personas) y tesauros (lugares y de ma-
terias) que puedan desarrollarse con posterioridad. Estas Normas se han creado para su uso en
el sistema de descripcin archivstica automatizado de los Archivos de titularidad estatal gestio-
nados por el Ministerio de Educacin, Cultura y Deporte: Portal de Archivos Espaoles (PARES).
Sin embargo, los propios desarrollos del nuevo mdulo han supuesto tener que retocar y afinar
aspectos de la NPA que resultaban inconsistentes. Estas normas estn en proceso de revisin,
ya que si en 2010 tenan como objetivo la formalizacin de puntos de acceso, ahora el objetivo
es la elaboracin de registros de autoridad como conceptos. Se va a incluir, adems, una nue-
va parte de las normas dedicada a la formalizacin de nombres de normas y de actividades y
funciones que no estaban contempladas en la primera edicin, otro captulo a los nombres de
las relaciones, as como adaptar la parte de lugares y materias a la nueva ISO25964 de tesauros.
Esperamos que la nueva edicin de las NPA, cuya redaccin est ya muy avanzada, vea la luz
lo antes posible.
Los desarrollos del nuevo mdulo han ido paralelos a los trabajos de colaboracin inter-
nacional que hemos venido llevando a cabo en el Portal de Archivos Europeos (en adelante,
APE), red de archivos que comenz su andadura en 2009 bajo el nombre de APEnet a iniciativa
espaola y con el patrocinio de la Comunidad Europea7. Durante la fase del proyecto APEx Ar-
chives Portal Europe Network of Excellence, entre 2012 y 2015, hemos formado parte del grupo
de trabajo WP4: Standard and Guidelines, que ha supuesto trabajar en la elaboracin de los
perfiles del portal de las normas internacionales de intercambio EAG, EAC-CPF y EAD, as como
en los documentos schemas, mapeos, DTD y deliverables necesarios para APE; en especial, en el
desarrollo de las apeEAC-CPF8 y las autoridades en el Portal y en la adecuacin de los perfiles de
EAD a las EAD3 y su interoperabilidad con EDM. En paralelo, hemos trabajado en los desarrollos
para la elaboracin en PARES de la herramienta para la generacin automtica de los ficheros
XML en los perfiles de APEx: apeEAD, apeEAC-CPF y apeEAG2012, mientras adaptbamos los
contenidos y se revisaban los datos y campos obligatorios de diversos fondos y colecciones de
los archivos estatales, y se elaboraban ficheros de autoridades de personas, instituciones y fami-
lias. Se han realizado continuas pruebas de subida y visionado en las herramientas de APE para
la preparacin e intercambio de datos, el dashboard y el DPT. Como un gran engranaje, se han
testado los errores, resolviendo inconsistencias, que en ocasiones eran problemas de los propios
datos, en otras, errores en la construccin de los XML, en otras, del propio portal europeo...
aprovechando todo este gran campo de pruebas para avanzar en el desarrollo del mdulo y en
la confeccin y construccin de nuestros registros de autoridad y vocabularios.
APE9. Es el agregador archivstico europeo de Comisin Europea y Europeana. Se han
desarrollado diferentes estrategias, documentos y herramientas para facilitar el envo de datos a
Europeana desde un entorno normalizado y resolver los problemas de interoperabilidad entre las
normas archivsticas en contexto en un entorno comn con bibliotecas, museos y otras institu-

Vase sobre Apenet: <http://www.apenet.eu/>, sobre APEx: <http://www.apex-project.eu/index.php/en/> y como fundacin:


7

http://www.archivesportaleuropefoundation.eu/.
8Manuales y materiales del WP4 disponibles en: <http://www.apex-project.eu/index.php/en/outcomes/standards y en http://

wiki.archivesportaleurope.net/index.php/Main_Page>.
9Para ms informacin vase <http://www.archivesportaleurope.net/>.

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
186

ciones culturales. Si nuestros datos son interoperables con APE, en sus cuatro variables, nuestros
datos sern interoperables con Europeana: apeEAD con EDM, y tambin apeEAC con EDM10.

Figura 4. Estado actual de los trabajos de desarrollo del portal PARES. (Elaboracin propia).

En resumen, el nuevo mdulo de autoridades de PARES contempla, tal y como hemos


comentado, el control de autoridades de los tipos de entidad contemplados en la NEDA:
Entidades del tipo agente (que incluye los subtipos institucin, persona y familia), tanto
productores de fondos o no, cuya estructura de datos est basada en ISAAR-CPF y EAC-CPF.
Entidades de lugar y materias, con la estructura de datos ISO 25964.
Entidades del tipo funcin y sus divisiones, y las entidades del tipo norma, cuya estructura
de datos se basa en ISDF y en EAC-CPF (se utilizan etiquetas de campos equivalentes, ya
que an no est implementada la norma EAC-F).

Figura 5. Tipos de registros de autoridad. (Elaboracin propia).

El modelo de datos de Europeana (EDM) es una versin de 2013 del modelo de datos ESE (Europeana Semantic Elements,
10

<http://pro.europeana.eu/share-your-data/data-guidelines/ese-documentation>) en desarrollo. Se reutilizan otras herra-


mientas interoperables: RDF (Resource Description Framework), ORE (OAI Object Reuse and Exchange), SKOS (The Simple
Knowledge Organization System) y DC (Dublin core namespaces for properties).

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
187

No nos es posible abordar por completo cada uno de estos tipos de registros de autoridad
y cmo se estn llevando a cabo los procesos de normalizacin de los diversos tipos (vase
Lafuente y Muriel, 201411). Intentaremos sintetizar las novedades ms interesantes y centrarnos
en los tesauros:
Sobre los registros de autoridad de personas, familias e instituciones, ya hemos comentado
que lo ms novedoso de los desarrollos, adems de la implementacin del modelo de datos con
las EAC-CPF, ha sido el desarrollo de las relaciones: entre registros de autoridades de personas,
familias e instituciones, entre estas y sus funciones, con las materias (como actividades o eventos
bibliogrficos), con los lugares y con otros recursos, y lo ms importante, con las unidades de
descripcin asociadas, diferenciando las relaciones como productor de las que son materia de un
documento. Cuando las relaciones especficas de familia estn bien informadas, el sistema gene-
ra automticamente las genealogas ascendentes y descendentes de la persona.

Figura 6. Detalle del rbol genealgico ascendente del I Marqus de Santillana. (Captura de INTRAPARES, 3 de febrero de 2016).

Otro caso de relaciones, las establecidas entre eventos (tipos de materias) utilizados para
cumplimentar con listas estructuradas el campo historia o <BioHist> segn las especificaciones
de la etiqueta <chronList>, que tambin puede usarse de forma inversa, es decir, desde un even-
to ver las personas relacionadas. Figura 7.

Remitimos al trabajo publicado con ocasin del Micrositio de la Fragata Mercedes, donde se comentan estos trabajos
11

previos de manera ms pormenorizada.

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
188

Figura 7. Detalle del registro de autoridad del evento (materia)


Batalla de Lepanto, 1571 y sus relaciones con autoridades de persona. (Captura de INTRAPARES, 3 de febrero de 2016).

Materias y lugares. A partir de haberse cerrado los desarrollos de la herramienta, hemos


empezado a construir los tesauros de materias y de lugares a partir de los puntos de acceso que
ya existan en la base de datos PARES que se estn normalizando, dividiendo o unificando para
adecuarlos a las NPA, y de todos aquellos nuevos que se van proponiendo por los tcnicos
que llevan a cabo los tratamientos archivsticos relacionados con la descripcin de fondos en
los archivos y, al igual que en todo el mdulo, asociados a las unidades de descripcin corres-
pondientes.
El modelo aplica los principios de las ISO 25964, donde cada concepto puede englobarse
en varias familias del tesauro, como un tesauro multifaceta. Otra de las lneas de trabajo es tratar
de hacer compatibles al mximo las familias del tesauro (los Top Term) as como los trminos
ms generales con los tesauros ms conocidos y en uso, como el de la UNESCO o EUROVOC,
o los vocabularios y open data de las grandes bibliotecas. Sin embargo, las temticas que con-
templan los fondos de nuestros archivos son tan complejos y extensos que hemos tenido que
ampliar o desdoblar las familias clsicas de tesauros, por un lado, y ampliando los trminos
especficos mucho ms all, integrando tanto trminos de uso actual con otros ya inexistentes
pero de gran uso y pertinencia en los documentos de los fondos antiguos.
A la vez que vamos normalizando los vocabularios, se establecen las formas preferentes de
acuerdo a las NPA, se indican sus equivalentes lingsticos enlazados en su caso con sus equiva-
lentes segn otras reglas con los repositorios open data (BNE, LEM y sus equivalentes en gallego
y cataln, y por supuesto con la Library of Congress y la BNF francesa) o recursos electrnicos
con enlaces permanentes (DRAE, CSIC, etc.) en los cinco idiomas que se han comentado, se
enriquece en la medida de lo posible con los recursos electrnicos y fuentes pertinentes. De
momento, el tesauro multilinge no es simtrico, aunque el objetivo es que lo llegue a ser.

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
189

Figura 8. Detalle del tesauro multilinge de materias en euskera: Transporte areo (Captura de INTRAPARES, 3 de febrero de 2016).

Como ocurre en todo tesauro multilinge, la complejidad reside en los problemas semn-
ticos, es decir, en determinar si los conceptos en dos lenguas son exactos o aproximados, y en
este caso, cmo o de qu manera resolver la traduccin de trminos a otras lenguas, algunos,
intraducibles, como los antiguos impuestos u oficios medievales, por ejemplo, alcabala del vien-
to, almojarifazgo o almotacn.

Figura 9. Trminos especficos no traducibles (Captura de INTRAPARES, 4 de febrero de 2016).

En los tesauros de lugares se estn formalizando los lugares de acuerdo con la toponimia
oficial actual (importante en comunidades lingsticas diferentes al castellano), georreferencian-
do, recogindose tambin cualquier otro nombre alternativo o anterior, y tesaurizando.

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
190

Figura 10. Tesauro de lugares de geografa poltica. Arteixo (A Corua). (Captura de INTRAPARES, 4 de febrero de 2016).

Este tesauro consta de momento de varias facetas: geografa poltica, geografa natural,
la artificial y, la ms compleja pero necesaria tratndose de archivos histricos, las jurisdicciones
antiguas: judicial, eclesistica, militar y las entidades ya desaparecidas.

Figura 11. Lugares (lista alfabtica): Jurisdiccin antigua: Flandes. (Captura de INTRAPARES, 4 de febrero de 2016).

Funciones y actividades. Aqu nos hemos topado con una barrera importante, necesitamos
avanzar en los desarrollos pero an no se han desarrollado las normas que los establecen. Estas
relaciones son bsicas para documentar el contexto entre agentes. Los ltimos meses hemos es-
tado tratando de ver cmo poder implementar las funciones y tambin las normas en el mdulo
al mismo nivel que las personas, familias, instituciones, materias y lugares, si bien an las EAC-F
no existen (norma de intercambio de las ISDF). En este caso, hemos aplicado la misma lgica que
se emplea en la EAC-CPF para los productores en aquellos campos similares (formas autorizadas,
formas paralelas, otras formas, fechas de existencia, relaciones, etc.). Necesitamos establecer re-
laciones entre nombres/productores y sus funciones/actividades, para informar y documentar el
contexto y, a su vez, entre funciones/actividades y normas (mandate en EAC-CPF).

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
191

Figura 12. Funciones de familias nobles. Detalle del XML.

El tesauro de Normas incluye todo tipo de disposicin normativa, tesaurizada por tipos de
normas (leyes, decretos, pragmticas, etc.) que, o bien pueden ser los propios documentos
de archivo (tratados internacionales, pragmticas), o bien fuente legislativa de una entidad o
disposicin por la que se rige una funcin o competencia:

Figura 13. Normas. Detalle tesauro: Tratados internacionales. Paz de Westfalia y relacin de UD asociada.

Obviamente, cada nuevo paso que hemos dado ha supuesto en ocasiones tener que re-
visar los pasos anteriores, revisar contenidos, realizar pruebas, revisar las normas en un trabajo
continuo. En la actualidad, los esfuerzos en los desarrollos de PARES permiten visualizar todos
estos trabajos, centrndonos en un nuevo buscador que posibilite buscar en autoridades y con-

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
192

ceptos y en una nueva interfaz del portal y nueva pgina web de PARES. Un nuevo buscador
ms sencillo, amigable pero a su vez ms potente, con nuevas pantallas de resultados que pre-
sente filtros por facetas y permita bsquedas refinadas. Un segundo paso, cuando los tesauros
estn ms avanzados y completos, ser abrir los datos tanto de los vocabularios como de los
registros de autoridad en SKOS.

Figura 14. Conversin de lugares en SKOS.

Mientras tanto, seguimos trabajando en la mejora de nuestros datos y contenidos, im-


plementando y enriqueciendo los vocabularios, para que las bsquedas resulten pertinentes y
fiables, para que nuestros datos sean interoperables, transparentes y reutilizables; en definitiva,
que nuestro patrimonio documental se revalorice, se aprecie y se disfrute. Muchas gracias.

Figura 15. Nuevo buscador de PARES: bsqueda por autoridades (Oropesa). (Captura de INTRAPARES 4 de febrero de 2016).

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
193

Bibliografa
Hennicke, S. et alii (2011): Conversion of EAD into EDM Linked Data. First International Workshop
on Semantic Digital Archives, TPDL conference. Berln. Disponible en: <http://ceur-ws.org/
Vol-801>. [Consulta: el 31 de enero de 2016].
Lafuente Urien, A. (2014): Archival authority control: an introduction text to Encoded Archival Con-
text: corporate bodies, persons and families (EAC-CPF), julio 2014. Apex-project. (Recurso en
lnea). <http://www.apex-project.eu/index.php/en/articles/184-archival-authority-control-an-
introduction-to-encoded-archival-context-corporate-bodies-persons-and-families>.
Lafuente Urien, A., y Muriel Hernndez, S. (2014): Control de autoridades y puntos de acceso en el
Portal de Archivos Espaoles (PARES). Madrid: Ministerio de Educacin Cultura y Deporte.
(Recurso en lnea): <http://www.mecd.gob.es/fragatamercedes/dms/museos/fragatamercedes/
historia/fuentes-historicas/Control-de-autoridades.pdf>.
Sugimoto, G. (2009): Technical Report: Archival Digital Object Ingestion into Europeana (ESE-EAD
harmonisation) v1.0. Disponible en: <http://www.efgproject.eu/downloads/Technical_Re-
port_Archival_Digital_Object_Ingestion_into_Europeana_%28ESE-EAD_harmonisation%29_
v1.0.pdf>. [Consulta: 31 de enero de 2016].

Normas
CNEDA (18-06-2012): Modelo Conceptual de Descripcin Archivstica y Requisitos de Datos Bsicos de
las Descripciones de Documentos de Archivo, Agentes y Funciones. Parte 1: Tipos de Entidad.
Parte 2: Relaciones. <http://www.mcu.es/archivos/docs/NEDA_MCDA_P1_P2_20120618.pdf>
[Consulta: 31 de enero de 2016].
CNEDA (16-01-2016): Modelo Conceptual de Descripcin Archivstica y Requisitos de Datos Bsicos
de las Descripciones de Documentos de Archivo, Agentes y Funciones. Parte 3: Atributos. Do-
cumento en informacin pblica. <http://www.mecd.gob.es/dms/mecd/cultura-mecd/areas-
cultura/archivos/mc/cneda/documentacion/MCDA-P3--15-01-2016-_borradorIP/MCDA-P3%20
(15-01-2016)_borradorIP.pdf>. [Consulta: 31 de enero de 2016].
EAC-CPF: Encoded Archival Context - Corporate bodies, Persons, and Families (EAC-CPF). Disponible
en: <http://www.mcu.es/archivos/docs/EAC_CPF2010TL_SPA_2012.pdf2010>. [Consulta: 31 de
enero de 2016].
FRSAD (2010): Functional requirements for subject authority data. A conceptual model. IFLA, 2010.
Disponible en: <http://www.ifla.org/files/assets/classification-and-indexing/functional-require-
ments-for-subject-authority-data/frsad-final-report.pdf>. [Consulta: 4 de febrero de 2016].
FRSAD (2013): Functional requirements for Authority data: a conceptual model. IFLA, 2013. Dispo-
nible en: <http://www.ifla.org/publications/functional-requirements-for-authority-data>. [Con-
sulta: 4 de febrero de 2016].
ISAAR (CPF) (2004): Norma internacional sobre los registros de autoridad de archivos relativos a
instituciones, personas y familias [Recurso electrnico], 2 ed. Madrid: Ministerio de Cultu-
ra, Secretara General Tcnica. Disponible en: <http://www.mcu.es/archivos/docs/isaar.pdf>.
[Consulta: 31 de enero de 2016].
ISFD (2007): Norma internacional para la descripcin de funciones [Recurso electrnico], 1 ed.
2. Disponible en: <http://www.mcu.es/archivos/docs/CE/ISDF_ESP_definitiva.pdf>. [Consulta:
31 de mayo de 2010].
NPA (2010): Normas para la elaboracin de puntos de acceso normalizados de instituciones, personas,
familias, lugares y materias en el sistema de descripcin archivstica de los Archivos Estatales.

El lenguaje del patrimonio | Pgs. 181-194


PARES hacia la web semntica: autoridades y tesauros en los archivos estatales
194

Madrid: Subdireccin General de los Archivos Estatales. Disponible en: <http://www.mcu.es/


archivos/docs/Novedades/Norma_puntos_acceso2010.pdf>. [Consulta: 4 de febrero de 2016].
UNE-ISO 25964-1 (2014): Informacin y documentacin: Tesauros e interoperabilidad con otros vo-
cabularios. Parte 1: Tesauros para la recuperacin de la informacin.

El lenguaje del patrimonio | Pgs. 181-194

También podría gustarte