Power Point
Caso clínico
Ampliación de información
Vídeos
No todo es clínica
Octubre 2019
Octubre 2019

Tesauros: ¡menuda palabrota!

Sara Ares Blanco

Especialista en Medicina Familiar y Comunitaria CS Federica Montseny. Madrid Vocal de Investigación de la SoMaMFyC

Remedios Martín Álvarez

Especialista en Medicina Familiar y Comunitaria CAP Vallcarca. Barcelona Responsable de investigación Junta Permanente semFYC

Sara Ares Blanco

Especialista en Medicina Familiar y Comunitaria CS Federica Montseny. Madrid Vocal de Investigación de la SoMaMFyC

Remedios Martín Álvarez

Especialista en Medicina Familiar y Comunitaria CAP Vallcarca. Barcelona Responsable de investigación Junta Permanente semFYC

Puntos clave

  • Los tesauros son un conjunto de palabras que constituyen un vocabulario, organizado de forma jerárquica, que facilitan la búsqueda de información en las bases de datos bibliográficas.
  • Los tesauros más conocidos en el ámbito de la Medicina Familiar son los términos MeSH de PubMed, Emtree de Embase y los Descriptores en Ciencias de la Salud de Bireme.
  • Los tesauros permiten hacer búsquedas bibliográficas precisas, así como normalizar el vocabulario médico que se usa en todo el mundo.
  • Las palabras clave o descriptores de los tesauros son fundamentales para catalogar e indexar artículos en las bases de datos, y aseguran la visibilidad de un elevado número de trabajos de la misma temática.
  • Las palabras clave de los resúmenes estructurados y publicaciones han de ser bien elegidas, y se aconseja que sean acordes con los descriptores de los tesauros para facilitar la divulgación de la producción científica.

 

¿Qué es un tesauro?

Un tesauro es un conjunto de palabras que constituyen un tipo de vocabulario, organizado de forma jerárquica, y que se basa en el uso de palabras clave o descriptores, que definen un concepto de forma breve y clara.

 

Los tesauros constituyen un conjunto ordenado y estructurado de todos los descriptores o palabras clave que se utilizan en el ámbito biomédico para describir, indexar y clasificar las referencias de los trabajos en las bases de datos bibliográficas.

 

Los descriptores son términos estandarizados que la institución que produce la base de datos bibliográfica asigna a cada referencia en el proceso de su clasificación y descripción temática. Es una manera de representar los conceptos principales tratados en los artículos para facilitar así su recuperación.

 

Los tesauros no proporcionan significados, sino que muestran los términos que tienen indexados y sus relaciones de jerarquía y sinonimia con otros términos. En los tesauros cada concepto está representado por un único término, y cada término representa un único concepto, de esta manera se resuelven los problemas de sinonimia, polisemia y ambigüedad que comporta el lenguaje en global.

 

Por todo ello, el tesauro está organizado de forma jerárquica, en forma de árbol, de manera que ciertas palabras clave generales son la parte principal (término principal), y de ellas dependen otras palabras más específicas (términos asociados).

 

Al preguntarse sobre las complicaciones del dolor de garganta, primero habría que escoger la palabra sobre la que hacer la búsqueda bibliográfica. En este caso, la más importante podría ser «faringitis», como término principal. Dentro de las faringitis, se encontrarían otras series de palabras, menos importantes (en general, por ser enfermedades menos frecuentes) pero más concretas, que darían las complicaciones de la misma. Estos términos asociados son dependientes de faringitis y podrían ser: nasofaringitis, absceso retrofaríngeo y amigdalitis.

 

La relación entre las palabras clave del tesauro puede ser por similitud (términos sinónimos), por jerarquía (un término es más importante que otro) o por relación (un término aporta una característica más concreta de esa palabra clave)1.

 

¿Qué tipo de tesauros existen?

En inglés, el tesauro más conocido es el MeSH, que se puede encontrar en PubMed (figura 1). En español, siguiendo el ejemplo de la terminología MeSH, se desarrollaron los Descriptores en Ciencias de Salud (DeCS) realizado por BIREME (figura 2), y auspiciado por la Organización Panamericana de la Salud (http://bit.ly/2WTepjw). Los DeCS contienen más de medio millón de términos, y para los hispanoparlantes tienen la ventaja de que dan el mismo término en español, en inglés y en portugués2.

 

Para quien tenga dificultades con el inglés, otra alternativa a los DeCS sería usar BabelMesh (figura 3) (http://bit.ly/2Ij8gsU), que traduce el término MeSH del español al inglés y lanza directamente la búsqueda. Permite también limitar la búsqueda solo a artículos en español que estén indexados en PubMed. Y otra ventaja es que, en el caso de, una pregunta clínica desarrollada con la metodología PICO también permite buscarla en español a través de PubMed (http://bit.ly/2FPLSUQ).

 

Otro tesauro es el Emtree, que se usa en la base de Embase3 (figura 4) (http://bit.ly/2UpLS8l). Pero esta base de datos tiene la peculiaridad de que no es de acceso libre. Embase ha exportado todos los términos MeSH y los ha adaptado mediante una herramienta informática a Emtree.

  

 

La diferencia entre ambos tesauros es que MeSH usa más vocabulario y definiciones amplias, mientras que Emtree usa menos sinónimos y definiciones especialmente concisas. Véase como ejemplo la definición de Atención Primaria (tabla 1). Por otro lado, Embase dispone del texto completo de los artículos indexados, no solo el resumen y el título, como sucede en PubMed. En Embase se encuentran también más términos Emtree sobre fármacos y dispositivos médicos que en PubMed.

 

Por último, un tesauro menos conocido, y también a considerar, es el que desarrolla el Ministerio de Salud de Australia (figura 5) (http://bit.ly/2A3jO0J).

 

¿Qué son los términos MeSH?

Los términos MeSH (Medical Subject Heading, título o encabezado de temas médicos) son palabras definidas por los documentalistas de la Biblioteca Nacional de Medicina de Estados Unidos (NLM) para catalogar y facilitar la búsqueda de información médica; se puede consultar a través de PubMed.

 

Estos términos se usan tanto en artículos como en libros registrados en las bases de datos que dependen de la NLM, pero no en otras bases. En 2019 hay descritos 29.351 términos, 76 subtítulos y 247.209 términos complementarios, y en este año se añadieron 421 nuevas palabras. Cada año el listado se actualiza, haciéndose público a finales del otoño del año previo, pudiéndose consultar todas las novedades de los MeSH en su web (http://bit.ly/2KhTXHq). Un ejemplo añadido al listado en 2019 es el término «exfumadores» (ex-smokers), ya que antes no existía y solo se podía hacer una búsqueda por MeSH como fumadores (smoking), aunque hubiesen abandonado ese hábito.

 

Los términos MeSH también pueden llamarse conceptos o descriptores. Estos términos resumen el contenido general de un tema que está dividido entre términos más generales (broader terms) y términos más concretos (narrow terms). Esta distinción entre términos según la concreción también la presentan otros tesauros4.

 

En ocasiones, un término tiene una palabra favorita (preferred term) que puede ser la primera palabra que aparece al iniciar la búsqueda5. Pero los términos favoritos pueden cambiar a lo largo del tiempo, ya que el lenguaje médico evoluciona, por ello, para mantener el contenido del término preferido, aunque la palabra que se use cambie, se emplea un número identificativo (unique identifier, UI) que pertenece al concepto y no cambia.

 

Los términos MeSH, además de ser palabras claves, y clasificar los títulos o el resumen del artículo, también clasifican su contenido. Hay que tener en cuenta a la hora de usar las palabras clave que los términos MeSH que se ven en el resumen de PubMed son las palabras que propone la revista indexada en sus normas de publicación.

 

A día de hoy, casi todas las revistas y congresos de nuestroámbito solicitan que se empleen términos MeSH o DeCS para facilitar la búsqueda de información pos­terior.

 

¿Qué base de datos utilizan los términos MeSH?

Los términos MeSH son usados por MEDLINE, que es la principal base de datos de la NLM para indexar sus fondos bibliográficos. Inició su recorrido en 1966, aunque recoge artículos previos a este fecha, y a día de hoy contiene más de 26 millones de referencias de artículos, desde las ciencias básicas a aspectos más educativos, e incluye biología, biofísica, química, bioingeniería, psicología, medicina y salud pública. MEDLINE es la primera fuente de información de PubMed.

 

MEDLINE contiene más de 5.200 revistas de todo el mundo, en más de 40 idiomas, aunque el 93% de los artículos publicados están en inglés y el 40% de los artículos se han realizado en Estados Unidos. La selección de estas revistas la realiza un comité técnico de la NLM, junto con un comité de expertos externo. A su vez, también se pueden encontrar newsletters o revistas en colaboración con asociaciones profesionales, como la Asociación de Enfermeras Americanas o la Asociación de Dentistas Americanos. En 2017 se añadieron 813.500 citas a MEDLINE.

 

Las palabras clave genéricas y los términos MeSH, descriptores de los tesauros

 

Las palabras clave de un resumen o manuscrito, en ocasiones, no son las mismas que las palabras o descriptores de un tesauro.

 

En la actualidad, la mayoría de las publicaciones biomédicas solicitan que las palabras claves sean acordes con los descriptores de un tesauro, aunque pueden dejar abierta la posibilidad de utilizar palabras clave según los autores consideren. Por ello es importante conocer qué son las palabras clave en genérico y su implicación.

 

Las palabras clave son términos o frases cortas que condensan las temáticas más importantes que se presentan en un manuscrito.

 

La importancia de las palabras clave radica en que son una herramienta de doble vía, es decir, de quienes escriben y de quienes buscan la información de manuscritos o áreas temáticas relacionadas. Permiten a los documentalistas clasificar y ordenar los sistemas de indexación, y a su vez la recuperación de manuscritos de las bases bibliométricas.

 

Por ello, no se debe infravalorar o menospreciar su importancia a la hora de escribir un resumen estructurado o un manuscrito. El uso inadecuado de las palabras clave puede dificultar la difusión de un trabajo científico, si no se detecta su relación con otros similares. Y viceversa, la adecuada elección de las palabras clave asegura la visibilidad de los manuscritos6.

 

La posible subjetividad de las palabras clave (keywords), considerada como una debilidad, puede ser obviada si se cuenta con un vocabulario controlado o tesauro de referencia que facilita la elección adecuada. En general, el número de palabras clave en la mayoría de las revistas científicas oscila entre 3 y 10, y deben ser obtenidas de tesauros específicos o disciplinares de acuerdo con el contenido del tema del resumen o manuscrito.

 

Por todo ello, es recomendable que las palabras clave se correspondan con los descriptores MeSH, ya que ello facilita que los documentalistas puedan indexar y presentar los conceptos principales tratados en un artículo, y asegura una adecuada visibilidad en búsquedas posteriores.

 

La historia de los términos MeSH

La primera lista de términos la realizó, en 1954, la NLM bajo el título Subject Heading Authority List, basándose en una lista previa, la Current List of Medical Literature7. En esta lista había unos 100 subtítulos que procedían de las categorías principales que estaban divididas por regiones anatómicas, órganos y tejidos. En el prólogo de la primera edición de los MeSH ya se recogía que los títulos pueden parecer un lenguaje estereotipado, pero si se entienden como sugerencias en vez de como palabras clave, se puede tolerar cierta ambigüedad de las palabras utilizadas.

 

En 1960 se redujeron a 67 subtítulos, que eran más generales, con 4.400 descriptores. Fue entonces cuando el director de la NLM, Frank B. Rogers, planteó que las listas deben ser de uso sencillo para los usuarios y a su vez simplificar el trabajo de los bibliotecarios mediante una estrategia común de búsqueda. A pesar de ello, la lista tenía problemas para clasificar artículos que recogían varios temas, como etiología, fisiopatología o tratamiento. En 1963, la segunda edición de los MeSH describía 13 categorías, con 58 subcategorías, que los dividía en categorías principales y subcategorías, con 5.700 descriptores.

 

Clasificación de los términos MeSH

Los términos MeSH están clasificados de forma jerárquica partiendo de lo más general hacia lo más concreto, y siempre deben explicar el contexto del concepto. Para la distribución jerárquica se utiliza una estructura en árbol (figura 6), que divide los términos en 16 categorías generales que formarían las ramas principales del árbol (tabla 2) y dentro de esas categorías aparecerían las ramas de menor tamaño (títulos y subtítulos) (http://bit.ly/2mB9DHb)8. Cada posición del árbol tiene un número identificativo que lleva la letra de la categoría al número asociado (Tree Number) y en el caso de los fármacos se considera no solo su categoría, sino también su nivel de actuación. Cuando se busca en el árbol, se encuentra la definición del término (Scope Note) y también aclaraciones (Annotation) que explican por qué se utilizó esa posición en el árbol.

 

 

A su vez, también se puede consultar la fecha en la que se indexó, ya sea una fecha única o, en ocasiones dos fechas. Por ejemplo, si se busca Atención Primaria (Primary Health Care) aparece 1974 (1972), esto significa que se indexó en 1972, pero que el término preferido cambió al actual en 1974. En la misma pantalla se muestra qué descriptor se utilizó previamente a 1972, que en este caso sería «Comprehensive Health Care», que comenzó a usarse con ese significado en 1968. Esto es importante,  según las búsquedas que se hagan, para afinar si se quieren buscar artículos más antiguos (figura 7).

 

Una vez que se conoce la categoría del descriptor, la clasificación sigue en este orden9:

  1. Título (Main Heading, MH), también se traduce al español como encabezamiento. Es la parte más importante de los MeSH, y describe «de qué va» un artículo y resume el significado del tema. Los términos MeSH asignados a un artículo pueden representar un tema central o bien un tema más secundario, pero nunca incorporan la localización geográfica, por lo que son palabras que describen un concepto en una situación neutra.
    Se trata de palabras científicamente aceptadas, que pueden aparecer en más de una posición del árbol.
    Para decidir qué termino es el título, se usa también el término favorito, que es aquel con un significado más general sobre ese tema, considerando al resto de los términos como subordinados al mismo (que serían los si­nónimos –entry terms–). En general, cada artículo puede tener desde un solo título hasta 10-15 títulos.
    Si en una búsqueda general en PubMed se escribe uno de los sinónimos, automáticamente la búsqueda se realiza mediante el término MeSH favorito; si fué­ramos a la sintaxis de la búsqueda (search builder) veríamos automáticamente ese término MeSH.
  2. Subtítulos (Subheadings o Qualifiers, SH). Incluyen cualquier tema en relación con el título, y en general explican una característica de este, y por ello son más específicos. Cuando esta característica incluye la forma, el lenguaje o la geografía del tema, se define como Qualifier (http://bit.ly/2LvEW4l). En el caso de farmacología, los subtítulos serían administración y dosificación, efectos adversos, agonistas, antagonistas e inhibidores y farmacocinética. También se puede consultar el significado de los subtítulos (http://bit.ly/2NBjzfq).
  3. Conceptos complementarios (Supplementary Concept Records): son sobre todo términos incluidos en la categoría D (sustancias químicas y fármacos). Se clasifican por el nombre de la sustancia, sinónimos con el nombre comercial o el número de laboratorio, el nombre definido por la Sociedad Americana de Química (CAS tipo 1) o el nombre de la enzima (registro CAS). Los compuestos químicos se asocian a un título con su correspondiente acción farmacológica. Se añaden diariamente.
    Además de estas cuatro categorías, puede haber combinaciones entre título y subtítulo, anotaciones (que son apuntes para entender las relaciones entre el título y los subtítulos) o descriptores (describen la relación entre el título y la localización geográfica).

 

¿Cómo se usan los términos MeSH en una búsqueda?

Para acceder a los términos MeSH, hay cuatro opciones (http://bit.ly/2mEEHFO):

  1. Entrar por la portada de PubMed y en la columna de la derecha de recursos, señalar base de datos MeSH (figura 8).
  2. Entrar por el cajón de búsqueda de PubMed y seleccionar la base de datos de MeSH en la pestaña del navegador (figura 9).
  3. Entrar directamente por la sección de PubMed de los términos MeSH (figura 1) (http://bit.ly/2Lwn5u8).
  4. Utilizar las estrategias de búsqueda de PubMed para usar los términos MeSH mediante etiquetas; esto significa que se escribiría la palabra que buscar en el navegador de PubMed y se añadiría entre corchetes la etiqueta correspondiente (término MeSH [Mesh], tema principal MeSH [MAJR], título MeSH [MH], subtítulo MeSH [SH], concepto complementario [Supplementary Concept]) (figura 10).

 

Una vez que se sabe dónde buscar por término MeSH, hay que localizar el descriptor MeSH del tema que se quiere estudiar9; y cuando se sepa la palabra concreta, se pueden emplear cuatro estrategias de búsqueda:

  1. Buscar la palabra, añadirla al cajón de sintaxis y realizar la búsqueda.
  2. Buscar la palabra y limitar la búsqueda al tema principal («restrict to major topic») para obtener información más general.
  3. Buscar la palabra, añadirla al cajón de sintaxis, pero agregar también uno o más subtítulos para hacer una búsqueda más específica.
  4. Solo hacer búsquedas a nivel de ese término MeSH, pero de ninguna palabra subordinada a la misma («Do not include MeSH terms found below this term in the MeSH hierarchy»).

 

Si se desea hacer una búsqueda general, se recomienda usar la estrategia 1, y para una búsqueda más concreta en un tema del que hay muchos artículos publicados, la estrategia 3.

 

En 2019 se ha añadido el término «revisión sistemática» (http://bit.ly/2YWfloX) que permite utilizar diferentes estrategias de búsqueda:

  1. Buscar como término MeSH y añadirlo a otros términos MeSH para buscar solo revisiones sistemáticas.
  2. Usar su abreviatura (systematic [sb]) junto al término que se esté buscando para agilizar la búsqueda.
  3. Una estrategia para buscar de forma más amplia revisiones sistemáticas que comparten de forma pública (http://bit.ly/2G5kBiz) copiando el enlace y añadiendo el término MeSH que interese para lanzar la búsqueda en PubMed.
  4. Otra opción de búsqueda de revisiones sistemáticas sería usar los MeSH a través de la página de Clinical Queries (http://bit.ly/2KdOHEF).

 

En 2014 se introdujo MeSH on Demand (http://bit.ly/2OUcEzD), que es una herramienta informática para encontrar los términos MeSH más relevantes en un texto libre o en un resumen. Tiene la ventaja de que puede ayudar a encontrar más términos de los que inicialmente uno pensaría, pero con la limitación de que no ha sido realizado por una persona. También se puede usar para revisar un resumen que se haya escrito para decidir escoger dos o tres palabras clave.

 

Mientras se consulta un artículo en PubMed, se puede ver, en el borde inferior del artículo: el tipo de publicación (artículos de revistas científicas, guías de práctica clínica, cartas al editor, revisiones, etc.), los términos MeSH presentes en el título y el resumen del mismo artículo. Esto, en caso de búsquedas de temas poco frecuentes, orienta a posibles términos MeSH que se usen para describir ese tema, de modo que puedan copiarse esos términos para mejorar la estrategia de búsqueda.

 

Limitaciones de los términos MeSH

No todas las palabras están indexadas como término MeSH, por lo que, en ocasiones, al buscar una palabra, puede que no se encuentre o que tenga una definición diferente a la que estemos empleando.

 

Por ejemplo, si se buscase el término británico de médico de familia (GP), no lo encontraríamos. Si buscásemos por «General Practitioner», la definición sería la de médicos cuya práctica no está restringida a un campo concreto de la medicina, lo cual probablemente no sea la definición que esperamos del médico de familia. Si buscásemos por médico de familia («Family Doctor»), tampoco lo encontraríamos como término MeSH, y habría que buscar como «Family Physician», con la salvedad de que la definición es «aquellos médicos que han completado los requerimientos educativos por la Academia Americana de Médicos de Familia», lo cual tampoco coincidiría con los requisitos para ser médico de familia en España.

 

Al buscar en PubMed por «Family Physician», se obtienen 15.810 resultados, pero restringiendo la búsqueda a Estados Unidos y siguiendo la definición estricta de término MeSH, aparecen solo 2.168 resultados. Por lo tanto, los términos MeSH ayudan en la búsqueda, pero con matices que deben valorarse y conocerse antes de iniciar una búsqueda. No se debe olvidar que los MeSH se limitan al campo de la medicina, y aunque hay términos más amplios compartidos con otras áreas del conocimiento, si se buscan términos de otras disciplinas, probablemente no se encuentren como término MeSH.

 

Las definiciones de los términos pueden variar también a lo largo del tiempo, así como las fechas de inclusión en la clasificación, que suelen ser posteriores a la realidad que definen, como sucedió con el virus de la inmunodeficiencia humana, que se describió por primera vez en 1983, pero se incluyó en 1988. Otro ejemplo es la Atención Primaria, incluida en 1974, a pesar de su existencia desde hacía décadas.

 

Resumen

Los tesauros constituyen un vocabulario médico, organizado de forma jerárquica usando una estructura en árbol con términos generales y términos dependientes. Se trata de un conjunto ordenado y estructurado de descriptores o palabras clave del ámbito biomédico para describir, indexar y clasificar las publicaciones, en las bases de datos bibliográficas. Estos términos permiten también hacer búsquedas bibliográficas más específicas y no siempre coinciden con las palabras clave; en caso de que el tema sea poco frecuente, si se encuentra un artículo en PubMed sobre lo que se quiere estudiar, también se pueden consultar los términos MeSH que se usaron para indexarlo, y así relanzar la búsqueda con esos mismos descriptores.

 

Los tesauros más conocidos son los términos MeSH de PubMed, Emtree de Embase y los Descriptores en Ciencias de la Salud de Bireme.

 

A día de hoy, casi todas las revistas y congresos del ámbito de la Medicina Familiar solicitan que se empleen términos MeSH o DeCS para facilitar la búsqueda de información posterior.

 

Hoy en día, para resolver dudas clínicas, se busca información a través de bases de datos tipo PubMed o Embase, donde se encuentran artículos originados en todo el mundo. Esto debe llevar a pensar si, cuando se usa una palabra, esta significa lo mismo en un país centroafricano que en el sudeste asiático o en el ámbito español. Para solucionar esta situación se crearon los tesauros y las palabras clave, fundamentales para catalogar e indexar artículos en las bases de datos bibliográficas, y para asegurar la visibilidad de un número elevado de trabajos con la misma temática.

 

El uso de estas palabras ha aumentado de forma considerable en la investigación en el ámbito de la Medicina Familiar, en los últimos 15 años10.

 

Conclusión

A día de hoy, conocer los tesauros y su funcionamiento, y su utilidad es importante para cualquier médico que desarrolle labores asistenciales, investigadoras o docentes.

 

Bibliografía

  1. W. Martín Roncero. El uso de la terminología médica. Thesaurus. Medical Subject Headings (I). Aten Primaria [Internet]. 1999;23(9):548-52. Disponible en: http://www.elsevier.es/es-revista-atencion-primaria-27-articulo-el-uso-terminologia-medica-thesaurus--14835
  2. BIREME/OPS/OMS. DeCS 2018 - Novedades [Internet]. Biblioteca Virtual en Saúde. 2018 [cited 2018 Jul 18]. Disponible en: http://decs.bvs.br/E/visiongeneral2018.htm
  3. University of Toledo. Guide to using Embase - an international biomedical and pharmaceutical database [Internet]. Disponible en: http://libguides.utoledo.edu/Embase_Guide/Emtree
  4. Maniez J. Relationships in Thesauri: Some Critical Remarks. Int Classif. 1988;15(3):133-8.
  5. Soergel D. Organizing information: principles of data base and retrieval systems. Orlando (Florida): Academic Press; 1985. p. 252.
  6. NIH. History of MeSH [Internet]. 2017. [cited 2018 Jul 18]. Disponible en: https://www.nlm.nih.gov/mesh/intro_hist.html
  7. NIH. MeSH Tree Structures [Internet]. 2016 [cited 2018 Jul 18]. Disponible en: https://www.nlm.nih.gov/mesh/intro_trees.html
  8. National Library of Medicine NUS. Branching Out: The MeSH® Vocabulary [Internet]. 2012. Disponible en: https://www.nlm.nih.gov/bsd/disted/video/index.html
  9. National Library of Medicine NUS. Searching PubMed® with MeSH®. 2018. Disponible en: https://nnlm.gov/sites/default/files/shared/files/trifolds/meshtri.pdf
  10. Hong Y, Yao Q, Yang Y, Feng J, Wu S, Ji W, et al. Knowledge structure and theme trends analysis on general practitioner research: A Co-word perspective. BMC Fam Pract [Internet]. 2016;17(1):10. Disponible en: http://www.biomedcentral.com/1471-2296/17/10

AMF 2019; 15(9); 509-515; ISSN (Papel): 1699-9029 I ISSN (Internet): 1885-2521

Comentarios

No hay comentarios