Escudo UNAM Logotipo Dirección General de Bibliotecas y Servicios Digitales de Información, DGBSDI - UNAM   Logotipo LIEC - Lee, Investiga, Escribe y Comunica

La era digital ha revolucionado la forma en que buscamos información, desde los métodos manuales y laboriosos, pasando por la búsqueda en Internet, hasta la implementación de sistemas de descubrimiento y la búsqueda semántica. Cada etapa ha hecho que el proceso de búsqueda sea más accesible, eficiente y preciso. Hoy estamos en la cúspide de una nueva transformación, la Inteligencia Artificial Generativa, que está redefiniendo cómo accedemos y utilizamos la información.

Evolución de la búsqueda de información

    1. Búsqueda manual:
      • Uso de publicaciones periódicas, índices y resúmenes (abstracts) en formato impreso.
      • Revisión exhaustiva y manual de materiales.

      Búsqueda manual

    2. Vocabulario libre y controlado en bases de datos:
      • Uso de palabras clave y descriptores: Las palabras clave son términos elegidos libremente para buscar información, mientras que los descriptores son términos estandarizados utilizados para buscar y/o organizar contenidos en bases de datos.
      • Aplicación de operadores booleanos: AND, OR, y NOT que mejoran la precisión de las búsquedas al combinar o excluir términos, haciendo los resultados más relevantes.

      Vocabulario libre y controlado en bases de datos

    3. Búsqueda en Internet:
      • Acceso rápido y amplio mediante buscadores y metabuscadores.
      • Facilitación de la localización de información relevante.

      Búsqueda en Internet

    4. Sistemas de descubrimiento:
      • Herramienta de búsqueda unificada que permite acceder y recuperar contenidos de diversas fuentes y colecciones desde una única plataforma.
      • Organización y presentación eficiente de la información.

      Sistemas de descubrimiento

    5. Búsqueda semántica:
      • Interpreta el significado y contexto de las consultas para ofrecer resultados más relevantes.
      • Analiza cómo los términos se relacionan entre sí y con el contenido.
      • Reconoce términos similares para ampliar la búsqueda.
      • Usa técnicas para entender y analizar el lenguaje humano.

Ejemplo de Búsqueda semántica

Ejemplo de Búsqueda semántica

Búsqueda de información en línea con técnica RAG

Las herramientas que utilizan inteligencia artificial generativa para buscar información en fuentes específicas emplean una técnica conocida como RAG (Retrieval-Augmented Generation). Esta técnica permite que los modelos generativos, partiendo de un conocimiento general amplio, lo ajusten y apliquen de manera más detallada y precisa a tareas especializadas.

Originalmente, GPT no hacía uso de la técnica RAG. Fue con la aparición de funcionalidades como ChatGPT Search que se empezó a integrar el enfoque de recuperación de información para generar respuestas fundamentadas en datos externos.

Aunque existen herramientas de interacción documental como ChatPDF, Humata y ChatDOC, que también usan RAG para cargar documentos y mantener conversaciones sobre su contenido, no están realmente diseñadas para la búsqueda de información en línea.

Las herramientas basadas en RAG se caracterizan, además, por identificar y referir citas bibliográficas de las obras consultadas o propuestas. Esto no exime al usuario de la responsabilidad de corroborar y confirmar la veracidad de dichas referencias.

Ventajas

  • Capacidad para generar respuestas a consultas complejas.
  • Genera respuestas adaptadas al contexto y la intención del usuario.
  • Realización de tareas como generación de texto, revisión de literatura y análisis de datos a partir de la consulta.
  • Interacciones en lenguaje natural.
  • Reducción de la sobrecarga de información.
  • Las respuestas generadas pueden incluir referencias específicas a las fuentes originales.

Desventajas

  • Posibilidad de generar información incorrecta (alucinación), incompleta o no pertinente.
  • Riesgo de desinformación.
  • A veces se usan solo resúmenes en lugar del texto completo para dar respuestas.
  • Desajustes entre las citas y el contenido real de la fuente.

Las herramientas de búsqueda de información en línea se pueden clasificar en dos categorías principales: búsqueda de información general y búsqueda de información académica.

Herramientas de búsqueda de información general

  1. Gemini
    • Desarrollador: Google.
    • Descripción: Gemini, anteriormente conocido como Bard, es el modelo de lenguaje natural más avanzado de Google. Es un modelo multimodal que procesa texto, imágenes y audio, lo que le permite ofrecer respuestas más ricas y detalladas que otros modelos previos como BERT, LaMDA y PaLM.
    • Corpus: Utiliza la vasta base de datos de Google, incluyendo páginas web, imágenes y otros contenidos multimedia indexados por el buscador.
    • Beneficios: Respuestas más naturales y precisas gracias a su capacidad multimodal para procesar y combinar distintos tipos de datos como texto e imágenes.
    • Disponibilidad: Accesible tanto a través de la web como en una aplicación para Android.
    • URL: https://gemini.google.com/

    Gemini

  2. Google SGE (Search Generative Experience)
    • Desarrollador: Google.
    • Descripción: Google SGE es una versión más pequeña y especializada en comparación con Gemini. Está integrada en el buscador de Google y se centra en ofrecer información precisa y recursos útiles, más allá de solo responder preguntas.
    • Corpus: Se basa en el índice de búsqueda de Google, que abarca una amplia gama de fuentes web indexadas, incluidos sitios web académicos, comerciales y públicos.
    • Beneficios: Está diseñada para usuarios que buscan información clara y directa, priorizando la precisión sobre una interacción conversacional prolongada.
    • Disponibilidad: Disponible al activar la función en Search Labs de Google, es compatible con Google Chrome en versiones de escritorio y móviles para IOS y Android.   

    Google SGE (Search Generative Experience)

  3. Copilot
      • Desarrollador: Microsoft.
      • Descripción: Copilot, anteriormente conocido como Bing chat, es una herramienta generativa que utiliza GPT-4, entrenado con la base de datos del buscador Bing para ofrecer respuestas avanzadas y detalladas en tiempo real.
      • Corpus: Utiliza el índice de búsqueda de Bing que incluye un vasto conjunto de páginas web, imágenes y otras fuentes en línea.
      • Beneficios: Es una herramienta versátil y completa que ofrece una solución integral para diversas necesidades de búsqueda y generación de contenido.
      • Disponibilidad: Integrado en el buscador Bing, Microsoft Edge, Office 365, y Windows 10 y 11. Está disponible tanto en la web como en aplicaciones móviles para IOS y Android.
      • URL: https://copilot.microsoft.com/

    Copilot

  4. Perplexity
      • Desarrollador: Perplexity AI.
      • Descripción: Perplexity es una herramienta híbrida que permite tanto la búsqueda general en la web como la búsqueda académica, combinando modelos como GPT-4o y su propio modelo con diversas versiones de Claude y LLama.
      • Corpus: Combinación del índice de búsqueda de Perplexity y modelos de lenguaje que acceden a fuentes diversas, incluidos documentos académicos, videos de YouTube y plataformas sociales como Reddit.
      • Beneficios: Versatilidad para abordar tanto la búsqueda general como la académica, y capacidad para analizar y comparar contenidos en múltiples formatos.
      • Disponibilidad: Accesible por medio de la web y con aplicaciones para IOS y Android.
      • URL: https://www.perplexity.ai/

    Perplexity

Herramientas de búsqueda de Información académica

Las herramientas de búsqueda de información académica recuperan información en bases de datos académicas. Son útiles para investigaciones y a menudo requieren suscripción.

  1. Elicit
    • Desarrollador: Ought.
    • Descripción: Elicit es una herramienta especializada en la revisión de literatura académica. Su principal fortaleza es la capacidad de organizar y analizar textos completos o resúmenes de artículos y preprints (versión preliminar de un artículo académico o científico que se publica antes de ser revisado por pares).
    • Corpus: Semantic Scholar, bioRxiv y arXiv.
    • Beneficios: Facilita el análisis comparativo y exhaustivo de literatura académica, ideal para investigadores que necesitan organizar grandes volúmenes de información.
    • Disponibilidad: Herramienta accesible en línea y en aplicación de escritorio.
    • URL: https://elicit.com/

    Elicit

  2. Scispace
    • Desarrollador: Typeset.
    • Descripción: Scispace es una herramienta que, además de la revisión de literatura, permite interactuar directamente con los textos para obtener información específica y extraer datos clave.
    • Corpus: Se basa en un corpus propio que incluye artículos de investigación de acceso abierto y otras fuentes académicas.
    • Beneficios: Herramienta poderosa para la revisión de literatura con capacidades adicionales para enriquecer la investigación.
    • Disponibilidad: Extensión para Google Chrome y aplicación en línea.
    • URL: https://typeset.io/

    Scispace

  3. Consensus
    • Desarrollador: Consensus AI.
    • Descripción: Consensus se distingue por su capacidad para responder preguntas de investigación con respuestas directas, tipo sí/no y generar textos organizados y concisos.
    • Corpus: Semantic Scholar
    • Beneficios: Ideal para investigadores que necesitan respuestas rápidas y organizadas a preguntas de investigación.
    • Disponibilidad: Accesible a través de la web.
    • URL: https://consensus.app/search/

    Consensus

  4. Scopus AI
    • Desarrollador: Elsevier.
    • Descripción: Scopus AI está integrada en la base de datos Scopus, diseñada para proporcionar respuestas precisas a preguntas de investigación dentro de su colección de acceso restringido, ya que está compuesta por contenido de pago.
    • Corpus: Utiliza el corpus exclusivo de la base de datos Scopus, que incluye resúmenes y referencias de artículos científicos de diversas disciplinas.
    • Beneficios: Facilita la identificación de tendencias y expertos clave, proporcionando respuestas detalladas y contextualizadas.
    • Disponibilidad: Integrada en Scopus.

    Scopus AI

  5. Scite Assistant
    • Desarrollador: Scite Inc.
    • Descripción: Scite Assistant es una herramienta avanzada del índice de citas Scite que incorpora un chatbot configurable, permitiendo a los usuarios personalizar las fuentes y el formato de las respuestas.
    • Corpus: Basado en el índice de citas Scite, que incluye artículos y citas de fuentes académicas como Wiley, Pubmed, Unpaywall y repositorios de preprints.
    • Beneficios: Ofrece una solución integral y flexible para la investigación académica, con acceso a una amplia gama de recursos y la posibilidad de personalizar las consultas y los resultados.
    • Disponibilidad: Accesible a través de la web.
    • URL: https://scite.ai/assistant

    Scite Assistant

Consideraciones finales

La integración de la Inteligencia Artificial Generativa en la búsqueda de información es un avance prometedor, pero es crucial ser consciente de sus limitaciones. Los usuarios deben estar informados sobre el potencial de "alucinaciones" y usar estas herramientas con un enfoque crítico.

VIDEO DE INTERÉS: Asistentes de investigación con Inteligencia Artificial Generativa

 

Volver