Home Numeros Anteriores Articulos de portada Glosario Seminarios Publicidad Suscripciones Quienes Somos
 
Mayo 2008
Febrero 2008
 

A la búsqueda de tesoros de información

La aguja en el pajar ya es más fácil de encontrar gracias al software de búsqueda y descubrimiento, que permite hallar valiosos datos escondidos en el mundo de la información no estructurada dentro de las organizaciones.

Por Guillermo Aguilera

Tanto o más importante que tener la información, es encontrarla a tiempo, cuando se necesita. Y para ello, entre las tecnologías de acceso a la información, destaca el software de búsqueda empresarial, así como otros usados para clasificación de contenido, análisis de contenido y categorización, que facilitan a las personas encontrar y usar información que está enterrada dentro del contenido que poseen las organizaciones.

Entre los principales fabricantes de este tipo de software están IBM, Collexis, NetApp, Xerox, X1 Technologies, además de Yahoo! y Google. Ken Bisconti, Vicepresidente de estrategia de IBM Enterprise Content Management Software, ha afirmado que "el portafolio de búsqueda y contenido de IBM está ayudando a los clientes empresariales a hacer más que reunir simples resultados de búsqueda. Nuestra tecnología les permite usar información para resolver problemas complejos de negocios al combinar análisis avanzado, clasificación de contenido y capacidades de búsqueda con software, hardware y servicios".

Y eso es lo que hace el software de búsqueda y descubrimiento: clasificación de información, extracción y análisis de búsqueda empresarial, acceder, encontrar y aprovechar mejor la información almacenada dentro de las organizaciones y a través de la Web.

Juan Daniel Canchola, Gerente de Information Management en IBM México, comenta que la popularidad y el éxito de varios motores de búsqueda que, valga la redundancia, “buscan” sobre sitios Web en Internet, han estado generalmente ligados a la calidad de los resultados de la búsqueda.

Información de calidad

Los motores de búsqueda que existen en el mercado, dice Canchola, han usado varios algoritmos para ranquear los resultados de búsqueda para presentar al usuario lo más apropiado de acuerdo a los criterios ingresados. “Además de los algoritmos propietarios usados por los motores, la calidad de los metadatos recuperados de un sitio Web juega un rol significativo en la calidad de la búsqueda”, afirma.

Las empresas pueden beneficiarse significativamente proporcionando a sus empleados capacidades de búsqueda contra el vasto mundo de datos almacenados dentro de la empresa en varias fuentes de información. Las búsquedas empresariales de alta calidad pueden incrementar la productividad y ayudar en la difusión de la información. Sin embargo, buscar dentro de una Intranet plantea retos que son significativamente más complejos que aquellos encarados por los motores de búsqueda para Internet. De igual manera, entre los mayores retos a cubrir están el reforzar la seguridad nativa de varias fuentes de información cuando se recupera el contenido, recolectar metadatos útiles y un efectivo algoritmo de ranqueo para mejorar la calidad de las búsquedas.

Estas soluciones están diseñadas para ayudar a las empresas e individuos a encontrar, analizar y maximizar el valor de su información, sin importar donde se encuentre almacenada ni el formato de la misma. Combinan los adelantos de entrega de información contextual, búsquedas empresariales y análisis de texto, con el objetivo de reducir la brecha entre la necesidad de información y la capacidad de tomar mejores y más rápidas decisiones, ayudando a las empresas a romper los silos de información, mejorar la productividad, incrementar sus ventas y obtener niveles sin precedente del conocimiento de su negocio a través de búsqueda semántica segura y avanzada, de minería de contenido rico y mediante la visualización de contenido abundante.

La oferta del gigante azul, IBM, en cuanto a software de búsqueda empresarial y descubrimiento de contenido, se apoya en la iniciativa global de la compañía, Información bajo Demanda, que ayuda a los clientes de todos tamaños a sobrepasar barreras al usar a la información como un recurso estratégico. Sus ofertas van desde una versión empresarial, OmniFind, hasta un producto gratuito, OmniFind Yahoo! Edition, un producto de búsqueda empresarial gratuito.

Canchola pone como ejemplo la suite de IBM, software que proporciona a los usuarios una experiencia de búsquedas única y segura a través de la empresa, habilitándolos para descubrir y tener contacto con la información almacenada en múltiples programas, repositorios y formatos. Este software también ayuda a las organizaciones “a correlacionar montos masivos de información de Internet con la información de la empresa, incluyendo texto, audio, video e información dinámica, para crear una vista en tiempo real de escenarios de negocio” añade.

El software de IBM está basado en el estándar de Arquitectura de Gestión de Información sin Estructura (UIMA - Unstructured Information Management Architecture) para proporcionar una arquitectura abierta para conectar aplicaciones para extracción de entidad y análisis de texto. UIMA permite la integración de componentes de análisis de texto sobre documentos, extraer conocimiento e identificar conceptos de alto nivel, tales como personas, lugares, organizaciones, productos, problemas y otras “entidades” que están ubicadas dentro de datos no-estructurados. Este conocimiento puede ser empleado para crear una indexación mejorada para las búsquedas o enrutada a un tradicional datamart o datawarehouse para su uso en inteligencia de negocios o aplicativos de análisis.

Finalmente, explica Canchola, IBM Omnifind Enterprise Edition es un estándar del paradigma de arquitectura orientada a servicios (SOA). La búsqueda de información diseminada a través de múltiples fuentes en toda la empresa, mejorando su valor por el enriquecimiento de metadatos a través del análisis de texto, es puesta a disposición de las personas como un servicio para que los procesos y aplicaciones puedan tomar ventaja de él.

Otro fabricante de software de búsqueda es X1 Technologies, que ofrece su X1 Enterprise Search Suite, una suite de productos diseñados para integrarse de manera invisible a los sistemas críticos de negocios proporcionando acceso unificado y seguro al contenido diseminado en toda la empresa.

En el campo de la ciencia y la investigación, los motores de búsqueda y descubrimiento pueden aportar velocidad a las investigaciones. Empresas como Thomson Scientific, proveedor de soluciones de información para las comunidades de investigación y negocios, se afanan por encontrar mejores maneras de encontrar información. Recientemente esta organización anunció una alianza estratégica con la empresa Collexis, un desarrollador de software de búsqueda y descubrimiento de conocimiento de alta definición, para el desarrollo de una solución de extracción de datos personalizados para los usuarios. El resultado, Thomson Collexis Dashboard, ofrece a los científicos e investigadores análisis profundo, tendencias y visualización de la información publicada.

Al unir el Knowledge Dashboard de Collexis con la Web of Science de Thomson Scientific para crear una solución de extracción de datos personalizados para la comunidad investigadora, la nueva solución ofrecerá un perfeccionado descubrimiento de conocimiento para las comunidades de investigación y desarrollo académicas y gubernamentales. Los usuarios podrán identificar y buscar documentos, expertos y tendencias, y hacer nuevos descubrimientos con mayor rapidez, precisión y profundidad que si lo hicieran a través de los motores de búsqueda convencionales.

Por ejemplo, Thomson Collexis Dashboard permite a los científicos analizar grandes cantidades de publicaciones con respecto a un tema definido de manera rápida y eficaz, y para filtrar la información esencial. Además, permite que los investigadores exploren los conceptos de conocimiento existentes y proporcionen sugerencias proactivas acerca de la dirección de la investigación de un tema o por categoría. También incluye múltiples tesauros que permiten diferentes puntos de vista de la misma navegación por datos y tema.

Voluntariamente a fuerza

Otro fabricante, NetApp, toma en cuenta el aspecto del espacio y los costos de almacenar cada vez más información. NetApp plantea que las empresas tienen que sujetarse a cada vez más normas reguladoras y enfrentar los riesgos de que éstas no se respeten. El cumplimiento de tales obligaciones se ha convertido en una de las principales prioridades de las organizaciones.

El problema realmente es mucho más amplio. Los departamentos dedicados al cumplimiento de normativas en varias instituciones han empezado a centrarse en la necesidad de conservar tipos de datos adicionales (datos no estructurados) como hojas de cálculo, presentaciones, archivos creados mediante aplicaciones internas y otros datos que normalmente se encuentran almacenados en un sistema de archivos.

Archivar gran cantidad de datos no estructurados cumpliendo con las normativas puede resultar muy costoso. Por ejemplo, una empresa normal con 12 TB de datos no estructurados puede almacenar 20 mil cartuchos de cinta, con un costo superior a los dos millones de dólares americanos en soportes, unidades de cinta y librerías para seguir la normativa.

NetApp ofrece una solución al problema con LockVault, que permite realizar copias no modificables de todos los servidores de archivos regularmente, así como copias duplicadas de todos los datos que cumplen con la normativa, tan a menudo como desee, y elimina la necesidad de depender de métodos manuales o basados en políticas para identificar y aislar registros sujetos a normas de cumplimiento de normativas. Es posible buscar, indexar o recuperar de forma instantánea cualquier backup.

Xerox también está en la arena de este tipo de software con su FactSpotter, que promete ir más allá de las búsquedas por palabra clave de los actuales programas de reconocimiento de datos, analizando el significado de los términos y su contexto, y aceptando la inclusión de lenguaje coloquial.

El motor de rastreo inteligente de Xerox puede buscar en casi todos los tipos de documentos, independientemente de su idioma, localización, o formato, y facilita la obtención de información de bases de datos masivas, y permite seleccionar los resultados destacando solamente algunas respuestas relevantes en lugar de devolver miles de resultados no relacionados.

Según la compañía, el producto podría revolucionar las operaciones de negocios con un uso intensivo de datos como el descubrimiento electrónico de pruebas, la gestión de riesgos, la investigación farmacéutica, la inteligencia de seguridad, y la identificación de casos de fraude.

 

 
 
 

 
Home |  Números Anteriores |  Artículo de Portada |  Glosario |  Seminarios |  Publicidad |  Suscripciones |  Quiénes Somos