jueves, 20 de mayo de 2010

INDEXACION

El proceso de recuperación de información consiste esencialmente en extraer de unacolección de documentos aquellos que se ajustan a las especificaciones de un peticióndeterminada. Se trata pues de una comparación sistemática entre los documentos o susrepresentaciones y la petición o demanda de información. Podemos descomponer el procesoen tres fases:* Traducción del documento en un lenguaje de indexación. La expresión queresulta de este proceso se llama modelo de búsqueda del documento. Se tratade representar el documento por una serie de descriptores que lo determinen lomás directamente posible para su posterior indexacion búsqueda.* Expresión de la petición de información en el mismo lenguaje del modelo debúsqueda. Se obtiene el denominado perfil de búsqueda.* Comparación sistemática de los modelos de búsqueda de los documentos con elperfil de búsqueda, a fin de seleccionar los que se ajusten a este.La operación resultaría relativamente sencilla si los lenguajes de indexación y debúsqueda coincidieran exactamente. Ello, sin embargo, no es así en la mayoría de los casos,ya que los productores de bases de datos y repertorios bibliográficos suelen indexar enlenguaje libre o semilibre, lo que resulta mucho más fácil y económico para sus fines. Por tanto,al seleccionar los descriptores para la búsqueda, habrá que tener en cuenta todas lasposibles formas de expresión de un concepto en la indexación de los documentos (sinónimos,conceptos más generales y más específicos, etc.) ya que de otro modo podrían perdersecantidades importantes de información. Por otra parte, si la selección es demasiado amplia, seobtendrán documentos carentes de interés. De ahí la importancia de preparar adecuadamenteel perfil de búsqueda, operación que resulta así la mas importante en el proceso de indexacion recuperación de información.

miércoles, 19 de mayo de 2010

Posicionamiento Web

Existen multiples herramientas que nos permiten la una mejor indexación de nuestras paginas Web.Existen unos comandos especiales que nos permiten tener información de como se está indexando la información que se pueden digitar antes de la direccion de URL: site: Páginas indexadas de su sitio link: Páginas que enlazan a la página de presentación de su sitio web cache: Caché actual de su sitio info: Información de que disponemos sobre su sitio related: Páginas similares a su sitio tambien se pueden usar sitemas. Un sitema es un mapa de nuestro sitio con un formato determinado (xml) que permite a google indexar mejor la información.

PROCESO DE INDEXACION

El término proceso de indexación hace referencia al proceso de análisis de documentos para la obtención de una representación concreta de los mismos.

martes, 18 de mayo de 2010

Google Desktop

Google Desktop es una herramienta gratuita incluida en el Google Pack que sirve para hacer búsquedas en tu ordenador. Puedes buscar archivos, música, fotos, texto en correos electrónicos, páginas web visitadas, etc, lo que te permite acceder fácilmente a toda la información de tu ordenador. Esto te ahorra el trabajo de tener que organizar manualmente tus archivos, mensajes, etc. Google Desktop también te permite buscar documentos que hayas borrado accidentalmente.Cuando haces una búsqueda, Google Desktop muestra los resultados de búsqueda más relevantes en una página, cada uno de ellos con el nombre del archivo y una breve muestra del contenido con los términos de búsqueda resaltados. Google Desktop busca en el texto completo de los siguientes tipos de archivoGmail Outlook Express Word Excel Power Point Internet Explorer AOL Instant Messenger MSN Messenger Google Talk Netscape Mail / Thunderbird Netscape / Firefox / Mozilla PDF Música Vídeo Imágenes Archivos Zip

Tipos de indexación

Tipos de indexaciónPor palabras: se indexa cada palabra del documento con excepción de palabras vacías como los artículos “la, el, los etc” o si, no, e, a, etc.De string: cuando se indexan palabras o frases completas.

indixación automatizada

La indización automatizada, identifica en los documentos las palabras claves que abrevien todo o la mayor parte del contenido de un texto, lo que hace es extraer los términos de indización de forma automática con la ayuda de las máquinas con las que se pueden realizar búsquedas por medio de listas, términos de conjunto abierto o a través de una indización controlada, como tesauros u ontologías. Para lograr la indización automática lo se debe indizar las partes principales del documento como el título, los subtítulos, el resumen, autor etc. o indizan el texto completo, pero el mayor porcentaje de la recuperación de información la arrojan los términos indexados en el título, y muy poco en el texto completo.

DEFINICION DE INFORMACION

INFORMACION: Conjunto de datos numericos, alfabeticos y alfanumericos ordenados, al estar organizados y que tienen un significado especifioc y disminuyen la incertidumbre sobre un tema e incrementan el conocimiento de del tema trato.

HIPERTEXTO

EL ENLACE QUE MOSTRAREMOS A CONTINUACION NOS PARECIO DE ALTA RELEVANCIA, NO SOLO PARA EL TEMA DE RECUPERACION DE INFORMACION SINO POR LA INFORMACION QUE ENCONTRAREMOS RELACIONADA PARA LOS QUE ESTUDIAMOS SISTEMAS DE INFORMACION Y DOCUMENTACION, ENCONTRAREMOS INDIZACION Y CLASIFICACION DE HIPERTEXTOS, NORMALIZACION, GLOSARIOS, WEB 2.0, LENGUAJES, TAXONOMIAS, TESAUROS, MARC, ENTRE OTROS TEMAS ESTE ES EL LINK: http://www.hipertexto.info/documentos/indice_tematic.htm

noticias recuperacion de informacion Recuperación de Información: recuperación de información

recuperacion-de-informacion.html#links">noticias recuperacion de informacion Recuperación de Información: recuperación de información

recuperación de información, sistemas de recuperación de información, busqueda y recuperación de información, lenguajes de recuperación de información, metadatos, posicionamiento web, indexaxción y búsqueda
http://recuperainformacion.blogspot.com/2009/05/demanda-documental_26.html