lunes, 30 de abril de 2007

Axentes de monitorización

O axente Do-I-Care é un claro exemplo de axente de monitorización, que emprega técnicas de “machine learning” para detectar cambios “interesantes” naquelas páxinas Web que foron clasificadas polo ususario, previamente, como relevantes. Debido a que este axente se centra en cambios de páxinas coñecidas, en lugar de descubrir novas páxinas, increméntase a probabilidade de que a información encontrada vaia ser interesante.
A precisión do axente tanto para encontrar cambios relevantes, como no seu proceso de aprendizaxe, mellora aproveitándose de que as páxinas usualmente son modificadas seguindo uns patróns regulares. Ademais, estos axentes poden colaborar entre si encadeándose e propagandolle información significativa ós axentes doutros usuarios.
Para levar a cabo a súa actividade, o axente Do-I-Care debe realizar as seguintes actividades:
  • Visitar periódicamente unha lista de páxinas definida polo usuario.
  • Identificar calquera cambio dende a última vez que a visitou.
  • Decidir se os cambios eran interesantes
  • Notificar ó usuario se o cambio era interesante.
  • Aceptar a rexeneración de importancia no interestingness do cambio e da puntualidade da notificación.
  • Facilitar, compartir a colaboración da información entre os individuos e os grupos.

Como poden ser interesantes diversas páxinas, por diversas razóns, os usuarios poden manter os axentes múltiples do Do-I-Care especializados en asuntos ou clases particulares de páxinas Web.
Unha vez que un axente detecte un cambio interesante, notifícallo ó usuario cun E-mail, e o cambio engádese á Web asociada ó axente. Esta páxina Web tamén se utiliza para a rexeneración e a actividade de colaboración.

Axentes de filtrado

Un axente de filtrado filtra información mediante o borrado de datos non desexados. Lieberman (1995) describe un axente de filtrado,o Letizia. Os usuarios da web senten unha necesidade apremiante dalgún tipo de asistencia intelixente, xa que unha interface manual de manipulación directa dos nexos non é suficiente, nun browser, para previr o sentimento de quedar afogado en información inconexa. Letizia é un axente autónomo de interface que permite unha acción cooperativa continua entre o usuario e un axente de busca no espacio Web. Letizia rexistra a URL elixida e le as páxinas para formar un perfil de intereses do usuario. Un simple cálculo de frecuencia de palabras-claves úsase para analizar páxinas, como medida de recuperación de información. Leticia está sempre activo, buscando o espacio Web que é cercano á posición actual do usuario, en paralelo coas actividades do usuario. Usa a propia interface de Netscape para presentar os seus resultados, nunha ventá independente na que o axente sinala páxinas que probablemente lle interesen ó usuario.

A interface usual de Letizia consta en tres ventás de Netscape. O usuario pode escoller continuar a súa navegación nas páxinas seleccionadas por el ou ben acoller, en calquera momento, as suxerencias de Letizia. Letizia recoñece cal é a ventá actualmente utilizada polo cliente, e ocupa tan só as ventás que el non utiliza. Aceptar unha suxerencia desde Letizia consiste simplemente en conectarse á ventá que contén unha páxina recomendada por Letizia, e continuar navegando. O usuario pode, por suposto, colocar páxinas recomendadas nunha hotlist ou doutra maneira, como o fai de costume en Netscape. Letizia non está limitada a esta configuración de tres ventás. Na práctica, unha maneira menos molesta de utilizar Letizia é simplemente con dúas ventás, unha ventá de usuario e unha para Letizia.


En axentes autónomos como Letizia a revisión da Web tanto navegando como buscando información é reemplazada por unha revisión da Web navegando como unha actividade en tempo real. A meta non é de ningún modo obter unha "mellor resposta", senón facer o mellor uso posible do recurso máis limitado e valioso: a atención do usuario.
Tendo un axente en funcionamento continuo significa que o axente pode ser máis audaz nas súas recomendacións ó usuario. Non necesita sacar unha conclusión perfecta con respecto a que documento responde mellor ó interese do usuario, xa que é probable que consiga algo mellor nalgún momento do futuro, si o usuario continua a navegar en áreas conexas. Por contraste, un motor tradicional de busca debe traballar moi duro para lograr o resultado máis preciso posible e cumprir o pedido do usuario, porque unha vez que xerou unha resposta, nunca consegue outra oportunidade.

Outro exemplo de axentes de filtrado é o Tapestry. É un sistema de filtrado de documentos de correo electrónico, feito para soportar filtracion colaborativa. Filtra mensaxes basándose en anotacións ou en quen as respondeu. A arquitectura do trapestry inclúe un indexador de documentos, un depósito de documentos e un depósito de filtros(definidos polo usuario). A pesar de non ser creado para grupos de noticias, permite a filtración de toda información de entrada.

http://www2.ing.puc.cl/~dcolle/publicaciones/agentes/agentes2.htm

lunes, 23 de abril de 2007

Copernic e CiteSeer

Dous exemplos típicos de axentes de búsqueda non cooperativos son Copernic e Citeseer.

Copernic é un axente de busca que transfire unha ecuación a un conxunto de buscadores de maneira simultánea, recupera as referencias pertinentes e ordeaas según o grao medio de relevancia obtido de cada un dos buscadores. Púxose ó alcance do público en 1998 e dende entón lanzáronse versións con elementos novos, aínda que a maioría somente están disponibeis nas edicións comerciais.
Copernic Basic, a edición libre, permite consultar simultaneamente cerca de 80 buscadores importantes agrupados en sete categorías: “O web” máis unha categoría opcional relacionada cun idioma ou un país, “Grupos de noticias”, “Direccións de correo electrónico”, “Compra de libros”, “Compra de hardware” e “Compra de software”. A pesar de ser a edición reducida dun programa comercial, ofrece tantas ou máis posibilidades que as versións completas doutros buscadores múltiples como Lexibot, NetAttaché Pro o Internet EZ Search.
Copernic Plus, a edición comercial máis económica, permite acceder a máis de 1.000 fontes de información agrupadas en 90 categorías de busca especializada, algunhas das cales son bastante irrelevantes; algúns exemplos: “Enciclopedias”, “Saúde”, “Multimedia”, “Ciencias”, “Negocios e finanzas”, “Descarga de software”, “Cine”, “Artículos sobre as tecnoloxías”, “Música”, etc.
Copernic Pro, a edición comercial más completa, ofrece, ademais, outras prestacións interesantes: actualización de buscas programadas, servicio de alerta e verificador ortográfico das buscas.

CiteSeer é un buscador orientado á localización e recuperación de artículos científicos provintes de diversas fontes, como poden ser revistas técnicas ou as actas de congresos. Parsealle as referencias a un artículo, identifica as que se dirixen a un mesmo documento, aínda que estén escritas de forma diferente e identifica o contexto da cita dentro do artigo. Preténdese dar unha visión global sobre o tema buscado. CiteSeer localiza os artículos por palabras clave ou por referencias a estes e outros artigos que traten temas similares.

miércoles, 11 de abril de 2007

Axentes de consulta

Trátase dun tipo de axente de busca. É un sistema de axentes orientados á consulta que orixina un ou máis axentes en reposta á pregunta formulada polo usuario. Estes axentes traballan en representación do individuo mentres dure a consulta, recollendo información de tódalas bases de datos dispoñibles. Cando unha persoa realiza unha pregunta, esta vaise descompoñer en subconsultas para a súa resolución. Se os axentes existentes son incapaces de dar unha resposta en toda a súa amplitude, xéranse novos axentes que buscarán noutras bases de datos. Se aínda así a resposta non é bastante amplia, crearanse novos axentes ata poder ofrecer a resposta adecuada.

A calidade da resposta a unha determinada consulta, básase en dous parámetros :


  • precisión: mide a relación que hai entre os documentos relevantes para a consulta e o total de documentos que devolve a mesma.


  • recall: mide a relación entre o total de documentos e o total de documentos relevantes devoltos.

Estos parámetros son inversamente proporcionais, polo tanto, débese intentar conseguir un equilibrio entre os dous, fin que é bastante complicado de conseguir cos motores de busca actuais.

As vantaxes que deberían proporcionar este tipo de axentes son as seguintes:

  • Facilidade de uso

  • Aumento da precisión da busca

  • Reducción da sobrecarga que xeran os procesos de busca na Web.
Mata Hari: non é só un axente de consulta, e tamén un axente intelixente de búsqueda no WWW e un axente local á vez. Funcionará dunha forma ou outra dependendo da utilidade que cada usuario lle dexese asignar.

http://www.elprofesionaldelainformacion.com/contenidos/1999/abril/agentes_inteligentes_definicion_y_tipologia_los_agentes_de_informacion.html
http://www.thewebtools.com