29 juin 2009

KB Crawl 4 : Moteur nouvelle génération

kb-crawl-4

KB Crawl 4 est la nouvelle génération de moteur de veille Internet. Pour assurer  l’exhaustivité de ses résultats, il procède en 5 étapes distinctes.

 

La première étape c’est la Collecte. Selon ce moteur elle consiste à surveiller la totalité du Web. Il scrute forums de discussions, newsletters, newsgroups, blogs, flux RSS et Intranets. Il parcourt plus de 100 000 pages au minimum par jour quel que soit leur langue. Il y rassemble ensuite tous les documents Word, Excel, Java-Scripts, HTPL, XML, PPT ou autres.
La deuxième étape c’est le Filtrage. Il consiste à filtrer les URL puis à émettre une alerte en cas de mise à jour apportées et constatées sur la page : évolution de la page, revirement du contenu…
La troisième étape, le Traitement consiste à concevoir un calendrier pour une surveillance de la semaine à la minute et un répertoire de classement pour les sources et les mots-clés.
La quatrième étape est la Capitalisation. Il s’agit de créer un répertoire où les pages différentes seront archivées où un nouveau moteur de recherche est incorporé d’où la possibilité de partager une base de perception.
La cinquième étape et la dernière c’est la Diffusion. Il s’agit de la diffusion des rapports de veille par e-mail. Elle dépend des motifs d’alertes mais aussi des destinataires.

No related posts.

Mots-clefs :, , , , , , , , , , , , , , , , ,

Laisser un commentaire

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>