Passionné(e) de lecture ? Inscrivez-vous gratuitement ou connectez-vous pour rejoindre la communauté et bénéficier de toutes les fonctionnalités du site !  

Indexation et interrogation de pages web decomposees en blocs visuels - blockweb : un modele d'index

Couverture du livre « Indexation et interrogation de pages web decomposees en blocs visuels - blockweb : un modele d'index » de Faessel Nicolas aux éditions Presses Academiques Francophones
Résumé:

Cet ouvrage porte sur l'indexation et l'interrogation de pages Web. Nous présentons le modèle BlockWeb, qui s'appuie sur une décomposition de pages Web en une hiérarchie de blocs visuels et prend en compte l'importance visuelle de chaque bloc et la perméabilité des blocs au contenu de leurs... Voir plus

Cet ouvrage porte sur l'indexation et l'interrogation de pages Web. Nous présentons le modèle BlockWeb, qui s'appuie sur une décomposition de pages Web en une hiérarchie de blocs visuels et prend en compte l'importance visuelle de chaque bloc et la perméabilité des blocs au contenu de leurs blocs voisins dans la page. Cette décomposition permet notamment d'effectuer une interrogation à une granularité plus fine que la page : les blocs les plus similaires à une requête sont être renvoyés à la place de la page complète. Une page est représentée sous forme d'un graphe acyclique orienté dont chaque noeud est associé à un bloc et étiqueté par son importance et chaque arc est étiqueté par la perméabilité du bloc cible au bloc source. Afin de construire ce graphe à partir de la représentation en arbre de blocs d'une page, nous proposons un nouveau langage : XIML (XML Indexing Management Language), qui est un langage de règles. Ce modèle a été expérimenté sur deux applications distinctes : la recherche du meilleur point d'entrée sur un corpus d'articles de journaux électroniques et l'indexation et la recherche d'images sur un corpus de la campagne d'ImagEval 2006.

Donner votre avis