Téléchargement | - Voir le manuscrit accepté : From HTML documents to web tables and rules (PDF, 890 Kio)
|
---|
Auteur | Rechercher : Simon, K.; Rechercher : Lausen, G.; Rechercher : Boley, Harold1 |
---|
Affiliation | - Conseil national de recherches du Canada. Technologies de sécurité et de rupture
|
---|
Format | Texte, Article |
---|
Conférence | The Eighth International Conference on Electronic Commerce (ICEC 2006), August 14-16, 2006, Fredericton, New Brunswick, Canada |
---|
Sujet | extraction de données; alignement des enregistrements de données; langages à base de règles |
---|
Résumé | Nous présentons un système d'extraction du Web sémantique, qui joute des fonctionnalités au navigateur et établit des correspondances entre des documents HTML et des tables et, si possible, des règles. Premièrement, l'extracteur des données de base ViPER distille une information semi-structurée et la réorganise en une structure tabulaire de données, que l'on peut également explorer et/ou soumettre à un traitement machine additionnel. Deuxièmement, pour illustrer ce traitement, l'extracteur étendu de connaissances Rex ViPER explore les tables obtenues pour y relever les propriétés structurelles et les dépendances fonctionnelles. Des règles sont générées pour produire une représentation plus compacte et gérable, et souvent enrichie, des connaissances. L'information entièrement structurée ainsi que les faits et les règles sérialisés par RuleML que l'on obtient peuvent être stockés avec les documents originaux, faire l'objet de requêtes émises par des moteurs de règles, tels que OO jDREW et FLORID et être échangés entre des services Web. Ainsi, Rex ViPER contribue à l'automatisation de la construction d'un Web sémantique exploitable par machine. |
---|
Date de publication | 2006 |
---|
Maison d’édition | National Research Council of Canada. Institute for Information Technology |
---|
Déclaration de droit d’auteur | - © 2006 Conseil national de recherches du Canada
|
---|
Publication connexe | |
---|
Langue | anglais |
---|
Publications évaluées par des pairs | Oui |
---|
Numéro du CNRC | NRCC 49310 |
---|
Numéro NPARC | 5764332 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | 4b3ab6b5-8cb0-4ed8-838b-7ed43067e340 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2024-02-29 |
---|