KIT | KIT-Bibliothek | Impressum | Datenschutz

Large-Scale Pattern-Based Information Extraction from the World Wide Web

Blohm, Sebastian

Abstract:
Extracting information from text is the task of obtaining structured, machine-processable facts from information that is mentioned in an unstructured manner. It thus allows systems to automatically aggregate information for further analysis, efficient retrieval, automatic validation, or appropriate visualization.
This thesis explores the potential of using textual patterns for Information Extraction from the World Wide Web.

Open Access Logo


Volltext §
DOI: 10.5445/IR/1000015423
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB)
Publikationstyp Hochschulschrift
Publikationsjahr 2010
Sprache Englisch
Identifikator urn:nbn:de:swb:90-154237
KITopen-ID: 1000015423
Verlag KIT, Karlsruhe
Art der Arbeit Dissertation
Fakultät Fakultät für Wirtschaftswissenschaften (WIWI)
Institut Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB)
Prüfungsdaten 22.01.2010
Referent/Betreuer Prof. R. Studer
Schlagwörter Information Extraction, World Wide Web, Text Mining, Information Retrieval, Semantic Web, Machine Learning, Data Mining
Relationen in KITopen
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page