KIT | KIT-Bibliothek | Impressum | Datenschutz

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Witte, René; Mülle, Jutta

Abstract:


Das noch recht junge Forschungsgebiet "Text Mining" umfaßt eine
Verbindung von Verfahren der Sprachverarbeitung mit Datenbank-
und Informationssystemtechnologien. Es entstand aus der
Beobachtung, dass ca. 85% aller Datenbankinhalte nur in
unstrukturierter Form vorliegen, so dass sich die Techniken des
klassischen Data Mining zur Wissensgewinnung nicht anwenden
lassen. Beispiele für solche Daten sind Volltextdatenbanken mit
Büchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln
oder wissenschaftlichen Publikationen, aber auch Ströme
kontinuierlich auflaufender Emails oder Meldungen von
Nachrichtenagenturen (Newswires).

Im Gegensatz zum Information Retrieval geht es beim Text Mining
nicht darum, lediglich Dokumente anhand von Anfragen
aufzufinden, sondern aus einem einzelnen oder einem Satz von
Dokumenten neues Wissen zu gewinnen, etwa durch automatische
Textzusammenfassungen, die Erkennung und Verfolgung benannter
Objekte oder die Aufdeckung neuer Trends in Forschung und
Industrie. Durch die ständig wachsende Zahl elektronisch
verfügbarer Texte werden automatisch arbeitende Verfahren zur
Bewältigung der Informationsflut immer dringender, was Text
... mehr


Volltext §
DOI: 10.5445/IR/1000005161
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp Forschungsbericht/Preprint
Publikationsjahr 2006
Sprache Deutsch
Identifikator ISSN: 1432-7864
urn:nbn:de:swb:90-51610
KITopen-ID: 1000005161
Verlag Universität Karlsruhe (TH)
Serie Interner Bericht. Fakultät für Informatik, Universität Karlsruhe ; 2006-5
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page