KIT | KIT-Bibliothek | Impressum | Datenschutz
Open Access Logo
§
Volltext
URN: urn:nbn:de:swb:90-51610

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Witte, René; Mülle, Jutta

Abstract:

Das noch recht junge Forschungsgebiet "Text Mining" umfaßt eine
Verbindung von Verfahren der Sprachverarbeitung mit Datenbank-
und Informationssystemtechnologien. Es entstand aus der
Beobachtung, dass ca. 85% aller Datenbankinhalte nur in
unstrukturierter Form vorliegen, so dass sich die Techniken des
klassischen Data Mining zur Wissensgewinnung nicht anwenden
lassen. Beispiele für solche Daten sind Volltextdatenbanken mit
Büchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln
oder wissenschaftlichen Publikationen, aber auch Ströme
kontinuierlich auflaufender Emails oder Meldungen von
Nachrichtenagenturen (Newswires).

Im Gegensatz zum Information Retrieval geht es beim Text Mining
nicht darum, lediglich Dokumente anhand von Anfragen
aufzufinden, sondern aus einem einzelnen oder einem Satz von
Dokumenten neues Wissen zu gewinnen, etwa durch automatische
Textzusammenfassungen, die Erkennung und Verfolgung benannter
Objekte oder die Aufdeckung neuer Trends in Forschung und
Industrie. Durch die ständig wachsende Zahl elektronisch
verfügbarer Texte werden automatisch arbeitende Verfahren zur
Bewältigung der Information ... mehr


Zugehörige Institution(en) am KIT Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp Forschungsbericht
Jahr 2006
Sprache Deutsch
Identifikator ISSN: 1432-7864
KITopen ID: 1000005161
Verlag Karlsruhe
Serie Interner Bericht. Fakultät für Informatik, Universität Karlsruhe ; 2006-5
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft KITopen Landing Page