Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Witte, René; Mülle, Jutta

doi:10.5445/IR/1000005161

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Witte, René; Mülle, Jutta

Abstract:

Das noch recht junge Forschungsgebiet "Text Mining" umfaßt eine
Verbindung von Verfahren der Sprachverarbeitung mit Datenbank-
und Informationssystemtechnologien. Es entstand aus der
Beobachtung, dass ca. 85% aller Datenbankinhalte nur in
unstrukturierter Form vorliegen, so dass sich die Techniken des
klassischen Data Mining zur Wissensgewinnung nicht anwenden
lassen. Beispiele für solche Daten sind Volltextdatenbanken mit
Büchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln
oder wissenschaftlichen Publikationen, aber auch Ströme
kontinuierlich auflaufender Emails oder Meldungen von
Nachrichtenagenturen (Newswires).

Im Gegensatz zum Information Retrieval geht es beim Text Mining
nicht darum, lediglich Dokumente anhand von Anfragen
aufzufinden, sondern aus einem einzelnen oder einem Satz von
Dokumenten neues Wissen zu gewinnen, etwa durch automatische
Textzusammenfassungen, die Erkennung und Verfolgung benannter
Objekte oder die Aufdeckung neuer Trends in Forschung und
Industrie. Durch die ständig wachsende Zahl elektronisch
verfügbarer Texte werden automatisch arbeitende Verfahren zur
Bewältigung der Informationsflut immer dringender, was Text
... mehr

KITopen-Download

Volltext

DOI: 10.5445/IR/1000005161

Export

Statistiken

Seitenaufrufe: 926
seit 27.04.2018

Downloads: 26028
seit 29.10.2008

Zugehörige Institution(en) am KIT	Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp	Forschungsbericht/Preprint
Publikationsjahr	2006
Sprache	Deutsch
Identifikator	ISSN: 1432-7864 urn:nbn:de:swb:90-51610 KITopen-ID: 1000005161
Verlag	Universität Karlsruhe (TH)
Serie	Interner Bericht. Fakultät für Informatik, Universität Karlsruhe ; 2006-5
Nachgewiesen in	OpenAlex
Globale Ziele für nachhaltige Entwicklung

Repository KITopen

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Abstract: