KIT | KIT-Bibliothek | Impressum | Datenschutz

Worteinbettungen für die Anforderungsdomäne

Telge, Tobias

Abstract:

Worteinbettungen werden in Aufgaben aus der Anforderungsdomäne auf vielfältige Weise eingesetzt.
In dieser Arbeit werden Worteinbettungen für die Anforderungsdomäne gebildet und darauf geprüft, ob sie in solchen Aufgaben bessere Ergebnisse als generische Worteinbettungen erzielen.
Dafür wird ein Korpus von in der Anforderungsdomäne üblichen Dokumenten aufgebaut.
Er umfasst 21458 Anforderungsbeschreibungen und 1680 Anwendererzählungen.
Verschiedene Worteinbettungsmodelle werden auf ihre Eignung für das Training auf dem Korpus analysiert.
Mit dem fastText-Modell, das durch die Berücksichtigung von Teilwörtern seltene Wörter besser darstellen kann, werden die domänenspezifischen Worteinbettungen gebildet.
Sie werden durch Untersuchung von Wortähnlichkeiten und Clusteranalysen intrinsisch evaluiert.
Die domänenspezifischen Worteinbettungen erfassen einige domänenspezifische Feinheiten besser, die untersuchten generischen Worteinbettungen hingegen stellen manche Wörter besser dar.
Um die Vorteile beider Worteinbettungen zu nutzen, werden verschiedene Kombinationsverfahren analysiert und evaluiert.
In einer Aufgabe zur Klassifizierung von Sätzen aus Anforderungsbeschreibungen erzielt eine gewichtete Durchschnittsbildung mit einer Gewichtung von 0,7 zugunsten der generischen Worteinbettungen die besten Ergebnisse.
... mehr


Zugehörige Institution(en) am KIT Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp Hochschulschrift
Publikationsjahr 2020
Sprache Deutsch
Identifikator KITopen-ID: 1000123704
Verlag Karlsruher Institut für Technologie (KIT)
Art der Arbeit Abschlussarbeit - Bachelor
Referent/Betreuer Tichy, Walter F.
Reussner, Ralf H.
Hey, Tobias
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page