KIT | KIT-Bibliothek | Impressum | Datenschutz

Bestimmung der semantischen Funktion von Sätzen in Anforderungsbeschreibungen

Tomova, Dana

Abstract:
Das Verständnis der Absicht von Softwareanforderungen ist essentiell für die automatische Generierung von Informationen zur Rückverfolgbarkeit. Funktionale Anforderungen können verschiedene semantische Funktionen, wie die Beschreibung von erwarteten Funktionalitäten oder Zuständen des Systems beinhalten. Im Rahmen des INDIRECT-Projektes wird ein Werkzeug zur Klassifiktion der semantischen Funktion der Sätze in Anforderungsbeschreibungen entwickelt. Dafür werden verschiedene maschinelle Lernverfahren (Stützkonvektormaschine, Logistische Regression, Random Forest und Naive Bayes) auf ihre Eignung für diese Aufgabe überprüft. Um ihre Funktionalität zu evaluieren, werden die Verfahren auf einem Datensatz aus frei verfügbaren Anforderungsbeschreibungen getestet, welcher manuell mit semantischen Funktionen etikettiert wurde. Die Ergebnisse zeigen, dass der Random Forest-Klassifikator unter Verwendung von N-Grammen auf Zeichenebene mit einem F1-Maß von 0,79 die beste Leistung auf unbekannten Projekten liefert. Die Lernverfahren werden zusätzlich mittels einer Kreuzvalidierung auf allen vorhandenen Daten getestet. Dabei erzielt die Stützvektormaschine mit einem F1-Maß von 0,90 die besten Ergebnisse, während der Random Forest-Klassifikator ein F1-Maß von 0.89 erreicht.

Open Access Logo


Volltext §
DOI: 10.5445/IR/1000100540
Veröffentlicht am 10.12.2019
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp Hochschulschrift
Publikationsjahr 2019
Sprache Deutsch
Identifikator KITopen-ID: 1000100540
Verlag KIT, Karlsruhe
Art der Arbeit Abschlussarbeit - Bachelor
Schlagwörter Maschinelles Lernen, Stützvektormaschine, Random Forest Klassifikator, 10-fache Kreuzvalidierung, Architektur von INDIRECT
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page