KIT | KIT-Bibliothek | Impressum | Datenschutz

Software Plagiarism Detection on Intermediate Representation

Heneka, Niklas Rainer 1
1 Karlsruher Institut für Technologie (KIT)

Abstract:

Plagiate von Quelltext sind ein weit verbreitetes Problem in der Informatik. Um dem entgegenzuwirken, können Software-Plagiatsdetektoren helfen, plagiierten Code zu erkennen. Die meisten modernen Plagiatsdetektoren sind token-basiert. Das Entwerfen und Implementieren eines neuen dedizierten Sprachmoduls zur Unterstützung einer neuen Programmiersprache ist dabei üblich. Dieser Prozess kann zeitaufwändig sein, und es ist unklar, ob er überhaupt notwendig ist. In dieser Arbeit evaluieren wir die Notwendigkeit von dedizierten Sprachmodulen für Java und C/C++ und leiten Schlussfolgerungen für das Design neuer Sprachmodule ab. ... mehr

Abstract (englisch):

Source code plagiarism is a widespread problem in computer science education. To counteract this, software plagiarism detectors can help identify plagiarized code. Most state-of-the-art plagiarism detectors are token-based. It is common to design and implement a new dedicated language module to support a new programming language. This process can be time-consuming, furthermore, it is unclear whether it is even necessary. In this thesis, we evaluate the necessity of dedicated language modules for Java and C/C++ and derive conclusions for designing new ones. To achieve this, we create a language module for the intermediate representation of LLVM. ... mehr


Volltext §
DOI: 10.5445/IR/1000168422
Veröffentlicht am 19.02.2024
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Informationssicherheit und Verlässlichkeit (KASTEL)
Publikationstyp Hochschulschrift
Publikationsdatum 17.11.2023
Sprache Englisch
Identifikator KITopen-ID: 1000168422
Serie 57
Art der Arbeit Abschlussarbeit - Bachelor
Prüfungsdaten 17.11.2023
Referent/Betreuer Sağlam, Timur
Schmid, Larissa
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page