Abstract:
Eine Vielzahl von Anwendungen sammelt, speichert und analysiert Daten über Endnut-
zer. Beispiele hierfür sind Kundenbindungssysteme wie Payback, Bonusprogramme von
Krankenkassen, verhaltensabhängige Kfz-Versicherungstarife, Pay-as-you-go-Dienste im
öffentlichen Nahverkehr, Smart Metering und viele andere. Derzeit werden von den meis-
ten dieser Systeme Nutzerdaten in großem Umfang gesammelt, was zu umfangreichen
Datensätzen mit personenbezogenen Informationen führt. Dies hat jedoch sowohl für
Nutzer als auch für Unternehmen Nachteile. Die gesammelten Daten ermöglichen die
... mehr
Erstellung umfangreicher Profile, die weit über den beabsichtigten Verwendungszweck
hinausgehen. Große Datensammlungen sind zudem ein lukratives Ziel für Cyberangriffe,
die den betroffenen Nutzern beispielsweise durch Identitätsdiebstahl Schaden zufügen und
den beteiligten Unternehmen durch negative Publicity und mögliche Datenschutzstrafen
schaden können.
Technologien zum Schutz der Privatsphäre sind eine Lösung für diese Probleme, da sie es
ermöglichen, die gewünschten Analysen sicher anhand relevanter Benutzerdaten durch-
zuführen, ohne dass sensible Daten im Klartext erfasst oder gespeichert werden müssen.
Dies bringt jedoch neue Herausforderungen mit sich, da Technologien zum Schutz der Pri-
vatsphäre in Bezug auf Rechenleistung und Kommunikation anspruchsvoll sind. In dieser
Arbeit schlagen wir zwei generische Lösungen vor, die auf diesen Technologien basieren,
und bewerten sie. Beide Lösungen sind formal im Rahmen des Universal Composability
Framework modelliert, wodurch sie in jedem Kontext eingesetzt werden können und dabei
ihre durch simulationsbasierte Sicherheit hohen Sicherheitsgarantien behalten. Darüber
hinaus werden beide Lösungen mit einer praktischen Prototyp-Implementierung und
-Bewertung vorgestellt, die das Potenzial für den praktischen Einsatz sowie die aktuellen
Einschränkungen aufzeigen. Bei beiden Lösungen stellen wir sicher, dass die Nutzer bei
der Datenerfassung anonym bleiben und gleichzeitig die Authentizität der erfassten Daten
gewährleistet ist.
Unsere erste Lösung namens PUBA basiert auf persönlichen Logbüchern, die auf dem
Gerät jedes Benutzers gespeichert sind. Diese Logbücher sind authentifiziert und können
nur vom Systembetreiber aktualisiert werden, wobei die Vertraulichkeit ihres Inhalts ge-
wahrt bleibt. Die Benutzer können dann an datenschutzkonformen Analyseberechnungen
teilnehmen, bei denen sichergestellt ist, dass ihr Logbuch aktuell und authentisch ist. Um
eingeschränkten Benutzergeräten wie Smartphones gerecht zu werden, können Benutzer
komplexere Analyseberechnungen an einen (möglicherweise böswilligen) Proxy auslagern,
der nicht mit dem Systembetreiber zusammenarbeitet. Leistungsbewertungen unseres
Prototyps zeigen, dass PUBA ausreichend Leistung bietet um Logbücher für die letzten
10-30 Transaktionen zu unterstützen.
In unserer zweiten Lösung namens POBA werden die Logbücher stattdessen auf von den
Betreibern kontrollierten Servern gespeichert. Wir modellieren ein Setting, in dem mehrere
Betreiber zusammenarbeiten, um das System zu betreiben, ohne sich gegenseitig vollstän-
dig zu vertrauen. Der Inhalt der Logbücher wird geschützt, indem er unter allen beteiligten
Betreibern aufgeteilt wird. Darüber hinaus werden fortschrittliche kryptografische Tools
wie Oblivious RAM eingesetzt, um die Identität der Benutzer zu schützen und zu verhin-
dern, dass mehrere Interaktionen mit demselben Benutzer in Verbindung gebracht werden
können. Da die Daten in dieser Umgebung ohne Benutzerinteraktion verfügbar sind, haben
die Betreiber mehr Flexibilität bei der Durchführung von Analysen. Solange sich einige
Betreiber ehrlich verhalten, stellt die Notwendigkeit aller Betreiber, den Berechnungen
zuzustimmen, dennoch sicher, dass die Analyseergebnisse den Datenschutzanforderungen
entsprechen. Leistungsbewertungen unseres Prototyps zeigen seine Praktikabilität im
3-Parteien Setting: Mit drei Betreibern können über zwei Millionen Logbucheinträge pro
Tag verarbeitet werden.
Abstract (englisch):
A large number of applications collect, store and analyze data about end users. Examples
include customer loyalty systems such as Payback, incentive systems offered by health
insurers, behavior-dependent car insurance tariffs, pay-as-you-go public transport services,
smart metering, and many more besides. Currently, most of these systems simply collect
raw user data, resulting in vast datasets of personal information. However, this has
disadvantages for both users and companies. The collected data allows extensive profiles
to be created that go far beyond the intended use. ... mehrLarge collections of data are also a
lucrative target for cyber-attacks, which can harm affected users through identity theft,
for example, as well as causing harm to the involved company through negative publicity
and potential data protection penalties.
Privacy-preserving technologies are a remedy for these problems, as they allow the desired
analytics to be evaluated securely on relevant user data without the need to collect or
store sensitive user data in the clear. However, this comes with new challenges, as privacy-
preserving technologies are more computationally and communicationally complex. In this
thesis, we propose and evaluate two generic solutions based on these technologies. Both
solutions are formally modelled in the Universal Composability framework, which allows
them to be used in any context while maintaining strong security guarantees through
simulation-based security. Furthermore, both solutions come with a practical prototype
implementation and evaluation, showcasing the potential for practical deployment as well
as the current limitations. In both solutions, we ensure that users remain anonymous
when data is collected, while guaranteeing the authenticity of the collected data.
Our first solution, called PUBA, is based on personal logbooks stored on each user’s device.
These logbooks are authenticated and can only be updated by the system operator while
maintaining the confidentiality of their content. Users can then participate in privacy-
preserving analytics computation, where it is ensured that their logbook is up-to-date
and authentic. To accommodate constrained user devices, such as smartphones, users can
outsource more complex analytics computations to a (potentially malicious) proxy that is
not colluding with the system operator. Performance evaluations of our prototype show
that PUBA has sufficient performance for logbooks storing the last 10-30 transactions.
In our second solution, called POBA, the logbooks are stored on operator-controlled servers
instead. We model a setting in which multiple operators collaborate to run the system
without fully trusting each other. Logbook contents are protected by secret-sharing them
between all the operators involved. Additionally, advanced cryptographic tools, such
as oblivious RAM, are employed to protect user identities and prevent the linking of
multiple interactions to the same user. Since data is available without user interaction
in this setting, operators have more flexibility when running analytics. As long as some
operators behave honestly, requiring all operators to agree to computations still ensures
that the analysis results satisfy privacy requirements. Performance evaluations of our
prototype demonstrate its practicability in the three-party setting: With three operators,
it can handle over two million logbook entries per day.