Compacting Minimal Perfect Hashing using Symbiotic Random Search

Ziegler, Jonatan


Minimale perfekte Hashfunktionen (MPHFs) sind Datenstrukturen, die eine Menge aus $n$ Schlüsseln bijektiv auf $\{1, \ldots, n\}$ abbilden. Um diese abzuspeichern werden mindestens $n \cdot \log_2 e \approx 1.4427n$ Bits benötigt. Bisherige MPHFs erreichen bis zu 1.489 Bits pro Schlüssel, indem sie geseedete Hashfunktionen finden, welche die Schlüssel wiederholt in zwei gleich große Teile aufteilen und einen Basisfall gesondert handhaben. Allerdings werden durch das individuelle Abspeichern der Seeds bis zu $\log_2 e$ Bits pro Unterteilung verschwendet, selbst bei Verwendung einer entropieoptimalen Codierung. ... mehr

Abstract (englisch):

Minimal perfect hash functions (MPHFs) are data structures that map a set of 𝑛 keys to $\{1, \ldots, n\}$ bijectively. To store them, at least $n \cdot \log_2 e \approx 1.4427n$ bits are necessary. Previous MPHFs reach as low as 1.489 bits per key by finding seeded hash functions that split the keys into two sets of equal size repeatedly and handling a base case. However, storing all those seeds individually - even with an entropy optimal encoding - wastes up to $\log_2 e$ bits per split. We introduce Symbiotic Random Search (SRS) which solves this problem by utilizing a special search pattern. ... mehr

DOI: 10.5445/IR/1000177814
Veröffentlicht am 08.01.2025
Zugehörige Institution(en) am KIT Institut für Theoretische Informatik (ITI)
Publikationstyp Hochschulschrift
Publikationsjahr 2024
Sprache Englisch
Identifikator KITopen-ID: 1000177814
Verlag Karlsruher Institut für Technologie (KIT)
Umfang 67
Art der Arbeit Abschlussarbeit - Bachelor
Referent/Betreuer Walzer, Stefan
Lehmann, Hans-Peter
