KIT | KIT-Bibliothek | Impressum | Datenschutz

Being Google - Studierende entwickeln Plattform für verteiltes Web-Crawling

Andelfinger, Philipp; Neudecker, Till

Abstract:

Moderne Suchmaschinen können Seiten des World Wide Web in gigantischen und fortlaufend aktualisierten Datenbanken durchsuchen und selbst komplexe Suchanfragen in wenigen Millisekunden verarbeiten. Dienste dieser Art sind kaum denkbar ohne die Verwendung hochverteilter Ansätze beim Crawling im Web und bei der Bearbeitung von Nutzeranfragen. Im Rahmen der Lehrveranstaltung „Praxis der Softwareentwicklung” im Bachelor-Studiengang Informatik hat ein Team von Studenten im Projekt "Being Google - Verteiltes Web-Crawling und Suche" ein Software-System entworfen und implementiert, das ein effizientes Crawling von textuellen Web-Inhalten, die Indexierung in einer verteilten Datenbank sowie eine performante Suche nach abgelegten Inhalten erlaubt.

Abstract (englisch):

Modern search engines enable the search in large and continuously updated databases of web sites, providing responses to complex search requests within milliseconds. Services of this type require the use of highly distributed approaches for crawling of web contents and processing of user requests. In the context of the course "Software Engineering Practice", a team of students developed a software system for efficient crawling of textual web contents, for indexing in a distributed database, and for high-performance search of colected contents.


Volltext §
DOI: 10.5445/IR/1000044912
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Telematik (TM)
Scientific Computing Center (SCC)
Universität Karlsruhe (TH) – Zentrale Einrichtungen (Zentrale Einrichtungen)
Publikationstyp Zeitschriftenaufsatz
Publikationsjahr 2014
Sprache Deutsch
Identifikator ISSN: 1866-4954
urn:nbn:de:swb:90-450925
KITopen-ID: 1000045092
Erschienen in SCC-News
Verlag Karlsruher Institut für Technologie (KIT)
Heft 2
Seiten 40-41
Relationen in KITopen
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page