Seminarium: Systemy Rozproszone
25 lutego 2016, godzina 12:15, sala 4070
Paweł Kura

FlashGraph: Processing Billion-Node Graphs on an Array of Commodity SSDs



W dzisiejszym świecie informatyki grafy pełnią ważną rolę w wielu dziedzinach. Z ich pomocą można opisać wiele zjawisk, zależności, np. sieci społecznościowe, sieci komputerowe. Chcemy umieć je efektywnie analizować i wyciągać wnioski. Rozmiary tych grafów jednak mogą przekraczać możliwości pojedynczej maszyny, szukamy zatem rozwiązań rozproszonych.

Z technicznego punktu widzenia analizowanie grafów zwykle wymaga wykonania wielu operacji odczytu i zapisu losowego, które ze względów wydajnościowych zazwyczaj są wykonywane w pamięci. Mając do czynienia z grafami o dużej liczbie wierzchołków wykorzystywana jest zagregowana pamięć na wielu maszynach. Takie rozwiązanie jest efektywne, lecz kosztowne.

Na seminarium przedstawię alternatywne podejście do tego problemu - FlashGraph. FlashGraph jest silnikiem do przetwarzania grafów. Zbudowany jest na specjalnym systemie plików na dyski SSD, przeznaczonym do szybkiego, równoległego wykonywania operacji odczytu i zapisu. Ponadto wygodny programistyczny interfejs umożliwia łatwą implementację wielu algorytmów grafowych. Rozwiązanie te jest tanie i, jak się okazuje, jego wydajność może być porównywalna z wydajnością tradycyjnych rozwiązań.

Paweł Kura



Bibliografia: