Seminarium: Systemy Rozproszone
17 marca 2016, godzina 12:15, sala 4070
Marcel Zięba

CPI^2 - CPU performance isolation for shared compute clusters



Bardzo ważnym zagadnieniem w systemach rozproszonych jest izolacja wydajności. Niestety Linux ma niewiele rozwiązań, które pozwalają na sprawiedliwy podział współdzielonych zasobów, takich jak na przykład pamięć podręczna procesora. Niestety rezultatem tego jest często nieprzewidywalna wydajność, spowodowana działaniami innych aplikacji.

W celu zidentyfikowania problemów z wydajnością, w systemie CPI^2, jest zliczana średnia liczba cykli na wykonanie jednej instrukcji. Pozwala to na znalezienie prawdopodobnych "sprawców" pogorszenia wydajności. Dzięki spowolnieniu sprawców, aplikacje wrażliwe na opóźnienia wracają do normalnego działania.

System CPI^2 został uruchomiony na wszystkich klastrach w serwerowniach Googla i wykrywa średnio kilka tysięcy incydentów dziennie. Dzięki niemu, końcowi użytkownicy doświadczają znacznie mniej odchyleń wydajności, a deweloperzy mogą się spodziewać bardziej przewidywalnego środowiska.

Marcel Zięba



Bibliografia: