Seminarium: Systemy Rozproszone
13 maja 2021, godzina 12:15, sala Zoom Meeting https://us02web.zoom.us/j/86169891592
Piotr Karpiński , Wojciech Ciszewski

Jak cache'ować dane w zadaniach treningu sieci neuronowych


W ostatnich latach dużą część zadań wykonywanych przez klastry obliczeniowe stanowią treningi sieci neuronowych. Zadania te wymagają specjalistycznego hardware'u - kart graficznych. Karta graficzna może przetwarzać dane dużo szybciej, niż jest w stanie je dostawać - problemem jest zbyt wolny system I/O.

Podczas prezentacji opowiem o systemie cache'owania danych zoptymalizowanym pod użycie w zadaniach treningu sieci neuronowych.

Zapraszam,
Piotr Karpiński

Bibliografia:

Leveraging High-Frequency Cores in the OS Scheduler for Improved Application Performance


We współczesnych procesorach poszczególne rdzenie mogą działać z różnymi częstotliwościami taktowania, co pozwala na precyzyjne balansowanie wydajności i poboru energii. Zmiana częstotliwości nie jest jednak natychmiastowa. Może to prowadzić do frequency inversion ― sytuacji, w której częstotliwość taktowania rdzeni nie odpowiada ich obciążeniu.

W ramach prezentacji przedstawię powody powstawania oraz przykład frequency inversion. Pokażę także alternatywne strategie szeregowania procesów mierzące się z tym problemem.

Zapraszam,
Wojciech Ciszewski

Bibliografia: