Seminarium: Systemy Rozproszone
10 kwietnia 2025 12:15, sala 4070
Mateusz Cegiełka, Mateusz Wasilewski



DeepSeek-V3 Technical Report



Opowiem o architekturze i treningu wiodącego modelu językowego DeepSeek-V3, skupiając się bardziej na dokładniejszym opisie sposobu rozpraszania tych obliczeń niż na szczegółach MLowych. Po przypomnieniu oryginalnej architektury Transformer, wyjaśnię jak została zmodyfikowana do rozproszenia na największych klastrach świata, jak prawdziwe algorytmy używają technologii takich jak RDMA, jakie są możliwe przyszłe kierunki rozwoju sprzętu, i co to znaczy dla lokalnego uruchamiania modeli językowych.

Zapraszam,
Mateusz Cegiełka



Bibliografia:





Optimizing Scheduler for Linux Gaming



Poor task scheduling can lead to stuttering during gameplay—but what exactly is "stuttering," and how can we measure its effects on the gaming experience?
In this talk, we dive into how game workloads interact with the Linux scheduler and explore the behavior of game tasks from the scheduler’s perspective.
We then present an optimized scheduling policy LAVD, implemented using sched_ext, a BPF-based extensible scheduling framework, designed specifically to reduce stuttering on Linux gaming platforms like the Steam Deck.

Zapraszam,
Mateusz Wasilewski



Bibliografia: