Seminarium: Systemy Rozproszone
10 kwietnia 2014, godzina 12:15, sala 4070
Łukasz Piotrowski

Big Data: rozproszone bazy danych. Apache HBase, Cassandra.



Apache HBase oraz Apache Cassandra należą obecnie do najpopularniejszych rozproszonych systemów baz danych. Są to nierelacyjne bazy danych NoSQL, w których szczególnie ważnymi aspektami są: wydajność, skalowalność oraz odporność na awarie. HBase jest systemem umożliwiającym szybki dostęp (odczyt i zapis) do pojedynczych rekordów dla dużych tabel, zachowując jednocześnie warunek ścisłej spójności.

Na seminarium przedstawię architekturę wymienionych systemów oraz omówię w jaki sposób są zrealizowane i zapewnione podane cechy. Przybliżę także problemy, które występują w rozproszonych bazach danych. Jednym z nich jest osiągnięcie poprawnego zachowania systemu po wystąpieniu awarii części klastra. Wystąpienie takich przypadków jest bardzo prawdopodobne, jeżeli system składa się z dużej liczby maszyn.

Zapraszam!
Łukasz Piotrowski

Bibliografia: