Buforowanie

Spis tre¶ci

Wstêp

Miejsce systemu buforowania w interfejsie systemu plików

Struktury danych

Czytanie bloków dyskowych - funkcje bread i breada

Pisanie bloków dyskowych - demon bdflush

Scenariusze dostêpu - getblk i brelse

Strategia odzyskiwania buforów refill_free_list

Podsumowanie

Literatura

Wstêp

Zadaniem pamiêci buforowej jest usprawnienie dzia³ania i ujednolicenie interfejsu operacji dyskowych. Dziêki utrzymywaniu puli buforów eliminuje siê wielokrotne odwo³ania do tego samego bloku dyskowego. Zapis opó¼niony pozwala na wykonywanie operacji dyskowych w czasie gdy system jest mniej zajêty. Odczytywanie z wyprzedzeniem przygotowuje blok dyskowy, o który proces prawdopodobnie poprosi w przysz³o¶ci.

Do dzia³ania podrêcznej pamiêci buforowej konieczna jest implementacja pewnej puli buforów umo¿liwiaj±ca szybkie odszukanie bufora reprezentuj±cego dany blok dyskowy. Pula buforów musi zapewniaæ jednoznaczne odwzorowanie buforów w bloki dyskowe - ka¿dy blok dyskowy znajduje siê w pamiêci w co najwy¿ej jednej kopii. Potrzebne s± pewne algorytmy kontroluj±ce przep³yw buforów pomiêdzy strukturami danych puli buforów i organizacjê wspó³pracy z pamiêci± systemow±.

Miejsce systemu buforowania w interfejsie systemu plików

Funkcjami wysokiego poziomu których wywo³anie powoduje u¿ycie mechanizmu buforowania s± read i write. Funkcje te w rzeczywisto¶ci powoduj± wywo³anie funkcji specyficznych dla konkretnego systemu plików okre¶lonych w tablicy rozdzieczej file operations. Dla pewnych systemów plików funkcje opisane poni¿ej zastêpowane s± przez podobne, ale bardziej przystosowane, np.: ext2_bread zamiast bread; dla innych systemów standardowe funkcje mechanizmu buforowania s± wywo³ywane po dokonaniu specyficznych czynno¶ci, np.: fat_bread u¿ywa bread. Gdyby zawsze stosowano wywo³ywanie tu opisanych funkcji, to kod by³by bardziej czytelny, ale narzut zwi±zany z wywo³aniem funkcji (szczególnie gdy funkcja specyficzna dla systemu plików nie robi wiele ponad wywo³anie funkcji ogólnej) powoduje, ¿e efektywniej jest zakodowaæ dan± funkcjê ponownie. Dla wszystkich systemów plików implementacje funkcji read lub write powoduj± jednak wykonanie tego samego algorytmu bread.

Struktury danych

Ka¿dy bufor sk³ada siê z dwóch czê¶ci: nag³ówka bufora i zawarto¶ci pewnego bloku dyskowego. W nag³ówku znajduj± siê pola informuj±ce o odwzorowaniu danych z bufora w pewien blok dyskowy i pola okre¶laj±ce aktualny stan bufora. Ponadto istniej± pola u¿ywane do zarz±dzania buforami, czyli utrzymywania pewnych struktur puli buforów i organizacji przep³ywu buforów w tych strukturach. Dane dyskowe zawarte w buforze mog± mieæ ró¿ne rozmiary w zale¿no¶ci od wielko¶ci bloku dyskowego. Istnieje 5 standardowych rozmiarów bufora.

Bufory zorganizowane s± w trzech podstawowych strukturach:

tablica mieszaj±ca - zawiera od 997 do 65521 dwukierunkowych kolejek w zale¿no¶ci od pamiêci zainstalowanej w systemie (ustalane w czasie instalacji systemu). Struktura ta s³u¿y do szybkiego odszukiwania bufora odwzorowanego w dany blok (lub stwierdzenia jego braku) - algorytm getblk. Bufory w tej strukturze zawieraj± bloki z danymi z dysku.
lista wolnych - tablica 5 kolejek buforów wolnych (dla ka¿dego z mo¿liwych rozmiarów bufora). S± to kolejki cykliczne i dwukierunkowe. Wszystkie bufory w tej strukturze s± puste. Z tej struktury pobierane s± bufory w przypadku konieczno¶ci przydzia³u nowego bufora - gdy nie zostanie znaleziony poszukiwany bufor w tablicy mieszaj±cej. Gdy wolnych buforów jest za ma³o, s± dodawane z tablicy mieszaj±cej po uprzednim opró¿nieniu (wg strategii LRU).
lista LRU - tablica 6 kolejek cyklicznych dla poszczególnych rodzajów zawarto¶ci bufora, np.: dzielone, brudne. S³u¿y do zarz±dzania przep³ywem buforów pomiêdzy tablic± mieszaj±c± i list± wolnych. Jest zorganizowana zgodnie ze strategi± LRU. Najstarsze bufory s± przenoszone do listy wolnych gdy brakuje wolnych buforów, natomiast podczas tworzenia nowego bufora umieszcza siê go w tej strukturze i tablicy mieszaj±cej.

Z zastosowania pól u¿ywanych do konstrukcji tych struktur wynika, ¿e dowolny bufor znajduje siê albo na li¶cie wolnych, albo w tablicy mieszaj±cej i jednocze¶nie na li¶cie LRU. Po uruchomieniu systemu wykonywana jest funkcja inicjuj±ca powy¿sze struktury. Wszystkie dostêpne bufory umieszczane s± na li¶cie wolnych i alokowana jest pamiêæ na tablicê mieszaj±c±, natomiast lista LRU jest pocz±tkowo pusta

Ponadto istniej± pewne dodatkowe struktury pomocnicze, jak lista nag³ówków buforów, z której pobiera siê nag³ówek podczas tworzenia nowego bufora, oraz listy s³u¿±ce do stronicowania pamiêci zawieraj±cej bufory. Wszystkie bufory le¿±ce na jednej stronie pamiêci po³±czone s± w listê, co jest przydatne w czasie usuwania tej strony z pamiêci g³ównej.

Mo¿na zauwa¿yæ, ¿e przyjêta w Linuxie struktura puli buforów jest ró¿na od spotykanej w innych Unixach; struktura opisywana w ksi±¿ce Bacha sk³ada siê tylko z dwóch list, bez po¶rednicz±cej kolejki buforów wolnych.

Czytanie bloków dyskowych - funkcje bread i breada

Funkcja bread jest wywo³ywana gdy zostanie zg³oszone zapotrzebowanie na pewien blok dyskowy. Jako parametry przekazywany jest numer systemu plików i numer bloku w tym systemie, oraz rozmiar bufora. Funkcja próbuje odszukaæ blok danych w tablicy mieszaj±cej za pomoc± algorytmu getblk, który zwraca bufor (jednocze¶nie go zajmuj±c) wype³niony aktualnymi danymi w przypadku znalezienia, a w przeciwnym razie pusty. Je¶li zwrócony blok zawiera aktualne dane to jest zwracany dalej do funkcji wywo³uj±cej algorytm bread. Gdy bufor jest pusty - nie znaleziono bloku w puli buforów - wykonywana jest niskopoziomowa funkcja inicjuj±ca czytanie z dysku. Proces ¶pi w oczekiwaniu na zakoñczenie operacji odczytu. Nastêpnie dokonywane jest sprawdzenie, czy odczytane dane s± poprawne, co zabezpiecza przed b³êdami niskopoziomowych operacji dyskowych. Zwracany jest bufor z poprawnymi danymi, a w przypadku b³êdu nastêpuje zwolnienie bufora i zwracana jest warto¶æ NULL.

Funkcja breada ma podobne dzia³anie, ale dokonuje równie¿ odczytu z wyprzedzeniem. Sprawdzana jest odleglo¶æ bie¿±cej pozycji od konca pliku, i inicjowany jest odczyt nastêpnych bloków z plików. Funkcja ta, podobnie jak bread, czeka na odczytanie ¿±danego bloku, ale na zakoñczenie odczytu pozosta³ych bloków ju¿ nie.

Tu mo¿na znalezc dokladniejszy opis funkcji bread i breada.

Pisanie bloków dyskowych - demon bdflush

Zapisywanie bloków dyskowych odbywa siê w dwóch etapach. Po pierwsze - gdy proces wywo³a write, to wykonywany jest algorytm analogiczny do getblk, jednak z pewny m wyj±tkiem: w przypadku braku bufora w kolejkach mieszaj±cych odczyt niskopoziomowy nastêpuje tylko wtedy zapisywany fragment nie obejmuje ca³ego bloku. Nastêpnie bufor jest modyfikowany i oznaczany jako brudny.

Rzeczywiste zapisanie bloku na dysk ma miejsce w przypadku konieczno¶ci opró¿nienia buforów potrzebnych dla innych operacji, lub na skutek okresowego dzia³ania demona bdflush.

Scenariusze dostêpu - getblk i brelse

Zadaniem algorytmu getblk jest odszukanie i dostarczenie ¿±danego bufora z tablicy mieszaj±cej. Je¶li nie ma bufora w tablicy mieszaj±cej zwracany jest nowy, pusty bufor. Bufor taki pobierany jest z kolejki buforów wolnych, która jest uzupe³niana zgodnie ze strategi± odzyskiwania buforów. Zwracany bufor jest ju¿ zablokowany. W li¶cie LRU dany bufor zgodnie ze strategi± przesuwany jest na koniec.

Funkcja brelse s³u¿y do zwolnienia zablokowanego uprzednio bufora po wykonaniu na nim pewnych operacji przez proces.Jej dzia³anie jest proste.

Warto tutaj rozpatrzyæ pewne mo¿liwe scenariusze mog±ce zachodziæ dla algorytmu getblk:

Szukany bufor zostaje znaleziony w tablicy mieszaj±cej i jest dostêpny - zostaje zwrócony z funkcji.
Zostaje znaleziony, lecz nie jest dostêpny - nastêpuje za¶niêcie w oczekiwaniu na bufor, a po jego zwolnieniu przez inny proces sprawdzenie, czy to ¿±dany bufor, gdy¿ móg³ on byæ ju¿ u¿yty przez inny proces.
Bufora nie ma w tablicy mieszaj±cej, ale s± wolne bufory w li¶cie wolnych - usuwamy jeden bufor z listy wolnych, wstawiamy do listy LRU i tablicy mieszaj±cej, po czym zwracamy.
Bufora nie ma i lista wolnych jest pusta - wywo³ujemy refill_free_list, a dalej jak w poprzednim punkcie.

W Unixie, gdzie struktura puli buforów oparta jest na dwóch listach, mo¿liwych scenariuszy jest wiêcej i ich opis jest bardziej skomplikowany. Przyjêty w Linuxie schemat oparty na trzech strukturach danych znacznie upraszcza konstrukcjê puli buforó w (np. zapisywanie buforów na dysk zosta³o oddzielone od przydzielania nowych buforów), jednak zarz±dzanie tak± pul± wymaga nieco wiêkszego nak³adu pracy.

Strategia odzyskiwania buforów - refill_free_list

Gdy algorytm getblk nie znajduje bufora w tablicy mieszaj±cej, zwraca nowo przydzielony bufor pobrany z kolejki buforów wolnych. Mo¿e siê jednak zdarzyæ, ¿e kolejka buforów wolnych jest pusta, wtedy konieczne jest jej uzupe³nienie. Operacja ta odbywa siê w kilku fazach, gdy¿ odzyskiwane bufory mog± pochodziæ z kilku ¼róde³. Dla zwiêkszenia efektywno¶ci ka¿de wywo³anie funkcji refill_free_list powoduje odzyskanie ustalonej, wiêkszej ilo¶ci buforów.

Pierwszym ¼ród³em nowych buforów jest wolna pamiêæ w systemie. Wywo³ywana jest funkcja, która przydziela pamiêæ na nowe bufory. Drugim ¼ród³em s± listy LRU, z których odzyskuje siê najd³u¿ej nieu¿ywane bufory. Ponadto z list LRU mo¿na odzyskiwaæ bufory oznaczone do zapisu opó¼nionego.

Ró¿ne sposoby odzyskiwania buforów przeplataj± siê w ró¿nych fazach algorytmu. Je¶li w systemie jest du¿o wolnej pamiêci to najpierw wywo³ywana jest funkcja grow_buffers. Nastêpna próba utworzenia polega na odzyskiwaniu buforów z list LRU. Wybierany jest jeden kandydat z ka¿dej listy (nie uwzglêdniaj±c buforów oznaczonych do opóŸnionego zapisu), i dopiero w¶ród tych kandydatów dokonuje siê ostatecznej selekcji. Je¶li w tym momencie nie uzyskamy potrzebnej ilo¶ci buforów, ponownie wywo³ujemy grow_buffers z wiêkszym priorytetem. Dopiero gdy ta metoda nie skutkuje uruchamiany jest demon zapisuj±cy bdflush. Ostatni± szans± jest ponowne wywo³anie grow_buffers z jeszcze wiêkszym priorytetem.

Taka strategia szereguje kolejne fazy prób odzyskiwania buforów w zale¿no¶ci od wp³ywu danej fazy na system i kosztu jej wykonania. Na przyk³ad gdy jest du¿o wolnej pamiêci to nie ma potrzeby likwidowaæ starych buforów, ale gdy pamiêci jest ma³o to warto zu¿yæ trochê czasu na uruchomienie demona bdflush.

Demon bdflush dzia³a te¿ niezale¿nie od omawianej funkcji i okresowo zapisuje dane na dysk. Jest to dodatkowe ¼ród³o wolnych buforów.

Podsumowanie

Podstawowe zalety buforowania to zwiêkszenie wydajno¶ci systemu i ujednolicenie interfejsu funkcji dostêpu do dysku. Ale wa¿ne jest te¿ np. ukrywanie przed u¿ytkownikiem faktu, ¿e operacji dyskowe s± operacjami blokowymi; pozwala na wykonywanie przez procesy operacji bajtowych. J±dro nie musi znaæ znaczenia danych dyskowych - mog± to byæ np. i-wêz³y.

Niestety wystêpuj± te¿ znacz±ce wady. Podstawowym problemem zwi±zanym z opó¼nionym zapisem jest nieznajomo¶æ momentu, w którym dane zostaj± w rzeczywisto¶ci zapisywane na dysku. W przypadku awarii systemu dane te zostaj± utracone. Dodatkowym problemem jest podwójne kopiowanie - z dysku do pamiêci j±dra i ponownie do pamiêci procesu. W Linuxie probuje siê temu zaradziæ stosuj±c bufory dzielone.

Literatura

Skomentowane ¼ród³a funkcji systemu buforowania:

getblk(find_buffer, get_hash_table)
refill_freelist (find_candidate, create_buffers, grow_buffers)
bread (buffer_uptodate, ll_rw_block)
breada
brelse (wait_on_buffer, set_write_time, refile_buffer)

Szczegó³owe opisy algorytmów:

Pozostala literatura:

M. J. Bach "Budowa systemu operacyjnego Unix"
Projekt Linux

Opracowa³: Jaros³aw Wawszczak