4.9 Stronicowanie

Wstêp

Stronicowanie polega na podziale pamiêci na spójne bloki ustalonej wielko¶ci. Powoduje to znaczne u³atwienia przy obs³udze pamiêci, a tak¿e brak fragmentacji zewnêtrznej , chocia¿ wystêpuje fragmentacja wewnêtrzna. Taki pojedyñczy blok, na które jest podzielona pamiêæ nazywa siê stron±, a jego wielko¶æ okre¶la sta³a PAGE_SIZE w pliku page.h. W wersji systemu, której dotyczy ten opis ma ona wielko¶æ 4096 (bajtów, czyli 4 kB). W systemie Linux rozró¿niamy dwa rodzaje pamiêci:

pamiêæ fizyczna
pamiêæ logiczna (wirtualna) jest to pamiêæ na u¿ytek procesów generowana przez j±dro systemu. Pamiêæ ta mo¿e byæ wielko¶ci nawet do 3 GB , mimo ¿e teoretycznie powinna byæ ograniczona przez pamiêæ operacyjn± komputera. Dzieje siê tak dlatego, ¿e proces nie musi byæ w ca³o¶ci umieszczony w pamiêci operacyjnej aby byæ wykonywany. Czê¶æ pamiêci , która zosta³a mu przydzielona mo¿e byæ przechwywana na dysku , a dopiero w razie odwo³ania do niej wczytana do pamiêci operacyjnej. Proces jednak nie wie czy pamiêæ , do której siê odwo³uje jast na dysku twardym , dyskietce czy w pamiêci operacyjnej komputera , gdy¿ to wymianê stron miêdzy pamiêci± a urz±dzeniem zewnêtrznym organizuje j±dro (patrz : wymiana ). Z punktu widzenia procesu posiada on do dyspozycji bardzo du¿± , jednorodn± i szybk± pamiêæ logiczn±.

To w³a¶nie pamiêæ logiczna jest podzielona na strony. Skoro ka¿da strona musi mieæ swój odpowiednik w pamiêci fizycznej , to sensownie by³oby podzieliæ tak¿e tê pamiêæ na bloki wielko¶ci PAGE_SIZE. Tak te¿ jest to zrobione. Blok pamiêci fizycznej wielko¶ci PAGE_SIZE nazywa siê ramk± .

Tablice stron

T³umaczeniem adresów logicznych pamiêci procesów na adresy fizyczne zajmuje siê MMU - Memory Menagement Unit czyli sprzêtowa jednostka zarz±dzania pamiêci±. W momencie gdy proces przechodzi do stanu wykonywania , j±dro systemu przekazuje do MMU adres tablicy stron procesu. Indeksami tej tablicy s± logiczne numery stron procesu , a warto¶ciami adresy ramek , w których te strony s± przechowywane. Nie jest to jednak zwyk³a tablica lecz tablica potrójnie po¶rednia :

Tablica zewnêtrzna posiada 1k wska¼ników do tablic ¶rodkowych, tablica ¶rodkowa zawiera 1k wska¼ników do tablic wewnêtrznych , a ka¿da z nich dopiero 1k wska¼ników do adresów ramek. Jest to mechanizm podobny do u¿ytego przy zarz±dzaniu wolnymi obszarami dyskowymi. W ten sposób mo¿na zaadresowaæ 1k * 1k * 1k = 1G stron czyli 4096 GB. Z tej liczby widaæ , ¿e potrójna po¶rednio¶æ zosta³a wykonana na wyrost. W rzeczywisto¶ci wykorzystywana jest tylko podwójna po¶rednio¶æ gdy¿ tablice ¶rodkowe wskazuj± na jedn± tylko tablicê wewnêtrzn± ( a nie na 1024 ). Element wskazywany przez tablicê wewnêtrzn± zawiera oprócz adresu ramki tak¿e inne informacje. Adres ramki jest wielokrotno¶ci± jej rozmiaru (czyli 4 kB) wiêc 12 bitów adresu do dok³adnego miejsca w pamiêci mo¿na zagospodarowaæ w inny sposób. Wykorzystywane jest 7 z nich m.in. do zaznaczenia czy ramka jest aktualnie w pamiêci, czy mo¿na na niej pisaæ, czy jest chroniona. Taka struktura jest wbrew pozorom bardzo ³atwa w u¿yciu , charakteryzuje siê szybkim dostêpem do danych ( w przzeciwieñstwie do listy) a tak¿e oszczêdno¶ci± pamiêci ( w przeciwieñstwie do jednowymiarowej d³ugiej tablicy). Oszczêdno¶æ pamiêci polega na tym, ¿e przy ma³ej ilo¶ci pamiêci wykorzystywanej przez proces wiêkszo¶æ tablic wewnêtrznych nie bêdzie istnia³a.

Adresowanie

Ka¿dy proces korzysta ze swojej pamiêci logicznej. Aby zaj±æ , zwolniæ lub pobraæ zawarto¶æ kawa³ka pamiêci o danym adresie logicznym trzeba ten¿e adres przekszta³ciæ na adres fizyczny i dokonaæ w³a¶ciwej operacji. T³umaczenie odbywa siê w oparciu o tablicê stron danego procesu. W momencie gdy proces jest wznawiany do wykonywania, j±dro informuje MMU gdzie znajduje siê tablica stron tego procesu. Od tego momentu proces odwo³uje siê do pamiêci logicznej, a MMU dba o to , aby w rzeczywisto¶ci odwo³anie dotyczy³o pamiêci fizycznej. Sprzêtowe wykonywanie t³umaczenia adresów logicznych na fizyczne jest du¿o szybsze ni¿ t³umaczenie programowe. Dzieje siê tak dlatego, ¿e operacja ta jest bardzo prosta - wymaga jedynie zamiany czê¶ci bitów na inne (pobrane z tablicy stron procesu). Oto jak to siê odbywa. Adres logiczny zajmuje 32 bity z czego 20 bitów idzie na numer strony (st±d powstaje ograniczenie na ilo¶æ stron procesu: 2 ^ 20 stron czyli 1M stron czyli 4 GB), a 12 bitów na przesuniêcie na wskazanej stronie ( 2 ^ 12 B = 4kB = wielko¶æ strony = maksymalne przesuniêcie ) . W tabeli stron procesu znajduje siê po³o¿enie (adres) ramki odpowiadaj±cej stronie o numerze wskazanym przez pierwsze 20 bitów adresu logicznego. Do uzyskanego adresu fizycznego ramki (20 bitów) dodaje siê ¿±dane przesuniêcie (12 bitów) i uzyskuje adres fizyczny , o który chodzi³o .

PRZYK£AD :

Chcemy odczytaæ warto¶æ zmiennej typu int (2 bajty) która mie¶ci siê w pamiêci logicznej pod adresem : 5A6F4B27 (szesnastkowo). Numer logiczny strony to pierwsze 20 bitów czyli : 5A6F4 , a przesuniêcie to B27 (czyli dziesiêtnie : 2855 bajt na wskazanej stronie) . Przypu¶æmy ¿e w tablicy stron danego procesu stronie o numerze 5A6F4 odpowiada ramka o adresie 21C38000. Na koñcu musz± byæ trzy zera gdy¿ adres ramki jest wielokrotno¶ci± rozmiaru ramki , który wynosi 4096 (szestnastkowo : 1000). Do uzyskanego adresu dodawane jest przesuniêcie na stronie : 21C38000 + B27 = 21C38B27 W ten sposób uzyskali¶my adres fizyczny szukanej zmiennej.

Powstaje pytanie : czemu proces posiada po¶redni± pamiêæ wirtualn± , a nie od razu fizyczn± ?

Dlatego , ¿e w przeciwnym przypadku nimo¿liwe by³oby wspó³bi e¿ne wykonanie dwóch procesów z zachodz±cymi na siebie zbioram i adr esów . Zbiory te musia³yby byæ roz³±czne , co spowodowa³oby du¿e ograniczenia na maksymaln± ilo¶æ pamiêci dla procesów ( ograniczeniem by³aby wielko¶æ pamiêci operacyjnej komputera ). Przydzielenie pamiêci dyskowej procesowi spowodowa³oby znowu , ¿e ka¿de odwo³anie do niej zajmowa³oby strasznie du¿o czasu , co wyd³u¿y³oby wykonywanie programów setki lub nawet tysi±ce razy.

Zalety stronicowania

G³ówn± zalet± stronicowania jest brak fragmentacji zewnêtrznej czyli sytuacji , w której w pamiêci robi± siê dziury , z których ju¿ nikt nie skorzysta.

PRZYK£AD :

Za³ó¿my , ¿e pozwolnieniu obszaru pamiêci wielko¶ci 2 kB kto¶ zg³asza zapotrzebowanie na 1,9 kB , które zostaje mu przydzielone z uprzednio zwolnionego obszaru. Powstaje niezagospodarowany kawa³ek pamiêci wielko¶ci ok. 100 bajtów ( o ile nie uda siê go w³±czyæ do kolejnego obszaru , który byæ mo¿e te¿ jest wolny). Jest on na tyle ma³y , ¿e byæ mo¿e nigdy nie znajdzie siê na niego chêtny i ta czê¶æ pamiêci zostanie bezu¿yteczna. Taka sytuacja mo¿e siê zdarzaæ czêsto i w sumie takie dziury spowodowa³yby , ¿e sporej czê¶ci pamiêci nie mo¿na wykorzystaæ.

Przydzielanie pamiêci w kawa³kach ustalonego rozmiaru zapobiega fragmentacji zewnêtrznej gdy¿ najmniejszy nie u¿yty blok pamiêci ma rozmiar jednej strony. Taki blok ma równe sznse zostaæ u¿ytym jak ka¿dy inny , poniewa¿ proces i tak dostaje pamiêæ po jednej ramce ( a nie kilka na raz ). Wi±¿e siê z tym tak¿e inna zaleta. Proces , który zg³asza zapotrzebowanie na kilka ramek dostaje je pojedyñczo , co powoduje , ¿e nie musz± byæ one spójnym blokiem pamiêci fizycznej. Mo¿na wyobraziæ sobie sytuacjê , w której procesy musz± dostawaæ spójne bloki pamiêci : proces czeka na obszar wielko¶ci 10 ramek , a w systemie wolnych jest wiele bloków wielko¶ci od jednej do dziewiêciu ramek, ale nie ma wiêkszych. Proces musi czekaæ , mimo ¿e w sumie wolnej pamiêci jest tyle, ¿e mo¿na by zrealizowaæ wielokrotnie wiêksze ¿±danie.

Wady stronicowania

Wad stronicowania jest niewiele , i pewnie dlatego jest ono podstaw± zarz±dzania pamiêci± wszystkich wersji systemu UNIX. Jedyne wady jakie przychodz± do g³owy to:

fragmentacja wewnêtrzna - proces mo¿e potrzebowaæ du¿o mniej ni¿ 4 kB pamiêci , a mimo to dostanie blok tej wielko¶ci . Pozosta³a czê¶æ strony nie zostanie byæ mo¿e u¿yta.
koszt utrzymywania pamiêci w postaci stron i ramek - dla ka¿dej strony i ramki trzyma siê informacje o nich (zajmuj± kilka bajtów ) co w sumie daje poka¼n± ilo¶æ pamiêci.

Eliminowanie jednej z dwóch wy¿ej wymienionych wad powoduje narastanie drugiej. Zwiêkszenie sta³ej PAGE_SIZE spowodowa³oby mniejszy koszt urzymania pamiêci (mniejsza liczba ramek i stron) ale wiêksz± fragmentacjê zeenêtrzn±. Natomiast zmniejszenie tej sta³ej zniwelowa³oby efekt fragmentacji wewnêtrznej (mniejsze strony - mniej do zmarnowania ) ale zwiêkszy³oby siê koszty ( ro¶nie liczba stron i ramek).

Bibliografia

plik : page_alloc.c
plik : page.h
plik : memory.c
Maurice J. Bach "Budowa systemu operacyjnego UNIX"

Autor: Maciej Kwiatkowski