/* * linux/mm/vmscan.c * * Copyright (C) 1991, 1992, 1993, 1994 Linus Torvalds * * Swap reorganised 29.12.95, Stephen Tweedie. * kswapd added: 7.1.96 sct * Version: $Id: vmscan.c,v 1.4.2.2 1996/01/20 18:22:47 linux Exp $ */ #include <linux/mm.h> #include <linux/sched.h> #include <linux/head.h> #include <linux/kernel.h> #include <linux/kernel_stat.h> #include <linux/errno.h> #include <linux/string.h> #include <linux/stat.h> #include <linux/swap.h> #include <linux/fs.h> #include <linux/swapctl.h> #include <linux/pagemap.h> #include <linux/smp_lock.h> #include <asm/dma.h> #include <asm/system.h> /* for cli()/sti() */ #include <asm/segment.h> /* for memcpy_to/fromfs */ #include <asm/bitops.h> #include <asm/pgtable.h> /* * To check memory consuming code elsewhere set this to 1 */ /* #define MM_DEBUG */ /* * When are we next due for a page scan? */ static int next_swap_jiffies = 0; /* * Was the last kswapd wakeup caused by * nr_free_pages < free_pages_low */ static int last_wakeup_low = 0; /* * How often do we do a pageout scan during normal conditions? * Default is four times a second. */ int swapout_interval = HZ / 4; /* * The wait queue for waking up the pageout daemon: */ static struct wait_queue * kswapd_wait = NULL; /* * We avoid doing a reschedule if the pageout daemon is already awake; */ static int kswapd_awake = 0; /* * sysctl-modifiable parameters to control the aggressiveness of the * page-searching within the kswapd page recovery daemon. */ kswapd_control_t kswapd_ctl = {4, -1, -1, -1, -1}; static void init_swap_timer(void); /* * The swap-out functions return 1 if they successfully * threw something out, and we got a free page. It returns * zero if it couldn't do anything, and any other value * indicates it decreased rss, but the page was shared. * * NOTE! If it sleeps, it *must* return 1 to make sure we * don't continue with the swap-out. Otherwise we may be * using a process that no longer actually exists (it might * have died while we slept). */ static inline int try_to_swap_out(struct task_struct * tsk, struct vm_area_struct* vma, unsigned long address, pte_t * page_table, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcią dzieloną używaną przez proces *tsk, mieszczącą się w obszarze wirtualnej pamięci vma w tablicy stron w miejscu page_table. argumenty: tsk - proces, któremu chcemy zwolnić ramkę vma - blok pamięci, z którego chcemy zwolnić ramkę address - adres ramki page_table - adres adresu ramki (wraz z bitami stanu) dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nią poczekać can_do_io - czy w celu zwolnienia ramki możemy wykonać operacje IO */ { pte_t pte; unsigned long entry; unsigned long page; struct page * page_map; /* pte jest adresem ramki wraz z bitami stanu */ pte = *page_table; /* jeśli strony nie ma w pamięci, to zwracamy 0 */ if (!pte_present(pte)) return 0; /* page jest adresem ramki (bez bitów stanu) */ page = pte_page(pte); /* jeśli numer ramki przekracza rozmiar tablicy ramek, to coś jest źle */ if (MAP_NR(page) >= MAP_NR(high_memory)) return 0; /* page_map jest tablicą ramek od miejsca, w którym jest ramka page (innymi słowy jest adresem struktury page z informacjami o ramce */ page_map = mem_map + MAP_NR(page); if (PageReserved(page_map) /* do ramki nie może być żadnych odwołań */ || PageLocked(page_map) /* ramka jest zablokowana, tj. nie zakończyła się jeszcze operacja wymiany dla tej ramki */ || (dma && !PageDMA(page_map))) /* ramka ma być przesyłana przez dma, ale nie leży ona w zasięgu mechanizmu transferu kanałami dma */ return 0; /* Deal with page aging. Pages age from being unused; they * rejuvenate on being accessed. Only swap old pages (age==0 * is oldest). */ if ((pte_dirty(pte) /* bylo odwolanie do strony */ && delete_from_swap_cache(MAP_NR(page))) /* strona była w swap_cache (jednocześnie usuwamy ją ze swap_cache) */ || pte_young(pte)) /* jest 'mloda' */ { /* odznaczamy w tablicy stron, że było odwołanie do tej strony */ set_pte(page_table, pte_mkold(pte)); /* odmładzamy stronę */ touch_page(page_map); return 0; } /* postarzamy stronę */ age_page(page_map); /* jeśli strona nie jest jeszcze stara (0 oznacza najstarszy wiek strony) */ if (page_map->age) return 0; /* jeśli dane w ramce uległy zmianie */ if (pte_dirty(pte)) { if(!can_do_io) /* jeśli dane w ramce uległy zmianie i nie możemy wykonać operacji IO, to nie ma możliwości zwolnienia tej ramki */ return 0; if (vma->vm_ops && vma->vm_ops->swapout) /* jeśli blok pamięci wirtualnej w którym leży ta strona ma określoną operację swapout (jest tak wiw gdy strona pochodzi z mapowania plików) */ { pid_t pid = tsk->pid; /* liczba stron rezydujących w pamięci dla naszego procesu zmniejsza się o 1 */ vma->vm_mm->rss--; /* jeśli nie udało nam się wymieść strony, to wysyłamy do procesu, którego stronę wymiatamy sygnał SIGBUS */ if (vma->vm_ops->swapout(vma, address - vma->vm_start + vma->vm_offset, page_table)) kill_proc(pid, SIGBUS, 1); } else { /* nie mamy określonej operacji swapout */ /* jeśli licznik odwołań do ramki >1, to nie możemy zwolnić ramki */ if (page_map->count != 1) return 0; /* jeśli nie możemy dostać bloku z żadnego z urządzeń wymiany (np. mie ma już miejsca), to nie możemy wymieść strony */ if (!(entry = get_swap_page())) return 0; /* liczba stron rezydujących w pamięci dla naszego procesu zmniejsza się o 1 */ vma->vm_mm->rss--; /* flush_cache_page nie robi nic !!! (zdefiniowane jako do {} while(0)) */ flush_cache_page(vma, address); /* w tablicy stron w miejsce numeru ramki wstawiamy klucz identyfikujący stronę na urządzeniu wymiany */ set_pte(page_table, __pte(entry)); /* jeśli wymiatamy stronę aktualnie wykonywanego procesu, to musimy dać znać systemowi, że zmieniła się tablica stron (system ma pewnego rodzaju pamięć podręczną na tablicę stron aktualnie wykonywanego procesu) */ flush_tlb_page(vma, address); /* liczba wymiecionych stron naszego procesu zwiększa się o 1 */ tsk->nswap++; /* zapisujemy stronę na dysku */ rw_swap_page(WRITE, entry, (char *) page, wait); } /* odznaczamy ramkę, jako wolną (i ewentualnie kasujemy ją ze swap_cache) */ free_page(page); return 1; /* we slept: the process may not exist any more */ } if ((entry = find_in_swap_cache(MAP_NR(page)))) /* strona nie była zmieniana i jest w swap_cache => nie musimy jej zapisywać - wystarczy tylko odznaczyć w tablicy stron miejsce, w którym jest na urządzeniu wymiany */ { if (page_map->count != 1) { set_pte(page_table, pte_mkdirty(pte)); printk("Aiee.. duplicated cached swap-cache entry\n"); return 0; } /* liczba stron rezydujących w pamięci dla naszego procesu zmniejsza się o 1 */ vma->vm_mm->rss--; /* flush_cache page nie robi nic !!! (zdefiniowane jako do {} while(0)) */ flush_cache_page(vma, address); /* w tablicy stron w miejsce adresu wstawiamy entry - klucz identyfikujący urządzenie wymiany i miejsce na urządzeniu wymiany w którym nagrana jest strona (entry zawiera również informacje pozwaląjace odróżnić entry od adresu ramki */ set_pte(page_table, __pte(entry)); /* jeśli wymiatamy stronę aktualnie wykonywanego procesu, to musimy dać znać systemowi, że zmieniła się tablica stron (system ma pewnego rodzaju pamięć podręczną na tablicę stron aktualnie wykonywanego procesu) */ flush_tlb_page(vma, address); /* odznaczamy, że ramka jest wolna */ free_page(page); return 1; } /* w tym miejscu mamy pewność, że strona jest albo z mapowania plikow, albo jest stroną czystą */ /* liczba stron rezydujących w pamięci dla naszego procesu zmniejsza się o 1 */ vma->vm_mm->rss--; /* flush_cache page nie robi nic !!! (zdefiniowane jako do {} while(0)) */ flush_cache_page(vma, address); /* w tablicy stron odznaczamy, że strony nie ma ani w pamięci, ani na dysku */ pte_clear(page_table); /* jeśli wymiatamy stronę aktualnie wykonywanego procesu, to musimy dać znać systemowi, że zmieniła się tablica stron (system ma pewnego rodzaju pamięć podręczną na tablicę stron aktualnie wykonywanego procesu) */ flush_tlb_page(vma, address); /* jeśli jest to ramka ze stroną z mapowania plików, to usuwamy ją z odpowiednich struktur do mapowania plików i zwalniamy ją */ entry = page_unuse(page); /* zwalniamy ramkę (zauważmy, że jeśli jest to ramka ze stroną z mapowania plików, to robimy to po raz drugi !!!), nie możemy jednak nie zrobić free_page, bo być może jest to ramka ze stroną nigdy nie używaną (wtedy page_unuse nie wykona free_page); nie prowadzi to do błędu, bo zwalnianie ramki we free_page polega tylko na zapisaniu niektórych bitow */ free_page(page); return entry; } /* * A new implementation of swap_out(). We do not swap complete processes, * but only a small number of blocks, before we continue with the next * process. The number of blocks actually swapped is determined on the * number of page faults, that this process actually had in the last time, * so we won't swap heavily used processes all the time ... * * Note: the priority argument is a hint on much CPU to waste with the * swap block search, not a hint, of how much blocks to swap with * each process. * * (C) 1993 Kai Petzke, wpp@marie.physik.tu-berlin.de */ static inline int swap_out_pmd(struct task_struct * tsk, struct vm_area_struct * vma, pmd_t *dir, unsigned long address, unsigned long end, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcią dzieloną używaną przez proces *tsk, mieszczącą się w obszarze wirtualnej pamięci vma w katalogu tablic stron pgd. argumenty: tsk - proces, któremu chcemy zwolnić ramkę vma - blok pamięci, z którego chcemy wymieść stronę dir - adres adresu tablicy stron start - adres, od którego zaczynamy wymiatać end - adres, na którym kończymy próby wymiatania dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nią poczekać can_do_io - czy w celu zwolnienia ramki możemy wykonać operacje IO */ { pte_t * pte; unsigned long pmd_end; /* sprawdzamy, czy tablica stron istnieje */ if (pmd_none(*dir)) return 0; /* sprawdzamy, czy tablica stron jest poprawna */ if (pmd_bad(*dir)) { printk("swap_out_pmd: bad pmd (%08lx)\n", pmd_val(*dir)); pmd_clear(dir); return 0; } /* wyznaczamy adres tablicy stron od miejsca, ktore obsługuje nasz adres */ pte = pte_offset(dir, address); /* wyznaczamy końcowy adres, który obsługuje nasza tablica stron */ pmd_end = (address + PMD_SIZE) & PMD_MASK; /* ustawiamy adres końcowy prób zwalniania ramki tak, aby nie przekraczał adresu obsługiwanego przez naszą tablicę stron */ if (end > pmd_end) end = pmd_end; do { int result; /* aktualizujemy adres, od którego będziemy szukali następnym razem */ tsk->swap_address = address + PAGE_SIZE; /* próbujemy zwolnić ramkę o adresie (wraz z bitami) *pte */ result = try_to_swap_out(tsk, vma, address, pte, dma, wait, can_do_io); if (result) return result; /* ustawiamy adres tak, aby był na następnej stronie */ address += PAGE_SIZE; /* przeskakujemy do następnej pozycji tablicy stron */ pte++; } while (address < end); return 0; } static inline int swap_out_pgd(struct task_struct * tsk, struct vm_area_struct * vma, pgd_t *dir, unsigned long address, unsigned long end, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcią dzieloną używaną przez proces *tsk, mieszczącą się w obszarze wirtualnej pamięci vma w katalogu tablic stron dir. argumenty: tsk - proces, któremu chcemy zwolnić ramkę vma - blok pamięci, z którego chcemy zwolnić ramkę dir - adres adresu katalogu tablic stron drugiego poziomu start - adres, od którego zaczynamy wymiatać end - adres, na którym kończymy próby wymiatania dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nią poczekać can_do_io - czy w celu zwolnienia ramki możemy wykonać operacje IO */ { pmd_t * pmd; unsigned long pgd_end; /* sprawdzamy, czy katalog tablic stron drugiego poziomu istnieje (na intelu zawsze udaje, że istnieje) */ if (pgd_none(*dir)) return 0; /* sprawdzamy, czy katalog tablic stron drugiego poziomu jest poprawny (na intelu zawsze udaje, że jest poprawny */ if (pgd_bad(*dir)) { printk("swap_out_pgd: bad pgd (%08lx)\n", pgd_val(*dir)); pgd_clear(dir); return 0; } /* pobieramy adres katalogu tablic stron drugiego poziomu od miejsca, które obsługuje nasz adres */ pmd = pmd_offset(dir, address); /* wyznaczamy końcowy adres, który obsługuje nasz katalog tablic stron drugiego poziomu */ pgd_end = (address + PGDIR_SIZE) & PGDIR_MASK; /* ustawiamy adres końcowy prób zwalniania ramki tak, aby nie przekraczał adresu obsługiwanego przez nasz katalog tablic stron drugiego poziomu */ if (end > pgd_end) end = pgd_end; do { /* próbujemy zwolnić ramkę z konkretnego katalogu tablic stron drugiego poziomu; na intelu jest tylko jednoelementowa (a i to udawana) tablica katalogów tablic stron drugiego poziomu, więc pętla kręci się tylko raz */ int result = swap_out_pmd(tsk, vma, pmd, address, end, dma, wait, can_do_io); if (result) return result; address = (address + PMD_SIZE) & PMD_MASK; pmd++; } while (address < end); return 0; } static int swap_out_vma(struct task_struct * tsk, struct vm_area_struct * vma, pgd_t *pgdir, unsigned long start, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcią dzieloną używaną przez proces *tsk, mieszczącą się w obszarze wirtualnej pamięci vma. argumenty: tsk - proces, któremu chcemy zwolnić ramkę vma - blok pamięci, z którego chcemy zwolnić ramkę pgdir - katalog tablic stron pierwszego poziomu (w innej systematyce tablica stron trzeciego poziomu) od adresu start start - adres, od którego zaczynamy wymiatać (zakładamy, że leży pomiędzy vma->start i vma->end) dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nią poczekać can_do_io - czy w celu zwolnienia ramki możemy wykonać operacje IO */ { unsigned long end; /* Don't swap out areas like shared memory which have their own separate swapping mechanism or areas which are locked down */ /* nie wymiatamy stron z obszarów będących pamięcią dzieloną, lub których nie możemy wymiatać; zauważmy, że strony, które są z mapowania plików mogą być wymiatane w ten sposób */ if (vma->vm_flags & (VM_SHM | VM_LOCKED)) return 0; end = vma->vm_end; while (start < end) /* dopóki nie przejrzeliśmy calego vma */ { /* próbujemy wymieść stronę z katalogu tablic stron drugiego poziomu znajdującego się w *pgdir */ int result = swap_out_pgd(tsk, vma, pgdir, start, end, dma, wait, can_do_io); if (result) return result; /* przesuwamy adres startowy w miejsce, od którego adresy obsługuje następny katalog stron drugiego poziomu */ start = (start + PGDIR_SIZE) & PGDIR_MASK; /* będziemy brali pod uwagę następne pole katalogu stron pierwszego poziomu, czyli następny katalog stron drugiego poziomu */ pgdir++; } return 0; } static int swap_out_process(struct task_struct * p, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcia dzielona używaną przez proces *p. argumenty: p - proces, któremu chcemy zwolnić ramkę dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nia poczekać can_do_io - czy w celu zwolnienia ramki możemy wykonać operacje IO */ { unsigned long address; struct vm_area_struct* vma; /* * Go through process' page directory. */ /* rozpoczynamy zwalnianie od miejsca, gdzie ostatnio skończyliśmy */ address = p->swap_address; /* jeżeli gdzieś nagle skończymy działanie tej funkcji, to przy następnym wywołaniu dla tego procesu rozpoczniemy zwalnianie od adresu 0 */ p->swap_address = 0; /* * Find the proper vm-area */ /* znajdujemy pierwszy (w kolejności względem startu segmentów) blok ciągłej pamięci, którego koniec jest większy od adresu, przy którym zakończyliśmy przeszukiwanie ostatnim razem */ vma = find_vma(p->mm, address); if (!vma) return 0; /* być może nasz adres nie leży w żadnym z obszarów adresowych przyłączonych do procesu (np. startujemy od 0 lub odłaczyliśmy ostatnio jakiś obszar w programie) */ if (address < vma->vm_start) address = vma->vm_start; for (;;) { /* próbujemy wymieść stronę z aktualnego vma */ int result = swap_out_vma(p, vma, pgd_offset(p->mm, address), address, dma, wait, can_do_io); if (result) return result; vma = vma->vm_next; if (!vma) break; address = vma->vm_start; } p->swap_address = 0; return 0; } static int swap_out(unsigned int priority, int dma, int wait, int can_do_io) /* Funkcja próbująca zwolnić jedną ramkę z pamięci nie będącej pamięcią dzieloną. argumenty: priority - priorytet z jakim chcemy zwolnić ramkę dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy wolnej ramki, że aż chcemy na nią poczekać */ { static int swap_task; /* numer zadania, które ostatnio przeglądaliśmy */ int loop, /* czy już przebiegliśmy przez koniec tablicy z zadaniami */ counter, /* liczba procesów, które można wymienić i ktore mają jakieś strony w pamięci (niekoniecznie tylko różne od pamięci dzielonej i mapowania plików), które będziemy przeglądali w celu zwolnienia ramki */ shfrv; /* zmienna pomagająca przy ustalaniu counter'a */ struct task_struct *p; #ifdef MM_DEBUG shfrv = 10; #else /* * Trouble due ageing pages: In some situations it is possible that we cross only tasks * which are swapped out or which have only physical pages with age >= 3. * High values of swap_cnt for memory consuming tasks do aggravate such situations. * * If PAGEOUT_WEIGHT has a value of 8192 a right shift value of 10 leads to * (8 * nr_tasks) >> priority * Together with a high number of tasks, say 100, we have counters (due priority) * 12(6) + 25(5) + 50(4) + 100(3) + 200(2) + 400(1) + 800(0) * and as total result 1587 scans of swap_out() to swap out a task page. * * Just assume 80 tasks are swapped out and the remaining tasks have a swap_cnt value >= 40 * together with pages with age >= 3. Then we need approx 20*40*2 = 1600 scans to get a * free page. * And now assume that the amount of cached pages, buffers, and ipc pages are really low. */ switch (priority) /* w zależności od priorytetu ustalamy o ile bitów w prawo przesuwamy counter - patrz wyżej */ { case 6: case 5: case 4: /* be friendly */ shfrv = 10; break; case 3: case 2: case 1: /* more intensive */ shfrv = 9; break; case 0: default: /* sorry we need a page */ shfrv = 8; break; } #endif counter = ((PAGEOUT_WEIGHT * nr_tasks) >> shfrv) >> priority; for(; counter >= 0; counter--) { /* * Check that swap_task is suitable for swapping. If not, look for * the next suitable process. */ loop = 0; while(1) /* kręcimy się, aż znajdziemy proces nadający się do wymiany, lub aż przejrzymy wszystkie procesy */ { if (swap_task >= NR_TASKS) { /* skaczemy do początku tablicy procesów (omijając proces init) */ swap_task = 1; if (loop) /* all processes are unswappable or already swapped out */ return 0; loop = 1; } p = task[swap_task]; if (p && p->swappable && p->mm->rss) /* znaleźliśmy proces nadający się do wymiany mający jeszcze ramki rezydujące w pamięci */ break; swap_task++; } /* * Determine the number of pages to swap from this process. */ if (!p->swap_cnt) { /* * Normalise the number of pages swapped by * multiplying by (RSS / 1MB) */ p->swap_cnt = AGE_CLUSTER_SIZE(p->mm->rss); } if (!--p->swap_cnt) /* jeżeli liczba stron do wymiany w tym procesie == 1, to w następnym obiegu badamy następny proces - unikamy tym samym ponownego wyznaczania liczby stron do wymiany w tym procesie w tej turze */ swap_task++; switch (swap_out_process(p, dma, wait, can_do_io)) { case 0: if (p->state == TASK_STOPPED) /* Stopped task occupy nonused ram */ /* Nie udało się zwolnić ramki, ale proces jest wstrzymany - ma priorytet przy usuwaniu stron. Następnym razem będziemy próbowac zwalniać ramki tego procesu */ break; if (p->swap_cnt) swap_task++; break; case 1: /* OK - udalo się zwolnić ramkę */ return 1; default: /* Nie udało się zwolnić ramki, ale wynik rokuje nadzieje na to, że w następnej turze uda się zwolnić ramkę - następnym razem sprawdzamy ten sam proces */ break; } } #ifdef MM_DEBUG if (!priority) { printk("swap_out: physical ram %6dkB, min pages %6dkB\n", (int)(high_memory>>10), min_free_pages<<(PAGE_SHIFT-10)); printk("swap_out: free pages %6dkB, async pages %6dkB\n", nr_free_pages<<(PAGE_SHIFT-10), nr_async_pages<<(PAGE_SHIFT-10)); } #endif return 0; } /* * We are much more aggressive about trying to swap out than we used * to be. This works out OK, because we now do proper aging on page * contents. */ int try_to_free_page(int priority, int dma, int wait) /* Funkcja próbująca zwolnić jedną ramkę. argumenty: priority - priorytet dma - czy mamy przesyłać stronę przez dma wait - czy tak bardzo potrzebujemy ramki, że aż chcemy na nią poczekać */ { /* zmienna statyczna przechowująca informację o tym, jaki rodzaj pamięci ostatnio zwalniano (pamięć używaną na stronicowanie plikow, pamięć dzieloną, czy pozostałą pamięć używaną przez procesy */ static int state = 0; /* aktualny priorytet zwalniania, a jednocześnie licznik w pętli zwalniającej krecącej się od i do stop w dół */ int i=6; /* zmienna określająca dolny próg kręcenia się pętli zwalniającej */ int stop, /* zmienna określająca, czy możemy wykonać operację IO, aby zwolnić ramkę */ can_do_io; /* we don't try as hard if we're not waiting.. */ /* standardowo pętla zwalniająca ramki kończy się na priorytecie 3 */ stop = 3; /* standardowo możemy wykonywać operacje IO, aby zwolnić ramkę */ can_do_io = 1; /* jeżeli możemy czekać na zwolnienie ramki, to pętla zwalniająca kończy się na priorytecie 0 (o ile nie uda nam się zwolnić wcześniej) */ if (wait) stop = 0; /* jeżeli ramka jest potrzebna dla wykonania operacji IO, to musimy zwolnić taką ramkę, która do zwolnienia nie będzie wymagała wykonania operacji IO, bo wpadniemy w blokade */ if (priority == GFP_IO) can_do_io = 0; switch (state) /* w zależności od tego, jaki rodzaj pamięci ostatnio zwalnialiśmy rozpoczynamy zwalnianie od niej, lub od następnego rodzaju pamięci, jeśli nie udało nam się zwolnić tego rodzaju pamięci poprzednim razem */ { do { case 0: /* zwalniamy ramkę używaną do mapowania plików */ if (shrink_mmap(i, dma, can_do_io)) return 1; state = 1; case 1: /* zwalniamy ramkę używaną na pamięć dzieloną; nie ma innej możliwości zwolnienia ramki używanej na pamięć dzieloną, niż jej zapisanie, dlatego musimy mieć możliwość wykoniania operacji IO */ if (can_do_io && shm_swap(i, dma)) return 1; state = 2; default: /* zwalniamy ramkę używaną przez proces, nie będąca pamięcią dzieloną; ramki używane do mapowania plików mogą być zwalniane w ten sposób */ if (swap_out(i, dma, wait, can_do_io)) return 1; state = 0; i--; } while ((i - stop) >= 0); } return 0; } /* * Before we start the kernel thread, print out the * kswapd initialization message (otherwise the init message * may be printed in the middle of another driver's init * message). It looks very bad when that happens. */ void kswapd_setup(void) { int i; char *revision="$Revision: 1.4.2.2 $", *s, *e; if ((s = strchr(revision, ':')) && (e = strchr(s, '$'))) s++, i = e - s; else s = revision, i = -1; printk ("Starting kswapd v%.*s\n", i, s); } /* * The background pageout daemon. * Started as a kernel thread from the init process. */ int kswapd(void *unused) // demon wymiany { int i, j; /* current jest aktualnie działającym procesem (procesem demona wymiany */ current->session = 1; current->pgrp = 1; /* grupą demona jest grupa nr. 1 */ sprintf(current->comm, "kswapd"); current->blocked = ~0UL; /* * As a kernel thread we want to tamper with system buffers * and other internals and thus be subject to the SMP locking * rules. (On a uniprocessor box this does nothing). */ #ifdef __SMP__ lock_kernel(); syscall_count++; #endif /* Give kswapd a realtime priority. */ /* wyznaczamy sposób kolejkowania zadania demona wymiany */ current->policy = SCHED_FIFO; current->priority = 32; /* Fixme --- we need to standardise our namings for POSIX.4 realtime scheduling priorities. */ /* inicjalizacja danych zegara demona wymiany */ init_swap_timer(); while (1) { /* low on memory, we need to start swapping soon */ /* w zależności od tego, czy budzenie demona odbyło się z powodu spadku liczby wolnych ramek poniżej free_pages_low, czy nie ustalamy czas, po którym nie będziemy sie wahać, czy wymieniać strony */ next_swap_jiffies = jiffies + (last_wakeup_low ? swapout_interval >> 1 : swapout_interval); /* odznaczamy demon jako nieaktywny po to, aby pokazać, że wymaga on budzenia i ponownego szeregowania (ta zmienna jest używana w funkcji swap_tick), która co pewien czas budzi kswapd */ kswapd_awake = 0; current->signal = 0; /* wykonaj dolne połówki obsługi przerwań zwiazane z dyskiem, tzn. wykonaj zawieszone drugie części nie dokończonych funkcji obsługi przerwań działających na dysku (po to, aby wymiana była w miarę aktualna) */ run_task_queue(&tq_disk); /* czekamy na budzenie od jądra lub od zegara */ interruptible_sleep_on(&kswapd_wait); /* odznaczamy demon jako aktywny */ kswapd_awake = 1; /* zwiekszamy zmienną statystyczna mowiącą o ilości zbudzeń demona */ swapstats.wakeups++; /* Protect our reserved pages: */ /* jeżeli liczba wolnych ramek spadła poniżej min_free pages lub (jeśli min_free_pages >=48) poniżej min_free_pages-12, to wyznaczamy o ile ramek więcej niż normalnie (tj. kswapd_ctl.maxpages) będziemy próbować zwolnić */ i = 0; j = (min_free_pages >= 48 ? min_free_pages-12 : min_free_pages); if (nr_free_pages <= j) i = (1+j) - nr_free_pages; /* Do the background pageout: */ for (i += kswapd_ctl.maxpages; i > 0; i--) /* próbujemy zwolnić ramkę z poziomu jądra (pierwszy parametr GFP_KERNEL); bez dma (drugi parametr); czekając wtw, gdy liczba wolnych ramek spadła poniżej min_free_pages (lub min_free_pages-12), gdy min_free_pages >= 48 */ try_to_free_page(GFP_KERNEL, 0, (nr_free_pages <= j)); } } /* * The swap_tick function gets called on every clock tick. */ void swap_tick(void) /* Funkcja wołana przy każdym tyknięciu zegara demona wymiany - decydyje o tym, czy zbudzić demona wymiany, czy też nie. */ { int want_wakeup = 0; /* czy chcemy zbudzić demona */ if ((nr_free_pages + nr_async_pages) < free_pages_low) /* jeżeli liczba wolnych ramek wliczając w to ramki po stronach, które są aktualnie asynchronicznie przesyłane na dysk (nie są jeszcze ani wolne, ani odznaczone jako wolne, ale zaraz będą wolne i odznaczone jako wolne) spada poniżej free_pages_low */ { if (last_wakeup_low) /* jeśli ostatnie budzenie było ponieważ nr_free pages <free_pages_low, to czy chcemy budzić demona zależy od tego, czy minął czas wahania (określany w demonie kswapd) na wymianę */ want_wakeup = (jiffies >= next_swap_jiffies); else last_wakeup_low = want_wakeup = 1; } else if (((nr_free_pages + nr_async_pages) < free_pages_high) && (jiffies >= next_swap_jiffies)) { /* jeżeli liczba wolnych ramek wlicząjac w to ramki po stronach które są aktualnie asynchronicznie przesyłane na dysk (nie są jeszcze ani wolne, ani odznaczone jako wolne, ale zaraz będą wolne i odznaczone jako wolne) spada poniżej free_pages_high i jednocześnie minął czas wahania (określany w demonie kswapd) czy wymiatać strony, to odznaczamy w want_wakeup, że chcemy wymieniać */ last_wakeup_low = 0; want_wakeup = 1; } if (want_wakeup) /* jeśli chcemy wymiatać strony */ { if (!kswapd_awake && kswapd_ctl.maxpages > 0) /* jeśli nie działa w tej chwili demon wymiany i demon ma uprawnienia do wymiany (dokładniej kswapd_ctl.maxpages określa nam ile maksymalnie ramek ma prawo demon zwolnić za jednym uruchomieniem, z wyłączeniem sytuacji, gdy ilość wolnych ramek spada poniżej min_free_pages)*/ { wake_up(&kswapd_wait); /* budzimy demona */ need_resched = 1; /* odznaczamy, że chcemy dokonać ponownego szeregowania*/ } } timer_active |= (1<<SWAP_TIMER); } /* * Initialise the swap timer */ void init_swap_timer(void) /* Inicjalizujemy zegar budzący demona wymiany. */ { timer_table[SWAP_TIMER].expires = 0; timer_table[SWAP_TIMER].fn = swap_tick; timer_active |= (1<<SWAP_TIMER); }
Andrzej Kuczyński