Все адресное пространство составляет порядка 1340 Кбайт, но только 40 Кбайт из них имеют право на запись и соответствуют частному отображению. Если область памяти является совместно используемой и не имеет прав на запись, то ядро хранит в памяти всего одну копию отображаемого файла. Это может показаться обычным для совместно используемых отображений; однако, случай, когда при этом еще и отсутствуют права на запись, проявляется несколько неожиданно. Если учесть факт, что когда на отображение нет прав записи, то соответствующая информация никогда не может быть изменена (из отображения возможно только чтение), становится ясно, что можно совершенно безопасно загрузить выполняемый образ в память всего один раз. Поэтому динамически загружаемая библиотека функций языка С и занимает в памяти всего 1212 Кбайт, а не 1212 Кбайт, умноженное на количество процессов, которые эту библиотеку используют. В связи с этим, процесс, код и данные которого имеют объем порядка 1340 Кбайт, на самом деле занимает всего 40 Кбайт физической памяти. Экономия памяти из-за такого совместного использования получается существенной.
Обратите внимание на области памяти, которые не имеют отображаемого файла, находятся на устройстве с номерами 00:00
и номер файлового индекса для которых равен нулю. Это отображение страницы, заполненной нулями (zero page, пулевая страница). Если отобразить страницу, заполненную нулями, на область памяти, которая имеет права на запись, то побочным эффектом является инициализация всех переменных в нулевые значения. Это важно, поскольку в таком случае получается область памяти, заполненная нулями, которая нужна для сегмента bss.
Каждой области памяти, связанной с процессом, соответствует структура vm_area_struct
. Так как процесс не является потоком (thread), то для него существует отдельная структура min_struct
, на которую есть ссылка из структуры task_struct
.
Работа с областями памяти
Ядру часто необходимо определять, соответствует ли та или иная область памяти в адресном пространстве процесса заданному критерию, например, существует ли заданный адрес в области памяти. Эти операции являются основой работы функции mmap()
, которая будет рассмотрена в следующем разделе, и выполнять их приходится часто. Несколько полезных для этого функций объявлены в файле <linux/mm.h>
.
Функция find_vma()
Функция find_vma()
определена в файле mm/mmap.c
.
Эта функция позволяет найти в заданном адресном пространстве ту первую область памяти, для которой значение поля vm_end
больше заданного адреса addr
. Другими словами, эта функция позволяет найти первую область памяти, которая содержит адрес addr
или начинается с адреса, большего адреса addr
. Если такой области памяти не существует, то функция возвращает значение NULL
.
В противном случае возвращается указатель на соответствующую структуру vm_area_struct
. Обратите внимание, что найденная область VMA может начинаться с адреса, большего адреса addr
, и этот адрес не обязательно принадлежит найденной области памяти. Результат выполнения функции find_vma()
кэшируется в поле map_cache
дескриптора памяти. Поскольку очень велика вероятность того, что после одной операции с областью памяти последуют еще операции с ней же, то процент попаданий в кэш получается достаточно большим (на практике получаются значения порядка 30-40%). Проверка кэшированных результатов выполняется очень быстро. Если нужный адрес в кэше не найден, то выполняется поиск по всем областям памяти, связанным с заданным дескриптором. Этот поиск выполняется с помощью красно-черного дерева следующим образом.
struct vm_area_struct* find_vma(struct mm_struct *mm,
unsigned long addr) {
struct vm_area_struct *vma = NULL;
if (mm) {
vma = mm->mmap_cache;
if (!(vma && vma->vm_end > addr && vma->vm_start <= addr)) {
struct rb_node* rb_node;
rb_node = mm->mm_rb.rb_node;
vma = NULL;
while (rb_node) {
struct vm_area_struct* vma_tmp;
vma_tmp =
rb_entry(rb_node, struct vm_area_struct, vm_rb);
if (vma_tmp->vm_end > addr) {
vma = vma_tmp;
if (vma_tmp->vm_start <= addr)
break;
rb_node = rb_node->rb_left;
} else
rb_node = rb_node->rb_right;
}
if (vma)
mm->mmap_cache = vma;
}
}
return vma;
}
Вначале выполняется проверка поля vma_cache
на предмет того, содержит ли кэшированная область VMA необходимый адрес. Обратите внимание, что простая проверка того, является ли значение поля vm_end
большим addr
, не гарантирует что проверяемая область памяти является первой, в которой есть адреса, большие addr
. Поэтому, для того чтобы кэш в этой ситуации оказался полезным, проверяемый адрес должен принадлежать кэшированной области памяти. К счастью, это как раз и соответствует случаю выполнения последовательных операций с одной и той же областью VMA.
Если кэш не содержит нужную область VMA, то функция должна выполнять поиск по красно-черному дереву. Это выполняется путем проверки узлов дерева. Если значение поля vma_end
для области памяти текущего узла больше addr
, то текущим становится левый дочерний узел, в противном случае — правый. Функция завершает свою работу, как только находится область памяти, которая содержит адрес addr
. Если такая область VMA не найдена, то функция продолжает поиск по дереву и возвращает ту область памяти, которая начинается после адреса addr
. Если вообще не найдена ни одна область памяти, то возвращается значение NULL
.
Функция find_vma_prev()
Функция find_vma_prev()
работает аналогично функции find_vma()
, но дополнительно она еще возвращает последнюю область VMA, которая заканчивается перед адресом addr
. Эта функция также определена в файле mma/mmap.c
и объявлена в файле <linux/ram.h>
следующим образом.
struct vm_area_struct* find vma_prev(struct mm_struct *mm,
unsigned long addr, struct vm_area_struct **pprev);
Параметр pprev
после возвращения из функции содержит указатель на предыдущую область VMA.
Функция find_vma_intersection()
Функция find_vma_intersection()
возвращает первую область памяти, которая перекрывается с указанным интервалом адресов. Эта функция определена в файле <linux/mm.h>
следующим образом. Это функция с подстановкой тела.
static inline struct vm_area_struct* find_vma_intersection(
struct mm_struct *mm, unsigned long start_addr,
unsigned long end_addr) {
struct vm_area_struct *vma;
vma = find_vma(mm, start_addr);
if (vma && end_addr <= vma->vm_start)
vma = NULL;