Есть ряд каверзных вопросов по Linux, которые вводят в ступор большинство начинающих системных администраторов Linux. Их очень любят задавать на собеседованиях бывалые админы, а в интернете про ответы на них не написал только ленивый. В топе уже наверно полтора десятилетия держится вопрос про удаление открытого файла в Linux. Тем не менее кандидаты все также из раза в раз продолжают делать круглые глаза. Максимум, что от них можно услышать – это “Иноды. Я слышал про иноды, но больше про них ничего не знаю”.
Чтобы раз и навсегда внести ясность в этот вопрос и была написана эта статья.
Содержание
Удаление открытого файла в Linux
Чтобы проверить как работает файловая система в Linux, проведем небольшой эксперимент.
Подготовка
Для проведения всех тестов нам необходима виртуальная машина с практически любым дистрибутивом Linux и дополнительный диск. Благо в век виртуализации это сделать проще простого. Для наглядности возьмем диск в пару гигабайт и заранее подготовим его (базовые операции с дисками рассмотрим в другой статье).
Представим, что вы впервые вошли по ssh на сервер, у вас рутовые права и ваша задача просто разобраться с дисковой подсистемой.
Свободное место и свободные иноды
Первое, что мы сделаем, это проверим диски всем знакомой командой df (лишние данные убраны из вывода):
1 2 3 |
# df -h Filesystem Size Used Avail Use% Mounted on /dev/mapper/test_disk_01-lv_test_01 1.5G 4.5M 1.4G 1% /mnt/data |
Утилита отображает занятое на файловой системе место в блоках 1К. Этой информации в большинстве случаев хватает лишь для констатации факта о % свободного места и не стоит на этом останавливать диагностику.
Проблемы с записью новых файлов может вызвать также нехватка инодов (inodes), поэтому полезно будет их проверить той же командой, но с другим ключом:
1 2 3 |
# df -i Filesystem Inodes IUsed IFree IUse% Mounted on /dev/mapper/test_disk_01-lv_test_01 98304 10 98294 1% /mnt/data |
Используется 1% места на разделе. Запоминаем вывод команд, он нам понадобится для последующего анализа.
Создание файлов на диске
Далее создадим один большой файл на нашем диске. Сделать это проще всего утилитой dd, которая поставляется по умолчанию вместе с системой (предварительно создадим пару каталогов):
1 2 |
cd /mnt/data && mkdir {big,small} dd if=/dev/zero of=big/file.img bs=1G count=1 |
И ещё создадим 10 маленьких файлов, но другим способом:
1 |
touch small/file{001..010}.img |
Теперь снова смотрим два вывода df:
1 2 3 |
# df -h Filesystem Size Used Avail Use% Mounted on /dev/mapper/test_disk_01-lv_test_01 1.5G 1.1G 359M 75% /mnt/data |
Как видно, теперь на диске занято 75%. А что с инодами?
1 2 3 |
# df -i Filesystem Inodes IUsed IFree IUse% Mounted on /dev/mapper/test_disk_01-lv_test_01 98304 23 98281 1% /mnt/data |
Количество инод изменилось на 13, хотя файлов мы создали всего 11.
Эксперимент с удалением открытого файла
Теперь посмотрим на ситуацию другой утилитой, которую также обязательно нужно использовать для диагностики. Речь о du:
1 2 3 4 |
# du -shc ./* 1.1G ./big 4.0K ./small 1.1G total |
Примерно занят 1ГБ.
Теперь сымитируем что-то похожее на блокировку файла (если будут предупреждения, соглашайтесь):
1 2 |
# less +F big/file.img >/dev/null & [2] 16483 |
Команда просто открывает файл на чтение и отправляет задание в бэкграунд. Теперь удаляем файл:
1 |
rm -f big/file.img |
После этого проверяем свободно место:
1 2 3 |
# df -h Filesystem Size Used Avail Use% Mounted on /dev/mapper/test_disk_01-lv_test_01 1.5G 1.1G 359M 75% /mnt/data |
И свободные иноды:
1 2 3 |
# df -i Filesystem Inodes IUsed IFree IUse% Mounted on /dev/mapper/test_disk_01-lv_test_01 98304 23 98281 1% /mnt/data |
В итоге место не освободилось, хотя файл, казалось бы, удален. Инодов используется столько же. Но может быть du покажет нам что-то другое:
1 2 3 4 |
# du -shc ./* 4.0K ./big 4.0K ./small 8.0K total |
Занято 8Кб. Ок, есть ещё одна утилита, которая лучше других объяснит что происходит, это lsof:
1 2 3 |
# lsof | grep deleted COMMAND PID TID USER FD TYPE DEVICE SIZE/OFF NODE NAME less 16483 root 3r REG 253,2 1073741824 11 /mnt/data/big/file.img (deleted) |
Мы посмотрели все, что хотели, можно заканчивать.
Завершение эксперимента
Сворачиваем наш эксперимент – убиваем процесс, который мы ранее запустили в фоновом режиме:
1 |
kill -9 16483 |
Теперь снова проверяем свободное место:
1 2 3 |
# df -h Filesystem Size Used Avail Use% Mounted on /dev/mapper/test_disk_01-lv_test_01 1.5G 4.5M 1.4G 1% /mnt/data |
А также иноды:
1 2 3 |
# df -i Filesystem Inodes IUsed IFree IUse% Mounted on /dev/mapper/test_disk_01-lv_test_01 98304 22 98282 1% /mnt/data |
Большой файл удалился, место и иноды освободились. Смысла проверять вывод du нет, она покажет то же самое, что и в предыдущий раз.
Выводы
Что все же произошло? А произошло следующее: информация от du и df до удаления большого файла была очевидной и объяснений не требует. За исключением одного момента – почему файлов создали 11, а количество инодов увеличилось на 13? Тут все просто. Наверно все слышали выражение, что все в линуксе – файл 1? И каталог тоже, а их мы создали два.
Далее мы удалили файл, который открыт на чтение другим процессом. Команда rm удалила ссылку на файл, которую хранит объект каталога, но не смогла удалить файл физически с диска, поскольку файл был открыт на чтение другой программой.
Хоть файл уже и не имел имени, но все ещё имел файловый дескриптор (= инод), к которому продолжала обращаться программа. Это было также хорошо заметно по выводу lsof – файл был помечен как удаленный. Как только программу остановили, файл освободился и система смогла завершить начатое – удалить файл и зависимые структуры данных на диске окончательно.
В показаниях утилиты du также нет ничего странного, ведь она считывает все перечисленные имена файлов в каталоге и оценивает их размер. Поскольку ссылку на имя большого файла удалили, du не смогла оценить его объем, зато это смогла сделать df, ведь она оценивает реальный занятый объем на диске в блоках без привязки к именам. Вот весь секрет.
Успехов и удачи при работе с Linux! А подготовиться к собеседованиям могу помочь я.