Самоучитель
системного администратора

12. Плановые операции обслуживания

Обязанность контроля функционирования информационной системы влечет за собой выполнение ряда рутинных операций. Их состав специфичен для каждого предприятия. Однако я попытаюсь привести примерный шаблон, на основе которого может быть составлен конкретный план периодических мероприятий. Удобно, если этот план будет выполнен в виде соответствующего перечня, выполнение каждого пункта которого будет отмечаться в этом же документе.

    Примечание

    В данном плане приводятся только позиции, которые следует проверить администратору. Естественно, что обнаружение каких-либо ошибок предполагает соответствующие действия администратора по ликвидации проблемы.

Конечно, объем операций должен быть скорректирован с учетом размера организации, наличия и объема мониторинга и т. п.

Ежедневные операции

Ежедневные операции направлены, в первую очередь, на контроль текущего состояния информационной системы. Каждая позиция данного шаблона должна быть дополнена конкретными операциями проверки. Можно назвать следующие далее операции проверки.

Оценка внешнего состояния серверов и окружающей среды.

    Администратору необходимо оценить температуру вокруг серверов, проверить отсутствие внешних признаков вскрытия корпусов, состояние кабельной системы и т. д.

Проверка функционирования основных служб информационной системы.

    Администратор обязан проверить состояние всех основных служб системы: работоспособность канала Интернета, возможность приема и отправки сообщений электронной почты, отклики от информационного сервера Интернета предприятия и т. д. Объем подобных операций зависит от состава информационной системы.

Оценка показаний датчиков аппаратного контроля.

    Серверные платформы оснащены датчиками, позволяющими контролировать температурный режим внутри корпуса, параметры электропитания, частоту вращения вентиляторов, состояние RAID-контроллеров. Администратору необходимо убедиться, что соответствующие показания находятся в допустимых диапазонах.

Проверка результатов выполнения операций резервного копирования.

    Следует убедиться, что все операции резервного копирования завершились успешно и без каких-либо сообщений об ошибках. Особо хочется обратить внимание, что контролю подлежат все операции резервного копирования: выполняемые как системными средствами, так и внутренними операциями прикладного программного обеспечения.

Проверка результатов обновления антивирусных баз.

    Необходимо убедиться, что все работающие компьютеры (серверы и рабочие станции) имеют последнюю версию вирусных баз локального сервера, а этот сервер, в свою очередь, успешно обновлен из Сети.

Проверка результатов иных плановых операций в системе.

    В информационной системе могут существовать иные операции, выполняемые по специальным графикам. Например, мероприятия по оптимизации баз данных SQL-сервера, формирование отчетов статистики использования Интернета и т. п. Администратору следует проверить итоги выполнения таких операций.

Проверка содержимого протоколов работы серверов.

    Администратор должен просмотреть и проанализировать протоколы работы всех серверов информационной системы, в первую очередь обращая внимание на протоколы системы безопасности и на сообщения об ошибках или предупреждения. Следует отметить, что и чисто информационные сообщения могут существенно помочь опытному администратору в предупреждении аварии.

Проверка доступного объема жестких дисков.

    Необходимо проверить наличие на основных производственных серверах достаточного свободного объема дискового пространства, которое позволит продолжить нормальное выполнение бизнес-операций. Это требование относится к тем серверам, объем информации на которых может меняться. Например, почтовый сервер (прием большого числа сообщений), файловый сервер (пользователи перенесли на него существенный объем данных), сервер баз данных (разработчики изменили структуру информации, вследствие чего размер баз существенно вырос) и т. п. Естественно, что для серверов, выполняющих такие функции, как маршрутизация сетей и т. п., данный контроль не актуален.

Проверка работы служб систем.

    Администратор должен проверить, что все автоматически запускаемые службы всех серверов информационной системы находятся в состоянии "работает". Конечно, существуют службы, которые автоматически запускаются и впоследствии останавливаются. Но я на этом не буду заострять ваше внимание.

Еженедельные операции

В следующей далее группе еженедельных операций представлены задачи, которые администратор должен выполнять несколько раз в месяц. Конкретная периодичность — раз в неделю или раз в две недели — должна быть определена в зависимости от специфики информационной системы.

Формирование отчета.

    Хотя это чисто организационное предложение, наличие периодического отчета системного администратора, с одной стороны, стимулирует самого администратора, с другой — позволяет держать руководителя в курсе состояния информационной системы.

Очистка фильтров вентиляторов охлаждения.

    Практика показывает, что в условиях обычного учреждения воздушные фильтры "забиваются" уже через одну-две недели. В связи с этим следует еженедельно очищать фильтрующие элементы как всего помещения, так и на корпусах оборудования (конечно, если соответствующие фильтры предусмотрены).

Проверка производительности серверов.

    Администратору необходимо проверить параметры производительности серверов системы и проанализировать их изменения по сравнению с прошлыми периодами. В случае снижения параметров — принять меры по поддержанию необходимого уровня обслуживания пользователей.

Плановые операции другой периодичности

Администратору не следует забывать и о тех работах, выполнять которые ему приходится достаточно редко. Следующие далее работы можно запланировать, например, в квартальном или полугодовом планах.

Установка обновлений.

    Администратор должен периодически проверить наличие обновлений для всего программного обеспечения, используемого в организации. Даже если в организации реализована система текущего обновления безопасности, необходимо убедиться в отсутствии обновлений, которые не охватываются ею.

Удаление устаревших объектов службы каталогов.

    Часто создание и удаление учетных записей пользователей отстает от фактического кадрового состава предприятия, состав компьютеров, перечисленных в службе каталогов, не соответствует реальности. Имеет смысл периодически удалять устаревшие объекты из службы каталогов, хотя бы на основе времени, прошедшего с момента последнего входа соответствующей учетной записи в домен.

Очистка оборудования от пыли.

    Обычно данную операцию совмещают с проведением на оборудовании тех или иных работ, поскольку при этом обычно предполагается отключение электропитания. Периодичность работ определяется качеством окружающей среды, и при отсутствии специальных мер по фильтрации воздуха данная операция должна выполняться не реже одного раза в три—пять месяцев.

Тренировки полного восстановления системы.

    Крайне важно, чтобы специалист мог оперативно выполнить комплекс работ по полному восстановлению информационной системы после аварийной ситуации. Поэтому в организации должны быть запланированы работы по восстановлению тестовой системы на основе тех резервных копий, которые создаются в плановом порядке.

Корректировка руководящей документации.

    Целесообразно раз в год приводить в порядок документацию: актуализировать схемы сетей, отражать выполненные ремонты и т. п. Следует пересмотреть руководящие документы организации, касающиеся ИТ-технологии, внести в них необходимые изменения, учитывающие состояние дел, утвердить и опубликовать на внутренних ресурсах для ознакомления пользователей.

Планирование развития.

    По итогам загруженности информационной системы за некоторый период администратор может предположить о дополнительных ресурсах, которые могут потребоваться для дальнейшего нормального функционирования системы (например, приобретение дополнительного жесткого диска). Соответствующие предложения должны быть направлены руководителю.

План-отчет операций

На основе приведенного в предыдущих разделах плана мероприятий следует составить список конкретных, текущих операций администратора. При этом каждая позиция должна быть пооперационно развернута в соответствии со спецификой информационной системы примерно в следующем виде, позволяющем непосредственно в бланке отмечать результаты проверки каждого пункта (табл. 12.1).

Таблица 12.1.
Список конкретных текущих операций администратора

Заполненный администратором отчет будет являться документом, по которому можно оценить как работу специалиста, так и объективно проанализировать состояние системы.


Рейтинг@Mail.ru