Описание процессов, обеспечивающих поддержание жизненного цикла ПО

Назначение документа

Данный документ содержит описание процессов, обеспечивающих поддержание жизненного цикла программного обеспечения, в том числе устранение неисправностей, выявленных в ходе эксплуатации программного обеспечения, совершенствование программного обеспечения, а также информацию о персонале, необходимом для обеспечения такой поддержки.

Общие положения

В данном документе рассматриваются четыре основных процесса, которые призваны обеспечить работоспособность сервиса и его непрерывное развитие:

  • Управление инцидентами
  • Управление проблемами
  • Планирование мощностей
  • Процесс запуска новых сервисов

Управление инцидентами

Описание

Процесс предназначен для управления жизненным циклом всех инцидентов и ориентирован на скорейшее восстановление качества ИТ-услуги для пользователей.

Цель

  • Восстановление работы услуги;
  • Контроль процесса восстановления услуги;
  • Ведение статистики и последующего анализа;
  • Синхронизация всех заинтересованных лиц в рамках инцидента;
  • Выявление и фиксация причины.

Краткое описание процесса

Этап

Ответственный

Действия

1. Идентификация 

Менеджер проекта

Для обнаружения инцидента используется ряд инструментов:

  • Обращения внешних и внутренних пользователей;
  • Отслеживание графиков;
  • Автоматические мониторинги.

2. Регистрация и категоризация

Менеджер проекта

Заводит тикет в очередь и назначает на ответственное лицо.

3. Оповещение

Менеджер проекта

Сообщает о проблеме в чаты с заинтересованными лицами. Указывает примерное время на восстановление.

4.  Восстановление

Дежурный разработчик

Восстанавливает работу услуги, проверяет результат на бою и на графиках.

5. Закрытие

Менеджер проекта

Инцидент считается закрытым в случае выполнения следующих условий:

  • Ошибка не воспроизводится.
  • Определена и устранена причина возникновения ошибки.

 

Управление проблемами

Описание

Процесс предназначен для управления жизненным циклом всех проблем и минимизации рецидивов инцидентов в будущем.

Цель

  • Минимизация вероятности рецидива инцидентов;
  • Анализ состояния систем и подсистем;
  • Сокращение технического долга.

Краткое описание процесса 

Этап

Ответственный

Действия

1. Идентификация 

Рабочая группа

Регулярные анализ инцидентов на предмет системности сбоев в рамках систем, подсистем и компонентов

2. Регистрация 

Менеджер проекта

Заведение проблемы

3. Приоретизация 

Технический лидер

Определение приоритета проблемы путем оценки влияния и вероятности рецидивов

4. Диагностика

Рабочая группа

Выявление причины

5. Решение 

Рабочая группа

Планирование и решение проблемы

6. Закрытие

Менеджер проекта

Фиксация итогов, проверка и последующие закрытие проблемы

Планирование мощностей

Описание

Процесс предназначен для управления пропускной способностью системы в разрезе основных ресурсных потребностей, таких как: процессор, память, диски, сеть и т.д.

Цель

  • Подготовка системы к пиковым нагрузкам;
  • Обеспечение масштабирование бизнеса.

Краткое описание процесса

Этап

Ответственный

Действия

1. Сбор требований

Технический лидер

Анализ потребностей бизнеса в разрезе: продукт, маркетинг, интеграции

2. Выявление запроса

Рабочая группа

Формализация конкретных объемов и типа на закупку

3. Валидация запроса

Технический лидер

Проверка корректности и сбалансированности запроса

4. Финансовая валидация запроса

Продуктовый лидер

Сопоставление запроса с финансовым планом бизнеса

5. Утверждение запроса

Технический и продуктовый лидер

Утверждение трат и объемов обеспечения бизнес-планов

6. Отправка запроса на закупку

Технический лидер

Отправка запроса на закупку необходимых мощностей

 

Процесс запуска новой функциональности

Описание

Процесс предназначен для управления создание новой функциональности в балансе скорость и качество сервиса.

Краткое описание процесса

Этап

Ответственный

Действия

1. Сбор требований

Менеджер проекта

Анализ продуктовых вводных для старта проектирования изменений

2. Разработка

Рабочая группа

Создание новой функциональности или внесения изменений в существующую 

3. Код-ревью

Рабочая группа

Валидация качественных изменений в коде

4. Функциональное тестирование

Специалист по качеству

Проверка изменений на соответствие с функциональными требованиями

5. Регрессионное тестирование

Специалист по качеству

Проверка стабильности незатронутой функциональности

6. Выкатка на % пользователей

Специалист по качеству

Выкатка на часть пользователей и наблюдение

7. Проверка графиков и настройка мониторингов

Релиз-инженер

Проверка стабильности основных метрик

8. Релиз

Специалист по качеству

Выкатка на 100% пользователей