Привет, Хабр! Меня зовут Сергей Бондарев, я CDO в Первой грузовой компании. Сегодня расскажу, как мы решаем задачу управления данными с точки зрения IT-разработки и используемых методологий.
Сперва о том, кто мы такие
Мы в ПГК перевозим грузы — сталь, уголь, продукты питания, технику и оборудование — по России и за рубежом. Под нашим управлением находятся порядка 100 тыс. вагонов. Управление обширным вагонным парком — задача совсем не тривиальная. Необходимо следить за местоположением вагонов, их техническим состоянием, прорабатывать логистические моменты, например, составлять график передачи поездов по междорожным стыковым пунктам.
Чтобы решать эти задачи, мы развиваем собственные цифровые сервисы и реализуем полный цикл разработки программных продуктов. Так, в нашем арсенале есть системы предиктивной аналитики, позволяющие направлять вагоны в ремонт до фактического возникновения неисправности или прогнозировать спрос на услуги за счет машинного обучения.
Очевидно, что в основе каждого аналитического продукта лежат данные. Их источники — самые разнообразные. Они поступают от владельца железнодорожной инфраструктуры, из наших транзакционных систем и других цифровых продуктов. Помимо них существуют накопленные исторические данные и разнообразная нормативно-справочная информация. Дальше я расскажу, как мы всем этим управляем.
Что мы понимаем под управлением данными
Пара слов о том, что мы понимаем под управлением данными. Это — руководство их поставкой и хранением, а также контроль их качества, распространения и применения. Потребность в системном управлении данными зависит от нескольких факторов. Во-первых, от объема данных, которыми оперирует организация. Во-вторых, от количества сотрудников с ними работающих. В-третьих, от текущего культурного уровня организации в использовании данных и стратегических целей компании.