Как стать автором
Обновить
VK
Технологии, которые объединяют
Сначала показывать

Кто такой Data Product Manager и почему без него не обойтись в 2022 году, если вы работаете с Big Data

Блог компании VK Системное администрирование *Big Data *DevOps *


В 2022 году индустрия больших данных изменилась. И нужно решать, что делать с инфраструктурными вызовами, переходить ли в облако и как продолжать развитие ИТ-решений. Со всем этим компаниям может помочь новая роль в команде — Data Product Manager.

Это статья написана по мотивам выступления на VK Cloud Conf Александра Волынского, Technical Product Manager в VK Cloud. Вы можете посмотреть его целиком в записи.

Главные проблемы и вызовы для индустрии работы с данными в 2022 году


  • Инфраструктура и инструменты. Как обеспечить работу систем, построенных на базе ПО вендоров, прекративших продажу лицензий?
  • Поддержка и развитие решений на базе зарубежного ПО. Как развивать системы и где получить компетенции для технического сопровождения решений, поддержку которых прекратили зарубежные вендоры?
  • Обеспечение безопасности решений. Обновления, новую функциональность и ключевые патчи для закрытия уязвимостей уже не получить.

Учитывая эти проблемы, многие компании решают перейти на Open-Source-инструменты и решения. Но применение этого стека технологий — тоже непростая задача: нужно выбрать решения, запланировать ресурсы, сформировать команду специалистов с нужными компетенциями или найти партнеров по внедрению ПО. И еще понадобится специалист, который все это организует: не всегда в компании может быть достаточно компетенций для реализации таких задач. 
Читать дальше →
Рейтинг 0
Просмотры 290
Комментарии 0

Новости

Как Go выполняет встраивание

Блог компании VK Серверная оптимизация *Go *

Привет, я Никита Галушко, работаю над мессенджером ВКонтакте. Расскажу, как Go подходит к инлайнингу функций — этот процесс ещё называют встраиванием. В статье разберёмся, зачем вообще это нужно, какой профит можно получить для ускорения работы кода, а когда плюсы могут обернуться минусами. На примерах углубимся в специфику Go: как этот язык инлайнит функции, что можно и что нельзя встроить, какие возможности доступны в разных версиях. Также обсудим ограничения и способы обойти их.

Читать далее
Всего голосов 24: ↑23 и ↓1 +22
Просмотры 2.9K
Комментарии 6

C++. Унарный минус и беззнаковый тип

Блог компании VK C++ *

Привет, Хабр! Меня зовут Владимир, я работаю в VK Карты. Хочу рассказать про случай, который недавно произошёл у нас в подразделении. Он кажется достаточно типичным и может быть интересен другим программистам.

Нам, программистам на C++, не привыкать, что даже самый безобидный код может таить в себе сюрпризы. Рассмотрим пример:

uint32_t width = 7;

int32_t signed_offset = -width;

Он полон сюрпризов! Каких? Короткий ответ: значение signed_offset не определено стандартом и зависит от реализации. Но это далеко не все неожиданности в этом коде. Статья как раз о них.

Читать далее
Всего голосов 26: ↑21 и ↓5 +16
Просмотры 5.2K
Комментарии 24

15 самых распространенных проблем с качеством данных (и способы их решения)

Блог компании VK Big Data *Машинное обучение *Хранилища данных *DevOps *
Перевод


Команда VK Cloud перевела статью о 15 самых популярных проблемах с Data Quality и способах их смягчения или даже полного избегания.

1. Неполные данные


Эта проблема самая распространенная. При ее возникновении в ключевых столбцах не хватает информации, либо содержатся неправильно выполненные задания ETL или данные, которые негативно влияют на дальнейшую аналитику. 

Решение. Внедрить контроль фреймворка для сверки данных. Он проверяет число записей, поступающих на разные уровни аналитики, и отправляет оповещение, если на каком-то уровне записей стало меньше.
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 4.1K
Комментарии 4

Как запустить UI-автотесты в любом Chromium-браузере

Блог компании VK Браузеры Тестирование веб-сервисов *
Tutorial

Привет, Хабр! Меня зовут Кристина Курашова, и я отвечаю за качество в VK Assistant. Написала тут небольшую инструкцию для тех, кто тоже запускает UI-автотесты в браузерах на основе Chromium (не только Chrome). Надеюсь, она сэкономит вам время. Welcome!

Читать далее
Всего голосов 26: ↑25 и ↓1 +24
Просмотры 3.2K
Комментарии 17

Taneleer на смену Thanos – как мы поменяли подход к обнаружению скомпрометированных паролей

Блог компании VK Информационная безопасность *Tarantool *

Привет, Хабр! Мы – команда информационной безопасности Почты Mail.ru. Уже много лет мы постоянно совершенствуем текущие и внедряем новые механизмы безопасности и технологии беспарольного входа, которые направлены на защиту аккаунтов пользователей. Но пока пароль остается основным методом аутентификации для большинства пользователей и является самым ненадежным методом аутентификации, потому что природа не одарила человеческий мозг хорошим генератором псевдослучайных чисел и идеальной памятью. Согласно многочисленным исследованиям, пользователи предпочитают использовать простые, предсказуемые, не уникальные пароли.

Читать далее
Всего голосов 44: ↑43 и ↓1 +42
Просмотры 2.7K
Комментарии 0

От сбора до использования: как повысить Data Quality на всех этапах работы с данными

Блог компании VK Big Data *Машинное обучение *Хранилища данных *DevOps *
Перевод


Представьте, что у вас только что появилось классное озеро данных с прикольными пайплайнами, которые собирают данные со всей компании. А теперь представьте свой шок, когда команды бизнес-специалистов поймут, что в озере данных — не данные, а мусор. 

Команда VK Cloud перевела статью о том, как следить за данными на каждом этапе и повысить их качество для грамотного использования.
Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 1.4K
Комментарии 0

Как мы делали суперприложение на основе Почты

Блог компании VK Разработка мобильных приложений *

Совсем скоро, 3 и 4 сентября в VK пройдёт новый Weekend Offer. В нём будет участвовать и наша команда — мы создаём суперприложение на основе почтового клиента Mail.ru. Хотим подробнее рассказать об этом проекте и о задачах, которые нужно будет решать нашим будущим коллегам :)

Год назад бизнес поставил нам задачу: интегрировать в приложение несколько других сервисов компании, чтобы пользователи могли одним нажатием переходить из сервиса в сервис. Ну, вы и сами знаете, для чего нужны суперы — для развития экосистемы и конкретных продуктов. И спустя два месяца мы запустили в эксплуатацию суперприложение на основе почтового клиента Mail.Ru.

Читать далее
Всего голосов 30: ↑22 и ↓8 +14
Просмотры 3.5K
Комментарии 10

Отказоустойчивая архитектура контентной платформы на 4 Тбит/с — опыт VK Видео

Блог компании VK Высокая производительность *Анализ и проектирование систем *IT-инфраструктура *Распределённые системы *

Представьте идеальный мир с бесконечными ресурсами, в котором можно сколько угодно линейно масштабироваться под нагрузку: просто доставлять серверы, диски, видеокарты, как только потребуется больше мощностей. Звучит хорошо? Только оказывается, что когда серверов 5 000 и дисков 100 000, то несколько из них обязательно находятся в состоянии maintenance или repair, куда их привели обстоятельства непреодолимой силы. И главная задача здесь — обеспечить доступность сервиса в условиях постоянных сбоев. 

В статье разберём, как построить отказоустойчивую платформу, с какими неочевидными corner cases может столкнуться сервис с UGC-контентом, а ещё — как жить в реальном, а не идеальном мире и оптимизировать железо. Чтобы раздавать 4 Тбит/с можно, конечно, использовать 400 серверов по 10 Гбит/с, но гораздо интереснее грамотно всё потюнить и выжать 100 Гбит/с с Java-сервера.  

Читать далее
Всего голосов 57: ↑57 и ↓0 +57
Просмотры 11K
Комментарии 13

Настоящий детектив: загадочные таймауты на проде

Блог компании VK Анализ и проектирование систем *Отладка *

Привет! Меня зовут Алексей, я работаю в команде Антиспама Почты Mail.ru, и сегодня хочу поделиться интересным опытом нашей команды по поиску проблем на бою. 

Многие из нас любят детективные истории: интрига, драйв, захватывающий сюжет, который держит в напряжении до самого конца, когда раскрывается загадка. Ровно такие же ощущения испытываешь, когда разбираешься с проблемами на проде. 

Этот пост — детектив со всеми его элементами: загадочная история с превышением времени до таймаута, круг подозреваемых (среди которых сервисы, прокси и сеть), команда разработчиков-сыщиков, собирающих и изучающих улики и ставящих следственные эксперименты, и непредсказуемая развязка.  

Читать далее
Всего голосов 69: ↑69 и ↓0 +69
Просмотры 8.6K
Комментарии 25

Встраиваем Lua в PHP через FFI

Блог компании VK Open source *PHP *Системное программирование *Lua *

Foreign Function Interface — это перспективная альтернатива для традиционных PHP-расширений.


Сегодня мы будем разбирать FFI-библиотеку для работы с liblua5 из PHP, которая позволит исполнять скрипты на Lua из нашего приложения.


Читать дальше →
Всего голосов 43: ↑42 и ↓1 +41
Просмотры 2.9K
Комментарии 11

Отслеживание сетевого трафика в Kubernetes: примеры кода и практические советы

Блог компании VK DevOps *Kubernetes *
Перевод


Команда VK Cloud перевела статью об основных принципах работы сети в Kubernetes: как кластер принимает и отправляет пакеты начиная с исходного веб-запроса и до размещения приложения в контейнере.

Требования к сети в Kubernetes


Сначала давайте проясним требования к сети Kubernetes:

  • Под в кластере должен свободно взаимодействовать с любым другим подом без использования Network Address Translation (NAT).
  • Любая программа, работающая на узле кластера, должна взаимодействовать с любым подом на том же узле без использования NAT.
  • У каждого пода есть собственный IP-адрес (IP-per-Pod), и любой другой под может обратиться к нему по этому адресу.

Эти требования и ограничения описывают свойства сети кластера в целом и вынуждают отвечать на следующие вопросы: 

  1. Как убедиться, что контейнеры в одном и том же поде ведут себя как на одном хосте?
  2. Может ли под обращаться к другим подам в кластере?
  3. Может ли под обращаться к службам? Обрабатывают ли службы запросы о балансировке нагрузки?
  4. Может ли под получать трафик извне кластера?

В этой статье мы рассмотрим первые три пункта, начиная со взаимодействия на уровне подов и контейнеров.
Читать дальше →
Всего голосов 18: ↑18 и ↓0 +18
Просмотры 3.9K
Комментарии 0

От Soda Luv до BTS: как ВКонтакте рекомендует музыку миллионам пользователей

Блог компании VK Машинное обучение *Искусственный интеллект Социальные сети и сообщества

Всем привет! Это Даня Самойлов и Женя Замятин, мы из команды Core ML, занимаемся рекомендациями VK Музыки. В этой статье мы хотим поделиться с вами, как устроена наша система музыкальных рекомендаций (на примере алгоритмического плейлиста «Для вас»), и рассказать об интересных решениях, принятых на каждом этапе.

Читать далее
Всего голосов 20: ↑19 и ↓1 +18
Просмотры 2.1K
Комментарии 10

Звёзды в IT-команде: зачем, чего хотят, как удержать

Блог компании VK Блог компании Конференции Олега Бунина (Онтико) Управление разработкой *Управление персоналом *Карьера в IT-индустрии

Привет, я Иван Самсонов, продакт-менеджер в прикладных исследованиях ВКонтакте. Последние шесть лет так или иначе нанимаю людей, и согласен, что «наш успех как менеджеров — не более чем результат того, насколько хорошо мы умеем выбирать сотрудников». Расскажу, как на этапе собеседования увидеть в человеке звезду (или будущую звезду), привлечь его в свою команду и помочь реализоваться. И поделюсь пятью принципами работы с такими специалистами, которые я сформулировал для себя и которые помогают мне укреплять команду и вместе с ней добиваться крутых результатов, действительно соответствующих топ-уровню.

Читать далее
Всего голосов 61: ↑52 и ↓9 +43
Просмотры 15K
Комментарии 66

Как мы адаптировали «1С: Предприятие» под работу в облаке VK Cloud

Блог компании VK Системное администрирование *ERP-системы *DevOps *Облачные сервисы *


Результаты теста Гилева — одна из основных метрик производительности платформы «1С: Предприятие». На результаты теста обращают внимание как поставщики облачных услуг, так и клиенты, которым нужно решение с лучшими параметрами. 

Меня зовут Тимур Явкин, я архитектор облачных решений VK Cloud. Расскажу, как прошел тест Гилева наш облачный сервис «1С: Предприятие» версии 7.х в связке с СУБД MS SQL 2019 Enterprise, как мы повысили результаты с 11 до 32 баллов и к каким выводам пришли.
Читать дальше →
Всего голосов 11: ↑9 и ↓2 +7
Просмотры 2.5K
Комментарии 21

Создаём своё объектное хранилище за чаc

Блог компании VK Хранилища данных *Tarantool *


Привет! Меня зовут Артем Гаврилов и я работаю в Tarantool. Сегодня я расскажу, как быстро создать объектное хранилище на основе платформы in-memory вычислений Tarantool и распределённой файловой системы IPFS (InterPlanetary File System).


Мы рассмотрим пример шардирования стороннего приложения с помощью Tarantool и сделаем MVP объектного хранилища с отказоустойчивостью на уровне ЦОДа, в то время как более простые решения отказоустойчивы только на уровне нескольких серверов.


Тем, кто знаком с IPFS, вероятно, будет интересно читать начиная с раздела «С чем мы столкнёмся».

Читать дальше →
Всего голосов 38: ↑38 и ↓0 +38
Просмотры 5.4K
Комментарии 3

Как запускать поды как сервисы systemd в Podman

Блог компании VK Системное администрирование *DevOps *Kubernetes *
Перевод


Расширять традиционные практики администрирования Linux с помощью контейнеров — естественный путь развития. Podman без проблем интегрируется в Linux, но поддержка systemd — краеугольный камень этой интеграции. Команда VK Cloud Solutions перевела статью о том, как она работает.
Читать дальше →
Всего голосов 18: ↑18 и ↓0 +18
Просмотры 3.2K
Комментарии 1

Как настроить хранение логов кластера Kubernetes в бакете S3 и зачем это нужно

Блог компании VK Системное администрирование *Хранение данных *DevOps *Kubernetes *

Стандартный способ хранения логов Kubernetes на ноде неудобен: память ограничена, данные разбросаны, а многие аналитические инструменты просто не получится применять. Чтобы сделать хранение и работу с логами удобнее для разработки аналитических инструментов, логи можно перенести в бакет объектного хранилища S3.

Меня зовут Илья Нырков, я программист компании VK Cloud Solutions и разработчик облачных решений. На примере нашего облака я расскажу, почему вообще стоит обратить внимание на S3, как перенести и хранить логи кластера Kubernetes в бакет S3 и в чем преимущество этого решения.

Читать дале
Всего голосов 27: ↑25 и ↓2 +23
Просмотры 2.7K
Комментарии 7

Как студенты образовательных программ VK разрабатывали свои проекты

Блог компании VK Учебный процесс в IT Карьера в IT-индустрии

Рассказывают сами ребята. Посмотреть записи выступлений можно здесь.

Читать далее
Всего голосов 29: ↑29 и ↓0 +29
Просмотры 1.2K
Комментарии 0

Разложить по полочкам: как мы научили Облако сортировать фотографии по лицам

Блог компании VK Обработка изображений *Машинное обучение *Облачные сервисы *

Многие люди с помощью облачных сервисов делятся файлами с друзьями и близкими: загрузил один раз в облако, открыл доступ по публичной ссылке и рассылай её кому хочешь. Мы стремимся облегчить пользователям работу с Облаком и регулярно анализируем, какой информацией они делятся, какие форматы файлов загружают. Ежегодно пользователи создают больше 50 млн публичных ссылок, из которых около 13 млн — ссылки на папки с фотографиями. Если вам доводилось просматривать несколько сотен снимков с корпоратива или дружеской посиделки в поисках своего любимого лица, то вы знаете, какое это нудное занятие. 

Мы — Сергей Тарасенко, менеджер продуктов Облако и Диск-О, и Арсений Зорин, руководитель группы бэкенд-разработки — расскажем о новом инструменте, который экономит время пользователей: автоматической сортировке фотографий внутри папки по лицам. Именно сортировке: вы можете быстро выбрать изображения с конкретными людьми, но не идентифицировать их.

Читать далее
Всего голосов 37: ↑33 и ↓4 +29
Просмотры 1.7K
Комментарии 4

Информация

Дата основания
Местоположение
Россия
Сайт
vk.com
Численность
5 001–10 000 человек
Дата регистрации
Представитель
Анастасия Гутор