Как стать автором
Обновить
73.94
Слёрм
Учебный центр для тех, кто работает в IT
Сначала показывать

Знакомимся с Access Logs и фильтрами в Envoy и Istio service mesh

Время на прочтение 11 мин
Количество просмотров 535

Не у всех есть необходимость в тонкой настройке access logging в Envoy, но если она всё-таки возникает, то могут понадобиться примеры, которых почему-то не очень много в документации. Поэтому мы сделали перевод статьи, где вы можете познакомиться с Envoy, узнать, как включить журнал доступа (access log) Envoy в Istio, и научиться настраивать фильтры.

Предполагается, что у вас есть базовые знания об Istio, но даже если у вас их нет, вы можете следовать этому руководству и попробовать настроить всё на своей локальной машине.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 0

Учимся использовать модуль Ansible Shell для выполнения удалённых команд

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 3.9K

Мы перевели статью, где подробно рассматривается использование модуля Ansible Shell и различные способы выполнения удалённых команд на узлах в рамках работы по автоматизации. В статье рассматриваются различные опции и модули для выполнения удалённых команд, а также их различия и то, когда следует использовать каждый из них. Статья для тех, кто изучает Ansible.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 1

Roadmap для тех, кто собирается в DevOps

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 25K

Многие, кто изучает DevOps, ориентируются на Roadmap.sh. Это классный ресурс, который помогает понять, какие компетенции нужно приобрести в профессии. Но в нём очень много информации, начинающие специалисты рискуют утонуть в деталях. Мы разработали свой Roadmap на основе опыта спикеров Слёрма. Он сделан с учётом российских реалий, разбит на уровни, фокусирует внимание на том, что в первую очередь понадобится для старта и роста в профессии и содержит ссылки на наши платные и бесплатные курсы. Статья будет полезна разработчикам и системным администраторам, которые хотят перейти в DevOps. 

Читать далее
Всего голосов 19: ↑14 и ↓5 +9
Комментарии 22

Apache Kafka и Spring Boot: лёгкая интеграция

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 808

Kafka — это универсальный и мощный инструмент для построения конвейеров данных в реальном времени и событийно-ориентированных приложений. Перевели туториал, где рассматривается интеграция Kafka с экосистемой Spring Boot.

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 2

Руководство для начинающих по Spark UI: Как отслеживать и анализировать задания Spark

Уровень сложности Простой
Время на прочтение 13 мин
Количество просмотров 2.3K

Публикуем перевод гайда по Spark UI. Это встроенный инструмент Apache Spark, который предоставляет полный обзор среды Spark: узлов, исполнителей, свойств и параметров среды, выполняемых заданий, планов запросов и многого другого. Кроме теории в статье вы найдёте несколько примеров, которые помогут попрактиковаться в отслеживании и анализе заданий Spark.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 2

Введение в data science: инструменты и методы анализа

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 5.9K

Представьте, что вам предстоит собрать сложную головоломку, но вы не знаете, как будет выглядеть конечный результат. Наука о данных может помочь нам решить эту головоломку, используя специальные инструменты и методы, чтобы различные фрагменты, собранные вместе, имели смысл. 

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Комментарии 1

Управление политиками кластера Kubernetes через Gatekeeper OPA

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 636

Перевели статью о том, что такое Gatekeeper, зачем он нужен и как работает. Разберёмся с политиками, настроим инфраструктуру Gatekeeper в кластере, протестируем политики.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 0

Пилим монолит и рисуем архитектуру запрещённой сети: лучшие выпуски IT-шоу «Заходят два архитектора в бар»

Время на прочтение 2 мин
Количество просмотров 8.2K

Слёрм — это учебный центр для IT-специалистов и инженеров. Кроме курсов, мы делаем несколько спецпроектов, и шоу «Заходят два архитектора в бар…» — один из них. Шоу выходит в прямом эфире раз в неделю: приглашённый эксперт выступает с 20-минутным докладом на архитектурную тему, а следующие гости становятся его оппонентами и дополняют озвученные идеи или горячо спорят с ними.  

Зрители тоже участвуют — задают вопросы в чате, обсуждают полезные идеи и знакомятся. 

Предлагаем посмотреть 5 лучших выпусков шоу «Заходят два архитектора в бар…». Там обсуждаем дизайн Web API, Rabbit и Kafka, блокировки в PostgreSQL, а ещё рисуем архитектуру запрещённой соцсети с картинками.

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 1

Делаем из Black Box мониторинга внешнее observability

Время на прочтение 9 мин
Количество просмотров 1.3K

Есть мнение, что Black Box подход к мониторингу хуже, чем White Box. Мол, мы получаем от него мало информации. Данных действительно немного, но мы можем развить нашу систему Black Box мониторинга и добиться довольно информативной системы контроля, которую мы условно назвали «внешнее observability».

В этой статье расскажем, как это сделать, и дадим несколько советов: 

• Как поддерживать Black Box в актуальном состоянии; 

• Использовать Black Box мониторинг как аудит безопасности;

• Как работать с алертами в Black Box;

• Как сделать геораспределённый мониторинг;

• Как использовать Black Box с кешированием.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 0

Автоскейлинг контроллеров Ingress в Kubernetes

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 3K

В этом переводе рассказываем о том, как настроить автомасштабирование контроллера Ingress с использованием Prometheus, KEDA и Locust для генерации трафика.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 2

SRE: Распределённая и централизованная модели управления инцидентами

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 1.6K

Внедрение SRE-практик в компаниях может происходить по-разному. Где-то решение об этом принимает менеджмент, где-то это может быть инициатива снизу. В любом случае может встать вопрос: как организовать реагирование на инциденты и кто будет брать на себя лидерство в командах во время инцидента?

Перевели статью о двух моделях структуры для команд управления инцидентами — распределенной и централизованной. В ней рассматриваются плюсы и минусы каждой из моделей, а также примеры того, как каждая из них выглядит.

Читать далее
Всего голосов 4: ↑2 и ↓2 0
Комментарии 2

Что вспоминают о курсе DevOps Upgrade наши выпускники

Уровень сложности Простой
Время на прочтение 11 мин
Количество просмотров 1.7K

У курса Слерма DevOps Upgrade прошло уже 5 потоков. Выпустился 161 студент. В честь завершения нашего 5-го потока решили поговорить с нашими выпускниками и узнать, с чем они сталкивались во время учёбы. Собрали истории выпускников в одну статью.

Читать далее
Всего голосов 11: ↑6 и ↓5 +1
Комментарии 0

Дебажим Golang с помощью Delve

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 2.5K

В этой статье мы рассмотрим, как дебажить программы, написанные на Golang, с помощью Delve. Delve — это сторонний отладчик для Go, скачать на github по ссылке https://github.com/go-delve/delve. Это хорошая альтернатива отладчику GDB golang (https://golang.org/doc/gdb), так как Delve куда больше возможностей для работы.

Читать далее
Всего голосов 10: ↑7 и ↓3 +4
Комментарии 3

Как рассчитать SLA на примере Nginx-сервера

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 5K

Соглашение об уровне обслуживания (SLA) – это соглашение с клиентами или пользователями, где описывается уровень обслуживания, который поставщик обещает предоставить клиенту. SLA можно представить в виде измеряемой метрики, например, как время безотказной работы или суммарное количество ошибок. Перевели статью, где рассматривается простой способ расчета SLA на примере Nginx-сервера.

Читать далее
Всего голосов 9: ↑7 и ↓2 +5
Комментарии 1

Мы заглянули под капот Kafka и решили проблему потерянных сообщений

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 10K

Kafka — это масштабируемая, отказоустойчивая платформа для обмена сообщениями в реальном времени. Она позволяет обрабатывать миллионы сообщений в секунду. Однако некоторые ситуации приводят к потере событий. Например, Kafka требует хорошего стабильного сетевого соединения между клиентами и брокерами; если сеть нестабильна, это может легко привести к потере сообщений. 

Команда разработчиков Trendyol Tech видоизменила архитектуру и решила эту проблему с помощью outbox-шаблона, но столкнулась с другой проблемой — дублированием событий. Приводим перевод статьи о том, как разработчики залезли под капот Kafka и нашли решение этих двух проблем.

Читать далее
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 5

Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером

Время на прочтение 7 мин
Количество просмотров 7.4K

Привет, Хабр! Сегодня рассказываем, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.

В статье сначала опишем паттерны построения распределённых хранилищ, чтобы понимать, через какие процессы проходят данные. А после поговорим о задачах специалистов по работе с данными и необходимых для каждой позиции навыках.

P.S. На картинке спрятаны 6 инструментов для работы с данными. Узнали их?

Читать далее
Всего голосов 17: ↑15 и ↓2 +13
Комментарии 0

Преобразование табличных данных в Python

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 4.2K

Предположим: вы полны желания изучить  манящий массив данных. К счастью, для этого достаточно вашего компьютера. Итак, вы открываете блокнот Python или REPL, чтобы начать работать:  какую библиотеку использовать? Естественно, вы можете обратиться к старой доброй Pandas. А как насчет новой модной библиотеки фреймов данных, например Polars или datatable? А ещё, для разнообразия, можно попробовать встроенный SQL с помощью DuckDB.

Давайте погрузимся в прекрасную область фреймов данных, чтобы сделать выбор!

PS: Используйте DuckDB, если вам удобно работать с SQL, Polars или Pandas с поддержкой PyArrow, если вам не нужно какое-то специфическое расширение NumPy, и задействуйте PyArrow в том случае, если вы не против ручной оптимизации.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 1

Учимся использовать разные типы переменных в Ansible

Уровень сложности Простой
Время на прочтение 12 мин
Количество просмотров 7.3K

Переменные Ansible — это динамические значения, которые используются в плейбуках и ролях Ansible для настройки и возможности повторного использования конфигураций. Они очень похожи на переменные в языках программирования и помогают эффективно управлять сложными задачами. Они позволяют применять один и тот же сценарий или роль в разных средах, системах или контекстах без необходимости хардкодинга конкретной информации.

Представляем перевод статьи, где подробно рассматриваются переменные Ansible.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 1

Apache Spark 3.4 для Databricks Runtime 13.0

Время на прочтение 10 мин
Количество просмотров 970

Databricks — это аналитическая платформа для облачных вычислений, работы с большими данными и машинного обучения. Компания разрабатывает data lake и работает с фреймворком Apache Spark. Приводим перевод статьи Databricks о нововведениях Apache Spark 3.4, который вошел в релиз Databricks Runtime 13.0.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 0

Оптимизация производительности цикла опроса в Kafka Consumer

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 2.5K

Цикл опроса является важным компонентом API Kafka consumer. Он отвечает за получение сообщений от брокеров Kafka и их обработку, вызывая обработчик сообщений, определенный пользователем. В этой статье расскажем, какие параметры нужно настроить, чтобы достичь большей производительности.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 1

Информация

Сайт
slurm.io
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия
Представитель
Антон Скобин