Как стать автором
Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

Анализировать данные — это как варить пиво. Почему дата-анализ и пивоварение — одно и то же с техноизнанки

Время на прочтение 10 мин
Количество просмотров 35
Блог компании IT-guide Data Mining *Big Data *Data Engineering *
🧠 Хабр IT-гид

Анализировать данные — это как варить пиво. Почему data-анализ и пивоварение — одно и то же с техноизнанки

Три года я был эстонским пивоваром: придумывал рецепты и сам варил. Когда начал изучать Python, SQL и анализ данных, понял, что между подготовкой данных и подготовкой сусла много общего: оказывается, в цеху я занимался DS, но не подозревал об этом. Меня зовут Алексей Гаврилов, я сеньор дата-аналитик в ретейле. В этой статье расскажу, чем пивоварение и аналитика данных похожи изнутри.

Читать далее
Рейтинг 0
Комментарии 0

Новости

15 лет «Фланта»: переход от сервисной компании к продуктовой, покупка внешнего продукта, вера в Open Source

Уровень сложности Простой
Время на прочтение 17 мин
Количество просмотров 346
Блог компании Флант DevOps *Управление продуктом *Open source *IT-компании
Ретроспектива

В мае 2023 года «Фланту» исполнилось 15 лет. За это время из небольшого предприятия двух друзей-студентов, которые мечтали поставить GNU/Linux на каждый рабочий стол, мы выросли в команду опытных и уважаемых в индустрии DevOps-инженеров и постепенно трансформируемся в продуктовую компанию с собственной экосистемой продуктов: Kubernetes-платформой Deckhouse, утилитой для CI/CD werf, системой мониторинга Okmeter и другими проектами.

В этой статье мы хотели порефлексировать о переходе от сервисной компании к созданию собственных продуктам, рассказать, как эти продукты развивались и что с нами произошло за последние 5 лет.

Сразу обозначим свой «символ веры». Услуга DevOps as a Service (DaaS) была, есть и будет основой нашей продуктовой линейки. Именно благодаря инженерам, которые 24/7 обслуживают сотни клиентских кластеров, мы можем получать максимально быстрый фидбэк по своим продуктам, тестировать новые релизы и собирать кучу новых идей для дорожной карты. То есть в нашем случае услуга, как бы странно для классических продуктовых компаний это ни звучало, является одним из ключевых компонентов продуктовой разработки.

Читать далее
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 0

Кодирование и декодирование данных

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 599
Блог компании OTUS Математика *Сжатие данных *Читальный зал
Обзор


Автор статьи: Артем Михайлов

Кодирование и декодирование данных — это процессы, которые стали неотъемлемой частью нашей цифровой жизни. Они позволяют «упаковать» большой объем информации и передать ее по различным каналам связи, в том числе через Интернет. Кодирование и декодирование не ограничиваются только передачей данных. Они также применяются в графике, звуке, видео и многих других областях.

Зачем нужно кодировать и декодировать данные? Ответ состоит в том, что нам нужно сократить объем информации и передать ее за минимальное время и с минимальными потерями. Кодирование позволяет компрессировать данные до необходимого уровня, а декодирование — восстановить их при получении.

Важным примером применения кодирования и декодирования данных является цифровое телевидение и интернет-трансляции. Например, H.264 — это технология кодирования видео, которая позволяет получить максимально высокое качество с минимальным объемом данных. При этом, при передаче через Интернет, данные сжимаются, и после достижения адресата автоматически декодируются.
Читать дальше →
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 1

Как сэкономить свои нервы и деньги компании на перестроении структуры больших таблиц без простоя в PostgreSQL

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 1.7K
PostgreSQL *Администрирование баз данных *Big Data *
Из песочницы

Привет! Меня зовут Васильев Виктор, я DBA в компании UIS и CoMagic. В этой статье на реальных примерах расскажу, как можно сэкономить время разработчика, администратора баз данных и ресурсы сервера(ов), используя утилиту pg_rebuild_table. Сопровождая большие, высоконагруженные системы, с бо’льшей вероятностью каждый сталкивался с кейсами, о которых будет рассказано дальше. Некоторые технические подробности пройду без детализации, чтобы сильно не усложнять и не делать статью очень громоздкой. Лучше отвечу на вопросы в комментариях.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 1

Истории

Что делать с двумя тысячами роутеров, на которых корявая прошивка, если ты — провайдер?

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 13K
IT-инфраструктура *Cisco *Сетевые технологии *Сетевое оборудование Инженерные системы *
Из песочницы

В этой статье я хочу рассказать о своем опыте построения конвейера для прошивки устройств, в которые можно втыкать кабеля с 8-pin коннекторами на концах. Некоторые наблюдения, как мне кажется, могут помочь вам решать подобные кейсы в будущем.

Читать далее
Всего голосов 64: ↑63 и ↓1 +62
Комментарии 30

Модуль Terraform для Proxmox

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 2.4K
IT-инфраструктура *
Из песочницы
Перевод

Всем привет, я не блогер и не люблю писать посты и блоги, пока.

Решил найти решение для Terraform и Proxmox. После не долгих поисков нашёл провайдер под названием terraform-provider-proxmox. Так как на русском документации не было ни где, решил перевести документацию о ресурсах на русский язык как мог. Думаю что кому ни будь будет полезно и избавит от дополнительного труда.

Дальше
Всего голосов 14: ↑13 и ↓1 +12
Комментарии 2

Спиливаем spill-ы

Время на прочтение 9 мин
Количество просмотров 525
Блог компании билайн Высокая производительность *Scala *Big Data *DevOps *
Туториал

Привет! 

Меня зовут Александр Маркачев, я 3,5 года работаю на позиции Data Engineer в билайне и люблю открывать для себя что-то новое и интересное в работе. Так случилось и с темой, которой я сегодня хочу с вами поделиться — со spill-ами.

Под катом мы поговорим о том, что такое Spill-ы в контексте Spark, и почему именно для Spark это не такая уж сильно плохая штука. Рассмотрим, из-за чего Spill-ы в принципе возникают, разберем несколько видов Spill-ов (и даже вызовем их намеренно), а затем будем решать эту проблему.

Что такое spill-ы в Spark

Вообще, Spill — это термин для обозначения процесса перемещения данных из памяти на диск, а затем снова обратно в память. По крайней мере, именно так гласит официальная трактовка. Если проще, то дело вот в чем — когда у Spark не хватает ресурсов для обработки, он перемещает данные на диск.

В процессе обработки существуют разные участки — есть Executor Memory, есть Storage Memory, и когда эти участки оба целиком заполнены, то они начинают переполняться и вызывать утечку данных. Причем в отличие от утечки в C, Java или еще где-то, в Spark это преднамеренное действие для того, чтобы ваша задача не падала. Собственно, именно поэтому при нехватке ресурсов данные и «проливаются».

Можно ещё сильнее упростить аналогию.

Читать далее
Всего голосов 13: ↑13 и ↓0 +13
Комментарии 1

«20% оборудования не приедет в срок, а 10% — не приедет никогда». Параллельный импорт глазами провайдера инфраструктуры

Время на прочтение 6 мин
Количество просмотров 5.3K
Блог компании Selectel IT-инфраструктура *Законодательство в IT IT-компании
Мнение

После ухода крупных иностранных производителей с рынка российские компании стали искать альтернативные способы получения необходимых товаров. И если напиток, сильно похожий на кока-колу, мы получили быстро, то заменить некоторые вещи было не так легко. В частности, это касается серверных комплектующих и оборудования для дата-центров. Однако товары по-прежнему поставляются на российский рынок — благодаря параллельному импорту.

Меня зовут Кирилл Малеванов, я технический директор Selectel. В начале 2022 года мы столкнулись с ситуацией, когда нужно искать новые способы получения оборудования, одним из которых стал параллельный импорт. В статье расскажу об особенностях этого метода на рынке IT-инфраструктуры и о рисках, с которыми придется столкнуться.
Читать дальше →
Всего голосов 39: ↑37 и ↓2 +35
Комментарии 12

Материалы митапа по защите веб-ресурсов от кибератак в 2023: Anti-DDoS, WAF, Antibot

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 466
Блог компании КРОК Информационная безопасность *Облачные вычисления *Облачные сервисы *

Борьба с кибератаками сегодня похожа на сражение с гидрой: отрубаешь одну голову,  на ее месте вырастает две. Как писали «Ведомости», количество кибератак в феврале 2023 года по сравнению с февралем 2022 года увеличилось на 65%. Первыми под удар злоумышленников попадают веб-ресурсы – корпоративные порталы с ценными данными клиентов и сотрудников, сайты e-com.

Какие типы кибератак сегодня преобладают? Какие облачные инструменты защиты веб-ресурсов стоит подключать в первую очередь? Почему защита нужна не только бизнесу, но и его контрагентам? Обо всем этом менеджер по развитию бизнеса КРОК Облачные сервисы Александр Фикс и руководитель отдела системного администрирования «РДЛ-Телеком» Иван Мельников поговорили на нашем митапе. А также обсудили практический кейс компании «РДЛ-Телеком». 

Ниже –  выжимка с главными тезисами встречи. А посмотреть запись и прочитать полную расшифровку можно почитать здесь.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Как вывести миллиарды ключей из ScyllaDB

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 796
Блог компании STM Labs Высокая производительность *Big Data *Хранение данных *Хранилища данных *
Кейс

Мечтал ли я когда-либо ворочать миллиардами? Честно признаюсь, да. И нельзя сказать, что Вселенная меня не услышала. Вот только я никак не имел в виду миллиарды записей в базе данных...

Ранее я уже писал о нашем опыте использования ScyllaDB в качестве архивного хранилища. Разумеется, исследования и открытия, связанные с новой базой данных, для нас на этом не закончились... Создавая архив для данных, вероятность обращения к которым близка к нулю, мы, конечно, допускали, что время от времени клиенты будут просить вернуть данные обратно в оперативное хранилище. Но запрос на извлечение из архива сразу всех записей стал для нас неожиданностью. Хорошо ещё, что клиента интересовал только ключ записи, а не вся запись целиком. Тем не менее достать 10 млрд. ключей из ScyllaDB за приемлемое время звучало как челлендж. Ну надо так надо.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 0

Секреты должны оставаться секретами: как работает Secret Scanner в Yandex Cloud

Время на прочтение 5 мин
Количество просмотров 1.2K
Блог компании Yandex Cloud & Yandex Infrastructure Информационная безопасность *Программирование *IT-инфраструктура *Облачные сервисы *

Привет! Меня зовут Лиза Шеленговская, я разработчик в подразделении Yandex Cloud Security. Задача нашей команды — создавать сервисы безопасности в облаке, а также следить за безопасностью самого облака. Конечно, мы занимаемся и вопросами управления уязвимостями. Одна из самых частых угроз в облаке и в on-premise — утёкшие статические секреты. В этой статье я расскажу о проблеме утечек чувствительных данных в публичные репозитории кода и о сервисе Secret Scanner, который мы создали, чтобы обезопасить пользователей. С его помощью мы ищем секреты, оказавшиеся в открытом доступе.

Читать про секреты
Всего голосов 17: ↑17 и ↓0 +17
Комментарии 0

Как на самом деле должен работать масштабируемый блокчейн?

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 1.4K
Децентрализованные сети *
Из песочницы
Перевод

Что такое масштабируемость?

В программировании масштабируемость относится к способности приложения, сети, алгоритма, протокола или системы развиваться в соответствии с растущей нагрузкой, чтобы штатно выполнять более широкий круг функций и обслуживать нарастающее число пользователей. В централизованных вычислительных системах производительность можно повысить двумя способами: обновить программное обеспечение оборудования, чтобы оно более эффективно выполняло увеличивающийся спектр задач, либо добавить вычислительные мощности (серверы). Под масштабируемостью блокчейна чаще всего имеется в виду способность обрабатывать большее количество транзакций в секунду, так называемый, TPS (transactions per second).

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 26

Установка Gentoo на Playstation 3

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 7K
Блог компании RUVDS.com Настройка Linux *Игры и игровые консоли
Туториал
Перевод

История Linux на PS3 довольно интересна. Если вы знакомы с историей PS3, то, вероятно, знаете, что Sony выпустила её в 2006 году с поддержкой возможности запуска других операционных систем при помощи функции под названием OtherOS. OtherOS позволяла пользователям устанавливать операционные системы наподобие Linux или FreeBSD во второй раздел жёсткого диска PS3.

В 2010 году Sony в прошивке 3.21 избавилась от поддержки OtherOS «из соображений безопасности». На самом деле это означало, что некоторые люди начали использовать эту функцию для глубокого изучения внутренностей PS3 и разбираться, как пиратить игры. Благодаря модифицированной прошивке, можно использовать OtherOS с современными прошивками; именно этим мы и займёмся.
Читать дальше →
Всего голосов 45: ↑45 и ↓0 +45
Комментарии 12

Почти всё о Carbonio MTA

Время на прочтение 7 мин
Количество просмотров 400
Блог компании Zextras Системное администрирование *Софт
Туториал

Carbonio MTA (Mail Transfer agent) - это ключевой узел инфраструктуры Carbonio, обеспечивающий работу его главной функции - отправки и получения электронной почты. В сердце Carbonio MTA лежит Postfix, который в связке с Amavis, ClamAV и SpamAssassin обеспечивает надежную и безопасную работу с потоками электронной почты, защищая почтовые ящики пользователей от спама и зараженных вирусами писем. В этой статье мы расскажем о том, как грамотно настроить Carbonio MTA и как администратор может взаимодействовать с ним.

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Комментарии 1

Правильные и простые бэкапы. Инструменты Veeam для резервного копирования — в чем разница?

Время на прочтение 6 мин
Количество просмотров 2.4K
Блог компании Selectel Резервное копирование *Хранение данных *Облачные сервисы *

Чем сильнее бизнес зависит от IT-систем, тем большие убытки он понесет в случае потери данных и простоев из-за восстановления работоспособности. Поэтому важно настроить регулярное резервное копирование систем и данных.

Но какое решение для этого выбрать? И если Veeam, то что использовать — Backup & Replication, Agent или Сloud Connect? В тексте постарались объяснить, в чем разница между сервисами Veeam для резервного копирования.
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Комментарии 12

Азы программирования для детей и подростков: актуальные инструменты обучения и немного личного опыта

Время на прочтение 6 мин
Количество просмотров 2.7K
Блог компании МТС Программирование *Учебный процесс в IT Облачные сервисы *

Привет, Хабр! Меня зовут Сергей Ребров, я работаю в команде машинного обучения в МТС. У меня две дочки, которых стараюсь знакомить с миром разработки, поэтому решил написать статью про обучение азам программирования детей и подростков. Есть личные кейсы, есть информация к размышлению, описываю и полезные, на мой взгляд, инструменты. Если для вас эта тема интересна - прошу под кат!

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 2

Моделируем кибератаки на энергосистемы и пытаемся разобраться с «гусями» в сети

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 1.2K
Блог компании ЦИТМ Экспонента Сетевые технологии *Matlab *Энергия и элементы питания Инженерные системы *
Туториал

Привет, Хабр! Когда-то у нас выходил материал по применению протокола SV на электроэнергетических объектах, в котором мы обещали разбор протокола GOOSE. Итак, время пришло.

В этом материале напомним читателям, зачем нужен этот протокол, кто его использует, как выглядят и из чего состоят GOOSE-сообщения. Покажем пример обмена устройствами таким трафиком, а также как, имея программно-аппаратный комплекс для моделирования в реальном времени, создать модель энергосистемы и провести опыт моделирования GOOSE-spoofing атаки на защищающие ее терминалы РЗА.

Надеемся, что статья будет полезна начинающим специалистам и специалистам, работающим с цифровыми технологиями в электроэнергетике, все-таки шпаргалки всегда полезны.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 1

Gatekeeper в production: полезные практики и шаги, которые не стоит допускать

Время на прочтение 7 мин
Количество просмотров 1.1K
Блог компании VK Информационная безопасность *DevOps *Kubernetes *


Kubernetes, как и любая другая рабочая среда, не лишен уязвимостей. Поэтому наряду с развитием проектов в нем администраторы или DevOps-инженеры должны уделять внимание и безопасности использования кластеров. Для этого нужен надежный инструмент, который может работать с любыми политиками и валидировать действия клиентов в кластерах Kubernetes.
Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 2

Как протокол RDP (почти) вырвался из проприетарного рабства

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 15K
Блог компании RUVDS.com Open source *Системное администрирование *IT-стандарты *Серверное администрирование *
Обзор

Remote Desktop Protocol (протокол удалённого рабочего стола, RDP) — проприетарный протокол, разработанный Microsoft примерно в 1998 году. Начиная с XP каждая версия Windows включает системный компонент mstsc.exe.

Благодаря RDP, можно подключиться к другой системе и работать за ней словно за своим компьютером. То же самое делают, например, AnyDesk и TeamViewer, у которых протоколы схожей функциональности.
Читать дальше →
Всего голосов 50: ↑45 и ↓5 +40
Комментарии 24

Кто управляет информацией — тот владеет миром: как сделать так, чтобы данные генерировали прибыль, а не убытки?

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 636
Администрирование баз данных *Хранение данных *
Мнение

У всех компаний есть разнообразные данные: о клиентах, транзакциях, закупках, оборудовании, доходах и расходах. Но для одних компаний данные – драйвер роста, а другие несут убытки, полагаясь на них. Разница в том, что первые управляют информацией: знают, как и в какой форме она поступает, как ее внести в корпоративные системы, обогатить, и главное - как использовать, а вторые пускают эту работу на самотек и живут в зоопарке информационных систем без единой версии правды.

Это обзорный материал, я расскажу в нем об объектах основных данных, о том, по каким причинам часто возникают ошибки, какими инструментами улучшить качество данных и рассмотрю шаги конкретного проекта по внедрению НСИ.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 2