Как стать автором
Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

Возвращаем 2007 год, или делаем Интернет без блокировок

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 7K
Информационная безопасность *Сетевые технологии *Софт Социальные сети и сообщества
Из песочницы

Как известно, в 2007 году кроме того, что деревья были выше, а трава зеленей, еще и в Интернете не было особых ограничений - можно было открыть почти любой сайт и наслаждаться им. До ковровых блокировок Telegram оставалось ещё 10 лет... К сожалению, в наше время такой возможности уже нет. Причины тут всем известны, в частности, некоторые компании уже не предоставляют своих услуг в России.

Хорошо, что существует возможность в рамках домашней сети восстановить свободный Интернет таким, каким он был в 2007-м. Именно этим мы и займемся. Стоит отметить, что в 2007 году довольно часто можно было встретить подключения на скорости 64-128 Кб/с, а то и вовсе dial-up; Wi-Fi был редкостью, а мобильная связь - довольно дорогим удовольствием. Однако, эти особенности того времени мы постараемся не воспроизводить.

Представляю вашему вниманию Freeroute - простой маршрутизатор, который позволяет направлять трафик на разные шлюзы в зависимости от домена назначения. Free в названии, как водится, означает свободный, а не бесплатный.

Читать далее
Всего голосов 26: ↑24 и ↓2 +22
Комментарии 13

Новости

Как добыть Windows 11 под ARM?

Уровень сложности Средний
Время на прочтение 2 мин
Количество просмотров 5.4K
Системное администрирование *Виртуализация *
Кейс

С момента появления Apple MacBook с процессорами M1 и M2 задача виртуализации становится очень актуальной. Я для разработки всегда использую несколько виртуалок. Ubuntu, CentOS, Windows, работающие под Oracle Virtual Box, например, в качестве тестовых полигонов значительно облегчают жизнь и экономят время. Но Virtual Box на MacBook с процессором M2 чувствует себя очень плохо (но это отдельная история). Основная задача в том, что на новых маках в качестве гостевых операционных систем лучше всего использовать собранные под ARM. Это особенность архитектуры и челендж на ближайшее время. Итак, где взять Windows 11 под ARM?

Читать далее
Всего голосов 23: ↑20 и ↓3 +17
Комментарии 23

Dagster и Great Expectations: Интеграция без боли

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 235
Python *Data Mining *Data Engineering *
Из песочницы

Меня зовут Артем Шнайдер, и я занимаюсь DataScience в Бланке. Сегодня я хочу рассказать вам о том, как можно интегрировать два мощных инструмента – Dagster и Great Expectations.

Great Expectations позволяет определить так называемые ожидания от ваших данных, то есть задать правила и условия, которым данные должны соответствовать. 

Dagster, с другой стороны, это платформа с открытым исходным кодом для управления данными, которая позволяет создавать, тестировать и развертывать пайплайны данных. Написан на python, что позволяет пользователям гибко настраивать и расширять его функциональность.

Исходный код к этой статье на GitHub.

Давайте начнем? :-)

Погнали 🚀
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0

PHP. Как увеличить потребление памяти в 3 и более раз при работе с массивами

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 2.1K
PHP *Серверная оптимизация *

1. Общие сведения
2. Увеличиваем потребление памяти вдвое
3. Увеличиваем потребление памяти втрое
4. Взрывное увеличение потребляемой памяти
5. Заключение

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 17

Истории

Пишем роли ansible не ломая прод — особенности check_mode или как правильно его готовить

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 452
DevOps *
Туториал

вы в команде адептов инфраструктуры как код и не только раскатываете свою инфраструктуру, но и обновляете ее и хотите быстро восстанавливать, а это значит что вы должны обеспечивать одну из ключевых концепций ansible - идемпотентность повторных запусков. Для этого вы вынуждены не только писать роли, применяя их в лабораторных условиях, но и применения их на реальной инфраструктуре, о том как дебажить при этом ямлы написано например здесь. Применять код который сделает множество изменений в продакшн - такое себе удовольствие не для слабонервных, поэтому и мы будем пускать его предварительно с флагом --check - в холостую, желая посмотреть те изменения которые будут внесены в целевую инфраструктуру.

чекаем туториал
Всего голосов 8: ↑6 и ↓2 +4
Комментарии 0

Отладка плэйбуков ansible

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 1.1K
DevOps *
Туториал

Рябятаньки в этом руководстве я постараюсь рассказать как дебажить playbookи, устраняя потенциальные проблемы, не дожидаясь обезвреживания продакшена. Если вы читаете это, то я уверен что вы, также как и я, прочитали десяток статей о том как установить ansible и запускать (применять - режет слух) плэйбуки для конфигурирования всего до чего дотягивается руки.

узнать как дебажить
Всего голосов 9: ↑7 и ↓2 +5
Комментарии 0

9 ИИ-сервисов в помощь разработчику: используем возможности нейросетей на полную

Время на прочтение 4 мин
Количество просмотров 1.6K
Блог компании МТС Облачные сервисы *Искусственный интеллект

Недавно мы публиковали статью «Плагины ChatGPT, которые помогут в работе — и не только программистам». В ней говорилось о плагинах ChatGPT, которые серьёзно облегчают жизнь большинству специалистов, связанных с IT. Сегодня давайте обсудим сервисы, которые предназначены для помощи исключительно программистам. С каждым днём таких сервисов всё больше, и наиболее интересные из них мы разместили в новой подборке.

Читать далее
Всего голосов 11: ↑8 и ↓3 +5
Комментарии 0

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 1.2K
Python *Машинное обучение *Искусственный интеллект Умный дом Data Engineering *

Всем привет!

Возвращаясь к бытовому применению нейронных сетей, изначально была идея усовершенствовать модель детекции свободного парковочного места из предыдущей моей статьи (Определение свободного парковочного места с помощью Computer Vision), сделать возможность сегментации дороги, тротуара и исключать из парковочных мест, автомобили, которые стоят на газоне (было несколько гневных комментариев на этот счёт).

Однако в процессе размышлений, я решил сделать отдельную модель сематической сегментации, причем написать вручную нейросеть и обучить на своих данных. Суть модели заключается в следующем:

Модель на базе U-Net архитектуры сегментирует различные объекты (кот, стул, стол, тарелка с котлетами итд) и при сближении двух объектов сегментации (кот - тарелка) модель сигнализирует об этом с помощью телеграмм бота.

Отлично, задача поставлена, теперь реализация!

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 1

BI по-русски: что умеют BI-решения, доступные отечественному бизнесу

Время на прочтение 5 мин
Количество просмотров 1.5K
Блог компании beeline cloud Big Data *Визуализация данных *Хранение данных *

Мы в beeline cloud постоянно изучаем тренды рынка BI: как он меняется с развитием ИИ и ростом спроса на отечественный софт. А сегодня хотим рассказать о том, кто и зачем использует системы бизнес-аналитики, а также посмотреть на возможности ключевых игроков, представленных в России.

Читать далее
Всего голосов 13: ↑8 и ↓5 +3
Комментарии 10

Device Twins и подвеска автомобиля: найдите 10 совпадений

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 1.2K
Блог компании SIBlink Облачные вычисления *Интернет вещей
Мнение

Казалось бы, что может быть общего между такими разными вещами: рычагами, подшипниками и ступицами и виртуальной сущностью в облаке? Давайте искать.

Колесо автомобиля - это главное, что связывает его с физической реальностью вокруг (ДТП и сотрудников ГИБДД рассматривать не будем). Так же и устройства Интернета вещей (IoT) связывают его с физической реальностью, поэтому такие системы иногда называют кибер-физическими. Как кантилевер атомного силового микроскопа сканирует наномир, так колесо автомобиля сканирует дорожный ландшафт. Что при этом делает подвеска? Она помогает колесу делать свою работу максимально эффективно.

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 3

Data Consistency: как быть уверенным, что с данными всё ок

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 1.3K
SQL *Data Mining *Big Data *Data Engineering *
Туториал

Я довольно долгое время работала аналитиком в Яндекс.Метрике - системе web аналитики. Такие системы помогают сайтам собирать и анализировать поведение пользователей на их сайтах.

Естественно, в таких продуктах как аналитические системы, данные - это главная ценность. Поэтому одна из моих задач как аналитика был мониторинг того, что с данными всё ок.

В этой статье я хочу поделиться своим опытом по решению этой комплексной задачи и бонусом покажу примеры использования array функций в ClickHouse, которые могут помочь вам посчитать действительно сложные метрики.

Поехали
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 1

Мой терминал: alacritty, zsh, tmux, nvim

Время на прочтение 7 мин
Количество просмотров 4.4K
Настройка Linux *VIM **nix *Софт
Из песочницы

В этой статье я расскажу о том, как я выстроил работу с терминалом в Linux под себя и какие инструменты использовал для этого.

Читать далее
Всего голосов 26: ↑23 и ↓3 +20
Комментарии 23

Реквием по красной панде

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 3.2K
DevOps *Data Engineering *
Ретроспектива

Apache Kafka - давно уже стала стандартом для распределенного лога, буфера для потоков данных. Можно сказать, что технология прочно вошла в разряд "скучных". Множество статей на хабре, медиуме, видео на ютубе, обширное сообщество в телеграме. Подводные камни известны, специалистов много, уровень зрелости дошел до такой стадии, что начали принимать достаточно сложные KIP типа отказа от Apache Zookeeper и т. п.

Но мы же айтишники, зуд улучшательства и непрерывного повышения качества (чтобы ни скрывалось под этой фразой) у нас в крови. И вот она - Redpanda, которая обещает нам полную совместимость с протоколом kafka, и еще кучу бонусов сверху.

Привет, меня зовут Стас, последние 5 лет я работаю на позиции data platform engineer. Из них Apache Kafka была одной из составляющих моих платформ данных около 3 лет. Эта статья будет итогом более чем полугода эксплуатации в продуктиве кластера redpanda. Спойлер: вчера я поднял из гита удаленные плейбуки для кафки и вернул ее в продакшн обратно, прощай мечта...

Читать далее
Всего голосов 20: ↑19 и ↓1 +18
Комментарии 12

Налоговые льготы для ИТ-компаний: детали из практики применения

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 511
IT-инфраструктура *Законодательство в IT Финансы в IT
FAQ
Recovery mode

В условиях принятых мер налоговой поддержки российским ИТ-компаниям, являющимся плательщиками налога на прибыль и страховых взносов, законодательство дает возможность воспользоваться пониженной (нулевой) налоговой ставкой по налогу на прибыль, применить пониженный тариф страховых взносов.

Названные льготы действуют для периода 2022 - 2024 годов.

Читать далее
Всего голосов 6: ↑3 и ↓3 0
Комментарии 0

Как сделать из Python-скрипта исполняемый файл

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 7.8K
Блог компании Southbridge Python *Big Data *Data Engineering *
Туториал
Перевод

Вы изучаете данные и хотите поделиться своим кодом Python с другими, не раскрывая исходный код и не требуя от них установки Python и других компонентов? Если да, то вас может быть интересна конвертация вашего скрипта Python в исполняемый файл.

Читать далее
Всего голосов 24: ↑15 и ↓9 +6
Комментарии 10

Балансировка нагрузки: простыми словами о всей мощи двух случайных вариантов

Время на прочтение 7 мин
Количество просмотров 2.9K
Блог компании Издательский дом «Питер» Программирование *Алгоритмы *Серверная оптимизация *Распределённые системы *
Перевод
image

В мире динамического выделения ресурсов и балансировки нагрузки есть много интересных алгоритмов, но один из самых известных и занимательных – так называемый «метод двух случайных выборов». Он привносит очень простое изменение в процедуру случайного выделения ресурсов, а качество результатов от этого улучшается экспоненциально. Мне посчастливилось реализовать именно эту технику в гигантском масштабе, чтобы оптимизировать использование ресурсов в AWS Lambda, но мне всё равно долго не удавалось «прочувствовать» этот метод интуитивно. В этом посте хочу познакомить вас с той метафорической картиной этого алгоритма, которую я для себя составил, и которая очень удобна для понимания других продвинутых техник в этой области.
Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 3

Типичная задача на собеседовании: URL Shortener

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 19K
IT-инфраструктура *Usability *Accessibility *Хранилища данных *
Кейс
Recovery mode

Один из моих знакомых недавно сходил на собеседование, на котором его попросили спроектировать укорачиватель ссылок. Он растерялся и задачу — как хотел интервьюер — не осилил, а потом нашел в интернете популярное решение и попросил меня прокомментировать. Полная формулировка поставленной проблемы: «Как бы вы разработали службу сокращения URL-адресов, подобную TinyURL

К моему сожалению, я — человек любознательный, поэтому я не закрыл окно чата, а пошел почитать, как принято в высшем свете такую задачу нынче решать. То, что я увидел, заставило меня набросать свою собственную архитектурку, потому что даже в страшном сне согласиться с предложенным по ссылке дизайном — не вариант. В тексте ниже я заочно дискутирую с автором решения по ссылке выше.

Читать далее
Всего голосов 42: ↑28 и ↓14 +14
Комментарии 84

Июньский дайджест нового серверного оборудования

Время на прочтение 5 мин
Количество просмотров 2K
Блог компании Selectel IT-инфраструктура *Облачные сервисы *Компьютерное железо IT-компании

Производители оборудования каждый день засыпают нас новостями о новинках и изменениях в продуктах. Для того, чтобы оставаться на волне, мы в Selectel следим за этими новостями, а подходящее и актуальное железо внедряем и используем в наших дата-центрах.
Мне показалось интересным рассмотреть ряд «‎железных» новостей, а также кратко рассказать об опыте и планах использования некоторых новинок.

Заинтересовало? Тогда приглашаю под кат.
Читать дальше →
Всего голосов 35: ↑35 и ↓0 +35
Комментарии 1

Data Quality в банке — знаем цену каждой ошибки

Уровень сложности Простой
Время на прочтение 11 мин
Количество просмотров 499
Блог компании Газпромбанк Big Data *Data Engineering *

Финансовый сектор уже давно одна большая "дата", когда банк принимает решение о том, выдать ли человеку или компании кредит, он анализирует сотни метрик. Я руковожу стримом Data Quality в Газпромбанке и расскажу о том, как мы решаем проблемы при интеграции с внешними источниками информации, какие оценочные метрики используем и как экспериментируем с моделями, прогоняя неверные данные.

Откуда берутся ошибки и чем внешние источники данных отличаются от внутренних

Чем больше данных, тем больше проблем, связанных с их качеством, причем к ошибкам может привести огромное количество причин.  Некоторые — банальные. Например, оператор при вводе персональных данных неправильно перепечатал ФИО из паспорта. Есть ошибки в проектировании систем. Скажем, разработчики проигнорировали требование к длине поля ввода данных. Например, поле «Паспорт выдан» ограничили 35 символами. Понятно, что нужно больше, но в системе сохраняются только первые 35 введенных символов: «ФМС Тверского района по городу Моск». Бывает, не учли, что какие-то данные вообще надо сохранять, а они потом потребовались. Например, пол клиента. Могут возникнуть сложности, связанные с потерей части данных при передаче информации из системы в систему в ходе ETL/ELT-процессов. При этом стоит разделять проблемы с качеством внутренних данных, которые находятся во внутрикорпоративных системах, и внешних, поступающих из сторонних источников. У нас в банке отлажены процессы по улучшению качества данных (КД), поэтому оно постоянно растет и стабильно выше, чем КД из внешних источников.

еще про данные
Всего голосов 3: ↑1 и ↓2 -1
Комментарии 1

Как настроить подключение к ClickHouse в FineBI V6.0?

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 238
Визуализация данных *Хранилища данных *
Туториал

В последнее время в работе часто сталкиваюсь с вопросом про подключение FineBI V6.0 к ClickHouse - столбцовой системе управления базами данных (СУБД) для онлайн обработки аналитических запросов (OLAP). Ловите пошаговую инструкцию.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0