Как стать автором
Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

Swirl для анализа корпоративных данных: как мы использовали ИИ-поиск и что из этого вышло

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 90
Обзор

При решении задачи поиска мы столкнулись с проблемой интеграции разнородных источников данных и обеспечения максимальной релевантности результатов. У нас накопилось много разрозненной информации в разных форматах и системах, что сильно осложняло поиск.

В итоге мы решили попробовать Swirl - поисковую платформу с открытым исходным кодом, созданную на Python и Django, позволяющую объединить поиск в базах данных (SQL и NoSQL), облачных сервисах, поисковых провайдерах, хранилищах данных и таких инструментах, как Miro, Jira, GitHub и т.д., а на выходе получить результаты с аналитикой от ChatGPT.

Для разработчиков и компаний, которые также хотят оптимизировать и упростить поиск, эта информация может быть полезна. Приглашаем познакомиться!

Читать далее
Всего голосов 1: ↑0 и ↓1 -1
Комментарии 0

Новости

Реляционные системы управления базами данных становятся проблемой. Что с этим делать?

Время на прочтение 9 мин
Количество просмотров 2.7K
Мнение
Перевод

С реляционными базами данных я знаком очень давно, с конца 90-х. Мои первые шаги в мире компьютеров и программирования связанны именно с ними. Реляционным БД было отведено особое место в моей образовательной программе и стажировке на инженера-программиста. Они преследовали меня на протяжении всей моей карьеры. Я буквально провалился на самое дно кроличьей норы реляционных систем управления базами данных (РСУБД) – и до сих пор люблю их.

За годы работы я испробовал практически все РСУБД, а их попадалось мне немало: MySQL, Postgres, Oracle, Microsoft SQL Server, DBase, Access, SQLite, DB2, MariaDB, AWS RDS, Azure SQL, Google Cloud SQL. Нельзя любить РСУБД, если не любишь SQL, а это отдельная вселенная. И не все SQL одинаковы. Есть MySQL со своим собственным жаргоном, есть T-SQL от Microsoft и всемирно известный PL/SQL от Oracle. Наверное, не стоит упоминать, что все они несовместимы друг с другом.

Читать далее
Всего голосов 12: ↑9 и ↓3 +6
Комментарии 8

MLOps на примере прогноза движений акций с помощью MLRun

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 872
Туториал

MLOps: структурирование пути от концепции модели к ее реальному воздействию

В современном мире, основанном на данных, машинное обучение является символом инноваций. Однако преобразование модели из теоретической конструкции в готовый к использованию инструмент — сложная задача. Откройте для себя MLOps — гармоничное сочетание «машинного обучения» и «операций», созданное для решения этой сложной задачи.

Черпая вдохновение из DevOps в разработке программного обеспечения, MLOps объединяется вокруг основных задач, предлагая структурированный путь для проектов ML на протяжении всего их жизненного цикла.

Теперь давайте углубимся в мир MLOps с помощью MLRun.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 1

Airflow vs NiFi: исследуем оркестратор для формирования витрин данных

Уровень сложности Средний
Время на прочтение 19 мин
Количество просмотров 812
Обзор

Сегодня концепция витрин данных является стандартом и используется повсеместно. Поэтому даже небольшим компаниям важно определиться с помощью каких инструментов они будут решать проблему оркестрации процессов построения витрин. Какой инструмент в условиях относительно небольшого бюджета позволит достигать поставленных целей? Этот вопрос мы и постараемся раскрыть в статье. Для этого рассмотрим два известных инструмента: Airflow и NiFi, а также постараемся выявить их сильные и слабые стороны.

Читать далее
Всего голосов 7: ↑4 и ↓3 +1
Комментарии 6

Истории

NAS и SAN: основные характеристики, принцип работы и применение решений

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 1.4K
Обзор

Сетевое хранилище (NAS) и сети хранения данных (SAN) — это два ключевых подхода к организации хранилища в сети, которые позволяют пользователям обмениваться данными независимо от их местоположения, что особенно актуально для работы геораспределенных команд.

Несмотря на то, что оба метода предоставляют быстрый и экономичный способ управления большими объемами данных, они отличаются друг от друга. В этом материале мы рассмотрим основные характеристики NAS и SAN, принцип работы решений и применение каждого из них.

Читать далее
Всего голосов 14: ↑11 и ↓3 +8
Комментарии 7

Keycloak ― построение отказоустойчивого кластера

Время на прочтение 6 мин
Количество просмотров 1.6K

Разворачивая у нас в Туту Keycloak мы столкнулись с необходимостью создания отказоустойчивого кластера. И если с БД всё более менее понятно, то вот реализовать корректный обмен кэшами между Keycloak оказалось довольно непростой для настройки задачей.

Мы упёрлись в то, что в документации Keycloak описано как создать кластер используя UDP мультикаст. И это работает, если у вас все ноды будут находиться в пределах одного сегмента сети (например ЦОДа). Если с этим сегментом что‑то случится, то мы лишимся Keycloak. Нас это не устраивало.

Необходимо сделать так, чтобы ноды приложения были географически распределены между ЦОД, находясь в разных сегментах сети.

В этом случае в документации Keycloak довольно неочевидно предлагается создать свой собственный кастомный JGroups транспортный стэк, чтобы указать все необходимые вам параметры.

Бонусом приложу shell скрипт, написанный для Consul, который предназначен для снятия анонсов путём выключения bird и попытки восстановления приложения.

Читать далее
Всего голосов 13: ↑13 и ↓0 +13
Комментарии 2

Как начать работать с IPv6 там, где его нет (часть 2)

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 1.8K
Туториал

В настоящее время основным подходом к внедрению IPv6 является dual-stack, когда устройство одновременно настроено на функционирование обоих IP-протоколов. Это и понятно, ведь основная часть интернета работает на версии IPv4. Механизм 6to4 позволяет подключить ваше устройство IPv4 к брокеру, создав туннель в IPv6.

В первой части цикла статей показана настройка облачного маршрутизатора на routeros. В текущем материале продолжим раскручивать полученное решение, а затем перенесём соединение с брокером на Linux. Но сначала отдельно поговорим о сетевой безопасности подключаемого к IPv6 оборудования. Для понимания происходящих процессов рекомендуется ознакомиться с предыдущей статьёй, так как с целью исключения болтологии вводный материал повторяться не будет.
Читать дальше →
Всего голосов 30: ↑30 и ↓0 +30
Комментарии 4

EVM — определение масштаба

Время на прочтение 6 мин
Количество просмотров 278
Recovery Mode

Виртуальная машина Ethereum - это вычислительный механизм и программная платформа, функционирующая как децентрализованный компьютер.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Бесшовный апгрейд ПО для системы хранения данных: как организовать и улучшить

Время на прочтение 14 мин
Количество просмотров 1.3K

Любое программное обеспечение необходимо обновлять — ПО для систем хранения данных (СХД) не исключение. Логика апгрейда в СХД не тривиальна. В системе есть несколько контроллеров хранения, обновлять которые нужно последовательно, учитывая все возможные риски — потерю отказоустойчивости, конфликт версий и другие. При этом даунтайм сервиса или миграция данных на другую систему — варианты, которые не устроят ни одну компанию.

Я Владимир Приходько, руководитель отдела разработки подсистем управления в компании YADRO. Вместе с командой мы развиваем пользовательский функционал СХД. В тексте расскажу о специфике бесшовного обновления ПО в системах хранения данных и дам рекомендации, как выстроить этот процесс с учетом лучших практик. Все описанные подходы мы с командой успешно используем в обновлении СХД TATLIN.UNIFIED

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 1

Перенос Docker на другой диск в Windows

Время на прочтение 2 мин
Количество просмотров 1.8K
Кейс

Всем привет! Недавно я столкнулся с проблемой нехватки памяти на основном диске под крупный проект, который разворачивается в Docker. Вопрос переноса ресурсов Docker на HDD в 1ТБ стоят принципиально, так как не было других вариантов развернуть проект. И вот, что из этого вышло...

Читать далее
Всего голосов 10: ↑8 и ↓2 +6
Комментарии 11

Применение нейросетевых подходов для формирования признаков в моделях

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 707
Обзор

Наша команда Графовой аналитики стрима Моделирование КИБ и СМБ занимается различными исследовательскими задачами для двух основных направлений: риск- и бизнес-моделирования.

В данной статье мы расскажем о том, как продвинутые подходы машинного обучения, в частности нейронные сети, помогают генерировать признаки для моделей, сокращая трудозатраты на проработку гипотез и операционные издержки при подготовке данных для моделей.

Интересно? Поехали...
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 0

Построение системы контроля доступа в логистических комплексах: кейс маркетплейса OZON

Время на прочтение 4 мин
Количество просмотров 893
Кейс
Recovery Mode

Сегодня расскажем о работе СКУД PERCo на объектах маркетплейса OZON.

При организации СКУД на объектах маркетплейса важно было обеспечить бесперебойность работы и быстродействие системы, так как любой сбой может привести к значительным издержкам. 

Не менее важный фактор –  способность системы оперировать большими объемами данных. В настоящее время система обрабатывает более 250 000 идентификаторов. В состав системы входят 850 универсальных контроллеров, которыми управляет один сервер. 

Также была необходимость построения распределенной СКУД – компания OZON располагает 18 складами и 70 распределительными и сортировочными центрами по всей стране. 

Основные задачи при построении СКУД были следующие:

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 1

Почему инфраструктура big tech обычно состоит из самописных решений

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 3.5K
Мнение

Привет! Предлагаю поговорить о том, почему крупные IT‑компании так любят создавать в своей инфраструктуре собственные решения. Казалось бы, напрашивается ответ: NIH‑синдром и ничего более. Но такой ответ вряд ли может считаться сколько-нибудь полным, а тем более претендующим на объективность.

Меня зовут Дмитрий, я CTO в команде Yandex Platform Engineering. Наша задача — помогать инженерам выстраивать весь цикл разработки от написания кода до эксплуатации сервисов и делать его эффективнее. Такая работа включает настройку процессов: мы не просто делаем нечто as a service, но и помогаем эти самые as a service внедрять внутри компании. И всё это работает на масштабах Яндекса: нашими сервисами пользуются тысячи разработчиков по всей компании.

На собственном опыте я знаю, какие мотивы и пути развития ведут к появлению самописных инструментов. Постараюсь выделить системные причины их создания на конкретных примерах наших решений.

Читать далее
Всего голосов 28: ↑27 и ↓1 +26
Комментарии 7

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
Joker
Дата 9 – 14 октября
Время 16:00 – 19:30
Место Санкт-Петербург Онлайн
Открытый урок «Kafka Streams»
Дата 16 октября
Время 10:00
Место Онлайн
Вебинар онлайн-курса «DevOps 1C»
Дата 16 октября
Время 20:00 – 21:30
Место Онлайн
Питч-сессия pravo (tech) impulse
Дата 19 октября
Время 15:45 – 17:30
Место Москва
Вебинар «Разработка бэкенда на Clojure»
Дата 24 октября
Время 20:00 – 21:30
Место Онлайн
Russia Risk Conference 2023 — 19-я конференция по риск-менеджменту
Дата 25 – 26 октября
Время 10:00 – 19:00
Место Москва Онлайн
HolyJS
Дата 2 – 12 ноября
Время 15:00 – 19:00
Место Санкт-Петербург Онлайн
IT Recruiting – HR Forum 2023
Дата 8 – 10 ноября
Время 9:00 – 18:00
Место Москва
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн

Делаем HMI-панель из планшета для системы автоматизации на контроллере Wiren Board

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 4.4K
Туториал

Система автоматизации обычно работает автономно без участия пользователя, но единая точка контроля и управления системой всё равно нужна: вмешаться в работу автоматических алгоритмов, внести изменения в параметры или просто проверить, что система работает верно.

В комплекте с контроллером Wiren Board идёт программное обеспечение, которое позволяет закрыть большинство задач построения и эксплуатации системы автоматизации: графические и текстовые панели, архив данных с графиками, драйверы для устройств, скрипты wb-rules.

В статье мы сделаем панель графическую управления автоматизацией двухкомнатной квартиры, где есть: кухня, коридор, санузел, спальня и зал.

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 1

Виртуализация мечты: работаем над дорожной картой развития систем виртуализации

Уровень сложности Простой
Время на прочтение 1 мин
Количество просмотров 703

Уважаемые Хабровчане!

Как вы, наверняка, знаете, производителей отечественных систем виртуализации существенно больше, чем производителей СХД. Навскидку, более 30 российских компаний занимаются данным классом продуктов, с различными подходами к разработке и продаже данных решений. Однако, на просторах рунета не утихают горячие споры о том, что не хватает даже многих базовых функций виртуализации, не говоря уже о каких-то «вишенках на торте», обсуждаемых на ежегодных форумах в Каталонии.

Поэтому мы предлагаем пройтись новым «хаброопросом» по базовым функциям систем виртуализации, которые жизненно необходимы вам, нашим текущим или потенциальным заказчикам.

Среднее время прохождения - 5 минут, а сам опрос находится по ссылке.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 1

10 забавных сервисов в области ИИ

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 13K

Привет, Хабр!

Генерирую я значит через сервис ИИ новые эмодзи и думаю, а почему бы не написать прямо сейчас статью про это и поделиться с Вами 10 сервисами, которые мне показались забавными. Кого-то из Вас они могут натолкнуть на ещё более интересные идеи или мысли.

Меня зовут Рушан, и я автор Telegram-канала Нейрон. Сегодня в этой статье поделюсь с Вами 10 полезными сервисами в области ИИ и ML, которые мне показались интересными. Надеюсь, статья поможет и Вам узнать что-нибудь нового.

Итак, погнали:

Читать далее
Всего голосов 29: ↑20 и ↓9 +11
Комментарии 9

Илья Поляков: как мы выявили уязвимость в 6 версиях FortiNAC и получили за это премию Pentest Awards

Время на прочтение 4 мин
Количество просмотров 550

Илья Поляков,@e_liu_ha, руководитель отдела анализа кода Angara Security, рассказал, как удалось выявить важную уязвимость в 6 версиях линейки FortiNAC для аутентификации пользователей по протоколу 802.1X и получить премию Pentest Awards в категории Bypass.

Эта история началась в январе 2023 года, когда мы исследовали при­ложе­ние FortiNAC и нашли цепоч­ку дефек­тов и уяз­вимос­тей: облегча­ющую ревер­синг дебаго­вую информацию в ском­пилиро­ван­ных клас­сах Java, сла­бую крип­тогра­фию, хра­нимую XSS и инъ­екцию команд, поз­воля­ющие соз­дать генера­тор лицен­зион­ных клю­чей, которые пос­ле акти­вации выпол­няют про­изволь­ный код от име­ни супер­поль­зовате­ля на сер­вере при­ложе­ния.

Почему FortiNAC? Потому что это одна из самых популярных в мире энтерпрайза систем контроля сетевого доступа (Network Access Control, NAC). Основная задача подобных продуктов — обнаруживать и профилировать любые устройства, которые подключаются к корпоративной инфраструктуре.

Читать далее
Рейтинг 0
Комментарии 0

Как мы Kafka с NestJS microservices подружить пытались

Время на прочтение 11 мин
Количество просмотров 1.9K

Привет, меня зовут Валентин, я NodeJS-разработчик в Сравни. Моя команда делает Profile Service — внутренний продукт, который отвечает за быстрое получение и запись личных данных пользователей для экосистемы Сравни. Мы взаимодействуем с 20+ продуктовыми командами, которые дают нагрузку на сервис порядка 200-300 RPS; порядок обрабатываемых записей в БД – десятки миллионов.

В какой-то момент мы решили внедрить Kafka – де-факто стандарт транспорта, работающий в миллионах проектов. Что может пойти не так? Оказалось – вообще всё что угодно. 

В этой статье я расскажу, с какими неочевидными проблемами мы столкнулись при переходе на Kafka у нас в продукте, как мы чинили баги в NestJS Microservices и какие выводы сделали (спойлер: Kafka – не всегда хорошее решение). 

Приступим!

Читать далее
Всего голосов 18: ↑15 и ↓3 +12
Комментарии 9

Обзор отечественной операционной системы РЕД ОС

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 13K
Обзор

РЕД ОС — это российская операционная система на базе ядра Linux, которая разработана компанией РЕД СОФТ с использованием открытых исходных кодов и собственных решений. РЕД ОС имеет ряд преимуществ, которые делают её привлекательной для различных сфер применения. В этой статье мы расскажем о некоторых из них.

Читать далее
Всего голосов 47: ↑20 и ↓27 -7
Комментарии 70

Запускаем новые GitLab Auto-scaling раннеры в Yandex Cloud

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 757

И снова здравствуйте! В этой статье я хочу продолжить вопрос динамических gitlab-раннеров, которые запускаются в Яндекс Облаке. В прошлой статье мы рассмотрели старый подход, основанный на docker-machine. 

Естественным будет вопрос: «Чем плох docker-machine?» И тут такой же простой ответ: «Ничем, он хорош». Но  хорош он ровно до момента его промышленного использования.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0