Как стать автором
Обновить

Разработка

Сначала показывать
Порог рейтинга
Уровень сложности

Запуск альфа-теста Капибара(Новый Старый Пикабу)

Время на прочтение 9 мин
Количество просмотров 832

Продолжу рассказывать о развитии Капибары, опенсорсном проекте, цели которого воспроизвести лучшее что было на пикабу и не наступить на их же "грабли". Первая часть здесь: https://habr.com/ru/articles/759598/. Первый официальный пост о прогрессе в разработке на новом сайте здесь: https://www.kapi.bar/post/dnevnik-razrabotki-kapibary-ot-10-xi-2023. Но обо всем по порядку.

Пару недель назад у нас стартанул полу-закрытый альфа-тест. Сейчас выдаём ранний доступ на сайт kapi.bar отважным авторам-альфатестировщикам и активным комментаторам взамен просим слать нам багрепорты и пока быть самим себе модераторами. Функционал для создания постов, комментариев и выставления оценок для них есть. Ленты "Новое", "Тренды", "Топ", "Обсуждаемое" и поиск по тегам уже работают и доступны для чтения всем желающим.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 3

Новости

Как заменить пропущенные значения в Pandas

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 538

Давайте рассмотрим распространенную проблему с пропущенными данными и способы ее решения.

Иногда, когда мы анализируем данные, некоторые значения могут быть утеряны. Обычно пропущенные данные обозначаются в виде вопросительных знаков, нулей или пустых ячеек. Например, в таблице нормализованных потерь присутствует пропущенное значение, представленное как NaN.

Кстати, подписывайтесь на наши социальные сети, мы туда еженедельно публикуем топовый контент! Вот наш канал в телеграм и группа ВК.

Таблица 1: Пример набора данных о машинах

| Марка   | Модель  | Год выпуска | Цена | Нормализованные потери | Тип топлива |

|---------|---------|-------------|------|------------------------|-------------|

| Toyota  | Corolla | 2019        | 15000| 134                    | Бензин      |

| Honda   | Civic   | 2020        | 17000| NaN                    | Дизель      |

| Ford    | Mustang | 2018        | 25000| 235                    | NaN         |

| Subaru  | Outback | 2017        | NaN  | 178                    | Бензин      |

| Hyundai | Elantra | 2021        | 18000| 156                    | Гибрид      |

| Nissan  | Sentra  | 2019        | 15500| 170                    | Бензин      |

Давайте сразу создадим датафрейм, чтобы мы дальше могли уже сразу обсуждать варианты обработки пропущенных данных на этом примере.

Читать далее
Всего голосов 9: ↑0 и ↓9 -9
Комментарии 0

«Вредные привычки» российских IT-заказчиков

Время на прочтение 4 мин
Количество просмотров 3K

Привет, Хабр. На связи Максим Иванов, директор по развитию компании Modus.

Я лично и мы в целом в компании любим и свою работу, и наших заказчиков. Российский рынок в целом сложный – сложнее только Ближний Восток и Азия, и ему присущи свои «вредные привычки, но иногда попадаются заказчики, проекты которых в самом начале «пахнут жареным». Про такие привычки и про то, какие проекты и каких заказчиков мы не берем, я и расскажу.

Читать далее
Всего голосов 11: ↑5 и ↓6 -1
Комментарии 2

Разворачивание первого приложения с Kubernetes

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 1.6K

Во времена популярности микросервисной архитектуры появляется все больше потребности в платформах и решениях для автоматизации сложных или нереализуемых вручную процессов. Например, когда нам нужно работать с высоконагруженными приложениями, имеющими свои крутые пики и просадки посещаемости, было бы очень сложно построить архитектуру без использования Docker-контейнеров (виртуальных машин), которые позволяют разбивать приложение на части, взаимодействующие друг с другом. Однако задача становится еще более сложной, если мы работаем с приложением, которое делится на другие приложения, которые в свою очередь разделены на контейнеры, и вся эта система обрабатывает миллионы запросов пользователей и хранит невообразимый объем информации.

Яркие примеры таких приложений: YouTube или Google. Естественно, на одной машине такие сервисы не развернуть, поэтому в архитектуре используются тысячи компьютеров, именуемых Нодами (worker node). Однако эти Ноды, как части общего механизма, могут выходить из строя, и тогда их нужно заново поднимать, более того, хорошо бы вообще постоянно мониторить каждый Нод и считывать его состояние. Выполнять такие задачи становится очень сложно вручную. И, возможно, именно для этих площадок, а может быть и нет, но Google разработала технологию Kubernetes, которая выполняет роль оркестрации контейнеров. Kubernetes следит за Нодами и поднимает те, что выходят из строя, но это не единственная ее задача. Технология также может отключать неиспользуемые Ноды, оптимизируя расход ресурсов.

Читать далее
Всего голосов 2: ↑0 и ↓2 -2
Комментарии 1

Истории

It's a mod, mod world: как моддинг произвел революцию в разработке игр

Время на прочтение 7 мин
Количество просмотров 1.4K

Для некоторых ПК-геймеров игровые модификации — решающее преимущество перед консольными игроками. Хотя разработчики — например, компания Capcom — иногда рассматривают моддинг как проблему, которая может негативно сказаться на репутации игр.

Ранее мы об этом не задумывались и даже создавали свои моды. Однако вопрос дискуссионный. Чего моды приносят больше: пользы или вреда? Давайте разбираться.
Читать дальше →
Всего голосов 19: ↑18 и ↓1 +17
Комментарии 12

Разговор с Алексеем Усановым из Positive Technologies о реверс‑инжиниринге и создании книги по этой специализации

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 776

Это первый материал по «ИТ‑Пикнику», проходившему 2 сентября 2023 года. Будет отдельный обзорный материал мероприятия, а пока хочу представить интервью с руководителем направления исследований безопасности аппаратных решений компании Positive Technologies (РТ) Алексеем Усановым.

Осматривая стенды на «ИТ‑Пикнике», я заглянул на стенд Positive Technologies. Там проходила лекция, я заинтересовался темой и решил послушать. Лекция была посвящена реверс‑инжинирингу в информационной безопасности. Я раньше с темой сталкивался только в контексте создания игр. Когда энтузиасты делают клон игры, но у них нет исходников и советов от разработчиков, только внешний вид игры и примерные представления, на каком движке она была создана. Оказывается, в ИБ это довольно знаковая область. Немного подумав после лекции, я поймал Алексея Усанова и поговорил с ним на тему реверс‑инжиниринга в ИБ, кстати, оказалось, что он написал целую книгу об этом.

Читать далее
Всего голосов 10: ↑8 и ↓2 +6
Комментарии 0

GigaSearch или Поисковая система на GigaChat

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 1.5K

Галлюцинации — это явление, которое до недавнего времени было привилегией человеческого сознания. Однако, с развитием текстовых генеративных моделей, таких как GigaChat и ChatGPT, возникла возможность наблюдать подобные "иллюзии" и в мире искусственного интеллекта.

Есть случаи, когда галлюцинации генеративной модели вполне уместны. Например, если вы попросите модель сгенерировать детскую сказку, то наличие в ней выдуманных персонажей и событий будет весьма кстати и понравится малышу.

Но мы точно не хотим получать выдуманную информацию про реальных людей или события. Кому интересно почитать о том, как мы боремся с галлюцинациями в GigaChat — добро пожаловать под кат.

Читать дальше
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 3

Kubernetes Scheduler в Деталях: Ключевые Концепции. Часть 2

Уровень сложности Сложный
Время на прочтение 13 мин
Количество просмотров 853

В мире, где Kubernetes доминирует в управлении контейнеризированными приложениями, один вопрос часто встаёт перед теми, кто стремится понять его внутренние механизмы: 'Как на самом деле работает k8s scheduler?' Эта статья предназначена для развенчания мифов и предоставления чёткого объяснения работы Kubernetes планировщика. Мы исследуем ключевые моменты этого процесса, начиная от того, назначает ли планировщик модули узлам один за другим в очереди или выполняет эту задачу параллельно, и заканчивая более сложными аспектами его работы. Погрузитесь в детали этой сложной, но увлекательной темы вместе с нами, чтобы лучше понять, как Kubernetes оптимизирует размещение подов в вашем кластере

Погружение в Мир Kubernetes Scheduler
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 0

Дежурный data-инженер: рабочие хроники

Время на прочтение 15 мин
Количество просмотров 817


Команда VK Cloud перевела серию статей о том, как data-инженер принимает вызовы технической команды по работе с платформой данных. Он рассказывает о реальных неисправностях, которые возникают в процессе работы, и о том, как команда работы с данными их устраняет.
Читать дальше →
Всего голосов 2: ↑1 и ↓1 0
Комментарии 0

Освобождение робота-пылесоса, который стал моим другом

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 5.7K
Немного доп. оборудования, несколько команд Linux и вуаля! Пылесос свободен! Фото Cath Virginia / The Verge

В целом роботы-пылесосы мне нравятся. Для меня это эдакий небольшой друг, который чистит за меня пол. Просто фантастика. Но, к сожалению, есть одна проблема — я им не доверяю. Эти девайсы постоянно отправляют отчёты на серверы, что может представлять угрозу для безопасности и тайны личной жизни. Мне такое не по духу, и я подумал, что кто-то уже должен был хакнуть эту схему. После недолгих поисков в интернете я понял, что прав. Мне попался проект Valetudo, нацеленный на освобождение роботов-пылесосов от связи с облаком.
Читать дальше →
Всего голосов 56: ↑56 и ↓0 +56
Комментарии 19

Subject объекты в RxDart и чем они полезны Flutter-разработчику

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 468

Dart в совокупности с пакетом Async обладает неплохим функционалом в части работы со стримами. Однако ограничения всё ещё есть. Чтобы сделать стримы более удобными, используется пакет RxDart.

Меня зовут Виталий, я Flutter Team Lead в Surf. Это первая статья в цикле публикаций на тему RxDart.

Читать далее
Рейтинг 0
Комментарии 0

Подмена номера: как работает и чем опасна

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 2.2K

По данным Банка России, только за два квартала 2022 года ущерб клиентов банков от телефонного мошенничества составил совокупно 7 млрд руб. Операции без согласия клиента проводились благодаря звонкам с подменой телефонного номера. С ее помощью можно выдать свой телефон за номер известной организации и тем самым обмануть доверчивого абонента. Рассмотрим, как функционирует данная технология, может ли ее использовать любой человек, и насколько это для него безопасно.

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Комментарии 2

Разработка через тестирование. Совместное использование JUnit 5 и Mockito

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 762

Привет, Хабр! На связи участница профессионального сообщества NTA Александра Грушина.

Поговорим о важности написания тестов к своему коду, о магии подхода test-driven development. Я расскажу о своём пути: от первого знакомства с концепцией TDD до умелого использования инструментов тестирования на Java (Junit 5 + Mockito).

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 2

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
HolyJS
Дата 2 – 12 ноября
Время 15:00 – 19:00
Место Санкт-Петербург Онлайн
Яндекс Backend Tour
Дата 13 – 26 ноября
Время 18:00 – 23:00
Место Москва Нижний Новгород Екатеринбург Новосибирск Санкт-Петербург Онлайн
Национальный рекламный форум
Дата 15 – 17 ноября
Время 10:00 – 19:30
Место Москва
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
Импульс Т1
Дата 17 ноября
Время 13:00
Место Иннополис Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн
Импульс Т1
Дата 1 декабря
Время 12:30
Место Москва Онлайн

Как Винни Пух и Пятачок стали программистами 1С (День второй. Презентация)

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 1.5K

Барабанная дробь в дверь застала Винни Пуха в момент попытки попить чая с медом, последним делиться как-то не хотелось ни с кем. Судя по доносившимся звукам — это был Пятачок. Помня о договоренности пойти к Ослику Иа на презентацию – такое не до конца понятное и потому пугающее слово для Винни Пуха и главное зачем там что-то представлять? Желтый листок, стог сена, три кнопки с надписями: зеленой «Сделать все хорошо», оранжевой «Вернуть как было», красной «Удалить Все», осликом в центре и еще одним листком со схемой распределения в стиле Пятачка, а попробуй догадаться, где старт, а где финиш  - но раз оговорились, то делать нечего и тяжело пыхтя, Винни поплелся к двери на ходу раздумывая о чем то своем.

Читать далее
Всего голосов 3: ↑1 и ↓2 -1
Комментарии 5

RecTools – OpenSource библиотека для рекомендательных систем

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 1.8K

Если вы когда-либо работали с рекомендательными системами, то знаете, что все необходимые и самые часто используемые инструменты разбросаны по разным библиотекам. Более того, каждая из таких библиотек имеет много уникальных особенностей, к которым нужно приноровиться (например, разные форматы данных на вход).

Выходит, что чтобы просто протестировать на своей задаче базовый пул подходов, нужно немало помучиться. Получается довольно грустно.

К такому же выводу, видимо, пришли ребята из МТС – и выкатили в опенсурс RecTools. Это библиотека, где собраны самые часто используемые модели для рекомендательных систем. Также с её помощью можно максимально просто и быстро оценивать необходимые метрики. 

Давайте же посмотрим, что RecTools умеет, и как с этим работать.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 2

Как департамент утилизации CPU превратился в департамент экономии железа, выдерживающий нагрузку в 1 млн RPS

Уровень сложности Простой
Время на прочтение 26 мин
Количество просмотров 5K

Привет, меня зовут Мария, когда-то я работала на шахте, потом на заводе, а 3.5 года назад пришла в Ozon Tech. Сейчас я старший Golang-разработчик в команде product-facade. Это самый высоконагруженный сервис маркетплейса, но так было не всегда.

Хотите узнать, что скрывается под витриной маркетплейса? Что держит нагрузку в 1 миллион запросов в секунду? Толстые кэши или нечто большее? Про то, как устроено наше кэширование и как мы к этому пришли, — рассказываю в статье.

Читать далее
Всего голосов 64: ↑64 и ↓0 +64
Комментарии 29

Страна-датацентр: корабль с 10 000 Nvidia H100 хочет стать убежищем для разработчиков ИИ. Но всё ли то, чем кажется?

Время на прочтение 7 мин
Количество просмотров 3.5K

Весь мир говорит о стране-датацентре Del Complex. Которая будет плавать по международным водам на корабле с 10 000 GPU Nvidia. И без привязки к законам конкретного государства обеспечивать хранение и обработку глобальных данных.

Новость об этом уже появилась на тысячах сайтов, на всех языках. Но у нас создается впечатление, что все эти журналисты сильно поторопились. И тут всё может быть интереснее (и забавнее), чем они думают.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 24

Безопасный Zookeeper: SASL with Digest-MD5

Уровень сложности Средний
Время на прочтение 20 мин
Количество просмотров 358

Привет! Столкнулся с тем, что быстро не нашел простой инструкции, как с использованием SSL и SASL настроить безопасный кластер из нескольких Linux узлов Zookeeper, и решил это исправить.

В этой статье поговорим о том, как:

Настроить Zookeeper в кластере из трех узлов без шифрования (Plain);

Добавить шифрование во внутрикластерное взаимодействие (Quorum TLS);

Создать сертификаты для подключения к узлам Zookeeper клиентов (Server TLS);

Создать сертификаты для подключения клиентов к узлам (Client TLS);

Добавить авторизацию в шифрованный кластер (SASL with MD5);

Показать на примере, как работают ACL, посмотреть, чем отличается суперпользователь super от всех остальных (как работает ACL в действии).

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 0

Корпуса, кулеры и другие аксессуары для Raspberry 5. Что предлагает рынок

Время на прочтение 3 мин
Количество просмотров 2.2K

Одноплатник Raspberry Pi, вероятно, самый популярный одноплатный компьютер в мире. Для него выпускается огромное количество аксессуаров, модулей и расширений. Для недавно появившегося в продаже Raspberry Pi 5 подходят многие модули предыдущих версий. Но если говорить о корпусе или системе охлаждения, здесь для этой «малинки» мало что подходит от других моделей.

Конечно, свято место пусто не бывает, так что производители начинают выпускать собственные продукты. Вот что предлагает рынок сейчас.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 1

Компромисс смещения и дисперсии в машинном обучении

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 592

Привет Хабр! В этой статье мы рассмотрим такое понятие в машинном обучении, как компромисс смещения и дисперсии (bias-variance Tradeoff). Так как понимание того, что можно изменить в процессе обучения нашего алгоритма обучения, приведет нас к созданию более точных моделей.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 2