Как стать автором
Обновить
324.9

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как начать в DL: книги и курсы

Время на прочтение 3 мин
Количество просмотров 952
Дайджест

What's up guys!

В этой статье мы поговорим о полезных материалах для изучения тем глубокого обучения и немного ИИ. В статье я дам список полезных ресурсов и немного советов по.

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 1

Новости

Попросил нейросеть нарисовать биологические объекты: посмотрите, какая дичь получилась

Время на прочтение 3 мин
Количество просмотров 12K

Привет, я Артем, копирайтер-маркетолог для проектов о здоровье. Постоянно пишу много текстов о медицине и биологии, и мне часто нужны картинки соответствующей тематики. Воровать нехорошо, на стоковых сайтах можно найти далеко не всё, а на дизайнера у клиентов не всегда предусмотрен бюджет. Поэтому недавно решил взять себе в помощники популярную нейросеть Midjourney. Провел эксперимент и попросил ее нарисовать некоторые медицинские, биологические объекты. Смотрите, что получилось (можно ли показывать слабонервным – решайте сами).

Читать далее
Всего голосов 38: ↑25 и ↓13 +12
Комментарии 37

Галлюцинации нейросетей: что это такое, почему они возникают и что с ними делать

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 1.7K
Recovery Mode

Новости о достижениях нейронных сетей появляются практически каждый день — ChatGPT, Midjourney и другие являются суперпопулярными историями в Google Trends. Нейронные сети, похоже, стали всемогущими и могут заменить людей на рабочих местах.

Да, машины в состоянии решить множество задач, но их «мозги» недостаточно хороши. Например, роботы вообще не обладают творческими способностями. Кроме того, у ИИ часто случаются галлюцинации, а потому он не является надёжной заменой человеку. Особенно в тех областях, где речь идёт о жизни и здоровье.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 6

Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 488
Туториал

Привет, Habr !

Я работаю инженером по машинному обучению в Мегафоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки и продуктивизации моделей машинного обучения, предоставлять функционал для основных этапов (сбор данных, MQ/DQ, продуктивизация).

Сегодня поговорим о том, какие сложности могут возникать при работе с кластером Hadoop и какие есть методы для их решения.

Видеозапись по мотивам статьи можно посмотреть здесь.

Эта статья будет интересна аналитикам и инженерам, которые работают с BigData и регулярно сталкиваются с необходимостью продуктивизировать модели на Hadoop.

Затронем следующие темы:

Читать далее
Рейтинг 0
Комментарии 0

Истории

Как развернуть свой собственный ChatGPT, только лучше

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 13K

Бесплатная версия ChatGPT не включает в себя доступ к языковой модели GPT-4 -  самой современной и продвинутой модели от OpenAI. Хотя платная версия снимает эти ограничения за $20 в месяц, однако оплатить её с помощью карты Российского банка тоже не получится

К тому же интерфейс ChatGPT не менялся уже почти год, в то время как сторонние решения предоставляют набор полезных и удобных инструментов уже сейчас.

Читать далее
Всего голосов 26: ↑7 и ↓19 -12
Комментарии 28

Всё идет по плану: как задавать роботу список действий с помощью языковых моделей и голосовых команд

Уровень сложности Средний
Время на прочтение 18 мин
Количество просмотров 546
Кейс

Всем привет! Этим летом мы с командой участвовали в летней школе AIRI, где нам было предложено реализовать учебный проект. Мы выбрали себе задачу на стыке языковых моделей и робототехники. В частности, мы реализовали полноценный фреймворк, в котором можно строить собственные пайплайны для построения системы генерации плана с помощью языковых моделей, причем с интерфейсом ввода на основе распознавания русской речи. Кроме того, мы придумали собственную систему валидирования и подсчета метрик качества выполнения задач.

Работа оказалась настолько сложной и интересной, что нам захотелось рассказать о ней большему числу людей, а не только тем, кто был на школе. Ну а чтобы контекст работы был немного понятнее, мы добавили в наше повествование небольшой обзор методов планирования (в том числе с помощью языковых моделей), а также распознавания речи. Надеемся, наш рассказ будет интересным и полезным. Погнали!

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Когда стоит заменить A/B-тестирование сэмплированием Томпсона

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 531
Туториал
Перевод

Какую рекламу показать пользователю, красную или синюю?

Представьте, что вам нужно выбрать один из двух баннеров: красный или синий. Разумеется, вам бы хотелось показывать пользователю рекламу с наибольшим откликом.

Но как узнать, какой из баннеров имеет наибольший уровень кликабельности?

Чаще всего для ответа на этот вопрос используется A/B-тестирование. Группа пользователей разделяется пополам, и первой части показывают один баннер, а второй — другой. После этого можно вычислить уровень кликабельности и выбрать лучший из вариантов.

Предположим, что в конце A/B-тестирования у вас получились следующие результаты:

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 2

Яндекс Карты открывают крупнейший русскоязычный датасет отзывов на организации

Время на прочтение 6 мин
Количество просмотров 3.2K

Сегодня мы хотим поделиться новостью для всех, кто занимается анализом данных в области лингвистики и машинного обучения. Яндекс выкладывает в открытый доступ крупнейший русскоязычный датасет отзывов об организациях, опубликованных на Яндекс Картах. Это 500 тысяч отзывов со всей России с января по июль 2023 года.

В этой статье я расскажу, чем полезны отзывы с точки зрения исследований, в чём особенность этого датасета, а также покажу примеры задач, которые можно решать с его помощью.

Читать далее
Всего голосов 30: ↑30 и ↓0 +30
Комментарии 4

Распознавание по цвету. Как мы выбирали между классическими алгоритмами и нейросетями

Время на прочтение 7 мин
Количество просмотров 1.7K

В большом проекте по сортировке полезных ископаемых была подзадача, которую нам предстояло решить, — распознавание объектов по цвету. Встал выбор: обучить нейросетевой классификатор или обойтись более простыми алгоритмами классического компьютерного зрения. Рассказываем, что из этого вышло. Также из этой статьи вы узнаете, как рост числа параметров математической модели влияет на ее эффективность, какое решение выбрать, если на анализ объекта дается 200 миллисекунд, о плюсах и минусах классических алгоритмов компьютерного зрения.

Классические алгоритмы или нейросеть?
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 2

Исследования возможностей нейронных сетей глубокого обучения в распознавании маскируемого трафика

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 1.6K
Аналитика

Классификация сетевого трафика является важным процессом, необходимым для правильной организации передачи данных между приложениями, которые его генерируют. Определение трафика в DPI обеспечивает основу для множества сетевых функций, таких как управление, обеспечение безопасности, разделение услуг, полисинг и другие.

В данной статье мы рассматриваем новый подход к классификации прикладных протоколов в сетевых пакетах.

Читать далее
Всего голосов 9: ↑6 и ↓3 +3
Комментарии 1

Python в Excel, базы данных без SQL и трудности в аналитике

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 3.8K
Дайджест

Привет, Хабр! Сегодня — международный день доступа к информации, поэтому делюсь с вами интересными материалами по ML, AI и дата-аналитике. В новом выпуске вас ждут новинки от Nvidia для LLM, три пути развития аналитического стека, инструменты для анализа данных и другое. Еще больше полезных текстов по DataOps и MLOps — в Telegram-сообществе «MLечный путь».
Читать дальше →
Всего голосов 27: ↑27 и ↓0 +27
Комментарии 0

PyTriton inference server c Gradio: быстро и просто делаем демо для ML-проектов

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 1.2K

Рассмотрим то как можно в одиночку быстро создать сервер и UI для ML приложения на Python с перспективой вывода в prod. Исследуем PyTriton и немного Gradio.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0

Как мы создавали self-service функционал проверки качества данных для ML-моделей

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 643
Кейс

Привет! Продолжу рассказ о том, как мы превращаем банк в «биг дата» — организацию. Очевидно, что чем больше данных использует компания, тем больше зависит от их качества. Но, зачастую, вопросам качества данных при разработке витрин уделяется недостаточно внимания. Это связано с тем, что требования к качеству данных не фиксируются в бизнес‑требованиях, а разработчик витрины/инженер данных не всегда досконально знает предметную область. Будущее — за организацией контрольных мероприятий в контуре бизнес‑заказчиков. Этот тренд получил название Self‑Service функции. У нас в Газпромбанке по такому принципу строится проверка качества данных для ML‑моделей. Каждому аналитику/разработчику моделей доступен функционал оценки качества данных любой витрины. Рассказываю, как выстроили такую схему работы.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 1

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
XIX конференция разработчиков свободных программ «Базальт СПО»
Дата 29 сентября – 1 октября
Время 10:00 – 19:00
Место Переславль-Залесский Онлайн
Kokoc Hackathon
Дата 29 сентября – 1 октября
Время 19:00 – 21:00
Место Онлайн
Ruby Russia 2023 Online
Дата 30 сентября
Время 11:00 – 21:00
Место Онлайн
PG Boot Camp Russia 2023
Дата 5 октября
Время 10:00 – 17:00
Место Москва Онлайн
Joker
Дата 9 – 14 октября
Время 16:00 – 19:30
Место Санкт-Петербург Онлайн
Открытый урок «Kafka Streams»
Дата 16 октября
Время 10:00
Место Онлайн
Питч-сессия pravo (tech) impulse
Дата 19 октября
Время 15:45 – 17:30
Место Москва
Russia Risk Conference 2023 — 19-я конференция по риск-менеджменту
Дата 25 – 26 октября
Время 10:00 – 19:00
Место Москва Онлайн
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн

Тест-драйв PyTorch 2.0 и заглядываем под капот «двушки»

Уровень сложности Средний
Время на прочтение 15 мин
Количество просмотров 5.1K
Кейс

Привет, Хабр!

На связи участники профессионального сообщества NTA Рощупкин Богдан, Сахоненко Егор и Алёшин Максим.

В посте мы рассмотрим, насколько эффективен torch.compile() на практике, заглянем под капот «двушки» PyTorch 2.0, чтобы узнать, как работает этот метод и какие преимущества он дает.

Разработчики PyTorch заявляют, что torch.compile() может дать прирост производительности до 50% по сравнению с обычным кодом PyTorch. Для проверки этого заявления мы проведем ряд экспериментов на разных моделях и данных, выясним, есть ли реальная выгода от использования torch.compile().

Заглянуть под капот
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 0

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети

Время на прочтение 11 мин
Количество просмотров 4.7K

Многие люди, когда либо имевшие дело с нейронными сетями, наверняка задумывались, можно ли написать нейросеть, которая сама будет создавать нейросети для решения каких-либо задач. Так вот в этом цикле статей я решил реализовать это. Одним из этапов алгоритма будет генерирование нейросети из списка слоёв. В связи с некоторыми ограничениями, накладываемыми методами реализации (о которых будет сказано в следующих частях, когда мы начнём объединять код из этой статьи с RL ʕ⊙ᴥ⊙ʔ ), входные данные для генератора будут представлены в виде строки случайной длины, содержащей упорядоченный набор слоёв с их параметрами. Генерировать сеть будем для задачи классификации картинок (разобьём это пугало первым).

О реализации на python+pytorch читать тут
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 3

Топ 10 deepnude нейросетей 2023 года

Время на прочтение 5 мин
Количество просмотров 43K
Обзор

DeepNude — это технология, использующая нейросети для создания изображений обнаженных тел на основе одетых фотографий или видео. Суть этой технологии заключается в том, чтобы "снять" одежду с изображения человека с помощью искусственного интеллекта и показать, как, предположительно, выглядит тело человека под одеждой.

Итак, в данной статье поговорим о пикантных и для некоторых людей непристойных темах, которые больше всего интересуют наше общество - обнаженное тело. Сделаем обзор таких сервисов как: Deepnude.ai, Deepfake.com, DeepSwap.ai, SoulGen и прочих.

Читать далее
Всего голосов 103: ↑89 и ↓14 +75
Комментарии 64

Странные позы, лишние пальцы и много котиков: самые интересные баги Midjourney

Время на прочтение 5 мин
Количество просмотров 5K
Обзор

За время существования Midjourney пользователи сгенерировали петабайты изображений. Сколько из них действительно качественные — открытый вопрос. Машинное обучение интересно свей непредсказуемостью: часто генеративные нейросети коверкают иллюстрации, придумывают новые объекты, рисуют франкенштейнов — в общем, странно самовыражаются.

Часть багов разработчики Midjourney пофиксили, но некоторые существуют и сейчас. Мы потратили целый день, чтобы уговорить нейросеть заменить человека на картинке, но ничего не вышло. Смотрите, что создает Midjourney, когда ошибается, и угадывайте, какие баги мы зашифровали в обложке.
Читать дальше →
Всего голосов 39: ↑33 и ↓6 +27
Комментарии 8

Вышел Savant 0.2.5: фреймворк компьютерного зрения на базе Nvidia DeepStream SDK

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 974
Обзор
Перевод

Savant - это высокоуровневый фреймворк с открытым исходным кодом для создания высокоэффективных приложений компьютерного зрения, работающих в реальном времени на стеке Nvidia. Он позволяет разрабатывать динамические, отказоустойчивые конвейеры, используя лучшие подходы Nvidia для ускорителей в центрах обработки данных и на границе.

Мы рады представить вам новую версию Savant - 0.2.5. Мы работали над этим релизом более 2,5 месяцев. Он содержит значительные изменения, новые возможности и исправления ошибок в нескольких областях, но в первую очередь мы улучшили возможности для разработчиков и варианты развертывания.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Нейросети в образовании

Время на прочтение 6 мин
Количество просмотров 2.9K

Привет, друзья! Знаете ли вы, что за большинством привычных вам услуг стоит ИИ? Он уже везде, не побоюсь этого слова, даже в образовательных продуктах, включая разнообразные курсы. 

Наша команда в ЛАНИТ последнее время работает над продуктами, которые используют такое чудо техники, как нейросети, в частности GPT. В процессе нашей работы мы столкнулись с кучей интересных сервисов, которые используют ИИ и могут быть полезны для решения задач в учебе. И я с удовольствием поделюсь самыми крутыми из них. Так что сделайте себе чашечку кофе и удобно устройтесь, впереди десять минут полезностей. Начинаем!

Читать далее
Всего голосов 40: ↑39 и ↓1 +38
Комментарии 0

Как генеративный ИИ будет использоваться в разработке игр в ближайшее десятилетие: исследование Bain&Company

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 1.8K
Ретроспектива

Генеративный ИИ сейчас переживает настоящий бум, находя применение в самых разных сферах, но одной из самых интересных и перспективных областей для его использования является разработка видеоигр. На данный момент некоторые крупные игровые компании уже начали применять ИИ-модели на стартовых этапах создания игр – например, для генерации идей развития сюжетной линии. Однако очевидно, что это только начало, и годами роль ИИ в этой сфере будет неуклонно расти. Как же именно он сможет изменить игровую индустрию?

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Комментарии 4

Вклад авторов

Работа

Data Scientist
109 вакансий