Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

kentavr009 вчера в 12:57

Bounding boxes для обнаружения объектов — что это, простым языком

3 мин

933

Машинное обучение *

Мнение

Что такое Bounding box и для чего он нужен. Если вы имеете ученую степень в области машинного обучения, вероятно вам тут будет неинтересно))

fedorborovitsky вчера в 09:23

Разработка алгоритмов обработки данных в реальном времени на Python

Простой

14 мин

2.1K

Блог компании М.Видео-Эльдорадо Python *Анализ и проектирование систем *Машинное обучение *

Привет, Хабр!

С появлением больших объемов информации и необходимостью обработки данных в реальном времени, разработчиками все чаще приходится создавать эффективные алгоритмов обработки данных, способных обеспечивать высокую отзывчивость и мгновенное реагирование на изменения.

Обработка данных в реальном времени подразумевает непрерывную обработку и анализ данных по мере их поступления, без задержек и задержек. Эта способность имеет большое значение для многих сфер (если не для всех).

В этой статье мы рассмотрим ключевые аспекты разработки алгоритмов обработки данных в реальном времени на Python, начиная с выбора инструментов и заканчивая оптимизацией производительности и обеспечением безопасности системы. Погрузимся глубже в тему, предоставив вам множество примеров кода и практических рекомендаций для успешной разработки. Давайте начнем!

Читать дальше →

Lithium_vn 16 ноя в 15:36

Нейронные сети для новичков и профи: топ бесплатных курсов по ИИ

Простой

6 мин

9.4K

Блог компании BotHub Машинное обучение *Учебный процесс в IT

Обзор

Нейронные сети - одна из самых популярных и быстроразвивающихся областей в IT-обучении. Количество курсов и материалов по этой теме растет с каждым днем. К сожалению, не все из них качественные и действительно полезные.

В этой статье мы собрали только лучшие бесплатные онлайн курсы по нейронным сетям и машинному обучению. Это курсы от известных IT-компаний, которые предоставляют полное погружение в тему, а не являются просто прогревом перед каким-то платным продуктом. Здесь вы найдете курсы разного уровня сложности - от базовых для новичков до продвинутых. Некоторые из них на русском языке, другие - на английском. Но каждый сможет подобрать для себя что-то полезное и интересное.

Давайте вместе разберем подробнее, какие бесплатные онлайн курсы стоит пройти для изучения нейронных сетей и машинного обучения.

Приглашаем к прочтению!

NigrumKross 16 ноя в 15:01

5 уровней зрелости MLOps

9 мин

2.9K

Блог компании VK Big Data *Машинное обучение *

Перевод

Google и Microsoft представили свои уровни зрелости MLOps — они описывают развитие инфраструктуры ML на основе лучших практик в отрасли. Команда VK Cloud перевела статью, в которой описано лучшее из обоих фреймворков.

Читать дальше →

+13

DariaSatco 16 ноя в 13:45

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Средний

10 мин

664

Блог компании МегаФон Big Data *Машинное обучение *Искусственный интеллект

Кейс

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Ilya_Ryabov 16 ноя в 10:43

Создание видео zoom in и zoom out с помощью inpainting в Kandinsky

Средний

5 мин

1.6K

Блог компании Сбер Python *Обработка изображений *Машинное обучение *Natural Language Processing *

Из песочницы

Развитие text2image-моделей открывает новые интересные возможности для создания креативного контента. Функция inpainting в Kandinsky от Sber AI позволяет создавать видео zoom in и zoom out с иллюзией приближения или отдаления от единого изображения.

Doctor_IT 15 ноя в 17:09

Парк юрского периода глазами нейросети: как развернуть Diffusers для генерации изображений за 10 минут

5 мин

2.8K

Блог компании Selectel Машинное обучение *Искусственный интеллект Data Engineering *

Туториал

Как часто бывает: появляется немного свободного времени, хочется отдохнуть и написать картину… но его то ли недостаточно, то ли просто лень размахивать кистью. Но можно делегировать задачу нейросети — для этого необязательно использовать Midjourney или DALL-E.

Один из вариантов — развернуть собственного помощника на готовом сервере с помощью библиотеки Diffusers и моделей Hugging Face. Мы попробовали и сгенерировали целый «Парк юрского периода» с разными тирексами. Что из этого получилось и как повторить наши творения, рассказываем под катом.

Читать дальше →

+25

crazyfrogspb1 15 ноя в 12:06

Ближайшее будущее AI в рентгенологии. Мои комментарии к статье в RSNA

Простой

13 мин

1.1K

Машинное обучение *Научно-популярное Искусственный интеллект Здоровье Будущее здесь

Обзор

В конце октября вышла статья "The Future of AI and Informatics in Radiology" под авторством Кёртиса Ланглотца, профессора радиологии и биомедицинского data science в Стэнфорде. Она содержит 10 предсказаний о будущем ИИ в нашей индустрии. Хочу по ним пробежаться и поделиться своим видением текущей ситуации.

Ещё несколько лет назад ни один эксперт не мог даже предположить, что сегодня технологии искусственного интеллекта смогут проникнуть в такую сложную и ответственную область как медицина. Но динамика развития цифровых помощников просто поражает. На 2023 год насчитывается более 100 компаний, разрабатывающих продукты на основе ИИ. Кроме того, только официально зарегистрированных Управлением по контролю за продуктами питания и лекарствами США (FDA), алгоритмов на основе ИИ для радиологии насчитывается более 400. И это только в США, но не менее крупных достижений добиваются в России, Евросоюзе, странах СНГ.

NewTechAudit 15 ноя в 09:39

Использование Insightface для быстрого поиска и сравнения лиц на изображениях

Средний

9 мин

1.5K

Python *Машинное обучение *Искусственный интеллект

Кейс

Привет, Хабр!

С вами Вадим Дарморезов, участник профессионального сообщества NTA.

Сегодня рассмотрю кейс поиска изображений-«близнецов», которые были размещены в pdf-файлах, насчитывающих десятки, а порой и сотни страниц.

В проектах, связанных с распознаванием лиц своеобразными «флагманами» являются библиотеки dlib/face‑recognition и свёрточные нейронные сети. При этом на просторах русскоязычного интернета довольно мало статей о библиотеке insightface. Именно о ее использовании хотелось бы поговорить более подробно. Всем, кому это интересно, добро пожаловать по кат.

Искать "близнецов"

akimovpro 14 ноя в 12:07

OpenAI DevDay – ещё 5 видео про то, как работает компания, и как AI применять разработчикам

Простой

5 мин

Машинное обучение *Искусственный интеллект

Обзор

Вчера ночью OpenAI выложил ещё несколько видео с OpenAI DevDAy и там довольно много интересного, как устроено то, что они анонсировали и более подробно, как они работают над новыми фичами. Видео действительно полезные для всех, кто собирается использовать их API. Сделал полный обзор.

Для погружения в основной список анонсов советую прочитать вчерашний обзор, здесь же будут более глубокие детали и частности. Но тоже безумно интересно.

MarkWatney 14 ноя в 12:00

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры

Средний

8 мин

1.5K

Алгоритмы *Математика *Машинное обучение *

Туториал

Предположим у нас благородная цель - мы хотим разорить казино, чтобы оно не разоряло других, а попутно заработать самим. В качестве цели выберем игру блэкджек. Эта игра довольно сильно зависит от случайности, но понятно, что в перспективе, если придерживаться одной стратегии, то мы всегда придем к одному конкретному выигрышу или проигрышу. Если одна стратегию лучше другой, то она даст на лучше результат. В этой статье я расскажу, как, используя обучение с подкреплением, найти лучшую, оптимальную стратегию на примере игры блэкджек.

DenisBerezutskiy 14 ноя в 03:37

Улучшаем пунктуатор на стенограммах

Средний

29 мин

1.1K

Data Mining *Машинное обучение *Искусственный интеллект Natural Language Processing *

Из песочницы

Привет, Хабр! Сегодня я расскажу о том, как натренировать качественный русскоязычный пунктуатор и капитализатор для стенограмм (то есть, модель, превращающую только что распознанный Speech-to-Text’ом “привет хабр” в литературный “Привет, Хабр!”). Задача эта давно известная и в последние годы кое-как решаемая с помощью нейросетей-трансформеров, например, BERT. Ключевое слово здесь – “кое-как”. Мы пробовали множество открытых доступных моделей (подробности ниже), но результат сильно не дотягивал до нужного нам уровня. Пришлось доделывать модель самим.

Некоторые энтузиасты LLM сразу спросят: а зачем отдельно тренировать пунктуатор в 2023-м, когда есть универсальный ChatGPT? Одна из проблем в том, что ChatGPT работает только на зарубежных серверах, и как они там собирают данные – никому не известно. И это не говоря ещё о риске перевирания текста и высокой стоимости.

Если к вам обращаются заказчики за автономной системой протоколирования митингов, то ни о каком ChatGPT не может идти и речи. Что касается других LLM (Llama 2, T5 и т.д.), то они постоянно страдают галлюцинациями, потребляют в разы больше памяти и работают в десятки, а то и сотни раз медленнее, чем стандартный пунктуатор на BERT. Подробнее об экспериментах с использованием генеративных LLM – в разделе ниже.

В отличие от генеративных сетей, архитектура BERT в принципе хорошо подходит для расстановки знаков и заглавных букв: гарантия от галлюцинаций и быстрая работа, даже на CPU. Однако результат очень сильно зависит от того, на каких данных их обучали. Например, как мы выяснили на собственном опыте, пунктуаторы, натренированные на типичных больших русскоязычных корпусах (новости, энциклопедии, литература, рандомный кроулинг) очень редко ставят точки. Причём, как показали дальнейшие эксперименты, та же по строению модель справлялась намного лучше, если учить её на правильно подобранном датасете.

+13

badcasedaily1 13 ноя в 23:07

Введение в архитектуру MLOps

Простой

13 мин

4.5K

Блог компании OTUS Python *Машинное обучение *DevOps *

Обзор

Привет, Хабр!

MLOps, или Machine Learning Operations, это практика объединения машинного обучения и операционных процессов. Она направлена на упрощение и ускорение цикла разработки, тестирования, развертывания и мониторинга моделей машинного обучения. В MLOps применяются принципы DevOps, такие как автоматизация, непрерывная интеграция и доставка, для создания более эффективных и масштабируемых решений в области машинного обучения.

Объемы данных растут экспоненциально, способность быстро и эффективно обрабатывать эти данные становится ключевой для успеха. MLOps позволяет не просто создавать модели машинного обучения, но и быстро адаптироваться к изменениям, обновлять модели и поддерживать их работоспосоность на высоком уровне. Это важно, поскольку модель, которая работала хорошо вчера, может устареть сегодня из-за изменения данных или условий окружающей среды.

semihal 13 ноя в 16:09

Обзор современных подходов персонализации диффузионных нейронных сетей

Сложный

16 мин

1.8K

Блог компании Одноклассники Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

Задача персонализации text-to-image модели состоит в донастройке предобученной нейронной сети так, чтобы она могла генерировать изображения заданного объекта в выбранных сценах. Несмотря на то, что подходы к решению этой задачи существуют, для их применения в высоконагруженных системах необходимо решить ряд проблем: большое время дообучения, высокие требования к видеопамяти, неспособность точно захватывать детали целевого объекта и др.

Меня зовут Сергей Михайлин. Я разработчик группы машинного обучения в ОК. В данной статье дан обзор современных подходов к персонализации text-to-image моделей на базе открытой архитектуры Stable Diffision. Мы приводим технические подробности каждого подхода и анализируем его применимость в реальных высоконагруженных системах. На основании собственных экспериментов по персонализации text-to-image моделей мы выделяем список возникающих при решении этой задачи проблем и перспективных способов их решения.

akimovpro 13 ноя в 13:51

Революция от OpenAI — полный обзор: что означают последние анонсы для продуктовой разработки

Простой

11 мин

15K

Машинное обучение *Искусственный интеллект Natural Language Processing *Голосовые интерфейсы *

Обзор

Неделю назад я получил уведомление о начале трансляции первой разработческой конференции от OpenAI. Было неудобно смотреть эфир живьём, так что я уложил детей спать, и ночью, заварив себе какао, с предвкушением открыл YouTube.

Конечно, я к тому времени не выдержал и посмотрел краткие описания анонсов, так что был готов к тому, что увижу, но скажу честно: не смотря на презентацию в стиле студенческих конференций (на финальный слайд (под катом) вообще без слёз не взглянешь), чем дольше я слушал об анонсах, тем больше у меня отвисала челюсть.

Это не просто небольшие улучшения; это действительно скачок вперед. Я слушаю про увеличение длины контекста до 128К, обновлении данных до апреля текущего года, об интеграции в API интерпретатора, нового "рисователя" DALLE-3, анализ изображений, извлечение данных из массивов, безлимитных "ассистентов" и чуть ли не подпрыгиваю на стуле от оживления: решилось огромное количество проблем, которые до этого требовали человеко-месяцы доработки довольно квалифицированной командой.

Как только презентация подходит к концу, я судорожно открываю беклог и начинаю записывать и редактировать идеи. Я уверен, что перед разработчиками открыли действительно большие возможности, которые переопределят способ разработки и восприятия продуктов. И если тема AI вас как минимум интересует и вы ещё и занимаетесь продуктовой разработкой, а перепосченных по 150 раз новостей не хватает понять, что это значит лично для вас и команды, этот обзор будет весьма кстати.

Итак, что нового

+12

murat_apishev 13 ноя в 10:56

«ИИ без границ»: как научить Transformer обрабатывать длинные тексты

Сложный

12 мин

3.8K

Машинное обучение *Искусственный интеллект Natural Language Processing *

Обзор

Разносторонний системный рассказ о том, какими способами можно научить модель работать с длинными последовательностями. Для специалистов, занимающихся обучением LLM, и всех, кто хочет разобраться в теме.

+26

therb1 13 ноя в 02:11

Подборка видео с последнего SREcon

2 мин

1.9K

Open source *Системное администрирование *Программирование *Машинное обучение *DevOps *

Обзор

Всем привет меня зовут Максим, я SRE инженер в группе компаний Тинькофф.
Но сегодня я здесь по другой причине.

Я уже давно собираю и публикую подборки видео, от которых есть толк, с разных каналов SRE направленности в телеграмм канале https://t.me/sre_pub и спасибо им большое за то что позволяют мне это делать.

Но я не видел подобных подборок на хабре и для меня до сих пор загадка почему.
Лично для меня Хабр является основной площадкой для получения информации.
Вы можете это понять по 1500+ моих закладок в профиле.

Так вот я просмотрел все доклады с SREcon23 составил для вас подборку из докладов вырезав все доклады в которых было больше болтовни или рекламы чем пользы.

KAA-zdes 12 ноя в 17:09

Сколько можно это делать вручную!? Ищем дефекты рельсов по ультразвуковым отпечаткам

Средний

24 мин

2.3K

Машинное обучение *

Аналитика

Применение методов машинного обучения для поиска радиальных трещин болтовых отверстий железнодорожных рельсов по ультразвуковой дефектограмме.

+14

Timofey_Gladkiy 11 ноя в 15:31

Что в голове у змейки? Обучение нейросети играть в «Snake» генетическим алгоритмом

14 мин

8.4K

Занимательные задачки Python *Алгоритмы *Машинное обучение *

Из песочницы

В 2020, когда случился локдаун, и к большому сожалению, появилось очень много свободного времени, мне захотелось познакомиться с Python. Начальный опыт c Pascal был еще со школы и универа, поэтому оставалось лишь придумать задачу и пойти её самоотверженно решать на питоне. Интересной задачей показалось смастерить игру змейку, прикрутить к ней мозги в виде перцептрона с парой скрытых слоёв, и путем кнута и яблока обучить цифровое животное выживать в жестоких реалиях двумерного мира :)

«У самурая нет цели, есть только путь»

Первый блин на производстве не отличается красотой, но опыт был получен. Наиболее привлекательным мне пришелся генетический алгоритм: отбор успешных змеек, скрещивание, частичная мутация генов и так тысячи раз до результата. Змейки, без указания им правил выживания, в тысячном поколении «понимали», что нужно стремиться съесть яблоко и никуда не врезаться, это вызывало ощущение прикосновения к чуду "It's Alive!!!"

Спустя пару лет, закончив курс по аналитике данных, появилось желание переписать проект, попрактиковаться в более серьезных разделах python и сделать тренажёр со сбором статистики.

+53

stalkermustang 11 ноя в 09:57

Главное событие в мире AI: создатель ChatGPT рассказал, в какое будущее он нас всех ведет

Простой

25 мин

74K

Блог компании Open Data Science Машинное обучение *Искусственный интеллект Будущее здесь

Обзор

В этой статье мы расскажем вам про самые важные фичи, внедренные за последние полгода в ChatGPT (самую мощную нейросетку в мире), а также обсудим – каким видением будущего поделился Сэм Альтман на прошедшей 7 ноября конференции от OpenAI. Спойлер: они хотят запилить «агентов Смитов», которые смогут самостоятельно взаимодействовать с миром!

Это мы читаем →

+86

100