Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Авторы Компании

NigrumKross 26 минут назад

Фигуры Matplotlib и стиль Cyberpunk: несколько строк кода — и готова красивая фигура

8 мин

200

Блог компании VK Big Data *Машинное обучение *

Перевод

Когда мы создаем инфографику или постеры с данными, мы хотим привлечь внимание читателя: для этого изображение должно быть эстетически привлекательным и при этом убедительно доносить нашу мысль. Есть множество графических библиотек для создания графиков с помощью Python. Одна из них — это хорошо известная Matplotlib. Но графики, построенные ее стандартными средствами, часто выглядят скучными, и, чтобы оживить их, нужно потратить много времени.

Читать дальше →

kompas_3d 27 минут назад

Generative AI. Как программистам держать нос по ветру

Средний

10 мин

219

Блог компании АСКОН Машинное обучение *Облачные сервисы *Искусственный интеллект

Мнение

Вряд ли найдётся тот, кто ещё не знаком с GhatGPT, MJ, StableDiffusion - такая популярность говорит сама за себя. Хайп вокруг генеративного искусственного интеллекта (далее - ИИ) не утихает и уже начинает немного надоедать. Но мы, как разработчики, должны оставаться в курсе событий и принимать реальность такой, какая она есть.

А реальность такова:

- Использование Copilot и его аналогов, ChatGPT и других генеративных нейросетей увеличивает вашу продуктивность.

- Бизнес активно ищет возможности оптимизировать процессы или внедрить новые фичи на основе генеративного ИИ.

Давайте разберём каждое из этих утверждений.

YudinS вчера в 10:58

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

7 мин

6.9K

Блог компании Яндекс Браузеры Машинное обучение *Искусственный интеллект IT-компании

Неделю назад на сайте 300.ya.ru мы продемонстрировали возможности языковой модели YandexGPT применительно к задаче суммаризации текстов. С тех пор многое изменилось: мы обучили новую, более качественную модель, в пересказах которой в 4 раза меньше ошибок. А сегодня мы внедрили её в Яндекс Браузер. Может показаться, что мы просто взяли ту же модель, о которой уже рассказывали сообществу на примере Алисы, и прикрутили к ней кнопку в Браузере. Но не всё так просто. Да, наша базовая модель уже понимала, что такое суммаризация в общих чертах. Но для нас было важно добиться результата в нужной нам форме и с предсказуемым качеством. И вот тут-то начинаются нюансы.

Сегодня поделюсь с Хабром не столько новостью, сколько нашим опытом и советами из области дообучения моделей и промпт-инжиниринга. Расскажу, через что пришлось пройти нашей команде, чтобы модель начала делать то, что от неё ожидают.

Читать дальше →

+29

AlexTeexone 5 июл в 18:40

See and Tell: Сервис просмотра сериалов для слабовидящих

Средний

4 мин

530

Python *Машинное обучение *

Из песочницы

Весной 2023 года прошел хакатон MTS True Tech Hack, на котором был представлен кейс улучшения сервиса просмотра видео для людей с ограниченными зрительными способностями. Предоставить решение во время хакатона нам не удалось, но зато за следующие два месяца мы смогли закончить пилотную версию сервиса, помогающего слабовидящим людям лучше понимать происходящее на экране. В этом посте мы решили поделиться результатами и деталями проделанной работы.

+11

seninvs 5 июл в 11:56

Сложности MVP или как мы смотрели 40000 видео

Простой

4 мин

1.6K

Big Data *Машинное обучение *

Из песочницы

MVP, он же Minimal Viable Product, представляет собой базовую (ванильную) версию продукта и содержит только самый необходимый функционал. По сути это пробник, который служит для оценки рисков и оправданности вложений в полноразмерный продукт. MVP может иметь разный вид: пробный образец, тестовая партия, или уже готовый продукт, но с урезанным функционалом.

MVP - это отдельный вид искусства, где нужно за короткое время доказать, что ты можешь предложить бизнесу решение, которое поможет достичь поставленных продуктовых целей, за оправданную цену. Это своего рода спидран большого проекта. Про такой MVP как раз и пойдет наш разговор.

mmsmirnova 4 июл в 17:16

Как мы с помощью Kubeflow Pipelines оптимизировали обучение ML-моделей

Средний

10 мин

1.2K

Блог компании VK Машинное обучение *

Расскажу, как мы оптимизировали обучение моделей, внедрив инструмент Kubeflow Pipelines в нашу практику. Я хочу показать, чем Kubeflow Pipelines может быть полезен ML-специалисту и как в нём без потери существующей кодовой базы можно запускать готовые пайплайны.

+13

olegchir 4 июл в 14:22

LLM API для Java

Простой

6 мин

Блог компании Failover Bar Программирование *Java *Машинное обучение *

Обзор

Прочитав сегодняшнюю статью о том, как в Сан-Франциско массово собираются LLM-щики, коллега сказал — "лучше б там собирались BDSM-щики, это, по крайней мере, понятное развлечение". Для человека не посвященного, "нейросети" — это всё ещё что-то про Python и математическую статистику.

Тем не менее, можно кусать низко висящие фрукты и с помощью Java, дергать API для Chat GPT, и тогда ничего учить не придётся. В этой статье будут ссылки на несколько фреймворков с простым API для жабы и котла, которые можно использовать хоть сейчас.

Волшебно. Читать далее.

kitbit 4 июл в 11:34

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

Средний

15 мин

2.1K

Python *Big Data *Математика *Машинное обучение *Искусственный интеллект

Из песочницы

Изучая нейронные сети все глубже, сталкиваешься с тем, что не ко всем задачам применимы полносвязные глубокие нейронные сети с классическими слоями Linear и слоями активации Relu, Sigmoid, Than и их вариации. Почему не используют остальные функции в качестве активации, например, периодические?
В целом, периодические функции являются одними из основных функций, важными для человеческого общества и естествознания: суточные и годовые циклы в мире диктуются периодическими движениями солнечной системы, графики изменения погоды, показателей мировой экономики также включают периодическую компоненту.

+15

agpankova 3 июл в 20:29

Эволюция метрик качества машинного перевода — Часть 1

Простой

5 мин

704

Машинное обучение *Natural Language Processing *

Обзор

Как правильнее всего измерять качество машинного перевода? Многие слышали о BLEU, но на самом деле метрик много. В этой статье расскажем, какие существуют метрики, как они эволюционировали и какие сегодня наиболее адекватны. Часть 1: эволюция метрик и обзор традиционных метрик.

itmo 3 июл в 16:33

Как стать магистром по ML за 2 года

10 мин

1.9K

Блог компании ИТМО Программирование *Машинное обучение *Учебный процесс в IT

Год назад в ИТМО открылась новая магистратура по искусственному интеллекту. Мы отказались от академического подхода, посмотрели на примеры лучших инженерных школ и стажировок, да и в целом от мира образования, и пригласили ИТ-компании для участия в подготовке высококвалифицированных кадров.

В этой статье рассказываем о том, как построено обучение и над какими проектами здесь можно работать. В конце вы найдете ссылку на конкурс проектов для поступления на следующий учебный год.

MaxRokatansky 3 июл в 14:59

Sarsa: алгоритм, основные принципы и применение

Простой

7 мин

810

Блог компании OTUS Машинное обучение *Искусственный интеллект

Обзор

В области искусственного интеллекта и машинного обучения, SARSA (State-Action-Reward-State-Action) является одним из фундаментальных алгоритмов обучения с подкреплением. Он широко применяется в реализации различных задач, включая игровые приставки, роботов и системы автопилотирования. В данной статье мы рассмотрим определение SARSA и обсудим его значимость в области искусственного интеллекта и машинного обучения.

+11

ohio_merchant 3 июл в 14:11

«Магия вне Хогвартса», или Как разделить аудиосигнал на источники, обогнав существующие решения

8 мин

2.2K

Блог компании VK Машинное обучение *Звук

Привет, хабровчане! Меня зовут Дмитрий, я студент первого курса Вышки магистерской программы «Системный анализ и математические технологии».

В октябре прошлого года я прошёл отбор в Инженерно-математическую школу (ИМШ). Это совместная образовательная программа VK Education и НИУ ВШЭ. Я стал участником мастерской по прикладному искусственному интеллекту. В одном из проектов мы командой из двух человек (да, нас было мало, но мы были сильны!) решили реальную технологическую задачу под руководством эксперта VK и научных сотрудников университета. Нам нужно было придумать технологию разделения аудиосигнала на источники. В команде я отвечал за подготовку данных, а мой коллега — за проведение экспериментов. Хочу рассказать вам подробно, как мы решали эту задачу – надеюсь, что это будет для вас полезно.

+15

odmin227 3 июл в 13:12

Как я покорил ИТМО и поступил в магистратуру по ИИ без экзаменов

Простой

5 мин

2.5K

Блог компании AI Talent Hub Машинное обучение *Учебный процесс в IT Карьера в IT-индустрии Искусственный интеллект

Мнение

Привет, друзья поступающие! Меня зовут Даня Картушов, и сегодня я хочу поделиться с вами историей, которая может изменить ваше представление о поступлении в университет. Выбор темы для статьи для меня стал важным этапом. Ведь, кажется, за последние 12 недель я прошел через невероятные испытания, досрочно поступил в магистратуру по ИИ от AI Talent Hub, @NapoleonITи ИТМО а также понял, что настоящая сила — в сообществе, которое позволяет тебе стать лучше и в уверенности, что ты на верном пути.

alizar 3 июл в 12:00

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

Средний

6 мин

8.2K

Блог компании RUVDS.com Работа с видео *Алгоритмы *Сжатие данных *Машинное обучение *

Аналитика

Сжатие с учётом контекста, источник: WaveOne (сайт удалён)

Хотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.

В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов, тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок. Все знают, что в 2017 году произошёл прорыв в разработке ИИ благодаря изобретению трансформеров. В свою очередь, они основаны на концепции внимания, которую придумали в 90-е. Эта техника впервые позволила соотносить друг с другом отдельные части текста или видеокадра.

Читать дальше →

+50

SergeiGozalov 3 июл в 00:24

Распознаем лючки бензобаков

Средний

12 мин

9.6K

Обработка изображений *Машинное обучение *Робототехника

Из песочницы

Привет, Хабр! Однажды, я решил создать автоматическую автозаправочную станцию. Один из ее компонентов - роботизированная "рука", для автоматической заправки транспортных средств, независимо от марки/модели. Данная рука последовательно открывает лючок бензобака, отвинчивает крышку горловины бензобака, вставляет заправочный пистолет, осуществляет заправку автомобиля и возвращает все на место. В данной статье я хочу рассказать о том, как осуществлялось распознавание лючка бензобака для корректного позиционирования "руки" в пространстве и определения места присоединения присоски. Давайте посмотрим - как эта задача была решена.

+28

100

Lozkins 2 июл в 11:32

Прогулка по мостам Кёнигсберга с ORtools

Простой

6 мин

2.3K

Математика *Машинное обучение *

Кейс

На выходных впервые удалось выбраться в Калининград. Я уделил немало внимания исследованию уровня жизни и благополучия области, в основном, ориентируясь на стоимость покупки/аренды жилья, цены в ресторанах и заработок таксистов. Данные достаточно доступные и позволяют сформировать общее представление о положении дел в городе/области.

Помимо экономической составляющей, конечно, старался погрузиться в культурный/исторический аспект жизни города. За короткий промежуток времени достаточно сложно проникнуться всеми особенностями, однако в Калининграде я бы выделил верное следование ограничениям скорости! Благодаря этому, возникает ощущение безопасности, замедления времени и спокойствия.

История города богатая, и в этом мешке событий я нашел кое-что интересное для себя. Речь пойдет о задаче семи пешеходных мостов Кёнигсберга. В свое время Эйлер в процессе размышлений над решением этой задачи положил начало теории графов. В статье рассмотрим задачу с позиции задачи линейного программирования и подтвердим результаты трехсотлетней давности с помощью Python и OR-Tools.

AnatolyBelov 2 июл в 08:32

RuGPT3. Исследование вариантов циклическим перебором

7 мин

1.9K

Машинное обучение *Искусственный интеллект Natural Language Processing *

RuGPT3 - коллекция моделей от Сбер

Проводим автоматическое тестирование циклическим перебором вариантов.

Работаем в Colab, тестируем Small, Mediub, Large.

Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.

Алгоритм тестирования
полный последовательный перебор

10 вопросов
3 модели: Small, Medium, Large
Несколько наборов параметров внутри каждой модели
Реплики сохраняем в гугл-таблице

GolovinDS 30 июн в 16:00

Прогноз покупки страховки клиентами туроператора

Средний

21 мин

863

Блог компании OTUS Машинное обучение *

Кейс

Всем привет! Данная статья является выпускным проектом выпускницы OTUS. Наталья попыталась сделать прогноз покупки страховки клиентами туроператора методами ML. Что из этого вышло, смотрите под катом.

+17

KKK_56 30 июн в 12:43

Prompt-инженер как новый тренд. Требования и зарплаты у специалистов

6 мин

3.6K

Блог компании МТС Машинное обучение *Карьера в IT-индустрии Искусственный интеллект Будущее здесь

Технологические компании со всего мира ищут квалифицированных и эффективных инженеров, которые бы облегчили общение с машиной и составление инструкций. Екатерина Саяпина, Product Owner личного кабинета платформы МТС Exolve, созданной компанией МТТ (входит в экосистему МТС), разбирается, как попасть в эту волну, какие вакансии представлены на рынке и чему стоит научиться, если вы хотите стать prompt-инженером.

cointegrated 30 июн в 10:12

Фильтруй базар! Как мы параллельный русско-башкирский корпус чистили

Сложный

6 мин

1.6K

Python *Семантика *Data Mining *Машинное обучение *Natural Language Processing *

Чтобы обучать нейросети понимать и генерировать человеческие языки, нужно много качественных текстов на нужных языках. «Много» – не проблема в эпоху интернета, но с качеством бывают сложности. В этом посте я предлагаю использовать BERT-подобные модели для двух задач улучшения качества обучающих текстов: исправление ошибок распознавания текста из сканов и фильтрация параллельного корпуса предложений. Я испробовал их на башкирском, но и для других языков эти рецепты могут оказаться полезны.

+17