Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

koch 18 часов назад

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»

Простой

4 мин

532

Хакатоны Машинное обучение *Natural Language Processing *

Репортаж

В день, когда Сэм Альтман в темной одежде на темном фоне рассказывал миру о запуске GPT-4-Turbo, в те же самые минуты на Kaggle завершалось небольшое, но любопытное соревнование “Predict the LLM”. Цель – узнать автора по тексту. Авторами текстов выступили 7 анонимных больших языковых моделей…

Zachar_5 6 ноя в 19:17

Общаемся с базой знаний: как мы улучшили точность генеративных ответов LLM с помощью собственного RAG

Простой

7 мин

1.7K

Машинное обучение *Искусственный интеллект Natural Language Processing *

Кейс

Одна из основных проблем при использовании больших языковых моделей это практически неустранимые галлюцинации, возникающие при ответах на вопросы по загруженным документам. Задача "поговорить со своими документами" возникает очень часто, и как правило, она решается с помощью промптинга - вы загружаете вашу статью, договор или другой документ и пишете промпт "Ответь на вопрос по тексту:". Этот способ работает, но у него есть существенные недостатки: размер документа ограничен 1-3 страницами, рандомное возникновение галлюцинаций - неправильных ответов, выглядящих правдоподобно.

В этой статье мы показываем работающие кейсы и синергию подходов, реализованных нами в рамках разработки агента вопросно ответной системы - FractalGPT QA агента. В частности, с помощью алгоритма Fractal answer synthesis и интерпретируемого ИИ нам удается существенно снизить % галлюцинаций и стабильно сильно повысить точность и полноту ответов. Если читать теорию не охота - можно сразу промотать на кейсы.FractalGPT QA агента доступен в закрытой бете, запрос на тест QA системы по базе знаний можно оставить тут.

Lozkins 6 ноя в 11:50

Моделирование размещения хабов в pyomo

Средний

11 мин

790

Алгоритмы *Математика *Машинное обучение *Транспорт

Туториал

Транспортные, телекоммуникационные и компьютерные сети часто используют Hub-and-Spoke архитектуру для эффективной маршрутизации потоков между множеством отправителей и получателей. Особенность такой топологии заключается в использовании специального объекта сети - хаба. Хабом называется объект сети, который обеспечивает распределение, соединение, переключение, консолидацию, сортировку или перевалку в распределенных системах много-ко-многим. Кроме того, хабы позволяют соединить большой набор пар отправитель/получатель с использованием небольшого кол-ва соединений.

Задача размещения хабов (Hub Location Problem) относится к стратегическому уровню планирования сети. Это накладывает ограничения на возможность оперативной реализации и валидации решения. Одним из способов моделирования и анализа такого рода решений без рисков для текущей сети является математическое моделирование.

sabinaerikovna 5 ноя в 00:11

Mimesis: идеальное решение для генерации данных

Простой

6 мин

3.4K

Python *Машинное обучение *

Из песочницы

Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.

В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.

+20

badcasedaily1 4 ноя в 16:41

Архитектуры RL: DDPG иPPO

Средний

12 мин

1.1K

Блог компании OTUS Python *Программирование *Математика *Машинное обучение *

Обзор

Привет, уважаемые читатели Хабра!

В RL существует множество алгоритмов, каждый из которых имеет свои преимущества и недостатки.

DDPG (Deep Deterministic Policy Gradients) - это алгоритм, объединяющий в себе идеи из двух областей: DPG (Deterministic Policy Gradients) и DQN (Deep Q-Network). DDPG подходит для задач с непрерывным действием, и он стал основой к примеру для управления роботами и автономному вождению.

PPO (Proximal Policy Optimization) - это алгоритм, который сосредотачивается на обучении стратегии (policy) с учетом границ для обновлений. PPO стал популярным выбором благодаря своей стабильности и хорошей производительности в различных средах. Он также широко используется в научном обучение, ИИ героев в играх и в других областях.

+10

Sber 3 ноя в 14:56

Разработка рекомендательных систем: три открытых библиотеки от Сбера

Простой

4 мин

2.3K

Блог компании Сбер Open source *Алгоритмы *Машинное обучение *

Обзор

Делимся своими открытыми библиотеками для разработки рекомендательных систем. Что? Да! Рассказываем подробнее. Всем известно, что Сбер это уже не просто банк, а огромная технологическая компания, которая включает в себя и сервисы компаний-партнёров: электронную коммерцию, индустрию развлечений и даже медицину. Количество пользователей достигло 108 млн, и для каждого из них мы создаём персональные рекомендации, которые помогают не потеряться в разнообразии предложений и выбрать лучшее.

+10

Rosatom 2 ноя в 15:57

Предсказываем цены с помощью методов анализа данных и машинного обучения

Средний

10 мин

6.3K

Блог компании Росатом Машинное обучение *Исследования и прогнозы в IT *

Кейс

Привет, Хабр! Вас приветствуют Нане Бегларян (инженер данных) и Дмитрий Распопов (эксперт отдела искусственного интеллекта) из компании «Цифрум» Госкорпорации «Росатом». В этой статье мы поговорим с вами о задаче, связанной с разработкой комплексной модели для прогнозирования цен на электроэнергию, которая позволяет обеспечить стабильность и надежность работы энергосистемы.

Цены на электроэнергию могут значительно колебаться в зависимости от множества факторов, что может привести к нестабильности и непредсказуемости в работе энергосистемы. (и росту цифр в коммунальных счетах).

Чтобы было легче морально готовиться к очередной оплате (и заодно потренировать свои знания в ML), делимся с вами опытом и знаниями в области прогнозирования цен на электроэнергию с помощью методов анализа данных и машинного обучения.

badcasedaily1 2 ноя в 14:23

Применение архитектурных шаблонов в машинном обучении: разбор Gradient Boosting

Простой

12 мин

1.5K

Блог компании OTUS Python *Машинное обучение *

Обзор

Привет, Хабр!

Архитектурные шаблоны в машинном обучении представляют собой общие структуры и методологии, которые позволяют разработчикам более эффективно решать задачи. Они представляют собой набор bewährte Lösungen, то есть "проверенных решений", которые могут быть адаптированы к конкретным задачам и данным. Использование архитектурных шаблонов позволяет сэкономить время и ресурсы при разработке моделей машинного обучения.

Gradient Boosting – это один из наиболее мощных и гибких архитектурных шаблонов в машинном обучении. Он позволяет строить ансамбли моделей, комбинируя слабые ученики в сильную модель, способную решать разнообразные задачи классификации и регрессии. Этот метод обрел популярность благодаря своей способности обучаться на ошибках предыдущих моделей, постепенно улучшая свои прогнозы.

Преимущества Gradient Boosting включают в себя высокую точность прогнозов, устойчивость к переобучению и способность работать с разнородными данными. Он также позволяет эффективно решать задачи как классификации, так и регрессии, что делает его незаменимым инструментом для разработчиков.

NigrumKross 2 ноя в 13:28

Сокращаем дистанцию: как сконструировать SQL-модели в MLflow и упростить управление жизненным циклом машинного обучения

9 мин

908

Блог компании VK Машинное обучение *

Перевод

Сегодня в постоянно меняющейся сфере машинного обучения особую важность приобретает возможность управлять полным жизненным циклом моделей без особых усилий. Этот витиеватый процесс поможет упростить Open-Source-платформа MLflow.

Читать дальше →

+11

a_melnikov 1 ноя в 12:43

Использование ML для прогнозирования CLTV

Средний

10 мин

Блог компании билайн Математика *Машинное обучение *Управление продажами *Статистика в IT

Туториал

Из прошлой статьи мы узнали, что CLTV (customer lifetime value) — метрика, используемая для оценки прибыли, которую компания может получить от своего клиента за время его пользования продуктами и сервисами компании.

Разберем, что означает каждая буква в определении CLTV (customer lifetime value). Кто такой клиент, что мы понимаем под lifetime и ценностью, которую приносит нам клиент.

CLTV строится для клиента, а не для номера телефона, так как мы не хотим терять историю взаимодействий с ним. Мы учитываем, что абонент может сменить номер телефона и/или может измениться номер договора. Также билайн — это не только мобильная связь, но и домашний интернет, которым наши абоненты могут пользоваться в рамках одного договора. Поэтому мы сразу решили собирать информацию и по этим услугам в рамках одной записи по клиенту. В будущем мы планируем прогнозировать CLTV уже на уровне физического лица и домохозяйств, объединяя историю пользования всех сим-карт клиента.

Под lifetime мы понимаем не полный жизненный цикл клиента от момента заключения договора до момента его закрытия, а пятилетний горизонт, который мы отсчитываем от текущего момента времени. То есть, если мы строим прогноз от января 2023 года, то прогноз будет построен помесячно до декабря 2027 года. Почему 5 лет? Этот срок был определен опытным путем — при нем достигается баланс между качеством предсказаний и потребностью в бизнес-процессах.

В билайне под ценностью клиента принято понимать маржу, которую нам приносит абонент с учетом всех затрат и доходов, которые мы можем аллоцировать на конкретного клиента.

+11

NewTechAudit 1 ноя в 09:18

Поможем Ходору найти новых друзей с помощью графов

Средний

10 мин

2.3K

Python *Алгоритмы *Машинное обучение *

Туториал

Привет, Хабр!

На связи участник профессионального сообщества NTA Кухтенко Андрей.

В интернете постоянно что-то рекомендуют: посмотреть новое видео, добавить друга или купить товар. Как работают эти алгоритмы, расскажу в посте ниже и реализую рекомендательную систему с помощью графов.

Помочь Ходору найти друзей

maksler 31 окт в 23:12

Прогнозирование нагрузки солнечных электростанций

7 мин

1.4K

Python *Машинное обучение *

Прогнозируем нагрузку группы солнечных электростанций на сутки вперед с помощью машинного обучения. Сравниваем два метода — Random Forest и LSTM.

Keithla 31 окт в 15:58

Как работают Model Serving инструменты изнутри. Пишем свой на Python и Docker с нуля

Средний

15 мин

2.5K

Python *Машинное обучение *

Туториал

Вы когда-нибудь задумывались, как модели машинного обучения переходят от экспериментов к реальным приложениям? Здесь мы погрузимся в мир сред обслуживания моделей и невоспетых героев, стоящих за развертыванием и обслуживанием моделей ИИ. В этой статье мы раскрывается скрытая магия — от интеграции scikit-learn до контейнеризации Docker, предоставляя вам ключевые идеи для превращения ваших моделей в доступные сервисы.

virtual_explorer 31 окт в 14:15

Технология «Дятел»: новаторское решение проблемы галлюцинаций ИИ

4 мин

Блог компании FirstVDS Машинное обучение *Искусственный интеллект

Исследователи искусственного интеллекта из Университета науки и технологий Китая (USTC) и лаборатории Tencent YouTu Lab разработали инновационную структуру, получившую название «Дятел» (Woodpecker). Она предназначена для коррекции «галлюцинаций» в мультимодальных языковых моделях (MLLM).

Принципы своей работы они описывают встатье, опубликованной несколько дней назад на сервере препринтов arXiv. Их технология достаточно проста, но позволяет убрать глупые, очевидно неверные ответы, которые иногда , казалось бы, в случайном порядке выдают языковые и другие GPT-модели.

+20

totsamymatveev 31 окт в 12:24

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Средний

12 мин

Блог компании МегаФон Python *Big Data *Машинное обучение *Искусственный интеллект

Туториал

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

dubitskaya 31 окт в 12:07

Как я ускорила разработку корпоративных онлайн-курсов с помощью современной модели 4С/ID и использования нейросетей

Средний

6 мин

2.9K

Блог компании ЕДИНЫЙ ЦУПИС Машинное обучение *Учебный процесс в IT Искусственный интеллект

Кейс

В этой статье я на примере разберу процесс проектирования онлайн-курса «Практика эффективной обратной связи» по модели 4C/ID с использованием нейросетей. Расскажу, на каких этапах проектирования нейросети могут быть полезны, какие возникли трудности и каких результатов мы добились. Статья будет полезна методологам, методистам, специалистам L&D и всем, кому интересно заглянуть за кулисы проектирования онлайн-обучения.

DigitalTatarstan 30 окт в 11:30

Как мы собираемся дать ИИ и гражданам доступ в госуправление: кейс Татарстана

4 мин

Блог компании Команда Цифровой Трансформации Татарстана Big Data *Машинное обучение *Искусственный интеллект

Кейс

Центр цифровой трансформации Республики Татарстан запустил площадку публичных обсуждений проектов в сфере ИИ, в которой пользователи и предобученная большая языковая модель вместе обсуждают и оценивают инициативы в сфере ИИ.

В статье рассказываем, для чего нужна площадка и как она будет работать.

ptsecurity 30 окт в 11:11

Поймай меня, если сможешь: как найти хакера в инфраструктуре с помощью ML

9 мин

Блог компании Positive Technologies Информационная безопасность *Программирование *Машинное обучение *Искусственный интеллект

По результатам пентестов, проведенных нашими специалистами в 2021–2022 годах, 96% компаний оказались не защищены от проникновения в локальную сеть, причем в 8 из 10 организаций мог бы проникнуть даже низкоквалифицированный злоумышленник. Среди протестированных предприятий каждое пятое — из отрасли промышленности, и инциденты на них гораздо серьезнее и страшнее, чем взлом кассового аппарата продуктового магазина. Остановка турбины АЭС грозит экологической катастрофой, авария на металлургическом заводе практически всегда приводит к человеческим жертвам. А что будет, если хакеры атакуют аэропорт?

Мы проверили и узнали — ничего хорошего. На кибербитве Standoff команда красных взломала SCADA-систему аэропорта виртуального Государства F. Более того, им удалось получить контроль над телетрапом.

Сегодня мы пошагово разберем действия red team, расскажем, как модели машинного обучения могли бы помочь их поймать, и покажем, какими методами можно обнаружить атаку и выявить ее источник.

Читать

dentsuRU 27 окт в 15:47

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

Простой

6 мин

3.9K

Блог компании OKKAM Group Алгоритмы *Машинное обучение *

Кейс

Привет, Хабр! Меня зовут Владислав Абрамов, я аналитик в команде разработки компании Easy Commerce. Перед нами стояла задача создать алгоритм, который определяет влияние характеристик карточки товара на поисковую позицию в крупнейших российских маркетплейсах. Большинство из них не раскрывают принципы ранжирования — эту проблему нужно было решить с помощью анализа открытых данных. В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает.

Lithium_vn 27 окт в 15:39

ИИ выходит на новый уровень: LLM обретают пространственно-временную картину мира

Средний

5 мин

33K

Блог компании BotHub Машинное обучение *Научно-популярное Искусственный интеллект

Обзор

Исследователи из MIT под руководством Макса Тегмарка сделали важное открытие в области искусственного интеллекта. Им удалось доказать, что современные языковые модели (LLM), обученные на огромных массивах текстов, формируют внутри себя целостные модели мира, включающие представления о таких фундаментальных понятиях, как пространство и время.

Это открытие имеет принципиальное значение. Считалось, что для искусственного интеллекта недоступны базовые человеческие возможности, такие как самосознание, наличие картины мира и способность к человекоподобному мышлению, в принципе. Но это открытие стало gamechanger’ом в плане понимания того, как у ИИ происходит мыслительный процесс.

Предлагаем и Вам углубиться в это исследование и узнать, что конкретно было сделано и как!

+11

2 3 ...

49 50

ZlodeiBaal
1558.0
snakers4
1513.0
Leono
1346.8
alizar
1261.2
BarakAdama
1224.0
3Dvideo
958.0
averkij
727.0
man_of_letters
723.0
m1rko
694.0
stalkermustang
631.0

Data Scientist

105 вакансий

Машинное обучение *

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»

Новости

Общаемся с базой знаний: как мы улучшили точность генеративных ответов LLM с помощью собственного RAG

Моделирование размещения хабов в pyomo

Mimesis: идеальное решение для генерации данных

Истории

Архитектуры RL: DDPG иPPO

Разработка рекомендательных систем: три открытых библиотеки от Сбера

Предсказываем цены с помощью методов анализа данных и машинного обучения

Применение архитектурных шаблонов в машинном обучении: разбор Gradient Boosting

Сокращаем дистанцию: как сконструировать SQL-модели в MLflow и упростить управление жизненным циклом машинного обучения

Использование ML для прогнозирования CLTV

Поможем Ходору найти новых друзей с помощью графов

Прогнозирование нагрузки солнечных электростанций

Как работают Model Serving инструменты изнутри. Пишем свой на Python и Docker с нуля

Ближайшие события

Технология «Дятел»: новаторское решение проблемы галлюцинаций ИИ

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Как я ускорила разработку корпоративных онлайн-курсов с помощью современной модели 4С/ID и использования нейросетей

Как мы собираемся дать ИИ и гражданам доступ в госуправление: кейс Татарстана

Поймай меня, если сможешь: как найти хакера в инфраструктуре с помощью ML

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

ИИ выходит на новый уровень: LLM обретают пространственно-временную картину мира

Вклад авторов

Работа