Чем сложны LLM
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера. От растущих требований к железу до встраивания LLM в экосистему.
Обучение, применение и сопровождение моделей в продакшене
21–22 маяOnline
I’ML — техническая конференция для всех, кто использует ML в проектах.
В программе — разносторонние выступления: от общих проблем машинного обучения до реальных приложений в продуктах. От табличных данных, NLP и CV — до Big Data ML и конкретных кейсов из industrial, fintech, medical и social ML. MLOps, RL, RecSys, Uplift Modelling, Causal Inference — всё это и многое другое.
Форматы обсуждения могут быть самыми разными: доклады, мастер-классы или воркшопы, дискуссии или интервью, и даже баттлы. Здесь собираются ML-инженеры, дата-сайентисты, исследователи, аналитики и разработчики, чтобы поделиться как успешным опытом реализации ML-проектов, так и фейлами при внедрении ML. Присоединяйтесь!
Организатор — JUG Ru Group.
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера. От растущих требований к железу до встраивания LLM в экосистему.
Говорим про типы данных, с помощью которых модель учится понимать мир. Разбираемся в истории появления мультимодальных моделей и сравниваем их с нейронными сетями внутри человека.
Обсуждаем ML-инфраструктуру, включая MLOps. Как устроен этот процесс в компаниях разного уровня зрелости, как выводить модели в прод быстро и переиспользовать код. Как выглядит ML-платформа и кому лучше заниматься ее построением.
Продолжаем говорить о доставке моделей в прод. На этот раз — о задачах, с которыми сталкивается компания на всех этапах. Про датасеты, обучение моделей и пайплайны.
Разрабатываем модели на Big Data, отправляем их в прод и мерджим LLM.
Говорим о том, как менялась практика оценки NLP-моделей, обсуждаем влияние кодогенерации на бизнес и жизнь разработчика. Поднимаем вопросы о доверии к профессионалам и роли людей в создании новых метрик.
Существует множество проверенных архитектур для ранжирования. В этом выпуске изучаем их эффективность и обсуждаем, как сделать удобную инфраструктуру — вместе с Head of ML в Wildberries.
Разбираемся, что такое ML System Design Document — когда его внедрять, кто должен этим заниматься, и что вообще подразумевается под System Design для ML-специфики.
Компания: Сбер
Компания: X5 Tech
Компания: Авито
Компания: Циан
Компания: Artifactory