Как стать автором
Обновить

Предсказание выбытия насосов или как я вошел в data science

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров3.7K

Всем привет, меня зовут Богдан. В ML я начал свое посвящение осенью 2023 года и за этот год успел поработать над таким неоднозначным проектом как "Предсказание выбытия насосов". На данную тему на Хабре уже есть несколько статей, которые я в своё время нашел и опыт которых я пытался перенести в свой учебный big data пет проект :)
ссылки на других ребят тут: ссылка 1 и ссылка 2

Хочу сказать что в данной статье не будет кода, она будет посвящена размышлениям, неудачам и иногда смешным попыткам решить данную проблему. Ну а также наверное где-то я буду кидать ссылки на совершенно разные вещи и немного похвастаюсь нашим финальным решением и тем, к чему меня привело участие во всем этом.

Если вы хотите посмотреть на то как это реализовано под капотом, то добро пожаловать в репу на гитхабе
Здесь расписано множество вещей, которые я успел попробовать пока работал над этой задачей в них входят как удачные решения, так и не очень.

Читать далее
Всего голосов 4: ↑4 и ↓0+7
Комментарии10

Мы так и не смогли защитить свою модель машинного обучения от состязательных атак. Пока

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров3.2K

Наша команда разработчиков Исследовательского центра доверенного искусственного интеллекта ИСП РАН первые два года занималась построением сетевой системы обнаружения вторжений, основанной на применении методов машинного обучения. А в последний год мы сменили щит на меч и начали атаковать состязательными атаками (adversarial attacks) синтезированную нами же модель.

Задача была простой: оценить устойчивость модели к состязательным атакам. Спойлер: модель не устойчива, а как это исправить — мы пока не знаем. Подробности ниже.

Читать далее
Всего голосов 21: ↑21 и ↓0+21
Комментарии8

Искусство общения с LLM: Гайд по техникам Prompt Engineering

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3.8K

Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей.

В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач, о продвинутых техниках через рассуждения для повышения качества ответа и снижения вероятности появления галлюцинаций. Гайд будет полезен для всех, кто начинает погружаться в промптинг.

Это мой первый пост, поэтому буду рад любой обратной связи!

Читать далее
Всего голосов 10: ↑7 и ↓3+7
Комментарии3

Есть ли жизнь после Nvidia? Часть 2: исследование возможностей SOPHON AI Micro Server SE5-16

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1K

Чтобы ответить на вопрос «Есть ли жизнь после Nvidia?», мы продолжаем поиск альтернативных вычислительных устройств, с помощью которых надеемся в дальнейшей перспективе решать задачи по распознаванию транспорта и пешеходов.

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии2

Осталось 12 дней до конца регистрации на Data Fusion Contest. Призовой фонд — 2 млн рублей

Время на прочтение1 мин
Количество просмотров454

Уважаемые друзья! Соревнование ВТБ по машинному обучению Data Fusion Contest 2023 в самом разгаре. Уже определены победители первого турнира, которые разделят 600 тыс. рублей. А это значит, что в призовом фонде остались еще 1,4 млн рублей, за которые вы можете побороться до 2 апреля. Попробуйте свои силы в организации атак на модели машинного обучения и защиты от них (Adversarial Machine Learning). Соревнование проходит в турнирном формате и состоит из двух противоположных задач: «Атака» и «Защита».

И еще немного хороших новостей:
Всего голосов 1: ↑1 и ↓0+1
Комментарии3

СИБУР вывел на рынок решения для ИИ и управления данными

Время на прочтение2 мин
Количество просмотров1.2K

Линейка IT-решений СИБУРа, доступных на рынке, расширилась за счёт продуктов «Каталог данных» и «SIBUR ML Framework». То есть, таких решений у нас уже 5!

Помимо упомянутых новинок мы продаём программно-аппаратные комплексы дополненной реальности и промышленного интернета вещей, а ещё систему интеллектуального видеонаблюдения «Чёрный экран». В 2022 году экономический эффект от их внедрения превысил 300 млн рублей.

Но здесь мы расскажем про новинки.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Вебинар «От идеи до внедрения. Как построить систему анализа данных для промышленного предприятия»

Время на прочтение1 мин
Количество просмотров277

Factory5 приглашает на вебинар, посвященный типовым проблемам и задачам при развитии проектов машинного обучения — от амбициозной идеи до промышленной системы.

Читать далее
Рейтинг0
Комментарии0

Новый запуск курса My First Data Project: от идеи к продукту

Время на прочтение2 мин
Количество просмотров620

10 апреля сообщество AI Talent Hub и Передовая Инженерная Школа ИТМО запускают второй поток онлайн-курса My First Data Project по созданию реального продукта на данных с менторской поддержкой и возможностью поступить в магистратуру ИТМО без экзаменов.
Рассказываем, что нужно сделать!

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Препарируем MLOps в бесплатном курсе: 7 полезных материалов о дисциплине и инструментах для работы с ML-моделями

Время на прочтение2 мин
Количество просмотров1.7K

Привет, Хабр! У нас вышел новый бесплатный образовательный курс — «Выстраиваем работу с ML». В нем мы подробно рассматриваем концепцию MLOps и рассказываем об инструментах для работы с ML-моделями. Изучение всех материалов займет около трех часов. Под катом рассказываем, что вас ждет на курсе.
Читать дальше →
Всего голосов 23: ↑23 и ↓0+23
Комментарии0

Присоединяйтесь к онлайн-митапу ВТБ

Время на прочтение1 мин
Количество просмотров547

8 декабря 2022 года в 18:30 состоится онлайн-митап ВТБ «Применение ML-инструментов в бизнес-процессах». Митап полезен всем, кто интересуется Data Science и Machine Learning.

Основные темы митапа:

«Читать далее»
Всего голосов 6: ↑2 и ↓4+2
Комментарии0

Приглашаем на митап VK Tech Talks · ML в Питере

Время на прочтение1 мин
Количество просмотров577

22 июня приглашаем всех, кому интересны системы рекомендаций и ранжирования, узнать, как работают над такими продуктами специалисты ВКонтакте. Вы увидите очень разные кейсы со всеми их вызовами и найденными решениями.

Приходите в офис VK у Красного моста или подключайтесь к онлайн-трансляции ВКонтакте. Регистрируйтесь для очного участия или если хотите попасть в закрытый чат, где можно будет оставлять вопросы докладчикам онлайн.

Познакомиться с докладами
Всего голосов 11: ↑11 и ↓0+11
Комментарии0

Telegram-бот для распознавания COVID-19 по голосу будет размещен в облаке Serverspace

Время на прочтение2 мин
Количество просмотров665


Студент 3 курса Университета ИТМО, Владимир Шилоносов, учащийся по направлению Нейротехнологии и программная инженерия, разрабатывает новую систему распознавания COVID-19 на основе анализа звуковых данных. Программа использует такие признаки, как уровень громкости или диапазон высоты звука, чтобы обнаружить COVID-19. Точность предсказания 91,7%.
Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии1

Газпромбанк запускает стажировки по Data Science и Machine Learning

Время на прочтение1 мин
Количество просмотров14K

В Газпромбанке открывается программа для студентов и молодых специалистов по направлениям анализ данных и разработка ML-моделей. Заявки принимаем с 6 по 26 февраля, а процесс отбора в команды будет проходить до конца марта. Записывайтесь, если хотите развиваться в этой области, и рекомендуйте знакомым. Стажировка оплачивается, а лучшие участники получат предложение о работе в банке.

Стажировка продлится 9 месяцев. За это время участники научатся: разрабатывать и выводить модели машинного обучения в промышленную среду, выдвигать и проверять гипотезы, искать точки роста для бизнеса, выявлять закономерности в данных с использованием математической статистики и методов машинного обучения (линейные модели, нейронные сети, графы, кластерный анализ), а также визуализировать полученные результаты и проводить A/B тестирование с применением моделей;

Приглашаем студентов старших курсов бакалавриата и специалитета, магистратуры, аспирантуры, выпускников технических факультетов или курсов переквалификации.

От кандидатов ждем: знание Python, SQL,опыт работы со стандартными библиотеками для DS (numpy, pandas, matplotlib/seaborn, sklearn, pytorch), понимание принципов работы с Hadoop, Mlflow, Airflow, Docker.

Отбор будет проходить в несколько этапов. На первом принимаем заявки на странице программы. На втором этапе надо будет пройти технический тест, видеоинтервью и в финале – встретиться с руководителем подразделения. Старт программы – 3 апреля. По ее итогам лучшие кандидаты получат предложение о работе в банке. 

Читать далее
Рейтинг0
Комментарии5

Вебинар для тех, кто работает с аналитикой данных и ML

Время на прочтение1 мин
Количество просмотров403

Привет, Хабр! 22 февраля мы проведем вебинар «Аналитические инструменты для ленивых». Покажем, что делать, если хочется заниматься аналитикой данных, а не установкой библиотек и инструментов.

Читать далее
Всего голосов 3: ↑2 и ↓1+2
Комментарии0

Вебинар «MLflow в облаке. Простой и быстрый способ вывести ML-модели в продакшен» 23 марта

Время на прочтение1 мин
Количество просмотров1.6K


MLflow — один из самых стабильных и легких современных инструментов, позволяющих специалистам по Data Science управлять жизненным циклом моделей машинного обучения на всем его протяжении.

23 марта (вторник) присоединяйтесь к вебинару «MLflow в облаке. Простой и быстрый способ вывести ML-модели в продакшен», где мы пройдем все этапы установки и настройки MLflow в максимально близком к production варианте, а также покажем, как реализовать использование облачных сервисов в качестве различных backend-сервисов MLflow. Подключайтесь!
Подробнее о вебинаре
Всего голосов 4: ↑3 и ↓1+7
Комментарии1

X5 Data Science meetup #3

Время на прочтение2 мин
Количество просмотров899

Бурный рост эффективности ML систем провоцирует огромное количество дискуссий. 25 апреля X5 Tech приглашает экспертов в Data Science, чтобы обсудить, как с помощью новых методов и подходов победить неэффективные процессы.

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Митап про новые тренды и инструменты ML

Время на прочтение1 мин
Количество просмотров828

Привет, Хабр! 18 апреля в 18:00 мы проведем митап MLечный путь 2024. Обсудим инфраструктуру для ML и сложности построения production ML-систем. Поговорим про LLM, оптимизацию моделей, безопасность и сокращение расходов на инференс. На митапе выступят эксперты из Selectel, СберМаркета,, Dstack, Axenix, MIL Team, Raft. 
Читать дальше →
Всего голосов 4: ↑4 и ↓0+6
Комментарии0

Российские роботы выполняют задачи на естественном языке. Зимний ROS Meetup 2024 — как это было и как это будет?

Время на прочтение3 мин
Количество просмотров905

Всем привет! Сегодня мы отправимся в прошлое и вспомним, как проходил зимний ROS Meetup 3 февраля 2024 года: какие темы по LLM, Deep Learning и антропоморфным роботам были раскрыты и что нас ждёт дальше?

Чтобы услышать самую актуальную информацию из этой области и не только, приходите на следующий ROS Meetup 27-28 апреля 2024. Анонс с программой и ссылка для регистрации на очное мероприятие тут. Не упустите возможность стать ближе к будущему вместе с крупнейшим сообществом по Robot Operating System в России :)

Звучит захватывающе? Делают ли подобное в России? Да, и ещё раз да! Ниже мы кратко обсудим выступления из данного тематического блока. 

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Лучшим стажерам GlowByte по направлению «Практический ModelOps» предложат трудоустройство в компании

Время на прочтение1 мин
Количество просмотров531

В мае текущего года практика Advanced Analytics GlowByte провела студенческую стажерскую программу по направлению «Практический ModelOps». Из 35 кандидатов, претендующих на участие, 12 человек прошли три этапа отбора. В проведении стажировки и оценке проектов принимали участие руководители и специалисты направления ModelOps. 

Читать далее
Всего голосов 7: ↑4 и ↓3+3
Комментарии3

Подводим итоги хакатона X5 Tech AI Hack

Время на прочтение2 мин
Количество просмотров916

30 мая финалисты хакатона X5 Tech AI Hack выступили с питчингами своих проектов на антиконференции X5 Future Night, где обсуждались искусственный интеллект, роботизация и успешные кейсы применения этих технологий в бизнесе.   

На хакатоне участники решали задачи по обработке естественного языка – разрабатывали алгоритм для замены в тексте чувствительных данных и определения галлюцинаций у генеративной нейросети. Финалисты продемонстрировали превосходные умения работать с ИИ, Big Data и большими языковыми моделями. Делимся презентациями команд и записью защиты кейсов.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии3
1
23 ...