Как стать автором
Обновить
447.46

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Хайп вокруг аппаратного ускорения ИИ и реальная ситуация. Обучение модели на телефоне и результаты в миллисекундах

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

Сегодня в ленте было про GPU для дата-центров. Смешно было про "мейнфреймы в офисе для AI" - в статье, на которую ссылается автор, нет ничего про то, что искуственный интеллект может или будет работать на мейнфреймах. И опять про "аппаратное ускорение AI" на пользовательских устройствах. Автор, вы сами попробуйте добраться до этого аппаратного ускорения, и если найдете как - напишите статью. А то элементарная попытка использования GPU для работы TensorFlow Lite приводит только к потерянному времени, а ускорители NPU больше не поддерживаются именно там, где должны были бы. То есть за хайпом вокруг "аппаратного ускорения ИИ" производители создали новую категорию устройств, и теперь стандартно ноутбук будет стоить в 2 раза больше, чем было раньше. А по факту пользоваться этим ускорением будут только компании-производители, чтобы еще больше заработать денег на пользователях через рекламу, "правильные" модели и торговлю персональными данными.

А мы сегодня запустим TensorFlow Lite на устройствах разного класса и года выпуска и посмотрим, что там с производительностью и ускорением.

Читать далее
Рейтинг0
Комментарии0

Новости

Как котята лапками настраивают GPU в Kubernetes и при чем тут эффект Манделы

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров3.3K
image

Думаю, у каждого были ситуации, когда специальные инструменты помогали решать сложные рутинные задачи. Например, с помощью обжимки кабеля намного проще нарезать патчкорды, чем ножом и отверткой. Изоляция в Docker избавляет от беспорядка с зависимостями.

Привет, Хабр! Меня зовут Антон. Мне часто приходится настраивать инфраструктуру для обучения и инференсинга моделей на GPU в Kubernetes. Хочу поделиться волшебным инструментом, который позволяет это делать без костылей и велосипедов, если у вас лапки.

В этой статье расскажу и про боли при настройке GPU для ML-задач, и про лекарство — GPU-оператор. Разберемся на примере с GPU NVIDIA, но и для AMD общая концепция будет похожа. Ранее я выступал с этим материалом на конференции PyCon 2024.
Читать дальше →
Всего голосов 11: ↑11 и ↓0+12
Комментарии0

Отличается ли внимание человека и модели-трансформера?

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров794

Для того, чтобы понимать язык и делать различные выводы, человек рассуждает, опираясь на знания о мире и здравый смысл. Несмотря на то, что большие языковые модели достигли значительных успехов в обработке естественного языка, рассуждение на основе здравого смысла остаëтся одним из самых сложных навыков. 

Наиболее распространëнным способом оценки способностей моделей рассуждать, опираясь на здравый смысл, является тест на основе схемы Винограда (The Winograd Schema Challenge, или WSC), названный в честь Терри Винограда, профессора компьютерных наук в Стэнфордском университете. Тест основан на разрешении синтаксической неоднозначности.

Давайте рассмотрим пример из схемы Винограда:

"Кубок не помещается в коричневый чемодан, потому что он слишком большой."

Что в этом случае является слишком большим: чемодан или кубок? Для человека ответ является очевидным, а для модели?..

Мы расскажем про наше исследование, в котором сравнили внимание человека и модели, а также проанализировали, на какие слова при решении схемы Винограда обращают внимание человек и модель. Хотя внимание человека и внимание трансформера кажутся совершенно разными, отдельные результаты говорят о взаимосвязи между ними.

Читать далее
Всего голосов 5: ↑5 и ↓0+6
Комментарии2

Реализуем машинное обучение на сервере с помощью Swift

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров314

В этом руководстве я покажу вам, как работать с моделью машинного обучения на сервере Vapor с помощью Swift.

Ни для кого не секрет, что Apple стремится двигать свою экосистему в сторону извлечения максимальной выгоды путем переноса мощных процессов машинного обучения на устройства пользователей. Core ML предлагает молниеносную производительность и упрощает интеграцию моделей машинного обучения в приложения — от создания до обучения и развертывания моделей. Чтобы лучше понять тонкости работы фреймворка Core ML, рекомендую вам ознакомиться с этим руководством.

Однако в этом бесконечном прогрессе ИИ новые технологии, связанные с генеративными алгоритмами, несколько усложняют ситуацию: зачастую эти модели достаточно тяжелы и требуют значительных затрат ресурсов для работы на устройстве.

Читать далее
Рейтинг0
Комментарии0

Истории

Топ 5 продвинутых инструментов Data Science. Изучи за выходные и будешь выделяться

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров4.1K

Привет, чемпионы! Сегодня рассмотрим, как облегчить себе жизнь, применяя 5 инструментов в своих проектах. Эти инструменты улучшат ваш код, сделают ваш pipeline более стабильным и позволят не писать один код по 10 раз. Круто? Погнали!

Изучать новое!
Всего голосов 6: ↑6 и ↓0+9
Комментарии8

Лирика в IT, или как мы научились вытаскивать тексты из песен. Опыт Звука

Время на прочтение7 мин
Количество просмотров460

Для того чтобы пользователи музыкального стриминга могли легко находить песни по тематике и смыслу, а система рекомендаций подсказывала наиболее подходящие песни, необходим процесс извлечения лирики. Это подразумевает автоматизированное извлечение и последующий анализ текстов песен: от романтических баллад до хитов диско. Более того, это позволяет эффективно фильтровать контент для различных возрастных групп.

Меня зовут Дмитрий Берестнев, я Chief Data Scientist HiFi-стриминга Звук, и сегодня расскажу, как мы реализовали распознавание лирики.

Читать далее
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Ничья в футболе, водное поло и двумерный Пуассон

Уровень сложностиСложный
Время на прочтение19 мин
Количество просмотров660

Данная статья является разбором статьи 2003 года Dimitris Karlis'а и Ioannis Ntzoufras'а "Analysis of sports data by using bivariate Poisson models".

Данная статья будет интересна в основном тем кто использует или понимает как использовать распределения Пуассона в моделях машинного обучения и для предобработки данных для прогнозирования результатов спортивных событий.

Для моделирования спортивных данных было использовано двумерное распределение Пуассона и его расширения. Двумерное распределение Пуассона позволяет получить корреляцию между результатами соревнующихся команд, что вполне вероятно для некоторых командных видов спорта.

Читать далее
Всего голосов 2: ↑1 и ↓1+2
Комментарии2

Топ-7 высокооплачиваемых профессий в сфере ИИ

Время на прочтение9 мин
Количество просмотров7.2K

О том, как появление нейросетей влияет на рынок труда, говорят все. Потому что не говорить об этом невозможно. По мнению экспертов (и не только их), некоторые профессии скоро отправятся на свалку истории, а другие станут невероятно востребованными. Давайте разберёмся, что ждёт работодателей и соискателей в ближайшем будущем и каким специалистам в сфере ИИ, или AI, готовы платить больше всего.

Читать дальше →
Всего голосов 15: ↑10 и ↓5+8
Комментарии0

Рецепт идеальной разметки в Computer Vision

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.1K

За два года команда RnD CV из SberDevices выложила в открытый доступ три датасета для задач компьютерного зрения: HaGRID, EasyPortrait и Slovo. Чтобы достичь максимальной точности обработки данных, полученных с краудсорсинговых платформ, мы применили методы агрегации, которые позже объединили в фреймворк.

Привет, Хабр! На связи Карина Кванчиани и Александр Капитанов из SberDevices. В этой статье мы расскажем о фреймворке агрегации разметки данных, который использует наша команда и коллеги из других подразделений. AggregateMe помогает привести несколько разметок к одной и повысить её качество в случае, если исполнители где-то ошиблись. Скоро фреймворк появится в открытом доступе, а здесь расскажем, как он работает.

Читать далее
Всего голосов 6: ↑6 и ↓0+11
Комментарии1

Как обмануть AI-детектор, чтобы он не распознал текст от ИИ

Время на прочтение3 мин
Количество просмотров1.5K

Теперь не придётся краснеть перед работодателем или преподавателем из-за того, что вместо вас текст написал ИИ. Просто заставьте детекторы поверить, что автор — человек. В статье рассказали, как это сделать и в чём хитрость. 

Читать далее
Всего голосов 8: ↑4 и ↓4+3
Комментарии0

Как Google победил Skynet или подготовка обучения модели на мобильном устройстве

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров990

По мере того, как я погружался в тему машинного обучения на мобильных устройствах, я все больше ощущал какой-то заговор. Как я уже писал, простые обучалки начали исчезать из интернета несколько лет назад. А простые обучалки – это те, в которых простые модели, то есть то, что делают люди, которые только начинают разбираться в теме. Вместо этого сейчас предлагается использовать готовые датасеты вполне определенным образом, и от этого остается один шаг до использования готовых моделей. А еще, примеры для мобильных устройств на главном сайте TensorFlow устарели и не работают на современных версиях библиотеки, причем уже давно! И похоже, что скоро NPU, которые есть в каждом современном телефоне, станут для нас абсолютно бесполезными.

Читать далее
Всего голосов 6: ↑5 и ↓1+7
Комментарии1

Насколько ChatGPT-4o подвержен когнитивным искажениям?

Время на прочтение6 мин
Количество просмотров3.1K

Человеческий разум, столь сложный и удивительный, далеко не безупречен. Десятилетия исследований в области когнитивной психологии показали, что наше мышление подвержено систематическим ошибкам, известным как когнитивные искажения. Например, Канеман и Тверски открыли глаза на то, как часто мы подвергаемся влиянию искажений, даже когда абсолютно уверены в рациональности принятого решения. Мы склонны видеть мир не таким, какой он есть, а сквозь призму собственных предубеждений и упрощений. Но что, если эти же искажения проявляются и у искусственного интеллекта?

Конечно, ИИ может быть подвержен искажениям, исходящим из обучающих выборок и алгоритмических ограничений. Например, данные, на которых обучаются модели, могут содержать предвзятости, а сами алгоритмы могут формировать выводы, основанные на неявных предположениях. Но насколько передовые модели подвержены этим искажениям?

В этой статье мне бы хотелось обратиться к ChatGPT-4o и проверить именно ее и попробовать выявить потенциальные искажения.

Приятного прочтения (:

Читать далее
Всего голосов 13: ↑11 и ↓2+13
Комментарии9

Действительно ли большие языковые модели галлюцинируют? Эксперимент

Время на прочтение11 мин
Количество просмотров8.2K

Существует мнение, что основная проблема больших языковых моделей — в склонности к галлюцинациям. Когда нейросеть генерирует текст с информацией, не связанной с запросом.  

Меня зовут Полина, я инженер по разработке ПО искусственного интеллекта в YADRO. Вместе с коллегами я разрабатываю системы на базе генеративных моделей, в том числе вопросно-ответных ассистентов. В рамках одного из проектов мы вместе с экспертом команды Андреем Соколовым задались вопросом: действительно ли проблема галлюцинаций так актуальна для современных предобученных LLM в вопросно-ответном сценарии.

Для этого мы провели эксперимент на собранном датасете. Попутно рассказали про модели-трансформеры и дали строгое определение понятию «галлюцинации LLM». Все подробности — под катом.

Читать далее
Всего голосов 19: ↑19 и ↓0+26
Комментарии17

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
11 сентября
Митап по BigData от Честного ЗНАКа
Санкт-ПетербургОнлайн
14 сентября
Конференция Practical ML Conf
МоскваОнлайн
19 сентября
CDI Conf 2024
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн
25 сентября
Конференция Yandex Scale 2024
МоскваОнлайн
28 – 29 сентября
Конференция E-CODE
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн

ML Meetup Wildberries 11/09

Время на прочтение2 мин
Количество просмотров267

11 сентября в 18:00 пройдет первый ML Meetup Wildberries в московском офисе компании. Спикеры расскажут про ML-решения в продуктах и процессах WB, а также поделятся интересными решениями в Рекомендациях и Поиске.

Регистрируйтесь и обязательно дождитесь подтверждения участия. Количество мест ограничено!

Читать далее
Всего голосов 3: ↑3 и ↓0+5
Комментарии2

GPU для дата-центров

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.3K

Серверный узел с восемью GPU-ускорителями AMD Instinct MI325X (2,3 ТБ видеопамяти, 8×750 Вт)

Современные дата-центры уже не такие, как прежде. Раньше на типичный сервер поставили бы 144-ядерный CPU, много RAM и десяток HDD/SSD. Но теперь приоритеты меняются, в первую очередь из-за высокого спроса на машинное обучение (ML) и приложения LLM. Хотя аппетит к памяти только вырос, но процессоры нужны другие.

И крупным корпорациям, и маленьким компаниям нужно железо для обсчёта ИИ-приложений. Это GPU-ускорители, NPU (Neural Processing Unit) и TPU (Tensor Processing Unit), AI-чипы нового поколения. Нужны серверы с GPU. Открываются даже специализированные GPU-облака на растущем спросе.
Читать дальше →
Всего голосов 23: ↑22 и ↓1+33
Комментарии1

Дообучаем Llama 3.1 у себя дома

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров9.1K

Привет, чемпионы!

С каждым днем появляется все больше и больше LLM. Их метрики растут с таким же бешеным темпом. Но в узких областях знаний они до сих пор дают осечку. Почему это происходит и как с эти бороться? - Разбираем универсальный код для дообучения LLM на своих данных!

Дообучать LLM!
Всего голосов 19: ↑16 и ↓3+17
Комментарии12

Как на изи «влететь» на Хак и затащить его на flow-режиме

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров808

Введение и задача

Добрый день, уважаемые читатели Хабр.ру! Я хотел бы поделится с вами отчетом по хакатону (Practice & Scale AI: Рерайтинг текста на уровне, позволяющем проходить фильтрацию распознающих систем), в который мы очень «лихо» влетели со всей командой (Anomaly Detection) и, забегая вперед, скажу, который мы «втащили» на третье место по нашему кейсу. Жаль, правда, что призовое место было одно, но все же это был отличный опыт и по «горячим» следам все сейчас опишу и расскажу, что мы делали и как «пришли» к нашему решению.

Читать далее
Всего голосов 17: ↑12 и ↓5+11
Комментарии0

Финансовый «Большой взрыв» в мире ИИ: от 100 млн. до 100 млрд. долларов — анализируем прогноз гендира Anthropic

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.4K

Привет, на связи Sherpa Robotics. Мы перевели статью о буме в сфере ИИ: Джови Моралес, техно-энтузиаст с богатым опытом работы в индустрии, рассуждает о росте затрат на развитие искусственного интеллекта и ставит вопрос  о последствиях  «гонки вооружений» в мире AI для нашей планеты. Действительно ли затраты в 100 миллиардов на ИИ уже стали нормой? Стоит ли сфера таких вложений? Помимо ответа самого Моралеса мы, как специалисты в сфере AI, даём в конце статьи свой комментарий. И расскажем, как рост расценок повлияет на будни рядовых айтишников. Так что если интересно узнать, каким видится будущее AI и как оно относится к вам, приходите под кат.

Читать далее
Всего голосов 11: ↑7 и ↓4+7
Комментарии2

От технической базы до AI-продукта: как устроен курс от AI Talent Hub и karpov.courses

Время на прочтение9 мин
Количество просмотров643

Привет, Хабр! ML Engineering — тренд, который долго еще будет в топе. AI Talent Hub и karpov.courses создали курс «ML Engineering: от технической базы до AI-продукта», где за 9 месяцев можно освоить техническую базу, понять потребности рынка и создать востребованный продукт. Реальные истории студентов, которые освоили профессию ML-инженера, а также гайд, как запрыгнуть в вагон ML-знаний. 

Читать далее
Всего голосов 6: ↑4 и ↓2+3
Комментарии0

Как с помощью доработки RFM сделать CRM-рассылки эффективнее

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.2K

Привет! Меня зовут Дмитрий Кротов, я старший аналитик в команде Авито Авто. В статье рассказываю, как мы создали сегментацию покупателей автомобилей с пробегом с помощью микса методологий, оценили её эффективность и применили на практике. 

Читать далее
Всего голосов 17: ↑15 и ↓2+15
Комментарии0
1
23 ...

Вклад авторов

Работа

Data Scientist
76 вакансий