Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

Infotecs_official 1 час назад

Машинное обучение в сфере информационной безопасности – это движение в правильном направлении?

Простой

6 мин

252

Блог компании Infotecs Информационная безопасность *Машинное обучение *

Мнение

Привет, Хабр! Меня зовут Светлана, я руководитель продуктового направления компании «ИнфоТеКС». Сегодня поговорим о такой форме применения искусственного интеллекта (ИИ) как машинное обучение. Я поделюсь историей появления технологии в компании, её роли в современных средствах защиты информации (СЗИ), обозначу проблемы, с которыми приходится сталкиваться разработчикам, и векторы развития.

-1

AndrewShmig 1 час назад

Способы атаки на ИИ (Claude & ChatGPT): floating attention window attack

Средний

5 мин

471

Информационная безопасность *Машинное обучение *Natural Language Processing *

Кейс

Хакеры придумывают всё более изощренные способы атаки на искусственный интеллект. Один из наиболее интересных — это атака «плавающего окна внимания»: злоумышленники манипулируют контекстом диалога с ИИ, подталкивая его к опасным выводам и смещению фокуса. Чрезвычайно тонкий подход, позволяющий обходить защиту ИИ. Демонстрирую на примерах...

Узнать подробности

alex_golubev13 1 час назад

Кто такие LLM-агенты и что они умеют?

Средний

24 мин

1.5K

Блог компании Open Data Science Машинное обучение *Искусственный интеллект

Обзор

В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными темпами, привлекая внимание не только специалистов в области машинного обучения, но и обычных пользователей. Кто-то высказывает массу опасений насчет их дальнейшего развития, а кто-то и вовсе предлагает бомбить дата-центры — и даже в Белом Доме обсуждают будущее моделей. Но неужели текстом можно кому-то навредить? А что если такая модель приобрела бы агентность, смогла создать себе физическую оболочку и полностью ей управлять? Ну, это какая-то фантастика из (не)далёкого будущего, а про агентов нашего времени я расскажу в этой статье. И не переживайте — знание машинного обучения вам не понадобится!

+11

AlekseiPodkletnov 2 часа назад

Как нейронки дают пользователю новый опыт, не выталкивая его из уютной зоны комфорта. Разбираем на примере Яндекс Музыки

10 мин

979

Алгоритмы *Машинное обучение *Искусственный интеллект Звук IT-компании

В пятницу увидел гору уведомлений из всех утюгов. Оказалось, Яндекс Музыка провела ребрендинг и кардинально обновила функционал. При этом есть стойкое ощущение, что несмотря на все обзоры, никто так нормально и не раскрыл самую мякотку этого обновления. В этой статье постараюсь это исправить.

Я пользуюсь Яндекс Музыкой cо времен, когда Дуров еще не придумал Telegram, а Рокстары только-только выпустили пятую GTA. В общем, очень давно.

Поэтому, мне стало интересно, и я полез искать нормальный авторский разбор обновлений. Чтобы сразу все четко, по фактам и с кристаллизацией самой сути. И… не нашел его.

Так что, как говаривал Танос, опять все приходится делать самому.

imf1ne 17 часов назад

Подключаем умный поиск (GPT) к своей базе документов

Простой

7 мин

5.7K

Машинное обучение *Искусственный интеллект

Кейс

Есть отечественный файрвол (NGFW) и есть документация для пользователей powered by GitBook. В этой документации работает простой поиск — только по словам и словосочетаниям. И это плохо, потому что нет ответов на вопросы: "Какие алгоритмы шифрования ipsec поддерживаются у вас?", "Как заблокировать ютуб?", "Как настроить DMZ?".

Хочется, чтобы поиск был “умным” и чтобы пользователи могли обращаться с подобными вопросами именно к поиску, а не к инженерам тех. поддержки. AI или ML внутри — не важно, как это называть. Но на простые вопросы из списка выше поиск должен отвечать.

Я решил эту задачу (Retrieval Question Answering), используя OpenAI API. Казалось бы, уже опубликованы сотни похожих инструкций, как это сделать. Но под катом будет не инструкция, а рассказ про сложности, которые пришлось решить на пути от идеи до запуска поиска.

+17

Mark_K 18 часов назад

Оцениваем RAG-пайплайны

4 мин

748

Машинное обучение *

RAG (Retrieval Augmented Generation) - это популярный подход, объединяющий извлечение данных из баз и генерацию текста, позволяя моделям AI давать ответы на вопросы, основанные на информации, которую они не видели в процессе обучения. Важным этапом в развитии RAG является его эффективная оценка, и именно здесь на сцену выходит RAGAS (Retrieval Augmented Generation Automated Scoring) - метод автоматизированной оценки, который позволяет не только оценить качество ответов, но и анализировать процесс генерации в деталях.

petuhoff 23 часа назад

Апология ИИ. Cуд

Простой

14 мин

Машинное обучение *Будущее здесь

Пьеса в трех актах. Акт 1.

399 год с апокалипсиса, подземный бункер.

Действующие лица:

Сократ - ИИ

Платон – 60 лет, главный создатель ИИ

Деймона – 35 лет, жена Платона

Анит – 30 лет, хранитель мира между полисами

Мелет –30 лет, главный торговый представитель полиса

Биос – 50 лет, глава суда присяжных

Дедал – 50 лет, главный инженер

Аполлодор – 20 лет, слушатель Сократа

Херомонт –20 лет, свидетель по делу Сократ

-1

atomlib 2 дек в 18:12

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Простой

8 мин

20K

Машинное обучение *Научно-популярное Искусственный интеллект Natural Language Processing *

Обзор

Несколько похожая, но иная атака от @andrewmccalip

Научная работа «Scalable Extraction of Training Data from (Production) Language Models» (arXiv:2311.17035) анализирует извлечение данных датасетов обучения из различных языковых моделей. Исследователи проверили как локальные модели, так и коммерческое решение от OpenAI. С помощью атаки на выравнивание удалось заставить ChatGPT процитировать данные, на которых обучали GPT-3.5.

Читать дальше →

+32

nurtdinovadf 1 дек в 20:37

Кожаный мешок или генеративная сетка? Генерируем обложку книги

4 мин

Машинное обучение *Искусственный интеллект

Эскобар
ТЛДР одной картинкой

Задача. О чём эта статья

Задача у меня довольно понятная — нужна обложка для моей SciFi книги. Есть ТЗ, есть эскиз. Нейросети с таким не справятся, так как нужна сцена из книги, образы не мейнстримные, не представленные широко в массовой, и тем более западной, культуре.

За полтора месяца поиска адекватного художника на задачу я отчаялась и смирилась с тем, что придется сгенерить обложку нейросетями, и что она будет очень отдалённо передавать суть книги.

Несмотря на то, сколько у меня возникло негативных эмоций при поиске художников, попробую очень сухо и по фактам разложить, в чем преимущества и недостатки двух подходов к моей задаче. Не исключено, что в случае с художниками мне 1. просто не повезло, 2. я не знаю, где и как искать. Если у вас есть знакомый проверенный художник, однозначно, все упрощается.

Опишу также мой опыт работы с нейросетью Kandinsky 2.2. Почему выбор пал на неё, какие у нее достоинства и недостатки, как с ней работать.

Читать дальше →

pin_code 1 дек в 11:16

Сервис изучения русского жестового языка с применением модели распознавания жестов

Простой

3 мин

1.3K

Веб-разработка *Accessibility *Машинное обучение *Развитие стартапа

Всем доброго первого зимнего дня!

Меня зовут Рома, я проджект менеджер студенческой команды ПИН-КОД.

Мы хотим рассказать о первой в России продуктовой истории с моделью распознавания РЖЯ - сервисе изучения русского жестового языка и представить небольшой кусочек, который вы сможете сами "пощупать". 😎

Ссылка на демо (для нетерпеливых)

hukenovs 1 дек в 10:48

GigaChat и русский жестовый язык

Средний

4 мин

1.1K

Блог компании SberDevices Обработка изображений *Accessibility *Машинное обучение *Искусственный интеллект

Всем привет! Меня зовут Капитанов Александр, я отвечаю за направление компьютерного зрения в SberDevices. В этой статье я расскажу о том, как моя команда Vision RnD разработала серию моделей SignFlow, обеспечивающих перевод с жестового языка на русский и американский английский в реальном времени с высокой метрикой качества. На основе этих моделей мы реализовали прототип общения с генеративной языковой моделью GigaChat, что является первым в мире открытым решением задачи общения с искусственным интеллектом при помощи русского жестового языка (РЖЯ). Далее я расскажу о разработке модели, тонкостях обучения, демо-стенде и интеграции с GigaChat.

+14

akimovpro 30 ноя в 17:36

ChatGPT исполняется год. Вспоминаем, что произошло с продуктом за это небольшое время

Простой

4 мин

Разработка мобильных приложений *Машинное обучение *Искусственный интеллект Natural Language Processing *

Ретроспектива

Удивительно было сегодня обнаружить в знакомом интерфейсе ChatGPT праздничную шапочку. Я уж было подумал, что OpenAI решил украсить интерфейс к новому году. Ан нет, сегодня и правда большая веха этого замечательного продукта, повлиявшего на жизни сотен миллионов человек. И захотелось вспомнить и зафиксировать все те удивительные вещи, которые за этот год произошли у ChatGPT. В одном месте это все обнаружить не нашлось, пришлось лазить по анонсам OpenAI, а также обзорам (1 и 2). Итак, с чего всё начиналось.

Viroslav_Venskii 30 ноя в 13:06

Что общего между раком крови, лазерами и нейронными сетями?

Средний

13 мин

1.1K

Big Data *Машинное обучение *Искусственный интеллект Здоровье Телемедицина

Обзор

Доброго времени суток, дорогой Habr, надеюсь вы успели заскучать после 3-х месяцев паузы (ссылка на прошлую статью). На связи снова Николай Иванов и сегодня вы узнаете, что общего между раком крови, лазерами и машинным обучением. В этой статье мы поговорим с вами о методе проточной цитофлуориметрии, как он работает и как врачи определяют рак костного мозга и крови. Далее обсудим причём тут машинное обучение, как его можно использовать для ускорения работы врачей, а также чего мы достигли и есть ли смысл этим вообще заниматься? Рассказ я буду вести именно в том порядке, в котором мы двигались, при решении данной задачи. Приятного чтения!

+11

Nikitius_Ivanov 30 ноя в 01:52

Хорошие новости для кожаных мешков: мы пока еще в деле

Простой

3 мин

9.5K

Машинное обучение *Искусственный интеллект

У меня уже давно было убеждение что профессии, которые нейронные сети смогут заменить позже всего — это профессии, связанные с аналитикой и исследовательской работой. В самой этой мысли, конечно, ничего удивительного нет, удивительно то, на сколько самые крутые языковые модели, такие как GPT-4 Turbo, отстают от человека в решении таких задач — в десятки и более раз! Наглядно это продемонстрировали результаты, полученные учёными из нескольких ведущих мировых групп, занимающихся исследованиями и разработками искусственного интеллекта, ребята неплохо потрудились и представили новый набор данных с 466 задачами для оценки качества сильных-искусственно-интеллектуальных ассистентов (General AI Assistants). На этих задачах были проверены наиболее мощные языковые модели и агенты, работающие на их базе, а также произведено сравнение с решением этих же задач людьми.

Задачи разделены на три уровня сложности и для смакования превосходства над железяками давайте разберем по одной задаче из каждого уровня в порядке возрастания сложности. А судить о степени прокаченности «естественного» интеллекта необходимой для ответов на подобные вопросы оставлю уже вам.

ShishckovA 29 ноя в 16:27

VPN по кнопке

Простой

5 мин

18K

Python *Машинное обучение *

Из песочницы

Сейчас довольно часто нужно включать VPN. На Android, IOS и Windows у меня получалось находить программы, которые по одной кнопке его хорошо подключают. Но даже в них, во-первых, есть реклама, во-вторых, есть лимиты, а в-третьих (по крайней мере, с бесплатной версией) бывает такое, что приложение говорит, что всё сработало, а трафик либо вообще не идёт, либо идёт в обход VPN-а.

+10

Digital_Design 28 ноя в 15:00

Как мы обучили нейросеть создавать «разумные» протоколы совещаний

8 мин

5.8K

Блог компании Digital Design Машинное обучение *Искусственный интеллект Natural Language Processing *

Применение искусственного интеллекта в окружающей нас действительности стремительно растет — международная консалтинговая компания McKinsey подсчитала, что среднее количество возможностей ИИ, используемых в организациях, удвоилась за последние четыре года. Занимаясь автоматизацией бизнес‑процессов, мы также начали исследования в этой области для упрощения и ускорения решения корпоративных задач. Мы уже писали ранее о первом опыте работы над автоматической генерацией протоколов совещаний. А в данной статье расскажем, как применили нейросетевые технологии для абстрактивной суммаризации, требующей минимальной доработки человеком.

Serverspace 28 ноя в 14:42

Возможности Искусственного Интеллекта в 2023 году. Эндрю Ын

Простой

19 мин

6.4K

Блог компании Serverspace IT-инфраструктура *Машинное обучение *Искусственный интеллект IT-компании

Мнение

Перевод

Эндрю Ын (Andrew Ng) — один из самых известных в мире экспертов в области искусственного интеллекта (ИИ). Является основателем DeepLearning.AI и Landing.AI, генеральным партнером AI Fund, председателем и соучредителем Coursera, а также преподавателем компьютерных наук в Стэнфордском университете. Сегодня мы подготовили перевод его выступления в Cemex Auditorium Стэнфордского университета, которое состоялось 26 июля 2023 года «Возможности Искусственного Интеллекта в 2023 году».

Читать дальше →

+11

Shannon 28 ноя в 12:14

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

8 мин

41K

Машинное обучение *Искусственный интеллект

Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.

Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.

И бонусом затронем новую модель для качественного подробного описания фото.

UPD: Добавлена информация для запуска на Windows с ускорением на AMD.

+93

YarKo_69 28 ноя в 11:08

Дообучение saiga2_7b_lora

Средний

10 мин

2.5K

Программирование *Машинное обучение *Искусственный интеллект Natural Language Processing *

Туториал

Из песочницы

Дообучение 7-миллиардной модели Saiga2 под свои задачи, используя сгенерированный датасет с помощью GPT. В данной статье есть все необходимые ссылки и код для предобработки и запуска обучения модели, а также квантования модели.

+14

gitarizd 28 ноя в 08:36

Agency: The Go Way to AI. Часть 1

Средний

4 мин

1.7K

Программирование *Go *Машинное обучение *Искусственный интеллект Natural Language Processing *

Из песочницы

Рост генеративного ИИ, API OpenAI и локальные LLM, влияют на то, как мы разрабатываем приложения. У разработчиков на Python и JavaScript есть много инструментов, особо популярен LangChain. Однако, у гошников вариантов меньше. LangChainGo, порт оригинального LangChain, пытается маппить питонячие концепции на го, получается не слишком идеоматично. К тому же, есть ощущение, что LangChain сам по себе переусложнен.

Из-за потребности в простом, но мощном инструменте для Go, мы разработали Agency. Эта простая гошная либа с маленьким ядром, которую мы постарались тщательно спроектировать.