Искусственный интеллект

AI, ANN и иные формы искусственного разума

Статьи Посты Новости Авторы Компании

The-Founder-1 7 часов назад

Как воссоздают человека при помощи ИИ?

Простой

14 мин

1.1K

Python*Машинное обучение*Научно-популярноеИскусственный интеллект

Обзор

Помимо нейросетей и моделей машинного обучения, основанных на перцептронах, существуют и так называемые когнитивные архитектуры – они нацелены на имитацию человеческого интеллекта, как его себе представляют когнитивные науки через призмы разнородных теорий познания и гипотез.

Для психологии именно здесь скрывается человечность и тот сильный искусственный интеллект, AGI, симулирующий все способности человека. Но как работают когнитивные архитектуры наподобие ACT-R или SOAR, и подойдут ли они для продвижения общего интеллекта? – в нашей статье.

rukhi7 18 часов назад

Если интеллект это психическое расстройство, то что такое тогда искусственный интеллект?

5 мин

1.7K

Читальный залИскусственный интеллект

Мнение

Не так давно меня очень впечатлила статья Man, death & ethics и мне очень хотелось увидеть продолжение этой темы.

Но мне кажется, что прежде, чем разбираться с "концепциями определения человека, морали и этики" применительно к Искусственному интеллекту, не плохо было бы разобраться для начала с пониманием самого искусственного интеллекта и просто интеллекта. Давайте попробуем порассуждать на эту тему. Для начала попробую подвести к вопросу из заголовка.

Далее следуют некоторые рассуждения про интеллект в подавляющем большинстве своем, тем кому интересно про расстройства это точно не сюда.

-1

TAU15 15 июн в 08:36

JSON словарь в качестве постоянной памяти для GPT-ботов (версия 3.0)

Простой

4 мин

3.8K

Развитие стартапаИскусственный интеллектБудущее здесь

Кейс

Как заставить любого GPT-бота на базе любой LLM (например на ChatGPT) незаметно для пользователя запоминать в его постоянную память нужные нам сведения из диалога?

Пробуем применить подход к постоянной памяти используя JSON структуру.

-1

Soloist 15 июн в 02:22

Запускаем Stable Diffusion на GPU AMD Radeon в Docker

Средний

3 мин

4.5K

Графический дизайн*Искусственный интеллект

Туториал

Для запуска нам понадобится Ubuntu с установленными: git, make, docker и ROCm.

Инструкция по запуску короткая и простая, поэтому дополнительно разберём пример генерации изображения для этой статьи и продеманстрируем работу Stable Diffusion на AMD Radeon. Всё нижеизложенное протестировано на AMD Radeon RX 7900 XTX.

+11

egaoharu_kensei 14 июн в 19:47

Метрики оценки качества моделей и анализ ошибок в машинном обучении. Подробное руководство

Средний

32 мин

Python*Data Mining*Математика*Машинное обучение*Искусственный интеллект

Туториал

Одним из критически важных шагов при создании хорошей модели является правильный выбор метрики для оценки её качества, поскольку неправильный выбор может привести к неверным выводам и, как следствие, к принятию не самых оптимальных решений. Поэтому на сегодняшний день существует большое количество метрик, подходящих для самых разных задач и ситуаций.

В данном туториале будут рассмотрены популярные метрики для задач классификации, регрессии и кластеризации, а также инструмент для анализа ошибки модели, известный как bias-variance decomposition. Помимо этого, для большей части метрик будут представлены ручные расчёты и реализация с нуля на Python, а в конце вы сможете найти дополнительные источники для более глубокого ознакомления.

igormich88 14 июн в 15:28

Опыт создания нейросетевого-комикса

Простой

7 мин

4.2K

Машинное обучение*Графический дизайн*ДизайнИскусственный интеллект

Опыт создания нейросетевого-комикса

Привет! Почти каждый имел опыт создания изображений при помощи нейросетей или хотя бы видел сгенерированные ими картинки с лишними пальцами. Мне бы хотелось рассказать о том, как я создавал комикс на основе таких картинок, с какими сложностями столкнулся и какие хитрости использовал в работе. Сейчас создано 340 страниц, а основной сюжет комикса близится к завершению.

Примечание:
Пост рассказывает о личном опыте, не рассматривает архитектуру нейронных сетей и не претендует на охват всех возможных решений. Работу над комиксом я начал весной 2023 года, и с тех пор ситуация с нейронными сетями для создания изображений немного изменилась. Сюжет комикса и диалоги полностью написаны мной (ради интереса я попробовал использовать ChatGPT 3.5 для написания диалогов, но был разочарован).

Wonderlove 14 июн в 13:40

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Простой

4 мин

2.9K

Графический дизайн*ДизайнИскусственный интеллектБудущее здесь

Обзор

Всем привет!

Omost, разработанный lllyasviel — это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе

Название Omost (произношение: "almost") символизирует:

Каждый раз, когда вы используете Omost, ваше изображение почти готово

"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения

Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией

SmartEngines 14 июн в 10:39

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Простой

5 мин

554

Блог компании Smart EnginesОбработка изображений*Искусственный интеллект

Через неделю вузы начнут принимать документы абитуриентов на все формы обучения. Собрать и направить все необходимые бумаги в институты для будущих студентов – тот еще челлендж. Таким же малоприятным является процесс обработки этих документов и для сотрудников приемных комиссий, которым – когда абитуриенты выстроятся в очереди с оригиналами документов – придется перелопатить кипы бумаг.

Мы в Smart Engines нашли способ, как ускорить и упростить этот процесс для всех его участников.

ana_tomana 14 июн в 10:35

Как рисовать Sequence без боли и страданий в PlantUML

Простой

12 мин

Блог компании X5 TechАнализ и проектирование систем*UML Design*Искусственный интеллектIT-компании

Туториал

Привет! Меня зовут Настя, я старший системный аналитик в X5 Tech. Я рисую sequence-диаграммы каждый день на протяжении четырёх лет. За это время я прошла все круги ада по Данте, то есть попробовала разные инструменты для рисования этих самых диаграмм. Пока не встретила его – PlantUML.

Что удивительно, инструмент довольно не новый, но тем не менее лучше него я пока не встречала. А ещё удивительно, что он не особо популярный. Когда мы запустили в управлении системного анализа первый воркшоп по PlantUML, за 3 минуты после анонса пришли 12 заявок от аналитиков разных грейдов – от Junior до Lead.

В процессе подготовки материалов к воркшопу мы искали статьи и литературу, которые помогли бы дополнительно изучить sequence-диаграммы в PlantUML. Ничего интересного мы не нашли.

На самих воркшопах участники часто говорили о том, что они пытались самостоятельно изучить PlantUML, но их пугало то, что нужно писать какой-то код и учить какой-то синтаксис. Документация достаточно обширная, но информации о том, как последовательно строить sequence почти нет.

Поэтому и появилась эта статья.

Почему PlantUML?

+23

The-Founder-1 14 июн в 04:56

Кратко о KAN для самых неподготовленных

Простой

5 мин

4.3K

Машинное обучение*Искусственный интеллект

Обзор

В апреле практиками-исследователями и математики анонсировали новую архитектуру нейросетей. Крупного резонанса открытие не принесло, хотя с нашей точки зрения, KAN может претендовать на интересную технологию Важнее, что это не просто новая вариация трансформера или исправленная рекуррентная нейронная сеть – это новый подход к нейросетям в принципе, новая архитектура вместо MLP.

Мы написали большую статью по KAN со всеми подробностями, здесь мы совсем кратко пробежимся по основным положениям архитектуры и ее проблемах для самых неподготовленных читателей.

Но надеемся, что некоторое понимание базовой линейной алгебры и математического анализа присутствует.

MLP – обычная полносвязная нейросеть, где благодаря послойной активации нейронов мы получаем какой-то конечный результат (данные) на последнем слое. Похоже на имитацию действия мозговых нейронов: благодаря передаче импульса от нейрона к нейрону – мы получаем результат в виде ассоциации, воспоминаний...

Так вот суть KAN сводится к переносу акцента с “активации нейронов” к активации “связей” между ними.

Конечно, сами связи никуда не деваются, но. Теперь вместо обычных весовых отношений между нейронами – мы получаем обучаемые функции активации – связываем нейроны B-spline’ами. Веса – это такие числовые коэффициенты, которые определяют уровень активации нейронов. Больше вес – сильней сигнал.

Нейросети с большим числом слоев превращаются в черный ящик. Мы не можем понять, как конкретно числовые значения отвечают за те или иные признаки — и как именно признаки в них преобразуются. Поэтому внутренняя часть нейросети нам недоступна.

+10

aka352 13 июн в 21:01

Большие языковые модели — гонка в тупик или прорыв в будущее?

Средний

5 мин

5.7K

Искусственный интеллект

Мнение

Возвращаюсь к теме моих любимых больших языковых моделей(LLM, БЯМ). Наблюдения последних месяцев за индустрией, событиями и динамикой явно демонстрируют движение со все возрастающим ускорением прямо в тупик. Финиш может быть фееричным. Откуда такие выводы? Разберем по порядку...

+18

Trozko 13 июн в 18:35

Бот с характером: как образ и персона ботов влияют на клиентов

Простой

5 мин

533

Блог компании Just AIМашинное обучение*Искусственный интеллектГолосовые интерфейсы*

Обзор

Привет, Хабр! Меня зовут Ирина Степанова, я занимаюсь аналитикой разговорных интерфейсов в Just AI. Клиенты часто приходят с запросом на «человекоподобных»‎ ботов, но всем ли они нужны? И как специфика компании влияет на образ голосового помощника или чат-бота? В этой статье расскажу, какие боты пользуются популярностью в финтехе, из чего состоит образ бота и дам несколько рекомендаций по разработке личности виртуального помощника.

aansty4U 13 июн в 18:11

Тиндер в мире ИИ: пять способов, как нейросети могут помочь вам наладить личную жизнь

4 мин

2.3K

Блог компании BotHubИскусственный интеллект

Обзор

Перевод

Искусственный интеллект теперь проникает в самые интимные и, казалось бы, исключительно человеческие аспекты нашей жизни, такие как отношения и знакомства. Эта тенденция особенно заметна в западной культуре, где в целом доминируют нестандартные подходы к привычным для нас с Вами вещам. Поэтому предлагаю Вам познакомиться с новыми трендами в мире свиданий, полностью опирающимися на нейросети. Это отличная возможность перенять опыт или просто хорошо провести время ;)

Приятного прочтения!

+10

randall 13 июн в 17:47

Дата-центры будущего: в поисках мощности и новых источников энергии для LLM

Простой

8 мин

988

Блог компании MWSБлог компании МТСIT-инфраструктура*Энергия и элементы питанияИскусственный интеллект

Обзор

Большие языковые модели (LLM) требуют значительных вычислительных мощностей. И это лишь часть затрат. Бурный рост продуктов генеративного искусственного интеллекта приводит к огромным расходам энергии — энергопотребление ЦОДов постепенно достигает гигантских объемов.

Дата-центры потребуют модернизации — например, сочетания нескольких возобновляемых источников энергии. Другие решения появляются на стыке нескольких технологий: системы ИИ могут управлять переключением между различными источниками энергии в поисках оптимального сценария питания.

По прогнозам Dell'Oro Group, к 2027 году инвестиции в ИТ-инфраструктуру для ИИ приведут к увеличению капитальных затрат на дата-центры до 500 млрд долларов.

Сегодня расскажем про тренды оптимизации, которые не только удовлетворят растущий спрос, но и позволят строить дата-центры в больших количествах и гораздо большем масштабе, чем сейчас.

Читать дальше →

akdengi 13 июн в 12:09

Устанавливаем модель генерации изображений Stable Diffusion 3 на ComfyUI

Простой

2 мин

8.9K

Блог компании HOSTKEYOpen source*Машинное обучение*Искусственный интеллект

Туториал

Модель Stable Diffusion 3 вышла вчера, 12 июня, ее файлы (SD3 Medium) и примеры конфигурации были опубликованы в тот же день на Hugging Face. Попробовать модель (пока) можно только в ComfyUI и мы написали небольшую инструкцию, как это сделать.

vada 13 июн в 10:00

Как я помогал создавать внешний вид ПМЭФ-2024

5 мин

1.4K

ДизайнИскусственный интеллект

Кейс

Дисклеймер: я никоим образом не имею никакого отношения к составу мероприятия, компаниям, представленным там и их стендам, а также к «новинкам и инновациям», выступлениям и достижениям.
Я просто помог выполнить интересную задачу в крайне сжатые сроки.

nikitayusupov 12 июн в 15:38

Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

Простой

19 мин

3.6K

Python*Визуализация данных*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов о компании от пользователей. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

+16

Aliaksei_Rudak 12 июн в 09:19

Большое тестирование видеокарт для машинного обучения

Простой

8 мин

4.2K

Облачные вычисления*Машинное обучение*Компьютерное железоИскусственный интеллектВидеокарты

Аналитика

Всем привет! Меня зовут Алексей Рудак и я основатель компании Lingvanex, которая занимается решениями в области машинного перевода и транскрипции речи. Для нашей работы мы постоянно тренируем языковые модели. Наша команда использует десятки разных видеокарт, выбранных под разные задачи: где-то нужна мощная станция DGX, а где-то достаточно старой игровой карты типа RTX 2080Ti. Выбор оптимальной конфигурации GPU сэкономит вам не только время на тренировку, но и деньги.

Интересно то, что в интернете довольно мало статей с тестами GPU именно для скорости тренировки языковых моделей. В основном встречаются только тесты inference. Когда вышел новый чип H100, в отчете NVidia было указано, что при тренировке он быстрее A100 до девяти раз, но для наших задач новая карта оказалась всего на 90% быстрее старой. Для сравнения: у наших облачных провайдеров разница в цене между этими GPU составляла 2 раза, поэтому переходить на новый H100 для экономии денег смысла не было.

В дополнение к этому мы брали на тест станцию DGX, которая состоит из 8 видеокарт A100 80GB и стоит 10 тысяч долларов в месяц. После теста стало ясно что соотношение цена / производительность этой станции нас полностью не устраивает и за эти деньги мы можем взять 66 x RTX 3090, которые в сумме принесут гораздо больше пользы.

Наши языковые модели для перевода имеют до 500 миллионов параметров (в среднем от 100 млн до 300 млн). Возможно, если значительно увеличить кол-во параметров, то соотношение цена / производительность от DGX станет лучше. На данный момент мы не тренируем большие языковые модели, которые могут переводить сразу между всеми языками во всех вариациях, а применяем отдельные языковые модели под каждую языковую пару, например англо-немецкую. Каждая из таких моделей занимает от 120 до 300 Mb.

SLY_G 11 июн в 15:18

Дайджест научпоп-новостей за неделю, о которых мы ничего не писали

Простой

9 мин

3.5K

РобототехникаНаучно-популярноеИскусственный интеллектЗдоровьеАстрономия

Дайджест

• Новое электронное логическое устройство на основе жидкого металла имитирует механизм захвата добычи венерианской мухоловкой

• Экзотические чёрные дыры могут быть побочным продуктом тёмной материи

• ИИ использовали для создания новых антибиотиков в революционном исследовании

• «Google для ДНК» индексирует 10% известных генетических последовательностей.

• Впервые телескоп был убран из спорного астрономического центра на гавайском вулкане

+28

garrulus 11 июн в 13:31

MCD-rPPG: на одной волне с телемедициной

Средний

13 мин

693

Работа с видео*Big Data*Машинное обучение*Искусственный интеллектТелемедицина

Из песочницы

Современные методы бесконтактной оценки медицинских параметров позволяют по видеопотоку с камеры определять, какой у человека пульс. Для решения таких задач методами машинного обучения нужны данные, и коллеги из СамГМУ подготовили уникальный датасет MCD-rPPG, который содержит видеозаписи людей и их фотоплетизмограммы, а также сопутствующую информацию медицинского характера. Я подробно расскажу про эти данные и покажу первые результаты простых моделей, которые были получены в рамках моей стажировки в центре медицины Sber AI Lab.

Надеюсь, что всем ML-исследователям, и особенно тем, кто увлекается компьютерным зрением, будет интересно поэкспериментировать с этим датасетом и сравнить результаты с нашими бейзлайнами.

2 3 ...

282 283

Искусственный интеллект

Как воссоздают человека при помощи ИИ?

Новости

Если интеллект это психическое расстройство, то что такое тогда искусственный интеллект?

JSON словарь в качестве постоянной памяти для GPT-ботов (версия 3.0)

Запускаем Stable Diffusion на GPU AMD Radeon в Docker

Истории

Метрики оценки качества моделей и анализ ошибок в машинном обучении. Подробное руководство

Опыт создания нейросетевого-комикса

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Как рисовать Sequence без боли и страданий в PlantUML

Кратко о KAN для самых неподготовленных

Большие языковые модели — гонка в тупик или прорыв в будущее?

Бот с характером: как образ и персона ботов влияют на клиентов

Тиндер в мире ИИ: пять способов, как нейросети могут помочь вам наладить личную жизнь

Ближайшие события

Дата-центры будущего: в поисках мощности и новых источников энергии для LLM

Устанавливаем модель генерации изображений Stable Diffusion 3 на ComfyUI

Как я помогал создавать внешний вид ПМЭФ-2024

Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

Большое тестирование видеокарт для машинного обучения

Дайджест научпоп-новостей за неделю, о которых мы ничего не писали

MCD-rPPG: на одной волне с телемедициной

Вклад авторов