Как стать автором
Обновить
438.17

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Как воссоздают человека при помощи ИИ?

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.1K

Помимо нейросетей и моделей машинного обучения, основанных на перцептронах, существуют и так называемые когнитивные архитектуры – они нацелены на имитацию человеческого интеллекта, как его себе представляют когнитивные науки через призмы разнородных теорий познания и гипотез. 

Для психологии именно здесь скрывается человечность и тот сильный искусственный интеллект, AGI, симулирующий все способности человека. Но как работают когнитивные архитектуры наподобие ACT-R или SOAR, и подойдут ли они для продвижения общего интеллекта? – в нашей статье. 

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии7

Новости

Если интеллект это психическое расстройство, то что такое тогда искусственный интеллект?

Время на прочтение5 мин
Количество просмотров1.7K

Не так давно меня очень впечатлила статья Man, death & ethics и мне очень хотелось увидеть продолжение этой темы.

Но мне кажется, что прежде, чем разбираться с "концепциями определения человека, морали и этики" применительно к Искусственному интеллекту, не плохо было бы разобраться для начала с пониманием самого искусственного интеллекта и просто интеллекта. Давайте попробуем порассуждать на эту тему. Для начала попробую подвести к вопросу из заголовка.

Далее следуют некоторые рассуждения про интеллект в подавляющем большинстве своем, тем кому интересно про расстройства это точно не сюда.

Читать далее
Всего голосов 11: ↑4 и ↓7-1
Комментарии12

JSON словарь в качестве постоянной памяти для GPT-ботов (версия 3.0)

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.8K

Как заставить любого GPT-бота на базе любой LLM (например на ChatGPT) незаметно для пользователя запоминать в его постоянную память нужные нам сведения из диалога?

Пробуем применить подход к постоянной памяти используя JSON структуру.

Читать далее
Всего голосов 7: ↑3 и ↓4-1
Комментарии5

Запускаем Stable Diffusion на GPU AMD Radeon в Docker

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров4.5K

Для запуска нам понадобится Ubuntu с установленными: git, make, docker и ROCm.

Инструкция по запуску короткая и простая, поэтому дополнительно разберём пример генерации изображения для этой статьи и продеманстрируем работу Stable Diffusion на AMD Radeon. Всё нижеизложенное протестировано на AMD Radeon RX 7900 XTX.

Читать далее
Всего голосов 8: ↑8 и ↓0+11
Комментарии7

Истории

Метрики оценки качества моделей и анализ ошибок в машинном обучении. Подробное руководство

Уровень сложностиСредний
Время на прочтение32 мин
Количество просмотров3K

Одним из критически важных шагов при создании хорошей модели является правильный выбор метрики для оценки её качества, поскольку неправильный выбор может привести к неверным выводам и, как следствие, к принятию не самых оптимальных решений. Поэтому на сегодняшний день существует большое количество метрик, подходящих для самых разных задач и ситуаций.

В данном туториале будут рассмотрены популярные метрики для задач классификации, регрессии и кластеризации, а также инструмент для анализа ошибки модели, известный как bias-variance decomposition. Помимо этого, для большей части метрик будут представлены ручные расчёты и реализация с нуля на Python, а в конце вы сможете найти дополнительные источники для более глубокого ознакомления.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии5

Опыт создания нейросетевого-комикса

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.2K

Опыт создания нейросетевого-комикса

Привет! Почти каждый имел опыт создания изображений при помощи нейросетей или хотя бы видел сгенерированные ими картинки с лишними пальцами. Мне бы хотелось рассказать о том, как я создавал комикс на основе таких картинок, с какими сложностями столкнулся и какие хитрости использовал в работе. Сейчас создано 340 страниц, а основной сюжет комикса близится к завершению.

Примечание:
Пост рассказывает о личном опыте, не рассматривает архитектуру нейронных сетей и не претендует на охват всех возможных решений. Работу над комиксом я начал весной 2023 года, и с тех пор ситуация с нейронными сетями для создания изображений немного изменилась. Сюжет комикса и диалоги полностью написаны мной (ради интереса я попробовал использовать ChatGPT 3.5 для написания диалогов, но был разочарован).

Читать далее
Всего голосов 8: ↑7 и ↓1+7
Комментарии9

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.9K

Всем привет! 

Omost, разработанный lllyasviel — это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе

Название Omost (произношение: "almost") символизирует:

Каждый раз, когда вы используете Omost, ваше изображение почти готово

"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения

Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией

Читать далее
Всего голосов 8: ↑7 и ↓1+7
Комментарии7

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров554

Через неделю вузы начнут принимать документы абитуриентов на все формы обучения. Собрать и направить все необходимые бумаги в институты для будущих студентов – тот еще челлендж. Таким же малоприятным является процесс обработки этих документов и для сотрудников приемных комиссий, которым – когда абитуриенты выстроятся в очереди с оригиналами документов – придется перелопатить кипы бумаг.

Мы в Smart Engines нашли способ, как ускорить и упростить этот процесс для всех его участников. 

Читать далее
Всего голосов 4: ↑3 и ↓1+3
Комментарии1

Как рисовать Sequence без боли и страданий в PlantUML

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров4K

Привет! Меня зовут Настя, я старший системный аналитик в X5 Tech. Я рисую sequence-диаграммы каждый день на протяжении четырёх лет. За это время я прошла все круги ада по Данте, то есть попробовала разные инструменты для рисования этих самых диаграмм. Пока не встретила его – PlantUML. 

Что удивительно, инструмент довольно не новый, но тем не менее лучше него я пока не встречала. А ещё удивительно, что он не особо популярный. Когда мы запустили в управлении системного анализа первый воркшоп по PlantUML, за 3 минуты после анонса пришли 12 заявок от аналитиков разных грейдов – от Junior до Lead. 

В процессе подготовки материалов к воркшопу мы искали статьи и литературу, которые помогли бы дополнительно изучить sequence-диаграммы в PlantUML. Ничего интересного мы не нашли. 

На самих воркшопах участники часто говорили о том, что они пытались самостоятельно изучить PlantUML, но их пугало то, что нужно писать какой-то код и учить какой-то синтаксис. Документация достаточно обширная, но информации о том, как последовательно строить sequence почти нет. 

Поэтому и появилась эта статья. 

Почему PlantUML?
Всего голосов 20: ↑20 и ↓0+23
Комментарии28

Кратко о KAN для самых неподготовленных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.3K

В апреле практиками-исследователями и математики анонсировали новую архитектуру нейросетей. Крупного резонанса открытие не принесло, хотя с нашей точки зрения, KAN может претендовать на интересную технологию Важнее, что это не просто новая вариация трансформера или исправленная рекуррентная нейронная сеть – это новый подход к нейросетям в принципе, новая архитектура вместо MLP.

Мы написали большую статью по KAN со всеми подробностями, здесь мы совсем кратко пробежимся по основным положениям архитектуры и ее проблемах для самых неподготовленных читателей. 

Но надеемся, что некоторое понимание базовой линейной алгебры и математического анализа присутствует. 

MLP – обычная полносвязная нейросеть, где благодаря послойной активации нейронов мы получаем какой-то конечный результат (данные) на последнем слое. Похоже на имитацию действия мозговых нейронов: благодаря передаче импульса от нейрона к нейрону – мы получаем результат в виде ассоциации, воспоминаний...

Так вот суть KAN сводится к переносу акцента с “активации нейронов” к активации “связей” между ними. 

Конечно, сами связи никуда не деваются, но. Теперь вместо обычных весовых отношений между нейронами – мы получаем обучаемые функции активации – связываем нейроны B-spline’ами. Веса – это такие числовые коэффициенты, которые определяют уровень активации нейронов. Больше вес – сильней сигнал.

Нейросети с большим числом слоев превращаются в черный ящик. Мы не можем понять, как конкретно числовые значения отвечают за те или иные признаки — и как именно признаки в них преобразуются. Поэтому внутренняя часть нейросети нам недоступна.

Читать далее
Всего голосов 8: ↑8 и ↓0+10
Комментарии0

Большие языковые модели — гонка в тупик или прорыв в будущее?

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров5.7K

Возвращаюсь к теме моих любимых больших языковых моделей(LLM, БЯМ). Наблюдения последних месяцев за индустрией, событиями и динамикой явно демонстрируют движение со все возрастающим ускорением прямо в тупик. Финиш может быть фееричным. Откуда такие выводы? Разберем по порядку...

Читать далее
Всего голосов 23: ↑19 и ↓4+18
Комментарии26

Бот с характером: как образ и персона ботов влияют на клиентов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров533

Привет, Хабр! Меня зовут Ирина Степанова, я занимаюсь аналитикой разговорных интерфейсов в Just AI. Клиенты часто приходят с запросом на «человекоподобных»‎ ботов, но всем ли они нужны? И как специфика компании влияет на образ голосового помощника или чат-бота? В этой статье расскажу, какие боты пользуются популярностью в финтехе, из чего состоит образ бота и дам несколько рекомендаций по разработке личности виртуального помощника.

Читать далее
Всего голосов 5: ↑2 и ↓3+1
Комментарии5

Тиндер в мире ИИ: пять способов, как нейросети могут помочь вам наладить личную жизнь

Время на прочтение4 мин
Количество просмотров2.3K

Искусственный интеллект теперь проникает в самые интимные и, казалось бы, исключительно человеческие аспекты нашей жизни, такие как отношения и знакомства. Эта тенденция особенно заметна в западной культуре, где в целом доминируют нестандартные подходы к привычным для нас с Вами вещам. Поэтому предлагаю Вам познакомиться с новыми трендами в мире свиданий, полностью опирающимися на нейросети. Это отличная возможность перенять опыт или просто хорошо провести время ;)

Приятного прочтения!

Читать далее
Всего голосов 14: ↑12 и ↓2+10
Комментарии8

Ближайшие события

Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Дата-центры будущего: в поисках мощности и новых источников энергии для LLM

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров988
image

Большие языковые модели (LLM) требуют значительных вычислительных мощностей. И это лишь часть затрат. Бурный рост продуктов генеративного искусственного интеллекта приводит к огромным расходам энергии — энергопотребление ЦОДов постепенно достигает гигантских объемов.

Дата-центры потребуют модернизации — например, сочетания нескольких возобновляемых источников энергии. Другие решения появляются на стыке нескольких технологий: системы ИИ могут управлять переключением между различными источниками энергии в поисках оптимального сценария питания.

По прогнозам Dell'Oro Group, к 2027 году инвестиции в ИТ-инфраструктуру для ИИ приведут к увеличению капитальных затрат на дата-центры до 500 млрд долларов.

Сегодня расскажем про тренды оптимизации, которые не только удовлетворят растущий спрос, но и позволят строить дата-центры в больших количествах и гораздо большем масштабе, чем сейчас.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии1

Устанавливаем модель генерации изображений Stable Diffusion 3 на ComfyUI

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров8.9K

Модель Stable Diffusion 3 вышла вчера, 12 июня, ее файлы (SD3 Medium) и примеры конфигурации были опубликованы в тот же день на Hugging Face. Попробовать модель (пока) можно только в ComfyUI и мы написали небольшую инструкцию, как это сделать.

Читать далее
Всего голосов 6: ↑5 и ↓1+5
Комментарии8

Как я помогал создавать внешний вид ПМЭФ-2024

Время на прочтение5 мин
Количество просмотров1.4K

Дисклеймер: я никоим образом не имею никакого отношения к составу мероприятия, компаниям, представленным там и их стендам, а также к «новинкам и инновациям», выступлениям и достижениям.
Я просто помог выполнить интересную задачу в крайне сжатые сроки.

Читать далее
Всего голосов 20: ↑10 и ↓10+3
Комментарии18

Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров3.6K

В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов о компании от пользователей. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

Читать далее
Всего голосов 17: ↑16 и ↓1+16
Комментарии8

Большое тестирование видеокарт для машинного обучения

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров4.2K

Всем привет! Меня зовут Алексей Рудак и я основатель компании Lingvanex, которая занимается решениями в области машинного перевода и транскрипции речи. Для нашей работы мы постоянно тренируем языковые модели. Наша команда использует десятки разных видеокарт, выбранных под разные задачи: где-то нужна мощная станция DGX, а где-то достаточно старой игровой карты типа RTX 2080Ti.  Выбор оптимальной конфигурации GPU сэкономит вам не только время на тренировку, но и деньги.

Интересно то, что в интернете довольно мало статей с тестами GPU именно для скорости тренировки языковых моделей. В основном встречаются только тесты inference. Когда вышел новый чип H100, в отчете NVidia было указано, что при тренировке он быстрее A100 до девяти раз, но для наших задач новая карта оказалась всего на 90% быстрее старой. Для сравнения: у наших облачных провайдеров разница в цене между этими GPU составляла 2 раза, поэтому переходить на новый H100 для экономии денег смысла не было.

В дополнение к этому мы брали на тест станцию DGX, которая состоит из 8 видеокарт A100 80GB и стоит 10 тысяч долларов в месяц. После теста стало ясно что соотношение цена / производительность этой станции нас полностью не устраивает и за эти деньги мы можем взять 66 x RTX 3090, которые в сумме принесут гораздо больше пользы.

Наши языковые модели для перевода имеют до 500 миллионов параметров (в среднем от 100 млн до 300 млн). Возможно, если значительно увеличить кол-во параметров, то соотношение цена / производительность от DGX станет лучше. На данный момент мы не тренируем большие языковые модели, которые могут переводить сразу между всеми языками во всех вариациях, а применяем отдельные языковые модели под каждую языковую пару, например англо-немецкую. Каждая из таких моделей занимает от 120 до 300 Mb.

Читать далее
Всего голосов 9: ↑7 и ↓2+6
Комментарии12

Дайджест научпоп-новостей за неделю, о которых мы ничего не писали

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.5K

• Новое электронное логическое устройство на основе жидкого металла имитирует механизм захвата добычи венерианской мухоловкой

• Экзотические чёрные дыры могут быть побочным продуктом тёмной материи

• ИИ использовали для создания новых антибиотиков в революционном исследовании

• «Google для ДНК» индексирует 10% известных генетических последовательностей.

• Впервые телескоп был убран из спорного астрономического центра на гавайском вулкане

Читать далее
Всего голосов 16: ↑16 и ↓0+28
Комментарии4

MCD-rPPG: на одной волне с телемедициной

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров693

Современные методы бесконтактной оценки медицинских параметров позволяют по видеопотоку с камеры определять, какой у человека пульс. Для решения таких задач методами машинного обучения нужны данные, и коллеги из СамГМУ подготовили уникальный датасет MCD-rPPG, который содержит видеозаписи людей и их фотоплетизмограммы, а также сопутствующую информацию медицинского характера. Я подробно расскажу про эти данные и покажу первые результаты простых моделей, которые были получены в рамках моей стажировки в центре медицины Sber AI Lab.

Надеюсь, что всем ML-исследователям, и особенно тем, кто увлекается компьютерным зрением, будет интересно поэкспериментировать с этим датасетом и сравнить результаты с нашими бейзлайнами.

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии2
1
23 ...