Как стать автором
Обновить
455.18

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Создание голосового ассистента на Python с классификацией пользователей на основе нейронных сетей (аналог FaceID)

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров671

Всем привет!

Возвращаюсь к теме применения нейронных сетей в личных целях. На этот раз будем запускать долгий проект, по созданию голосового ассистента (ГА). Создать свою Алису или Siri довольно просто, есть уже много статей на Хабр (и не только), которые подробно описывают основные принципы, но чтобы было действительно профессионально и интересно мы углубимся в эту тему и «прикрутим» нейронные сети к нашему ГА. И в первой части начнем с того, что научим нашего голосового ассистента распознавать человека, который в данный момент пользуется компьютером.

Такой проект отлично будет смотреть в любом портфолио, тут будет присутствовать, как и общее программирование на Python, так и взаимодействие с нейронными сетями. Я считаю, что любой начинающий или практикующий питонист (аналитик, специалист по машинному обучению) разобрав, поняв, доработав (нужное подчеркнуть) данный проект, отлично прокачает свои навыки.

Первую часть нашего большого проекта поделим на несколько этапов:

Читать далее
Рейтинг0
Комментарии1

Новости

Забытые системы ИИ — как «Сайк» здравому смыслу учили

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.2K

Разговорами о работе с ИИ уже никого не удивить. Нейросетями не пользуется только ленивый, а бизнес всё чаще запускает свои языковые модели. Но мало кто помнит, что еще в 80-х один амбициозный исследователь взялся разработать свою интеллектуальную систему с чувством «здравого смысла». Проект назвали «Сайк», и он до сих пор существует — даже имеет ряд кейсов коммерческого применения. Мы в beeline cloud решили обсудить, как он устроен, и что лежит в основе решения.

Читать далее
Всего голосов 11: ↑10 и ↓1+15
Комментарии2

Google AI Studioзно умеет обманывать

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3K

Это моя первая статья на Хабре. Ну как принято, я сразу сделаю оговорки (тот самый дисклеймер) о том, что все, что я тут пишу — это мой личный опыт, мое личное мнение, я не стремлюсь как‑то где‑то и чем‑то кого‑то (тем более корпорацию Гугл, чьими продуктами я очень в принципе доволен и рад пользоваться) задеть, ущемить интересы, создать антирекламу, кого‑то опозорить (бла, бла..) и т. д. и т. п. Если кто‑то что‑то увидит негативное в свой адрес — это я не со зла и не специально (заранее извиняюсь), просто проводя аналитические оценки я пришел к таким выводам.

Решил поделится некими размышлениями о том, как ИИ от Гугла иногда преднамеренно (в смысле возможно ему специально включили «это» в алгоритм) или в процессе общения, сам того не ведая, научился «врать» (простите модераторы, не нужно сильно модерировать, это я просто запарился с этим ИИ, потому как немного пострадал).

В общем, история простоя и короткая. Я, как, наверное, и все любители (и не только) частенько отдаю на «аутсорс» (или точнее вскармливаю) определенные задачи ИИ‑шкам. Последнее время нравился Google AI. Ну а что? Многие со мной согласятся, что по сравнению с ChatGPT, работает Google AI более релевантно. Не слишком фамильярничает, не перегружает «водой» (если контекст этого не требует), отвечает быстрее, ну и 2 млн. токенов дает «на халяву» загрузить и анализировать. Для аналитика прям «ляпота и не только».

Короче, решали мы с Google AI (далее чтобы не копи/пастить давайте по тексту я назову его ГАИ) задачу. Ничего особенного, ГАИ мне давал, вроде, как обычно все результаты, и вроде так, как я от него добивался (в прямом смысле слова). Здесь я немного отступлю, просто экспромт возник — не перелистываем абзац, пожалуйста, просто есть один нюанс, о котором я пользуясь моментом тоже хочу узнать, может кто скажет дельное. Когда пишешь задачу особенно по матстатистике или эконометрике, и загружаешь в ГАИ, то надо в обяз прописывать условия типа «распиши решение с детальным описанием алгоритма» или «представь ответ с описанием формулы или расчета» и т. д. Я конечно понимаю, что имею дело с ИИ, но почему с тем же ЧатомГПТ или Клодом так детально писать не нужно? Они сами все предельно коротко, но емко напишут, а вот ГАИ — нееет, обязательно где‑то сократит и именно так, что потом «черт не разберет». Короче как я не пытался его настроить, без вышеназванных фраз, а-ля «дай ответ с подробным описанием...» ничего не получается. Конец отступлению.

Читать далее
Всего голосов 14: ↑3 и ↓11-7
Комментарии22

Создание 3D модели местности по видео с дрона

Время на прочтение3 мин
Количество просмотров6.1K

В данной статье речь пойдет про видеограмметрию-создание 3d моделей объектов на основе видео. Видеограмметрия появилась давно, но до сих пор используется редко из-за необходимости в более мощном "железе", чем при построении 3d моделей местности/объектов с помощью лидаров. В 2024 году производительность ПК настолько выросла, что теперь можно в течении разумного времени строить модели на домашних компьютерах и даже ноутбуках. Сначала покажу, какие модели получились у меня, затем поделюсь лайфхаками, которые помогут сразу строить модели обходя технические сложности, а в конце расскажу чем видеограмметрия может быть полезна.

Читать далее
Всего голосов 11: ↑10 и ↓1+12
Комментарии15

Истории

Уже пора программировать с помощью LLM или пока рановато?

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров5.3K

В предыдущей моей статье среди уважаемых читателей разгорелась большая дискуссия о том, способна ли модель адекватно программировать и освободить программиста от значительных трудозатрат по кодингу.

Ее заголовок, который написан с долей юмора и самоиронии некоторые восприняли очень прямолинейно. И тем не менее, вопрос по прежнему актуален. В этой статье я буду делать с помощью LLM рефакторинг двух образцов грязного кода и анализ результатов.

Давайте разберемся
Всего голосов 16: ↑4 и ↓12-8
Комментарии26

Как новая нейросеть G-Assist от Nvidia помогает проходить игры, настраивает графику и разгоняет ПК

Время на прочтение3 мин
Количество просмотров5.4K

Вряд ли кто-то поспорит, что потенциал нейросетей обширен — мы как раз говорили об этом в нашей предыдущей статье и в комментариях к ней. Но, если честно, настолько же ограничено их применение в быту. Нарисовать картинку, составить меню, перевести текст с иностранного языка на родной – придумать что-то сверх этого не так-то просто. Но Nvidia, которая недавно уже запустила нейросеть Chat with RTX для работы на локальном ПК, теперь представила свою новую разработку под названием G-Assist. Посмотрим, на что она способна.

Читать далее
Всего голосов 3: ↑3 и ↓0+4
Комментарии6

NER для начинающих: Простое объяснение с примерами на SpaCy

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.6K

В этой статье мы подробно рассмотрим распознавание именованных сущностей (Named Entity Recognition, NER) и его применение на практике. Простым и доступным языком объясним, как работает NER, приведем примеры кода с использованием библиотеки SpaCy и покажем, как обучать модели для распознавания именованных сущностей. Эта статья поможет вам быстро освоить основы и начать применять NER в своих проектах!

Читать далее
Всего голосов 3: ↑3 и ↓0+5
Комментарии3

Повышаем надёжность промышленного оборудования с помощью компьютерного зрения

Время на прочтение11 мин
Количество просмотров2K

Привет, Хабр! Меня зовут Павел Криницин. Я работаю на крупном металлургическом предприятии по производству и переработке алюминиевой продукции, где слежу за работой оборудования. В этой статье я расскажу, как мы исследовали способы раннего диагностирования повреждений конвейерных лент с применением компьютерного зрения. Эта статья будет полезна широкому кругу специалистов, занятых в различных областях промышленности, где применяют конвейерные транспортные системы. Описанные в статье подходы делают диагностику оборудования и поиск дефектов более точными, а планирование ремонтных работ — более эффективным.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии6

Что могут векторные СУБД — open source инструменты & облако

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров4.4K

Разработка систем искусственного интеллекта и обучение моделей подразумевает взаимодействие с огромными сводами неструктурированных данных — например, текстом и изображениями. Решать эту задачу помогают векторные БД. Они работают с так называемыми векторными представлениями (эмбеддингами), имеют продвинутые алгоритмы индексирования и особенно эффективны для реализации поиска по сходству. 

Учитывая популярность темы машинного обучения, новые векторные СУБД появляются чуть ли не каждый день. Мы сделали подборку open source решений, о которых мало рассказывали на Хабре: от крупных проектов вроде Qdrant до малоизвестных продуктов.

Векторные базы данных можно развернуть в облаке, обеспечивая мощную инфраструктуру, которая значительно улучшает управление крупномасштабными и сложными данными. На виртуальную инфраструктуру MWS сейчас действует скидка 50%.

Читать далее
Всего голосов 13: ↑12 и ↓1+18
Комментарии5

Гайд новичка: используем нейросеть ChatGPT в обычной жизни

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров26K

Нейросети, которые вроде как должны были отобрать у всех нас работу, на поверку оказались не совсем такими, как мы себе представляли. Даже эталонный ChatGPT-4o запинается, неверно понимает задачи и допускает ошибки, какие не допустил бы даже ребенок. Тем не менее, даже его можно приспособить под выполнение некоторых бытовых задач, облегчив тем самым свои рутинные задачи. Например, у меня нейросеть проверяет за ребенком домашнее задание, считает расходы, проводит факт-чекинг моих собственных текстов и делает много чего еще. Но, конечно, для того чтобы ИИ был "в адеквате" и не косячил, нужно учесть несколько важных нюансов. Именно об этом и поговорим сегодня, причем в режиме "для новичков".

Читать далее
Всего голосов 21: ↑15 и ↓6+11
Комментарии43

Уродливые дети ИИ-революции

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров9.2K

Революция ИИ случилась очень внезапно даже по меркам стремительно развивающихся технологий последних десятилетий. Как говорил фантаст и идеолог киберпанка Уильям Гибсон, будущее уже наступило — оно просто неравномерно распределено. И в одном из направлений — имитации внешности и голосов людей — будущее как будто шагнуло вперед сразу на столетие. Что происходит с индустрией сейчас, что ее ждет и как с эпидемией дипфейков планируют бороться в будущем? 

О том, что тема дипфейков — на гребне волны общественного интереса, говорит хотя бы то, что этот текст пришлось переписывать и дополнять несколько раз: когда он уже был готов к публикации, появлялась новая информация либо из мира дипфейков, либо из мира борьбы с ними. Но сопротивление кажется обреченным на провал: фейки уже как цунами — закрывают горизонт и того и гляди обрушатся на наши головы. 

Компании вроде OpenAI и Microsoft на словах признают опасности, которые приносят технологии, но продолжают создавать все более и более совершенные продукты. Как будто недостаточно того, что у OpenAI есть Sora, которая создает настолько реалистичные ролики, что создатели боятся пускать к ней пользователей. 

Microsoft же в конце апреля представила модель VASA-1, которую в обзорах называют «ночным кошмаром создания дипфейков» — убедительная анимация создается на основе всего одной фотографии. Или даже картины. Если Мону Лизу можно заставить читать рэп, что уж говорить об обычных людях… А цифра «1» в названии ясно даёт понять, что останавливаться компания на этом не планирует.

Читать далее
Всего голосов 10: ↑8 и ↓2+8
Комментарии10

ИИ в гейминге

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.4K

Компьютерные игры давно превратились из несерьёзного развлечения в процветающую индустрию, приносящую миллионные доходы. Этот сектор также способствует развитию технологий искусственного интеллекта и виртуальной реальности. Разработка компьютерных игр объединяет художественные и научные элементы с такими дисциплинами, как психология, антропология, культурология и социология. В результате геймеры с невероятной скоростью оттачивают как социальные, так и технические навыки.

Читать далее
Всего голосов 9: ↑7 и ↓2+6
Комментарии2

Гайд, как выбрать платформу RPA и не сойти с ума

Время на прочтение8 мин
Количество просмотров1.3K

Всем привет! С вами команда МТС Digital: Иван Жоров и Вячеслав Саушкин — разработчики RPA, Вячеслав Диасамидзе — руководитель центра «Роботизация», Владимир Абрамов — тим-лидер.

Сегодня обсудим импортозамещение в области софта на примере технологии RPA (Robotic Process Automation). Этот инструмент позволяет создавать ботов, которые будут выполнять за сотрудника рутинные задачи. Как это выглядит на практике и какие сейчас есть платформы, обсудим в статье. А еще поделимся, какую платформу и почему в свое время выбрали в МТС. Кейс тоже будет!

Читать далее
Всего голосов 5: ↑5 и ↓0+8
Комментарии8

Ближайшие события

12 – 13 июля
Геймтон DatsDefense
Онлайн
19 сентября
CDI Conf 2024
Москва

Аутсорсинг программирования в страну под названием ИИ

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров4.6K

В этой заметке я хочу поделиться собственным опытом использования ИИ-инструментов в моих программных проектах, а также своими соображениями о реальности полной передачи программирования в руки ИИ и тем самым - исчезновения профессии программиста. 

На первый взгляд - такие ожидания не беспочвенны. В самом деле: ведь качество ответов на запросы общего характера между ChatGPT 2 и ChatGPT 3.5 выросло с примерно 20% до примерно 80% только за счёт увеличения объёма обучающих данных и наращивания мощности используемых серверов. Может, скормить системе все программные проекты с открытым кодом, прикупить графических карт и можно будет всех или большинство программистов заменить на ИИ? Другими словами, программировать в аутсорсинге в стране под названием ИИ?

Читать далее
Всего голосов 26: ↑22 и ↓4+22
Комментарии26

Руководство для начинающих по галлюцинациям в больших языковых моделях

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров2.3K

По мере того как большие языковые модели (LLM) набирают популярность в различных областях, галлюцинации - искажения в результатах LLM - создают риск дезинформации и раскрытия конфиденциальных данных. В статье рассказывается о причинах возникновения галлюцинаций и изучаются методы их устранения.

Читать далее
Всего голосов 7: ↑4 и ↓3+4
Комментарии16

У вас новый ремонт? Лучше! Рисунок нового ремонта. Как мы из Stable Diffusion сделали дизайнера интерьеров

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров8.2K

Сейчас технологии машинного обучения и нейронных сетей находят широкое применение в различных сферах, не исключая дизайн и ремонт помещений. Одной из таких технологий является методы генеративных нейросетей, которые позволяют преобразовывать изображения, сохраняя основные элементы оригинала, но добавляя новые детали и стилистические изменения. Меня зовут Алексей Луговой, я работаю с Computer Vision в Самолете и уже обзорно рассказывал на Хабре, как мы применяем искусственный интеллект в строительстве. Сегодня же углубимся в задачу по созданию генеративной сети для создания проекта ремонта. Рассмотрю процесс использования диффузионных моделей с различными дополнениями на примере не самой обычной задачи — преобразования интерьера комнаты, начав с оригинального изображения голых стен и завершая итоговой генерацией в фирменном дизайнерском стиле.

Читать далее
Всего голосов 27: ↑24 и ↓3+28
Комментарии28

17 продвинутых RAG-техник: как превратить прототип LLM-приложения в готовое решение

Время на прочтение18 мин
Количество просмотров4K

GenAI стремительно ворвался в нашу жизнь. Ещё вчера мы с опаской смотрели на него, а сегодня уже вовсю используем в работе. Многие эксперты пророчат GenAI большое будущее, считая его предвестником новой промышленной революции.

И ведь действительно, LLM и мультимодальные модели уже сейчас демонстрируют впечатляющие возможности и при этом относительно просты во внедрении. Создать простое приложение на их основе - дело нескольких строк кода. Однако переход от эксперимента к стабильному и надежному решению — задача посложнее.

Как метко подметил Мэтт Тёрк: если в 2023 году мы боялись, что GenAI нас погубит, то в 2024-м мечтаем хоть как-то приручить его и запустить в "мелкосерийное производство".

Если вы уже успели создать свои первые LLM-приложения и готовы вывести их на новый уровень, эта статья для вас. Мы рассмотрим 17 продвинутых RAG-техник, которые помогут избежать типичных ошибок и превратить ваш прототип в мощное и стабильное решение.

Пристегните ремни, мы отправляемся в увлекательное путешествие по миру AGI! Вместе мы:

Поймем, как система отличает ценную информацию от информационного шума;

Разберемся, как правильно подготовить данные для LLM;

Выясним, можно ли строить цепочки из нескольких LLM;

Поймем, как направлять запросы через разные компоненты системы.

Приятного прочтения(:

Читать далее
Всего голосов 14: ↑14 и ↓0+15
Комментарии3

LLMops: что есть, кроме ChatGPT и как это развернуть

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров5.4K

Привет, Хабр! Меня зовут Ирина Николаева и я — руководитель R’n’D отдела машинного обучения в компании Raft Digital Solution. Я внедряла различные ML-модели: от анализа временных рядов и Computer Vision до высоконагруженных дата-инженерных сервисов. Эта статья написана по мотивам моего доклада на Highload ++ 2023.
В статье вас ждёт: обзор LLM-моделей, техники работы с ними через призму MLOps, разбор лицензий и требований к железу. А так же трюки с квантизацией и файн-тюнингом «на сладкое». Главный дисклеймер статьи в том, что данные лидербордов и технических требований актуальны на момент выступления на Highload, то есть ноябрь 2023, но не всё из них актуально до сих пор. Но если бы я обновила всю статью, была ли бы это та же самая статья — вопрос риторический, поэтому было принято решение оставить всё как есть.

Читать далее
Всего голосов 13: ↑12 и ↓1+12
Комментарии5

Live SymFormer Show. Музыкальное шоу с использованием AI-технологий

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров344

Салют, Хабр! На связи Алексей Минин. В SberDevices наша команда занимается созданием и развитием решений в области генеративной музыки. В этой статье хочу рассказать о том, как мы реализовали музыкальное шоу с применением технологий AI на прошедшей в апреле конференции GIGA RnD Day. В тот день на сцене вживую импровизировали музыканты и вместе с ними наша нейросетевая модель для генерации музыкальных произведений — SymFormer. В результате симбиоза живого исполнения и технологий на сцене создавалась уникальная музыкальная композиция в режиме реального времени.

Читать далее
Всего голосов 14: ↑14 и ↓0+17
Комментарии0

GigaConf: всё про искусственный интеллект

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.6K

На днях прошла наша конференция GigaConf, посвящённая ИИ в бизнесе. Мы подготовили сборник ознакомительных выступлений с трека открытия.

Читать далее
Всего голосов 13: ↑13 и ↓0+16
Комментарии0
1
23 ...