Как стать автором
Обновить
175.68

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Топ 10 deepnude нейросетей 2023 года

Время на прочтение 5 мин
Количество просмотров 42K
Обзор

DeepNude — это технология, использующая нейросети для создания изображений обнаженных тел на основе одетых фотографий или видео. Суть этой технологии заключается в том, чтобы "снять" одежду с изображения человека с помощью искусственного интеллекта и показать, как, предположительно, выглядит тело человека под одеждой.

Итак, в данной статье поговорим о пикантных и для некоторых людей непристойных темах, которые больше всего интересуют наше общество - обнаженное тело. Сделаем обзор таких сервисов как: Deepnude.ai, Deepfake.com, DeepSwap.ai, SoulGen и прочих.

Читать далее
Всего голосов 103: ↑89 и ↓14 +75
Комментарии 64

Новости

Странные позы, лишние пальцы и много котиков: самые интересные баги Midjourney

Время на прочтение 5 мин
Количество просмотров 4.9K
Обзор

За время существования Midjourney пользователи сгенерировали петабайты изображений. Сколько из них действительно качественные — открытый вопрос. Машинное обучение интересно свей непредсказуемостью: часто генеративные нейросети коверкают иллюстрации, придумывают новые объекты, рисуют франкенштейнов — в общем, странно самовыражаются.

Часть багов разработчики Midjourney пофиксили, но некоторые существуют и сейчас. Мы потратили целый день, чтобы уговорить нейросеть заменить человека на картинке, но ничего не вышло. Смотрите, что создает Midjourney, когда ошибается, и угадывайте, какие баги мы зашифровали в обложке.
Читать дальше →
Всего голосов 39: ↑33 и ↓6 +27
Комментарии 8

Django, ImageField и .webp. Ещё немного про ускорение web приложения и экономию дискового пространства

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 1.4K
Туториал

Доброго времени суток уважаемый читатель. Хотелось бы немного поговорить об оптимизации наших с вам любимых WEB приложений, написанных на нашем горячо любимом и всеми уважаемом фреймворке Django. В частности речь в этой статье пойдёт об оптимизации изображений. А теперь по порядку.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 28

Вышел Savant 0.2.5: фреймворк компьютерного зрения на базе Nvidia DeepStream SDK

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 967
Обзор
Перевод

Savant - это высокоуровневый фреймворк с открытым исходным кодом для создания высокоэффективных приложений компьютерного зрения, работающих в реальном времени на стеке Nvidia. Он позволяет разрабатывать динамические, отказоустойчивые конвейеры, используя лучшие подходы Nvidia для ускорителей в центрах обработки данных и на границе.

Мы рады представить вам новую версию Savant - 0.2.5. Мы работали над этим релизом более 2,5 месяцев. Он содержит значительные изменения, новые возможности и исправления ошибок в нескольких областях, но в первую очередь мы улучшили возможности для разработчиков и варианты развертывания.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Истории

Банк в кармане: как МКБ применяет решения для распознавания Smart Engines

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 580
Кейс

Московский кредитный банк (МКБ) уже три года применяет систему распознавания QR-кодов Smart Engines на смартфоне. Внедрение было визионерским: банк предвосхитил тренд на этот способ оплаты товаров и услуг.

Сегодня мы расскажем, как МКБ выбирал партнера по технологии распознавания, а также о том, каким образом банку удалось одним из первых в стране внедрить в мобильное приложение сканер номера телефона и как сейчас ИИ применяется в обслуживании клиентов вне офиса.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0

Как мы распознавали цвета медицинских тест-полосок с помощью ИИ для healthcare стартапа

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 963
Кейс

Рассказываем, как Технологика и стартап цифровой медицины запустили мобильное приложение, которое при помощи ИИ анализирует цвета медицинских тест-полосок и трактует результаты показателей мочи.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 4

Эволюция CAPTCHA: доказательство PoW, продвинутые боты

Время на прочтение 3 мин
Количество просмотров 3.1K


Поскольку во всех типах капчи системы ИИ показывают результат лучше человека, исследователи задались задачей придумать более эффективные методы защиты от ботов.

Например, mCaptcha — опенсорсная CAPTCHA, работающая по принципу proof-of-work. Её уже можно встретить на некоторых сайтах.
Читать дальше →
Всего голосов 15: ↑13 и ↓2 +11
Комментарии 22

Почему распознавание краёв не объясняет линейного рисунка

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 4.2K
Обзор
Перевод

Почему люди понимают линейные рисунки? Почему мы мгновенно узнаём объекты на линейных рисунках, хотя они не относятся к явлениям естественного мира? Многие исследования показывают, что люди, никогда ранее не видевшие такие изображения, могут их понимать; нам не нужно этому учиться.

Классический ответ на этот вопрос — та гипотеза, которую я буду называть Lines-As-Edges. Она гласит, что рисунки симулируют естественные образы, потому что признаки линий активируют рецепторы краёв в зрительной системе человека. Насколько я могу судить, такое убеждение широко распространено в среде исследователей зрения; многие люди вспоминают эту гипотезу, когда я говорю о восприятии рисунков, а также многие комментаторы под недавним постом в Twitter. Обобщением этой идеи становится то, что линии соответствуют некому внутреннему представлению, заставляющему нейроны реагировать на контуры объектов. Я называю эту гипотезу Line-As-Internal-Representation и расскажу о ней в этой статье.

Читать далее
Всего голосов 28: ↑28 и ↓0 +28
Комментарии 5

Нейростроительное MVP или Почему иногда стоит возрождать проекты

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 2.1K
Мнение

В 2019 году (кажется, целую вечность назад), мы начали эксперимент. Решили использовать наши знания в области нейронных сетей, чтобы создать продукт для многообещающей, как нам казалось, ниши. Целью было разработать аналитическую систему для застройщиков, которая с помощью камер и нейронных сетей следила бы за происходящим на строительных площадках. У нас была гипотеза. Мы изучили бизнесы, делающие подобную аналитику. Нашли несколько зарубежных стартапов, которые получили значительные инвестиции. Естественно, мы задались вопросом: «Почему мы не можем сделать то же самое?»

И что могло пойти не так?

Читать далее
Всего голосов 19: ↑19 и ↓0 +19
Комментарии 1

Проверка авто по vin, устройство на raspberry pi

Время на прочтение 7 мин
Количество просмотров 2.5K
Кейс
Предлагается рассмотреть рабочий концепт устройства, которое делает фото (не без помощи человека естественно), распознает vin номер авто на фото, проверяет номер по базе ГИБДД РФ, самостоятельно посещая сайт. Никаких взломов, бэкдоров и т.п., только законные действия.


Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 9

Усы, лапы и QR-код – вот мои документы. Заменит ли цифровой паспорт бумажный и чем это обернется для компаний?

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 2K

На этой неделе президент РФ Владимир Путин подписал указ о цифровом паспорте. Хотя электронные документы, как уточнили в Минцифры, будут использоваться только в “отдельных” случаях, компаниям и организациям, похоже, вскоре придется всерьез озадачиться. Ведь новые цифровые паспорта, равно как и другие электронные документы вроде водительского удостоверения, необходимо как-то проверять. 

Разбираемся, что такое цифровой паспорт и когда его можно будет использовать, а также показываем, какое решение мы, компания Smart Engines, придумали для компаний. 

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 4

Генерация изображения в Stable Diffusion по простому скетчу

Уровень сложности Средний
Время на прочтение 3 мин
Количество просмотров 5K
Обзор

Как известно, генерация в нейросети Stable Diffusion осуществляется по текстовому описанию с использованием различных обученных моделей. Кроме того, в качестве первичного источника можно использовать произвольное изображение (генерация по скетчу). Подробно об установке и подробностях работы можно ознакомиться в многочисленных статьях и видеообзорах в интернете. Отмечу только, что в работе нейросети при генерации используется цветовой шум – это стало отправной точкой моего небольшого исследования, которым я хочу с вами поделиться.

В процессе работы с нейросетью мною были использованы как текстовые описания (промты), так и скетчи – примитивные наброски, описывающей некую общую концепцию будущего изображения. При генерации по скетчу в настройках нейросети можно задавать значение параметра «Denoising strength» (принимает значения от 0 до 1). Параметр указывает силу влияния наброска на первичную генерацию изображения. Чем ближе значение к единице, тем меньше влияние. Как показала практика, при значениях ниже 0.5 практически на всех моделях и при любых прочих параметрах генерации, финальное изображение максимально упрощалось и стремилось к наброску. При значениях в диапазоне от 0.5 до 0.6 чаще получались картинки в мультяшном стиле, при этом негативные промты на результат влияния почти не оказывали. Реалистичные модели, как правило, при низких значениях дают результаты с большим количеством искажений, при больших – сценарий финального изображения очень быстро уходит от того, что изображено на наброске.

Читать далее
Всего голосов 12: ↑8 и ↓4 +4
Комментарии 8

Прогрессивный рендер изображений с использованием blurhash

Время на прочтение 10 мин
Количество просмотров 650
Кейс

Мы уже давно используем адаптивные изображения picture с srcset, но захотелось реализовать ленивую загрузку изображений на проектах, когда юзер видит изображение в плохом качестве, пока загружается основное.

В наше время пользователи хотят получать как можно больше контента за как можно меньшее время. В связи с этим, если изображение загружается не мгновенно, это уже проблема. Пользователь, скорее всего, его пропустит и пройдет дальше, если вообще не закроет сайт.

Вариант с отображением анимированного блока или изображения худшего качества в момент загрузки, очевидно, привлекает пользователей сильнее, чем просто белый блок. Поэтому решили, что его и будем реализовывать. Однако, есть множество различных способов это сделать.

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Комментарии 5

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
XIX конференция разработчиков свободных программ «Базальт СПО»
Дата 29 сентября – 1 октября
Время 10:00 – 19:00
Место Переславль-Залесский Онлайн
Kokoc Hackathon
Дата 29 сентября – 1 октября
Время 19:00 – 21:00
Место Онлайн
Ruby Russia 2023 Online
Дата 30 сентября
Время 11:00 – 21:00
Место Онлайн
PG Boot Camp Russia 2023
Дата 5 октября
Время 10:00 – 17:00
Место Москва Онлайн
Joker
Дата 9 – 14 октября
Время 16:00 – 19:30
Место Санкт-Петербург Онлайн
Открытый урок «Kafka Streams»
Дата 16 октября
Время 10:00
Место Онлайн
Питч-сессия pravo (tech) impulse
Дата 19 октября
Время 15:45 – 17:30
Место Москва
Russia Risk Conference 2023 — 19-я конференция по риск-менеджменту
Дата 25 – 26 октября
Время 10:00 – 19:00
Место Москва Онлайн
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн

Близится старт продаж iPhone 15. Почему блокировка банковских приложений не должна вас останавливать?

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 4K

Презентация iPhone 15 – главное технологическое событие сентября. И чем ближе старт продаж – тем больше дискуссий на тему целесообразности покупки нового яблочного смартфона. В этом году в числе стоп-факторов оказался весьма любопытный пункт – блокировка мобильных приложений банков, попавших под санкции. 

Действительно, скачать приложения банков из App Store сейчас нельзя. Пытаться перенести их с одного устройства Apple на другое или установить его в обход магазина – тот еще квест, причем не самый безопасный. Но у нас для вас хорошая новость: выход есть. Если вам интересно узнать, как банки (правда, не все) о вас позаботились и решили эту проблему, а также причем тут мы, компания Smart Engines – заглядывайте под кат. 

Читать далее
Всего голосов 15: ↑6 и ↓9 -3
Комментарии 47

Разбираем формат EXIF на примере Apple Photos

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 5.3K
Туториал
Перевод

В этой статье мы познакомимся с форматом EXIF и узнаем, какую информацию содержат метаданные фотографий, как эту информацию можно получить, и каким образом использовать. В качестве примера будем использовать фототеку, управляемую с помощью Apple Photos.
Читать дальше →
Всего голосов 47: ↑45 и ↓2 +43
Комментарии 5

Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 1.7K
Кейс

Привет, Хабр!

Сегодня с вами участники профессионального сообщества NTA Попов Иван и Чимбеев Анатолий.

В современном мире, где фотографии играют огромную роль в сфере социальных медиа, онлайн‑безопасности и контроля содержимого, важно иметь эффективные инструменты для обнаружения нежелательных предметов на изображениях. В данной публикации мы рассмотрим практическое применение двух популярных моделей — YOLO и ResNet — для обнаружения нежелательных предметов на фотографиях.

Как мы искали
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 2

Ловля уток на желуди и Брюс Уиллис в российской рекламе: как определять фейки в сети

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 2.4K

«Имбирь. 3000 рублей за кг». Подобные ценники на корнеплод мы наблюдали в супермаркетах в 2020 году, после чего имбирь и вовсе исчез с прилавков, а купить его можно было разве что в интернете и то по предзаказу. Ажиотаж был вызван расхожим мнением, что имбирь - панацея от новой коронавирусной инфекции. Впрочем, вскоре Всемирная организация здравоохранения эту информацию опровергла, а новость пополнила список фейков. 

Конечно, не без последствий. Потребовалось даже вмешательство ФАС, чтобы цены на продукт вернулись к допандемийным. Как возникают фейки и почему этому отчасти способствуют нейросети, в этой статье в блоге ЛАНИТ. 

Читать далее
Всего голосов 30: ↑28 и ↓2 +26
Комментарии 12

Fabula — нейросеть, которая нарисует ваш уникальный аватар по фото

Время на прочтение 5 мин
Количество просмотров 14K
Кейс

Как стартап из Казахстана смог построить успешный бизнес, используя генеративные нейросети на GPU-серверах от HOSTKEY.

Генеративные нейросети для создания картнок по запросом пользователей – один из главных трендов последнего года в области ИИ. Их развивают и ИТ-гиганты, и небольшие стартапы. Последним приходится конкурировать с корпорациями, обладающими неограниченными ресурсами и мощной инфраструктурой. Как им это удается? Расскажем на примере Fabula, клиента международного хостинг-провайдера HOSTKEY.

Читать далее
Всего голосов 9: ↑4 и ↓5 -1
Комментарии 15

Варианты применения Искусственных Нейронных Сетей. Компьютерное зрение (Computer Vision)

Время на прочтение 10 мин
Количество просмотров 2.2K

Искусственные Нейронные Сети являются мощными инструментами для решения многих задач и широко применяются различными организациями.

С некоторыми допущениями применение Искусственных Нейронных Сетей можно сгруппировать следующим образом:

Регрессия / Аппроксимация
Классификация / Кластеризация
Компьютерное зрение (Computer Vision)
seq2seq (Преобразование последовательности в последовательность)
Обработка естественного языка (Narural Language Process)

Данная статья посвящена примерам из группы задач "Компьютерное зрение (Computer Vision)"

Читать далее
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 3

«SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 967

В предыдущей части мы разобрали, как можно улучшить качество предсказаний SAM и ускорить её работу. Мы уже упоминали, что SAM — это фундаментальная модель, а значит, она может использоваться не только для сегментации, но и легко адаптироваться для решения других задач компьютерного зрения. Сегодня мы рассмотрим, как SAM может применяться для решения таких задач, как Image Inpainting, Object Tracking, 3D-сегментация и 3D-генерация, а также увидим, как SAM работает на датасетах из медицинской сферы и сравним дообученную модель с базовыми весами. А еще мы поделимся своим опытом и расскажем, как SAM облегчила нам разметку данных при сборе датасета бьютификации изображений.

SAM и тут и сям...
Всего голосов 12: ↑12 и ↓0 +12
Комментарии 0

Вклад авторов