Обработка изображений *

Работаем с фото и видео

Статьи Посты Новости Авторы Компании

olzeykan 26 сен в 18:56

Топ 10 deepnude нейросетей 2023 года

5 мин

42K

Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

DeepNude — это технология, использующая нейросети для создания изображений обнаженных тел на основе одетых фотографий или видео. Суть этой технологии заключается в том, чтобы "снять" одежду с изображения человека с помощью искусственного интеллекта и показать, как, предположительно, выглядит тело человека под одеждой.

Итак, в данной статье поговорим о пикантных и для некоторых людей непристойных темах, которые больше всего интересуют наше общество - обнаженное тело. Сделаем обзор таких сервисов как: Deepnude .ai, Deepfake.com, DeepSwap.ai, SoulGen и прочих.

+75

Doctor_IT 26 сен в 15:14

Странные позы, лишние пальцы и много котиков: самые интересные баги Midjourney

5 мин

4.9K

Блог компании Selectel Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

За время существования Midjourney пользователи сгенерировали петабайты изображений. Сколько из них действительно качественные — открытый вопрос. Машинное обучение интересно свей непредсказуемостью: часто генеративные нейросети коверкают иллюстрации, придумывают новые объекты, рисуют франкенштейнов — в общем, странно самовыражаются.

Часть багов разработчики Midjourney пофиксили, но некоторые существуют и сейчас. Мы потратили целый день, чтобы уговорить нейросеть заменить человека на картинке, но ничего не вышло. Смотрите, что создает Midjourney, когда ошибается, и угадывайте, какие баги мы зашифровали в обложке.

Читать дальше →

+27

C0uchP0tat0 26 сен в 13:09

Django, ImageField и .webp. Ещё немного про ускорение web приложения и экономию дискового пространства

Средний

4 мин

1.4K

Python *Django *Серверная оптимизация *Обработка изображений *

Туториал

Доброго времени суток уважаемый читатель. Хотелось бы немного поговорить об оптимизации наших с вам любимых WEB приложений, написанных на нашем горячо любимом и всеми уважаемом фреймворке Django. В частности речь в этой статье пойдёт об оптимизации изображений. А теперь по порядку.

ivankudryavtsev 26 сен в 12:30

Вышел Savant 0.2.5: фреймворк компьютерного зрения на базе Nvidia DeepStream SDK

Простой

6 мин

967

Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

Перевод

Savant - это высокоуровневый фреймворк с открытым исходным кодом для создания высокоэффективных приложений компьютерного зрения, работающих в реальном времени на стеке Nvidia. Он позволяет разрабатывать динамические, отказоустойчивые конвейеры, используя лучшие подходы Nvidia для ускорителей в центрах обработки данных и на границе.

Мы рады представить вам новую версию Savant - 0.2.5. Мы работали над этим релизом более 2,5 месяцев. Он содержит значительные изменения, новые возможности и исправления ошибок в нескольких областях, но в первую очередь мы улучшили возможности для разработчиков и варианты развертывания.

SmartEngines 25 сен в 11:48

Банк в кармане: как МКБ применяет решения для распознавания Smart Engines

Простой

4 мин

580

Блог компании Smart Engines Обработка изображений *Машинное обучение *Искусственный интеллект

Кейс

Московский кредитный банк (МКБ) уже три года применяет систему распознавания QR-кодов Smart Engines на смартфоне. Внедрение было визионерским: банк предвосхитил тренд на этот способ оплаты товаров и услуг.

Сегодня мы расскажем, как МКБ выбирал партнера по технологии распознавания, а также о том, каким образом банку удалось одним из первых в стране внедрить в мобильное приложение сканер номера телефона и как сейчас ИИ применяется в обслуживании клиентов вне офиса.

Tehnologika 25 сен в 11:37

Как мы распознавали цвета медицинских тест-полосок с помощью ИИ для healthcare стартапа

Средний

7 мин

963

Разработка мобильных приложений *Обработка изображений *Машинное обучение *Искусственный интеллект

Кейс

Рассказываем, как Технологика и стартап цифровой медицины запустили мобильное приложение, которое при помощи ИИ анализирует цвета медицинских тест-полосок и трактует результаты показателей мочи.

GlobalSign_admin 24 сен в 19:53

Эволюция CAPTCHA: доказательство PoW, продвинутые боты

3 мин

3.1K

Блог компании GlobalSign Информационная безопасность *Open source *Обработка изображений *

Поскольку во всех типах капчи системы ИИ показывают результат лучше человека, исследователи задались задачей придумать более эффективные методы защиты от ботов.

Например, mCaptcha — опенсорсная CAPTCHA, работающая по принципу proof-of-work. Её уже можно встретить на некоторых сайтах.

Читать дальше →

+11

PatientZero 24 сен в 15:45

Почему распознавание краёв не объясняет линейного рисунка

Простой

10 мин

4.2K

Обработка изображений *Графический дизайн *

Обзор

Перевод

Почему люди понимают линейные рисунки? Почему мы мгновенно узнаём объекты на линейных рисунках, хотя они не относятся к явлениям естественного мира? Многие исследования показывают, что люди, никогда ранее не видевшие такие изображения, могут их понимать; нам не нужно этому учиться.

Классический ответ на этот вопрос — та гипотеза, которую я буду называть Lines-As-Edges. Она гласит, что рисунки симулируют естественные образы, потому что признаки линий активируют рецепторы краёв в зрительной системе человека. Насколько я могу судить, такое убеждение широко распространено в среде исследователей зрения; многие люди вспоминают эту гипотезу, когда я говорю о восприятии рисунков, а также многие комментаторы под недавним постом в Twitter. Обобщением этой идеи становится то, что линии соответствуют некому внутреннему представлению, заставляющему нейроны реагировать на контуры объектов. Я называю эту гипотезу Line-As-Internal-Representation и расскажу о ней в этой статье.

+28

DewT-Mag 22 сен в 11:05

Нейростроительное MVP или Почему иногда стоит возрождать проекты

Простой

7 мин

2.1K

Блог компании Magnus Tech IT-инфраструктура *Обработка изображений *Машинное обучение *

Мнение

В 2019 году (кажется, целую вечность назад), мы начали эксперимент. Решили использовать наши знания в области нейронных сетей, чтобы создать продукт для многообещающей, как нам казалось, ниши. Целью было разработать аналитическую систему для застройщиков, которая с помощью камер и нейронных сетей следила бы за происходящим на строительных площадках. У нас была гипотеза. Мы изучили бизнесы, делающие подобную аналитику. Нашли несколько зарубежных стартапов, которые получили значительные инвестиции. Естественно, мы задались вопросом: «Почему мы не можем сделать то же самое?»

И что могло пойти не так?

+19

zoldaten 21 сен в 12:37

Проверка авто по vin, устройство на raspberry pi

7 мин

2.5K

Обработка изображений *Разработка на Raspberry Pi *DIY или Сделай сам

Кейс

Предлагается рассмотреть рабочий концепт устройства, которое делает фото (не без помощи человека естественно), распознает vin номер авто на фото, проверяет номер по базе ГИБДД РФ, самостоятельно посещая сайт. Никаких взломов, бэкдоров и т.п., только законные действия.

Читать дальше →

SmartEngines 21 сен в 11:48

Усы, лапы и QR-код – вот мои документы. Заменит ли цифровой паспорт бумажный и чем это обернется для компаний?

Простой

5 мин

Блог компании Smart Engines Обработка изображений *Машинное обучение *Искусственный интеллект

На этой неделе президент РФ Владимир Путин подписал указ о цифровом паспорте. Хотя электронные документы, как уточнили в Минцифры, будут использоваться только в “отдельных” случаях, компаниям и организациям, похоже, вскоре придется всерьез озадачиться. Ведь новые цифровые паспорта, равно как и другие электронные документы вроде водительского удостоверения, необходимо как-то проверять.

Разбираемся, что такое цифровой паспорт и когда его можно будет использовать, а также показываем, какое решение мы, компания Smart Engines, придумали для компаний.

gygavolt 20 сен в 14:57

Генерация изображения в Stable Diffusion по простому скетчу

Средний

3 мин

Обработка изображений *CGI (графика) *Искусственный интеллект

Обзор

Как известно, генерация в нейросети Stable Diffusion осуществляется по текстовому описанию с использованием различных обученных моделей. Кроме того, в качестве первичного источника можно использовать произвольное изображение (генерация по скетчу). Подробно об установке и подробностях работы можно ознакомиться в многочисленных статьях и видеообзорах в интернете. Отмечу только, что в работе нейросети при генерации используется цветовой шум – это стало отправной точкой моего небольшого исследования, которым я хочу с вами поделиться.

В процессе работы с нейросетью мною были использованы как текстовые описания (промты), так и скетчи – примитивные наброски, описывающей некую общую концепцию будущего изображения. При генерации по скетчу в настройках нейросети можно задавать значение параметра «Denoising strength» (принимает значения от 0 до 1). Параметр указывает силу влияния наброска на первичную генерацию изображения. Чем ближе значение к единице, тем меньше влияние. Как показала практика, при значениях ниже 0.5 практически на всех моделях и при любых прочих параметрах генерации, финальное изображение максимально упрощалось и стремилось к наброску. При значениях в диапазоне от 0.5 до 0.6 чаще получались картинки в мультяшном стиле, при этом негативные промты на результат влияния почти не оказывали. Реалистичные модели, как правило, при низких значениях дают результаты с большим количеством искажений, при больших – сценарий финального изображения очень быстро уходит от того, что изображено на наброске.

dev_family 19 сен в 09:41

Прогрессивный рендер изображений с использованием blurhash

10 мин

650

Веб-разработка *Клиентская оптимизация *Обработка изображений *

Кейс

Мы уже давно используем адаптивные изображения picture с srcset, но захотелось реализовать ленивую загрузку изображений на проектах, когда юзер видит изображение в плохом качестве, пока загружается основное.

В наше время пользователи хотят получать как можно больше контента за как можно меньшее время. В связи с этим, если изображение загружается не мгновенно, это уже проблема. Пользователь, скорее всего, его пропустит и пройдет дальше, если вообще не закроет сайт.

Вариант с отображением анимированного блока или изображения худшего качества в момент загрузки, очевидно, привлекает пользователей сильнее, чем просто белый блок. Поэтому решили, что его и будем реализовывать. Однако, есть множество различных способов это сделать.

SmartEngines 18 сен в 10:39

Близится старт продаж iPhone 15. Почему блокировка банковских приложений не должна вас останавливать?

Простой

5 мин

Блог компании Smart Engines Разработка под iOS *Обработка изображений *Смартфоны

Презентация iPhone 15 – главное технологическое событие сентября. И чем ближе старт продаж – тем больше дискуссий на тему целесообразности покупки нового яблочного смартфона. В этом году в числе стоп-факторов оказался весьма любопытный пункт – блокировка мобильных приложений банков, попавших под санкции.

Действительно, скачать приложения банков из App Store сейчас нельзя. Пытаться перенести их с одного устройства Apple на другое или установить его в обход магазина – тот еще квест, причем не самый безопасный. Но у нас для вас хорошая новость: выход есть. Если вам интересно узнать, как банки (правда, не все) о вас позаботились и решили эту проблему, а также причем тут мы, компания Smart Engines – заглядывайте под кат.

-3

Bright_Translate 17 сен в 13:00

Разбираем формат EXIF на примере Apple Photos

Средний

11 мин

5.3K

Блог компании RUVDS.com Обработка изображений *Фототехника

Туториал

Перевод

В этой статье мы познакомимся с форматом EXIF и узнаем, какую информацию содержат метаданные фотографий, как эту информацию можно получить, и каким образом использовать. В качестве примера будем использовать фототеку, управляемую с помощью Apple Photos.

Читать дальше →

+43

NewTechAudit 15 сен в 08:53

Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях

Средний

11 мин

1.7K

Обработка изображений *Машинное обучение *

Кейс

Привет, Хабр!

Сегодня с вами участники профессионального сообщества NTA Попов Иван и Чимбеев Анатолий.

В современном мире, где фотографии играют огромную роль в сфере социальных медиа, онлайн‑безопасности и контроля содержимого, важно иметь эффективные инструменты для обнаружения нежелательных предметов на изображениях. В данной публикации мы рассмотрим практическое применение двух популярных моделей — YOLO и ResNet — для обнаружения нежелательных предметов на фотографиях.

Как мы искали

Krisdes 12 сен в 10:01

Ловля уток на желуди и Брюс Уиллис в российской рекламе: как определять фейки в сети

Простой

7 мин

2.4K

Блог компании ГК ЛАНИТ Обработка изображений *Управление медиа *Искусственный интеллект

«Имбирь. 3000 рублей за кг». Подобные ценники на корнеплод мы наблюдали в супермаркетах в 2020 году, после чего имбирь и вовсе исчез с прилавков, а купить его можно было разве что в интернете и то по предзаказу. Ажиотаж был вызван расхожим мнением, что имбирь - панацея от новой коронавирусной инфекции. Впрочем, вскоре Всемирная организация здравоохранения эту информацию опровергла, а новость пополнила список фейков.

Конечно, не без последствий. Потребовалось даже вмешательство ФАС, чтобы цены на продукт вернулись к допандемийным. Как возникают фейки и почему этому отчасти способствуют нейросети, в этой статье в блоге ЛАНИТ.

+26

dasafyev 11 сен в 12:49

Fabula — нейросеть, которая нарисует ваш уникальный аватар по фото

5 мин

14K

Блог компании HOSTKEY Обработка изображений *Машинное обучение *Искусственный интеллект

Кейс

Как стартап из Казахстана смог построить успешный бизнес, используя генеративные нейросети на GPU-серверах от HOSTKEY.

Генеративные нейросети для создания картнок по запросом пользователей – один из главных трендов последнего года в области ИИ. Их развивают и ИТ-гиганты, и небольшие стартапы. Последним приходится конкурировать с корпорациями, обладающими неограниченными ресурсами и мощной инфраструктурой. Как им это удается? Расскажем на примере Fabula, клиента международного хостинг-провайдера HOSTKEY.

-1

AnatolyBelov 10 сен в 16:52

Варианты применения Искусственных Нейронных Сетей. Компьютерное зрение (Computer Vision)

10 мин

2.2K

Обработка изображений *Искусственный интеллект

Искусственные Нейронные Сети являются мощными инструментами для решения многих задач и широко применяются различными организациями.

С некоторыми допущениями применение Искусственных Нейронных Сетей можно сгруппировать следующим образом:

Регрессия / Аппроксимация
Классификация / Кластеризация
Компьютерное зрение (Computer Vision)
seq2seq (Преобразование последовательности в последовательность)
Обработка естественного языка (Narural Language Process)

Данная статья посвящена примерам из группы задач "Компьютерное зрение (Computer Vision)"

nagadit 7 сен в 12:04

«SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)

Средний

6 мин

967

Блог компании SberDevices Data Mining *Обработка изображений *Машинное обучение *Искусственный интеллект

В предыдущей части мы разобрали, как можно улучшить качество предсказаний SAM и ускорить её работу. Мы уже упоминали, что SAM — это фундаментальная модель, а значит, она может использоваться не только для сегментации, но и легко адаптироваться для решения других задач компьютерного зрения. Сегодня мы рассмотрим, как SAM может применяться для решения таких задач, как Image Inpainting, Object Tracking, 3D-сегментация и 3D-генерация, а также увидим, как SAM работает на датасетах из медицинской сферы и сравним дообученную модель с базовыми весами. А еще мы поделимся своим опытом и расскажем, как SAM облегчила нам разметку данных при сборе датасета бьютификации изображений.

SAM и тут и сям...

+12

2 3 ...

49 50

Обработка изображений *

Топ 10 deepnude нейросетей 2023 года

Новости

Странные позы, лишние пальцы и много котиков: самые интересные баги Midjourney

Django, ImageField и .webp. Ещё немного про ускорение web приложения и экономию дискового пространства

Вышел Savant 0.2.5: фреймворк компьютерного зрения на базе Nvidia DeepStream SDK

Истории

Банк в кармане: как МКБ применяет решения для распознавания Smart Engines

Как мы распознавали цвета медицинских тест-полосок с помощью ИИ для healthcare стартапа

Эволюция CAPTCHA: доказательство PoW, продвинутые боты

Почему распознавание краёв не объясняет линейного рисунка

Нейростроительное MVP или Почему иногда стоит возрождать проекты

Проверка авто по vin, устройство на raspberry pi

Усы, лапы и QR-код – вот мои документы. Заменит ли цифровой паспорт бумажный и чем это обернется для компаний?

Генерация изображения в Stable Diffusion по простому скетчу

Прогрессивный рендер изображений с использованием blurhash

Ближайшие события

Близится старт продаж iPhone 15. Почему блокировка банковских приложений не должна вас останавливать?

Разбираем формат EXIF на примере Apple Photos

Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях

Ловля уток на желуди и Брюс Уиллис в российской рекламе: как определять фейки в сети

Fabula — нейросеть, которая нарисует ваш уникальный аватар по фото

Варианты применения Искусственных Нейронных Сетей. Компьютерное зрение (Computer Vision)

«SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)

Вклад авторов