Как стать автором

Обработка изображений *

Работаем с фото и видео

Статьи Посты Новости Авторы Компании

Bright_Translate 19 часов назад

Разбираем самый маленький PNG в мире

Простой

9 мин

15K

Блог компании RUVDS.com Алгоритмы *Обработка изображений *Сжатие данных *

Обзор

Перевод

Самый миниатюрный PNG в мире весит 67 байт и представляет собой один чёрный пиксель. Выше вы видите его в 200-кратном увеличении.

Красота, не так ли?

Состоит этот файл из четырёх частей:

Сигнатура PNG, одинаковая во всех файлах этого формата: 8 байт.
Метаданные изображения, включая его размеры: 25 байт.
Данные пикселя: 22 байта.
Маркер «конец изображения»: 12 байт.

Далее я опишу этот файл подробнее и постараюсь объяснить принцип работы формата PNG.

В качестве небольшой затравки скажу, что в конце предстоит неожиданный поворот. Хотя, надеюсь, вам и без того интересно побольше узнать о PNG.

Читать дальше →

+78

ZlodeiBaal 18 янв в 03:50

«Пора ли гнать на мороз Computer Vision — scientist'ов ?» (Fondation Models и вокруг)

Средний

8 мин

9.8K

Блог компании Recognitor Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект

Аналитика

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. Какие задачи стало проще решать. Какие продукты появились в последнее время и появятся в будущем.
И можно ли уже выгнать на мороз лишних "ресерчеров"?!

Читать далее

+60

GEOGRAMMA 17 янв в 16:30

Основы обработки радиолокационных данных дистанционного зондирования Земли

Средний

31 мин

2.5K

Алгоритмы *Обработка изображений *Геоинформационные сервисы *Big Data *Научно-популярное

Обзор

Из песочницы

В настоящее время все более востребованными становятся данные радиолокационного наблюдения (РЛН) с космических аппаратов дистанционного зондирования Земли. Наблюдая повышенный интерес к этой предметной области с одной стороны и явный недостаток информационных материалов по теме обработки радиолокационных данных ДЗЗ с другой, решили написать статью, которая, надеемся, будет полезна для всех интересующихся темой ДЗЗ.

Читать далее

+14

WildChlamydia 17 янв в 12:35

Как художники за рабочие места с ИИ борются

Простой

8 мин

5.5K

Обработка изображений *Машинное обучение *Научно-популярное Искусственный интеллект Будущее здесь

Громоподобный шаг научно-технического прогресса слышен издалека: сквозь года до нас доносится эхо шагов из будущего. Шрамы ран, полученных в предыдущие промышленные революции, априорные, переданные через учебники и опыт предков, болезненно сжимаются под воздействием этого эха. Как и всё великое, дела человечества пугающе красивы.

Наверное, поэтому все мы стали в той или иной мере, но скажем честно, опасаться ИИ заранее. А пока фантазировали, он зашёл не совсем оттуда, откуда его ждали.

Читать далее

+14

PatientZero 17 янв в 11:09

Сжимаем текст в изображения PNG

Простой

2 мин

5K

Обработка изображений *Хранение данных *Сжатие данных *

Обзор

Перевод

(Наверно, это глупая идея. Но иногда даже самые глупые идеи приводят к неожиданным результатам.)

Текст шекспировской трагедии «Ромео и Джульетта» состоит примерно из 146 тысяч символов. Благодаря английскому алфавиту каждый символ можно описать одним байтом. Так что размер текстового файла в обычном Unicode составляет примерно 142 КБ.

В статье Adventures With Compression её автор JamesG размышляет о соревнованиях по сжатию текста и предлагает интересную мысль...

Читать далее

+15

dimanosov007 15 янв в 12:29

Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

12 мин

7.9K

Python *Обработка изображений *Машинное обучение *

Туториал

Перевод

Обнаружение движущихся объектов широко используется в самых разных приложениях, от видеонаблюдения до мониторинга дорожного движения. Это важнейшая задача в постоянно развивающейся области компьютерного зрения. Библиотека OpenCV с открытым исходным кодом, известная своим полным набором инструментов для компьютерного зрения, предоставляет надежные решения для обнаружения движущихся объектов. В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

Читать далее

+11

pavel_starikov 15 янв в 11:45

Защита JPG-файлов от копирования с помощью Exif и IPTC-тегов

Средний

5 мин

2.4K

PHP *Обработка изображений *Контент и копирайтинг *Копирайт

Из песочницы

Всем привет! На связи Павел Стариков Fullstack-разработчик digital-агентства. Представьте, вы потратили целый день на создание хороших фотографий для статьи на сайте. Выставили свет, поставили «на уши» множество людей, долго работали в «фотошопе». Фотографии получились отличные, вот только спустя год Яндекс внезапно присылает фильтр «малополезный контент», при этом другие статьи, которые своровали нашу картинку – на первых местах по SEO-высокочастотным запросам. Обидно, не правда ли?

Для предотвращения подобных ситуаций поисковые системы обращают внимания на текстовые мета-теги, которые можно записать в каждую фотографию. Основной формат изображений – JPEG имеет сразу несколько механизмов. Как Exif-данные, содержащие сведения об авторе, камере, дате изменения, так и менее известный стандарт IPTC, который хранит данные в двоичном формате.

Читать далее

+10

krisgrey 12 янв в 16:41

Обзор решений на основе 3D Gaussian Splatting

Средний

10 мин

1.6K

Работа с 3D-графикой *Обработка изображений *Искусственный интеллект

Из песочницы

Спустя полгода после выхода публикации 3D Gaussian Splatting лавина препринтов на его основе накрыла область 3D-реконструкции. Какие задачи теперь решаются проще, и как именно Gaussian Splatting помогает в приложениях реального времени?

Читать далее

+8

omysov 12 янв в 13:40

Метод быстрого марша (Fast Marching Method)

Средний

8 мин

6.8K

Алгоритмы *Обработка изображений *C# *

Из песочницы

Пример реализации метода быстрого марша(Fast Marching Method) для создания полей расстояний(Distance FIeld) и поиска кратчайшего пути.

Читать далее

+11

timonin 11 янв в 21:56

Создавать собак, кошек и даже лошадей в нейросети стало проще! Вышел ControlNet Animal OpenPose для Automatic 1111

Простой

3 мин

2.1K

Обработка изображений *Искусственный интеллект

Обзор

Всем привет, не успели мы отойти от шока, что руки теперь не проблема, так оказывается еще пару недель назад вышел препроцессор для ControlNet который позволяет получать скелет не только людей, как было раньше, но и животных. Я вот только узнал об этом и спешу рассказать вам.

Читать далее

+11

Quled 7 янв в 17:54

AI-генераторы порно фото: этика, тренды и законодательство

Простой

6 мин

48K

Обработка изображений *Машинное обучение *История IT Искусственный интеллект Здоровье

Аналитика

В последнее время, AI-генераторы порно фото стали частью большого обсуждения в сфере искусственного интеллекта, и порно индустрия не исключение. Интерес к этой теме растет, как и количество споров вокруг неё.

AI-генераторы порно фото — это программы, использующие алгоритмы машинного обучения для создания реалистичных изображений. Они могут генерировать фото, которые кажутся настоящими, но на самом деле являются продуктом алгоритма.

AI использует обширные базы данных изображений для обучения, а затем, основываясь на этом обучении, создает новые изображения. Это может включать и порно фото, что и вызывает этические дискуссии.

Читать дальше →

+72

R3EQ 2 янв в 15:38

Как я создавал автокликер для приложения «ДругВокруг»

Средний

15 мин

6.1K

Мессенджеры *C++ *Обработка изображений *C *Социальные сети и сообщества

Социальные сети и мессенджеры последнее время завоевали большую популярность среди пользователей интернета. Одной из таких соцсетей было приложение «ДругВокруг». Точнее, было в моём обиходе. Стояло оно у меня на компьютере с Windows XP в 2016 году. В то время у меня возникла идея сделать одну интересную программу для работы с этим приложением...

Читать далее

+4

ToSHiC 29 дек 2023 в 10:00

Видео — это вам не фото: о чём нужно знать разработчикам видеостриминговых сервисов

12 мин

4.9K

Блог компании Yandex Cloud & Yandex Infrastructure Работа с видео *Обработка изображений *Звук

Обзор

В видеостриминге есть два типа инженеров: разработчики, которые создают сервисы потокового вещания, и инженеры, которые делают контент. Два этих множества практически не пересекаются — в результате не все айтишники понимают, насколько легко может пострадать качество видео во время его обработки.

Привет, меня зовут Антон Кортунов, я техлид Yandex Infrastructure. В 2017 году мы запустили новый для Яндекса проект — платформу потокового видео Яндекс Эфир. Сам проект закрылся, но на основе платформы работают Кинопоиск, видеокарточки товаров в Яндекс Маркете, Реклама и множество других сервисов.

Как разработчик тогда я столкнулся с чудным дивным миром телевидения и кино, и понял, что видео — не просто последовательность кадров на фоне звуковой дорожки. Под катом расскажу о тонкостях, о которых я узнал от видеоинженеров за последние 5 лет.

Читать далее

+37

SmartEngines 28 дек 2023 в 10:15

Топ-18 наших самых крутых ИИ-разработок за 2023 год: рукописная прописка, UniversalPay и обрезанные QR. А что еще?

Простой

10 мин

1.6K

Блог компании Smart Engines Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

2023 год оказался для нашей компании, Smart Engines, крайне успешным со всех точек зрения – бизнес-результатов, научных достижений и, разумеется, технологий. И нашими успехами мы традиционно хотим поделиться с вами.

Подведение итогов мы решили начать с обзора наших самых заметных разработок. Некоторыми из них, кстати, вы, сами того не подозревая, можете пользоваться каждый день. Это и технология для упрощения платежей UniversalPay, и распознавание рукописной прописки, и считывание неограниченного числа QR-кодов, и много-много чего еще.

Мы собрали для себя и для вас топ-18 разработок Smart Engines за минувший год – приглашаем под кат, чтобы с ними познакомиться.

Читать далее

+1

a1exjob 28 дек 2023 в 08:00

Как мы с Кандинским дракона рисовали

Простой

4 мин

4.9K

Блог компании Специальный Технологический Центр Обработка изображений *Искусственный интеллект Подготовка технической документации *

Очень часто для оформления документов, например, презентаций или статей на Хабре 😊, требуются интересные, нестандартные и не нарушающие авторские права картинки, суть которых есть только в голове автора. Кроме того, сложные изображения может нарисовать только профессиональный художник в течение значительного времени. Поэтому генерирование изображений по текстовому описанию – это очень полезный и нужный пользовательский сервис, позволяющий создать уникальные изображения за очень короткий промежуток времени. Основной проблемой при генерировании изображений является формулирование грамотного запроса, чтобы получить желаемый результат.

Существует достаточно большое количество нейросетей, генерирующих изображения. Относительно недавно появилась новая версия модели генерации изображений по тексту Kandinsky 3.0 (дальше К3). На носу – ~~масленица~~ Новый Год, поэтому мы с К3 решили нарисовать символ китайского 2024 года, а именно зеленого деревянного дракона. Т.к. показать на рисунке, что дракон деревянный – задача нетривиальная, поэтому решено нарисовать просто добродушного зеленого дракона в стиле цифровой живописи.

Читать далее

+5

IlyaVK 27 дек 2023 в 16:17

Обработка изображений и видео на смартфонах: handcrafted-алгоритмы против глубокого обучения

Простой

22 мин

3K

Блог компании Samsung Обработка изображений *Машинное обучение *Искусственный интеллект

Обзор

Зеркалка — хорошая штука, но смартфон однозначно компактнее и удобнее. Да, мобильная оптика все еще далека до уровня зеркалок, однако получить красивые фотографии человек хочет здесь и сейчас. Как быть? Взамен харда, подключается софт, алгоритмы!

Именно софт смартфона помогает снять фото в HDR или сделать видео менее смазанным. Он состоит из «классических» вычислительных алгоритмов и нейросетей. Вычислительные алгоритмы требуют много ручной работы и глубокого понимания решаемой задачи, зато хорошо работают при ограниченных вычислительных ресурсах. Нейросети прожорливы, но сильно упрощают жизнь разработчику и потенциально позволяют достичь большего. Объединение двух этих подходов даёт замечательные результаты!

Читать далее

+7

SeregaChipset 26 дек 2023 в 19:00

Монтаж уличной ip-камеры и вывод изображения по RTSP (python, raspberry pi)

Средний

6 мин

21K

Python *Обработка изображений *Параллельное программирование *Умный дом Инженерные системы *

Из песочницы

Камеры видеонаблюдения стали для многих стран обыденностью, например в Китае, они могут свисать гроздьями, через каждые 5 метров, по улице. Но в провинции России это все еще может быть в новинку. Я отношусь к видеонаблюдению по большей мере положительно. Ведь вид камеры, даже превентивно может предотваратить хулиганство (однажды я использовал муляжи камер в офисе:)), а главное это возможность контроллировать обьект наблюдения.

Этот пост про монтаж уличной камеры, на стену многоквартирного дома и программную реализацию - вывод изображения, без использования стандартной программы, оптимизацию (размещение на raspberry pi).

Читать далее

+17

Pro2492 26 дек 2023 в 15:14

Что нового в Midjourney 6? 5 видимых отличий от 5.2

Простой

3 мин

7.8K

Обработка изображений *

Обзор

Recovery Mode

Теперь изображения сложно отличить от реальных фото - морщины, складки, красные глаза, текстура кожи — генерации выглядят почти идеально.

Читать далее

+13

litwr2 26 дек 2023 в 10:16

Цветные фотки на первых ПК

Средний

12 мин

4.3K

Обработка изображений *История IT Старое железо Видеокарты Настольные компьютеры

Обзор

Когда впервые на ПК стали работать с фотографиями? Какие из этих систем вошли в историю, а какие остались практически неизвестными? Следующий обзор - это попытка ответа на эти и сопутствующие вопросы с техническими деталями. Конечно, это про Амигу, но не только.

Читать далее

+9

SmartEngines 26 дек 2023 в 10:15

Томографический калейдоскоп, или подведение итогов уходящего 2023 года вместе с STE

Простой

9 мин

924

Блог компании Smart Engines Алгоритмы *Обработка изображений *Математика *Софт

Привет, Хабр. На пороге Новый год. Как всегда в конце года хочется понять, а чем же был для нас, компании Smart Engines, год уходящий? Продуктивным - да, и бизнес-результаты, и научные достижения, и технологии - как игрушки на елке - радуют. А где же игрушки - спросите вы и будете правы. Ведь один их сверкающий вид открывает двери празднику. А ниже они обязательно будут. Сегодня мы поделимся с вами нашим взглядом на 12 месяцев, а поможет в этом наш STE. Тот самый продукт для томографической реконструкции, над которым мы не устаем трудиться, дополняя, стабилизируя и запуская, как проходческий щит, в неосвоенные туннели условий томографической съемки.

Результат наших трудов покажем на томографии 12 объектов, каждый из которых символизирует один из 12 месяцев года. Да-да, интересная задача перед нами стояла в декабре - собрать 12 объектов, сфотографировать, сделать томографию и соорудить календарь из них. Кстати, и ты, дорогой читатель, можешь стать обладателем календаря от Smart Engines, но обо всем по порядку!

Читать далее

+2

1