Обработка изображений *

Работаем с фото и видео

iva2000 сегодня в 18:37

Брюнетки против блондинок или как на мониторе показать цвет свечения светильника?

Визуализация данных *Графический дизайн *Научно-популярное Обработка изображений *Физика

Метод демонстрации на мониторе цветности свечения светильника в соответствии с требованиями проекта национального стандарта «Методы определения неоднородности цветности», и шаблоны в MS Excel.

243

MrBFan сегодня в 12:06

Распознавание вен ладони в задаче биометрической идентификации

Блог компании Мир Plat.Form (НСПК) Обработка изображений *

На сей день в СКУД, в платежах, и в других задачах, где необходимо проводить аутентификацию используются разные биометрические модальности. Сегодня мы поговорим об относительно редкой на текущий момент: рисунку вен ладони.

Заглянуть под кожу

522

GlobalSign_admin 9 октября в 20:28

Видеосъёмка из браузера. HTML-код, который включает камеру на смартфоне

Блог компании GlobalSign Информационная безопасность *Разработка веб-сайтов *Обработка изображений *Браузеры

Современные стандарты HTML и JavaScript дают разработчикам мощные инструменты для работы со смартфоном через браузер. Мы уже рассказывали о трекинге движений человека по гироскопу/акселерометру с распознаванием паттернов (ходьба, бег, общественный транспорт, нахождение рядом с другим пользователем с аналогичными паттернами) на веб-странице.

Это далеко не единственная такая функция. Например, в мобильных браузерах поддерживается HTML-атрибут <capture>, который начинает видеосъёмку на смартфоне просто по нажатию кнопки на веб-странице.

Читать дальше →

5.1K

ChePeter 7 октября в 10:17

Удивительное рядом

Data Mining *Обработка изображений *Машинное обучение *Искусственный интеллект

Одной из самых жутких проблем для любого любителя, как и для профессионала в data science является качество разметки.
Качество разметки способно погубить самую толковую и красивую идею.

Но не всё оказалось так плохо и вашему вниманию предлагается, как и всегда в моих постах, красивая идея с кодами и примером.

Итак, начнем.

1.8K

ElenaVolchenko 4 октября в 10:33

Бизнес — экосистема CarDamageTest. Как построить удобный сервис для автовладельцев?

Блог компании Финолаб Data Mining *Обработка изображений *Бизнес-модели *

В предыдущей публикации я рассказала о нашем сервисе, который теперь имеет запатентованное название CarDamageTest. Он предназначен для автоматической оценки технического состояния автомобилей на основе технологий искусственного интеллекта. И сейчас мне хотелось бы вынести на ваше обсуждение трансформацию этого сервиса в полноценную цифровую бизнес-экосистему для автовладельцев и компаний, работающих в автомобильном бизнесе.

В статье мы обсудим преимущества бизнес-экосистем по сравнению с обычными сервисами для клиентов, рассмотрим выгоды участия в таких системах для бизнеса, ну а в конце статьи вы найдете ссылки для скачивания нашего сервиса.

380

PatientZero 3 октября в 14:49

Сжатие изображений при помощи модели Stable Diffusion

Обработка изображений *Сжатие данных *Машинное обучение *Искусственный интеллект

Перевод

Введение

На сегодняшний день Stable Diffusion является источником вдохновения для сообщества любителей опенсорсного машинного обучения и в то же время источником расстройства для художников всего мира. Мне стало любопытно, что ещё может сделать эта важная технология кроме того, как подвергать угрозе рабочие места профессиональных художников и дизайнеров.

В процессе экспериментов с моделью я обнаружил, что она подходит в качестве чрезвычайно эффективного кодека сжатия изображений с потерями. Прежде чем приступать к описанию своей методики и демонстрации кода, вот несколько результатов модели по сравнению с JPG и WebP с высокой степенью сжатия. Все изображения имеют разрешение 512x512 пикселей:

Читать дальше →

+37

7.7K

kucev 3 октября в 12:18

Архитектура платформы машинного обучения в продакшене

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

История машинного обучения (Machine learning, ML) началась в 1950-х, когда появились первые нейронные сети и алгоритмы ML. Однако чтобы стать известным обычному человеку, машинному обучению понадобилось ещё шестьдесят лет. Анализ более чем 16 тысяч статей по data science MIT technologies демонстрирует экспоненциальный рост машинного обучения на протяжении последних двадцати лет, стимулируемый big data и прогрессом в глубоком обучении.

На практике любой, имеющий доступ к данным и компьютеру, может сегодня обучить модель машинного обучения. Возможности автоматизации и создаваемые ML прогнозы имеют множество различных применений. Благодаря им работают современные системы распознавания мошенничества, приложения доставки товаров предсказывают время прибытия на лету, а программы помогают в медицинской диагностике.

Способы создания и применения моделей зависят от потребностей организации и прикладной области ML. Процесс создания моделей машинного обучения подробно описан, однако у ML существует и другая сторона — внедрение моделей в среде продакшена. Модели в продакшене управляются через специальный тип инфраструктуры — конвейеры машинного обучения. В статье мы расскажем о функциях сервисов ML в продакшене и рассмотрим готовые решения.

Читать дальше →

2.2K

wadik69 3 октября в 11:00

Автоматическая озвучка субтитров на YouTube с использованием компьютерного зрения

Python *Программирование *Обработка изображений *Машинное обучение *

Привет, Хабр! Около полугода назад я наткнулся на статью с практически аналогичным названием. Сама идея мне показалась интересной и захотелось сделать нечто похожее только с использованием компьютерного зрения.

Всем, кому интересно как мне удалось это реализовать и с какими трудностями пришлось столкнуться в процессе разработки — добро пожаловать под кат!

7.4K

zoldaten 27 сентября в 13:15

Калибровка камеры-imu с Kalibr

Обработка изображений *Разработка робототехники *Разработка на Raspberry Pi *

Tutorial

В данной публикации хотелось бы познакомить с пакетом калибровки камеры Kalibr, в том числе для целей его использования в пакете визуальной навигации ORB_SLAM3. Будет продемонстрирован процесс калибровки камеры fish-eye для raspberry pi. Камера будет калиброваться совместно с гироскопом/акселерометром imu-650 (GY-521). Предполагается, что данная пошаговая инструкция облегчит понимание процесса калибровки в случае возникновения необходимости в таковой.

Читать дальше →

885

ternaus 21 сентября в 01:48

Similar images: API

Python *Обработка изображений *Машинное обучение *Искусственный интеллект

Кортокая версия.

Я набил API и python библиотеку, которые позволяют искать картинки похожую на искомую.

API бесплатный, на один запрос выдает до 20 похожих картинок.

В базе данных 18 миллионов изображений. Надеюсь, в ближайшее время, добавлю еще 50M.

API: LINK

python wrapper: LINK

Web Demo: LINK. Можно загрузить свою картинку или воспользоваться текстовым поиском. Можно кликать на картинки в результате поиска и смотреть что найдет по ней. Хороший вопрос за сколько шагов можно дойти от чего-то невинного до порнухи или хотя бы обнаженки.

+19

2.7K

zoldaten 20 сентября в 19:58

ORB_SLAM3 на raspberry pi 4

Обработка изображений *Разработка робототехники *Разработка на Raspberry Pi *

Tutorial

Рассматриваются нюансы установки ORB_SLAM3 на одноплатном пк — raspberry pi 4 c ОС Raspbian buster, проводится поверхностный анализ возможностей алгоритма с учетом ограничений raspberry, показаны возможные пути оптимизации производительности, используется помимо прочего ROS noetic как связующее звено между imu, csi камерой raspberry pi и ORB_SLAM3. Статья не претендует на научность, излагается мнение автора с опорой на экспериментальную базу.

Читать дальше →

1.9K

kucev 19 сентября в 11:34

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

У Колумбийского университета есть хорошая история о плохих данных. Проект в сфере здравоохранения был нацелен на снижение затрат на лечение пациентов с пневмонией. В нём использовалось машинное обучение (machine learning, ML) для автоматической сортировки записей пациентов, чтобы выбрать тех, у кого опасность смертельного исхода минимальна (они могут принимать антибиотики дома), и тех, у кого опасность смертельного исхода высока (их нужно лечить в больнице). Команда разработчиков использовала исторические данные из клиник, а алгоритм был точным.

Но за одним важным исключением. Одним из наиболее опасных состояний при пневмонии является астма, поэтому врачи всегда отправляют астматиков в отделение интенсивной терапии, что приводило к минимизации уровня смертности для этих пациентов. Благодаря отсутствию смертельных случаев у астматиков в данных алгоритм предположил, что астма не так уж опасна при пневмонии, и во всех случаях машина рекомендовала отправлять астматиков домой, несмотря на то, что для них риск осложнений при пневмонии был наибольшим.

ML сильно зависит от данных. Это самый критически важный аспект, благодаря которому и возможно обучение алгоритма; именно поэтому машинное обучение стало столь популярным в последние годы. Но вне зависимости от терабайтов информации и экспертизы в data science, если ты не можешь понять смысл записей данных, то машина будет практически бесполезной, а иногда и наносить вред.

Читать дальше →

4.2K

OlegSivchenko 16 сентября в 17:22

Человек, маска и аватара. Не рано ли переходить на биометрическую идентификацию

Информационная безопасность *Обработка изображений *Машинное обучение *Научно-популярное

В эпоху всеобщей виртуальности и общения через аватары, а также бурно развивающейся биометрической идентификации и дипфейков становится исключительно важно отличать живого человека от неживой подделки, например, от фотографии. В этом и заключается центральная задача биометрической идентификации пользователя. Частично я затрагивал эти темы в статьях о зловещей долине и о маскировке, препятствующей распознаванию лиц, а сегодня попробую рассказать о целом спектре методов, выработанных для опознания живого человека в картиночной реальности социальных сетей.

+21

2.6K

datist 16 сентября в 13:36

SVTR — state-of-the-art нейросеть для задачи OCR

Обработка изображений *Машинное обучение *Искусственный интеллект

Tutorial

SVTR - state-of-the-art модель-трансформер для решения задачи OCR.

Авторами статьи была предложена архитектура с одним "зрительным" модулем для эффективного распознавания текста. Основная идея работы заключается в обработке признаков разного уровня, то есть локальных, которые представляют собой признаки отдельных частей символов, и глобальных, признаков целого изображения. Входное изображение с текстом сперва разбивается на компоненты, которым соответствуют определенные части изображения. Далее, применяя механизм self-attention между компонентами модель извлекает важную информацию, используя локальные и глобальные признаки. Также, уменьшая размерность и объединяя признаки после блоков self-attention, модель формирует многогранное представление о тексте на изображении. В результате, модель выдаёт последовательность признаков, в которой уже закодирован текст без использования рекуррентных сетей!

1.3K

Clickru 16 сентября в 12:11

Где брать изображения в 2022 году

Блог компании Click.ru Обработка изображений *Графический дизайн *Повышение конверсии *

Если вы занимаетесь интернет-маркетингом, вам потребуются качественные изображения. Они влияют на эффективность рекламы ничуть не меньше, чем правильно подобранные ключи, составленное объявление или выбранная аудитория, помогают лучше воспринимать информацию из текста, хорошо запоминаются.

Мы подготовили подборку из 19 популярных фотостоков, на которых вы без проблем сможете найти изображения для любых целей. Почти все фотобанки бесплатные, а платные легко оплатить из России.

+11

3.7K

ZlodeiBaal 15 сентября в 17:21

Как выбрать плату для Computer Vision в 2022

Блог компании Recognitor Обработка изображений *Машинное обучение *Компьютерное железо DIY или Сделай сам

Выбор платформы для работы с Computer Vision on the Edge - непростая задача. На рынке десятки плат. И одна другой краше. Но на практике все оказывается не так хорошо.
Я попробовал сравнить дешевые платы которые есть на рынке. И сделал это не только в по скорости. Я попробовал сравнить платформы по “удобству” их использования. Насколько просто будет портировать сети, насколько хорошая поддержка. И насколько просто работать. И актуализировал это для 2022 года (один и тот же Coral из 2020 и из 2022 - две разные платы).

+22

5.1K

kucev 14 сентября в 22:00

Руководство по Human Pose Estimation

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

Обычно эту задачу решают при помощи глубокого обучения.

Это одна из самых интересных областей исследований, получившая популярность благодаря своей полезности и универсальности — она находит применение в широком спектре сфер, в том числе в гейминге, здравоохранении, AR и спорте.

В этой статье приведён исчерпывающий обзор определения положения тела человека (Human Pose Estimation, HPE) и того, как оно работает. Также в ней рассматриваются различные подходы к решению задачи HPE — классические методы и методы на основе глубокого обучения, метрики и способы оценки, а также многое другое.

Читать дальше →

+19

megabax 14 сентября в 20:30

Уроки компьютерного зрения. Оглавление

Python *Обработка изображений *

Tutorial

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 1.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 2.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 3.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 4.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 5.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 6.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 7.

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 8.

+14

7.2K

arch1baald 14 сентября в 17:11

Шерудим под капотом Stable Diffusion

Обработка изображений *Машинное обучение *Искусственный интеллект Natural Language Processing *

Tutorial

Вероятно вы уже слышали про успехи нейросетей в генерации картинок по текстовому описанию.

Я решил разобраться, и заодно сделать небольшой туториал, по архитектуре модели Stable Diffusion. Сегодня мы не будем глубоко погружаться в математику и процесс тренировки. Вместо этого сфокусируемся на применении и устройстве основных компонент: UNet, VAE, CLIP.

+81

10K

Atmyre 14 сентября в 16:00

Структурное мышление или важное отличие человека от ИИ

Обработка изображений *Машинное обучение *Искусственный интеллект

В этой статье я расскажу об одном из самых важных отличий человеческого мышления от того, как работают нейросети: о структурном восприятии мира. Мы поймем, как это отличие мешает ИИ эффективно решать многие задачи, а также поговорим об идеях, с помощью которых можно внедрить в нейросети понимание структуры. В том числе обсудим недавние работы таких известных в области AI людей, как Джеффри Хинтон и Ян ЛеКун.

Начнем мы с понимания того, что вообще такое “структурное мышление” и почему люди им обладают:

+40

10K

2 3 ...

49 50

Обработка изображений *

Брюнетки против блондинок или как на мониторе показать цвет свечения светильника?

Новости

Распознавание вен ладони в задаче биометрической идентификации

Видеосъёмка из браузера. HTML-код, который включает камеру на смартфоне

Удивительное рядом

Бизнес — экосистема CarDamageTest. Как построить удобный сервис для автовладельцев?

Сжатие изображений при помощи модели Stable Diffusion

Введение

Архитектура платформы машинного обучения в продакшене

Автоматическая озвучка субтитров на YouTube с использованием компьютерного зрения

Калибровка камеры-imu с Kalibr

Similar images: API

ORB_SLAM3 на raspberry pi 4

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

Человек, маска и аватара. Не рано ли переходить на биометрическую идентификацию

SVTR — state-of-the-art нейросеть для задачи OCR

Где брать изображения в 2022 году

Как выбрать плату для Computer Vision в 2022

Руководство по Human Pose Estimation

Уроки компьютерного зрения. Оглавление

Шерудим под капотом Stable Diffusion

Структурное мышление или важное отличие человека от ИИ

Вклад авторов