Smart Engines, Москва - Обработка изображений, распознавание в видеопотоке / Статьи / Хабр

Как стать автором

Профиль Блог 101 Новости 14 Подписчики 322 Сотрудники 2

SmartEngines 1 июн в 14:38

Как Тинькофф применяет нейросети российского разработчика OCR

Простой

5 мин

1.3K

Блог компании Smart Engines Машинное обучение *Искусственный интеллект Финансы в IT Будущее здесь

Кейс

Раскрываем три кейса о том, как технологии распознавания паспорта, банковских карт и QR‑кодов помогают Тинькофф решать задачи на фоне быстрого роста числа клиентов — с 5 млн в 2016 до 30 млн человек сегодня.

Читать далее

+6

SmartEngines 29 мая в 12:38

Новейшая технология КТ — измерения под контролем реконструкции

Средний

6 мин

1K

Блог компании Smart Engines Алгоритмы *Обработка изображений *Искусственный интеллект

Привет, Хабр! Каждому из нас хотя бы однажды было интересно заглянуть внутрь какого-либо объекта, не разрушая его, не так ли? И на сегодняшний день это представляется возможным благодаря одному из методов неразрушающего анализа внутренней структуры объекта - методу компьютерной томографии (КТ), подробнее о котором уже мы писали в статье. Первое, что приходит на ум, когда мы слышим термин КТ: “... что-то из медицины, какое-то исследование ...”. К удивлению многих, КТ не менее успешно применяется и в области промышленности, и в области научных исследований, и даже в области таможенного контроля.

Тут мы расскажем о нашей новой разработке, которая одновременно решает два из наиболее обсуждаемых аспектов в области КТ: как снизить дозу облучения и как сократить время томографического эксперимента? Первый имеет огромную важность для медицины, а второй – для индустрии. В нанотомографии, например, время эксперимента может достигать десятков часов. В статье мы покажем результаты, которых достигли в ходе экспериментов по исследованию разработанного нами подхода.

Читать далее

+2

SmartEngines 25 мая в 12:28

Миссия выполнима: как Smart Engines обучила нейросеть распознавать все страницы паспорта РФ и находить подделки

Простой

8 мин

12K

Блог компании Smart Engines Обработка изображений *Машинное обучение *Искусственный интеллект

Ретроспектива

Восемь лет упорного труда, немного удачи и ... девять из тринадцати крупнейших банков России наши клиенты. В этой статье мы расскажем, как мы решили задачу распознавания (даже в темноте) и проверки подлинности паспорта и почему корпорации теперь отказываются от ручного ввода данных (спойлер: чтобы не утекли).

Читать далее

+20

SmartEngines 15 мая в 14:21

Как быстро вычисляются логарифм и экспонента в компьютере?

7 мин

3.1K

Блог компании Smart Engines Алгоритмы *Математика *

Сегодняшняя статья посвящена методам быстрого приближенного вычисления двоичного логарифма и экспоненты/степеней двойки. Не все задумывались, как именно реализовано вычисление нелинейных математических функций в компьютере, который вообще-то умеет складывать и умножать, но не вычислять синусы или гиперболические тангенсы. Из ~~школьных~~ институтских времен вспоминаются ряды Тейлора, приближающие функцию полиномом в окрестности заданной точки, или интерполяционные полиномы Лагранжа, но как добиться действительно высокой точности приближения? А можно ли эти имплементации ускорить? Постараемся сегодня приоткрыть завесу тайны.

Читать далее

+17

SmartEngines 5 мая в 17:34

Как с помощью нейронной сети снизить дозу КТ, не потеряв в качестве реконструкции

Средний

5 мин

1.3K

Блог компании Smart Engines Алгоритмы *Обработка изображений *Машинное обучение *

Привет, Хабр! Всем известно, что чрезмерное использование рентгеновских лучей негативно влияет на здоровье человека. Однако метод компьютерной томографии очень востребован, так как позволяет неинвазивно визуализировать изображение внутренней структуры человеческого тела. Поэтому задача снижения дозы в методе КТ возникла с момента введения в эксплуатацию первых сканеров. Существует множество методов снижения дозы излучения, получаемой пациентом, но, к сожалению, все они ведут к снижению диагностических качеств реконструированных изображений. Мы разработали метод снижения дозы излучения за счет снижения числа проекций, который сохраняет качество реконструированного изображения. Теоретически обоснованный метод базируется на применении нейронных сетей, показывает хорошее качество реконструкций, а быстродействие метода достигается за счет использования легковесной нейронной сети. Качество работы метода демонстрируется на открытом датасете с результатами томографии грудной клетки человека. Обо всем этом мы и расскажем в данной статье.

Читать далее

+14

SmartEngines 1 мая в 11:29

Фруктография: взгляд изнутри

Простой

2 мин

3.3K

Блог компании Smart Engines Обработка изображений *Софт

Всем привет!

На носу майские праздники, и некоторые из нас отправятся в добровольно-принудительном порядке на дачи открывать огородный сезон, чтобы через несколько месяцев собрать урожай. Для того чтобы скрасить процесс ожидания урожая мы хотим показать нашу коллекцию томограмм овощей и фруктов, которую мы собрали в этом году.

В детстве многие из нас пытались понять, что внутри различных предметов с помощью лупы. Некоторым повезло больше, и у них был микроскоп, в который рассматривали жучков, паучков и чешуйки лука. Но нам повезло еще больше, и у нас появилась возможность посмотреть внутрь различных предметов с помощью микротомографа.

Часто так получается, что в томограф первым делом засовывают микросхему или насекомое. Об этом мы тоже рассказывали на примере исследования CPU Pentium 4 и майского жука.

Но однажды во время обеденного перерыва один из наших исследователей засунул в томограф яблоко, которое принёс с собой на перекус, реконструировал и отрисовал в нашем новом визуализаторе, часть программы STE 2.0, и получилось красиво.

А потом понеслось. Народ стал приносить овощи/фрукты и просил посмотреть, что там внутри. Конечно, можно просто порезать ножом, но это же не технологично и скучно. А тут ещё и повод протестировать реконструктор и визуализатор. Результатами полученных трехмерных реконструкций мы и хотим поделиться с вами.

Читать далее

+22

SmartEngines 27 апр в 12:57

Распознавание банковских карт в видеопотоке в браузере с помощью SmartEngines и WebAssembly

Средний

5 мин

2.1K

Блог компании Smart Engines Разработка веб-сайтов *Обработка изображений *Искусственный интеллект WebAssembly *

Туториал

С активным развитием и распространением технологии WebAssembly (сокращённо WASM) появилась возможность создавать веб-модули, которые можно загружать с сервера и исполнять их прямо в браузере! Мы не смогли пройти мимо такой возможности, и, после долгих оптимизаций, представили свой модуль, умеющий распознавать банковские карты, баркоды, машиночитаемые зоны, номера телефонов и документы прямо в браузере.

Дальше мы расскажем о том, как с помощью wasm-модуля от Smart Engines распознать номер банковской карты, просто поднеся её к веб-камере ноутбука.

Читать далее

+8

SmartEngines 12 апр в 09:51

AI, остановись! Может ли искусственный интеллект остановить сам себя?

4 мин

1K

Блог компании Smart Engines Алгоритмы *Искусственный интеллект

Привет хабр! Как вы знаете, мы в Smart Engines много занимаемся распознаванием на мобильных устройствах, где обрабатываем кадры видеопотока в реальном времени. Почти три года назад мы писали о том, что в подобных системах возникает крайне интересная задача - принятие решение о том, что захват кадров можно прекратить и текущий результат распознавания принять за окончательный. В той статье мы рассказали о достаточно простом, но эффективном, подходе для решения этой задачи, который смотрит на нее как на монотонную задачу остановки. Сегодня мы расскажем вам о другом подходе к этой задаче, рассматривающем ее как задачу классификации.

Если вам интересно узнать как обучить простой классификатор, узнающий удачный момент для остановки процесса распознавания, и вы уже успели простить нас за кликбейтный заголовок, добро пожаловать под кат!

Читать далее

0

SmartEngines 16 мар в 13:09

Распознайте это немедленно

Средний

11 мин

1.4K

Блог компании Smart Engines Машинное обучение *Искусственный интеллект

Качественным, быстрым, устойчивым - именно таким должен быть распознаватель!

Всем привет! Распознаватель строки - элемент системы распознавания, о котором в первую очередь подумает обыватель, услышав о распознавании документов. А учитывая нынешний хайп вокруг нейронных сетей многим обязательно представится какая-то магия, замешанная на трансформерах и рекуррентности. Однако, как известно, магия вне Хогвартса запрещена и может быть опасна. Так что сегодня хотим рассказать, почему мы не используем рекуррентность и трансформеры в нашей системе и как же мы всё-таки получаем высокое качество. И приведем несколько замеров.

+5

SmartEngines 7 мар в 14:20

Smart Tomo Engine 2.0. Выход на новый уровень

Средний

7 мин

2.1K

Блог компании Smart Engines Алгоритмы *Обработка изображений *Софт Искусственный интеллект

Обзор

В сегодняшней статье речь пойдет о Smart Tomo Engine 2.0 – новой версии нашего продукта реконструкции трехмерных объектов из набора их томографических проекций (рентгенограмм). По сравнению с предыдущей версией у новой выше качество получаемых изображений, существенно повышено быстродействие, улучшена технологическая совместимость с программами анализа трехмерных данных и с различными видами томографов. Заходите под кат, чтобы увидеть работу новой версии STE на примере реконструкции цветов (в честь Международного женского дня).

Читать далее

+18

SmartEngines 28 фев в 14:51

Распознавание корпоративных документов: как не утонуть в море бумаг?

7 мин

1.9K

Блог компании Smart Engines Обработка изображений *Искусственный интеллект Подготовка технической документации *

Обзор

Мы подсчитали, что ручной ввод данных из типовых форм занимает 6–7 часов в день. Автономная система Smart Document Engine на смартфоне справляется с подобной задачей буквально за минуты. В этой статье мы расскажем о самых эффективных бизнес‑кейсах применения нашей мобильной OCR.

Читать далее

+2

SmartEngines 8 фев в 09:42

DLC-2021, или Жулик, не воруй

4 мин

1.5K

Блог компании Smart Engines Обработка изображений *Открытые данные *Машинное обучение *Искусственный интеллект

Всем привет! Мы в Smart Engines занимаемся распознаванием документов и часто об этом рассказываем, а еще мы часто публикуем результаты наших исследований в научных статьях и докладах. В результатах за прошлый год мы упомянули, что создали два открытых датасета. Совсем недавно мы писали о созданном нами наборе данных MIDV-2020. Теперь настало время DLC-2021. Ну что, поехали?

+5

SmartEngines 2 фев в 13:45

MIDV-2020: как мы создали крупнейший датасет документов, удостоверяющих личность

8 мин

2.7K

Блог компании Smart Engines Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект

Ретроспектива

В этой статье мы хотим рассказать как мы создали крупнейший на данный момент набор искусственно созданных документов с большим разнообразием типов документов, их содержания и условий съемки. Каждый из документов имеет уникальные (хоть и выдуманные) значения текстовых полей, уникальную подпись и уникальные искусственно созданные лица.

Читать далее

+4

SmartEngines 31 янв в 14:57

Встраиваем распознавание документов от Smart Engines куда угодно за пять минут

15 мин

1.7K

Блог компании Smart Engines Python *Программирование *Машинное обучение *Искусственный интеллект

Туториал

Привет!

Мы Smart Engines, многие годы занимаемся созданием ПО для распознавания документов, удостоверяющих личность, гибких форм, банковских карт, штрихкодов и так далее - всего более двух с половиной тысяч различных документов. С помощью нашего ПО клиенты решают самые разные задачи с различными сценариями использования (сканирование штрихкодов и банковских карт в мобильных приложениях и вебе, автоматизация заполнения шаблонов на основе распознанных ДУЛ, распознавание паспорта РФ). За всё время мы тысячу раз сталкивались с запросом “дайте какое-нибудь простое решение с API, которым нам можно было бы пользоваться”. Дело, конечно, хорошее, но функциональность у нашей системы очень богатая. Единый API, который подходил бы всем нашим заказчикам со своими разными задачами и разными сценариями использования, был бы переусложнен. В этой статье мы покажем пример того, как с помощью Docker, Python и нашего SDK самому реализовать простейшее решение для распознавания документов.

Читать далее

+3

SmartEngines 25 янв в 12:58

Итоги года Smart Engines: 65 научных работ и выручка свыше 400 млн рублей

11 мин

1.4K

Блог компании Smart Engines IT-компании

Ушедший 2022 год стал для многих компаний в некотором смысле испытанием: после успешной «перестройки» бизнес-процессов, спровоцированной COVID-19, пришлось экстренно адаптироваться к новой реальности. Несмотря на возникшую турбулентность, мы в Smart Engines хорошо поработали и достигли отличных результатов как в технологиях и науке, так и в бизнесе. Даже об экологии не забыли. За деталями - заглядывайте под кат.

Читать далее

+4

SmartEngines 17 янв в 12:04

Как нейросети обманывают врачей

7 мин

10K

Блог компании Smart Engines Алгоритмы *Математика *Искусственный интеллект Физика

Волна нейросетевых инноваций дошла и до компьютерной томографии (КТ), что в целом неудивительно, учитывая количество задач анализа изображений в КТ и бурный рост области применения методов машинного обучения. Тут и задачи сегментации (например, выделение опухолей, визуализация), и анализ изображения (детекция COVID-19), и даже повышение точности реконструкции. При этом если первые два случая применения нейронных сетей являются консультирующим инструментом для врача и никак не изменяют изображение, то использование нейросетей для получения реконструкции из исходных данных может представлять реальную опасность. Так нейронная сеть может стереть или дорисовать важные для диагностики здоровья пациента детали на реконструированном изображении и ввести врача в заблуждение. В данной статье мы расскажем где и зачем применяются нейронные сети в томографии, об аппаратных атаках на них и постараемся количественно оценить безопасность применения инструментов машинного обучения в компьютерной томографии.

Читать далее

+17

SmartEngines 5 сен 2022 в 13:06

Как мы помогли Альфа-Банку выйти из трудного положения с помощью WASM

4 мин

8.4K

Блог компании Smart Engines Разработка веб-сайтов *Машинное обучение *Искусственный интеллект WebAssembly *

Привет, Хабр! Раньше мы уже рассказывали о распознавании документов прямо в браузере и технологии WebAssembly (или WASM), которая позволяет это делать. Теперь давайте разберем, как и где это работает в реальной жизни.

Читать далее

+9

SmartEngines 23 июн 2022 в 09:26

Простой шаблонизатор DOCX-документов с помощью Smart Document Engine

10 мин

3.6K

Блог компании Smart Engines Python *Программирование *Обработка изображений *Искусственный интеллект

Мы в Smart Engines занимаемся системами распознавания документов, и мы решили проверить, сколько нужно времени, чтобы создать MVP инструмента, позволяющего предзаполнять типовые шаблоны в формате DOCX данными, извлекаемые из сканов и фотографий документов. В этой статье мы вам покажем как на базе нашей системы распознавания Smart Document Engine быстро сделать простой шаблонизатор, готовый к использованию и не требующий никакой предварительной подготовки пользователя. Кому интересно - добро пожаловать под кат!

Читать далее

+4

SmartEngines 29 апр 2022 в 12:50

Почему мы до сих пор не сделали сервис распознавания

7 мин

2.4K

Блог компании Smart Engines Облачные сервисы *Искусственный интеллект

Мы в Smart Engines занимаемся разработкой систем распознавания документов уже более 7 лет, предоставляя нашим клиентам уникальные алгоритмы, «завернутые» в локальные (on-premises) безопасные программные библиотеки, предназначенные для встраивания в клиентские информационные системы. Несмотря на то, что наш SDK крайне прост по части интеграции, предоставляет простое и эффективное API распознавания документов под разные языки программирования (включая даже Wasm), нас постоянно спрашивают о наличии у нас сервиса распознавания с WebAPI. В сегодняшней статье мы вам расскажем, почему же до сих пор мы не сделали такой веб-сервис. И даже не планируем его в обозримом будущем.

Читать далее

+2

SmartEngines 21 апр 2022 в 10:00

Распознавание документов в браузере вашего устройства

6 мин

2.7K

Блог компании Smart Engines Программирование *Машинное обучение *Искусственный интеллект WebAssembly *

Привет Хабр! Те из вас, кто следит за нашими публикациями про мобильное распознавание документов, знает, что мы придерживаемся принципа распознавания документов только на самом устройстве. Модуль, который отвечает за распознавание и ввод данных, не должен быть уязвимее того, что он в моменте заменяет (а именно, клавиатуру). Наши технологии легко встраиваются в мобильные приложения, но что делать, когда необходимо реализовать веб-приложение с возможностями ИИ? Уступать принципам не приходится - на помощь приходит WebAssembly. Под катом мы расскажем, как мы портировали наши решения по распознаванию документов, банковских карт, баркодов, и всего остального, для использования в Wasm. Уверены, что вам будет интересно.

Читать далее

+6

1