Мы в Smart Engines занимаемся разработкой систем распознавания документов уже более 7 лет, предоставляя нашим клиентам уникальные алгоритмы, «завернутые» в локальные (on-premises) безопасные программные библиотеки, предназначенные для встраивания в клиентские информационные системы. Несмотря на то, что наш SDK крайне прост по части интеграции, предоставляет простое и эффективное API распознавания документов под разные языки программирования (включая даже Wasm), нас постоянно спрашивают о наличии у нас сервиса распознавания с WebAPI. В сегодняшней статье мы вам расскажем, почему же до сих пор мы не сделали такой веб-сервис. И даже не планируем его в обозримом будущем.
Искусственный интеллект
AI, ANN и иные формы искусственного разума
Новости
Введение в суррогатные модели. Часть 1: Актуальность и новизна
Представьте, что кто-то создал для нас очень детальную имитационную модель сложнейшей системы (спасибо!). Теперь нам её эксплуатировать, мы же проектировщики, так что поищем оптимальную конфигурацию (миллион комбинаций параметров), прогнав для каждой из них по миллиону экспериментов (погода, реакция всяких агентов и просто для накопления статистики...). И тут нас настигает понимание того, что задача будет решаться несколько недель. Потратить время на упрощение модели вручную, или задействовать машинное обучение?
ROS книги по робототехнике переведенные на русский язык
Robot Operating System это фреймворк который позволяет эффективно программировать современных роботов.
IBM z16 — первый мейнфрейм IBM для искусственного интеллекта
В прошлом веке предсказывали, что вся информация так или иначе будет храниться в облаке. Несмотря на продолжающийся переход к облаку, многие крупные мировые банки, страховые компании и телекоммуникационные гиганты полагаются на свои мейнфреймы. Большая часть этих мейнфреймов произведено в компании IBM.
В начале апреля 2022 года, IBM продемонстрировала новый мейнфрейм из линейки z — z16, который спроектирован на базе микрочипа Telum, выпущенного летом 2021 г. Согласно IBM, процессор оптимизирован для обработки 300 000 000 000 финансовых транзакций в сутки. z16 устойчив к квантовым компьютерам, способным взламывать шифрование, благодаря криптографической решётке и аппаратному модулю безопасности Crypto Express 8S (CEX8S).
Основное предназначение нового мейнфрейма является предотвращение кибермошенничества в реальном времени. Целевые клиенты, в первую очередь, финансовые компании, но z16 будет полезен для всех, кто обрабатывает огромные потоки необходимых для бизнеса транзакций.
Если вы устраняете систематическую ошибку модели, то уже слишком поздно
Введение
Машинное обучение — это технологический прорыв, случающийся раз в поколение. Однако с ростом его популярности основной проблемой становятся систематические ошибки алгоритма. Если модели ML не обучаются на репрезентативных данных, у них могут развиться серьёзные систематические ошибки, оказывающие существенный вред недостаточно представленным группам и приводящие к созданию неэффективных продуктов. Мы изучили массив данных CoNLL-2003, являющийся стандартом для создания алгоритмов распознавания именованных сущностей в тексте, и выяснили, что в данных присутствует серьёзный перекос в сторону мужских имён. При помощи наших технологии мы смогли компенсировать эту систематическую ошибку:
- Мы обогатили данные, чтобы выявить сокрытые систематические ошибки
- Дополнили массив данных недостаточно представленными примерами, чтобы компенсировать гендерный перекос
Модель, обученная на нашем расширенном массиве данных CoNLL-2003, характеризуется снижением систематической ошибки и повышенной точностью, и это показывает, что систематическую ошибку можно устранить без каких-либо изменений в модели. Мы выложили в open source наши аннотации Named Entity Recognition для исходного массива данных CoNLL-2003, а также его улучшенную версию, скачать их можно здесь.
Что в облике тебе моем: алгоритм, предсказывающий оценочные суждения лиц
Встречают по одежке, а провожают по уму. Не суди книгу по ее обложке. Внешность обманчива. Все эти расхожие выражения тем или иным образом относятся к умению человека строить предположения касательно другого человека на базе исключительно внешних факторов. Встретив незнакомца, мы предполагаем его характер, статус и даже интеллектуальные способности в зависимости от внешности, по большей степени в зависимости от черт и выражения лица. В этом нет ничего предосудительного, так как это чаще всего не совсем сознательный процесс. Но есть ли в таком «гадании» по лицам логика и насколько подобные суждения соответствуют действительности? Часто предположения относительно человека оказываются неверными, но сам факт их наличия является важным социальным аспектом. Ученые из Технологического института Стивенса (США) разработали алгоритм, способный имитировать оценку человека по его лицу, чтобы понять, какие предположения о том или ином человеке будут строить незнакомцы, базируясь только на внешности. Насколько точно алгоритм предсказывает суждения человека, какие предположения были построены, и как еще можно использовать этот алгоритм? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.
Искусственный интеллект и IoT-аналитика защищают людей и коал
SAS и Attentis способствуют улучшению мер реагирования на наводнения и пожары в условиях изменения климата.
Реальные примеры, как ИИ оптимизирует дизайн микросхем
Перегруженность интегральной схемы, где через отдельные участки проходит слишком много цепей (красным цветом)
Сегодня в РФ рассматриваются планы создать полноценную инфраструктуру для производства микросхем, организовать 300 дизайн-центров с штатом минимум по 100 профильных специалистов и запустить новые фабрики. В этой связи интересно посмотреть, какие методы ML используются в проектировании современной микроэлектроники. Что-то можно перенять для отечественных разработок.
Как мы распознавали птиц при помощи камер и искусственного интеллекта (часть 1)
Нейронные сети используются для множества задач, но слышали ли вы когда-нибудь про распознавание птиц? Мы – нет, поэтому возможность поработать над этим проектом очень нас захватила, а опыт по итогу оказался крайне интересным.
Птицы миллионы лет эволюционировали в сторону незаметности и слияния с окружающей средой, чтобы избежать хищников. Поэтому ученым и любителям птичек достаточно сложно искать птиц среди деревьев и кустарников. Но вот наблюдать за ними с помощью видеокамеры, не выходя из дома, — прекрасный способ, который сильно экономит время. Особенно если искусственный интеллект избавит пользователя от необходимости просматривать часы видеозаписей в поисках птиц, просто отправив уведомление на телефон, когда птица попала в поле зрения камеры. Более того, искусственный интеллект еще и автоматически определит её вид.
Друг или враг? Стоит ли бояться искусственного интеллекта?
Искусственный интеллект - это уже не сказка. Почему он уже превосходит человеческий мозг и какая правовая основа может защитить нас от неправомерных деяний с его стороны?
Голосовые ассистенты. Краткий обзор
Сегодня существуют множество текстовых каналов связи (почта, месседжеры, социальные сети и др.), но пользователь иногда отдает предпочтение обычному звонку для передачи большого количества информации. А что будет, если он не дозвониться? Как правило, он пытается позвонить еще раз. И если звонящему это не удается, то он может просто забыть передать необходимую информацию или передать ее со значительной задержкой.
И вот здесь на помощь приходит голосовой ассистент, который не только может пообщаться с абонентом, но и перевести его сообщение в текст и выслать конечному абоненту.
Конечно, данный инструмент нужен не всем, но если у человека высокая голосовая нагрузка или него расписан день по минутам, что нет времени на ответ на звонок, то голосовой ассистент – отличный помощник.
Сейчас абоненту мобильной связи доступны следующие голосовые ассистенты:
Модель-полиглот: как мы учили GPT-3 на 61 языке мира
Генеративные языковые модели уверенно обосновались в практике Natural Language Processing (NLP). Большие предобученные трансформеры двигаются сразу в трёх направлениях: мультимодальность, мультизадачность и мультиязычность. Сегодня мы расскажем про последнюю — о том, как учили модель на основе GPT-3 на 61 языке мира.
Это — самая многоязычная авторегрессионная модель на сегодня. Такую модель можно использовать, например, чтобы создать вопросно-ответную систему, обрабатывающую тексты на многих языках, научить диалогового ассистента говорить на разных языках, а также сделать более универсальные решения для парсинга текста, извлечения информации.
Этим релизом мы хотим привлечь внимание к развитию NLP для языков стран СНГ, а также народов России. Для многих из представленных языков эта модель стала первой авторегрессионной языковой моделью.
Модель доступна в двух вариантах размеров: mGPT XL на 1,3 миллиарда параметров — в открытом доступе, а mGPT 13B — будет доступна в ML Space SberCloud.
Распознавание документов в браузере вашего устройства
Привет Хабр! Те из вас, кто следит за нашими публикациями про мобильное распознавание документов, знает, что мы придерживаемся принципа распознавания документов только на самом устройстве. Модуль, который отвечает за распознавание и ввод данных, не должен быть уязвимее того, что он в моменте заменяет (а именно, клавиатуру). Наши технологии легко встраиваются в мобильные приложения, но что делать, когда необходимо реализовать веб-приложение с возможностями ИИ? Уступать принципам не приходится - на помощь приходит WebAssembly. Под катом мы расскажем, как мы портировали наши решения по распознаванию документов, банковских карт, баркодов, и всего остального, для использования в Wasm. Уверены, что вам будет интересно.
Как ИИ помогает улучшать чипы: отчёт Nvidia
Для весенней конференции GTC стал доброй традицией рассказ об исследованиях и разработках Nvidia главного научного сотрудника и старшего вице-президента по исследованиям Билла Дэлли. Он поделился тем, как устроен отдел исследований и разработок Nvidia, а также немного рассказал о текущих приоритетах. В этом году Дэлли в основном занимался AI-инструментами, которые Nvidia и разрабатывает, и использует для совершенствования собственных продуктов. Например, Nvidia начала использовать ИИ для эффективного улучшения и совершенствования процесса проектирования GPU.
Как проект CAMS обнаруживает долгопериодические кометы с помощью машинного обучения
Миллионы лет назад столкновение Земли с космическим объектом диаметром около 10 км привело к вымиранию динозавров. Поэтому сегодня людям хочется как можно раньше узнавать о приближении долгопериодических комет (ДКП), представляющих значительный риск для экосферы Земли. Для этого был создан CAMS — проект, предназначенный для наблюдения за всем небом с целью обнаружения признаков комет. Рассказываем, как это работает.
Интеллект и все все все…
Искусственный интеллект (ИИ). Это словосочетание стало обыденным не только для фантастов и профессионалов.
Первые люди государства, бизнеса, науки говорят о важности этого направления (и о большой его опасности) для будущего всего человечества. Как следующий его шаг.
В это направление вкладываются огромные ресурсы, во всю кипит работа по его созданию, совершенствованию, внедрению в различные области человеческого бытия и сознания.
И нам его обещают не "когда-нибудь", а уже "вот-вот", при нашей жизни, лет через 10 - 20 (но это не точно). И предрекают принципиальные изменения всей нашей дальнейшей истории.
Множество статей на этом сайте посвящено именно ему.
Но есть ли у нас ясное, наглядное и простое понимание того, ЧТО такое интеллект, где, в чём он "находиться", откуда он взялся, из чего "состоит", зачем нужен, как "изменяется" и "работает"?
В чем его отличие например от инстинкта, "я", ума, разума, гениальности, эрудиции, интуиции, мудрости..? (и ЧТО значат, откуда взялись, как соотносятся эти термины? попробуйте ответить сейчас сами).
Как ИИ может (или не сможет, или (не)должен) получить "я", стать сознательным (и что это такое), а потом может и одушевленным и одухотворенным (а это что и как?)?
Зачем (цель) и почему (причины) мы его создаём и именно сейчас?
И, может быть главное - как создать искусственный интеллект не мертворождённым, неадекватным и смертоносным, а жизнеспособным и чело-вечным? Естественным.
Да уж, вопросы из серии ответа "42!", известного из фантастической книги "Автостопом по галактике" Д.Адамса.
Но проблема-то не фантастическая, она существует реально, "прямо сейчас", может оказать влияние на будущее всего человечества - бросая вызов человеческой цивилизации, нашему разуму.
Датацентрический и моделецентрический подходы в машинном обучении
Код и данные — фундамент ИИ-системы. Оба эти компонента играют важную роль в разработке надёжной модели, но на каком из них следует сосредоточиться больше? В этой статье мы сравним методики, ставящие в центр данные, либо модель, и посмотрим, какая из них лучше; также мы поговорим о том, как внедрять датацентрическую инфраструктуру.
Нейронная сеть считает лес кругляк и распознает автомобильные номера. Как это сделано?
В статье покажем, как алгоритмы компьютерного зрения помогают решить задачу автоматического определения объема круглого леса в лесовозе по фотографии. Пройдем путь от идеи до прототипа. Расскажем, какие были выбраны решения и почему.
Необходимая подготовка читателя — должно быть общее представление о компьютерном зрении (computer vision) и нейронных сетях. Здесь не будет описаний, что такое сверточная нейронная сеть и т.п., статей по таким основам найдете много на хабре (вот хорошая Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей). В то же время, совсем новички могут получить представление, какие знания и компетенции нужны для решения подобных задач.
Как мы научили ИИ смотреть кино
Привет, Хабр! Меня зовут Алексей Мельников, я продакт онлайн-кинотеатра KION, который МТС запустил в апреле прошлого года. Отвечаю за направление искусственного интеллекта (ИИ) в продукте. В этой статье я расскажу о том, как работает фича пропуска титров и заставок в онлайн-кинотеатрах и поделюсь личным опытом привлечения ИИ к этому делу.
ИИ для прогнозирования тренда стоимости Bitcoin на данных Twitter. ч.1
В этой статье я расскажу о первой серии экспериментов для проверки гипотезы влияния данных Twitter на тренд стоимости Bitcoin. Цель не угадать ценник, а предсказать рост, убывание или относительную неизменность цены
Вклад авторов
-
alizar 3980.6 -
marks 2200.4 -
3Dvideo 1046.0 -
BarakAdama 662.0 -
AlexeyR 597.0 -
ZlodeiBaal 550.0 -
Pochtoycom 523.8 -
ivansychev 503.7 -
Syurmakov 448.0 -
rg_software 412.0