Результаты поиска по запросу «[natural language processing]» / Хабр

Публикации Хабы Компании Пользователи Комментарии

maybe_elf 26 сен 2022 в 10:53

OpenAI открыла код системы распознавания речи Whisper

2 мин

6.9K

Open source*Машинное обучение*Искусственный интеллектЗвукNatural Language Processing*

OpenAI опубликовала исходный код системы распознавания речи Whisper. Открыты код эталонной реализации на базе фреймворка PyTorch и набор уже обученных моделей для использования под лицензией MIT.

maybe_elf 25 сен 2021 в 12:44

OpenAI выпустила нейросеть, которая кратко пересказывает книги

2 мин

22K

Алгоритмы*Машинное обучение*Искусственный интеллектNatural Language Processing*

В OpenAI представили нейросеть на основе GPT-3, которая способна генерировать краткие изложения книг. Разработчики отмечают, что подобные модели нужны для контролируемого масштабирования систем искусственного интеллекта. Работа данной нейросети покажет, насколько она справляется с работой, которую. обычно выполняют люди.

+10

maybe_elf 28 янв 2022 в 11:53

OpenAI заставила GPT-3 вести себя лучше и выполнять инструкции

2 мин

3.7K

API*Искусственный интеллектNatural Language Processing*

OpenAI заявила, что обучила свою языковую модель GPT-3 следовать инструкциям, благодаря чему она выдает меньше нежелательного текста.

maybe_elf 27 окт 2021 в 10:09

Исследование: мозг понимает язык с помощью «автокоррекции»

2 мин

4.4K

Машинное обучение*Искусственный интеллектМозгNatural Language Processing*

Исследователи Массачусетского технологического института применили модели искусственного интеллекта для изучения того, как и почему наш мозг понимает язык. Выяснилось, что человеческий мозг может работать примерно так же, как и функция автокоррекции на смартфоне.

maybe_elf 4 апр 2023 в 11:17

Bloomberg выпустило чат-бота для финансового рынка BloombergGPT

2 мин

3.7K

Машинное обучение*Управление медиа*Искусственный интеллектФинансы в IT

Агентство Bloomberg представило чат-бота BloombergGPT. Это большая языковая модель с 50 млрд параметров, созданная для финансового рынка. Модель обучена работе с широким спектром данных и поддерживает выполнение разнообразных задач обработки естественного языка в финансовой отрасли.

maybe_elf 19 ноя 2021 в 12:57

Украинский стартап Grammarly оценили в $13 млрд

1 мин

10K

Развитие стартапаБизнес-модели*Финансы в ITNatural Language Processing*

Основанная выходцами из Украины IT-компания Grammarly, которая разработала онлайн-сервис улучшения бизнес-текстов на английском языке, привлекла еще $200 млн. Таким образом. ее общая оценка достигла $13 млрд.

+17

Christina29 26 ноя 2021 в 11:25

One Day Offer для Data Scientists: приглашаем экспертов в команду SberDevices

3 мин

Блог компании SberDevicesМашинное обучение*Карьера в IT-индустрииИскусственный интеллектNatural Language Processing*

Мы продолжаем встречи с соискателями в формате “One Day Offer”, в результате которых можно получить предложение работы за один день. В этот раз приглашаем датасайентистов уровня Middle+/Senior.

Всё будет происходить онлайн, 4 декабря (это выходной) с 11:00 до 20:00. Для участия нужно зарегистрироваться, отправив заявку по адресу: [email protected].

Несколько слов о SberDevices. Наша команда создаёт современные модели обработки естественного языка (Natural Language Processing), речевые технологии, алгоритмы компьютерного зрения, разрабатывает системы биометрии, модели для генерации медиаконтента и даже нейроинтерфейсы. Мы используем последние разработки в области искусственного интеллекта и машинного обучения и очень любим работать с большими генеративными моделями. Впереди у нас ещё много интересных задач!

Итак, какие же команды нанимают в этот раз:

SmartNLP Team— выстраивает core-систему обработки естественного языка. Все запросы к виртуальным ассистентам Салют проходят через неё. Наш сервис реализует весь стек технологий NLP: от предобработки текста и выделения сущностей до определения намерения пользователя и вызова соответствующего навыка. В этом нам помогают собственные разработки в области Representation Learning, Metric Learning и Natural Language Understanding. О некоторых наших подходах можно почитать здесь, здесь и здесь.

Читать дальше →

maybe_elf 12 дек 2021 в 13:33

DeepMind утверждает, что ее языковая модель на 280 млрд параметров превосходит аналоги в 25 раз крупнее

3 мин

Машинное обучение*Искусственный интеллектNatural Language Processing*

AI-лаборатория DeepMind опубликовала три исследовательские работы, посвященные возможностям больших языковых моделей. Компания пришла к выводу, что дальнейшее масштабирование этих систем должно привести к множеству улучшений.

just_ai 15 ноя 2023 в 14:46

Обучение трансформеров, зоопарк ML-моделей, RAG-подходы, железо для LLM и другие темы на Conversations 2023

2 мин

1.6K

Блог компании Just AIМашинное обучение*КонференцииИскусственный интеллектГолосовые интерфейсы*

8 декабря в Москве и в онлайн-формате состоится Conversations – ежегодная конференция по разговорному, а теперь и генеративному AI для разработчиков и бизнеса.

Вызовы и достижения разработки LLM, диалоговые платформы и новые фреймворки, инфраструктура для запуска LLM, нейросетевая обработка и модели распознавания речи, обучение трансформеров, RAG-подходы и многое другое в лайнапе Conversations в этом году.

Вас ждет экспертиза от команд GigaChat и YaGPT, ВКонтакте, Selectel, MTS AI, Лаборатория Касперского, Тинькофф, Zerocracy, Yandex Cloud, Boto, 3itech и других. Для подогрева интереса делимся некоторыми подробностями докладов, а еще промокодом на скидку!

AnnieBronson 13 янв 2021 в 14:38

Исследователи выяснили, что системы ИИ не различают предложения с перемешанными словами

2 мин

3.7K

Машинное обучение*Искусственный интеллект

Исследователи из Обернского университета пришли к выводу, что многие ИИ, предназначенные для обработки естественного языка (Natural Language Processing, NLP), не замечают, когда слова в предложении перемешиваются, а его значение меняется. Это показывает, что ИИ на самом деле не понимают язык, и создает проблемы в обучении систем NLP.

+12

Travis_Macrif 10 фев в 09:00

В рамках реструктуризации платформа Grammarly увольняет 230 сотрудников

1 мин

1.7K

Развитие стартапаУправление персоналом*Карьера в IT-индустрииИскусственный интеллектNatural Language Processing*

Платформа для помощи в общении на английском языке на базе искусственного интеллекта Grammarly объявила о сокращении 230 сотрудников в рамках реструктуризации. В компании объяснили, что увольнения станут частью инициативы по увеличению внимания «к созданию рабочих мест с поддержкой ИИ».

dumonten 3 авг в 08:17

OpenSource на поле против OpenAI: Function Calls здесь и сейчас для самых маленьких… ресурсов

Средний

12 мин

2.7K

Open source*Программирование*Машинное обучение*Искусственный интеллектNatural Language Processing*

Из песочницы

Вызов функций на локально развернутых LLM возможен. Прочитайте статью и узнайте, как это можно реализовать и насколько хорошо это работает!

dmitrybugaychenko 18 мая 2018 в 10:31

Обработка текстов на естественных языках

30 мин

32K

Блог компании VKData Mining*Машинное обучение*Natural Language Processing*

Сегодня мы затрагиваем такую интересную тему, как естественные языки. Сейчас в эту область вкладываются очень большие деньги и в ней решают немало разнообразных задач. Она привлекает внимание не только индустрии, но и научного сообщества.

Читать дальше →

+34

primetalk 4 ноя 2014 в 18:32

Строго типизированные комбинаторы для построения парсера и синтезатора естественного языка

13 мин

Блог компании ПраймтолкРегулярные выражения*Scala*Natural Language Processing*

Известные ParserCombinator'ы и Parboiled предназначены исключительно для разбора формальных языков. Мы же решаем задачу разбора естественного языка и при этом хотим, чтобы с помощью той же грамматики можно было осуществлять синтез фраз на естественном языке, отражающих требуемую нам семантику. Было бы удобно иметь возможность описывать языковые конструкции вместе с правилами абстрагирования/конкретизации.

Например,

Преобразование числительных в число («десять» -> 10:Int)
и обратно (10:Int -> «десять» («десятый», «десяток» ...))
Преобразование числительных вместе с единицей измерения («десять рублей» <-> NumberWithMeasurement(10, RUB))
Неполный адрес («ул. Яблочная» <-> Address(street=«Яблочная»))
Адрес в пределах города («улица Яблочная дом сто двадцать три квартира сорок пять» <-> Address(street=«Яблочная», building=123, flat=45))
Телефон (256-00-21 («двести пятьдесят шесть ноль ноль двадцать один») <-> NumericalSequence(256,0,0,21))

Причём хотелось бы иметь следующие системные свойства:

единственность описания правил абстрагирования/конкретизации
строго типизированное представление семантики на всех уровнях абстракции
наличие альтернативных форм представления семантики и возможность повлиять на выбор формы представления семантики
согласование словоформ для получения фразы на чистом русском языке
возможность формирования вторичных структур на основе исходных правил. В частности, мы бы хотели формировать грамматики разбора, соответствующие правилам.

Под катом — описание подхода, реализованного в библиотеке synapse-typed-expressions. Рассмотрены только числительные, но подход естественным образом распространяется на другие вышеупомянутые формальные языковые конструкции.

Читать дальше →

+12

b0noII 1 ноя 2014 в 17:09

Разбитие текста на предложения лингво-независимым методом на примере библиотеки AIF

9 мин

16K

Java*Data Mining*Natural Language Processing*

В прошлой статье мы уже рассказывали о новой NLP библиотеке. Однако тогда мы рассказали «обовсем» и не о чем конкретном. Сегодня мы поговорим о теоретических аспектах разбития предложения на токены лингво-независимыми алгоритмами. Теоретические выкладки будут подкреплены практической реализацией в библиотеке AIF. Поехали…

Читать дальше →

+19

morfeusys 10 ноя 2014 в 23:27

SpeechMarkup API — превращаем речь в данные

8 мин

18K

Веб-разработка*Программирование*API*

В статье пойдет речь о том, как из любого запроса на естественном языке получить реальные данные, с которыми может работать ваше приложение. А именно, о REST API сервиса SpeechMarkup, который преобразует обычную строчку текста в JSON со всеми найденными смысловыми сущностями с конкретными данными в каждой из них.

Да-да, это та самая технология, которая лежит в основе любого голосового ассистента и используется в поисковиках.
Она позволяет однозначно интерпретировать запрос, а затем вернуть вашему приложению результат в виде обычного набора данных.

В статье я расскажу, для чего можно использовать данный API и приведу небольшой пример работающего приложения.

Читать дальше →

+25

vasyaabr 21 ноя 2014 в 11:54

Извлечение данных из фотохостинга

6 мин

23K

C#*Открытые данные*

Из песочницы

Наткнулся однажды на этот пост и мне подумалось — раз у нас есть такая прекрасная, полностью открытая галерея частных данных (Radikal.ru), не попытаться ли извлечь из нее эти данные в удобном для обработки виде? То есть:

Скачать картинки;
Распознать текст на них;
Выделить из этого текста полезную информацию и классифицировать ее для дальнейшего анализа.

И в результате, после нескольких вечеров, работающий прототип был сделан. Много технических деталей:

Читать дальше →

+19

worksolutions 1 июн 2020 в 12:08

Подборка статей о машинном обучении: кейсы, гайды и исследования за май 2020

3 мин

3.9K

Машинное обучение*Искусственный интеллектTensorFlow*

Продолжаем собирать для вас самые интересные новости и инструменты из области машинного обучения, написанные на доступном языке.

Читать дальше →

+11

ViArt 2 дек 2014 в 12:16

InterSystems iKnow. Часть вторая. Создание простого домена

11 мин

3.7K

Блог компании InterSystemsВеб-разработка*Data Mining*

Туториал

Это продолжение моего рассказа про Natural Language Processing технологию Intersystems iKnow, начало здесь. Во второй части вы найдете описание практической работы с iKnow. Мы создадим домен, настроим его, загрузим текст. Затем, посмотрим и проанализируем результаты. Подробнее об этом под катом…

Читать дальше →

ContentAI_Team 9 июн 2020 в 12:58

«Диалог» компьютерных лингвистов и специалистов по анализу данных впервые пройдет онлайн и бесплатно

4 мин

2.1K

Блог компании Content AIМашинное обучение*КонференцииNatural Language Processing*

Текущая ситуация в мире не повод останавливать диалог, особенно если его можно вести онлайн. С 17 по 20 июня состоится 26-ая Международная научная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог». В этот раз она пройдет онлайн и будет бесплатной. Много лет основным организатором конференции выступает ABBYY: мы заинтересованы в развитии компьютерной лингвистики, обработки естественного языка (Natural Language Processing, NLP) и проведении исследований в этих областях. Подробнее о том, что такое «Диалог» и зачем он нужен, мы уже говорили на Хабре.

Сегодня расскажем об интересных событиях, которые запланированы на предстоящей конференции: докладах, темах дискуссий и трех технологических соревнованиях в рамках Dialogue Evaluation – по извлечению семантических отношений из деловых текстов, автоматическому поиску гиперонимов и морфосинтаксическому анализу текстов. Поехали!

Читать дальше →

+15

2 3 ...

9 10