|
|
Томита-парсерТомита-парсер – это инструмент для извлечения структурированных данных (фактов) из текста на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов. Парсер позволяет написать свою грамматику, добавить свои словари и запустить на текстах. Примеры фактов, которые можно извлекать:дата рождения человека (Ричард Гир родился 31 августа 1949 года); родственные связи (Ричард Гир женат на Кэри Лоуэлл); исполнение ролей в фильмах (Ричард Гир - звезда фильма "Красотка"); адреса организаций (Офис Яндекса находится на улице Льва Толстого дом 16), и другие. Томита-парсер используется в подготовке данных для различных сервисов Яндекса, таких как Яндекс.Новости или Яндекс.Работа. Как начать писать грамматики:1
Прочитайте пользовательское соглашение. 2
Скачайте парсер для вашей операционной системы и стартовые файлы. 3
Ознакомьтесь с быстрым стартом. 4
Изучите руководство разработчика. |
Работайте в Яндексе |
© 2008—2013 «Яндекс»
|