ВебмастерМетрикаВиджетыРекламная сетьДиректПоиск для сайтаAPI
Войти

Томита-парсер

Томита-парсер – это инструмент для извлечения структурированных данных (фактов) из текста на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов. Парсер позволяет написать свою грамматику, добавить свои словари и запустить на текстах.

Примеры фактов, которые можно извлекать:

  • дата рождения человека (Ричард Гир родился 31 августа 1949 года);

  • родственные связи (Ричард Гир женат на Кэри Лоуэлл);

  • исполнение ролей в фильмах (Ричард Гир - звезда фильма "Красотка");

  • адреса организаций (Офис Яндекса находится на улице Льва Толстого дом 16), и другие.

  • Томита-парсер используется в подготовке данных для различных сервисов Яндекса, таких как Яндекс.Новости или Яндекс.Работа.

    Как начать писать грамматики:

    2

    Скачайте парсер для вашей операционной системы и стартовые файлы.

    3

    Ознакомьтесь с быстрым стартом.