В данной статье рассматривается применение специального языка запросов для извлечения словоформ, полученных из слабоструктурированных источников, рассматриваются основные термины в области семантических сетей. В исследовании приводится обзор существующих программных продуктов для синтаксического анализа предложений в текстах на русском языке. Также представлено описание программной системы, позволяющей преобразовывать тексты на естественном языке в унифицированный формат и выполнять извлечение данных с помощью специального языка запросов и существующей лингвистической онтологии. Новизну исследования составляет использование «смысловых единиц» из лингвистической онтологии, обеспечивающих более высокое качество (пертинентность) извлечения требуемой информации. В качестве итога приведены результаты оценки точности и полноты разработанного алгоритма для извлечения данных.
Комментарии 1
The most recent release of AGFL-GNU ftp://http://ftp.cs.kun.nl/pub/agfl/ показывает, что нужен логин
Но https://github.com/mahmoud208/AGFL/blob/master/AGFL.rar содержит архив, файлы которого у меня работали под Ubuntu.
Я не спец в теме Affix Grammars over a Finite Lattice, просто проверил доступность программы