ИЗВЛЕЧЕНИЕ КЛЮЧЕВЫХ ТЕРМИНОВ НАПРАВЛЕНИЯ «ЦИФРОВАЯ ЭКОНОМИКА»: ГРАФООРИЕНТИРОВАННЫЙ ПОДХОД

30.12.2018

3359 просмотров

Статья посвящена извлечению ключевых терминов из правительственных документов, выпущенных в период 2013-2018 годы и связанных с направлением Цифровая экономика. Изучение пра-вительственных документов представляет интерес с точки зрения анализа одного из источников зарождения терминологии цифровой экономики. В статье приводится краткий обзор основ-ных подходов к извлечению ключевых терминов из текста, а также дается детальное описание одного из графоориентированных методов – алгоритма TextRank. Выбранный алгоритм был протестирован на 13 правительственных документах. Результатом обработки каждого текста явилось построение взвешенного графа семантических связей между ключевыми словами, на ос-новании которого были выделены ключевые термины.

Скачать файл в формате PDF

Имя файла: DE-2018-04-06

Размер файла: 769 kb

Скачать файл

Идентификаторы статьи

DOI:
10.34706/DE-2018-04-06

Темы:

Об авторе

Мария Милкова

Научный сотрудник ЦЭМИ РАН, лаборатория экспериментальной экономики. Сферы научных интересов: анализ естественного языка (NLP), тематическое моделирование, поведенческая экономика, экономика внимания.

Рубрики

_____

ИЗВЛЕЧЕНИЕ КЛЮЧЕВЫХ ТЕРМИНОВ НАПРАВЛЕНИЯ «ЦИФРОВАЯ ЭКОНОМИКА»: ГРАФООРИЕНТИРОВАННЫЙ ПОДХОД

Идентификаторы статьи

Об авторе

Мария Милкова

Комментарии

Новые материалы

Тэги

16+

ИЗВЛЕЧЕНИЕ КЛЮЧЕВЫХ ТЕРМИНОВ НАПРАВЛЕНИЯ «ЦИФРОВАЯ ЭКОНОМИКА»: ГРАФООРИЕНТИРОВАННЫЙ ПОДХОД

Идентификаторы статьи

Об авторе

Мария Милкова

Читайте также:

ПСИХОМЕТРИЧЕСКИЕ ХАРАКТЕРИСТИКИ КИТАЙСКОГО КЛИЕНТА: ТЕСТИРОВАНИЕ ПРОГРАММЫ SYMANTO

Извлечение данных из текстов на естественном языке с помощью специального языка запросов и лингвистической онтологии

СПЕЦИАЛЬНЫЕ ВЫРАЖЕНИЯ ДЛЯ ПОИСКА В СТРУКТУРИРОВАННОМ ТЕКСТЕ С ИСПОЛЬЗОВАНИЕМ ГРАММАТИЧЕСКИХ СВОЙСТВ

Комментарии

Новые материалы

Тэги

16+