ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

03.06.2019

1821 просмотров

Статья представляет собой обзор подходов к тематическому моделированию – современному направлению исследования больших текстовых коллекций. В настоящее время сверхвысокие темпы накопления информации приводят к тому, что при изучении той или иной темы пользователю становится все труднее разобраться в исследуемом предмете. Таким образом, актуальным вопросом является смысловая компрессия информации – своего рода «дальнее чтение» – необходимое условие получения знаний в условиях стремительного разрастания доступного объема информации. «Дальнее чтение» может быть реализовано с помощью тематического моделирования –направления, находящегося на стыке компьютерной лингвистики и машинного обучения и призванного определять структуру коллекции текстовых документов путем выявления скрытых тем в документах, а также термов (слов или словосочетаний), характеризующих каждую из тем.

«Мы умеем читать тексты,
теперь нужно научиться не читать их»
Ф. Моретти

Скачать файл в формате PDF

Имя файла: DE-2019-01-06

Размер файла: 1.7 mb

Скачать файл

Идентификаторы статьи

DOI:
10.34706/DE-2019-01-06

Темы:

№5#57

Об авторе

Мария Милкова

Научный сотрудник ЦЭМИ РАН, лаборатория экспериментальной экономики. Сферы научных интересов: анализ естественного языка (NLP), тематическое моделирование, поведенческая экономика, экономика внимания.

Рубрики

_____

ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

Идентификаторы статьи

Об авторе

Мария Милкова

Комментарии

Новые материалы

Тэги

16+

ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

Идентификаторы статьи

Об авторе

Мария Милкова

Читайте также:

Журнал "Цифровая экономика" №5

Комментарии

Новые материалы

Тэги

16+