0

Определение жанра и автора литературного произведения статистическими методами

152 руб.
Купить на сайте ЛитРес

Издатель: НОУ «МФПУ «Синергия»

Серия: Прикладная информатика. Научные статьи

Год выхода: 2010

ISBN:

Информация о книге:
страниц: ~0
знаков: ~0
Жанры: Языкознание, Математика, Компьютеры: прочее
Рейтинг: 0.000
Голосов: 0

Ваша оценка
Поделиться оценкой:
Поделиться с помощью Вконтакте Поделиться с помощью Facebook Поделиться с помощью Twitter
Добавлена: 30.06.2015
В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.

Похожие книги

Отзывы читателей (0)

Подписаться на комментарии к этой книге