Classification by compression: Application of information-theory methods for the identification of themes of scientific texts


Дәйексөз келтіру

Толық мәтін

Ашық рұқсат Ашық рұқсат
Рұқсат жабық Рұқсат берілді
Рұқсат жабық Тек жазылушылар үшін

Аннотация

A method for automatic classification of scientific texts based on data compression is proposed. The method is implemented and investigated based on the data from an archive of scientific texts (arXiv.org) and in the CyberLeninka scientific electronic library (CyberLeninka.ru). Experiments showed that the method correctly identified the themes of scientific texts with a probability of 75–95%; its accuracy depends on the quality of the original data.

Авторлар туралы

I. Selivanova

The State Public Scientific Technological Library, Siberian Branch

Хат алмасуға жауапты Автор.
Email: selivanova@ict.sbras.ru
Ресей, Novosibirsk, 123298

B. Ryabko

Novosibirsk State University; Institute of Computational Technologies, Siberian Branch

Email: selivanova@ict.sbras.ru
Ресей, Novosibirsk, 630090; Novosibirsk, 630090

A. Guskov

Novosibirsk State University; Institute of Computational Technologies, Siberian Branch

Email: selivanova@ict.sbras.ru
Ресей, Novosibirsk, 630090; Novosibirsk, 630090

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

© Allerton Press, Inc., 2017