The Hybrid Method for Accurate Patent Classification


Дәйексөз келтіру

Толық мәтін

Ашық рұқсат Ашық рұқсат
Рұқсат жабық Рұқсат берілді
Рұқсат жабық Тек жазылушылар үшін

Аннотация

This article is dedicated to stacking of two approaches of patent classification. First is based on linguistically-supported k-nearest neighbors algorithm using the method of search for topically similar documents based on a comparison of vectors of lexical descriptors. Second is the word embeddings based fastText, where the sentence (or a document) vector is obtained by averaging the n-gram embeddings, and then a multinomial logistic regression exploits these vectors as features. We show in Russian and English datasets that stacking classifier shows better results compared to single classifiers.

Авторлар туралы

V. Yadrintsev

Federal Research Center Computer Science and Control of the Russian Academy of Sciences; Peoples’ Friendship University of Russia (RUDN University)

Хат алмасуға жауапты Автор.
Email: vvyadrincev@gmail.com
Ресей, Moscow, 119333; Moscow, 117198

I. Sochenkov

Federal Research Center Computer Science and Control of the Russian Academy of Sciences; Lomonosov Moscow State University

Хат алмасуға жауапты Автор.
Email: sochenkov@isa.ru
Ресей, Moscow, 119333; Moscow, 119991


© Pleiades Publishing, Ltd., 2019

Осы сайт cookie-файлдарды пайдаланады

Біздің сайтты пайдалануды жалғастыра отырып, сіз сайттың дұрыс жұмыс істеуін қамтамасыз ететін cookie файлдарын өңдеуге келісім бересіз.< / br>< / br>cookie файлдары туралы< / a>