Бісікало О.В. Метод лінгвістичного аналізу україномовного комерційного контенту / О.В. Бісікало, В.А. Висоцька // Інформаційні системи та мережі. Вісник Національного університету “Львівська політехніка”, № 854.- Львів 2016 – Стор. 185-204.

УДК 004.9

О. В. Бісікало1, В. А. Висоцька2
1 Вінницький національний технічний університет,
кафедра автоматики та інформаційно-вимірювальної техніки,
2 Національний університет “Львівська політехніка”,
кафедра інформаційних систем та мереж

МЕТОД ЛІНГВІСТИЧНОГО АНАЛІЗУ УКРАЇНОМОВНОГО КОМЕРЦІЙНОГО КОНТЕНТУ

© Бісікало О. В., Висоцька В. А., 2016

Розв’язано науково-практичну задачу автоматичного виявлення значущих ключових слів та рубрикації україномовного контенту в інтернет-системах на основі методу лінгвістичного аналізу текстової інформації. Наведено теоретичне та
експериментальне обґрунтування методу лінгвістичного аналізу україномовного контенту з використанням стемінгу Портера. Метод спрямовано на автоматичне виявлення значущих ключових слів україномовного контенту на основі запропонованої формалізації складових аналізу – граматичного (графемного), морфологічного, синтаксичного, семантичного, референційного та структурного.

Ключові слова: текст, україномовний, алгоритм, контент-моніторінг, ключові слова, контент-аналіз, стеммер Портера, лінгвістичний аналіз, синтаксичний аналіз.

The scientific and practical problem of automatic detection of meaningful keywords and Ukrainian content categorization in Internet systems on the basis of linguistic analysis of text information is unleashed. The article presents a theoretical and experimental substantiation of linguistic analysis methods for Ukrainian content using Porter stemming. The method is directed at the automatic identification of meaningful keywords in the Ukrainian content, based on the proposed analysis components formalization – the grammatical (grapheme), morphological, syntactic, semantic, structural and referential.

Key words: text, a Ukrainian, algorithm, content monitoring, keywords, content analysis, Porter stemmer, linguistic analysis, parsing.

(Для ознайомлення з повним текстом статті необхідно залогінитись)