Неактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зірка
 

ЕЛЕМЕНТИ ТЕОРІЇ ІНФОРМАЦІЇ В ЛІНГВІСТИЦІ

МЕТОДИЧНІ ВКАЗІВКИ

до лабораторної роботи № 4

з дисципліни «Методи опрацювання природної мови»

для магістрів галузі знань 12 «Інформаційні технології»

спеціальності 122 «Комп’ютерні науки та інформаційні технології»

спеціалізації «Системи штучного інтелекту»

 

Затверджено

на засіданні кафедри інформаційних систем та мереж

Протокол №01 від25.08.2016 р.

Львів-2016

Елементи теорії інформації в лінгвістиці: Методичні вказівки до лабораторної роботи № 4 / Укл.: В.А. Висоцька, Т.В. Шестакевич. – Львів: Видавництво Національного університету ”Львівська політехніка”, 2016. – 22 с.

Укладачі               Висоцька В.А., к.т.н., доцент

                                Шестакевич Т.В., асистент

 

 

Відповідальний за випуск      Литвин В.В., д.т.н., професор.

Рецензенти       Берко А.Ю., д.т.н., професор.

                                Чирун Л.В., к.т.н, доцент.

         


ЗМІСТ

1 ФОРМИ АДЕКВАТНОСТІ ТА МІРИ ІНФОРМАЦІЇ

2 КІЛЬКІСНІ МІРИ ІНФОРМАЦІЇ

2.1 Ентропія як міра невизначеності лінгвістичної події

2.2 Комбінаторний підхід до визначення кількості інформації

2.3 Вимірювання обмежень, що накладаються на застосування лінгвістичних одиниць системою і нормою мови

2.4 Імовірнісний підхід до визначення кількості інформації

2.5 Приріст інформації

2.6 Інформаційні виміри кодування інформації

2.7 Приклади розв’язування задач

3 КОНТРОЛЬНІ ПИТАННЯ

4 ЗАВДАННЯ

5 КОНТРОЛЬНІ ЗАДАЧІ

6 ЛІТЕРАТУРА

7 ВИМОГИ ДО ЛАБОРАТОРНОЇ РОБОТИ


Мета роботи: допомогти знайти практичне застосування основних положень теорії інформації, навчити визначати інформаційні втрати в каналах зв’язку із завадами, будувати оптимальні коди, знаходити та виправляти помилки при різних методах передачі та опрацювання інформації, представляти коди в пам’яті машини в стисненому вигляді та у вигляді різних структур.

 

1                     ФОРМИ АДЕКВАТНОСТІ ТА МІРИ ІНФОРМАЦІЇ

Важливою характеристикою інформації є її адекватність, тобто певний рівень відповідності створюваного за допомогою отриманої інформації образу реальному об'єкту, процесу, явищу і т.п. Адекватність інформації може виражатися в трьох формах: прагматичній, семантичній та синтаксичній.

Прагматична (споживацька) адекватність відображає відповідність інформації меті управління, яка на її основі реалізується. Ця форма адекватності безпосередньо пов'язана з практичним використанням інформації.

Семантична (смислова) адекватність визначає ступінь відповідності образу об'єкту і самого об'єкту. Семантичний аспект припускає облік смислового змісту інформації На цьому рівні аналізуються ті відомості, які відображає інформація, розглядаються смислові зв'язки. Ця форма служить для формування понять і уявлень, виявлення значення, змісту інформації та її узагальнення.

Синтаксична адекватність відображає формально-структурні характеристики інформації і не зачіпає її смислового змісту. На синтаксичному рівні враховуються тип носія і спосіб передачі інформації, швидкість передачі і обробки, розміри кодів представлення інформації, надійність і точність перетворення цих кодів і т.п. Ця форма сприяє сприйняттю структурних зовнішніх характеристик, тобто синтаксичної сторони інформації.

Якщо розглядається дослід, що може закінчитись одним із N можливих результатів, то необхідно оцінити такий результат. Такою оцінкою може стати міра інформації (або події). Міра загального об’єднання подій дорівнює сумі мір кожної події.

Кожній формі адекватності відповідає своя міра кількості інформації та об’єм даних.

Прагматична міра визначає корисність інформації (цінність) для досягнення користувачем поставленої мети. Ця міра також є відносною величиною, що зумовлено особливостями використання цієї інформації в тій чи іншій системі.

В якості семантичної міри інформації для вимірювання смислового змісту інформації, тобто її кількості на семантичному рівні, найбільше визнання отримала тезаурусна міра, яка пов'язує семантичні властивості інформації із здатністю користувача приймати повідомлення, що поступило. Для цього використовується поняття тезаурусу користувача.

Тезаурус- це сукупність відомостей, які має в своєму розпорядженні користувач. 

(Для ознайомлення з повним текстом статті необхідно залогінитись)