Неактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зірка
 

1.2. Елементи теорії ймовірностей

План викладення матеріалу

1.2.1. Елементарні та складні лінґвістичні події

1.2.2. Операції над лінґвістичними подіями

1.2.3. Імовірність елементарної лінґвістичної події

1.2.4. Імовірності складних лінґвістичних подій

1.2.5. Контрольні питання

1.2.6. Тести для самоконтролю

1.2.7. Задачі для самостійної роботи

Теорія ймовірностей – це математична наука, що вивчає закономірності у випадкових подіях. Елементи теорії ймовірностей застосовуються під час вивчення функціонування мови та мовлення за допомогою ймовірнісного моделювання тексту. Статистична лінґвістика ґрунтується на методах теорії ймовірностей. Лінґвістичні схеми в розв’язуванні задач криптології передбачають використання методів теорії ймовірностей [31, 95]. Задачі, розв’язувані за допомогою понять теорії ймовірностей, постійно виникають у лінґвістичних дослідженнях і, особливо, під час реалізації алгоритмів машинного послівного перекладу та інформаційного пошуку. Знання основ теорії ймовірностей вимагається при обчисленні формально-структурних характеристик інформації (об’єм даних, кількість інформації, коефіцієнт інформативності). Елементи теорії ймовірностей використовують у вирішенні таких завдань лінґвометрії, стилеметрії та глоттохронології (статистична лінґвістика), як автоматизація лексикографічних процесів, порівняння словників, створення систем стенографії, автоматичне визначення мови чи автентичності твору тощо [23, 95]. Також результати статистичної лінґвістики знаходять своє застосування у криптографії та криптоаналізі (рис. 1.4).

2.1.Елементарні та складні лінґвістичні події

Спостереження, випробування і подія в індуктивних дослідженнях мови. Основою всіх індуктивних досліджень у мовознавстві є спостереження за поведінкою і ознаками лінґвістичних об’єктів, що вивчаються. Це спостереження може здійснюватися також через експеримент або кількісне вимірювання. Здійснення кожного такого спостереження (досліду або вимірювання) називають випробуванням. Сукупність умов, за яких здійснюється таке випробування, називають комплексом умов і позначають через . Результатом лінґвістичного випробування є лінґвістична подія. Кожну подію, яка може відбутися, а може й не відбутися, називають випадковою подією [31, с.21]. Якщо результат лінґвістичного випробування повністю вичерпується деякою однією (і тільки однією) подією, то маємо справу з елементарною випадковою подією. Подію, яка складається з декількох елементарних подій, називають складною випадковою подією [20, 42, 64, 95].

Виконаємо дослід (випробування), який полягає у вгадуванні літери при такому комплексі умов s1: перед літерою, що вгадується, міститься ланцюжок котр, текст український без помилок. Це випробування може дати події A, B, C, D, E, котрі полягають, відповідно, у появі таких літер: а (котра), е (котре), и (котрий), о (котрому, котрого), і (котрі). Появи літер а, е, и, о, і після ланцюжка котр є елементарними випадковими подіями, появи після того самого ланцюжка діграм ий, ом, ог треба розглядати як складні випадкові події [95, с.113; 119].

  1. 2.2.Операції над лінґвістичними подіями

1. Складну подію, яка полягає в здійсненні хоча б однієї з подій A, B, називають сумою цих подій [95, с.114]; позначають через A+B (читають «A або B»). Поява літери а (подія A) або літери е (подія B) після ланцюжка котр є сумою A+B (рис. 1.5).

 

2. Складну подію, яка полягає в одночасному здійсненні подій A та B, називають їхнім добутком (рис. 1.6) [95, с.114]; позначають через AB (читається «A і B»).

3. Складну подію, яка полягає в тому, що подія A відбувається, а подія B не відбувається, називають різницею подій A та B (рис. 1.7) [95, с.114]; позначають через A-B.

 

Якщо комплекс умов полягає в тому, що всередині прямокутника вибирається навмання точка, подія A – точка вибирається в лівому крузі, а подія B – точка вибирається в правому крузі, то події A+B, AB та A-B полягають у попаданні вибраної точки всередину областей, заштрихованих на відповідних фігурах (рис. 1.5 – 1.7).

  1. A, яка відбувається при реалізації комплексу умов s, викликає щоразу появу події B, то говорять, що Aчастковий випадок B (рис. 1.8) [95, с.114], і записують AÌB (або BÉA).

 

  1. A при комплексі умов s викликає появу події B і, навпаки, при цьому самому комплексі умов B викликає A, то події A та B називають рівносильними (рис. 1.9) [95, с.114] і записують A=B.

 

  1. s має обов’язково відбутися, то таку подію називають достовірною. Подію, яка при комплексі умов s відбутися не може, називають неможливою. Оскільки всі достовірні події рівносильні, їх прийнято позначати через U, неможливі події з тих самих міркувань позначаються літерою V;  [95, с.115].

7. Дві події називають несумісними, якщо поява однієї з них при певному випробовуванні виключає можливість появи іншої. Події, які полягають у появі після ланцюжка котр букв а та е – несумісні [95, с.115].

8. Дві події називають сумісними, якщо поява однієї з них при заданому випробуванні не виключає появи другої [95, с.114].

  1. A, B, C,…, Z утворюють повну систему подій, якщо при виконанні випробування при комплексі умов s хоча б одна з них має відбутися. Події, які полягають у появі після ланцюжка котр літер а, е, и, о, у, і, утворюють повну систему подій [95, с.114].

10. Дві несумісні події A та  (читають «не A»), якщо вони утворюють повну систему подій, називають протилежними (рис. 1.10) [95, с.114].

 

  1. 2.3.Імовірність елементарної лінґвістичної події

Міра можливості появи лінґвістичної подіїA при виконанні комплексу умов s - це ймовірність P(A) цієї події [20; 31, с.23; 64; 95, с.115; 119]. Для мовознавства важливими є три означення ймовірності:

а) означення, яке ґрунтується на суб’єктивній кількісній оцінці можливості події;

б) класичне означення ймовірності;

в) статистичне означення ймовірності.

Суб’єктивне означення ймовірності у лінґвістиці. При інтуїтивному оціненні ймовірності появи події C використовують сукупність знань (тезаурус) Q відносно тих можливостей, які можуть сприяти або не сприяти появі події A. Ймовірність подають як P(A,Q), тобто як ймовірність події A при наявному у свідомості певної людини тезаурусі Q. Якщо дві особи мають щодо події A однаковий тезаурус Q, то P(A,Q1)= P(A,Q2). Проте, частіше ймовірність однієї події Aоцінюється різними людьми, виходячи з різних величин (Q1,Q2). Навіть у однієї тієї особи з часом величина Q1 змінюється в Q2, отже, і його оцінки ймовірності події A у різні періоди життя є різними: P(A,Q1)¹ P(A,Q2). На основі використання суб’єктивних ймовірностей існує багато мовних досліджень, а відмінності у суб’єктивних ймовірностях стає джерелом лінґвістичних дискусій [95, с. 116].

(Для ознайомлення з повним текстом статті необхідно залогінитись)