Розділ 4. Статистична лінґвістика
План викладення матеріалу
4.1. Лінґвометрія
4.1.1. Статистичні параметри мови
4.1.2. Кількісні оцінки мовлення
4.2. Стилеметрія
4.3. Глоттохронологія
4.4. Контрольні питання
4.5. Задачі для самостійної роботи
У даному розділі розглянуто завдання визначення статистичної структури тексту з використанням методів математичної статистики та теорії ймовірностей, схема зв’язків між методами розділів математики та статистичною лінгвістикою подано на рис. 4.1.
Початки застосовувати кількісних та статистичних методів до мови та мовлення сягають ще античності, а новим поштовхом до її розвитку в сучасності стало, зокрема, зростання популярності вивчення іноземних мов у середині ХІХ – на поч. XX ст. Теоретики та практики викладання мови усвідомили, що повністю оволодіти мовою за декілька років при кількох годинах занять на тиждень неможливо, тому вирішили обмежити словник найбільш частовживаними словами. Справжній «вибух» статистичних досліджень відбувся з появою та розвитком обчислювальної техніки. Комп'ютери допомогли максимально спростити механічну роботу, зокрема таку, як обчислення кількості слововживань у тексті. На відміну від єдино можливого колись ручного обрахунку, зараз переведення тексту в електронний вигляд та застосування відповідного програмного забезпечення дає змогу отримати ці дані автоматично. Лінґвостатистичні дослідження в Україні почалися з 50-х рр. XX ст., і спочатку вони стосувалися відбору лексичного мінімуму для іноземних мов, але згодом сфера їх застосування розширилася. Так, на початку 1960-х років в Інституті мовознавства ім. О.О. Потебні АН УРСР було організовано групу структурно-математичної лінґвістики, яка розпочала цілеспрямоване статистичне дослідження українських текстів художнього, науково-технічного та соціально-політичного функціональних стилів, що дало змогу виявити їхні статистичні параметри. Тоді ж розпочався проект з укладання серії частотних словників: художньої прози, драми, поезії, публіцистики, наукової прози, до якого було також залучено лабораторію комп'ютерної лінґвістики Київського національного університету імені Тараса Шевченка [23, с.17]. Матеріал викладено в розрізі трьох підрозділів прикладної лінґвістики та суміжних із нею наук: лінґвометрії, стилеметрії та глоттохронології.
(Для ознайомлення з повним текстом статті необхідно залогінитись)