Зміст статті

Неактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зіркаНеактивна зірка
 

Вступ

Активний розвиток Інтернет сприяє зростанню потреб в отриманні оперативних даних виробничого/стратегічного характеру і реалізації нових форм інформаційного обслуговування через сучасні інформаційні технології (ІТ), в тому числі в електронній комерції [312]. Документована інформація, підготовлена відповідно до потреб користувачів, є комерційним контентом [312, 327, 334, 767]. Серед текстового контенту часто зустрічається текстовий контент, автоматичне опрацювання якого викликає певні складності та вимагає застосування певного обсягу ресурсів. Сьогодні електронна комерція є об’єктивною реальністю та перспективним бізнес-процесом. Інтернет є бізнес-середовищем, а комерційний контент є товаром з найбільшим попитом і продажами в ньому та основним об’єктом процесів електронної контент-комерції. Комерційний контент можна відразу замовити, оформити, оплатити та отримати on-line як товар. Через Інтернет продають весь спектр текстового контенту – наукові та публіцистичні статті, музику, книги, фільми, фото, програмне забезпечення тощо. Відомими корпораціями, які реалізують електронну контент-комерцію, є Google через Play Market, Apple – Apple Store, Amazon – Amazon.com. Більшість рішень та досліджень проведено на рівні конкретних проектів. Системи електронної контент-комерції (СЕКК) побудовані за закритим принципом як разові проекти [334]. Сучасні СЕКК орієнтовані на реалізацію текстового контенту, який створений за межами системи.

Практичний чинник опрацювання інформаційних ресурсів в СЕКК пов’язаний з вирішенням задач формування, управління та супроводу зростаючих обсягів текстового контенту в Інтернет, активним розвитком електронного бізнесу, швидкими темпами поширення доступності до Інтернет, розширенням набору інформаційних товарів та послуг, зростанням попиту на комерційний контент [312, 320, 323, 327]. Принципи та інформаційні технології (ІТ) електронної контент-комерції застосовують при створенні Інтернет-магазинів (продаж eBooks, Software, video, music, movies, picture), систем on-line (газети, журнали, дистанційне навчання, видавництва) та off-line продаж контенту (copywriting services, Marketing Services Shop, RSS Subscription Extension), сloud storage та cloud computing [334]. В цьому напрямі працюють провідні світові виробники засобів опрацювання інформаційних ресурсів як Apple, Google, Intel, Microsoft, Amazon [72-75, 312, 320, 323, 327, 334, 504, 511, 514, 536, 547, 555-559, 767, 775, 778].

Теоретичний чинник опрацювання інформаційних ресурсів в СЕКК пов’язаний із розробленням ІТ опрацювання текстового контенту. В наукових роботах Д. Ланде, С. Брайчевського, А. Григор’єва та В. Фурашева досліджено та розвинуто математичні моделі електронних інформаційних потоків [387, 391, 488-489, 514, 521-528, 557-559, 771-774]. Г. Зіпф (G. Zipf) запропонував емпіричну закономірність розподілу частоти слів природної мови [334, 560-565, 708], а Дж. Селтон (G. Salton) [756] та Р. Папка (R. Papka) [202] – виявлення нових подій в потоках контенту [560-565]. В роботах Б. Дойл (B. Doyle), Б. Бойка (B. Boiko), С. Mакківер (S. McKeever), Дж. Макговерн (G. McGovern), Дж. Хаскос (J. Hackos), Е. Роклі (A. Rockley), Р. Накано (R. Nakano), Р. Вудс (R. Woods), Халверсон (Halverson) описані моделі життєвого циклу контенту [34, 68, 88, 124-125, 181-182, 193, 216, 289]. Методологію контент-аналізу започаткували А. Тенні (A. Tenni), Б. Метьюз (B. Matthews), Д. Спііда (D. Spiida), Ж. Кайзер (J. Kaiser), Б. Гласер (B. Glaser), . Стросс (A. Strauss) та активно розвинули Г. Лассуел (H. Lasswell), О. Холсті (O. Holsti), В. Іванов, М. Сорока, А. Федорчук [514, 528, 684, 708, 757, 771]. Ф. Джобіш (F. Joubish) запропонував методологію дослідження текстів для визначення авторства, автентичності або сенсу [708]. К. Нойендорф (K. Neuendorf) та К. Кріпендорф (K. Krippendorff) розробили методи кількісного та якісного аналізу текстового контенту [514, 528, 684, 708, 757, 771]. В роботах В. Корнєєва, А.Ф. Гарєєва, С.В. Васютіна, В.В. Райха запропоновані методи інтелектуального опрацювання текстової інформації [547]. Корпорації EMC, IBM, Microsoft Alfresco, Open Text, Oracle і SAP розробили специфікації Content Management Interoperability Services на інтерфейс Web-сервісів, для забезпечення взаємодії систем управління контентом електронного бізнесу [72-75].

З наукового погляду сегмент ІТ опрацювання інформаційних ресурсів є мало дослідженим. Кожний окремий проект реалізують практично з початку, фактично на основі своїх ідей та рішень. У літературі надзвичайно мало висвітлені суттєві теоретичні обґрунтування, дослідження, висновки, рекомендації, узагальнення для проектування СЕКК та опрацювання інформаційних ресурсів в таких системах. Виникла потреба в аналізі, узагальнені та обґрунтуванні існуючих підходів реалізації електронної комерції та побудови СЕКК. Актуальною є задача створення комплексу технологічних засобів на основі теоретичного обґрунтування методів, моделей і принципів опрацювання інформаційних ресурсів в СЕКК, побудованих за принципом відкритих систем, які дозволяють керувати процесом збільшення обсягів реалізації текстового контенту. Аналіз наведених чинників дає змогу зробити висновок про існування певного протиріччя між активним розвитком і поширенням ІТ та СЕКК з одного боку, та порівняно незначним обсягом наукових досліджень з цієї тематики та їх локальністю з іншого. Це протиріччя породжує проблему стримування інноваційного розвитку сектору електронної контент-комерції через створення і запровадження відповідних новітніх прогресивних ІТ, що негативно впливає на темпи зростання цієї частини ринку. В межах загальної проблеми актуальною є задача розроблення науково обґрунтованих методів опрацювання інформаційних ресурсів електронної контент-комерції та побудови на їх основі технологічних програмних засобів для створення, поширення і сталого розвитку СЕКК. В роботі проведено дослідження з метою визначення закономірностей, особливостей та залежностей у процесах опрацювання інформаційних ресурсів в СЕКК.

Для інтелектуального опрацювання текстової інформації необхідні інтелектуальні системи опрацювання інформаційних ресурсів (ІСОІР). Для опрацювання інформаційних ресурсів в СЕКК використовують певні ІТ. ІТ трактують як певну точку в просторі чотирьох інженерій (комп’ютерної, програмної, системної, даних та знань). Інженерія – це наука про проектування та побудову об’єктів певної природи. Для інтелектуальних систем (ІІС) центральним таким об’єктом є база знань (БЗ), що формується відповідно до предметної області (ПО), в якій функціонує ІІС. Сучасні методи інженерії знань (отримання знань від експерта, інтелектуальний аналіз даних, машинне навчання тощо) для побудови БЗ не ґрунтуються на жодних стандартах, тому побудовані на їхній основі бази знань з часом втрачають функціональність. Пропонуємо як стандарт інженерії знань використати онтології [83-84, 164-171]. Онтологія – це детальна формалізація деякої області знань за допомогою концептуальної схеми. Така схема, зазвичай, складається з ієрархічної структури даних, що містить всі релевантні класи об’єктів, їх зв’язків, теорем та обмежень, які прийняті у певній ПО [578-583]. Тому в галузі інформаційних технологій до дослідження онтологій все ширше долучаються науковці. Сьогодні розроблення онтологій переходить з лабораторій штучного інтелекту (ШІ) на робочі столи експертів з певних ПО, інженерів та користувачів. Онтології широко застосовують в інформаційних технологіях (робота пошукових машин, електронна комерція, системи опрацювання інформації), матеріалознавстві (системи аналізу стану матеріалів), машинобудуванні та інших галузях науки та промисловості [86, 82, 164, 166, 172].

Наукові дослідження в напрямі використання онтологій під час розроблення та функціонування інформаційних систем (ІС) почалися в кінці минулого століття та інтенсивно розвиваються. До фундаментальних робіт у цьому напрямі зараховують роботи Т.Грубера [117, 118], Н.Гуаріно [119-121], К.Джонса [105, 140], Е.Кауфмана [143], Е.Мена [183]. Перша книга на теренах СНД, в якій розглядалися ці дослідження, вийшла лише у 2009 році [700]. У цій роботі вперше російською мовою в систематизованій формі викладено теоретичні і практичні питання використання онтологій і тезаурусів як способів організації інформації та знань у сучасних інформаційних системах. У книзі на конкретних прикладах проілюстрований процес проектування онтологій. Які причини таких інтенсивних досліджень? Що дає використання онтологій у складі ІС? Відомі дослідники в цій галузі зазначають – передовсім це формалізація знань за допомогою онтологій, якої не вдавалось досягти за допомогою інших методів подання знань, інакше кажучи, онтології стали стандартом інженерії знань. По-друге – це використання спільного понятійного апарату як вченими, так і користувачами у всьому світі у певній ПО. По-третє – це структуризація та організація знань.

Використання онтологій у складі БЗ допомагає вирішити низку проблем методологічного та технологічного характеру, які виникають під час розроблення таких систем. Зокрема, в Україні такі проблеми полягають у відсутності концептуальної цілісності й узгодженості окремих прийомів та методів інженерії знань; нестачі кваліфікованих фахівців у цій галузі; жорсткості розроблених програмних засобів та їх низької адаптивної здатності; складності впровадження експертних систем та ІІС, що зумовлено психо­логічними аспектами.

Наукові дослідження в напрямі використання онтологій під час розроблення та функціонування інформаційних систем, зокрема інтелектуальних систем підтримки прийняття рішень, почалися в кінці минулого століття та інтенсивно розвиваються. Основні теоретичні засади формальних математичних моделей онтологій розроблено у роботах Т.Грубера, Дж.Солтона, А.Гомес-Переса, які запропонували онтологію розглядати як тривимірний кортеж; у працях Н.Гуаріно, П. Фолтса, М.Шамбарда наведено методики побудови онтологій та їх можливі шляхи розвитку; проблему автоматизованої побудови онтологій висвітлено у роботах Д.Челюска, М.Варгас-Вера, Т.Ватсона, П.Льюїса, К.Блашке; Дж.Сова ввів поняття концептуального графа, а М.Монтес-Гомес використав його для подання онтологій; використання онтологій під час функціонування прикладних інформаційних систем описано в роботах Р.Кнаппе, К.Джонса, Е.Кауфмана, Е.Мена, М.Бориса, А.Каллі, І.П.Норенкова, М.Ю.Уварова, Ю.В.Рогушина; проблему побудови інтелектуальних систем на основі онтологій розглянуто у роботах Т. Андреасена, Т.Бернерса-Лі, Д.Хендлера, О.Лазсіла, О.В.Палагіна, А.В.Анісімова, А.Я.Гладуна, зокрема опрацювання української природної мови; використання онтологій у структурі та під час функціонування інформаційних систем проаналізовано у роботах Джос де Брюїна, Д.Фенсела, С.Штаба, Р.Студера, Л.Холінка, М.Кокара, В.Лопеса, П.І.Андона, Л.А.Святогора, О.Г.Дубинського, І.Є.Кураленко, Т.А.Гаври­лової, А.С.Клещева, І.Л.Артем’євої; проблему опрацювання природномовних текстів для автоматизованої побудови онтології досліджено у роботах С.Баррі, Р.Кахліна, Л.В.Найханової, Д.П.Ночевнова, І.В.Совпела, О.І.Боровікової, Ю.А.Загорулько. Аналізуючи роботи загалом, можна зробити висновок, що наукові дослідження в галузі розроблення та використання онтологій під час побудови прикладних інформаційних систем активно розвиваються. Ці факти свідчать про актуальність проблематики побудови інтелектуальних систем опрацювання ІР на основі онтологій як предмету наукових досліджень.

Дослідження, які наведені у цій монографії, є складовою частиною наукових проектів кафедри “Інформаційних систем та мереж” Національного університету “Львівська політехніка”. Книга призначена для спеціалістів із проектування, розроблення та впровадження інтелектуальних систем опрацювання інформаційних ресурсів, науковців у галузі глобальних інформаційних системи, систем штучного інтелекту, Інтернет-технологій, фахівців з електронної комерції, Інтернет-маркетингу та Інтернет-реклами, менеджерів комплексних Web-проектів, а також для здобувачів 3-ого (освітньо-наукового) рівня вищої освіти в галузі знань 12 «Інформаційні технології». Монографія призначена для студентів, що навчаються за спеціальностями 122 «Комп’ютерні науки та інформаційні технології» та 124 «Системний аналіз» і споріднених спеціальностей, пов’язаних з вивченням інтелектуальних систем опрацювання інформаційних ресурсів на основі онтологій.