Обробка й аналіз інформаційних потоків: системи
підтримки прийняття рішень h2>
Природний
розвиток систем управління базами даних і управлінських систем призвело до
появи зовсім нових систем підтримки прийняття рішень. Як правило,
основним завданням таких систем є можливість роботи з
неструктурованими і слабкоструктурованих масивами даних. p>
Системи
підтримки прийняття рішень, незважаючи на значне поширення у великому
бізнесі та органах державної влади, ставляться до рішень, про які
прийнято говорити як про «майбутньому в ІТ-системах для середнього та малого бізнесу».
Проте тут будуть розглянуті основні підходи, які використовуються в різних
рішеннях такого роду. p>
Отже,
системи підтримки прийняття рішень (СППР) можуть бути необхідні у випадку, якщо
у бізнесу є потреба в обробці великих обсягів різнорідної (постійно
надходить) інформації з наступним аналізом і стратегічним плануванням
подальших дій. У СППР використовується кілька так званих аналітичних
технологій - методик, що дозволяють по відомих даних оцінити значення
невідомих характеристик і параметрів. Сучасні розробки в цій галузі
надають можливості обліку великого потоку різнорідної інформації про
об'єкт дослідження, і в той же час широкі можливості інфраструктурного
аналізу дозволяють керівнику своєчасно прийняти правильне рішення. У
залежно від даних, з якими ці системи працюють, СППР умовно можна
розділити на оперативні та стратегічні. Перші призначені для
негайного реагування на зміни поточної ситуації в управлінні фінансово-господарськими
процесами компанії. Другі орієнтовані на аналіз значних обсягів
різнорідної інформації, яка збирається з різних джерел. Найважливішою метою
цих СППР є пошук найбільш раціональних варіантів розвитку бізнесу
компанії з урахуванням впливу різних факторів: кон'юнктури цільових для компанії
ринків, зміни фінансових ринків і ринків капіталів, зміни в
законодавстві і т.д. На сьогоднішній день аналітичні системи практично
не використовуються в середньому та малому бізнесі. Можливості прогнозування і
моделювання ситуацій (так звані «ситуаційні центри»), а також функції
автоматизованого збору даних та їх обробки існують трохи більше ніж у
5% підприємств SMB. Проте з подальшим зростанням обсягів інформації на
підприємствах і здешевленням кінцевих рішень такого класу, можна
прогнозувати бурхливий ріст ринку СППР. В якості первинного джерела даних
для аналітичних систем повинні виступати СУБД організації, офісні документи,
мережу Інтернет. При цьому повинні враховуватися як внутрішні для організації
дані, так і глобальні відомості (макроекономічні показники, конкурентна
Середа і т. д.). p>
Сховище
даних - оптимальна база для побудови аналітичної системи (АС). Робота з
таким сховищем значно збільшує її ефективність, оскільки одним з
ключових показників АС є можливість швидко отримати результат. p>
Наступний
крок на шляху до ухвалення рішення-вибірка даних. Незалежно від того, в якій базі
даних знаходяться необхідні відомості, особа, яка приймає рішення не повинно
вникати в деталі роботи з СУБД. Тому потрібен механізм, трансформуючий
терміни предметної області в запити до конкретної БД. Подальші кроки - це
власне аналіз і представлення кінцевих результатів. Існує два методологічних
підходу в таких системах: вироблення рекомендацій (концепція data mining) і
підготовка даних (OLAP). p>
OLAP - засіб складання звітів на основі системи
запитів h2>
OLAP
(Online Analytical Processing) - технологія, заснована на інструментах математичної
статистики, вона застосовується головним чином для аналізу і відображення
інформації у вигляді багатомірних структур, які називаються також «куби OLAP». Дозволяє
вирішувати наступні завдання: p>
1.
Підготувати бази даних (часто об'ємні і містять складні взаємозв'язки); p>
2.
Організувати гнучкий і зручний доступ до баз даних через потужні засоби
формування запитів; p>
3.
Отримати результати запитів у формі, максимально зручною для подальшого
аналізу; p>
4.
Використовувати потужні генератори звітів. P>
Такий
підхід може бути дуже корисним у тому випадку, якщо особа, яка приймає рішення,
використовує комп'ютер лише для отримання необхідних даних, відображення
цих даних в структурованому, зрозумілому вигляді, а висновки робить самостійно. p>
Представлене
перетворення даних в тривимірну структуру - один з найпотужніших інструментів
технології OLAP. Він відрізняється гнучкістю: кожен користувач може визначати
потрібні багатовимірні проекції даних без будь-яких обмежень. Крім того, в
рамках цього методу існує можливість виробляти деталізацію даних до
потрібного рівня. Таким чином, технологію OLAP варто розглядати як засіб
формування та пошуку запитів до бази даних (сховища даних). При цьому
функціональності OLAP явно недостатньо, якщо потрібна більш детальний аналіз
або є необхідність в автоматизованому пошуку прихованих взаємодій
між об'єктами в представленому масиві інформації. p>
Data Mining - комплексний підхід до інтелектуального
аналізу даних h2>
В
відміну від методів аналітичної обробки інформації та створення звітів,
концепція Data Mining передбачає виявлення нетривіальних взаємозв'язків між
об'єктами даних, які потрібні для прийняття рішень. Зокрема,
інструментарій вироблення рекомендацій має наступні можливості: p>
1.
Формування безлічі альтернативних варіантів рішень; p>
2.
Використання кількох критеріїв оцінки; p>
3.
Облік важливості критеріїв; p>
4.
Вибір кращого варіанту, який видається як рекомендація. P>
Виділяють
п'ять типів закономірностей, що дозволяє виявляти Data Mining:
класифікація, кластеризація, регресія, асоціація, послідовність і
прогнозування. Коротко їх можна охарактеризувати так: p>
1.
Класифікація - це віднесення об'єктів (спостережень, подій) до одного з
заздалегідь відомих класів; p>
2.
Кластеризація-це групування об'єктів (спостережень, подій) на основі даних
(властивостей), що описують сутність об'єктів. Об'єкти усередині кластера повинні бути
схожими один на одного і відрізнятися від об'єктів, що ввійшли в інші кластери.
Чим більше схожі об'єкти усередині кластера і чим більше відмінностей між
кластерами, тим точніше кластеризація; p>
3.
Регресія, в тому числі завдання прогнозування. Встановлення функціональноі
залежності між залежними і незалежними перемененнимі; p>
4.
Асоціація - виявлення закономірностей між пов'язаними подіями. Прикладом
такої закономірності є правило, яке вказує, що з події X слід
подія Y. Такі правила називаються асоціативними. Вперше це завдання було
запропонована для знаходження типових шаблонів покупок, здійснених в супермаркетах,
тому іноді її ще називають аналізом ринкової корзини (market basket
analysis); p>
5.
Послідовні шаблони-встановлення закономірностей між пов'язаними під
часу подіями. Наприклад, після події X через певний час
відбудеться подія Y; p>
6.
Аналіз відхилень - виявлення найбільш нехарактерних шаблонів. P>
Це
все, що потрібно зробити для автоматизації процесу вилучення даних. Всі
інше робить особа, яка приймає рішення. Різні методи лише дають різну
інформацію в різних видах: в простому випадку це таблиці та діаграми, у більш
складному - моделі та правила. Цілком виключити участь людини неможливо,
оскільки вибрані дані не мають ніякого значення, поки не будуть застосовані
у конкретній предметній області. Таким чином, методи рішення задачі по
прийняття рішення не залежать від інструментарію. Тому в рамках двох
вищеописаних парадигм може існувати як завгодно широкий набір
інструментів. Говорити про дійсно повнофункціональному рішення можна тільки
в тому випадку, якщо був охоплений весь список завдань. На думку керівників
найбільших компаній, що розробляють спеціалізовані
інформаційно-аналітичні системи та системи підтримки прийняття рішень, це
напрям має стати пріоритетним при інформатизації бізнесу. Основна
завдання, яке вирішується при переході на використання таких систем, - допомогти
організаціям налагодити контроль і управління, що сприяють підвищенню
ефективності, раціональності та якості послуг, що надаються. p>
Список літератури h2>
IT
спец № 07 ЛИПЕНЬ 2007 p>