ВСТУП
Даний дипломний проект (ДП) виконаний відповідно до завдання і наказом на дипломне проектування і є частиною комплексного проекту розподіленого інтелектуального синергетичного комплексу (РИЗИК-2).
Метою цього дипломного проекту є аналіз та обгрунтування вибору архітектури розподіленого інформаційно-довідкового комплексу для медичних установ та розробка математичного та програмного забезпечення для його підсистем. Проектування РИЗИК проводиться силами СКБ-2 кафедри СА, ПЗ АСУ МІРЕА послідовно протягом кількох років. В якості медичної установи виступає Головний військовий клінічний госпіталь ім. Бурденко (ГВКГ).
У 1998-1999 навчальному році студентами 6-го курсу розроблені комплекси завдань (КЗ) по платним медичним послугам, електронного документообігу, розпізнавання хвороб печінки, оцінки ефективності функціонування медичного закладу та ін прикладні системи. Ці розробки представляють комплексний дипломний проект (КДП) СКБ-2.
У процесі виконання даного КДП вирішені декілька поточних завдань з розвитку РИЗИК-2:
* Системний аналіз РИЗИК, розгляд напрямів та етапів його створення; організація взаємодії виконавців на поточному етапі і аналіз місця приватної завдання проекту в спільній роботі;
* Розробка МО та ПО з основної теми ДП;
* Створення (у взаємодії з іншими членами СКБ) прикладних програмних систем курсів «Гражданская оборона», «Екологія та охорона праці» та «Економіка» за завданнями, виданих відповідними кафедрами МІРЕА;
* Оцінка економічної ефективності проекту і дослідження перспектив розвитку РИЗИК 2.
Розділ 1. СИСТЕМНИЙ АНАЛІЗ І СИНТЕЗ РИЗИК II
1.1. Аналіз задуму, цілей, напрямів та етапів розробки РИЗИК II
1.1.1. Задум та цілі розробки РИЗИК II
Останнє десятиліття відбувається інтенсивний розвиток обчислювальної техніки (ОТ). З кожним наступним днем ми одержуємо можливість використовувати Вт по своїй продуктивності яка перевищує ту, яка була вчора, а за вартістю практично таку ж, а то може бути і дешевше.
Найбільше поширення Вт отримує в тих областях, де від людини вимагається уважність, точність, акуратність і, в деяких випадках, швидкість реакції або прийняття рішення. Це може бути, наприклад, яка-небудь область, пов'язана з запуском і управлінням польотом супутників, ракетами ППО, а може - звичайна бухгалтерія, банківські операції.
Задум розробки РИЗИК II полягає в автоматизації діяльності медичного персоналу військово-медичних установ МО РФ.
Метою розробки РИЗИК II є створення розподілених інформаційно-довідкових комплексів, що входять до складу АСУ Головного військового клінічного госпіталю (ГВКГ) ім. акад. Н.Н. Бурденко, проектованої рамках ДКР "Тонус".
1.1.2. Напрями та етапи розробки РИЗИК II
Основними напрямками розробки є:
1. Розробка архітектури РИЗИК II
2. Розробка математичного забезпечення (МО) та спеціального програмного забезпечення (ВПЗ) прикладних задач.
Враховуючи, що автоматизації підлягає велику кількість завдань, розробка РИЗИК II ведеться поетапно, у відповідності з етапами розробки АСУ ГВКГ в ДКР "Тонус". Розробка даного КДП збігається з II етапом створення АСУ ГВКГ.
1.1.3. Дослідження вимог замовника
Справжній дипломний проект є складовою частиною комплексного дипломного проекту (КДП) "Розробка розподіленого інформаційно-довідкового комплексу медичних установ (РИЗИК II)", що виконується групою дипломників, об'єднаних у студентське конструкторське бюро (СКБ 2).
На даному етапі в КДП було потрібно розробити такі комплексні завдання:
1. Комплекс задач (КЗ) "Математичне забезпечення оцінки ефективності роботи госпіталю".
2. КЗ "Математичне забезпечення інформаційного забезпечення автоматизованого робочого місця фахівця медичної частини".
3. КЗ "Математичне забезпечення ідентифікації медичних об'єктів методом головних компонент".
4. КЗ "Математичне забезпечення автоматизації бухгалтерського обліку торгових підприємств".
По кожній комплексної задачі замовником були пред'явлені вимоги до складу програмних і технічних засобів, що застосовуються в процесі рішення формулювати завдання, а також до функціональних характеристик, режимів функціонування та умов експлуатації програмно-технічних комплексів з урахуванням обраної архітектури.
Крім того, до складу КДП вирішуються прикладні завдання з навчальних курсів економіки, охорони праці та цивільної оборони. За цим завданням також були пред'явлені вимоги до складу програмних і технічних засобів, функціональним характеристикам, режимам рішення, що містяться в ТЗ на ці завдання.
1.1.4. Аналіз можливостей розробника
На основі аналізу всіх пред'явлених вимог виділимо основні технічні та програмні можливості розробника:
1). Програмне забезпечення для ГВКГ на вимогу замовника, має бути реалізовано на ПЕОМ IBM PC з операційною системою Windows 95 (або Windows NT 4.0 Workstation), що володіє можливістю підключення в локальну мережу.
2). Програмне забезпечення навчальної системи за курсом "Екологія та охорона праці" реалізовано на ПЕОМ IBM PC з операційною системою MS DOS 6.0 для автономного режиму функціонування.
3). Програмне забезпечення системи за курсом "Економіка" має бути реалізовано на ПЕОМ IBM PC з операційною системою Windows 95 або Windows NT.
1.2. Синтез та обгрунтування проектних рішень
1.2.1. Архітектура РИЗИК II
Використання в роботі лікувального закладу засобів обчислювальної техніки є сьогодні природна необхідність, значною мірою визначає рівень медичної науки і безпосередньо надає вплив на діагностику захворювань пацієнтів.
Великим медичним закладом Московського військового округу і всієї Російської армії є Головний військовий клінічний госпіталь ім. акад. Н.Н. Бурденко. Він курирує роботу інших госпіталів, таких як окружний військовий госпіталь у м. Подільську, гарнізонні шпиталі в м. Красногорську, Москві і т.д., а також ряду центральних поліклінік МО РФ.
За своєю структурою госпіталь ім. академіка Бурденко є складним багатопрофільним лікувальним закладом, що забезпечує як амбулаторне, так і стаціонарне обстеження і лікування пацієнтів. До складу госпіталю входять:
1) основні лікувальні відділення: операційний, переливання крові, терапевтичне, інтенсивної терапії, кардіології, гастроентерології та ін;
2) допоміжні лікувальні відділення: приймальне, лікувальної фізкультури, фізіотерапії, стоматології та інші;
3) лабораторії: діагностики, біологічна, клінічна та інші;
4) адміністративні та забезпечують підрозділи: відділ матеріально-технічного постачання, відділ кадрів, відділення медичної статистики, аптека, склад, відділ цивільної оборони, відділ охорони праці, бухгалтерія, економічний відділ та інші.
За основу при визначенні структури госпітальної інформаційної системи, складу і змісту бази даних, складу програмних засобів і підсистем необхідно покласти комплекс завдань, що забезпечують лікувальний процес у відділеннях. Система повинна забезпечувати виконання таких функцій:
- Автоматизація виконання розрахунків і проведення аналізу отриманих результатів функціональних, лабораторних і рентгенологічних досліджень, а також доведення результатів до лікарів;
- Отримання довідок про наявність лікарських засобів і медичного обладнання;
- Передача заявок на харчування хворих і лікарські засоби;
- Автоматизоване формування і видача звітних і довідкових документів;
- Планування проведення консультацій та досліджень, контроль їх виконання;
- Забезпечення обміну інформацією між лікувальними і забезпечують підрозділами госпіталю.
Крім цього госпітальна інформаційна система повинна мати програмні засоби, що забезпечують друкування, редагування, зберігання текстової та графічної інформації, статистичну обробку даних, отримання довідок по медичній літературі, а також результатів аналізу діяльності лікувальних відділень і ряд інших.
При автоматизації лікувального процесу у відділеннях багатопрофільного медичного закладу необхідно розглядати його як складний комплекс різних методів отримання інформації про хворого, її аналізі і прийняття рішення про лікувальний вплив на основі цієї інформації.
Він вимагає чіткої взаємодії всіх забезпечують його підрозділів. При цьому на всіх етапах лікування повинен створюватися машинний документ, що відображає динаміку стану хворого, методи його лікування і є частиною автоматизованої історії хвороби. Результати кожного етапу повинні вводитися в ЕОМ.
Впровадження такої системи дозволить підвищити якість документації, рівень обстеження і діагностики лікування, а також створити базу даних про всі лікувалися в лікувальному закладі.
На основі такої структури ГВКГ, була розроблена архітектура РИЗИК II, наведена на рис.1.1.
На даному етапі, автоматизації підлягає діяльність медичної частини, 7-го неврологічного відділення і бухгалтерії шпиталю.
У цьому КДП цієї проблеми присвячений розділ 2, в якій проводиться розробка математичного забезпечення комплексу задач "Оцінка ефективності функціонування військово-медичної установи" для медичної частини.
1.2.2. Організація взаємодії виконавців
На основі розробленої архітектури РИЗИК II і вимог Замовника на поточному етапі загальний обсяг робіт був розподілений між виконавцями згідно з поділом на класи завдань, що стояли перед розробниками. Робота над проектом проводилась розробниками СКБ 2 у складі:
Чіхірев Р.Б. - Розробка модуля статистичної обробки та аналізу даних КЗ "Оцінка ефективності роботи військового госпіталю" - головний конструктор, відповідальний за комплексне завдання з курсу "Екологія та охорона праці";
Базін В.В.. - Розробка КЗ "Захворювання печінки" - перший заступник головного конструктора, відповідальний за комплексне завдання з курсу "Цивільна оборона";
Баймеев Р.Х. - Заступник головного консруктори по завдання з курсу "Економіка";
Сачков А.В. - Помічник головного конструктора.
Взаємодія між виконавцями по вирішуваних завдань здійснювалася відповідно до наведеної на рис. 1.2 матрицею взаємодії.
На розробку комплексного дипломного проекту було видано технічне завдання (ТЗ) (Додаток 1), в якому автору пропонувалося вирішити такі комплексні завдання:
1. Провести системний аналіз і синтез РИЗИК II.
2. Розробити математичне та програмне забезпечення статистичної обробки та аналізу даних для комплексу завдань "Оцінка ефективності роботи військового госпіталю".
3. Розробити автоматизовану навчальну систему по курсу "Цивільна оборона".
4. Розробити інформаційне забезпечення для автоматизованої навчальної системи за курсом "Екологія та охорона праці".
5. Розробити і налагодити програмне забезпечення для системи оцінки фінансового стану підприємства з курсу "Економіка".
З огляду на вищевикладене, відповідно до виданого на розробку технічного завдання, основні вимоги на розробку дипломного проекту є наступними:
1) Провести обстеження ГКВГ ім. Бурденко і виявити ряд першочергових завдань, які потребують автоматизації рішення.
2) Для ПЕОМ IBM PC AT в середовищі Windows 95 або Windows NT Workstation 4.0 розробити математичне та програмне забезпечення статистичної обробки та аналізу даних для комплексу завдань "Оцінка ефективності роботи військового госпіталю".
3) Розробити рекомендації щодо захисту оператора і ПЕОМ від вражаючих факторів ядерного вибуху і землетруси по курсу "Цивільна оборона".
4) Для ПЕОМ IBM PC AT в середовищі MS DOS розробити навчальну систему по курсу "Екологія та охорона праці", яка представляє собою комп'ютерний лабораторний практикум за необхідними розділам предмета і складається з інформаційної та контролюючої частини, які управляються сценарієм навчання.
5) Розробити програмне забезпечення для системи аналізу фінансового стану підприємства з курсу "Економіка".
6) У дипломному проекті необхідно провести техніко-економічну оцінку розробки та визначити перспективи розвитку РИЗИК II.
7) Програмні продукти повинні забезпечувати реалізацію функцій, заданих у ТЗ на ці кошти.
8) На програмні продукти повинна бути розроблена призначена для користувача документація у складі:
- Керівництво системного програміста;
- Керівництво програміста;
- Керівництво оператора ..
1.2.3. Обгрунтування вибору програмних засобів
1.2.3.1. Операційне середовище
Операційні середовища: MS DOS 5.0., Windows 3.1 (або Windows for Workgroups 3.11), Windows 95 (або Windows NT Workstation 4.0) визначена вимогами Замовника, що випливають з проектних робіт, що реалізовуються в рамках виконання ДКР "Тонус".
1.2.3.2. Інструментальні засоби розробки
Як засоби розробки спеціального програмного забезпечення була вибрана система Borland C + + Builder 1.0 Client/Server. Вибір обумовлюється тим, що з його допомогою можна в найкоротший термін розробити швидкий, компактний і повноцінне Windows-додаток, що працює з базами даних.
Для розробки програмного забезпечення з курсу "Економіка" був обраний MSM 4.3, так як програма повинна буде працювати під операційними системами Windows 95.
Для розробки програмного забезпечення з курсу "Екологія та охорона праці" був обраний Borland C + + 5.0., Так як програма повинна буде працювати під операційною системою MS DOS 5.0 на вимогу кафедри.
Для розробки програмного забезпечення з курсу "Цивільна оборона" було обрано Visual Basic 4.0., Так як програма повинна буде працювати під операційною системою Windows 95 на вимогу кафедри.
Для зв'язку з фізичними таблицями використовується спеціальна програма Borland Database Engine 4.0.
Повністю структура програмного забезпечення використовується при виконанні КДП РИЗИК II представлена на рис.1.3.
Малюнок. 1.1. Архітектура РИЗИК II.
Малюнок 1.2. Матриця взаємодії виконавців
Малюнок 1.3. Структура програмного забезпечення РИЗИК II.
Висновки по чолі 1
У цьому розділі містяться результати системного аналізу та синтезу РИЗИК II, а саме:
* Проведено аналіз задуму, цілей, напрямів та етапів розробки РИЗИК II;
* Проведено аналіз вимог замовника і можливостей розробника. результати обстеження об'єктів замовника:
* Розроблено архітектуру РИЗИК II, яка являє собою сукупність територіально віддалених об'єктів (медичних установ), що взаємодіють між собою через систему обміну даними. Всередині об'єктів взаємодія здійснюється за допомогою локальних обчислювальних мереж. Для розробки комплексу засобів автоматизації інтерес представляє ЛВС госпіталю.
* На основі розробленої архітектури РИЗИК II і вимог Замовника на даному етапі було організовано взаємодію виконавців для вирішення поставлених завдань.
* Проведено обгрунтування використання програмних засобів, необхідних для розробки та експлуатації завдань.
Розділ 2. МАТЕМАТИЧНЕ ЗАБЕЗПЕЧЕННЯ КОМПЛЕКСУ ЗАВДАНЬ "ОЦІНКА ЕФЕКТИВНОСТІ ФУНКЦІОНУВАННЯ ВІЙСЬКОВО-МЕДИЧНОГО ЗАКЛАДУ"
2.1 Постановка задачі та її специфікація
Основною метою розробки КЗ "Оцінка ефективності роботи військового госпіталю методом головних компонент" є автоматизація обробки статистичних даних, що є показники функціонування підрозділів ГВКГ імені академіка М.М. Бурденко.
Для підвищення ефективності використання ліжкового фонду потрібна об'єктивна оцінка показників роботи відділень і центрів госпіталю. У зв'язку з цим комплекс завдань "Оцінка ефективності функціонування військово-медичної установи", повинен дозволяти за сукупністю показників, що характеризують різні аспекти функціонування відділень медичного закладу, визначити порівняльну ефективність їх роботи. Одним із прийнятних і досить простих у реалізації математичних методів розв'язання поставленої задачі є метод головних компонент (МГК).
Метод головних компонент, сутність якого полягає в зведенні безлічі показників до кількох сумарним інтегральним оцінками, в даному випадку має істотні переваги [3] у порівнянні з іншими статистичними методамиі, такими як дисперсійний, регресійний та факторний аналізи [7,9].
Проте, недолік методу головних компонент полягає в складності знаходження власних чисел і власних векторів матриць великої розмірності [3,6] при ручній обробці яких, неможливо отримати досить точні результати за прийнятний час, тому необхідна її автоматизація із застосуванням ЕОМ.
Для досягнення мети проекту потрібно вирішити наступні завдання:
- Вивчити теоретичні основи методу головних компонент;
- Розробити математичну модель роботи відділень установи, тобто виділити досліджувані і вимірювані параметри, встановити залежності між ними і дати математичну постановку задачі;
- Вибрати метод розв'язання задачі;
- Розробити алгоритм і програму, що реалізує цей метод.
2.1.1 Метод головних компонент
Об'єкти вивчення в прикладних областях можуть бути всебічно охарактеризовано тільки за допомогою цілого набору ознак. При характеристиці об'єкта дослідження випадковими багатовимірними ознаками будується кореляційна матриця, елементи якої враховують тісноту лінійної стохастичною зв'язку. Однак при великій кількості ознак характеристика виявлених зв'язків стає труднообозрімой завданням. Виникає потреба в описі об'єктів меншою кількістю узагальнених показників, наприклад факторами або головними компонентами. Головні компоненти є більш зручними збільшеними показниками. Вони відображають внутрішні об'єктивно існуючі закономірності, які не піддаються безпосередньому спостереженню.
При кореляційному або регресійний аналіз на основі отриманої кореляційної матриці будуються, наприклад, рівняння регресії, що зв'язують факторні ознаки з результативними. Самі рівняння регресії є кінцевою метою дослідження. За ним проводиться змістовна інтерпретація отриманих результатів і приймаються відповідні рішення. При використанні методу головних компонент кореляційна матриця використовується як вихідна щабель для подальшого аналізу спостережуваних раніше значень ознак. З'являється можливість отримання додаткової інформації про досліджуваному процесі або об'єкті.
2.1.2 Завдання що вирішуються методом головних компонент
За допомогою методу головних компонент можна вирішити чотири основних типи завдань.
Перше завдання - відшукання прихованих, але об'єктивно існуючих закономірностей, які визначаються впливом внутрішніх і зовнішніх причин.
Друге завдання - опис досліджуваного процесу числом головних компонент m, значно меншим, ніж число спочатку взятих ознак n. Головні компоненти адекватно відображають вихідну інформацію в більш компактній формі. Виділені головні компоненти містять більше інформації, ніж безпосередньо заміряємо ознаки.
Третє завдання - виявлення і вивчення стохастичної зв'язку ознак з головними компонентами. Виявлення ознак, найбільш тісно пов'язаних з даною головною компонентою., Що дозволяє прийняти науково обгрунтоване керуючий вплив, що сприяє підвищенню ефективності функціонування досліджуваного процесу.
Існує можливість використання отриманих даних для вирішення четвертої задачі, яка полягає в прогнозуванні ходу розвитку процесу на основі рівняння регресії, побудованого за отриманими головних компонентів.
Негативною стороною методу є складність математичного апарату, що вимагає знання як теорії ймовірностей і математичної статистики, так і лінійної алгебри та математичного забезпечення ЕОМ. Однак, в даний час, у зв'язку з великим прогресом у галузі обчислювальної техніки та програмного забезпечення ЕОМ, більшість обчислювальних труднощів відносно легко вирішуються.
2.1.3 Аналіз умов припущень і обмежень задачі
У ході алгоритму знаходження головних компонент потрібно знайти власні вектори і власні значення матриці парних кореляцій. На даний момент найбільш швидкими є алгоритми QR розкладання [2,5] та їх окремі випадки. Зокрема, у зв'язку з тим, що виходять в ході дослідження матриці є симетричними (симетричними), то для знаходження власних чисел і власних векторів зручний відносно простий метод Якобі [6].
2.2. Обгрунтування проектних рішень
2.2.1. Математична модель методу головних компонент
Відомо, що справжня величина досліджуваного об'єкта містить принаймні два компоненти: справжню характеристику оцінюваного явища і похибку вимірювання, яка залежить від великої кількості причин. Якщо вимірювання проводяться в таких областях, як економіка, біологія, медицина, психологія, то додається третя складова, що залежить від варіабельності вивчається ознаки, індивіда або об'єкта. Таким чином, зареєстроване значення може бути представлено у вигляді суми, де - зареєстроване значення змінного ознаки н i-ого об'єкта дослідження, - істинне значення (математичне очікування) вимірюваного ознаки у i - ого індивіда, - варіативність значення змінного ознаки i - ого індивіда, - помилка вимірювання при визначенні j - ого ознаки у i - ого об'єкта дослідження.
В основу методу головних компонент покладена лінійна модель. Якщо N - число досліджуваних об'єктів, n - число ознак, то математична модель приймає вигляд:
, (2.1)
де r, j = 1,2, ... n; f - r-а головна компонента; - вага r-ї компоненти в j-ї змінної;-нормоване значення j-ого ознаки, отримане з експерименту, на основі спостереження. У матричній формі y = Af.
Для дослідження початковими даними є коваріації або коефіцієнти кореляції. Надалі будемо використовувати коефіцієнти кореляції.
Для встановлення зв'язку між головними компонентами і коефіцієнтами кореляції перепишемо формулу для будь-якого i у вигляді:
(2.2)
Варіабельність, що залежить від особливостей об'єктів, що є причиною розбіжності свідчень ознак від об'єкта до об'єкта щодо математичного очікування. Повна дисперсія виражається через дисперсію головних компонент, а так як дисперсії нормованих величин дорівнюють одиниці, то можна записати:
. (2.3)
Оскільки головні компоненти ортогональні, то вираз спрощується. Зліва записана дисперсія, а праворуч частки повної дисперсії, що відносяться до відповідних головних компонентів. Дисперсія є характеристикою мінливості випадкової величини, її відхилень від середнього значення. Повний внесок r-ого факторів дисперсію усіх n ознак визначає ту частку загальної дисперсії, яку дана головна компонента пояснює.
Цей внесок обчислюється за формулою:
(2.4)
Розрізняють два види компонент, загальні та генеральні. Генеральні головні компоненти суттєво пов'язані з усіма ознаками завдання, загальні - більш ніж з одним.
Незважаючи на те, що замість ознак отримано таку ж кількість головних компонент, внесок у загальну дисперсію більшості виявляється невеликим. Чи можна виключити з розгляду ті компоненти, внесок яких малий.
Отже, при проведенні експерименту ми отримуємо результати у вигляді матриці спостережуваних величин ХN, n де N - число спостережуваних об'єктів, n - кількість вимірюваних ознак.
Елементи даної матриці центруються і нормуються, і ми отримуємо матрицю Y.
З'ясуємо, що являють собою вагові коефіцієнти між ознаками і головними компонентами. Для цього помножимо на першу головну компоненту і отримаємо:
. (2.5)
Щоб отримає коефіцієнт кореляції між j-им ознакою і першою головною компонентою, просумуємо ліву частину за всіма N спостереженнями і поділимо суму на число спостережень N, тоді права частина набуде вигляду:
. (2.6)
Враховуючи, що, перепишемо вираз:
, (2.7)
де-коефіцієнт кореляції між j-им ознакою і r-й головною компонентою, - коефіцієнт кореляції між r-й і перший головною компонентою, - вагові коефіцієнти, які називаються в факторному аналізі коефіцієнтами відображення. Оскільки в методі головних компонент компоненти не коррелірованни між собою, можна записати = 0 (r? K), тому =. І в загальному випадку в методі головних компонент можна написати =.
Матриця спостережені коефіцієнтів кореляції може бути представлена так:
R = YY?, (2.8)
де Y - матриця нормованих значень ознак, Y? - Транспонована матриця.
Коефіцієнт кореляції характеризує зв'язок між двома випадковими величинами ХJ і Хr у випадку лінійної кореляції між ними. Коефіцієнт кореляції являє емпіричний перший основний змішаний момент. Для будь-яких ознак і випадкових величин, (2.9)
Середнє значення випадкової величини ХJ визначається за формулою
, (2.10)
а середньоквадратичне відхилення
. (2.11)
В результаті перетворень кореляційної матриці можна отримати y = U? 1/2f, де?-Матриця власних значень матриці R, U - матриця з власних векторів R. Звідси можна зробити висновок, що шукана матриця А може бути визначена як А = U? 1/2, або, відповідно для стовпців.
Вклад даного вектора АR в загальну дисперсію визначиться за формулою
. (2.12)
2.2.2. Геометрична інтерпретація методу головних компонент
Геометрична інтерпретація методу головних компонент служить перехід до нової системи координат, де осями служать головні компоненти розподілу. [3,11].
Розглянемо найпростіший двовимірний випадок. Вона представлена на Рис 2.1.
Рис. 2.1. Геометрична інтерпретація методу головних компоент для двовимірного випадку
2.2.3 Блок схема алгоритму
Блок схема алгоритму методу головних компонент наведена на малюнку 2.2.
Рис 2.2. Блок схема алгоритму методу головних компонент
2.2.4 Зворотній факторна завдання
Як було зазначено вище, кожна головна компонента дає якусь нову загальну характеристику всім досліджуваним об'єктам. Причому кожна компонента є функцією особливостей кожного з досліджуваних об'єктів. Часто нас цікавить випадок, коли нас цікавлять якості об'єктів, пов'язані з однією або кількома головними компонентами. Якщо було б можливо отримати значення компоненти для кожного з розглянутих пацієнтів, то їх можна було б ранжувати і класифікувати за такою важливою інтегральної особливості, як тяжкість поранення.
Звернемося до моделі методу головних компонент. Розгорнемо рівність, для j-ого ознаки:
(2.13)
Висловимо тепер значення головних компонент через значення ознак. Для r-ої компоненти:
. (2.14)
Запропонований метод не є єдиним, зате він легко програмується на ЕОМ.
2.2.5 Проблема власних чисел і власних значень
При вирішенні задачі методом головних компонент виникає проблема обчислення власних чисел і власних векторів. У відповідній літературі, присвяченій методу головних компонент [4], для вирішення цієї проблеми рекомендується скористатися стандартними підпрограмами та бібліотеками, що входять в поставку програмного забезпечення ЕОМ. Однак, у зв'язку з грандіозним прогресом у галузі обчислювальної техніки, розвитком персональних ЕОМ, і переорієнтацією ринку програмних засобів, дані рекомендації втрачають актуальність. Очевидно також, що і при написанні цієї методичної літератури, дані рекомендації не були ідеальними, так як при використанні стандартних підпрограм ніяк не використовуються властивості матриць, що виходять при розрахунках методом головних компонент.
2.2.6 Методи знаходження власних чисел і власних векторів
2.2.6.1 Постановка завдання
Власним значенням квадратної матриці А називається таке число?, Що для деякого ненульового вектора х має місце рівність Ах =? Х. Будь-який ненульовий вектор х, що задовольняє цього рівності, називається власним вектором матриці А, що відповідає власним значенням?. Усі власні вектори матриці визначені з точністю до числового множника. Безліч всіх власних значень матриці А називається спектром матриці А.
Власні значення? матриці А є корінням алгебраїчного рівняння:
(2.16)
яке називається характеристичним рівнянням матриці А.
Відомо, що характеристичне рівняння має в області комплексних чисел рівно m коренів? 1, № 2, ...,? M (з урахуванням їх кратності). Таким чином кожна квадратна матриця А порядку m має набір з m власних значень? 1, № 2, ...,? M.
Якщо матриця А симетрична, то всі її власні значення є дійсними числами. В іншому випадку, для несиметричних матриць можлива наявність комплексних власних значень виду? =?? I? з ненульовою уявною частиною. У цьому випадку власним значенням матриці буде і комплексно-зв'язане число.
Чисельні методи вирішення проблеми власних значень до кінця 40-х років, зводилися, в основному, до вирішення характеристичного рівняння. При реалізації такого підходу, основні зусилля були спрямовані на розробку ефективних методів швидкого обчислення коефіцієнтів характеристичного рівняння. Такі методи мають назви прямих. Популярним методом цього типу є метод Данилевського [10].
Зазначений підхід стає незадовільним при обчисленні власних значень матриць, що мають порядок m у кілька десятків (і тим більше сотень). Зокрема, одним з недоліків є також те, що точність обчислення коренів многочлена високого ступеня даним методом надзвичайно чутлива до похибки в коефіцієнтах, і на етапі обчислення останніх може бути значною мірою втрачена інформація про власні значення матриці.
З появою ЕОМ широкого поширення набули Інтерполяційні методи вирішення проблеми власних значень, які не використовують обчислення характеристичного многочлена. В даний час ці методи майже повністю витіснили прямі.
2.2.6.2 QR розкладання матриці
В даний час кращими методами обчислення всіх власних значень квадратних заповнених матриць загального вигляду є алгоритми, засновані на QR розкладанні, яке дозволяє одержати уявлення вихідної матриці А у вигляді добутку ортогональної матриці Q на верхню трикутну матрицю R. Планарних (плоскі) обертання (вони ж обертання Якобі або Гивенс) представляють собою найбільш простий засіб отримання шуканого ортогонального розкладання. Метод планарних обертань може бути природним чином узагальнено для отримання більш зручних форм ортогональних обертань, здійснюваних у просторі з довільним числом вимірів. Такими узагальненнями є алгоритм Хаусхольдера (метод відбитків) і модифікований алгоритм Грама - Шмідта [1,8].
Очевидно, що для повного розкладання, незалежно від застосованого алгоритму, потрібна певна послідовність ортогональних перетворень, які можуть бути представлені матрицями Q0, Q1 ,..., Qm. Таким чином, отримана в результаті матриця набуде вигляду Q = Q0, Q1 ,..., Qm.
2.2.6.3 Метод обертань (метод Гивенс)
Окрему планарної обертання, що застосовується до матриці А, еквівалентно множення її на матрицю виду:
(2.15)
де з = cos?, s = sin?,? - Кут обертання. Таким чином, в процесі перетворення матриці змінюються тільки її елементи рядків i і l.
Припустимо, що в результаті проведених перетворень розташовані нижче головної діагоналі елементи рядків з 1 по l матриці А стали рівними нулю. Тоді для звернення до нуль розташованих нижче головної діагоналі елементів (l +1)-го рядка матриці А здійснюється її обертання послідовно з першим, другим і наступними рядками. Цей процес продовжується до тих пір, поки всі розташовані нижче головної діагоналі елементи (l +1)-го рядка не стануть рівними нулю. Тобто, поки не отримаємо трикутну матрицю виду:
(2.16)
Назвемо отриману матрицю матрицею R, вона пов'язана з вихідною матрицею рівністю R = ТА, де Т = Тm-1, m. .. T
2.2.6.4 Метод Якобі
Метод Якобі є окремим випадком методу Гивенс, для симетричної матриці А, отже обчислення всіх власних значень і власних векторів речової симетричної матриці можна звести до відшукання такий ортогональної матриці Т, для якої твір D = ТTАT представляє діагональну матрицю, причому стовпці матриці Т будуть відповідними власними векторами матриці А. Матриця Т знаходиться як межа нескінченного твори елементарних матриць обертань, кожна з яких має вигляд
(2.17)
де з = cos?, s = sin?,? - Кут обертання.
Якщо необхідно звернути в нуль аik матриці А, то соs? і sin? потрібно вибрати за формулами
,
, (2.18)
Тоді отримаємо матрицю D = ТTmATm зі зміненими i-м і k-м стовпцями і рядками:
bii = cos2? aii + sin2? akk 2 cos? sin? aik,
bkk = sin2? aii + cos2? akk? 2cos? sin? aik,
bik = bki = 0, (2.19)
bij = bji = cos? aji + sin? ajk
bkj = bjk = sin? aji? sin? ajk
j = 1, ... n, j? i, j? k,
bji = aji,
в інших випадках.
Відзначимо, що виконується співвідношення b2ii + b2kk = a2ii + a2kk 2 a2ik, тобто сума квадратів діагональних елементів збільшується.
Відповідно на ту ж величину зменшується сума квадратів внедіагональних елементів, звідки і випливає збіжність до діагональної матриці. Елементи, які одного разу звернулися до нуль, при наступних кроках знову можуть стати ненульовим.
2.2.6.5 Приведення матриці власних чисел до виду необхідного для методу головних компонент
Для методу головних компонент необхідно, щоб власні число були розташовані в порядку убування. Матриця власних чисел, що виходять в методі Якобі, не виконує дана вимога. Для отримання шуканої матриці переставимо рядка в матрицях? і А (пам'ятаємо що? = ТА) так щоб max (?) було в першому стовпці, отримавши відповідно матриці? * і А *. Тепер для того щоб матриця? * Знову стала діагональної потрібно застосувати планарної обертання Тij (де i, j переставлений рядка). Отримуємо? *= ТijТА *.
Застосовуючи подібні перестановки і планарних обертання далі, легко одержати необхідну матрицю, у якій |? 1 |> |? 2 |>...|? m |.
2.2.6.6. Алгоритм методу Якобі
Блок схема алгоритму методу Якобі наведена на Рис. 2.3.
Рис. 2.3. Блок схема алгоритму методу Якобі
2.2.7. Застосування методу головних компонент в задачі оцінки ефективності функціонування військово-медичної установи
Вихідні дані для аналізу представляють собою таблицю зібраних статистичних даних, об'єктами в якій є відділення ГВКГ, а параметрами - встановлені ГВМУ показники для оцінки ефективності використання ліжкового фонду (Таблиця 2.1).
У методичних рекомендаціях Міністерства охорони здоров'я РФ даються такі статистичні показники використання ліжкового фонду госпіталю (лікувального відділення):
1. Середня кількість розгорнутих ліжок:
.
2. Середнє число зайнятих ліжок:
.
3. Показник використання планової ліжковий потужності відділення (%):< br />
4. Показник використання фактичної ліжковий потужності відділення (%):< br />
5. Середнє число днів зайнятості ліжка:
6. Оборот ліжка:
7. Середня тривалість перебування хворого на ліжку:
.
Сукупність перерахованих показників (феноменологічні спостережуваних ознак) відображає якість функціонування лікувального закладу як системи. Не можна не відзначити, що традиційна оцінка якості функціонування лікувальних закладів ускладнена не лише надмірною кількістю основних показників, а й їх сильною кореляцією. Саме передумови подібного роду - множинність і взаємозалежність показників - і зумовлюють необхідність пошуку показників якості використання ліжкового фонду на основі методу головних компонент. При цьому з наявних показників слід виключити ті, про які ми заздалегідь знаємо, що вони лінійно залежні. Наприклад, параметри "Кількість проведених ліжко-днів" і "Середнє число зайнятих ліжок обчислюються один з одного і, слідові