ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Вірю не вірю
         

     

    Інформатика, програмування

    Вірю не вірю

    Аракелян Арсен

    Щоб розібратися в тому, як і де спотворюється інформація, ми вирішили трохи докладніше розглянути основні етапи збору, аналізу та візуалізації даних. З'ясувалося, що скомпрометувати дані можна на будь-якому з них. Включаючи збір даних, особливо якщо жодного збору-то і немає, а інформація взята ...

    Зі стелі

    Такий зухвалий підхід і раніше зустрічався рідко, а зараз його і зовсім можна заносити в Червоної книги, оскільки людини, яка постійно вигадує неіснуючу статистику, занадто легко зловити за руку. Втім, за руку ловлять не часто -- твердження, підкріплені статистикою та відсиланням до авторитетів, за замовчуванням вважаються достовірними, і сумніваються в їх справедливості лише ті, хто дотримується протилежної думки і має на руках статистику, доводить зворотне твердження.

    Тому найбільше придуманої статистики на теми, які нікому особливо не важливі. Чи знаєте ви, що, за даними Всесвітньої Організації охорони здоров'я, блондинки є носіями вимираючого гена і протягом найближчих двохсот років зникнуть з лиця Землі? А чи знайоме вам твердження, згідно з яким людина повинна випивати щодня не менше восьми склянок води? Чи, можливо, ви чули, що щорічно півтори сотні людей гине під ударами впали з пальми кокосових горіхів.

    Якщо чули, то майте на увазі, що жодне з цих тверджень не відповідає дійсності. ВООЗ нічого подібного про блондинок не говорила, досліджень на цю тему не вела і навіть публічно спростувала ці заяви (так що у блондинок є шанс на виживання); на небезпеку зрілих кокосів звернули увагу копірайтери британської страхової компанії, які, звичайно, ніяких підрахунків не проводили, а байка про вісім склянок води з'явилася в результаті неправильно понятий журналістом наукової статті, автор якої хоч і писав про нещасливих склянках, окремо згадував, що це загальний об'єм рідини, що включає в себе як чисту воду, так і воду, що міститься в продуктах харчування (а там її досить багато).

    Іноді придумана статистика викидається в народ не для того, щоб переконати когось у своїй правоті, а щоб переконати аудиторію в неправоті опонента. Джоел Бест в книзі "Нахабна брехня і статистика" наводить приклад, коли активісти атакували Рональда Рейгана, стверджуючи, що в США півтора мільйона бездомних. Активісти придумали ці дані (відповідаючи на будь-яку критику дивно конструктивним чином: "Ви що, сумніваєтеся, що бездомних мало? Вам що, наплювати на проблеми бездомних? "). Всі розуміли, що дані про бездомних взяті зі стелі, але ще дуже довго адміністрації доводилося переконувати громадськість, що реальні показники в десятки разів менше -- громадськість була впевнена, що уряд занижує невигідні для себе показники, адже диму без вогню не буває. І якщо півтора мільйони були придумані, значить, в реальності як мінімум мільйон двісті - і жодним бездомним менше.

    Британські вчені

    Феномен "британських вчених" все ще чекає свого Ліннея. "Британські вчені "- один з головних джерел недостовірної інформації, у тому числі та статистичної (для російської преси, в Британії вони користуються меншою популярністю). Саме словосполучення звучить досить серйозно, та й піди перевір, що думають британські вчені насправді. Крім того, Великобританія велика країна, в ній багато вчених - цілком можливо, що за певних зусиллях там можна знайти вченого, який дотримується потрібної точки зору.

    Одним з головних джерел "наукових новин" з островів Туманного Альбіону є газета Daily Mail, чий авторитет у науковому світі близький до авторитету в тому ж науковому світі газети "Вогні Заполяр'я". Daily Mail - Дуже якісний таблоїд, співробітники якого вміють придумувати яскраві заголовки і хороші сюжети. Ні перевіркою отриманих даних, ні, боронь Боже, рецензування статей вони не займаються - і навіть з наукових новин вибирають тільки ті, які можна ефектно подати і продати цільової аудиторії. А цільова аудиторія Daily Mail - особливі люди, які у Британії давно стали об'єктом злих жартів (у нас аналог підібрати досить важко - ну хіба що читачі "Комсомольської правди" і "Експрес-газети"? - Но что-то підказує, що 35 відсоткам населення, які вважають Євгена Петросяна своїм улюбленим артистом, російський аналог Daily Mail припав би до душі).

    "Незалежні" лабораторії

    Не виключено, що в більшості "незалежних" лабораторій працюють саме "британські вчені". Як би там не було, "незалежні" лабораторії дивно часто домагаються такого результату, якого чекає від них рекламодавець. І головний метод забезпечення потрібних результатів - грамотний підбір групи, на якій будуть проводитися випробування. В ідеалі статистична вибірка повинна бути досить широкою і складеної випадковим чином, однак на практиці це часто неможливо виконати. Якщо, наприклад, замовника цікавить, як поставляться до його товару забезпечені домогосподарки від 20 до 27 років, то платити за залучення до опитування пенсіонерів він не буде, та й вибірку на два десятки чоловік може вважати цілком достатньою. На виході отримуємо витончений прес-реліз, з якого випливає, що дев'яносто відсотків жінок, що взяли участь в дослідженні ефективності крему від зморшок, відзначили, що після трьох тижнів використання крему зморшки значно розглядалися. Найцікавіше, що все в цьому прес-релізі - чиста правда, хоча в двадцять років зморшок, напевно, не дуже багато.

    Величина вибірки багато в чому залежить від об'єкта досліджень. Якщо, скажімо, для дослідження ефективності крему з лишком вистачило б тисячі випадково обраних жінок, то для перевірки ефективності щеплення від поліомієліту не вистачило в Свого часу 1200 дітей, половині яких було зроблено щеплення, а половині -- немає. Власне, сама перевірка пройшла цілком успішно - ніхто з щеплених дітей під час епідемії поліомієліту не захворів. Зіпсувало картину те, що з нещеплених дітей теж жоден не захворів. З тієї простої причини, що поліомієліт, слава богу, не застуда. І навіть під час епідемії ймовірність захворіти поліомієлітом загрожує дуже малої частки населення. Дітям пощастило. Експериментатори, які повинні були спочатку взяти більш широку вибірку, - Не дуже.

    Часом джерелом потрібних замовнику даних є не полувіртуальная незалежна лабораторія, а цілком поважна наукова організація. Дозволити собі таке можуть тільки дуже багаті компанії, які замовляють дослідження відразу в декількох інститутах, а потім вибирають ті результати, що не суперечать "політику партії". За очевидних причин інформації про таких угодах вкрай мало, але то тут, то там, буває, спливе шматочок внутрішньої корпоративної листування, з якої зацікавлені читачі можуть дізнатися, наприклад, що на початку 1990-х одна велика тютюнова компанія заборонила публікацію замовленого нею ж дослідження, тому що за результатами цього дослідження виходило, що на здоров'я тварин пасивне куріння діє погано. До щастя, у компанії на руках було інше дослідження, в якому говорилося, що протягом дев'яноста днів у спостережуваних тварин ніяких серйозних відхилень помічено не було. Воно й пішло в хід.

    Ще один приклад, який можна тут привести, не пов'язаний безпосередньо з незалежними лабораторіями, а пов'язаний, швидше, з не дуже добросовісної рекламою. Як і переважна більшість статистичних фальсифікацій, він дуже простий і формально фальсифікацією не є, однак вводить споживача в оману. Це реклама пайових інвестиційних фондів, які - якщо вірити цій самій рекламі -- є вкрай прибутковими підприємствами. На який зацікавився майбутніми мільйонами інвестора з задоволенням обрушать гору статистичної інформації, наочно доводить, як мудра керуюча компанія, як обережно і разом з тим ефективніше вона розподіляє кошти, як виросли активи її клієнтів за останній рік і так далі. І все це правда. Все так і є. З тією лише різницею, що таких фондів у компанії безліч, рекламує вона, зрозуміло, найуспішніші і ніяких гарантій, що активи будуть рости і далі, звичайно ж, не дає. Якщо б компанію цікавила не прибуток, а репутація, вона, можливо, звернула б увагу потенційного інвестора на те, що втратила гроші на багатьох своїх починаннях, а також на той простий факт, що передбачити зростання або падіння в довгостроковому періоді просто неможливо. Але в компанії, які дбають про репутацію на шкоду прибутку, багато грошей не принесуть, тому фінансисти роблять вигляд, що виростили цілий ліс, навіть якщо з усіх саджанців прижився лише один. Розумному і цього достатньо, а в дурня все одно хто-небудь гроші витягне - так краще вже ми, ніж які-небудь шахраї. Адже і не причепишся ні до чого. Все чесно.

    Державні агентства

    На Насправді, дані державних агентств - це, мабуть, одні з самих чистих і кращих даних, які може отримати дослідник. Тим не менше державні служби теж не є джерелом істини в останній інстанції, оскільки фіксують не самі події, а бюрократичну реакцію на них. Для прикладу візьмемо дві цитати, які, дослівно передаючи одну й ту ж по суті статистичну інформацію, за змістом суперечать один одному. Перша взята з журналу "Світ науки" (червень 2006 року).

    За даними Федеральної служби державної статистики, російські родини розпадаються все рідше, однак кількість шлюбів з кожним роком скорочується. Згідно з останніми підрахунками соціологів, у 2004 р. в Росії було зареєстровано 635 тис. розлучень. У порівнянні з попередніми роками ця цифра вселяє оптимізм: так, в 2003 р. розірвали шлюб 798 тис. пар, у 2002 р. - 853 тис. Однак менша кількість розлучень припадає і на меншу кількість шлюбів: 979 тис. у 2004 р. проти 1 млн. 91 тис. у 2003 р. і 1 млн. 19 тис. - в 2002 р. ". Друга - з журналу "Фінанс" (# 44, грудень 2005 року).

    За перші дев'ять місяців 2005 року кількість розлучень і шлюбів, за даними Росстату, помітно змінилося, причому в протилежних напрямках. За порівняно з минулим роком росіяни стали одружуватися на 7% частіше, а розлучатися -- на 6% рідше. Почалося це не вчора. Статистика показує, що шлюб стає все міцніше вже третій рік поспіль. У порівнянні з 2002 роком кількість розлучень скоротилося майже в півтора рази і за перші дев'ять місяців становило приблизно 442 тис., у той час як сімей було створено понад 800 тис. І якщо в 2002 році на кожні сто шлюбів припадало 84 розлучення, то в 2005-му (за підсумками дев'яти місяців) - Тільки 55 ".

    В цитатах є дивацтва великі і невеликі. У першій цитаті чомусь наводиться відверто застаріла статистика - і це невелика дивина, яку можна пояснити недоглядом редактора, який писав врізку поспіхом (наприклад, не встигла людина знайти більш актуальної інформації - буває). А ось те, що в статті, з якої взята цитата друге, факт зменшення кількості укладених шлюбів у 2002-2004 роках опущений як незначний, - вже велика дивина. Це часто зустрічається прийом: якщо потрібно показати впевнене зростання чого-небудь, увагу читача фокусується на ретельно обраному періоді часу, де зростання дійсно спостерігається. До речі, оскільки розлучення є похідною функцією шлюбу, цікаво подивитися, чи не викликане чи зменшення кількості розлучень тим простим фактом, що почали розпадатися шлюби, поміщені в "неврожайні" для оформлення шлюбу роки, але такий статистики, на жаль, немає, як немає і достовірних відомостей про те, скільки здатний протриматися середньостатистичний шлюб, що закінчується розлученням.

    Втім, мова про інше. А що, взагалі кажучи, означають ці числа? Наскільки вони співвідносяться з реальністю, даною нам у відчуттях? Та не дуже-то. Ця статистика зібрана на основі актів цивільного стану, і, як наслідок, у неї увійшли тільки ті пари, які оформили свої відносини офіційно. Люди, що живуть у цивільному шлюбі, в офіційну статистику не потрапили, тому що їх враховувати важко, точніше дорого. Між тим вони живуть разом, ведуть спільне господарство, виховують дітей (таких пар, правда, не дуже багато - зазвичай люди оформляють відносини перед народженням дитини, - але теж є), розходяться, нарешті. Але в цій статистиці їх немає, хоча якби державне агентство принципово ігнорував людей з рудим кольором волосся, "похибка" вимірювання була б куди менше. Власне, до агентства претензій найменше -- воно вважає те, що може порахувати. Інша справа, що ці дані інтерпретуються так, ніби є відображенням реальної ситуації, хоча ніяких підстав припускати таке немає.

    Ще один невеличкий приклад пов'язаний зі зменшенням кількості самогубств в Російській Федерації. Дуже здорова критика статистики по самогубств взагалі викладена у Джоела Беста в "нахабної брехні і статистику", але основне положення можна коротко переказати і в журнальної статті, благо воно формулюється просто: ми не знаємо, скільки людей дійсно вбиває себе. Всупереч поширеній думку багато (я боюся говорити "більшість", нехай буде "багато") самогубці не залишають записок, і галочка в графі "самогубство" часто не більше ніж припущення. Часом цілком обгрунтоване. Ми цілком можемо припустити, що людина, з'їв упаковку снодійного, збирався покінчити життя самогубством. Або, наприклад, якщо він написав на асфальті "У моїй смерті прошу звинувачувати Клаву К.", а потім викинувся з вікна - це теж схоже на самогубство. Або, приміром, він їхав вночі по МКАД зі швидкістю 200 км/год і спробував в'їхати в загородження - це самогубство чи ні?

    Під всіх гіпотетичних випадках, окрім, мабуть, друга, ми можемо мати справу як з самогубством, так і з нещасним випадком або навіть з убивством. Таким чином, в основі цих статистичних даних лежать навіть не акти цивільного стану, які хоч і неповно відображають реальність, але, принаймні, адекватно відображають якусь частину її, а судження невідомого нам людини, приймає рішення на місці. Мотиви цієї людини нам теж, за великим рахунку, невідомі. Можливо, протягом кількох років поспіль він записував у самогубства всі сумнівні випадки, крім тих, коли не було ніяких сумнівів, що розправитися з собою самостійно жертва не могла. Можливо, його начальнику кілька місяців тому подзвонили і м'яко натякнули, що для обласного центру таку високу кількість самогубств просто непристойно. Міг людина випасти з вікна в результаті нещасного випадку? Звичайно, міг. А якщо міг - значить, випав.

    На всяк випадок повторюся, що в нас немає ніякої достовірної інформації про те, чому самогубств в Росії стало менше (і, зрозуміло, всі припущення про дзвінках або навмисної маскування вбивств під самогубства не більш ніж гіпотетичні приклади - не більше того). Але достовірної статистики по самогубств в Росії немає. Вона могла б бути - хай не абсолютно, але хоча б щодо достовірної, коли можна розмірковувати про темпи зростання або падіння кількості самогубств, не прив'язуючись до конкретних цифр, - але для цього потрібна гарантія, що правила гри на роздоріжжі не змінюються.

    Якщо міркування про статистику самогубств не здаються вам переконливими, погляньте на динаміку статистики злочинів у Російській Федерації і, якщо вдасться, поговоріть з людьми, які намагалися звернутися до міліції з важко розкриваються справою. Втім, ця статистика цілком достовірна у відносному сенсі - якщо вважати, що опір чергового, який не бажає відкривати справа, являє собою постійну величину і з часом не змінюється.

    Добрі люди

    Добрі люди можуть сильно відрізнятися один від одного, але об'єднує їх одне - бажання довести свою точку зору будь-яким способом. І статистика їм тільки допомагає. Для початку візьмемо щодо нешкідливий приклад соціальної реклами, яка ефективно експлуатує як дані офіційної статистики, так і поширені омани. Керуючись виключно благими намірами.

    Багато хто, напевно, бачили ролик, в якому йдеться про те, що на російських дорогах щорічно гине близько 35 тисяч чоловік, тобто населення невеликого міста. Оскільки всім нам вже вуха прожужжали про п'яних водіїв, логічно припустити, що в переважній більшості смертей винні саме вони. Однак знайомство з цифрами показує, що, по-перше, за останні сімроків у статистикою ГИБДД більше 35 тисяч загиблих було тільки в 2003 році, по-друге, в 2006 році (а більш свіжої річної статистики зі зрозумілих причин не існує) загинуло не 35 тисяч чоловік, а 32 724 людини, і по-третє, за вини водіїв, які перебували за кермом у нетверезому стані, загинуло 2 673 людини (що, звичайно, теж дуже багато, але все ж таки менше десяти відсотків від загальної кількості загиблих). При цьому п'ята частина всіх ДТП сталася через порушення правил дорожнього руху пішоходами, яких загинуло більше семи тисяч чоловік.

    З соціальної реклами випливає, що винна в смертях недотримання правил дорожнього руху, причому саме недотримання водіями. По-людськи цей заклик зрозумілий, і, напевно, можна підібрати статистику, доводить саме це. Але куди подіти сім тисяч пішоходів, які, на свою біду, не дивляться на дорогу? Як пояснити надзвичайно високу смертність через аварії в Московській області в порівнянні з Москвою (тут може бути кілька припущень, але хотілося б, звичайно, не припущень, а відповідей)? Що, наприклад, робити з тим фактом, що в Москві занудне дотримання правил дорожнього руху напевно призведе до аварії в перший же тиждень експерименту?

    Ми не закликаємо не зважають на правила. Але опублікована статистика дійсно породжує більше запитань, ніж відповідей, заклик ж дотримуватися правил -- правильний по суті - навряд чи є достатнім, щоб значно знизити смертність на дорогах. А правильно поставлені питання вже точно не завадили б безпеки руху.

    Так, звідки, до речі, взялися ще майже 2,5 тисячі чоловік? Вони взялися з припущення, що статистика ГИБДД неповна, тому що до числа загиблих у ДТП включаються лише ті люди, що померли в перші сім днів після аварії. Ті, хто в цей термін, вибачте, не вклався, в статистику не входять. Не дуже, правда, зрозуміло, чому автори гасла вирішили округлити саме до 35 тисяч - з тим же успіхом вони могли сказати, що на дорогах гине сорок тисяч людей на рік. Все одно ніяких способів перевірити це твердження немає - і тим не менш воно може бути правдою.

    Копаючись в викладеної в загальний доступ статистикою ГИБДД, я, на свій подив, не виявив так старанно рекламованої окремими сенаторами статистики по ДТП з участю праворульних автомобілів. Якщо вона й існує, то простим смертним доступна лише зі слів членів Ради Федерації, які стверджують, що в 2004 році в ДТП за праворульних автомобілями загинув 2 741 чоловік.

    У мене немає ніяких сумнівів, що члени Ради Федерації, намагаючись заборонити ввезення і експлуатацію автомобілів з правим кермом, керувалися виключно благими намірами, але навіть якщо взяти на віру, що статистика така існує, залишається дуже багато питань. Наприклад, з чиєї вини були вчинені ці ДТП (ми вже бачили вище, що в значній частині ДТП винні пішоходи, яких жоден даїшник, до речі кажучи, не чіпає)? Як розподілилися ці аварії по регіонах? Наприклад, в Далекосхідному окрузі потрапити в ДТП на леворульном автомобілі важко, тому що леворульний автомобіль потрібно ще знайти. Чи фіксують співробітники ГИБДД при оформленні протоколу, з правим або лівим кермом був постраждалий автомобіль, і якщо так, як давно вони це роблять? Чи можна, порівнявши кількість леворульних і праворульних автомобілів в Москві (якщо є така статистика) або в країні (якщо є така статистика) з кількістю ДТП, у яких винні водії цих автомобілів (є така статистика), зробити висновок, що праворульниє автомобілі небезпечніше леворульних чи навпаки?

    Випадок з антипропаганда праворульних автомобілів - чистої води підміна понять, коли під виглядом відповіді на одне питання співрозмовнику дається відповідь на питання, який мало того що не ставив, так ще нікому особливо і не цікавий. При це зовсім неважливо, наскільки об'єктивна наведена у відповіді статистика.

    Проблема середнього

    Ремарка

    Просто, щоб розставити крапки над i. Ми виходимо з того, що якщо ФЦП підвищення безпеки руху допоможе врятувати життя хоча б одній людині, то вона вже хороша. Але сам механізм соціального деформації цілком адекватних статистичних даних цікавий. Тим більше, що зустрічається досить часто. Так, кілька років тому в США домовилися до того, що ожиріння щорічно забирає більше життів, ніж куріння (що, взагалі кажучи, не зовсім так).

    Термін "середньостатистичний" вже давно використовується так широко, що й терміном бути перестав. Втім, широке використання не робить це слово ясніше. У першу чергу тому, що незрозуміло, що саме розуміти під середнім взагалі.

    Класичний приклад (який призводить Хафф і майже всі його послідовники, справедливість, по-моєму, щось подібне я чув ще в школі, хоча мої вчителі Хаффа, звичайно, не читали) звучить приблизно так: в певній організації працюють 100 осіб, з них 95 отримують, скажімо, 40 тисяч рублів на місяць, чотири менеджера отримують 100 тисяч рублів на місяць, а власник бізнесу, він же генеральний директор, отримує п'ять мільйонів, тому що у нього велика родина. Запитання: яка середня зарплата в цій організації?

    Спроба розрахувати середнє арифметичне приводить нас до безглуздої, в общем-то, зарплати в 92 тисячі рублів. Цей показник, звичайно, близький до зарплати менеджера, але навряд чи 95 робочих вважатимуть такий підрахунок справедливим. І зрозуміло, що погоду псує директор, який зі своєю родиною вибивається з розподілу. Тому для таких випадків зазвичай використовується медіана - вибирається серединна значення (тобто, в нашому випадку, сорок тисяч рублів). Зрозуміло, це теж неідеальне рішення, оскільки ні зарплати менеджерів, ні зарплата директора в ньому не враховані, однак воно куди ближче до реального стану справ, ніж попередній варіант.

    Це зовсім не вища математика, в цьому здатний розібратися навіть не самий здатний третьокласник. Однак коли ми стикаємося не з реальною статистикою, а скоріше з її переказами, то дуже часто розуміємо, що у нас немає взагалі ніякої інформації про те, як вважалися середні показники (і чому).

    Художник

    І ось ці неповні, а часто доповнені забобонами статистиків і численних оповідача інформації (кожен з яких на своєму етапі може внести в дані помилки), потрапляють нарешті до художника. У художника завдання проста. Він має взяти табличку в Excel і зробити з неї гарну картинку.

    Для простоти давайте поки що вважати, що художник чесний і дійсно хоче зробити хорошу ілюстрацію, керуючись при цьому своїми уявленнями про хороше. І дані в нього непогані, бувають і гірше.

    Гіпотетичний приклад:

    Журнал "Компьютерра" в місті N купує сто чоловік. Тридцять п'ять студентів, тридцять керівників, п'ятнадцять співробітників комп'ютерних компаній, десять домогосподарок, три біолога, чотири лікаря, два олігархи та кондуктор трамваю.

    Логіка диктує художнику, що дрібними показниками можна знехтувати. На діаграмі вони будуть виглядати некрасиво. Тому художник, анітрохи не сумніваючись у правильності обраного рішення, змінює статистику так, щоб вона укладалася в картинку. І тепер "Компьютерра" в місті N купують студенти, керівники, співробітники і таємниче Інше, у яке митець запхав і олігархів, і біологів, і лікарів, і навіть кондуктора.

    Тепер припустимо, що у нашого художника гнучка мораль, і головний редактор "Компьютерра" поставив перед ним складне завдання: намалювати таку ілюстрацію, з якої б виходило, що за останні дев'ять місяців тираж журналу виріс у двадцять разів (насправді він виріс трохи менше, ніж у півтора рази, тому завдання на перший погляд здається нетривіальною).

    Це робиться дуже просто. По-перше, потрібно вибрати правильну точку відліку. Якщо взяти за основу діаграму, що відображає реальний стан речей, то по ній, звичайно, ніякого двадцятиразового збільшення не отримаєш. Але варто підняти вісь абсцис до рівня 63 тисяч і обрізати які пішли в мінус елементи, як положення моментально змінюється. Візуально ми сприймаємо це зображення як зростання з 1 тисячі до 27 тисяч - у наявності збільшення в 27 разів. Тепер, щоб вісь ординат з незручними для нас показниками (ну справді, 63 тисячі на нулі - кому це може бути цікаво, це ж так, деталі?) менше кидалася в очі, ми можемо зробити ще два підтяжечкою (тут все залежить від нахабства художника і відчайдушності поставленого завдання). По-перше, ми можемо просто прибрати всі баламутять написи -- але це грубо. Більш поширений метод полягає в розвороті графіка: стовпчики з показниками переводяться в 3D, причому ближній до нас стає ще більше за рахунок перспективи, а що заважають сприйняттю підписи хоч і не прибираються зовсім, але в очі впадають куди менше.

    Щоб подивитися, як це застосовується в реальному житті, досить поглянути на діаграму 4. Це сувора ділова графіка, тут немає як такого розвороту до глядача, та і підписи всі на місці, але зрушення осі і 3D присутні.

    В захист співробітників ГИБДД можна сказати, що, швидше за все, тривимірність графіка не навмисно - парадокс в тому, що незважаючи на дружний хор фахівців з дизайну, які пропонують не захоплюватися 3D-графіками, найбільш популярні засоби побудови графіків фактично провокують користувачів на використання 3D. Робити 3D-графіки нескладно, впливають вони ефективно, а те, що відображають реальність "творчо" - так це проблеми реальності.

    З художником пов'язана і проблема площ. Дуже часто для візуалізації статистики зручніше застосовувати не діаграму, а спеціально створену ілюстрацію, на якій збільшення будь-якого показника демонструється збільшенням площі. Але малює художник на око, і, як правило, співвідношення витримується нечітко (якщо потрібно показати зростання показника, художник помиляється в більшу сторону, якщо падіння - в меншу; іншими словами, художник майже завжди малює велику площа, ніж потрібно).

    В завершення скажемо, що всі перераховані художні прийоми не хибні самі по собі. Зміщення осі, наприклад, нерідко використовується для того, щоб показати зміна показника (якщо використовувати реальні масштаби, читач просто нічого не помітить). Для демонстрації зміни щоденних біржових індексів зміщення осі звичайна справа. Але саме ці прийоми найчастіше використовуються для викривлення інформації, яка вже могла пройти через декілька раундів спотворення на етапах збору та інтерпретації.

    Замість резюме

    Картина виходить безрадісна. У читача, роздивляється тривимірний графік у газеті, є купа шансів нарватися на фальшивку, навіть якщо учасники ланцюжка -- кришталевої чистоти люди. Починається все з неповної статистики, яка під багатьох випадках і не може бути повною. Неповні сирі дані доповнюються упередженнями інтерпретатора і аналізуються в зручному для нього ключі. Потім цей блок даних потрапляє до художника, який проводить ще пару хірургічних операцій, а потім - малює приблизний образ в черговий раз зміненої інформації так, як він його зрозумів.

    І це при тому, що ми розповіли тільки про верхівку айсберга - через нестачу місця в статтю не увійшли такі чудові прийоми, як штучна кореляція, коли два схожих зовні, але не пов'язаних між собою тренда об'єднуються, помилки програмного забезпечення (один з найбільш ефектних графіків, що доводять глобальне потепління, насправді є результатом грубої комп'ютерної помилки, виправлення якої призводить до графіком зовсім іншої форми) і багато-багато іншого.

    Адекватна статистика існує, але, як будь-який якісний товар, що коштує дорого. І як будь-який, навіть самий дорогий товар, поставляється as is - ні вартість звітів, ні ім'я постачальника інформації гарантією якості не є, горезвісний людський фактор і складність збору статистичних даних все псують. Але у покупців є хоч якийсь шанс.

    Що ж до тих, хто бореться за свободу інформації ... Нам доводиться їсти, що дають. І платити за нібито безкоштовну інформацію або власним часом, оцінюючи, як її могли спотворити в процесі підгонки в легкотравному форму, або власними рішеннями, які будуть прийняті на її основі.

    Список літератури

    Для підготовки даної роботи були використані матеріали з сайту http://www.kinnet.ru

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status