Особливості національної інтернет-статистики h2>
Юрій Коберскій p>
Існує
класична формула маркетингу з чотирьох основних складових: p>
•
Аналіз p>
•
Планування p>
•
Виконання p>
•
Контроль p>
Те
Тобто, якщо ви створюєте новий або розкручуєте існуючий бізнес, вам
необхідно проаналізувати поточну ситуацію на ринку, на який ви
претендуєте, чітко спланувати свою маркетингову стратегію, провести всі
необхідні роботи і потім ретельно контролювати його виконання. На сто
відсотків прийнятна ця схема і під час роботи по створенню веб-проектів. Причому,
напевно, саме важливе місце в цьому формулюванні займає аналіз поточної
ситуації сайту і положення на ринку. Усім, хто хоч як-небудь мав справу з
просуванням веб-проектів, розуміє, що це - дуже затягнутий за часом
процес і починає себе окупати не скоро. І при такому розкладі вихідні
установки, на яких буде базуватися вся робота, мають визначальний
значення - адже якщо вони будуть спочатку неправильні, то термін повторних робіт,
будучи і без того чималим, подвоїться. p>
Отже,
приступимо до аналізу. Для початку візьмемо сайт. Звичайний сайт, не особливо розпещений
відвідувачами, орієнтований на конкретну аудиторію і що пропонує
певний вид товарів або послуг. Наша мета - вивести його на перші сторінки
пошукачів і направити до нього цільовий трафік. Але для того, щоб приступати до
роботі, необхідно дати відповідь на цілий ряд питань. Потрібно знати причини,
чому існуючий сайт не займає лідируючі позиції, звідки приходять
відвідувачі, як вони переходять з однієї сторінки сайту на іншу, і головне --
чому вони купують або не купують товари, запропоновані на ньому, тобто,
оцінити ступінь оптимізації і рівня юзабіліті сайту (зручності для
користувачів). p>
При
такого роду аналізі слід враховувати, які пошукачі дають найбільше
трафіку, які сторінки є найбільш популярними точками входу, як ведуть
себе відвідувачі, на які сторінки переходять і чому. І головне - чи доходять
відвідувачі до кінцевої мети сайту - сторінки замовлення, або залишають сайт, не
знайшовши такої. Часто відвідувачі залишають сайт з-за того, що просто не
можуть розібратися у навігації по сайту. Така інформація просто необхідна для
початку робіт з поліпшення й оптимізації ресурсу. p>
Потрібна
точна і гнучка система статистики, що дозволяє переглянути дані про
відвідуваності сайту у всіх можливих площинах. На даний момент існує
два поширених способу відстеження статистики відвідувань - лічильники та
лог-аналізатори. Кожен з них має свої переваги і недоліки. Як
правило, лічильники годяться для широкого кола користувачів, лог-аналізатори ж
використовують більш досвідчені вебмастера. p>
Звичайно,
оптимальне рішення - це комбінація обох видів збору інформації, але такі
сервіси поки рідкість. Користувачі можуть комбінувати обидва види послуг, таким
чином, заповнюючи недоліки однієї системи перевагами іншої. Стандартні
позиції вебмайстрів по відношенню статистики своїх сайтів можна сформулювати
наступним чином. Одна - «лічильники всі вважають», інша, протилежна --
«Немає нормального аналізатора - потрібно написати свій». Багато хто так і роблять.
Добре, що останнім часом ця позиція похитнулася, тому що з'явилися гарні
аналізатори. Отже, давайте порівняємо основні недоліки та переваги обох
систем. Головний недолік лічильників - це відсутність обліку відвідувань пошукових
роботів. Вебмастер, розкручують новий ресурс, має потребу в такій інформації
критично, оскільки від того, чи був ресурс проіндексовані, залежить термін
появи ресурсу на пошуковому сервері. Крім того, лічильники надають
недостатньо гнучкий звіт за статистикою, вони обмежуються, як правило, загальною
інформацією про відвідуваність і про відвідувачів. p>
Що
ж повинен вміти лічильник? Точніше, що він повинен показувати? Візьмемо головні
вимоги до середньостатистичного лічильником: p>
•
Хто прийшов. Тут повинна відображатися інформація про користувача, що прийшов на
Ваш сайт (його IP, браузер, ОС) p>
•
Реферер, тобто, сторінка, з якою він прийшов. Життєво важливий фактор. Допоможе
вебмайстеру планувати і аналізувати ефективність рекламної стратегії, бо
з цієї інформації можна робити висновки про те, чи варто продовжувати
рекламуватися на тому чи іншому майданчику. p>
•
Час заходів, бажано повна інформація про час всієї сесії користувача
на сайті, час перебування на кожній сторінці і т. д. p>
•
Загальна статистика відвідуваності, бажано з детальним розподілом за часом
p>
•
Інформація про хостах, відвідувачів, хітах і сесіях p>
Краще
за все така інформація відображається одним із лідерів вітчизняної
інтернет-статистики - HotLog, який, до речі, дуже зручний у користуванні та
надає цілий ряд послуг як платних, так і безкоштовних. p>
Але
ні на одному лічильнику немає такої інформації: p>
•
Завантаження екзешніков, музики, флеш-об'єктів і ін p>
•
Кількість відвідувачів, які зайшли один раз, (випадкові заходи) і постійних
(цільова публіка) p>
•
Інформації про виконання скриптів в браузері при заході на сторінки p>
Майже
вся ця інформація відображається в журналах, однак значну її частину
неможливо засікти лічильником. Вийняти і проаналізувати її можна за допомогою
програм лог-аналізаторів. Складемо же список вимог до аналізатора логів: p>
•
Гнучка система звітності - це головна перевага аналізаторів перед
лічильниками, де звіти фіксовані p>
•
Розпізнавання якомога більшої кількості пошукових роботів p>
•
Розпізнавання заходів з пошукових систем. Лічильники чомусь розділяють заходи,
наприклад, з google.com і google.ru p>
•
Розпізнавання географії користувачів. На жаль, така функція доступна лише
в деяких програмах, тому що вимагає величезної, постійно оновлюється бази
даних IP-адрес p>
•
Налаштування система звітів. p>
Лог-аналізатор
видає багато зайвої інформації, яку слід фільтрувати, але допомагає,
наприклад, при відстеження хакерських атак. Крім того, програми кілька
дорогі, а безкоштовні, як правило, нікуди не годяться. Розглянемо загальну
функціональність декількох лог-аналізаторів, вартих особливої уваги. p>
Отже,
лог-аналізатор від WebTrends. Дуже потужний інструмент для збору та обробки
статистичної інформації, визнаний лідер серед лог-аналізаторів. Система
звітів настільки вичерпна, що важко розібратися навіть після тижня
роботи. Один із кращих інструментів за функціональністю для досвідчених
вебмастерів. Недоліків можна навести тільки два - чимала ціна і
некоректне відображення кириличним кодувань. p>
Програма
того ж напрямку, Log Analyzer від компанії NetPromoter, відмінно справляється
зі всілякими кодуваннями. Невелика за обсягом дистрибутиву програма, тим
не менше, відповідає більшості з перерахованих вище вимог. Розпізнає
візити роботів і заходи з пошукових систем, має досить велику, але тим не
менше, гнучку систему звітів. Розпізнає різні формати лог-файлів і
дозволяє настроювати свої власні формати. Головна перевага програми
- Вона дозволяє якісно працювати зі статистикою вітчизняних пошукачів,
чого немає ні в одному закордонному аналогу. p>
Ми
зв'язалися з менеджером проекту HotLog Галиною Жукової з проханням
прокоментувати ситуацію: p>
«Лічильники
і лог-аналізатори - принципово різні інструменти вимірювання відвідуваності
web-ресурсів. І тільки в комплексі вони можуть дати найбільш повну картину по
відвідувачам сайту. Наше основне завдання на сьогодні - надавати
максимально точні і докладні дані всім нашим користувачам. Вже зараз в
системі є можливість отримання статистики по кожному окремому відвідувачу,
а також перегляду повних звітів без яких-небудь обмежень. У безкоштовному
доступі представлена досить детальна і докладна інформація, в тому числі і
за географічними параметрами. Надалі ми плануємо постійно розширювати
можливості сервісу Інтернет-статистики і прагнемо надавати найбільш
повну інформацію. » p>
Ось
що думає з цього приводу Денис Кравченко, SEO-аудитор компанії NetPromoter: p>
«Ми
ні в якому разі не намагалися створювати продукт-конкурент лічильниками. Я особисто в
своїй роботі, крім аналізу серверних логів, із задоволенням користуюся
статистикою, наданою лічильниками. Це дуже зручно і нескладно в
зверненні. Але тим не менше, для більш глибокого аналізу не можна обійтися без
аналізатора лог-файлів, чим і було обумовлено створення нашою компанією
власного продукту. Ми, безумовно, будемо розвивати програму, оскільки
потреба в таких продуктах на російському ринку простежується дуже чітко ». p>
Ну
що ж, спробуємо підбити підсумки. p>
Можна
Чи можна вважати лічильники і лог-аналізатори конкурентними продуктами? На мій погляд,
однозначно ні. До тих пір, поки не з'являться сервіси, що поєднують глобальні
статистичні можливості лічильників (порівняння відвідуваності, аудиторії
кількох сайтів та ін) і тонкі можливості лог-аналізаторів (візити роботів,
завантаження об'єктів, хакерські атаки), веб-майстрам доводиться користуватися цими
двома інструментами. Крім того, лічильники є вирішальним фактором при
визначенні рекламодавцями ціни на розміщення банерів на тому чи іншому
ресурсі. Лог-аналізатори ж годяться більш як адміністративний інструмент, «не
для сторонніх очей ». Так що, до тих пір, поки не з'явився сервіс,
об'єднуюча переваги лічильників і лог-аналізаторів, нам доведеться
користуватися як тим, так і іншим інструментом. p>
Особливості
національної інтернет-статистики. Частина 2 p>
В
черговий раз доводиться писати статтю про інтернет-статистики, і в черговий
раз ставлю собі питання: «А якою вона має бути, ця статистика? Що б
задовольнило навіть самого вимогливого користувача? »Просто хости і хіти
відображати явно недостатньо - це навіть не вчорашній день російської
статистики, а позавчорашній. Так який же ми бачимо статистику сьогоднішню, і
якою ми хочемо її бачити завтра? p>
Можна
знайти численні списки вимог до лічильників, складені всілякими
фахівцями - від реферала, тобто сторінки, з якої було здійснено захід
на ваш сайт, до дозволу і кольоровості вашого монітора. Але які з цих
вимог дійсно життєво важливі для правильного функціонування
веб-сайту, а без яких можна було б безболісно обійтися? І головне, - які
вимоги до цих пір не задоволені жодним з лічильників, і як цю
проблему можна вирішити? p>
Отже,
що ж ми маємо в більшості лічильників? Безумовно, у нас є статистика
хостів/хітів на кожному з них. Є реферер, тобто що посилається сторінка --
дуже важлива інформація при виборі і аналізі ефективності рекламних майданчиків,
де ви розміщуєте свої банери. У більшості (якщо не у всіх) лічильників є
інформація про шляхи відвідувача по сайту - починаючи з точки входу і до останньої
сторінки. Це здійснюється за допомогою cookie, який встановлюється
JavaScript'ом на вашому комп'ютері і служить вашим унікальним ідентифікатором для
даного лічильника. Це cookie, або кукіси і послужить джерелом інформації про
кількості унікальних відвідувачів на сайті, або ж хостів. Цей же JavaScript
«Витягує» інформацію про кольоровості і дозвіл екрану. Але якщо на браузері
відвідувача заборонені кукіси, то він просто залишиться неврахованою. Також на
браузері може бути відключена підтримка JavaScript - ще одне джерело
неточності. Наявність же декількох різн и х браузерів в одного користувача ще
більше заплутує ситуацію. p>
Напевно,
головним каменем спотикання лічильників (як і лог-аналізаторів, але про них пізніше)
інтернет-статистики є діалап. Отже, які ж проблеми можуть виникати
при підрахунку поголів'я діалапщіков на вашому сайті? Дослідження показують, що
в Рунеті приблизно 55 відсотків Інтернет-користувачів виходять в мережу
через комутоване з'єднання, тобто мають модемний доступ. При повільній
зв'язку лічильники, як і інші картинки, що закачується із зовнішніх серверів
(наприклад, з банерних мереж) просто не встигають довантажити. Адже
погодьтеся, мало хто стане чекати повного завантаження сторінки при повільній
зв'язку, якщо необхідна частина сторінки з посиланнями вже завантажилася. Людина,
швидше за все, просто перейде за посиланнями на наступну сторінку, попередня ж
залишиться неврахованої. Крім того, багато хто з тих, хто змушений користуватися
комутованим доступом в Інтернет, просто відключають завантаження зображень в
браузер, таким чином, заощаджуючи трафік і роблячи неможливим ведення будь-якого
обліку. p>
Небагато
лічильники показують візити роботів - фактор дуже важливий при розкручуванні нового
ресурсу - в силу того, що це важко здійснити технічно. Як правило,
робот не завантажує зображення, тобто не витягує лічильники і,
відповідно, не враховується в статистиці. Зображення ж для Google Images
або Яндексовского Пошуку Малюнків індексуються окремо. Однак ця функція
присутня в лог-аналізаторах. Так, розпізнавання роботів добре реалізовано
в програмі Log Analyzer від компанії NetPromoter. Програма від самого початку
розрахована на розпізнавання тільки роботів, потім переросла в досить потужний
повноцінний лог-аналізатор з більш ніж 180 користувацькими агентами роботів у
базі даних. p>
Дозвіл
і кольоровість екрану - гм, ця інформація, хоча і надається кожним
лічильником, стане в нагоді, напевно, лише веб-дизайнерам. Практичної цінності
для інтернет-бізнесу вона не має, хоча ... Як правило, солідний сайт повинен
мати пристойний і милує око дизайн, але це теми статті мало стосується. p>
Ну
і одним з головних недоліків, якому зараз приділяється все більш важливе
значення, є безпека. Надання доступу до статистики третій
особі може бути вкрай небажаним. Приміром, списки Реферер, якщо
дістануться конкурентам, можуть бути використані ними для реклами на самих ваших
прибуткових ресурсах. І це тільки самий безневинний приклад. Звичайно, можна закрити
статистику, але випадок з продажем списків клієнтів співробітником AOL показав, що
навіть в таких корпораціях не завжди все в порядку з конфіденційністю. p>
Тепер
про лог-аналізаторах. Тут всі одночасно і простіше і складніше. Почнемо з того, що
серверні логи фіксують всю інформацію - будь то візит пошукового робота,
завантаження мультимедійного/Flash/Java/Exe файлу, витягування окремої
картинки з сервера (ох, блогери це люблять!), і взагалі дозволяють вести облік
трафіку. Можна одержувати коди доступів до сторінок, що неможливо врахувати
лічильником (якщо тільки у вас немає кастомізовану 404-ї сторінки). При
наявності хорошого лог-аналізатора із гнучкою системою звітів веб-майстер вивудить
всю потрібну для себе інформацію. Але ... Виникає знову ж таки проблема з
діалапщікамі. При кожному коннекте користувачеві привласнюється новий IP-адресу, і
сервер, а отже, і лог-аналізатор будуть інтерпретувати його як нового
унікального відвідувача, а це не так. Ця проблема вирішена лічильниками у вигляді
вищезгаданих куки, але в лог-файлах куки не фіксуються ніяк. Далі. Як
відомо, у великих офісах, як правило, користувачі виходять в Інтернет через
проксі-сервер, що привласнює однаковий IP-адреса всім користувачам. Те
Тобто, теоретично, навіть якщо в корпорації працює 100 чоловік, і десять з
них (уявімо собі) зайдуть на ваш сайт, то сервер зафіксує їх як одного
відвідувача. Якщо ви орієнтуєтеся на корпоративного клієнта, то похибка
виходить вельми відчутна. Крім того, проксі-сервера, як правило, кешуючу
вміст запитаних сторінок, а отже, всі наступні користувачі,
які сидять за прокси, одержують, по суті одну й тугіше версію сторінки. p>
Здається,
єдиним рішенням у даній ситуації може бути комбінація двох видів
статистики. Але як цього домогтися? Адже лічильник тягнеться з сервера провайдера
статистики, а логи лежать на сервері, де встановлений сайт. Ніхто з провайдерів
статистики поки не пропонує комбінованого підрахунку. Тим не менше, сервіси,
які комбінують два види статистики існують. Так, провайдери хостингу
іноді пропонують свої власні розробки в галузі статистики. Як
правило, вони недосконалі, але можуть задовольнити базові вимоги до
статистиці. p>
Давайте
ж представимо ідеальну систему підрахунку. Як вона повинна виглядати? Уявіть
собі, ви устанавчених у себе на сайті свій власний лічильник, який
викликається з вашого ж сервера. Отримана статистика фіксується
спеціалізованою програмою. Тобто, ви самі собі HotLog або SpyLOG. Але
цього за умовою завдання недостатньо - адже у нас залишаються не задіяними
логи з їх перевагами. Ця ж програма є лог-аналізатором і
обробляє як статистику з лічильника, так і інформацію, зафіксовану в
логах. Звичайно, таку систему набагато простіше собі уявити, якщо у вас є
свій власний сервер і ви маєте повні адміністраторські права. Якщо ж ви
купуєте хостинг, це може спричинити деякі проблеми - так не всі
провайдери надають доступ до логів - але це питання скоріше вибору
провайдера. Виникає ще одна проблема - наскільки буде високо довіра
рекламодавців до такої статистики, адже відомо, що даними лічильників
визначається ціна реклами на вашому сайті. Де гарантія, що ви не накручуєте
свою статистику? p>
Тим
Проте, поки, оскільки таких систем немає, доводиться комбінувати два види
збору статистики й знаходити середину. На жаль, показання лічильників та
лог-аналізаторів можуть розрізнятися в десятки разів. Більш того, показання
лічильників можуть відрізнятися в декілька разів - так, порівняйте свідчення, скажімо,
HotLog і досить популярного британського Nedstat - на останньому, як
правило, ви отримуєте дані відвідуваності мало не на порядок більші.
Щоправда, компанія заявляє, що вона вирішила проблему з урахуванням кеш
сторінок, але навряд чи така різниця може виникати тільки на цьому. Визначити ж
яка система більш правдива досить складно. p>
Список літератури h2>
Для
підготовки даної роботи були використані матеріали з сайту http://www.publications.reporter-studio.ru/
p>