Пропустити навігацію
Частина II Розділ 10

Конфіденційність

Вступ

У цьому розділі Web Almanac розглядається поточний стан конфіденційності в інтернеті. Ця тема останнім часом стала популярнішою та важливішою для користувачів. Потребу в настановах втілили різноманітні регламенти, такі як, наприклад, GDPR у Європі, LGPD у Бразилії та CCPA у Каліфорнії. Ці правила покликані посилити відповідальність тих, хто обробляє дані, та їх прозорість перед користувачами. У цьому розділі ми поговоримо про поширеність онлайн трекінгу за допомогою різних технік та про рівень прийняття веб-сайтами банерів щодо використання файлів «cookies» та політики конфіденційності.

Відстеження в мережі

Сторонні відстежувачі збирають дані користувачів, щоб будувати профілі їх поведінки з рекламною метою та отримувати за це плату. Це змушує інтернет-користувачів непокоїтися за свою конфіденційність, що виливається в появу різноманітних способів захисту від трекінгу. Проте, як ми побачимо у цьому підрозділі, онлайн трекінг й досі доволі поширений. І це негативно впливає не тільки на конфіденційність, але й на навколишнє середовище, а уникнення цього може навіть покращити продуктивність веб-сайтів.

Ми розглянули найпоширеніші типи сторонніх трекерів, а саме відстеження з допомогою сторонніх файлів «cookies» та з використанням фінґерпринтингу. Онлайн трекінг не обмежується цими двома техніками, нові продовжують з’являтися, щоб обходити наявні контрзаходи.

Стороні трекери

Ми використовуємо список відстежувачів від WhoTracksMe для визначення відсотку веб-сайтів, які роблять запити до потенційних трекерів. Як показує графік, ми визначили, що як мінімум один потенційний відстежувач присутній на близько 93% сайтів.

Рис. 10.1. Веб-сайти, що завантажують хоча б один потенційний трекер

Ми вивчили найпоширеніші трекери й побудували графік поширеності 10 найпопулярніших.

Рис. 10.2. Топ-10 потенційних трекерів

Найбільшим гравцем на ринку онлайн трекінгу є, безперечно, Google з вісьмома доменами серед топ-10 потенційних відстежувачів і присутністю щонайменше на 70% веб-сайтів. За ними слідує Facebook та Cloudflare, хоча останній найімовірніше відображує його популярність як хостингу.

Список трекерів від WhoTracksMe також визначає категорії, до яких належать відстежувачі. Якщо виключити CDN-и та хостинг-сайти зі статистики, припускаючи, що вони не відстежують, або принаймні це не є їх основною функцією, отримаємо дещо інший погляд на топ-10.

Рис. 10.3. Топ-10 трекерів

Google все ще має 7 з топ-10 доменів. Наступний графік показує поширення різних категорій для 100 найбільших потенційних трекерів за категоріями.

Рис. 10.4. Категорії 100 найпопулярніших потенційних трекерів

Майже 60% популярних трекерів стосуються реклами. Це може бути причиною високої дохідності ринку онлайн реклами, що сприймається у відношенні до кількості трекінгу.

Файли «cookies»

Ми переглянули найпопулярніші файли «cookies», додані з допомогою заголовку HTTP відповіді, згідно з їхніми іменами та доменами.

Домен Ім’я файлу Веб-сайти
doubleclick.net test_cookie 24%
facebook.com fr 10%
youtube.com VISITOR_INFO1_LIVE 10%
youtube.com YSC 10%
doubleclick.net IDE 9%
doubleclick.net unknown 9%
youtube.com GPS 9%
doubleclick.net unknown 8%
google.com NID 6%
doubleclick.net unknown 6%
Рис. 10.5. Найпопулярніші файли «cookies» на настільних веб-сайтах
Домен Ім’я файлу Веб-сайти
doubleclick.net test_cookie 32%
doubleclick.net IDE 21%
facebook.com fr 10%
youtube.com VISITOR_INFO1_LIVE 10%
youtube.com YSC 10%
google.com NID 10%
youtube.com GPS 8%
doubleclick.net DSID 7%
yandex.ru yandexuid 6%
yandex.ru i 6%
Рис. 10.6. Найпопулярніші файли «cookies» на мобільних веб-сайтах

Як можна побачити, домен для відстеження від Google «doubleclick.net» додає файли «cookies» майже на чверть мобільних веб-сайтів та на третину настільних. І знову ж 9 з 10 найпоширеніших файлів на настільних та 7 з 10 на мобільних клієнтах встановлюються доменом Google. Це найнижча межа кількості веб-сайтів, на яких додаються куки, оскільки ми тільки враховуємо файли, які встановлюються HTTP заголовком. Величезна кількість файлів «cookies» для відстеження додаються, використовуючи сторонні скрипти.

Фінґерпринтинг

Іншою поширеною технікою для відстеження є фінґерпринтинг. Він являє собою збирання різної інформації про користувача з метою створення унікального «відбитку» для його ідентифікації. Трекери використовують різні види фінґерпринтингу. Браузерний фінґерпринтинг використовує характеристики, специфічні для браузера користувача, спираючись на той факт, що шанс отримати тотожні налаштування браузера для іншого користувача доволі низький, якщо кількість змінних для відстеження достатньо велика. У нашому аналізі ми перевіряли наявність бібліотеки FingerprintJS, яка надає браузерний фінґерпринтинг як сервіс.

Рис. 10.7. Веб-сайти, що використовують FingerprintJS

Хоча цю бібліотеку і використовує невелика кількість веб-сайтів, стійкий характер фінґерпринтингу означає, що навіть незначне використання може мати надзвичайний вплив. До того ж FingerprintJS — не єдина спроба фінґерпринтингу. Інші бібліотеки, інструменти та нативний код також можуть виконувати цю функцію, тож це лише один приклад.

Платформи керування згодою

Банери щодо згоди на використання файлів «cookies» стали звичною справою. Вони роблять використання куків прозорішим та часто дозволяють користувачам визначати власні вподобання. Хоча багато сайтів створюють власні банери щодо використання файлів «cookies», останнім часом стали з’являтися сторонні рішення, які називають платформами керування згодою. Ці платформи стають простим способом для веб-сайтів збирати згоди користувачів для використання різних типів кук. Ми бачимо, що 4,4% веб-сайтів використовують платформи керування згодою, щоб визначати вподобання користувачів щодо файлів «cookies» на настільних клієнтах та 4,0% — на мобільних.

Рис. 10.8. Веб-сайти, які використовують платформи керування згодою
Рис. 10.9. Популярність платформ керування згодою

Порівнюючи популярність різних платформ керування згодою, ми бачимо, що Osano та Quantcast Choice лідирують серед інших.

IAB Europe (Interactive Advertising Bureau, або Бюро Інтерактивної Реклами) — це європейська асоціація цифрового маркетингу та реклами. Вони запропонували Transparency Consent Framework (TCF) як рішення для отримання дозволу користувачів на збереження їхніх налаштувань щодо цифрової реклами, що відповідає стандартам GDPR. Слідування цьому фреймворку створює стандарт для індустрії у комунікації між видавцями та рекламодавцями щодо згоди споживача.

Рис. 10.10. Рівень прийняття банерів TCF

Хоча наші результати показують, що TCF банер ще не став «стандартом для індустрії», це вже є кроком у правильному напрямку. Враховуючи, що основною цільовою групою для IAB Europe є фактично європейські видавці, а наша вибірка є глобальною, отримати рівень прийняття у 1,5% настільних веб-сайтів та 1,4% у мобільних — це все дуже непогано.

Політика конфіденційності

Політика конфіденційності широко використовується веб-сайтами для виконання юридичних зобов’язань та підвищення прозорості перед користувачами щодо збирання даних. Для нашої вибірки ми шукали ключові слова, які б вказували на наявність політики конфіденційності на кожному веб-сайті, який ми відвідали.

Рис. 10.11. Веб-сайти, які мають політику конфіденційності

Результати показують, що майже половина веб-сайтів у наборі даних має сторінку з політикою конфіденційності, що є однозначно позитивним моментом. Однак дослідження показують, що більшість користувачів інтернету не завдають собі клопоту читанням політики конфіденційності, а коли і роблять це, то не все розуміють через велику кількість тексту та його складність. І все ж наявність політики конфіденційності є кроком у правильному напрямку!

Висновок

Цей розділ показав, що сторонні трекери залишаються помітними як на настільних, так і на мобільних клієнтах, а Google відстежує найбільший відсоток веб-сайтів. Платформи керування згодою використовуються мізерною кількістю веб-сайтів, хоча доволі багато сайтів створюють власні банери щодо згоди на використання файлів «cookies».

Наостанок, майже половина веб-сайтів має сторінку з політикою конфіденційності, що підвищує прозорість для користувачів щодо обробки їхніх даних. Без сумніву, це крок вперед, але роботи все ще багато. За межами цього аналізу ми розуміємо, що політику конфіденційності важко читати, а банери щодо згоди на використання файлів «cookies» маніпулюють користувачами, щоб отримати їхній дозвіл.

Для того, щоб інтернет справді поважав користувачів, конфіденційність має бути частиною концепції, а не останньою думкою. Регулювання — це добре в даному питанні, заспокоює, коли бачиш підвищення регулювання у сфері конфіденційності по всьому світу. Навмисна конфіденційність має бути нормою, а не додаванням політик та інструментів в останній момент, щоб відповідати мінімальним юридичним вимогам й уникати штрафів.

Автор

  • Yana Dimova
    Yana Dimova — аспірантка Левенського католицького університету у Бельгії. Вона вивчає конфіденційність та інтернет-безпеку.

Цитування

BibTeX
@inbook{WebAlmanac.2020.Конфіденційність,
author = "Dimova, Yana і Satyagraha, Laurent Devernay і Ostapenko, Max і Pollard, Barry",
title = "Конфіденційність",
booktitle = "Web Almanac 2020",
chapter = 10,
publisher = "HTTP Archive",
year = "2020",
language = "Українська",
url = "https://almanac.httparchive.org/en/2020/privacy"
}