- Обезличивание — удаление идентификаторов так, чтобы данные нельзя было связать с конкретным лицом
- РКН утвердил четыре метода обезличивания: идентификаторы, изменение семантики, декомпозиция и перемешивание
- После качественного обезличивания данные могут выйти из-под регулирования ФЗ-152
- Псевдонимизация не равна обезличиванию: если связь можно восстановить — данные остаются персональными
- Обезличивание особенно важно для аналитики, тестовых сред и ML-проектов
Определение обезличивания
По статье 3 ФЗ-152 обезличивание персональных данных — это действия, в результате которых становится невозможным без использования дополнительной информации определить принадлежность данных конкретному субъекту.
Проще говоря: данные сохраняются, но установить, кому именно они принадлежат, больше нельзя.
При уничтожении данные удаляются полностью. При обезличивании информация сохраняется, но теряет привязку к конкретному человеку. Это важно для аналитики, статистики и тестирования.
Методы обезличивания по приказу РКН
Роскомнадзор утвердил четыре официальных метода обезличивания (Приказ Роскомнадзора № 996 от 05.09.2013).
1. Метод введения идентификаторов
Прямые идентификаторы (ФИО, СНИЛС, паспортные данные) заменяются кодами или внутренними ID. Таблица соответствия хранится отдельно с ограниченным доступом.
Применение: кадровые архивы, медицинские системы, CRM.
2. Метод изменения состава или семантики
Точные данные заменяются обобщёнными значениями:
- возраст → возрастная категория,
- адрес → регион,
- зарплата → диапазон.
Применение: отчётность, маркетинговая аналитика, BI.
3. Декомпозиция
Данные разделяются между разными хранилищами или таблицами. Отдельная часть базы не позволяет идентифицировать человека.
Применение: распределённые системы, защищённые хранилища.
4. Перемешивание (вариационный метод)
Атрибуты перемешиваются между записями:
- имя одного человека,
- дата рождения другого,
- адрес третьего.
Связь с реальным субъектом разрушается.
Применение: тестовые среды, демонстрационные базы.
Псевдонимизация и обезличивание: разница
| Характеристика | Псевдонимизация | Обезличивание | |---|---|---| | Возможность восстановления | Да | Нет | | Статус данных | Остаются ПД | Могут перестать быть ПД | | Регулирование ФЗ-152 | Сохраняется | Может не применяться | | Наличие ключа соответствия | Есть | Отсутствует |
Если компания может восстановить связь между хэшем и конкретным email, данные остаются персональными. То же касается JWT, внутренних ID и токенов.
Где обезличивание применяется чаще всего
Аналитика и BI
Компании используют обезличенные данные:
- для построения отчётов,
- анализа поведения пользователей,
- расчёта метрик,
- прогнозирования спроса.
Тестовые среды
Использование реальных ПД в dev/test-средах — один из самых частых источников утечек. Обезличивание позволяет безопасно тестировать системы.
Машинное обучение и AI
ML-модели обучаются на больших объёмах данных. Обезличивание снижает риски нарушения ФЗ-152 при обучении алгоритмов.
Архивное хранение
После достижения цели обработки часть данных можно обезличить вместо полного удаления — например, для долгосрочной статистики.
Пошаговый процесс обезличивания
- Определить прямые идентификаторы
- Найти косвенные идентификаторы
- Выбрать подходящий метод РКН
- Проверить риск повторной идентификации
- Зафиксировать процесс в регламентах
- Ограничить доступ к остаточным ключам и таблицам соответствия
Как проверить качество обезличивания
Задайте себе вопросы:
- Можно ли определить человека по одному полю?
- Можно ли определить человека по комбинации данных?
- Есть ли у компании дополнительные базы для восстановления связи?
- Может ли подрядчик выполнить деанонимизацию?
Если хотя бы один ответ положительный — данные всё ещё могут считаться персональными.
- Определены процессы, где требуется обезличивание
- Используются методы из Приказа РКН № 996
- Проверена невозможность деанонимизацииобязательно
- Тестовые среды не содержат реальные ПДобязательно
- Регламент обезличивания утверждён внутренними документами
- Разграничены понятия обезличивания и псевдонимизации
Типичные ошибки компаний
| Ошибка | Последствие | |---|---| | Хранение таблицы соответствия рядом с базой | Данные остаются ПД | | Использование реальных ПД в тестах | Высокий риск утечки | | Формальное обезличивание без проверки | Нарушение требований ФЗ-152 | | Передача «обезличенных» данных подрядчику с возможностью восстановления | Повторная идентификация субъектов |