кто и как распоряжается нашими данными в электронной коммерции

28.02.2022
1 267

Юлия Морозова

С развитием интернета крупные компании все активнее прибегают к сбору и анализу данных своих клиентов, что вызывает здравые опасения. Злые корпорации, которые знают про нас все и навязывают нам новые потребности, — это очень распространенный сегодня страх. Насколько мы близки к цифровому тоталитаризму и какие практики и ценности помогут нам его избежать?

Вопросы об этике обращения с большими данными ПостНаука задала кандидату экономических наук, доценту департамента бизнес-информатики Высшей школы бизнеса НИУ ВШЭ Юлии Морозовой. Материал подготовлен при поддержке Selectel — IT-компании, которая делает работу онлайн-сервисов бесперебойной, надежной и технологичной.

Всезнающие алгоритмы: как они влияют на нашу жизнь?

В 2012 году в штате Миннеаполис (США) разъяренный мужчина пришел в офис компании Target. Его возмутило, что магазин прислал ему домой предложения о скидках на товары для младенцев. Купоны доставили на имя дочери мужчины, которая тогда еще училась в старшей школе. Менеджерам пришлось оправдываться за ошибку, после чего мужчина ушел. Через несколько дней представители Target перезвонили мужчине и хотели принести официальные извинения, однако тот остановил их. Он растерянно сказал, что не знал всех обстоятельств произошедшего. Выяснилось, что его дочь действительно беременна, просто скрывала этот факт от остальной семьи. Скрыть же этот факт от магазина, однако, не удалось. Тайна раскрылась из-за ее покупок: анализ купленных товаров выявил изменение привычных покупательских привычек, и в итоге был сделан вывод о ее беременности.

В 2021 году сложно удивить людей такой «магией» статистики. Большинство людей из личного опыта знают, как их поисковые запросы и другие действия в интернете снабжают интернет-магазины и IT-гигантов информацией. На основе этих данных проводится так называемый предиктивный анализ данных: компании с помощью демографических данных (пол, возраст, день рождения, страна проживания), истории запросов, публикуемой в социальных сетях информации и данных геолокации стараются предсказать желания клиентов и сформировать предложение.

Но в 2012 году ситуация с компанией Target стала прецедентом для обсуждения проблемы больших данных. На тот момент ее нельзя было отнести к сектору электронной коммерции, но в основе ее предиктивных алгоритмов лежали те же принципы работы с данными. Беременные девушки — это категория покупателей, у которых резко меняются многие практики. Так, они очень часто перестают курить и принимать алкоголь, перестают пользоваться привычными средствами гигиены, у них меняются пищевые привычки. Все это в совокупности позволяет практически гарантированно предугадать беременность.

На момент 2012 года практически отсутствовало законодательство, которое регулировало бы обращение с данными. С юридической точки зрения все действия Target были полностью легальны: законодательство Соединенных Штатов не запрещает сбор данных для анализа своей аудитории и не запрещает передавать информацию анализа третьим лицам. Однако со временем ситуация начала меняться, и сегодня уже есть ряд юрисдикций, требующих от компании более осознанного отношения к данным пользователей.

Права на данные

Ситуация с беременной девушкой стала возможной из-за того, что магазин собирал данные о ней без ее согласия. Кроме того, она не была осведомлена о том, каким образом эти данные могут быть использованы. Именно эти проблемы призвано решить адекватное современным реалиям законодательство.

26 апреля 2016 года Европейский союз принял Общеевропейский регламент о персональных данных, известный также как GDPR (General Data Protection Regulation). Это постановление, то есть источник вторичного права ЕС, который становится частью законодательства всех государств-членов немедленно после своего вступления в силу. Эта норма права сегодня считается некоторым стандартом, на который ориентируются страны по всему миру. 

Основная цель GPDR — «гармонизация защиты основных прав и свобод физических лиц в отношении обработки персональных данных и обеспечение свободного движения персональных данных между государствами-членами» [1]. Нормы и правила, содержащиеся в GPDR, распространяются на все компании, которые занимаются сбором или обработкой данных резидентов ЕС. Если существующие в компании процедуры работы с данными не соответствуют GDPR, ей грозят штрафы в размере до 20 миллионов евро или 4% годового оборота компании.

Одна из задач GDPR — четко обозначить понятия, связанные с обработкой данных, а также зафиксировать правила честного и этичного обращения с ними. Под персональными данными [2] понимается любая информация, относящаяся к «субъекту данных», то есть идентифицированному или поддающемуся идентификации физическому лицу. Таким лицом признается человек, которого можно прямо или косвенно определить посредством ссылки на его имя, идентификационный номер, данные о местоположении, онлайновый идентификатор и другие личные особенности.

А самый главный принцип, закрепленный с помощью GDPR, — это добровольность. Клиенты должны давать согласие на обработку своих данных, и это согласие обязано быть [3]:

а) свободным: ничто не должно принуждать субъекта к согласию;

б) конкретным: пользователь должен четко понимать, кто и в каком объеме будет обрабатывать его данные;

в) однозначным: положения должны быть прописаны таким образом, чтобы субъект данных был полностью уведомлен обо всех возможных последствиях предоставления данных.

GDPR также устанавливает ряд дополнительных критериев законности [4] обработки персональных данных. Если хотя бы один из них соблюдается, то обработка также может быть признана допустимой. Обработка данных допустима, если она необходима для:

1) исполнения договора между компанией и субъектом данных;

2) выполнения компанией некоторых правовых обязательств;

3) защиты жизненно важных интересов субъекта данных или других лиц;

4) создания публичного блага и в рамках осуществления государственной власти;

5) реализации прямых интересов заказчика сбора данных, если те не противоречат интересам субъекта данных. 

При этом GDPR закрепляет за пользователями ряд неотъемлемых прав. Право знать — это оповещение пользователя о том, что те или иные данные о нем потребуются для полноценной работы сервиса. Право доступа гарантирует пользователю возможность узнавать и уточнять информацию, которой располагает интернет-магазин. 

Бесконтактная оплата

Ключевое право, закрепление которого стало прямой заслугой GDPR, — это право на забвение [5]. Оно закрепляет за каждым пользователем право обратиться в компанию и отозвать свое согласие на обработку его данных. Вслед за этим компания обязана удалить все собранные до этого данные и полностью исключить клиента из процедуры анализа. 

GDPR также требует от компаний проводить псевдонимизацию [2] персональных данных. Псевдонимизация в значении GDPR соответствует понятию обезличивания, принятому в законодательстве Российской Федерации. В соответствии со статьей 3 Федерального закона от 27.07.2006 N 152-ФЗ (ред. от 02.07.2021) «О персональных данных» «обезличивание персональных данных — действия, в результате которых становится невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту персональных данных». Это означает, что нельзя использовать в качестве идентификатора клиента его реальное имя. Вместо него нужно использовать условный «псевдоним», по которому ничего нельзя узнать о стоящем за ним человеке. Псевдонимизация достигается за счет того, что информация, идентифицирующая клиента, хранится отдельно в зашифрованном виде и в отношении нее приняты технические и организационные меры, которые предотвращают ее отнесение к идентифицированному или идентифицируемому физическому лицу.  Допустима также полная анонимизация данных.

Защита данных

Обеспечение безопасности данных в соответствии с законом — сложная техническая задача, поэтому представители бизнеса часто прибегают к услугам профессионалов. Такие компании должны охранять свои дата-центры, контролировать физический доступ к серверам и использовать оборудование, которое соответствует требованиям Федерального закона 152-ФЗ «О персональных данных». Для этого применяют аттестованные ЦОДы и специализированные серверы для 152-ФЗ.

Не менее важно для владельцев бизнеса избегать и киберугрозы — с этим помогает подключение защиты от DDoS-атак. Такой сервис в режиме реального времени сканирует и анализирует входящий трафик, определяет потенциальные атаки и блокирует их.

Многие страны постарались последовать примеру ЕС и постепенно начали совершенствовать свое законодательство. После вступления в силу GDPR в штате Калифорния был принят California Consumer Privacy Act (CCPA), который предоставляет пользователям такие же права на доступность хранимых данных, их псевдонимизацию и право на забвение. В 2020 году в российский Федеральный закон «О персональных данных» были внесены изменения, которые приблизили его к стандартам GDPR. Теперь российское законодательство также содержит понятие персональных данных, четкие критерии законности их обработки и предусматривает право на забвение.

Биометрический контроллер

Тем не менее одни лишь законодательные решения, какими бы проработанными они ни были, не могут раз и навсегда решить всех этических проблем обработки больших данных в электронной коммерции. Дело в том, что значительная их часть возникает напрямую из тех принципов, по которым функционируют современные методы анализа данных и коммерческие предложения интернет-магазинов.

Коллективная ответственность перед алгоритмами

Любая работа со статистикой подразумевает, что у нас имеется доступ к информации о достаточно большом количестве наблюдений. Если мы подбросим монетку 10 раз и в каждом случае она приземлится решкой, то это еще не значит, что у нас в руках оказалась какая-то необычная монетка. Скорее всего, это просто случайность. Чем больше раз мы подкинем монетку, тем более вероятно, что со временем в нашем журнале наблюдений будет зафиксирована статистика выпадений 50/50. 

Точно такие же искажения возникают при изучении людей. Если мы опросим 20 человек об их потребительских привычках и на их основании будем пробовать изменить нашу логистику и систему скидок, то вскоре мы можем лишь оттолкнуть от нас основную клиентскую базу. Случайные 20 респондентов не могут дать представления о всей совокупности потребителей. Именно поэтому в маркетинговых исследованиях много времени уделяется составлению выборки при изучении аудитории. Только так можно составить корректное представление о всей совокупности потребителей.

Однако здесь аналитики сталкиваются с другой проблемой. В ходе любого маркетингового исследования значительная часть выводов будет иметь обобщенный характер. Какие-то свойства общей совокупности клиентов будут переноситься на каждого входящего в нее человека. И при принятии некоторых решений это неизбежно приведет к этически спорным действиям.

Как известно, в США остро стоят вопросы равноправия различных этнических групп между собой. Так, чернокожее население гораздо чаще живет в самых бедных и наименее благополучных районах американских городов. Это естественным образом создает порочный круг преступности, из которого крайне проблематично выбраться. И статистика учитывает это, автоматически ассоциируя черный цвет кожи и повышенный уровень преступности.

Такой перекос отражается и на электронной коммерции. Алгоритмы машинного обучения глухи к социологической интерпретации статистики, и поэтому повышенная преступность среди чернокожих автоматически ставит клеймо на всей группе населения. Из-за этого каждый представитель этнической группы автоматически будет рассматриваться как неблагонадежный клиент, который менее достоин получать специализированные предложения и которому не стоит доверять рассрочку. Создается ситуация коллективной ответственности, при которой статистическое наблюдение за группой людей автоматически ставит клеймо на ни в чем не повинного ее представителя. Нетрудно понять, что аналогичные ситуации возможны не только в Америке, но и в любой другой многонациональной стране.

Анализ данных иногда подвергает группы людей дискриминации и по другим признакам. Очень часто с разным отношением к себе могут столкнуться мужчины и женщины. К значительному общественному резонансу привела ситуация с Apple Card — кредитной картой от компании Apple. В ноябре 2019 года программист Давид Хансон пожаловался на то, что его жене доступна в 20 раз меньшая сумма займа у банка, чем ему. Он отмечал, что они уже довольно долго живут в браке и ведут схожий образ жизни, поэтому невозможно списать эту разницу на личные привычки. Более того, по истечении денежного лимита жена Хансона полностью потеряла возможность совершать финансовые операции с карты, в то время как ему самому открывались дополнительные предложения. Позже об аналогичной проблеме сообщил Стив Возняк, один из основателей Apple. Вскоре после освещения этой ситуации в СМИ кредитный лимит жены Хансона просто поднялся без объяснения причин.

Причина такой несправедливости по отношению женщинам, скорее всего, также лежит в статистических наблюдениях, согласно которым те менее обеспечены и менее платежеспособны. Ситуация усугубляется тем, что современная аналитика все больше опирается на методы машинного обучения. Даже специалисты не всегда с ходу могут оценить, почему в процессе обучения машина присвоила тому или иному фактору особую значимость. В результате человеческий контроль ослабевает, и алгоритмы анализа данных могут принимать неэтичные решения.

Повседневные законные практики электронной коммерции также зачастую вызывают вопросы. Яркий пример — это система персональных скидок. На первый взгляд это исключительно полезная для потребителя система, которая позволяет ему сэкономить на выгодных лично для него предложениях. Однако часто такие предложения могут иметь характер некоторой манипуляции. Сегодня известно, что около 40% всех покупок в интернете совершаются импульсивно, то есть внезапно и без особой на то необходимости. При этом у 20% занимающихся импульсивными покупками американцев траты на эти покупки превышают 1000 долларов. Здесь встает вопрос: насколько правильно с точки зрения этики предлагать людям покупки, которые выходят за рамки их планирования и потенциально могут привести к перерасходу денег?

Разработка этических стандартов

Рассмотренные кейсы показывают, что одной лишь юридической защиты пользователей недостаточно, чтобы обеспечить реализацию всех их прав. Законы могут урегулировать только оборот данных и в той или иной форме ограничить цели, ради которых их собирают, но они бессильны повлиять на сами процедуры анализа данных. Сами методы содержат в себе принципиальные проблемы, которые может учесть только подготовленный специалист, рассматривающий все проблематичные аспекты анализа данных. 

На воспитание таких кадров в IT-компаниях направлено создание этических кодексов. Их цель — декларирование правил и принципов, которых компания намеревается придерживаться по отношению к другим компаниям и своим клиентам. Такие кодексы также задают стандарт поведения для рядовых работников и регулируют вопросы, которые не связаны с нарушениями трудового кодекса и не требуют судебного разбирательства. Также этические кодексы существуют у отдельных профессиональных сообществ. Такие документы служат своеобразным кодексом чести для работников отрасли, подобным клятве Гиппократа для врачей. Среди специалистов по работе данных такие кодексы существуют у Американской статистической ассоциации (ASA), Института инженеров электротехники и электроники (IEEE), Ассоциации вычислительной техники (ACM).

Российские IT-компании, в том числе и занятые в сфере электронной коммерции, также озабочены этическими проблемами анализа больших данных. 12 октября 2018 года была зарегистрирована Ассоциация больших данных. Сегодня в нее входят «Мегафон», «Магнит», «Авито» и множество других крупных игроков IT-сферы. 12 декабря 2019 года всеми участницами АБД вместе с Институтом развития интернета был подписан Кодекс этики использования данных, которому обязуется следовать каждый из участников. Одна из основных декларируемых сообществом целей — защита прав и свобод человека. Согласно пункту 4 кодекса, «при обработке данных не допускается умышленная дискриминация граждан на основании расовой, национальной, языковой принадлежности, политических взглядов, религиозных или философских убеждений, сведений об интимной жизни. В случае обнаружения признаков дискриминации в работе алгоритма участник Кодекса принимает все разумные меры для его изменения или прекращения применения такого алгоритма» [6].

Однако необходимо учитывать, что ни один свод правил никогда сам по себе не заставляет людей поступать этично, как много документов ни было бы подписано. Мир сегодня действительно находится в непростой ситуации: бо́льшая часть данных, несмотря на усилия организаций по всему миру, находится в руках больших корпораций. Именно они распоряжаются данными по своему усмотрению, пусть и с нашего формального согласия. Предотвратить наступление цифровой антиутопии поможет прежде всего обсуждение проблем, стремление к открытости и просвещение.

Литература

Предмет и задачи / GDPR

Определения / GDPR

Принципы, касающиеся обработки персональных данных / GDPR

Законность обработки / GDPR

Право на удаление данных («право быть забытым») / GDPR

Кодекс этики использования данных

ИСТОЧНИК: Пост Наука https://postnauka.ru/longreads/156721

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *