Новости и мнения

На пути к защите конфиденциальности участников

По словам ученых, геномные данные, передаваемые через проект Beacon, уязвимы для нарушений конфиденциальности

Anonymous patients whose DNA data is shared via a network of web servers—or beacons—set up by the Global Alliance for Genomics and Health are at risk of being reidentified, according to a report published today (October 29) in The American Journal of Human Genetics . Анонимные пациенты, чьи данные ДНК через сеть веб-серверов или маяков, созданных Глобальным альянсом по геномике и здоровью, подвергаются риску повторной идентификации, согласно отчету, опубликованному сегодня (29 октября) в The American. Журнал генетики человека . В нем исследователи из Стэнфордского университета и их коллеги представляют рекомендации о том, как можно улучшить безопасность, но некоторые ученые утверждают, что любое обещание конфиденциальности данных ДНК, вероятно, является ошибкой.

«Бумага показывает это. , , если у вас есть доступ к чьей-то ДНК, теперь вы можете пойти и проверить разные маяки, чтобы узнать, участвовал ли [этот человек] », – сказал ученый-компьютерщик и вычислительный биолог Янив Эрлих из Колумбийского университета в Нью-Йорке, который не принимал участия в работе.

Проект «Маяк» был создан Глобальным альянсом по геномике и здоровью как способ для исследовательских институтов и больниц легко обмениваться геномными данными, сохраняя при этом конфиденциальность пациентов. По сути, система позволяет пользователю спрашивать, существует ли конкретный нуклеотид в определенном месте хромосомы в каком-либо геноме, хранящемся в данном маяке, но скрывает все другие данные последовательности. Это означает, что врач может проверить, была ли обнаружена мутация, обнаруженная у одного из ее собственных пациентов, например, у других пациентов, фактически не имея доступа к геномам этих других пациентов.

Но в настоящее время нет ограничения по количеству запросов, которые может сделать пользователь, пояснил Карлос Бустаманте из Стэнфорда, который руководил исследованием. «[Мы] начали думать о том, как эта конкретная установка может быть использована злостным пользователем. Мыслят так: если я могу пропинговать эту базу данных и у меня есть неограниченное количество запросов, могу ли я узнать, находится ли конкретный человек в этой базе данных? »

Ответ был да. Команда показала, что с имитированным маяком, содержащим геномные данные 1000 особей, всего 5000 запросов нуклеотидов было достаточно, чтобы определить, был ли известный человек в базе данных. В искусственном маяке, содержащем всего 65 геномов, количество запросов на нуклеотиды сократилось до 250. «Спрятаться в большой толпе легче, чем в маленькой», – объяснил Бустаманте.

Чтобы найти геном человека внутри данного маяка, пользователь должен уже обладать последовательностью генома этого человека. «Когда кто-то имеет доступ к вашей ДНК. , , Вы уже потеряли много своей личной жизни », – сказал Эрлих. Но поскольку многие маяки содержат геномы людей с определенными заболеваниями, пользователь может получить информацию о медицинской истории человека, которую он хотел сохранить в тайне.

«Исходя из вашего генома, трудно предсказать, есть ли у вас диабет, болезнь сердца или психическое расстройство», – сказал Бустаманте. Но если пользователь обнаружил геном человека, скажем, в базе данных людей с психическими расстройствами, он мог бы догадаться, что у человека было такое расстройство.

«Вы можете делиться информацией в Facebook, – сказал Бустаманте, – но вы не обязательно хотите, чтобы каждый аспект всего, что вы когда-либо делали, был известен».

В результате исследования авторы представили Глобальному альянсу рекомендации по безопасности, которые группа «сейчас находится в процессе реализации», сказал Бустаманте. Например, он и его коллеги предложили, чтобы маяки содержали как можно больше геномов, чтобы сделать обнаружение одного человека более трудным, что пользователи должны быть зарегистрированы, а не анонимны, и что необычная активность – например, тысячи запросов от одного пользователя – должны быть исследованы.

Хотя Эрлих согласился с тем, что выявление и исправление таких дыр стоит, он считает, что весь разговор о конфиденциальности должен измениться. «Мы должны подчеркнуть, что защита от вреда [в результате повторной идентификации], а не защита от повторной идентификации [сама по себе]», – сказал он, поскольку предотвращение последнего «практически невозможно».

«Взять домой сообщение из такой бумаги. , , в том, что важно уведомлять участников исследования об ограничениях конфиденциальности данных », – добавил он.

Георгиевская церковь Гарвардской медицинской школы согласилась. «Я последний человек на планете, который скажет, что что-то невозможно, но я думаю, что до сих пор [идея конфиденциальности] была бредовой».

«Если [пациенты] получают надлежащее образование заранее, они понимают, что существует риск», – добавил он. «И если им неудобно с таким результатом, им, вероятно, следует позволить кому-то другому пожертвовать [ДНК]». Потеря нескольких пациентов, которые хотят гарантированной конфиденциальности, безусловно, лучше, чем «принуждение их к участию посредством обещаний, которые мы не можем сдержать». Церковь сказала.

С.С. Шрингарпур и К.Д. Бустаманте , « Утечки конфиденциальности из маяков обмена геномными данными», Американский журнал генетики человека , 97: 1-15, 2015.

Обсуждение

Ваш e-mail не будет опубликован. Обязательные поля помечены *