Лусине Погосян, Колумбийский университет (Соединенные Штаты), и Триша Тухолски (Национальные академии наук, инженерии и медицины США), представили второй семинар, который состоялся 11 мая 2023 года и был посвящен принципам управления данными для исследований в области наук о жизни во всем мире. Тухолски отметила, что стремительный рост объема данных в области наук о жизни открывает огромные возможности для проведения исследований, при этом такие данные представляют собой значительные финансовые вложения и иногда являются чувствительными. Она заявила, что глобальное научное сотрудничество имеет целью наилучшим образом использовать данные наук о жизни для развития науки и здравоохранения, но при этом возникают проблемы, связанные с обеспечением баланса между необходимостью доступа к данным и обменом ими и настоятельной необходимостью обеспечить ответственную и надежную защиту этих данных и людей, которые их предоставляют.
Чтобы рассмотреть эти вопросы в контексте управления, участники второго семинара привлекли внимание к глобальным политикам, практикам и механизмам управления данными; проанализировали международные нормы и новые тенденции в области управления данными наук о жизни; и рассмотрели сходства, различия, проблемы и возможности существующих систем управления данными.
Янн Джоли (Университет Макгилла, Канада) представил глобальные ресурсы и системы управления данными в качестве основы для обсуждения на семинаре. По его словам, управление данными включает в себя согласованные стандарты обмена данными и операционной совместимости, которые способствуют развитию
открытой науки и глобального сотрудничества, ускорению медицинских исследований и улучшению медицинского обслуживания. Джоли также отметил, что для такого управления необходима инфраструктура национальных и международных законов, правил и стандартов, регулирующих этические, правовые и социальные вопросы, возникающие при сборе данных, такие как согласие и конфиденциальность, а также обеспечивающих доступ к данным.
Джоли выделил несколько ключевых организаций и текстов, которые способствуют развитию открытой науки и ответственному международному обмену данными. К их числу относятся:
Этот список, не будучи исчерпывающим, тем не менее, иллюстрирует широкий диапазон предпринимаемых усилий по направлению обмена данными на международном уровне и некоторые общие элементы между ними. В целом, по словам Джоли, международная практика обмена данными опирается на широко сформулированные, гибкие и легко принимаемые нормы и стандарты сообщества. Несмотря на то, что в целом существует согласие с важностью обмена данными в науке, он отметил, что проблемы могут возникать, когда национальные законы о защите частной жизни отличаются от этих норм или когда ученым трудно соблюдать их. Внедрение этих норм и стандартов и обеспечение их соблюдения
происходят в основном за счет добровольного принятия и за счет влияния на национальное законодательство, а не в силу международных законов, соблюдение которых, как правило, трудно обеспечить. Наконец, он отметил, что основные усилия в этой области осуществляются организациями в Северной Америке и Европе, однако ситуация постепенно меняется, по мере того как организации на других континентах более активно начинают участвовать в обсуждениях и мероприятиях, связанных с обменом данными.
Джон Уре (компания Access Partnership, Сингапур) представил дискуссию с участием экспертов по управлению данными из разных стран мира. Участники дискуссии из Германии, Индии, Тайваня, Уганды и Соединенных Штатов рассказали о национальных законах, инструментах и системах управления данными в своих странах, а также рассмотрели новые тенденции в области глобальных данных в области наук о жизни в более широком смысле.
Таунтон Пейн из Национальных институтов здравоохранения США (NIH) рассказал о том, как NIH и другие федеральные ведомства США подходят к вопросу обмена данными. Правительство США объявило 2023 год «Годом открытой науки», привлекая внимание к цели расширения доступа к данным в области наук о жизни. Расширение доступа к данным и активизация обмена ими ускоряют научные исследования, позволяя проверять результаты опубликованных исследований, делать ценные массивы данных более доступными для повторного использования, а также повысить строгость исследований, финансируемых государством, и воспроизводимость их результатов. При наличии соответствующих механизмов это также расширяет возможности ученых в плане цитирования, признания и сотрудничества. Обмен данными также способствует повышению прозрачности и подотчетности, демонстрирует ответственное обращение со средствами
налогоплательщиков и максимизирует ценность вклада участников исследований, что способствует укреплению доверия общества к исследованиям (Funk et al., 2019).
Несмотря на общепризнанные преимущества открытой науки, основная часть данных, лежащих в основе опубликованных исследований, в настоящее время труднодоступна (Errington et al., 2021; Gabelica et al., 2022; Tedersoo et al., 2021). В рамках усилий по устранению этого недостатка основной вклад NIH в проведение «Года открытой науки» сделан в виде «Политики организации работы с данными и обмена ими» (Data Management and Sharing Policy), опубликованной в 2023 г., рассчитанной на 10 лет, предназначенной для многих сообществ и направленной на улучшение обмена данными (NIH, без указания даты). В соответствии с предыдущими политиками, такими как Политика обмена геномными данными 2014 года, данная политика содержит дополнительную информацию об обмене данными о человеке на основе системы контролируемого доступа с соответствующим согласием, надзором, проверкой и утверждением для дальнейшего использования (NIH, без указания даты). Политика обусловливает финансирование со стороны NIH предоставлением подробных планов организации работы с данными и обмена ими, требуя от исследователей информации о типе данных, которые будут собираться и генерироваться; указания конкретных инструментов, программного обеспечения, документации или стандартов данных, которые будут использоваться; и сообщения подробной информации о конкретном хранилище данных, которое будет использоваться; изложения того, как и когда данные станут доступны для поиска, защиты и обмена; и описания будущих ограничений на использование данных. По словам Пейна, в рамках данной политики также отдан приоритет существующим хранилищам данных как предпочтительному механизму обмена данными, а также требуется, чтобы обмен данными был одним из ранних компонентов схемы проведения исследования, а не второстепенным соображением. Хотя эти требования не являются юридическими, их несоблюдение может повлиять на решения о финансировании, что в целом оказывает большое влияние на научную практику.
Пейн также отметил, что Управление по научно-технической политике Белого дома выпустило служебную записку, обязывающую
другие федеральные ведомства внедрять меры политики, подобные Политике NIH по организации работы с данными и обмена ими, из чего следует, что подобные требования и практика, вероятно, получат широкое распространение в США в ближайшем будущем.
Фрузшина Молнар-Габор (Гейдельбергский университет, Германия) рассказала о системе управления данными в рамках Общего положения о защите данных (GDPR) Европейского союза (ЕС). В качестве нормативного акта ЕС GDPR обычно применяется во всех странах-членах ЕС, но при этом от стран не требуется принимать какие-либо дополнительные законодательные или нормативные меры. Она выделила положения GDPR, относящиеся к обработке данных, связанных с наукой о жизни и здравоохранением, которые подвергались различным интерпретациям.
GDPR в целом запрещает обработку персональных данных, сказала Молнар-Габор. Однако, поскольку не существует абсолютного определения персональных данных, а также учитывая, что права и интересы в области защиты данных должны быть сбалансированы с правами и интересами в области обработки данных, в зависимости от контекста, в котором обрабатываются данные, предоставляются исключения. Она сказала, что принципиально важно оценивать риски для субъектов данных в результате обработки данных, особенно риск повторной идентификации. Идея анонимизированных данных часто понимается по-разному в различных технических и юридических контекстах, что может усложнить исследования, особенно в контексте обработки метаданных, публикации и возможной повторной идентификации с помощью искусственного интеллекта. Кроме того, GDPR требует, чтобы обработка данных была разрешена на законных основаниях, например, с согласия субъекта данных, в том числе для будущего и ретроспективного использования. Как отметила Молнар-Габор, допускается исключение из общего запрета на обработку чувствительных данных, основанное на балансе между интересами исследования и необходимостью защиты данных.
Субъекты данных могут давать согласие на сбор и использование их данных, а в соответствии с GDPR субъекты данных имеют права, основанные на прозрачности обработки данных, такие как право на предоставление доступа, отсрочку доступа или исправление данных. Существуют различные роли лиц, осуществляющих обработку данных: контролеры, которые принимают решение о целях и основных средствах обработки данных, и обработчики, которые осуществляют обработку данных. В медицинских исследованиях, отметила Молнар-Габор, эти роли часто разделяются и выполняются совместно, что допустимо в соответствии с GDPR, если учитывать вопросы ответственности. Когда исследовательские организации выступают в качестве контролеров данных, они несут ответственность за обеспечение прав субъектов данных.
Вопрос передачи данных за пределы ЕС проблематичен, сказала Молнар-Габор. Согласно GDPR, международная передача данных требует двухэтапного процесса, в ходе которого сначала определяется правовой механизм передачи данных. Далее, если страна-получатель не обеспечивает защиту данных, эквивалентную уровню защиты, предусмотренному GDPR, экспортеры данных должны оценить уровень защиты, существующий в такой стране, и компенсировать отсутствие эквивалентности с помощью механизма передачи, позволяющего обмениваться данными. По словам Молнар-Габор, проблема безопасной передачи данных может быть решена за счет улучшения совместимости нормативных актов разных стран, хотя это создает дополнительные трудности для регулирующих органов.
Наконец, Молнар-Габор отметила, что другие изменения в законодательстве ЕС, такие как предложенный в 2023 году регламент European Health Data Space (Европейская комиссия, без указания даты) по обработке данных о здравоохранении и медицинских исследованиях, могут упростить обмен данными в области наук о жизни со странами, не входящими в ЕС, но при этом создать новые проблемы в сфере соблюдения требований. Молнар-Габор добавила, что, несмотря на возможные проблемы с интерпретацией буквы закона, документальное оформление, мониторинг и обеспечение соблюдения принципов GDPR могут укрепить доверие общества,
способствуя прозрачности и подотчетности, а также расширению прав и возможностей субъектов исследований.
Атира П.С. (Национальный университет перспективных правовых исследований, Индия) рассказала о шагах, предпринимаемых Индией для преодоления «болезней роста», сопровождающих цифровую революцию в стране. По словам П.С., по мере того как многие аспекты жизни индийцев, от банковского дела до образования и здравоохранения, переходят в Интернет, предпринимаются многочисленные усилия, направленные на формирование концепции управления в соответствии с принципами безопасности, доверия и расширения цифровых возможностей (India Stack, без указания даты). Хотя в настоящее время для обеспечения надлежащего управления данными в Индии используются директивные и нормативные акты, а не законодательство, она отметила, что по мере развития технологий растет потребность в более инклюзивных, четких, безопасных, устойчивых и согласованных структурных мандатах по управлению данными, в которых акцентируется неприкосновенность частной жизни.
Одной из попыток в этом направлении является предложенная федеративная структура «Архитектура расширения возможностей и защиты данных» ("Data Empowerment and Protection Architecture" - DEPA), которую П.С. описала как набор правовых мер защиты персональных медицинских данных, в котором переносимость и доступ сбалансированы с безопасностью и общественным доверием, и представляющее собой отход от модели регулирования GDPR (NITI Aayog, 2020). Как она пояснила, в рамках DEPA каждому гражданину Индии будет присвоен уникальный медицинский идентификатор, увязанный по многочисленным каналам, который будет защищен и анонимизирован, но при этом доступен в любой точке страны. Наряду с законопроектом о безопасности цифровой информации в здравоохранении (который также еще не принят), DEPA позволит привести стандарты хранения и обмена медицинскими данными в Индии в соответствие с международными стандартами и защитить фундаментальные права участников
исследований на автономию и неприкосновенность частной жизни. Эти фундаментальные права предоставляются гражданам Индии решением Верховного суда Индии (Puttaswamy, без указания даты), в котором также утверждается, что персональные данные должны собираться для конкретной заявленной цели, иметь отношение к этой цели и ограничиваться тем, что необходимо для достижения этой цели.
П.С. указала на другой актуальный мандат, находящийся на рассмотрении: индийский закон об охране цифровых данных от 2022 г.2, который будет распространяться на все оцифрованные персональные данные, включая данные, собранные в автономном режиме, впоследствии переводимые в цифровой формат. Данное законодательство содержит понятие «глубокого согласия», которое указывает на то, что персональные данные могут быть использованы без прямого согласия, если такое использование необходимо для обеспечения национальной безопасности, общественных интересов или общественного порядка. Она сказала, что это законодательство также претендует на экстерриториальное действие за пределами Индии; в соответствии с этой концепцией, сказала П.С., безопасными местами передачи данных будут считаться одобренные страны, в то время как передача в другие страны будет запрещена, что обусловливает важность соблюдения законодательства и совместимости данных.
Хеллен Нансумба (Министерство здравоохранения Республики Уганда) рассказала о существующих в ее стране механизмах обмена данными, а также о некоторых проблемах, связанных с укреплением основанных на праве справедливости практик обмена данными. Геномика является быстро развивающейся областью в Уганде, причем после пандемии COVID-19 объем работ расширяется, а геномный надзор ускоряется. Нансумба объяснила,
___________________
2 Со времени семинара закон об охране цифровых данных был введен в действие в августе 2023 г. (см. https://www.meity.gov.in/writereaddata/files/Digital%20Personal%20Data%20Protection%20Act%202023.pdf).
что в стране создается несколько механизмов для обмена биологическими материалами человека и связанными с ними данными, к которым относятся такие этические требования, как информированное согласие, конфиденциальность и беспристрастность, а также требования к управлению, такие как управление биохранилищем и соглашения о передаче материалов и данных.
Национальное биохранилище Уганды, в котором хранятся образцы и данные, полученные от нескольких исследователей и институтов, требует от каждого, кто депонирует данные или получает доступ к ним, соблюдения определенной последовательности действий и требований, которые устанавливаются на этапе финансирования, пояснила Нансумба. Данные сначала загружаются в Национальную лабораторную систему здравоохранения по управлению информацией, затем проходят качественную обработку, а затем передаются в биохранилище и хранятся соответствующим образом. Чтобы получить доступ к данным из биохранилища, исследователи должны запросить разрешение соответствующего национального комитета по этике исследований, выполнить условия соглашений о передаче данных и материалов и загрузить полученные результаты и данные в хранилище. «Мы ожидаем возврата результатов исследований, например, в сфере генотипов и данных микробиоты», — сказала Нансумба.
Нансумба сказала, что Уганда и другие страны с низким и средним уровнем дохода нуждаются в более мощной инфраструктуре и возможностях передачи технологий, чтобы участвовать в более открытом, прозрачном и справедливом глобальном обмене данными между исследователями, системами медико-санитарного обслуживания и пациентами. Она отметила, что многие страны не располагают целенаправленными системами управления информацией, необходимыми для хранения и передачи больших объемов геномных данных. Нансумба предложила, чтобы партнеры разработали план участия в затратах на поддержание данных в течение длительных периодов времени после завершения проекта. Она также высказала мнение, что информирование пациентов о результатах исследований будет иметь важное значение для повышения прозрачности и укрепления справедливой практики
обмена данными. Наконец, Нансумба указала на необходимость наращивания потенциала передачи технологий для предоставления ответов на вопросы, связанные с наличием данных для разработки вакцин и лекарственных препаратов.
Я-Хсин Ли из медицинского университета Чунг-Шань (Тайвань) рассказал о подходах к управлению данными, используемых в тайваньской базе данных системы государственного медицинского страхования. Как пояснил Ли, с 1995 года большинство населения Тайваня охвачено системой национального медицинского страхования, оплачиваемого государством, что делает базу данных системы государственного медицинского страхования богатым ресурсом для изучения реальных данных о состоянии здоровья населения. Эта база данных увязывает более 400 источников данных, охватывающих практически всех жителей Тайваня. Она включает данные о состоянии здоровья населения, полученные из онкологических реестров, журналов регистрации причин смерти и многих других источников; социальные данные, например, информацию о таких факторах, как курение или старение; и данные о социальном обеспечении, например, информацию о неполных семьях или сексуальных посягательствах. Она также может быть использована для анализа тенденций развития заболеваний и методов лечения или проведения межнациональных сравнений баз данных по конкретным темам.
Как сообщил Ли, в Тайване все данные шифруются, деидентифицируются, распространяются и контролируются Министерством здравоохранения и социального обеспечения. Данные увязаны с демографическими переменными, такими как местоположение, пол, возраст, диагнозы, рецепты, данные о посещении врачей, но не лабораторные анализы или медицинские записи. Заявки на работу с национальными медицинскими данными должны быть одобрены Советом по этике, а доступ к данным возможен только в физических центрах научных данных, которые есть в каждом крупном городе. Ли отметил, что требование физического посещения центра данных для получения доступа к хранящимся там данным является сильной стороной с точки зрения
защиты частной жизни и хорошо работает на Тайване, но отметил, что такая схема может быть менее осуществимой в больших странах.
Вэй Чжэн (Университет Вандербильта, Соединенные Штаты) выступил модератором дискуссии, состоявшейся после выступлений экспертов. Участникам дискуссии было предложено рассмотреть сходства и различия между представленными законодательными актами и мерами политики, а также обсудить пробелы и проблемы, связанные с разработкой политики в области управления данными. В центре обсуждения оказались проблемы управления данными и вопросы получения согласия.
Участники дискуссии обсудили некоторые уникальные особенности и основные проблемы в сфере управления данными в разных странах. По словам Пейна, NIH продемонстрировали лидерство в области приоритизации обмена данными в открытых хранилищах с контролируемым доступом, но по-прежнему сталкиваются с проблемами, связанными с обеспечением баланса между открытым доступом и обменом данными, с одной стороны, и автономией участников, информированным согласием и конфиденциальностью, с другой. Еще одной проблемой является получение ресурсов, необходимых для поддержания доступа к данным и обмена ими. «Обмен данными сопряжен с затратами, здесь требуются ресурсы», – сказал Пейн. Для решения этой проблемы NIH инвестируют значительные средства в инфраструктуру, такую как базы данных для генотипирования и фенотипирования, и просят исследователей включать в свои бюджеты по заявкам на гранты расходы на организацию работы с данными и обмен ими. Тем не менее, как отметил Пейн, в будущем затраты будут по-прежнему оставаться важным фактором. Наконец, Пейн подчеркнул, что предоставление доступа к большим и сложным массивам данных по геномике может быть сопряжено с техническими проблемами, которые необходимо решать.
Молнар-Габор выделила три основные проблемы, связанные с внедрением GDPR. Во-первых, нелегко определить, какие именно отраслевые меры по защите данных и конфиденциальности при обработке медицинских данных соответствуют требованиям GDPR. Зачастую эта задача ложится на плечи исследователей или обработчиков данных, которым могли бы быть полезны конкретные правила, а не существующие более общие положения. Во-вторых, как она отметила, трудно трансформировать законодательные требования в технические меры по защите данных. Наконец, многие правовые механизмы, позволяющие передавать данные за пределы ЕС/Европейской экономической зоны, требуют, с одной стороны, от экспортеров данных проведения всесторонней оценки уровня защиты данных в стране, получающей данные, а, с другой стороны, от импортеров данных — подписания обязательных правил, дополняющих их национальные нормы защиты данных, что в целом затрудняет международное сотрудничество, отметила Молнар-Габор.
По словам Ли, главная проблема Тайваня заключается в том, чтобы обеспечить получение действительно информированного согласия пациента в целях проведения исследований, поскольку большая часть национальных данных поступает от обычных посещений медицинских заведений. Нансумба видит главную проблему Уганды в непрозрачности нормативных требований в отношении доступа к данным, особенно в целях вторичного использования.
Джоли задал вопрос о практике получения общего согласия, которое может избавить от необходимости повторного получения согласия при проведении новых исследований с использованием существующих данных. Пейн ответил, что в США действуют разные законы, но в отношении геномных данных система получения согласия NIH распространяется на будущее использование, с возможными ограничениями в зависимости от того, что представляют собой эти данные и как было оформлено согласие. В ЕС, по словам Молнар-Габор, определение общего согласия, а также подробные правила его применения не включены в основной текст GDPR, что создает потенциальную возможность для различных определений и правил применения в странах-участницах. В целом, по
ее словам, прозрачное соблюдение информационных обязательств необходимо, независимо от согласия с точки зрения правовой основы обработки данных, для того чтобы субъекты данных могли обеспечить соблюдение своих прав на защиту данных.
Дамира Аширалиева (Национальный научно-практический центр, Министерство здравоохранения Кыргызстана) отметила, что в ее стране взятием образцов предусмотрено получение информированного согласия, что оказалось полезным при использовании диагностических данных COVID-19 для дальнейших исследований. При этом, по ее словам, национальное законодательство страны предстоит привести в полное соответствие с международными требованиями. Нансумба отметила, что в национальном хранилище биологических материалов в Уганде используется общее информированное согласие, поскольку большинство образцов получаются в результате регулярных обращений в медицинские учреждения и используются для будущих исследований, и исследователи предоставляют результаты исследований заинтересованным участникам. Клиницисты также указывают, когда предполагается использовать образцы в будущем, например, для изучения наследственных заболеваний или для инициатив в области общественного здравоохранения.
В заключение Тухолски подчеркнула, что исследователи, организации и страны сталкиваются с проблемами, связанными с обеспечением баланса между открытым доступом к данным, совместимостью данных и правами частных лиц на защиту частной жизни. Данные, используемые в исследованиях в области наук о жизни, часто носят чувствительный характер, и для их защиты при хранении, обмене, передаче и доступе к ним, особенно при пересечении национальных границ, вероятно, необходимы защитные меры. Она отметила, что на последующих семинарах серии будут дополнительно рассмотрены выгоды и риски, связанные с обменом данными, а также соображения по обеспечению справедливого обмена данными.