Объединенное машинное обучение позволяет провести крупнейшее на сегодняшний день исследование опухоли головного мозга без обмена данными о пациентах

 

Исследователи из Penn Medicine и корпорации Intel возглавили крупнейшую на сегодняшний день глобальную работу по машинному обучению, чтобы надежно объединить данные сканирования мозга 6314 пациентов с глиобластомой (GBM) в 71 месте по всему миру и разработать модель, которая может улучшить идентификацию и прогнозирование границ в трех подразделениях опухоли без ущерба для пациента. уединение. Их выводы были опубликованы сегодня в журнале Nature Communications.

"Это самый большой и разнообразный набор данных о пациентах с глиобластомой, когда-либо рассматривавшийся в литературе, и он стал возможным благодаря объединенному обучению", - сказал старший автор Спиридон Бакас, доктор философии, доцент кафедры патологии, лабораторной медицины и радиологии в Медицинской школе Перельмана при Университете Пенсильвании.. "Чем больше данных мы можем ввести в модели машинного обучения, тем точнее они становятся, что, в свою очередь, может улучшить нашу способность понимать, лечить и удалять глиобластому у пациентов с большей точностью".

 

Исследователи, изучающие редкие состояния, такие как GBM, агрессивный тип опухоли головного мозга, часто имеют популяцию пациентов, ограниченную их собственным учреждением или географическим местоположением. Из-за законодательства о защите частной жизни, такого как Закон о переносимости и подотчетности медицинского страхования 1996 года (HIPAA) в Соединенных Штатах и Общее положение о защите данных (GDPR) в Европе, сотрудничество по обмену данными между учреждениями без ущерба для конфиденциальности данных пациентов является серьезным препятствием для многих поставщиков медицинских услуг.

Новый подход к машинному обучению, называемый федеративным обучением, предлагает решение этих препятствий путем применения алгоритма машинного обучения к данным вместо следования текущей парадигме централизации данных в алгоритмах. Федеративное обучение — подход, впервые реализованный Google для функции автозамены клавиатур, — обучает алгоритм машинного обучения на нескольких децентрализованных устройствах или серверах (в данном случае учреждениях), хранящих локальные образцы данных, фактически не обмениваясь ими. Ранее было показано, что это позволяет клиницистам в учреждениях разных стран сотрудничать в исследованиях, не делясь никакими личными данными пациентов.

Бакас руководил этим масштабным совместным исследованием вместе с первыми авторами Сартаком Пати, доктором медицинских наук, старшим разработчиком программного обеспечения в Центре биомедицинских вычислений изображений и аналитики Пенсильванского университета (CBICA), Уджвалом Байдом, доктором философии, постдокторантом CBICA, Брэндоном Эдвардсом, доктором философии, научным сотрудником Intel Labs, и Микой Шеллер, научный сотрудник Intel Labs.

"Данные помогают стимулировать открытия, особенно при редких видах рака, где доступных данных может быть недостаточно. Федеративный подход, который мы описываем, обеспечивает доступ к максимальному объему данных при одновременном снижении институциональной нагрузки на обмен данными". сказала Джилл Барнхольц-Слоан, доктор философии, адъюнкт-профессор медицинской школы Университета Кейс Вестерн Резерв.

Модель следовала поэтапному подходу. Первый этап, называемый общедоступной начальной моделью, был предварительно обучен с использованием общедоступных данных Международного конкурса по сегментации опухолей головного мозга (BraTS). Перед моделью была поставлена задача определить границы трех субкомпартментов опухоли GBM: "усиливающая опухоль" (ET), представляющая нарушение сосудистого гематоэнцефалического барьера внутри опухоли; "ядро опухоли" (TC), которое включает ET и часть, которая убивает ткань, и представляет часть опухоли, актуальные для хирургов, которые их удаляют; и "вся опухоль" (WT), которая определяется объединением TC и инфильтрированной ткани, которая представляет собой всю область, которая будет обработана облучением.

Сначала были проанализированы данные о 231 случае заболевания пациентов из 16 мест, и полученная модель была проверена на соответствие локальным данным в каждом месте. На втором этапе, получившем название предварительной консенсусной модели, использовалась общедоступная исходная модель и было включено больше данных из 2471 случая пациентов из 35 мест, что повысило ее точность. Заключительный этап, или модель окончательного консенсуса, использовал обновленную модель и включил наибольшее количество данных из 6314 случаев пациентов (3 914 680 изображений) в 71 месте на 6 континентах для дальнейшей оптимизации и проверки на обобщаемость для невидимых данных.

В качестве контроля для каждого шага исследователи исключили 20 процентов от общего числа случаев, представленных каждым участвующим сайтом, из процесса обучения модели и использовали в качестве "локальных данных проверки". Это позволило им оценить точность совместного метода. Чтобы дополнительно оценить обобщаемость моделей, шесть сайтов не были задействованы ни на одном из этапов обучения, чтобы представить совершенно невидимую совокупность данных "вне выборки" из 590 случаев. Примечательно, что сайт Американского колледжа радиологии подтвердил свою модель, используя данные национального клинического исследования.

После обучения модели окончательная согласованная модель получила значительные улучшения производительности по сравнению с данными локальной валидации сотрудников. Окончательная согласованная модель показала улучшение на 27% при обнаружении границ ET, на 33% при обнаружении границ TC и на 16% при обнаружении границ WT. Улучшенный результат является четким указанием на пользу, которую можно получить за счет доступа к большему количеству случаев, не только для улучшения модели, но и для ее проверки.

Заглядывая в будущее, авторы надеются, что благодаря общей методологии федеративного обучения ее применение в медицинских исследованиях может быть далеко идущим, применяясь не только к другим видам рака, но и к другим состояниям, таким как нейродегенерация, и за ее пределами. Они также ожидают дальнейших исследований, чтобы продемонстрировать, что федеративное обучение может соответствовать протоколам безопасности и конфиденциальности по всему миру.

Категория: Наука и Техника | Добавил: fantast (06.12.2022)
Просмотров: 118 | Рейтинг: 0.0/0