Путешествия
Новости турбизнеса, статьи, советы, видеобзоры, экскурсии на сайте http://protuor.ru

Бесплатное приложение для определения COVID-19 по звуку кашля может появиться в феврале

0
Кредиты наличными

В январе лаборатория искусственного интеллекта (ИИ) Сбербанка представила алгоритм, способный определить вероятность заболевания коронавирусной инфекцией по голосу, дыханию и кашлю. Как стало известно стопкоронавирус.рф, через несколько недель компания планирует выпустить на рынок и соответствующее бесплатное приложение для пользователей смартфонов. Об особенностях разработанного алгоритма, его точности и дальнейших перспективах порталу рассказал руководитель лаборатории Сбербанка Леонид Жуков.

Желание помочь

«Когда началась пандемия, мы все задумались о том, как можем помочь в борьбе с новым заболеванием, применяя свои знания и навыки», — объясняет Леонид Жуков.

Тогда подразделение «Сбера», которое специализируется на Data Science, начало разрабатывать алгоритм, предсказывающий распространение новой коронавирусной инфекции. В свою очередь, лаборатория искусственного интеллекта создала алгоритм, который определяет степень поражения легких по данным компьютерной томографии (КТ). Сегодня этот инструмент успешно применяется более чем в 20 регионах нашей страны.

Просматривая материалы зарубежных коллег, инженеры лаборатории ИИ наткнулись на статью Массачусетского технологического института (MIT) об алгоритме, который определяет вероятность заболевания новой коронавирусной инфекцией по кашлю.

«Идея нас очень заинтересовала, но без данных работать нельзя. А данные MIT не были доступны, поэтому работать было попросту не с чем», — объясняет руководитель лаборатории ИИ «Сбера».

К осени открытые датасеты (наборы обработанных данных для машинного обучения) опубликовали исследователи из Швейцарии и Индии. «А в ноябре и вовсе случилось маленькое чудо. Мы узнали, что компания «Медицинские инвестиционные решения» собирает необходимые нам данные — записи дыхания, кашля и голоса пациентов на добровольной основе — и готова ими поделиться. Нашли друг друга», — рассказывает Жуков.

Тестовая версия приложения

Важно отметить, что образцы записей были уже систематизированы медиками — каждый комплект содержал отметку о результате ПЦР-теста пациента, поэтому можно было определить, где звуки заболевших, а где — здоровых.

Когда у сотрудников лаборатории появилась необходимая информация, они приступили к разработке алгоритма.

Автоматическое обучение

В работе использовали опыт и собственные наработки, полученные при работе с КТ-снимками. Здесь также применили технологии глубоких сверточных сетей. 

«Мы взяли несколько тысяч образцов, которые нам предоставили партнеры, и начали обучать алгоритм на этих примерах, используя так называемое обучением с учителем», — объясняет руководитель лаборатории ИИ «Сбера».

При этом данных все равно было мало — для тренировки нейросети такого числа примеров недостаточно. Поэтому сотрудники лаборатории взяли открытые датасеты с голосами людей, уличным шумом и другими звуками для обучения сети. Заодно так нейронная сеть училась определять и выделять именно голос, дыхание и кашель среди других звуков.

Каждую полученную аудиозапись с помощью преобразования Фурье перевели в мел-спектрограмму — изображение, которое показывает энергию звука на разных частотах (мел — единица высоты звука). Так нейросеть получила понятный материал для обучения — она учится на картинках.

Тестовая версия приложения

«Коронавирус влияет на наши легкие и связки, голос меняется. И человеческое ухо порой неспособно распознать эти изменения, особенно если они незначительные в ситуации, когда болезнь протекает относительно легко. А вот машине это под силу», — объясняет Жуков.

В конечном счете глубокая сверточная нейросеть научилась распознавать определенные паттерны изменения голоса, дыхания и кашля. В новых образцах она ищет те паттерны, которые говорят о вероятном заболевании COVID-19.

Не медицинское решение

Леонид Жуков объясняет, что алгоритм его лаборатории — это не медицинское решение, а скорее технология для самопроверки. Система не может заменить ПЦР-тесты и поставить диагноз — это исключительное право врачей.

«Это персональный чекер, который помогает человеку понять, есть ли вероятность, что он заболел именно COVID-19. Заполнили короткий опросник по симптоматике, загрузили аудио со своим голосом, дыханием и кашлем — получили решение за минуту. Если система сказала, что вероятность заболевания у вас высока, обращайтесь к врачам, делайте лабораторные тесты», — рассказывает руководитель проекта.

В перспективе «Сбер» планирует повышать качество работы модели и сделать свою разработку своеобразной системой прескрининга, неинвазивным тестом. В течение четырех-пяти недель компания собирается выпустить соответствующее бесплатное приложение для смартфонов. Так тест станет массово доступным и, учитывая скорость его прохождения, может серьезно помочь в борьбе с распространением новой коронавирусной инфекции.

Подобные наработки, судя по научным публикациям, есть в США, Швейцарии и Индии, но готовый продукт — приложение для смартфонов — ни одна из этих стран еще не представила.

Тестовая версия приложения

Главное — точность

«Для любого алгоритма главное — точность, именно это самый важный вопрос. Тестов со стопроцентной точностью попросту не существует, это невозможно. Однако есть два показателя, которыми определяется качество тестов, а также алгоритмов классификации: чувствительность и специфичность (она же избирательность)», — отмечает Жуков.

Чувствительность показывает качество работы теста на больных, то есть способность алгоритма определить больного в группе других заболевших. Показатель чувствительности 90% говорит о том, что из 100 больных тест правильно определит 90, а оставшихся выявить не сможет. Специфичность, наоборот, показывает, сколько тест выявляет здоровых среди здоровых.

Для лабораторных тестов эти показатели фиксированы — просто потому, что так работают законы химии и биологии. А вот для алгоритмических тестов их можно настраивать в рамках общего качества модели под разные задачи.

«При этом важно понимать, что чувствительность и специфичность взаимосвязаны — увеличивая один из показателей, мы автоматически уменьшаем второй. На сегодня алгоритмический тест несильно, но все же уступает ПЦР-тестам, однако по параметрам мы к ним близки», — рассказывает инженер.

Если говорить техническим языком, средний ROC AUC (площадь под кривой ошибок — комплексная метрика, позволяющая оценить общее качество модели машинного обучения) составляет 0,85. При этом показатель 1 означает, что модель идеальна, а показатель 0,5 — что система выдает результат, как при подбрасывании монеты, с вероятностью 50/50.

Команда разработчиков планирует совершенствовать систему — когда будут появляться новые данные (образцы голоса, дыхания и кашля), нейросеть продолжит обучаться на них. И алгоритм будет работать еще точнее.

Вячеслав Кокуркин

Оставьте ответ

Ваш электронный адрес не будет опубликован.

четырнадцать − семь =

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.