О том, как научить искусственный интеллект понимать, а не угадывать химию

Наука и жизньНаука

Глаз-синхротрон

Беседу ведёт Наталия Лескова

Богдан Олегович Проценко. Фото Виктора Шаповалова

Рентгеновская спектроскопия поглощения — один из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: учёные тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчёты. Теперь, благодаря методам, основанным на машинном обучении, этот процесс занимает всего несколько минут.

О том, как научить искусственный интеллект понимать, а не угадывать химию, рассказывает Богдан Проценко, лаборант-исследователь Международного исследовательского института интеллектуальных материалов Южного федерального университета (МИИ ИМ ЮФУ).

— Богдан Олегович, что такое рентгеновская спектроскопия и зачем она нужна?

— Это метод исследования вещества. У физиков, как у детей: чтобы понять, что внутри, надо вещь или сломать, или воздействовать на неё чем-то, и уже по результату, отклику делать выводы. Чтобы понять, что арбуз сладкий, достаточно просто похлопать по нему. А вот когда мы переходим к атомам и молекулам, мельчайшим деталям их строения и функционирования, к тому, как вообще устроена материя вокруг нас и почему она такая, а не какая-то другая — всё становится намного сложнее. Нет там «правды», которую можно увидеть глазами: размеры систем много меньше длины волны видимого света, а энергии процессов много больше. Дифракционный предел (который также называют критерием Рэлея или критерием Аббе) ограничивает минимальные размеры того, что можно увидеть. Но если взять длины волн, сопоставимые с размерами атомов и расстояниями между ними, то мы обойдём этот предел и окажемся в рентгеновском диапазоне.

Когда мы светим на вещество рентгеновским излучением, оно рассеивается либо с сохранением энергии, упруго, как говорят физики, либо неупруго, теряя или приобретая энергию после рассеивания. Первый вариант называется дифракцией — это отличный метод исследовать структуру упорядоченных объектов, например кристаллов. Рассеянное на кристаллической решётке рентгеновское излучение интерферирует, давая максимумы и минимумы на разных углах отражения. Но для этого нужен дальний порядок расположения атомов. А вот второму варианту, собственно рентгеновской спектроскопии, это уже безразлично.

Макет строящейся установки СИЛА (СИнхротрон + ЛАзер). Она объединит в себе сразу две установки: лазер на свободных электронах (с энергией 6 ГэВ) и синхротрон. За макетом — Богдан Проценко. Фото: Фото Назара Чубкова

Мы светим рентгеновским излучением разных энергий на вещество и смотрим, как оно поглощается. Это и есть рентгеновская спектроскопия. По форме зависимости поглощения излучения от его энергии, которая и называется спектром рентгеновского поглощения, можно понять, как в веществе расположены атомы и в каком химическом состоянии они находятся. При буквальном переводе с латыни spectrum — «образ», «душа», что как бы подчёркивает, что спектр отражает некоторые уникальные внутренние особенности объекта.

Идея рентгеновской спектроскопии в общем-то простая: раз рассеяние у нас неупругое, то есть часть излучения поглощается, теряет энергию, — значит, эта энергия на что-то расходуется. А идёт она на то, чтобы выбить электроны в атомах со своих «насиженных» мест и отправить их прочь из атома. Выбитый электрон тратит полученную энергию на то, чтобы преодолеть притяжение атома и затем столкнуться с соседними атомами. Ситуацию, когда излучение выбивает электроны из вещества, мы называем фотоэффектом, выбитый электрон — фотоэлектроном, а такого рода рассеяние на соседях с наложением результатов — интерференцией. В сущности, рентгеновская спектроскопия — это интерференция фотоэлектронов, где интерференционной решёткой служит сама материя. Разного рода интерферометры принадлежат к классу самых точных измерительных приборов, взять хотя бы обсерваторию LIGO, где впервые зафиксировали гравитационные волны.

В микромире между частицами и волнами нет чёткой грани — это так называемый корпускулярно-волновой дуализм. Поэтому на вылетевший электрон в силу квантовых эффектов можно смотреть как на волну, которая рассеивается на соседях, накладывается сама на себя и т. д. Представьте себе, что вы кинули в воду камень, и от его падения пошли волны на воде — вот это как бы выбитый электрон. Волны встречают препятствия, отражаются, эти вторичные отражённые волны накладываются уже на первую волну и друг на друга — получается интересная интерференционная картина. При разных энергиях излучения, то есть если с разной силой «пинать» электрон, интерференционная картина будет разной. Вот почему форма зависимости поглощения от энергии содержит в себе информацию как о локальном окружении атомов, так и об их электронной структуре. Примерно как в аналогии с кругами на воде, только с поправкой на то, что все процессы носят квантовый характер: получается, что фотоэлектрон, будучи одной (!) частицей, вполне прекрасно рассеивается сам на себе и учитывает в момент своего вылета (ещё до рассеяния на соседях, как бы «зная будущее наперёд») все возможные варианты того, как он сможет после вылета рассеяться на соседях. Если вам это кажется захватывающим — поздравляю, вы в шаге от вступления в наш клуб спектроскопистов!

— Что нужно, чтобы получить рентгеновский спектр какого-нибудь соединения?

— Понятное дело, что для рентгеновской спектроскопии нужен собственно рентген, и во всём мире строятся огромные установки для генерации очень яркого и сфокусированного излучения. Это синхротроны и рентгеновские лазеры на свободных электронах — монструозные устройства, способные генерировать излучение в миллионы раз ярче Солнца с микро- и фемтосекундным разрешением… На таких сложных и дорогих устройствах, занимающих, как правило, площадь очень большого здания, находится сразу несколько лабораторий — их называют линиями, или каналами, где каждая лаборатория реализует свою методику исследования. Возможности рентгеновской спектроскопии огромны, потому неудивительно, что существует корреляция между научно-техническим уровнем страны и количеством подобных установок. Учёные обычно пишут заявку на то, чтобы получить возможность провести измерения на одной из них, и, если она выигрывает, приезжают командой, с оборудованием и образцами, и проводят измерения круглосуточно — там каждый час на счету. Экспериментальная работа на таких установках позволяет получать уникальные данные, ценные практически в любой области, от искусствоведения и истории до геологии экзопланет, структурной биологии, катализа и материаловедения. Например, структура подавляющего большинства белков человечеству известна во многом благодаря синхротронам.

— Насколько я знаю, в нашей стране на данный момент всего одна такая установка — в Курчатовском институте.

— Да, это Курчатовский источник синхротронного излучения («КИСИ-Курчатов»). Кроме него есть ещё два ускорителя в Новосибирске (ВЭПП-3 и ВЭПП-4), которые часть времени работают на генерацию синхротронного излучения. Ещё активно строятся или планируются новые, например СКИФ (Сибирский Кольцевой Источник Фотонов), СИЛА (СИнхротрон+ЛАзер), РИФ и другие. Думаю, нам в Ростове один, пусть и небольшой ускоритель, тоже бы не помешал.

— Какие всё это решает фундаментальные задачи?

— Спектроскопия рентгеновского поглощения — это один из важнейших инструментов, необходимых для того, чтобы узнать, как на самом деле устроено вещество вокруг нас. Иными словами, понять на атомарном уровне устройство материи, какая она, почему и как функционирует.

Причём ограничений на состояние образца нет, рентгеновская спектроскопия применима для любого агрегатного состояния вещества и может применяться прямо в процессе работы (в этом помогает проникающая способность рентгена), например, можно исследовать, как деградируют катализаторы прямо в ходе реальной реакции или как стареют литий-ионные батареи в циклах зарядки-разрядки. Её используют и для изучения биологических объектов (в частности, металлических центров в белках), для диагностики конструкционных и функциональных материалов, в том числе для микроэлектроники.

Фото Назара Чубкова

— Что представляет собой ваша разработка?

— Наша разработка — это метод для быстрого и точного анализа данных спектроскопии рентгеновского поглощения, основанный на искусственном интеллекте или машинном обучении. Мы с вами говорили про то, как много полезной информации содержится в рентгеновских спектрах и как их измеряют, но ни слова про то, как их, собственно, анализируют. А это очень непросто. Мы не видим отдельные атомы и их состояние, но видим некоторую сложную общую картину. Как будто бы это какая-то тень, отбрасываемая объектом, но не сам объект. А как восстановить объект по отбрасываемой им тени? Если структура однозначно определяет спектр, то спектр не всегда однозначно определяет структуру. В математике даже есть термин для такого рода задач — некорректные обратные задачи. Наша разработка посвящена тому, как решить эту некорректную задачу: с помощью машинного обучения построить алгоритм получения структуры из спектра.

У спектра рентгеновского поглощения есть две основные области: тонкая структура вблизи края поглощения (XANES) и протяжённая тонкая структура поглощения после края (EXAFS). Последняя, поскольку в ней доминирует рассеяние на соседях, позволяет исследователь в большей степени геометрические параметры (то, как расположены атомы), и для неё существует формула, подгоняя которую к данным, учёные получают структурные параметры вещества. А вот для XANES, где есть вклад в рассеяние и геометрии локального окружения и электронного состояния атомов, такой формулы нет. И не будет никогда. Так уж устроена наука, что только в школе всё понятно и для всего есть уравнение, решаемое аналитически, в жизни и науке, увы, не так. Перед нами ларец с ценнейшей информацией, но ключа у нас от него нет… Потому исследователям остаётся либо с весьма ограниченной точностью численно моделировать простейшие системы на суперкомпьютерах, чтобы понять какие-то закономерности, либо сравнивать неизвестную систему с известными.

Спектр каждого материала уникален, и его особенности — как отпечаток пальца человека. Поэтому этот метод так и называется — «метод отпечатка пальца». Исследователи берут библиотеку спектров веществ-эталонов и пристально вглядываются в то, что у этих спектров есть общего и различного с неизвестным спектром. Хотя звучит это не очень точно, надёжно и воспроизводимо… Иными словами, исследователи потратили огромные усилия и деньги, чтобы построить синхротроны, провести на них измерения, — и не могут из этих данных извлечь полезную информацию. Однако давайте приглядимся к последнему методу внимательнее — в нём мы собираем выборку, или библиотеку данных, и на её основе ищем закономерности, воспользовавшись которыми, пытаемся сделать вывод или предсказание для новых данных. Ничего не напоминает? Да это же просто пресловутое машинное обучение, раздел столь популярного ныне искусственного интеллекта!

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Булгаковский Киев Булгаковский Киев

Булгаков, скорее всего, не ждал, что станет частью большого исторического хаоса

Дилетант
Пластмассовый мир (не) победил Пластмассовый мир (не) победил

Насколько глубоко гаджеты проникли в нашу жизнь?

Правила жизни
«Ползи, улитка…» «Ползи, улитка…»

Куда деться от городской суеты? Создать город без суеты!

Вокруг света
«Не ждите сразу москвичей с деньгами». Как оценить рынок для открытия турагентства «Не ждите сразу москвичей с деньгами». Как оценить рынок для открытия турагентства

Как оценить рынок внутреннего туризма и открыть собственный бизнес

Inc.
Мамин голос Мамин голос

Каким мамин голос может остаться в памяти детей

Новый очаг
«Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией «Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией

Истории женщин, которые научились жить с алопецией и помогают другим

Forbes
Загадочная смерть Дороти Хант, жены одного из ключевых участников Уотергейтского скандала Загадочная смерть Дороти Хант, жены одного из ключевых участников Уотергейтского скандала

Трагедия Дороти Хант и ее связь с Уотергейтским скандалом

ТехИнсайдер
Соло-мама Соло-мама

Каких ошибок стоит избегать женщинам, которые растят детей в одиночку

Лиза
Летаем с комфортом: от каких напитков нужно отказаться на борту самолета, а к каким стоит присмотреться? Летаем с комфортом: от каких напитков нужно отказаться на борту самолета, а к каким стоит присмотреться?

Какие напитки лучше пить в самолете?

ТехИнсайдер
Установка для очистки отработанных масел УОМ-3М(100) Установка для очистки отработанных масел УОМ-3М(100)

Как установка УОМ-3М(100) очищает отработанное моторное масло

Наука и техника
Культура всегда со страной Культура всегда со страной

Разговор с директором Эрмитажа о роли, которую играют сейчас музеи

Знание – сила
Инфекционный след: что вызывает болезнь Альцгеймера и зачем нужен когнитивный резерв Инфекционный след: что вызывает болезнь Альцгеймера и зачем нужен когнитивный резерв

О вероятных причинах и механизмах развития болезни Альцгеймера

Forbes
Раскодировать инфекцию Раскодировать инфекцию

Программа для сложных клинических случаев

Санкт-Петербургский университет
Шоу продолжается Шоу продолжается

Эра Бернара Тапи в «Марселе»: взлёт, скандал и резкое падение клуба

Ведомости
Делим заботы поровну Делим заботы поровну

Муж не помогает по дому: как исправить ситуацию без стресса

Лиза
На партийном вайбе На партийном вайбе

Оживлённые вожди и мемы: как партии завоёвывают молодёжь с помощью ИИ

Ведомости
О колокольчиках в саду О колокольчиках в саду

Оказывается, не все колокольчики голубые и не у всех венчики похожи на колокола

Наука и жизнь
Кабачки Кабачки

Куда девать кабачки летом?

Здоровье
Как Сатурну удается сохранять такие ровные кольца Как Сатурну удается сохранять такие ровные кольца

Сатурн: откуда у него кольца и почему они всегда на своем месте

Maxim
Пусть всегда будет солнце! Пусть всегда будет солнце!

Atraversia — серийная моторная яхта с чисто электрической установкой

Y Magazine
Изучать или запрещать: почему весь мир так боится микропластика Изучать или запрещать: почему весь мир так боится микропластика

Насколько на самом деле опасен микропластик и нужно ли с ним бороться

Forbes
Не только Мирра Андреева: 5 российских теннисисток, за которыми стоит следить Не только Мирра Андреева: 5 российских теннисисток, за которыми стоит следить

В российском теннисе выросло поколение спортсменок. За кем стоит следить?

Правила жизни
Популярные средства похудения ведут к большой потери мышечной массы Популярные средства похудения ведут к большой потери мышечной массы

Как препараты для похудения, Ozempic или Wegovy, влияют на организм?

ТехИнсайдер
Под ливнем наград Под ливнем наград

История создания кастомной яхты Benetti Kasper 7

Y Magazine
Интернет из папки: готовы ли российские суды доверять электронным доказательствам Интернет из папки: готовы ли российские суды доверять электронным доказательствам

Как цифровизация сказывается на судебных процессах в России?

Forbes
Уже не косметика, но еще не лекарство: чем опасна космецевтика Уже не косметика, но еще не лекарство: чем опасна космецевтика

Чем опасно бесконтрольное применение космецевтики?

Forbes
Как откручивать шкив коленвала и в какую сторону Как откручивать шкив коленвала и в какую сторону

Все о снятии шкива коленвала: инструменты, последовательность, как крепится

РБК
Партнер по религиозным соображениям Партнер по религиозным соображениям

Как Россия создает базу для привлечения исламского капитала

Эксперт
CAR-T-клетки получили прямо в организме четырех пациентов CAR-T-клетки получили прямо в организме четырех пациентов

Результаты испытаний технологии для получения противоопухолевых Т-лимфоцитов

N+1
Как нам реорганизовать капитализм? Как нам реорганизовать капитализм?

В мире ширится оппозиция традиционным рыночным отношениям

Ведомости
Открыть в приложении