Нейросети предскажут свойства органических соединений
Ученые из России, Эстонии и Великобритании создали новый метод прогнозирования важного свойства органических молекул – фактора биоконцентрации.
Новый подход, основанный на классических моделях физико-химических взаимодействий растворителя с растворяемым веществом и современных методах машинного обучения, позволяет предсказывать сложные свойства веществ, используя минимальный набор исходных данных. Результаты исследования опубликованы в журнале Journal of Physics: Condensed Matter.
Фактор биоконцентрации характеризует степень накопления вещества в живых организмах и является одним из важнейших свойств органических веществ, используемых при оценке безопасности того или иного химического соединения. Оценить этот параметр на практике можно, добавив исследуемое вещество, к примеру, в емкость с живой рыбой и спустя некоторое время померив его концентрацию в рыбе и в окружающей воде.
Оценить фактор биоконцентрации без проведения дополнительных экспериментов можно двумя способами.
Первый способ – это сгенерировать множество параметров (дескрипторов), описывающих молекулы, и построить на основе этих данных математическую модель. Модель может получиться точной, но плохо интерпретируемой за счет большого числа параметров. Что еще хуже, модель может работать неудовлетворительно для соединений, слишком отличающихся от представленных в обучающей выборке.
Второй подход основан на молекулярной теории жидкости, описывающей поведение веществ в растворах. Однако, так как биоконцентрация – это сложный параметр, зависящий от множества факторов, то используя физико-химическую теорию напрямую предсказать биоконцентрацию тоже не получится.
Ученые из "Сколтеха", Университета Тарту (Эстония) и Университета Стратклайда (Великобритания) под руководством профессора "Сколтеха" Максима Федорова разработали гибридный метод предсказания фактора биоконцентрации. Cначала они проводят физико-химические расчеты, на основе которых определяют трехмерные плотности водорода и кислорода вокруг изучаемой молекулы, а потом применяют к этим данным 3D сверточные нейронные сети, технологию уже успешно используемую для распознавания изображений. Данный подход демонстрирует, что для описания сложных свойств органических веществ достаточно небольшого объёма исходной информации.
"Разработанный нами метод позволит существенно упростить прогнозирование экологической нагрузки от того или иного вещества. Но самое главное в нашей работе это то, что мы разработали универсальный способ описания молекулы для передачи ее "образа" в трехмерную сверточную нейронную сеть. В перспективе, наши разработки позволят прогнозировать свойства различных экзотических молекул и принципиально новых соединений, для которых существующие методы поиска соотношений структура-свойство неприменимы", – рассказывает аспирант "Сколтеха" Сергей Соснин, первый автор опубликованной статьи.