Химиоинформатика

Химическая информатика, хеминформатика или химическая информатика (английский: Chemoinformatics, Cheminformatics, Chemical Informatics или Chemiinformatics ) обозначает отрасль науки в области химии, использующей методы информатики, связанные с целью разработки методов для расчета молекулярных свойств и использовать. Среди предков - Поль деМэн (1924–1999), Иоганн Гастайгер , Юре Зупан (* 1943) и Ивар Уги .

Термин «химическая информатика» сравнительно молод, в то время как более ранняя вычислительная химия Термини (производная от английского: Computational Chemistry ) и химическая теория графов относятся к той же области ( ссылка : Bonchev / Rouvray, 1990). В настоящее время вычислительная химия понимается больше как раздел теоретической химии и квантовой химии .

Основы

Хемоинформатика занимается расчетами на цифровых представлениях молекулярных структур . Молекулярные структуры можно понимать как графики . Чем их представление уже известная для многих приложений таблица привязки (англ .: connection table ) является достаточной в характере связей ( связей ) между отдельными атомами молекулы, хранится. Включение двумерных (2-D) или трехмерных (3-D) координат может быть необходимо только для дальнейшего рассмотрения . Последние особенно необходимы, когда, например, в области медицинской химии , необходимо исследовать взаимодействия с биомолекулами, такими как белки .

Размер теоретического химического пространства всех фармакологически активных органических молекул оценивается примерно в 10 60 молекул. Для этой оценки были приняты только молекулы с элементами углерода, кислорода, азота и серы и с молярной массой менее 500 г / моль ( Лит .: Bohacek, 1999). Пространство всех мыслимых органических соединений значительно больше, а именно бесконечно велико. Таким образом, обе теоретические химические установки намного превышают количество синтезированных ранее молекул ( ссылка : Lahana, 1999). Однако с помощью компьютерных методов многие миллионы молекул уже могут быть проанализированы теоретически ( in silico ) без предварительного их синтеза для измерений в лаборатории.

Представление химических структур

Представление химических структур - один из фундаментальных вопросов. Представление в виде таблицы соединений, основанное на теории валентной структуры , зарекомендовало себя для большинства приложений . Ацесульфам в стандартном формате Molfile из MDL приведен здесь как пример таблицы привязки . Строки 5–14 содержат координаты x , y и z и идентификаторы элементов атомов, строки 15–24 - таблицу связей с начальными и конечными атомами каждой связи и типом связи. Нулевые столбцы содержат возможные дополнительные идентификаторы.

 Acesulfame
   -ISIS-  05070815372D

  10 10  0  0  0  0  0  0  0  0999 V2000
     3.2283   -1.4806    0.0000 S   0  0  3  0  0  0  0  0  0  0  0  0
     2.5154   -1.8944    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
     3.2283   -0.6538    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
     4.0544   -1.4806    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
     3.6448   -2.1935    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
     1.7990   -1.4806    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
     2.5154   -0.2406    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
     1.7990   -0.6538    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
     1.0826   -1.8944    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
     2.5154    0.5855    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   1  2  1  0  0  0  0
   1  3  1  0  0  0  0
   1  4  2  0  0  0  0
   1  5  2  0  0  0  0
   2  6  1  0  0  0  0
   3  7  1  0  0  0  0
   6  8  1  0  0  0  0
   6  9  2  0  0  0  0
   7 10  1  0  0  0  0
   7  8  2  0  0  0  0
  M  END

Помимо таблицы связывания, можно определить трехмерные координаты реально существующих молекул с помощью рентгеноструктурного анализа. Если это невозможно или молекула физически не существует, трехмерные координаты могут быть, по крайней мере, приблизительно также непосредственно из таблицы связывания с помощью итеративной энергии - для молекулы генерируются минимальные расчеты для различных конформаций . Двумерные координаты обычно используются только для иллюстрации молекулы и поэтому должны в основном соответствовать эстетическим требованиям. Они также рассчитываются непосредственно из таблицы связей в соответствии с общепризнанными правилами химических символов, но только в самых редких случаях они отражают фактические пространственные условия в молекуле.

Методы

Процедуры, не требующие эмпирических параметров, называются методами ab initio. Полуэмпирические методы содержат эмпирические величины и другие полуэмпирические параметры, которые были определены с помощью теоретических процедур, но больше не имеют никакого отношения к измеряемым величинам. В принципе, неэмпирические процессы подходят для молекул меньшего размера. Полуэмпирические процессы показывают свои сильные стороны на молекулах среднего размера (100 атомов). Примерами полуэмпирических методов являются MNDO и AM1.

Ab initio методы

Качество, с которым ab initio методы могут вычислять свойства молекул, зависит от базового набора атомов, то есть от того, насколько хорошо и с каким количеством индивидуальных функций представлены атомные орбитали и в какой степени учитывается корреляция электронов. Ab initio методы, которые также учитывают корреляцию электронов , значительно сложнее, но дают наилучшие результаты. Обычно делают компромисс и аппроксимируют корреляцию электронов. Примеры таких методов: теория возмущений Меллера-Плессета , CI ( конфигурация-взаимодействие ), CC ( связанный кластер ), MCSCF (самосогласованное поле с множественной конфигурацией). Большинство процедур ab initio основано на методе Хартри-Фока . Одним из преимуществ метода ab initio является то, что их можно систематически улучшать, поскольку точность результатов может быть систематически улучшена путем расширения базового набора и повышения степени учета электронной корреляции (например, CISD, CISDT, ...) .

Функциональные методы плотности

Теория функционала плотности (DFT) - это метод определения основного состояния многоэлектронной системы на основе трехмерной позиционно-зависимой электронной плотности . Следовательно, нет необходимости решать уравнение Шредингера для многомерной многоэлектронной системы, что значительно снижает количество требуемых вычислительных мощностей и позволяет проводить вычисления в более крупных системах. В основе теории функционала плотности лежит теорема Хоэнберга-Кона . Однако точный функционал, связывающий плотность основных состояний с собственной энергией системы, неизвестен. Поэтому на практике выбор подходящего приближенного функционала имеет решающее значение для точности. Систематическое улучшение менее выражено, чем при использовании методов ab initio.

Полуэмпирические процедуры

В полуэмпирических методах большая часть интегралов формализма Хартри-Фока не учитывается, другие аппроксимируются спектроскопическими значениями, параметрами или параметризованными функциями. Причиной такого приближения была низкая вычислительная мощность прежних времен. Чтобы иметь возможность применять теоретические знания к химическим проблемам, существующий формализм пришлось упростить.

Приближение Хюккеля является простейшим полуэмпирическое подход, так как он не вычисляет никаких интегралов. Однако это применимо только к электронным системам. Позже теория была распространена на системы (Расширенная теория Хюккеля, EHT).

Установленные методы, которые все еще часто используются сегодня, относятся к классу приближения NDDO (пренебрежение двухатомным дифференциальным перекрытием): MNDO (модифицированное пренебрежение дифференциальным перекрытием), AM1 (модель Остина 1), PM3 (параметризованный метод 3). Для критических расчетов полуэмпирические методы были объединены с CI и MCSCF. С помощью таких методов, например, можно рассчитать реакционные барьеры и полные энергетические профили сложных реакций или даже возбужденные состояния (MNDO / CI, MNDO / MCSCF).

Ограничения полуэмпирических методов заключаются в их параметризации: на самом деле, с помощью готового метода могут быть рассчитаны только системы, которые аналогичным образом присутствовали в наборе данных параметризации.

Молекулярно-механические процессы

В программах силового поля используется классический механический подход: связи между двумя атомами A и B просто аппроксимируются пружиной и в простейшем случае описываются гармоническим потенциалом ( закон Гука ):

Поскольку двойная связь между двумя атомами углерода имеет другую прочность и равновесную длину, чем одинарная связь, требуются другие наборы параметров ( силовая постоянная и положение покоя ). По этой причине простые элементы больше не используются для идентификации атомов, а используются для обозначения типов атомов. Аналогичные подходы существуют для валентных и торсионных углов. Электростатические ( кулоновские ) и ван-дер-ваальсовые взаимодействия называются несвязывающими взаимодействиями. Методы силового поля должны быть параметризованы на основе эмпирических или квантово-механических расчетных данных, чтобы силовое поле характеризовалось двумя вещами: его энергетической функцией и набором параметров.

Силовые поля позволяют оптимизировать геометрию очень больших (био) молекул (например, белков ) и в основном используются для моделирования молекулярной динамики или Монте-Карло .

Приложения

В этой области есть несколько важных тем - выборка:

  • Компьютерное представление молекул и квантово-механический расчет их свойств.
  • Приложения, которые могут хранить и находить химические вещества в структурированном виде (базы данных)
  • Методы понимания систематики взаимодействия между молекулярной структурой и свойствами веществ (QSPR).
  • Расчеты силового поля для оптимизации геометрии больших молекул
  • Молекулярная динамика для расчета термодинамики связывания ферментов
  • Планирование автоматизированного синтеза
  • Компьютеризированный прогноз эффективности лекарств

Некоторые примеры приложений более подробно представлены ниже.

Количественная взаимосвязь структура-активность

С помощью соответствующих алгоритмов , коды для молекул разработаны. Путем создания новых консервов создаются гипотезы на основе молекулярных свойств, таких как биодоступность или способность вещества, функция определенного белка в организме подавлять или усиливать (см. Также: QSAR ).

Оптимизация лидов

При наличии подходящих химических и биологических гипотез это химическое пространство может быть сокращено до нескольких кандидатов, которые затем синтезируются в лаборатории и проходят клинические испытания. По этой причине хеминформатика в области фармацевтической химии и медицинской химии играет важную роль в оптимизации структур свинца .

термодинамика

В технической химии , групповые вклады методы используются для оценки свойств материалов , таких как нормальные точки кипения , критические данные , поверхностного натяжение и многие другие.

Молекулярное моделирование

Молекулярное моделирование использует, например, при создании моделей неизвестных макромолекул из шаблона (шаблон) Аналогично, известные молекулы (гомологии моделирования), взаимодействие между малыми и большими молекулами (рецептор стыковкой), в результате чего КССА возможно, молекулярная динамика и разработка трехмерных структур молекул с минимизацией энергии ( алгоритм восхождения , моделирование охлаждения , молекулярная механика и т. д.). Таким образом, речь идет о разработке моделей неизвестных структур на основе известных структур для обеспечения возможности QSAR.

Связанные области

Существует сильная связь с аналитической химией и хемометрикой . Отношения структура-свойство (например, корреляция спектра) играют центральную роль. Из-за схожего способа работы существует тесная связь с компьютерной физикой , а это означает, что часто нет четкого разделения.

Программные пакеты

Программы вычислительной химии основаны на различных квантово-химических методах решения молекулярного уравнения Шредингера . В принципе, можно выделить два подхода: полуэмпирические процедуры и процедуры ab initio.

Все описанные процедуры и методы доступны в стандартных пакетах программного обеспечения. Примеры: ACES, GAUSSIAN , GAMESS , MOLPRO, Spartan, TURBOMOLE, Cerius2 и Jaguar. ArgusLab подходит как свободно доступная программа для входа в вычислительную химию.

Задача пользователя этого программного обеспечения состоит в том, чтобы найти наиболее подходящую модель для его проблемы и интерпретировать результаты в диапазоне достоверности моделей.

Смотри тоже

литература

веб ссылки

Индивидуальные доказательства

  1. Трюгве Хельгакер, Джеппе Олсен, Пол Йоргенсен: Теория молекулярной электронной структуры . Репринтное издание. Wiley-Blackwell, Chichester 2013, ISBN 978-1-118-53147-1 ( amazon.de [по состоянию на 19 декабря 2018 г.]).
  2. Вольфрам Кох, Макс К. Хольтхаузен: Руководство химика по функциональной теории плотности . Джон Вили и сыновья, 2015, ISBN 978-3-527-80281-4 .
  3. ^ Вальтер Тиль: полуэмпирические квантово-химические методы . В: Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . Лента 4 , вып. 2 , 2014, ISSN  1759-0884 , с. 145-157 , DOI : 10.1002 / wcms.1161 .