Химиоинформатика
Химическая информатика, хеминформатика или химическая информатика (английский: Chemoinformatics, Cheminformatics, Chemical Informatics или Chemiinformatics ) обозначает отрасль науки в области химии, использующей методы информатики, связанные с целью разработки методов для расчета молекулярных свойств и использовать. Среди предков - Поль деМэн (1924–1999), Иоганн Гастайгер , Юре Зупан (* 1943) и Ивар Уги .
Термин «химическая информатика» сравнительно молод, в то время как более ранняя вычислительная химия Термини (производная от английского: Computational Chemistry ) и химическая теория графов относятся к той же области ( ссылка : Bonchev / Rouvray, 1990). В настоящее время вычислительная химия понимается больше как раздел теоретической химии и квантовой химии .
Основы
Хемоинформатика занимается расчетами на цифровых представлениях молекулярных структур . Молекулярные структуры можно понимать как графики . Чем их представление уже известная для многих приложений таблица привязки (англ .: connection table ) является достаточной в характере связей ( связей ) между отдельными атомами молекулы, хранится. Включение двумерных (2-D) или трехмерных (3-D) координат может быть необходимо только для дальнейшего рассмотрения . Последние особенно необходимы, когда, например, в области медицинской химии , необходимо исследовать взаимодействия с биомолекулами, такими как белки .
Размер теоретического химического пространства всех фармакологически активных органических молекул оценивается примерно в 10 60 молекул. Для этой оценки были приняты только молекулы с элементами углерода, кислорода, азота и серы и с молярной массой менее 500 г / моль ( Лит .: Bohacek, 1999). Пространство всех мыслимых органических соединений значительно больше, а именно бесконечно велико. Таким образом, обе теоретические химические установки намного превышают количество синтезированных ранее молекул ( ссылка : Lahana, 1999). Однако с помощью компьютерных методов многие миллионы молекул уже могут быть проанализированы теоретически ( in silico ) без предварительного их синтеза для измерений в лаборатории.
Представление химических структур
Представление химических структур - один из фундаментальных вопросов. Представление в виде таблицы соединений, основанное на теории валентной структуры , зарекомендовало себя для большинства приложений . Ацесульфам в стандартном формате Molfile из MDL приведен здесь как пример таблицы привязки . Строки 5–14 содержат координаты x , y и z и идентификаторы элементов атомов, строки 15–24 - таблицу связей с начальными и конечными атомами каждой связи и типом связи. Нулевые столбцы содержат возможные дополнительные идентификаторы.
Acesulfame -ISIS- 05070815372D 10 10 0 0 0 0 0 0 0 0999 V2000 3.2283 -1.4806 0.0000 S 0 0 3 0 0 0 0 0 0 0 0 0 2.5154 -1.8944 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0 3.2283 -0.6538 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 4.0544 -1.4806 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 3.6448 -2.1935 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 1.7990 -1.4806 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 2.5154 -0.2406 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.7990 -0.6538 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.0826 -1.8944 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 2.5154 0.5855 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1 2 1 0 0 0 0 1 3 1 0 0 0 0 1 4 2 0 0 0 0 1 5 2 0 0 0 0 2 6 1 0 0 0 0 3 7 1 0 0 0 0 6 8 1 0 0 0 0 6 9 2 0 0 0 0 7 10 1 0 0 0 0 7 8 2 0 0 0 0 M END
Помимо таблицы связывания, можно определить трехмерные координаты реально существующих молекул с помощью рентгеноструктурного анализа. Если это невозможно или молекула физически не существует, трехмерные координаты могут быть, по крайней мере, приблизительно также непосредственно из таблицы связывания с помощью итеративной энергии - для молекулы генерируются минимальные расчеты для различных конформаций . Двумерные координаты обычно используются только для иллюстрации молекулы и поэтому должны в основном соответствовать эстетическим требованиям. Они также рассчитываются непосредственно из таблицы связей в соответствии с общепризнанными правилами химических символов, но только в самых редких случаях они отражают фактические пространственные условия в молекуле.
Методы
Процедуры, не требующие эмпирических параметров, называются методами ab initio. Полуэмпирические методы содержат эмпирические величины и другие полуэмпирические параметры, которые были определены с помощью теоретических процедур, но больше не имеют никакого отношения к измеряемым величинам. В принципе, неэмпирические процессы подходят для молекул меньшего размера. Полуэмпирические процессы показывают свои сильные стороны на молекулах среднего размера (100 атомов). Примерами полуэмпирических методов являются MNDO и AM1.
Ab initio методы
Качество, с которым ab initio методы могут вычислять свойства молекул, зависит от базового набора атомов, то есть от того, насколько хорошо и с каким количеством индивидуальных функций представлены атомные орбитали и в какой степени учитывается корреляция электронов. Ab initio методы, которые также учитывают корреляцию электронов , значительно сложнее, но дают наилучшие результаты. Обычно делают компромисс и аппроксимируют корреляцию электронов. Примеры таких методов: теория возмущений Меллера-Плессета , CI ( конфигурация-взаимодействие ), CC ( связанный кластер ), MCSCF (самосогласованное поле с множественной конфигурацией). Большинство процедур ab initio основано на методе Хартри-Фока . Одним из преимуществ метода ab initio является то, что их можно систематически улучшать, поскольку точность результатов может быть систематически улучшена путем расширения базового набора и повышения степени учета электронной корреляции (например, CISD, CISDT, ...) .
Функциональные методы плотности
Теория функционала плотности (DFT) - это метод определения основного состояния многоэлектронной системы на основе трехмерной позиционно-зависимой электронной плотности . Следовательно, нет необходимости решать уравнение Шредингера для многомерной многоэлектронной системы, что значительно снижает количество требуемых вычислительных мощностей и позволяет проводить вычисления в более крупных системах. В основе теории функционала плотности лежит теорема Хоэнберга-Кона . Однако точный функционал, связывающий плотность основных состояний с собственной энергией системы, неизвестен. Поэтому на практике выбор подходящего приближенного функционала имеет решающее значение для точности. Систематическое улучшение менее выражено, чем при использовании методов ab initio.
Полуэмпирические процедуры
В полуэмпирических методах большая часть интегралов формализма Хартри-Фока не учитывается, другие аппроксимируются спектроскопическими значениями, параметрами или параметризованными функциями. Причиной такого приближения была низкая вычислительная мощность прежних времен. Чтобы иметь возможность применять теоретические знания к химическим проблемам, существующий формализм пришлось упростить.
Приближение Хюккеля является простейшим полуэмпирическое подход, так как он не вычисляет никаких интегралов. Однако это применимо только к электронным системам. Позже теория была распространена на системы (Расширенная теория Хюккеля, EHT).
Установленные методы, которые все еще часто используются сегодня, относятся к классу приближения NDDO (пренебрежение двухатомным дифференциальным перекрытием): MNDO (модифицированное пренебрежение дифференциальным перекрытием), AM1 (модель Остина 1), PM3 (параметризованный метод 3). Для критических расчетов полуэмпирические методы были объединены с CI и MCSCF. С помощью таких методов, например, можно рассчитать реакционные барьеры и полные энергетические профили сложных реакций или даже возбужденные состояния (MNDO / CI, MNDO / MCSCF).
Ограничения полуэмпирических методов заключаются в их параметризации: на самом деле, с помощью готового метода могут быть рассчитаны только системы, которые аналогичным образом присутствовали в наборе данных параметризации.
Молекулярно-механические процессы
В программах силового поля используется классический механический подход: связи между двумя атомами A и B просто аппроксимируются пружиной и в простейшем случае описываются гармоническим потенциалом ( закон Гука ):
Поскольку двойная связь между двумя атомами углерода имеет другую прочность и равновесную длину, чем одинарная связь, требуются другие наборы параметров ( силовая постоянная и положение покоя ). По этой причине простые элементы больше не используются для идентификации атомов, а используются для обозначения типов атомов. Аналогичные подходы существуют для валентных и торсионных углов. Электростатические ( кулоновские ) и ван-дер-ваальсовые взаимодействия называются несвязывающими взаимодействиями. Методы силового поля должны быть параметризованы на основе эмпирических или квантово-механических расчетных данных, чтобы силовое поле характеризовалось двумя вещами: его энергетической функцией и набором параметров.
Силовые поля позволяют оптимизировать геометрию очень больших (био) молекул (например, белков ) и в основном используются для моделирования молекулярной динамики или Монте-Карло .
Приложения
В этой области есть несколько важных тем - выборка:
- Компьютерное представление молекул и квантово-механический расчет их свойств.
- Приложения, которые могут хранить и находить химические вещества в структурированном виде (базы данных)
- Методы понимания систематики взаимодействия между молекулярной структурой и свойствами веществ (QSPR).
- Расчеты силового поля для оптимизации геометрии больших молекул
- Молекулярная динамика для расчета термодинамики связывания ферментов
- Планирование автоматизированного синтеза
- Компьютеризированный прогноз эффективности лекарств
Некоторые примеры приложений более подробно представлены ниже.
Количественная взаимосвязь структура-активность
С помощью соответствующих алгоритмов , коды для молекул разработаны. Путем создания новых консервов создаются гипотезы на основе молекулярных свойств, таких как биодоступность или способность вещества, функция определенного белка в организме подавлять или усиливать (см. Также: QSAR ).
Оптимизация лидов
При наличии подходящих химических и биологических гипотез это химическое пространство может быть сокращено до нескольких кандидатов, которые затем синтезируются в лаборатории и проходят клинические испытания. По этой причине хеминформатика в области фармацевтической химии и медицинской химии играет важную роль в оптимизации структур свинца .
термодинамика
В технической химии , групповые вклады методы используются для оценки свойств материалов , таких как нормальные точки кипения , критические данные , поверхностного натяжение и многие другие.
Молекулярное моделирование
Молекулярное моделирование использует, например, при создании моделей неизвестных макромолекул из шаблона (шаблон) Аналогично, известные молекулы (гомологии моделирования), взаимодействие между малыми и большими молекулами (рецептор стыковкой), в результате чего КССА возможно, молекулярная динамика и разработка трехмерных структур молекул с минимизацией энергии ( алгоритм восхождения , моделирование охлаждения , молекулярная механика и т. д.). Таким образом, речь идет о разработке моделей неизвестных структур на основе известных структур для обеспечения возможности QSAR.
Связанные области
Существует сильная связь с аналитической химией и хемометрикой . Отношения структура-свойство (например, корреляция спектра) играют центральную роль. Из-за схожего способа работы существует тесная связь с компьютерной физикой , а это означает, что часто нет четкого разделения.
Программные пакеты
Программы вычислительной химии основаны на различных квантово-химических методах решения молекулярного уравнения Шредингера . В принципе, можно выделить два подхода: полуэмпирические процедуры и процедуры ab initio.
Все описанные процедуры и методы доступны в стандартных пакетах программного обеспечения. Примеры: ACES, GAUSSIAN , GAMESS , MOLPRO, Spartan, TURBOMOLE, Cerius2 и Jaguar. ArgusLab подходит как свободно доступная программа для входа в вычислительную химию.
Задача пользователя этого программного обеспечения состоит в том, чтобы найти наиболее подходящую модель для его проблемы и интерпретировать результаты в диапазоне достоверности моделей.
Смотри тоже
литература
- Д. Бончев, Д.Х. Рувре: Химическая теория графов: Введение и основы . Издательство Gordon and Breach Science, 1990, ISBN 0-85626-454-7 .
- RS Bohacek, C. McMartin и WC Guida, «Искусство и практика структурно-ориентированного дизайна лекарств: перспектива молекулярного моделирования», Обзоры медицинских исследований, 1999, 1, 3-50. DOI : 10.1002 / (SICI) 1098-1128 (199601) 16: 1 <3 :: AID-MED1> 3.0.CO; 2-6
- Р. Лахана: Сколько лидов у HTS? Открытие наркотиков сегодня , 1999, 4, 447-448. DOI: 10.1016 / S1359-6446 (99) 01393-8 .
- А. Р. Лич, В. Дж. Жилле: Введение в хемоинформатику. Kluwer Academic Publishers, 2003, ISBN 1-4020-1347-7 .
- Дж. Гастайгер , Т. Энгель (Ред.): Хемоинформатика: Учебник. Джон Вили и сыновья, 2003 г., ISBN 3-527-30681-1 .
- Теоретическая химия # литература
- Журнал молекулярного моделирования , торговый журнал, выходящий раз в два месяца.
веб ссылки
- QMC @ home BOINC- проект Мюнстерского университета по квантовому методу Монте-Карло
- VCCLAB : Виртуальная лаборатория вычислительной химии
- JCIM : Журнал химической информации и моделирования
- JChemInf : Журнал химинформатики
- Центр компьютерной химии Университета Эрланген-Нюрнберг
- Cheminformatics.org , веб-сайт, поддерживаемый вручную, со ссылками на хеминформатику , проекты и базы данных
- Osiris Property Explorer , компьютерное предсказание свойств потенциальных лекарств
Индивидуальные доказательства
- ↑ Трюгве Хельгакер, Джеппе Олсен, Пол Йоргенсен: Теория молекулярной электронной структуры . Репринтное издание. Wiley-Blackwell, Chichester 2013, ISBN 978-1-118-53147-1 ( amazon.de [по состоянию на 19 декабря 2018 г.]).
- ↑ Вольфрам Кох, Макс К. Хольтхаузен: Руководство химика по функциональной теории плотности . Джон Вили и сыновья, 2015, ISBN 978-3-527-80281-4 .
- ^ Вальтер Тиль: полуэмпирические квантово-химические методы . В: Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . Лента 4 , вып. 2 , 2014, ISSN 1759-0884 , с. 145-157 , DOI : 10.1002 / wcms.1161 .