590 likes | 853 Views
1. Оценка качества пространственной структуры (по G.Kleywegt, 2000). Сравнительный анализ пространственных структур белков. Построение пространственной модели белка в результате рентгеноструктурного анализа кристалла не есть точная наука!. Модель зависит от ее авторов:. их опыта
E N D
1. Оценка качества пространственной структуры (по G.Kleywegt, 2000) Сравнительный анализ пространственных структур белков
Построение пространственной модели белка в результате рентгеноструктурного анализа кристаллане есть точная наука!
Модель зависит от ее авторов: • их опыта • самокритичности • мотивации • используемого программного обеспечения Ошибки в модели почти неизбежны!
При высоком разрешении (<1.5 Å) и хороших фазах модель на 95% и более основана на экспериментальных данных (Kleywegt, 2000)
Остальные 5% модели зависят от того, • какие программы использовались • как моделировался B-фактор (есть свобода выбора) • допускались ли альтернативные конформации • моделировались ли водороды
Продолжение • какие сгущения электронной плотности интерпретировались как молекулы растворителя (воды), а какие – как шум • как отнеслись к некристаллографической симметрии: посчитали ли 2е или более копий одной и той же молекулы белка в ассиметрической ячейке • идентичными или • разрешили им отличаться?
При разрешении >2 Å (>90% РСА моделей в PDB) роль воображения авторов модели возрастает!
Задачи, решаемые пользователем PDB • Выбор хорошей (лучшей) модели из нескольких моделей одного и того же или нескольких родственных белков • Интегральная оценка качества и, следовательно, степень доверия модели • Выявление “маргинальных” групп атомов Маргинальные атомы в модели могут быть либо ошибками расшифровки (“отщепенцами”), либо особенными атомами белка (“белыми воронами”)
Основные индикаторы маргиналов • Пространственный R-фактор (Jones et al., 1991) • Карта Рамачандрана (Ramachandran&Ramachandran, 1965) • “Ротамеровость” боковой цепи (Jones et al., 1991) • Комфортность окружения атомов (Vriend&Sanders, 1993), в частности, анализ водородных связей • Инверсии петидной цепи от Cα до следующего Cα (pep-flip; Jones et al., 1991, Kleywegt&Jones, 1998)
Другие индикаторы маргиналов • высокий B-фактор ( >40) • странный коэффициент заполнения (напр. 0!?) • длины связей • углы • торсионные углы • (не) планарность • (неправильная) хиральность (Сα, для Thr, Ile – еще и Сβ)
Продолжение • недопустимое сближение несвязанных атомов • существенное различие B-факторов ковалентно связанных атомов • существенное различие конформаций в разных копиях одного и того же белка из ассиметрической ячейки
Пространственный R-фактор (Real Space R, RSR) • Характеризует насколько модель атома (-ов) соответствует “экспериментальной” электронной плотности Сумма берется по узлам пространственной решетки в окружении атома (атомов) Хорошие значения: RSR<10% Плохие: >20%
Продолжение • ρэкспвосстанавливается по фазам из модели и интенсивностям рефлексов из эксперимента (часто берут взвешенные интенсивности: эксперимент+модель – отсюда разные карты электронной плотности для одной модели) • Карты электронной плотности моделей, для которых в PDB есть файл структурных факторов, доступны на сайте Electron Density Server (EDS)
Вариант RSR – коэфициент корреляции между ρэксп и ρмодели • Как и RSR, вычисляется по узлам пространственной решетки • Не зависит от значений ρэксп , а зависит от согласованности изменений ρэксп и ρмодели • Coeff.corr. <0.9 - подозрительно
Еще один вариант RSR – Z-score • Для вычисления Z остатка (напр. Ala57) его RSR сравнивается со средним RSR длятого же типа остатков (Ala) по выборкеиз PDB с примерно таким же разрешением (напр. 1.5-2 Å)
Карта Рамачандрана характеризует насколько конформация плипептидной цепи остатка (псевдо-)энергетически выгодна ψ +180° 0° -180° -180° 0° +180° φ
Концепция “псевдоэнергии” • Идея: то, что наблюдается чаще – более энергетически выгодно • Реализация: • строим гистограмму интересующего нас параметра по подходящей выборке из PDB • приближаем ее разумной функцией (например, гауссовой) • считаем, что полученный график отражает энергию в зависимости от параметра
81782 остатка на карте Рамачандрана Beta (B) Left helix (L) Alpha(A)
Области на карте Рамачандрана 1CNR, разрешение 1.05 Классификация областей(PROCHECK): - предпочитаемая (A,B,L) - разрешенная (a,b,l,p) - допустимая (~a,~b,~l,~p) -запрещенная В хорошей модели >90% остатков, не считая Gly, Pro, находятся в предпочитаемой области
Карта какого остатка? PROLINE
Где Trp, где Ser? Ser Trp
His Asn Gln Анализ водородных связей • В моделях встречается инверсия боковых цепей His, Asn, Gln
Атом ND2 Asn51 №2 Атом N7 – акцептор H ? ? №1 A103 Атом OD1 Атом N6 – донор H Инверсия(?) в Asn51 гомеодомена №2 Еще в 36 структурах гомеодоменов – так же, как в 1й; еще в 2х – как во второй
4.3Å HOH375 3.9Å HOH376 Leu28.CD Анализ молекул воды.Пример из модели 1CBS Может ли HOH376 фиксироваться в одинаковых точках во всех ячейкахкристалла!??? Думаю, что нет
Интегральная оценка комфортности окружения остатка • В программе WhatCheck рассчитывается Z-score для комфортности окружения каждой боковой цепи • Маргиналы – Z-score < -5 • Более показательны участки цепи с низким Z, для их обнаружения строится сглаженный график зависимости Z от номера остатка
Статистика конформаций боковых цепей остатков • Боковые цепи имеют от 0 (Gly, Ala) до 4х (Lys, Arg) степеней свободы вращения вокруг ковалентных связей • Обозначаются χ1, ..., χ4
Распределение угла χ1 в моделях PDB Всего в выборке было 67608 остатков
Карта углов χ1 и χ2 для Leu Ось X: chi_1 (0-360°) Ось Y: chi_2 (0-360°) Всего 6638 остатков Изображены линии уровня плотности числа остатков
Ротамеры - это боковые цепи в типичных для данного типа остатков конформацияхУ каждого типа остатков (Leu, Trp, Arg и т.п.)свое число ротамеровSwissPDBviewer “знает” ротамеры и может их показать
Примеры грубыхошибок в записях PDB • Кристалл не того белка !!! • Полностью ошибочная модель (!) • Правильно найдены, но неправильно соединены элементы вторичной структуры • Участок цепи вписан в электронную плотность с ошибкой
Janin, 1990:в лаборатории очищали и кристаллизовали ретинат-связывающий белок;при РСА обнаружилось, что получился лизоцим …
1PHY, 2.4 ÅMcRee et al. 1989 2PHY, 1.4 Å Borgstahl et al. 1995 Две структуры фотоактивного желтого белка рецептора фототаксиса Ectothiorhdospira halophila:почти ничего общего!
1CHR: Hoier et al., 1993 Разрешение 3.00 Å 2CHR: Kleywegt et al., 1996 Разрешение 3.00 Å Хлормуконат циклоизомераза из Alcaligenes eutrophus: совмещенные структуры 1chr и 2chr
Gln20 Ala5 Ala5 Ser22 Lys16 Lys16 Gly40 Gly40 1CHR и 2CHR: пример “сдвига рамки” при расшифровке
Выравнивание последовательностей 1CHR и 2CHR по близости C_alpha атомов при наложении структур
Мог ли пользователь заподозрить ошибку в структуре 1CHR до появления 2CHR?
RSR: пространственный R-фактор для всех остатков структуры 1CHR
EDS server: Z-score vs Residue for 1chr Z-score=(RSR-<RSR>)/sigma
Z-score для RSR для всех остатков структуры 2CHR
Packing environmen for 1CHR:“Second generation quality Z-score plotsmoothed over a 10 residue window” (PDBCheck)