Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Metody teoretyczne przewidywania struktury białek oraz ich ..., Notatki z Chemistry

struktura natywna odpowiada zazwyczaj minimum energii swobodnej układu, w którym znajduje się białko. Jednakże ze względu na duży rozmiar cząsteczki białka ...

Typologia: Notatki

2022/2023

Załadowany 24.02.2023

Klara_86
Klara_86 🇵🇱

5

(1)

112 dokumenty

1 / 109

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
Maciej Błaszczyk
Metody teoretyczne
przewidywania struktury białek
oraz ich kompleksów z peptydami
Praca doktorska wykonana w
Pracowni Teorii Biopolimerów
Wydziału Chemii Uniwersytetu
Warszawskiego
Promotor pracy:
prof. dr hab. Andrzej Koliński
Promotor pomocniczy:
dr hab. Sebastian Kmiecik
Warszawa, listopad 2015
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Podgląd częściowego tekstu

Pobierz Metody teoretyczne przewidywania struktury białek oraz ich ... i więcej Notatki w PDF z Chemistry tylko na Docsity!

Maciej Błaszczyk

Metody teoretyczne

przewidywania struktury białek

oraz ich kompleksów z peptydami

Praca doktorska wykonana w Pracowni Teorii Biopolimerów Wydziału Chemii Uniwersytetu Warszawskiego

Promotor pracy: prof. dr hab. Andrzej Koliński Promotor pomocniczy: dr hab. Sebastian Kmiecik

Warszawa, listopad 2015

Pracę dedykuję mojej Żonie oraz dzieciom: Emilii, Róży, Janowi, Jerzemu i Jonatanowi. Jesteście najlepszą motywacją do działania i rozwoju.

SPIS TREŚCI

  • Wyjaśnienie skrótów stosowanych w pracy
    1. WSTĘP
    1. CZĘŚĆ TEORETYCZNA
    • 2.1. Metody eksperymentalne wyznaczania struktury białek i ich ograniczenia.........................
      • 2.1.1. Krystalografia rentgenowska
      • 2.1.2. Spektroskopia magnetycznego rezonansu jądrowego
      • 2.1.3. Ograniczenia metod eksperymentalnych
    • 2.2. Metody teoretyczne przewidywania struktury białek
      • 2.2.1. Metody porównawcze
        • 2.2.1.1. Przyrównania sekwencji
        • 2.2.1.2. Przewlekanie.........................................................................................................
      • 2.2.2. Modele gruboziarniste
        • 2.2.2.1. Model CABS
      • 2.2.3. Analiza wyników otrzymanych metodami gruboziarnistymi
        • 2.2.3.1. Analiza skupień
        • 2.2.3.2. Odbudowa reprezentacji pełnoatomowej
        • 2.2.3.3. Optymalizacja modeli
    1. WYNIKI PRAC
    • 3.1. BioShell Threader – serwer internetowy do modelowania porównawczego
      • 3.1.1. Metoda
      • 3.1.2. Dane początkowe i strona wynikowa
      • 3.1.3. Wyniki
    • 3.2. Predykcja struktury przy użyciu modelu CABS...................................................................
      • 3.2.1. Procedura
        • 3.2.1.1. Selekcja modeli początkowych
        • 3.2.1.2. Więzy odległości
        • 3.2.1.3. Modelowanie programem CABS
        • 3.2.1.4. Analiza skupień
        • 3.2.1.5. Rekonstrukcja modeli pełnoatomowych i ich optymalizacja
        • 3.2.1.6. Ocena modeli
      • 3.2.2. CABS-fold – serwer do przewidywania struktury trzeciorzędowej białek
        • 3.2.2.1. Dane początkowe..................................................................................................
        • 3.2.2.2. Dane wyjściowe....................................................................................................
      • 3.2.3. Wyniki
        • 3.2.3.1. Eksperyment CASP
        • 3.2.3.2. CASP9 – analiza wyników eksperymentu
        • 3.2.3.3. CASP9 ‒ przykłady
        • 3.2.3.4. Modelowanie de-novo
        • 3.2.3.5. Dynamika stanów okołonatywnych
    • 3.3. CABS-dock – serwer do przewidywania struktury kompleksów białek z peptydami
    1. PODSUMOWANIE I WNIOSKI
    1. BIBLIOGRAFIA
    1. PRACE STANOWIĄCE PODSTAWĘ ROZPRAWY
    • Praca 1 (P1)
    • Praca 2 (P2)
    • Praca 3 (P3)
    • Praca 4 (P4)
    • Praca 5 (P5)
    • Praca 6 (P6)
    • Praca 7 (P7)
    • Praca 8 (P8)
    • Praca 9 (P9)
    • Praca 10 (P10)
    • Praca 11 (P11)

Miara zdefiniowana jest jako: GDT_HA = ( P 0,5 +P 1 +P 2 +P 4)/ gdzie: Pn oznacza procent atomów (w przypadku tej pracy jedynie Cα) w ocenianej strukturze odległych o nie więcej niż n Å od odpowiadających im atomów w strukturze referencyjnej (po optymalnym nałożeniu struktur) LTB – ang. L aboratory of T heory of B iopolymers ; Pracownia Teorii Biopolimerów, a także nazwa grupy Autora, która wzięła udział w eksperymencie CASP MC – metoda M onte C arlo MD ‒ ang. M olecular D ynamics (dynamika molekularna) MSA – ang. M ultiple S equence A lignment (metody przyrównania wielu sekwencji) MQAP ‒ ang. M odel Q uality A ssessment P rogram (program do oceny jakości struktur białkowych) NMR ‒ ang. N uclear M agnetic R esonance (spektroskopia magnetycznego rezonansu jądrowego) PDB ‒ ang. P rotein D ata B ank ; baza danych zawierająca struktury białkowe; także format pliku stosowany do zapisu danych (w tym współrzędnych atomów) dotyczących struktur białkowych PSI-BLAST – ang. P osition- S pecific I terative B asic L ocal A lignment S earch T ool; program oparty na algorytmie BLAST wykorzystujący profile sekwencyjne REMC ‒ ang. R eplica E xchange M onte C arlo (metoda wymiany replik Monte Carlo) RMSD ‒ ang. R oot M ean S quare D eviation (średnie odchylenie kwadratowe); miara używana do oceny podobieństwa struktur białkowych. RMSD obliczany jest w następujący sposób:

𝑅𝑀𝑆𝐷 = √ 𝑁^1 ∑ 𝑑𝑖^2

𝑛

𝑖= gdzie: 𝑁 jest liczbą odpowiadających sobie atomów (w przypadku tej pracy jedynie Cα), a 𝑑𝑖 odległością między nimi (po optymalnym nałożeniu struktur) ROC – ang. R eceiver O perating C haracteristic ; krzywa pozwalająca na ocenę działania klasyfikatorów SAXS – ang. S mall A ngle X - Ray S cattering (małokątowe rozpraszanie promieniowania rentgenowskiego)

SCOP – ang. S tructural C lassification o f P roteins ; baza danych klasyfikacji znanych struktur białkowych SCWRL – program do odbudowy grup bocznych na podstawie modelu zawierającego łańcuch główny TBM – ang. T emplate B ased M odeling (modelowanie z użyciem szablonów) TR – ang. T arget R efinement; optymalizacja struktur, jedna z dyscyplin w ramach CASP TS – ang. T ertiary S tructure Prediction (przewidywanie struktur białkowych); podstawowa dyscyplina w ramach CASP UniProt – ang. Uni versal Prot ein Resource ; baza sekwencji białkowych

1. WSTĘP

Zrozumienie funkcji białek na poziomie molekularnym wymaga poznania ich przestrzennej struktury. Struktura białka jest natomiast zdeterminowana przez jego sekwencję aminokwasową oraz jego otoczenie. Istnieje ponadto sprzężenie zwrotne – sekwencja białek jest modyfikowana w toku ewolucji, tak aby białko mogło lepiej pełnić określone funkcje. Zależności te zaprezentowano schematycznie na rysunku 1.

Rysunek 1. Ilustracja zależności: sekwencja – struktura – funkcja białka

Poznanie struktury przestrzennej białek ma kluczowe znaczenie dla badań nad nowymi metodami terapii różnych chorób. Dokładne modele mogą pomóc w powstaniu nowych leków, które poprzez oddziaływanie z białkami wywołują określony efekt terapeutyczny (Service 2008). Uważa się na przykład, że konsekwencją niewłaściwego uformowania struktury białkowej jest wiele poważnych schorzeń, takich jak choroby Alzheimera czy Creutzfeldta-Jakoba. Zrozumienie, jaki jest mechanizm zwijania białek, może doprowadzić do znalezienia przyczyny nieprawidłowego formowania ich struktury a także wskazać rozwiązania tego problemu.

Przedmiotem niniejszej pracy jest przede wszystkim opracowanie nowych metod przewidywania zależności pomiędzy sekwencją a strukturą białek. Wedle hipotezy Anfinsena sekwencja białka (przynajmniej dla małych białek globularnych) jednoznacznie determinuje jego strukturę 1 (Anfinsen 1973). Anfinsen stwierdził, że struktura natywna odpowiada zazwyczaj minimum energii swobodnej układu, w którym znajduje się białko. Jednakże ze względu na duży rozmiar cząsteczki białka znalezienie takiego minimum nie jest łatwe. Ponad 45 lat temu Levinthal sformułował słynny paradoks: wykazał, że nawet w przypadku małego białka proces poszukiwania przestrzeni konformacyjnej poprzez losowe sprawdzenie możliwych konformacji zająłby więcej czasu niż wiek wszechświata (Levinthal 1969). Dodatkowo zagadnienia odnajdywania minimum energii swobodnej nie ułatwia fakt, że różnice energii pomiędzy konformacją rozwiniętą a strukturą natywną są bardzo małe: odpowiadają zazwyczaj energii zaledwie kilku wiązań wodorowych (Fersht i Daggett 2002). Białko w stanie zdenaturowanym posiada bowiem więcej kontaktów z cząsteczkami rozpuszczalnika niż białko w stanie natywnym, co niemalże kompensuje dodatkowe oddziaływania wewnątrzcząsteczkowe formy zwiniętej. Metody przewidywania struktury trzeciorzędowej białek muszą zatem sprostać dwóm trudnym do jednoczesnego spełnienia wymaganiom: z jednej strony mierzyć się z olbrzymią przestrzenią konformacyjną, z drugiej zaś być czułe na niewielkie różnice energetyczne. Wydaje się, że kompromisowym rozwiązaniem tego problemu są metody gruboziarniste. Przykładem jest model CABS (Kolinski 2004), w którym ograniczenie liczby stopni swobody pozwala na wielokrotnie szybsze próbkowanie przestrzeni konformacyjnej. Natomiast dzięki zastosowaniu potencjałów statystycznych stworzonych na podstawie analizy regularności strukturalnych obserwowanych w poznanych zwojach białek możliwe jest stworzenie stosunkowo dokładnej miary pozwalającej na porównywanie energii otrzymywanych konformacji. Przewidywanie struktury białek nie byłoby w większości przypadków możliwe jedynie na podstawie ich sekwencji. Na szczęście okazuje się, że w toku ewolucji struktura przestrzenna białek o podobnej sekwencji jest stosunkowo silnie zachowywana.

(^1) Wyjątek stanowią np. białka pozbawione struktury trzeciorzędowej (ang. intrinsically disordered proteins ).

2. CZĘŚĆ TEORETYCZNA

2.1. Metody eksperymentalne wyznaczania struktury białek i ich

ograniczenia

Spośród ponad 110 tysięcy struktur zdeponowanych w bazie PDB^2 (ang. Protein Data Bank ) blisko 99% zostało wyznaczonych przy użyciu jednej z dwóch metod: spektroskopii rentgenowskiej lub spektroskopii NMR (magnetycznego rezonansu jądrowego, ang. Nuclear Magnetic Resonance ) (rysunek 2 ). Tabela 1 przedstawia krótkie porównanie wymienionych technik uwzględniające zakres ich zastosowań oraz ograniczenia.

Rysunek 2. Metody eksperymentalne zastosowane do wyznaczenia struktur białek dostępnych w bazie PDB (dane z 6 listopada 2015 roku)

(^2) Za: http://www.rcsb.org/, dostęp: 6 listopada 2015 r.

Krystalografia rentgenowska (89,1%) NMR w roztworze (9,8%) Mikroskopia elektronowa (0,8%) Inne (0,3%)

pracy i prób automatyzacji procedury (Stevens i Wilson 2001) wyznaczanie struktury białek metodami krystalograficznymi jest wciąż czasochłonne i kosztowne.

2.1.2. Spektroskopia magnetycznego rezonansu jądrowego

Prekursorami zastosowania metod NMR do rozwiązywania struktury białek byli Richard Ernst i Kurt Wüthrich (Kumar i inni 1981; Wuthrich i inni 1982). Spektroskopia NMR opiera się na magnetycznych właściwościach jąder o niezerowym spinie, które w polu magnetycznym absorbują rezonansowo promieniowanie elektromagnetyczne o częstościach radiowych (Bloch 1946; Bloembergen i inni 1947). Energia rezonansu zależna jest od otoczenia chemicznego jąder, dzięki czemu zarejestrowane widma pozwalają na uzyskanie parametrów dotyczących badanej cząsteczki, takich jak odległości pomiędzy atomami czy miary kątów dwuściennych. Są one następnie używane jako więzy do modelowania w celu otrzymania reprezentacji trójwymiarowej struktury cząsteczki (Markwick i inni 2008). Wraz ze wzrostem rozmiaru badanych cząsteczek interpretacja widm staje się jednak coraz trudniejsza (m.in. ze względu na nakładanie się sygnałów), dlatego wykorzystanie metod do większych białek (od ok. 150-200 aminokwasów) staje się problematyczne.

2.1.3. Ograniczenia metod eksperymentalnych

W pracy porównującej struktury otrzymane przy użyciu różnych technik eksperymentalnych (Sikic i inni 2010 ) pokazano, że struktury uzyskane metodami krystalograficznymi mogą różnić się znacząco od tych uzyskanych metodami spektroskopii NMR (średnie odchylenie kwadratowe (RMSD) po najlepszym nałożeniu obu struktur wynosi ok. 2,0 Å). To zróżnicowanie struktur można uzasadnić w dwojaki sposób: błędami metod oraz ruchliwością białek w stanie natywnym. Metody krystalograficzne uważa się powszechnie za bardziej dokładne niż metody NMR, jednak nie są wolne od wad. Na przykład większość struktur krystalograficznych wyznaczana jest w warunkach kriogenicznych. Pokazano, że zamrażanie może wprowadzać błędy związane z upakowaniem atomów i prowadzić do powstania struktur znacząco różniących się od tych występujących w warunkach fizjologicznych (Eyal i inni 2005).

Struktury białek wyznaczane za pomocą spektroskopii NMR są określane za pomocą zestawu mniej lub bardziej różniących się modeli (najczęściej 20). Z tego powodu metody NMR są często wybierane do analizy dynamiki stanów bliskich strukturze natywnej (Markwick i inni 2008). Naukowcy nie są zgodni co do poziomu precyzji i dokładności metod NMR (Spronk i inni 2003). Niewątpliwie zależą one nie tylko od jakości zgromadzonych danych, ale także od zastosowanych metod obliczeniowych służących stworzeniu i wyborowi modeli przestrzennych odpowiadających danym eksperymentalnym. Ponadto, jak wskazano wyżej, wadą metod NMR jest spadek dokładności wyników wraz ze wzrostem rozmiarów badanych białek. Metody eksperymentalne pozwoliły na wyznaczenie około 11 0 tysięcy struktur białkowych. Liczba ta stanowi około 2 promile sekwencji białkowych dostępnych obecnie w bazie UniProt (Wu i inni 2006). Ta olbrzymia (i wciąż powiększająca się) dysproporcja wskazuje na konieczność rozwijania innych metod służących rozwiązywaniu struktur białek.

2.2. Metody teoretyczne przewidywania struktury białek

Opisane wyżej ograniczenia i wysokie koszty metod eksperymentalnych stanowią dobrą motywację do rozwijania alternatywnych rozwiązań jakimi są metody teoretyczne przewidywania struktury. Metody te można podzielić na dwie główne grupy: metody wykorzystujące prawa fizyki i metody modelowania porównawczego.^3 Metody wykorzystujące prawa fizyki opierają się na hipotezie Anfinsena, że konformacja struktury natywnej białka odpowiada minimum energii swobodnej układu, w którym się ono znajduje. Niestety, ze względu na ogromną liczbę stopni swobody dużych cząsteczek, jakimi są białka, modelowanie procesu ich zwijania przy użyciu metod pełnoatomowych (np. dynamiki molekularnej) jest bardzo kosztowne obliczeniowo, a dla większości białek niemożliwe. Rozwiązaniem tego problemu jest zastosowanie pewnych uproszczeń modelowanych układów poprzez zastosowanie modeli gruboziarnistych.

(^3) Zaprezentowany tu podział ma charakter umowny. W praktyce wiele metod wykorzystuje

zarówno prawa fizyki, jak i pewne dane pochodzące z obserwacji właściwości znanych struktur. Np. wiele metod gruboziarnistych wykorzystuje przewidzianą strukturę drugorzędową białek (otrzymaną przy użyciu metod porównawczych).