




























































































Studiuj dzięki licznym zasobom udostępnionym na Docsity
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Przygotuj się do egzaminów
Studiuj dzięki licznym zasobom udostępnionym na Docsity
Otrzymaj punkty, aby pobrać
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Społeczność
Odkryj najlepsze uniwersytety w twoim kraju, według użytkowników Docsity
Bezpłatne poradniki
Pobierz bezpłatnie nasze przewodniki na temat technik studiowania, metod panowania nad stresem, wskazówki do przygotowania do prac magisterskich opracowane przez wykładowców Docsity
struktura natywna odpowiada zazwyczaj minimum energii swobodnej układu, w którym znajduje się białko. Jednakże ze względu na duży rozmiar cząsteczki białka ...
Typologia: Notatki
1 / 109
Ta strona nie jest widoczna w podglądzie
Nie przegap ważnych części!
Praca doktorska wykonana w Pracowni Teorii Biopolimerów Wydziału Chemii Uniwersytetu Warszawskiego
Promotor pracy: prof. dr hab. Andrzej Koliński Promotor pomocniczy: dr hab. Sebastian Kmiecik
Pracę dedykuję mojej Żonie oraz dzieciom: Emilii, Róży, Janowi, Jerzemu i Jonatanowi. Jesteście najlepszą motywacją do działania i rozwoju.
Miara zdefiniowana jest jako: GDT_HA = ( P 0,5 +P 1 +P 2 +P 4)/ gdzie: Pn oznacza procent atomów (w przypadku tej pracy jedynie Cα) w ocenianej strukturze odległych o nie więcej niż n Å od odpowiadających im atomów w strukturze referencyjnej (po optymalnym nałożeniu struktur) LTB – ang. L aboratory of T heory of B iopolymers ; Pracownia Teorii Biopolimerów, a także nazwa grupy Autora, która wzięła udział w eksperymencie CASP MC – metoda M onte C arlo MD ‒ ang. M olecular D ynamics (dynamika molekularna) MSA – ang. M ultiple S equence A lignment (metody przyrównania wielu sekwencji) MQAP ‒ ang. M odel Q uality A ssessment P rogram (program do oceny jakości struktur białkowych) NMR ‒ ang. N uclear M agnetic R esonance (spektroskopia magnetycznego rezonansu jądrowego) PDB ‒ ang. P rotein D ata B ank ; baza danych zawierająca struktury białkowe; także format pliku stosowany do zapisu danych (w tym współrzędnych atomów) dotyczących struktur białkowych PSI-BLAST – ang. P osition- S pecific I terative B asic L ocal A lignment S earch T ool; program oparty na algorytmie BLAST wykorzystujący profile sekwencyjne REMC ‒ ang. R eplica E xchange M onte C arlo (metoda wymiany replik Monte Carlo) RMSD ‒ ang. R oot M ean S quare D eviation (średnie odchylenie kwadratowe); miara używana do oceny podobieństwa struktur białkowych. RMSD obliczany jest w następujący sposób:
𝑛
𝑖= gdzie: 𝑁 jest liczbą odpowiadających sobie atomów (w przypadku tej pracy jedynie Cα), a 𝑑𝑖 odległością między nimi (po optymalnym nałożeniu struktur) ROC – ang. R eceiver O perating C haracteristic ; krzywa pozwalająca na ocenę działania klasyfikatorów SAXS – ang. S mall A ngle X - Ray S cattering (małokątowe rozpraszanie promieniowania rentgenowskiego)
SCOP – ang. S tructural C lassification o f P roteins ; baza danych klasyfikacji znanych struktur białkowych SCWRL – program do odbudowy grup bocznych na podstawie modelu zawierającego łańcuch główny TBM – ang. T emplate B ased M odeling (modelowanie z użyciem szablonów) TR – ang. T arget R efinement; optymalizacja struktur, jedna z dyscyplin w ramach CASP TS – ang. T ertiary S tructure Prediction (przewidywanie struktur białkowych); podstawowa dyscyplina w ramach CASP UniProt – ang. Uni versal Prot ein Resource ; baza sekwencji białkowych
1. WSTĘP
Zrozumienie funkcji białek na poziomie molekularnym wymaga poznania ich przestrzennej struktury. Struktura białka jest natomiast zdeterminowana przez jego sekwencję aminokwasową oraz jego otoczenie. Istnieje ponadto sprzężenie zwrotne – sekwencja białek jest modyfikowana w toku ewolucji, tak aby białko mogło lepiej pełnić określone funkcje. Zależności te zaprezentowano schematycznie na rysunku 1.
Rysunek 1. Ilustracja zależności: sekwencja – struktura – funkcja białka
Poznanie struktury przestrzennej białek ma kluczowe znaczenie dla badań nad nowymi metodami terapii różnych chorób. Dokładne modele mogą pomóc w powstaniu nowych leków, które poprzez oddziaływanie z białkami wywołują określony efekt terapeutyczny (Service 2008). Uważa się na przykład, że konsekwencją niewłaściwego uformowania struktury białkowej jest wiele poważnych schorzeń, takich jak choroby Alzheimera czy Creutzfeldta-Jakoba. Zrozumienie, jaki jest mechanizm zwijania białek, może doprowadzić do znalezienia przyczyny nieprawidłowego formowania ich struktury a także wskazać rozwiązania tego problemu.
Przedmiotem niniejszej pracy jest przede wszystkim opracowanie nowych metod przewidywania zależności pomiędzy sekwencją a strukturą białek. Wedle hipotezy Anfinsena sekwencja białka (przynajmniej dla małych białek globularnych) jednoznacznie determinuje jego strukturę 1 (Anfinsen 1973). Anfinsen stwierdził, że struktura natywna odpowiada zazwyczaj minimum energii swobodnej układu, w którym znajduje się białko. Jednakże ze względu na duży rozmiar cząsteczki białka znalezienie takiego minimum nie jest łatwe. Ponad 45 lat temu Levinthal sformułował słynny paradoks: wykazał, że nawet w przypadku małego białka proces poszukiwania przestrzeni konformacyjnej poprzez losowe sprawdzenie możliwych konformacji zająłby więcej czasu niż wiek wszechświata (Levinthal 1969). Dodatkowo zagadnienia odnajdywania minimum energii swobodnej nie ułatwia fakt, że różnice energii pomiędzy konformacją rozwiniętą a strukturą natywną są bardzo małe: odpowiadają zazwyczaj energii zaledwie kilku wiązań wodorowych (Fersht i Daggett 2002). Białko w stanie zdenaturowanym posiada bowiem więcej kontaktów z cząsteczkami rozpuszczalnika niż białko w stanie natywnym, co niemalże kompensuje dodatkowe oddziaływania wewnątrzcząsteczkowe formy zwiniętej. Metody przewidywania struktury trzeciorzędowej białek muszą zatem sprostać dwóm trudnym do jednoczesnego spełnienia wymaganiom: z jednej strony mierzyć się z olbrzymią przestrzenią konformacyjną, z drugiej zaś być czułe na niewielkie różnice energetyczne. Wydaje się, że kompromisowym rozwiązaniem tego problemu są metody gruboziarniste. Przykładem jest model CABS (Kolinski 2004), w którym ograniczenie liczby stopni swobody pozwala na wielokrotnie szybsze próbkowanie przestrzeni konformacyjnej. Natomiast dzięki zastosowaniu potencjałów statystycznych stworzonych na podstawie analizy regularności strukturalnych obserwowanych w poznanych zwojach białek możliwe jest stworzenie stosunkowo dokładnej miary pozwalającej na porównywanie energii otrzymywanych konformacji. Przewidywanie struktury białek nie byłoby w większości przypadków możliwe jedynie na podstawie ich sekwencji. Na szczęście okazuje się, że w toku ewolucji struktura przestrzenna białek o podobnej sekwencji jest stosunkowo silnie zachowywana.
(^1) Wyjątek stanowią np. białka pozbawione struktury trzeciorzędowej (ang. intrinsically disordered proteins ).
2. CZĘŚĆ TEORETYCZNA
Spośród ponad 110 tysięcy struktur zdeponowanych w bazie PDB^2 (ang. Protein Data Bank ) blisko 99% zostało wyznaczonych przy użyciu jednej z dwóch metod: spektroskopii rentgenowskiej lub spektroskopii NMR (magnetycznego rezonansu jądrowego, ang. Nuclear Magnetic Resonance ) (rysunek 2 ). Tabela 1 przedstawia krótkie porównanie wymienionych technik uwzględniające zakres ich zastosowań oraz ograniczenia.
Rysunek 2. Metody eksperymentalne zastosowane do wyznaczenia struktur białek dostępnych w bazie PDB (dane z 6 listopada 2015 roku)
(^2) Za: http://www.rcsb.org/, dostęp: 6 listopada 2015 r.
Krystalografia rentgenowska (89,1%) NMR w roztworze (9,8%) Mikroskopia elektronowa (0,8%) Inne (0,3%)
pracy i prób automatyzacji procedury (Stevens i Wilson 2001) wyznaczanie struktury białek metodami krystalograficznymi jest wciąż czasochłonne i kosztowne.
2.1.2. Spektroskopia magnetycznego rezonansu jądrowego
Prekursorami zastosowania metod NMR do rozwiązywania struktury białek byli Richard Ernst i Kurt Wüthrich (Kumar i inni 1981; Wuthrich i inni 1982). Spektroskopia NMR opiera się na magnetycznych właściwościach jąder o niezerowym spinie, które w polu magnetycznym absorbują rezonansowo promieniowanie elektromagnetyczne o częstościach radiowych (Bloch 1946; Bloembergen i inni 1947). Energia rezonansu zależna jest od otoczenia chemicznego jąder, dzięki czemu zarejestrowane widma pozwalają na uzyskanie parametrów dotyczących badanej cząsteczki, takich jak odległości pomiędzy atomami czy miary kątów dwuściennych. Są one następnie używane jako więzy do modelowania w celu otrzymania reprezentacji trójwymiarowej struktury cząsteczki (Markwick i inni 2008). Wraz ze wzrostem rozmiaru badanych cząsteczek interpretacja widm staje się jednak coraz trudniejsza (m.in. ze względu na nakładanie się sygnałów), dlatego wykorzystanie metod do większych białek (od ok. 150-200 aminokwasów) staje się problematyczne.
2.1.3. Ograniczenia metod eksperymentalnych
W pracy porównującej struktury otrzymane przy użyciu różnych technik eksperymentalnych (Sikic i inni 2010 ) pokazano, że struktury uzyskane metodami krystalograficznymi mogą różnić się znacząco od tych uzyskanych metodami spektroskopii NMR (średnie odchylenie kwadratowe (RMSD) po najlepszym nałożeniu obu struktur wynosi ok. 2,0 Å). To zróżnicowanie struktur można uzasadnić w dwojaki sposób: błędami metod oraz ruchliwością białek w stanie natywnym. Metody krystalograficzne uważa się powszechnie za bardziej dokładne niż metody NMR, jednak nie są wolne od wad. Na przykład większość struktur krystalograficznych wyznaczana jest w warunkach kriogenicznych. Pokazano, że zamrażanie może wprowadzać błędy związane z upakowaniem atomów i prowadzić do powstania struktur znacząco różniących się od tych występujących w warunkach fizjologicznych (Eyal i inni 2005).
Struktury białek wyznaczane za pomocą spektroskopii NMR są określane za pomocą zestawu mniej lub bardziej różniących się modeli (najczęściej 20). Z tego powodu metody NMR są często wybierane do analizy dynamiki stanów bliskich strukturze natywnej (Markwick i inni 2008). Naukowcy nie są zgodni co do poziomu precyzji i dokładności metod NMR (Spronk i inni 2003). Niewątpliwie zależą one nie tylko od jakości zgromadzonych danych, ale także od zastosowanych metod obliczeniowych służących stworzeniu i wyborowi modeli przestrzennych odpowiadających danym eksperymentalnym. Ponadto, jak wskazano wyżej, wadą metod NMR jest spadek dokładności wyników wraz ze wzrostem rozmiarów badanych białek. Metody eksperymentalne pozwoliły na wyznaczenie około 11 0 tysięcy struktur białkowych. Liczba ta stanowi około 2 promile sekwencji białkowych dostępnych obecnie w bazie UniProt (Wu i inni 2006). Ta olbrzymia (i wciąż powiększająca się) dysproporcja wskazuje na konieczność rozwijania innych metod służących rozwiązywaniu struktur białek.
Opisane wyżej ograniczenia i wysokie koszty metod eksperymentalnych stanowią dobrą motywację do rozwijania alternatywnych rozwiązań jakimi są metody teoretyczne przewidywania struktury. Metody te można podzielić na dwie główne grupy: metody wykorzystujące prawa fizyki i metody modelowania porównawczego.^3 Metody wykorzystujące prawa fizyki opierają się na hipotezie Anfinsena, że konformacja struktury natywnej białka odpowiada minimum energii swobodnej układu, w którym się ono znajduje. Niestety, ze względu na ogromną liczbę stopni swobody dużych cząsteczek, jakimi są białka, modelowanie procesu ich zwijania przy użyciu metod pełnoatomowych (np. dynamiki molekularnej) jest bardzo kosztowne obliczeniowo, a dla większości białek niemożliwe. Rozwiązaniem tego problemu jest zastosowanie pewnych uproszczeń modelowanych układów poprzez zastosowanie modeli gruboziarnistych.
(^3) Zaprezentowany tu podział ma charakter umowny. W praktyce wiele metod wykorzystuje
zarówno prawa fizyki, jak i pewne dane pochodzące z obserwacji właściwości znanych struktur. Np. wiele metod gruboziarnistych wykorzystuje przewidzianą strukturę drugorzędową białek (otrzymaną przy użyciu metod porównawczych).