CW 10 lat: Człowiek szyty na miarę

W 1953 r. James Watson i Francis Crick, gdy zaproponowali model struktury cząsteczki DNA, jako podwójnej spirali, w publikacji, która wkrótce miała im przynieść Nagrodę Nobla, postawili także hipotezę, iż "wydaje się (nam) prawdopodobne, że dokładna sekwencja nukleotydów (stanowiących podstawowe strukturalne elementy makrocząsteczki DNA) stanowi kod, w którym zapisana jest informacja genetyczna".

W 1953 r. James Watson i Francis Crick, gdy zaproponowali model struktury cząsteczki DNA, jako podwójnej spirali, w publikacji, która wkrótce miała im przynieść Nagrodę Nobla, postawili także hipotezę, iż "wydaje się (nam) prawdopodobne, że dokładna sekwencja nukleotydów (stanowiących podstawowe strukturalne elementy makrocząsteczki DNA) stanowi kod, w którym zapisana jest informacja genetyczna".

Od tego momentu podstawowy problem współczesnej biologii stał się problemem informatycznym. W największym skrócie przedstawia się on następująco: gigantyczne cząsteczki DNA, upakowane gęsto w chromosomach w jądrach komórek naszego organizmu, mają postać łańcuchów (pomijam fakt, że są to łańcuchy podwójne), których ogniwami są cztery niewielkie cząsteczki będące zasadami azotowymi i oznaczone symbolami A, C, T i G. Białka z kolei, które w żywych organizmach wykonują większość codziennej "życiowej pracy" i służą jako biologiczne katalizatory biochemicznych reakcji (enzymy) lub "budulec" żywych tkanek, są utworzone przez kombinację 20 różnych elementów - aminokwasów. Proces "ekspresji" informacji genetycznej polega więc na "przetłumaczeniu" komunikatu zapisanego w języku posługującym się czterema literami na język zawierający dwadzieścia liter. Interesującą ciekawostką historyczną jest to, że ten "podstawowy problem biologii" sformułował w tej formie jako jeden z pierwszych nie biolog, lecz znany fizyk, kosmolog i popularyzator nauki George Gamow. W jaki dokładnie sposób język czterech zasad tłumaczony jest na język dwudziestu aminokwasów, to zagadka domagająca się rozwiązania.

Przepis na człowieka

Model zaproponowany przez G. Gamowa okazał się błędny, ale już kilka lat (i kilka nagród Nobla) później wiadomo było, że czteroliterowy język DNA jest utworzony z trzyliterowych "słów" (AAT, AGA, ATT itp.) i każdemu aminokwasowi języka białkowego odpowiada jedno słowo lub ich więcej. Te wstępne, lingwistyczne ustalenia wymagały głównie laboratoryjnej sprawności analitycznej. Kiedy jednak generalna struktura języka życia została poznana, przed nauką stanęło kolejne wyzwanie - odcyfrowanie pełnego genetycznego przepisu na człowieka. Tym razem główną trudnością była konieczność manipulowania ogromną ilością informacji i problemy chemiczne ustąpiły miejsca problemom informatycznym.

Praca nad odczytaniem pełnej treści ludzkiego genomu, która pod koniec przybrała postać dramatycznego wyścigu pomiędzy kilkoma konkurującymi ze sobą zespołami badaczy, wstępnie została zakończona, jak wiadomo, ubiegłego lata. Nie tyle było to jednak zakończenie, ile początek. Początek nowej dziedziny badawczej i zarazem gałęzi przemysłu powstałej w miejscu, gdzie najbardziej zaawansowana technologia informacyj-na spotkała się z biologią, medycyną i farmakologią. Dziedzina ta, nazwana bioinformatyką, ma zarówno czysto poznawcze aspiracje, jak i potencjalnie przełomowe możliwości zastosowań.

Ilość informacji zakodowanej w ludzkim genomie stanowi pewien wskaźnik gigantycznej skali zadania, jakim było jej odcyfrowanie. Bez komputerów największej mocy nie byłoby możliwe manipulowanie zapisem, zawierającym 3 mld liter, których spisanie wymagałoby 100 tys. stron druku! Ilość niezbędnej do przetworzenia informacji była jednak znacznie większa. Metodę zastosowaną przez zespół firmy Celera, kierowanej przez Craiga Ventera, można by opisać w ten sposób: cały genom był "cięty" na przypadkowe, choć niewielkiej długości, kawałki, zaś sekwencja nukleotydów w każdym z nich była odczytywana przez specjalne, zautomatyzowane analizatory. Całość była następnie "sklejana" z kawałków za pomocą wielu komputerów, analizując poszczególne fragmenty genomu sprawdzano, gdzie zbiór ich cech zachodzi na siebie. Komputery musiały więc przeanalizować informację równoważną kilku kompletnym genomom. Było to "stresujące" zadanie nawet dla najbardziej zaawansowanych, dostępnych dziś komputerów. A ponieważ to, co uczeni planują, bynajmniej nie zapowiada się prościej, potrzeby bioinformatyki będą dyktować postęp techniki obliczeniowej.

Po genomie - białko

Królujący dziś w swej domenie "najszybszy komputer świata," zwany ASCI White (Accelerated Strategic Computing Initiative), znajduje się w Lawrence Livermore Laboratory pod San Francisco i używa swej niebywałej mocy obliczeniowej, wynoszącej 3,8 miliardów operacji na sekundę (równowartość 50 tys. typowych komputerów osobistych), do symulowania eksplozji nuklearnych na potrzeby rządu amerykańskiego. Dni panowania ASCI White są jednak policzone, jego bowiem twórca - IBM - pracuje już nad konstrukcją maszyny 500 razy szybszej, której koszt szacuje się na 100 mln USD. Blue Gene, tak nazwano nowy komputer, jest projektowany wyłącznie pod kątem biologicznych zastosowań. Będą to zadania wymagające więcej "krzemowego rozumu" niż odcyfrowanie ludzkiego genomu. Jakie to będą zadania?

By zrozumieć, że przed biologami stoją problemy bardziej złożone niż odczytywanie informacji genetycznej, wystarczy przyjrzeć się białkom. To one są tymi substancjami biochemicznymi, które "załatwiają" w naszym organizmie konkretne sprawy, a DNA jest tylko przechowywanym w chromosomach przepisem na ich produkcję. Można by pomyśleć, iż jeśli znamy sekwencję DNA, to wszystko wiemy o cząsteczce białka, które ona koduje.

W praktyce nie jest to takie proste. Pod względem kształtu cząsteczki DNA są w porównaniu z białkami wręcz prymitywnie proste. Są po prostu skręconymi podwójnymi sznurkami. Białka natomiast mogą przybierać przeróżne, najdziwniejsze kształty i to właśnie kształt ich cząsteczek decyduje o ich funkcji.

Te strukturalne różnice wynikają stąd, że budulec białek - aminokwasy - są cząsteczkami znacznie bardziej różnorodnymi niż zasady azotowe.

Kiedy w komórce powstaje nowa makrocząsteczka białka, najpierw poszczególne aminokwasy łączą się ze sobą w nitkę będącą odpowiednikiem nici DNA - ich sekwencja tworzy tzw. strukturę pierwszorzędową cząsteczki białka. Ponieważ jednak aminokwasy mają bardzo zróżnicowane kształty, natychmiast po syntezie owa nitka polipeptydowa zaczyna się skręcać, zwykle tworząc najpierw pojedynczą spiralę (struktura drugorzędowa). Na tym jednak jej metamorfoza się nie kończy, spirala ta bowiem sama zaczyna się skręcać i pomiędzy różnymi stykającymi się ze sobą aminokwasami zaczynają się wytwarzać nowe wiązania chemiczne stabilizujące ostateczny kształt cząsteczki, czyli jej strukturę trzeciorzędową.

Białko, które może się składać z setek albo tysięcy pojedynczych aminokwasów, w końcu przybiera postać np. z grubsza globularną.

Jeśli jest ono enzymem, co jest jego częstym przeznaczeniem, to gdzieś na powierzchni tej nieregularnej aminokwasowej kuli znajdują się aktywne centra katalizujące specyficzne reakcje chemiczne, czyli działające jak miniaturowe laboratorium chemiczne o niezwykłej precyzji i wydajności. Jeśli z kolei powstałe białko jest przeciwciałem broniącym organizm przed atakiem mikrobów, czynne centra na jego powierzchni działają jak klucz pasujący do zamka, który po rozpoznaniu wroga łączy się z nim w "śmiertelnym uścisku" i neutralizuje jego działanie. Jakakolwiek byłaby funkcja tych białek, tajemnica ich działania tkwi w szczegółach ich struktury trzeciorzędowej.

Znając sekwencję zasad azotowych w genie, czyli w cząsteczce DNA, kodującej dane białko, możemy łatwo przetłumaczyć ją na jego strukturę pierwszorzędową. Potem jednak sprawy się komplikują. Choć proces zwijania się białka jest zdeterminowany i "w zasadzie" składając razem poszczególne aminokwasy powinniśmy przewidzieć, jaki ostatecznie kształt przybierze cząsteczka, w rzeczywistości jest to niezmiernie skomplikowany probleobliczeniowy. Jak przewiduje główny architekt Blue Gene's Monty Denneau - jego maszyna, która będzie dokonywać kwadryliona operacji na sekundę (kwadrylion to 1 z piętnastoma zerami!), będzie musiała działać przez rok 24 godziny dziennie tylko po to, by rozwiązać problem struktury trzeciorzędowej jednej typowej cząsteczki białka...

Człowiek szyty na miarę

Czy warto tak się męczyć? Oj warto, warto. Po podglądaniu przyrody, następnym krokiem będzie bowiem jej imitacja. Rozważmy np. epidemię AIDS. Rozwinięcie pełnego potencjału bioinformatyki umożliwi, jak się przypuszcza, znalezienie skutecznej obrony przed wirusem HIV. Najpierw dokładnie przeanalizujemy strukturę tego wirusa, a następnie, pracując "w odwrotnej kolejności", będziemy mogli zaprojektować białko, które będzie zdolne do jego unieszkodliwienia przez związanie się z funkcjonalnymi obszarami na jego powierzchni czy katalizowanie jego chemicznej destrukcji. A to tylko jedno z niezliczonej liczby możliwych zastosowań bioinformatyki. W epoce jej pełnego rozkwitu wszyscy będziemy traktowani indywidualnie przez naszych lekarzy, którzy będą projektować i produkować lekarstwa "szyte na miarę" dla nas i nikogo innego. Lekarstwa, które będą w 100% skuteczne i nie będą miały żadnych skutków ubocznych.

Mam tylko jedną obawę. Kiedy już technologia bioinformatyczna osiągnie pełną dojrzałość, będziemy mogli za pomocą komputerów zaprojektować i wykonać całkowicie nowy i nieskazitelnie doskonały model ludzkiego osobnika, zamiast zawracać sobie głowę reperowaniem tego, co nie zostało właściwie przemyślane i skonstruowane od początku.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200