Informacja w sekwencjach genetycznychCzas czytania: 5 min

Piotr Kublicki

2024-01-31
Informacja w sekwencjach genetycznych<span class="wtr-time-wrap after-title">Czas czytania: <span class="wtr-time-number">5</span> min </span>

W ostatnim dziesięcioleciu naukowcy dokonali zdumiewającego odkrycia w biologii molekularnej – otóż kluczowym pojęciem koniecznym do opisu funkcjonowania organizmów jest informacja. Jak to ujął noblista i były dyrektor Kalifornijskiego Instytutu Technicznego, David Baltimore: „współczesna biologia to nauka o informacji”1. Skandynawscy naukowcy kojarzeni z teorią inteligentnego projektu – Steinar Thorvaldsen z Uniwersytetu w Tromsø i Ola Hössjer z Uniwersytetu w Sztokholmie – w wydawanym przez wydawnictwo Uniwersytetu Oksfordzkiego naukowym czasopiśmie „The Journal of the Royal Statistical Society, Series C (Applied Statistics)” opublikowali niedawno artykuł poświęcony właśnie zagadnieniu szacowania informacji genetycznej w komórce2. Zdaniem autorów wyniki takiego szacowania świadczą, że formowanie się sekwencji przenoszących informację genetyczną najlepiej wyjaśniać w kontekście projektu.

Thorvaldsen i Hössjer twierdzą, że istotnym problemem w analizie informacji genetycznej jest brak ram matematycznych, które by taką analizę umożliwiały. W związku z tym proponują nowe metody statystyczne do modelowania i analizowania zawartości informacji w białkach, rodzinach białek i ich sekwencjach. Zasadniczo naukowcy przyjmują, że informacja jest ważną cechą struktur biologicznych (być może nawet to kluczowy aspekt życia), jednak wyrażenie i opisanie tej informacji w ścisłych matematycznych ramach wciąż – jak piszą Thorvaldsen i Hössjer – stanowi poważne wyzwanie. Spowodowane jest to tym, że w tego typu analizach używa się koncepcji informacji opracowanej przez Claude’a Shannona do opisania transmisji informacji w systemach telekomunikacyjnych. Zgodnie z tą definicją ilość informacji jest odwrotnie proporcjonalna do prawdopodobieństwa wystąpienia znaków czy symboli przesyłanych w kanale komunikacyjnym. Innymi słowy, mniejsze prawdopodobieństwo wystąpienia jakiegoś ciągu znaków oznacza większą ilość przenoszonej informacji (wyrażonej zwykle w bitach) i odwrotnie. Zaletą tej koncepcji jest to, że ilość informacji można łatwo zmierzyć, a jej wadą, że informacja ta nie ma związku ze znaczeniem czy przekazem danej wiadomości. Bezsensowna kombinacja symboli czy znaków może przenosić więcej informacji niż komunikat przenoszący jakąś konkretną wiadomość. To rozdzielenie wiadomości od jej znaczenia rodzi problemy przy zastosowaniu koncepcji Shannona do systemów biologicznych. Informacja w rozumieniu Shannona dotyczy jedynie składni (informacja syntaktyczna), podczas gdy biologiczne sekwencje – jak DNA – przenoszą także znaczenie, czyli o wiele trudniejszą do kwantyfikowania w kategoriach prawdopodobieństwa informację semantyczną.

W 2003 roku znany badacz zagadnienia abiogenezy Jack Szostak opublikował w czasopiśmie „Nature” krótki artykuł, w którym zwrócił uwagę na to, że w biologii molekularnej istotne jest znaczenie lub funkcjonalność przekazu3. Ponieważ klasyczna teoria informacji Shannona nie rozróżnia funkcjonalności i niefunkcjonalności, Szostak dostrzegł potrzebę opracowania nowej miary informacji, którą nazwał informacją funkcjonalną. Problem z informacją funkcjonalną jest z kolei taki, że znacznie trudniej ją zdefiniować i zmierzyć. Jednym ze sposobów pomiaru informacji funkcjonalnej jest przykładowo uwzględnienie wszystkich możliwych sekwencji, które mogłyby pełnić równoważną funkcję biochemiczną, taką jak zdolność białka do reagowania lub wiązania się z określoną cząsteczką.

Poszukiwanie sposobu kwantyfikacji biologicznej informacji przyświecało także skandynawskim badaczom. Thorvaldsen i Hössjer twierdzą, że informacja funkcjonalna nie jest cechą jakiejkolwiek pojedynczej cząsteczki, ale cechą zbioru wszystkich opcjonalnych sekwencji sklasyfikowanych według ich aktywności. W związku z tym badacze proponują szereg matematycznych metod pozwalających oszacować różne wymiary biologicznej informacji wraz z przykładowymi analizami przeprowadzonymi na sekwencjach uzyskanych z rozmaitych baz danych.

Należy też zwrócić uwagę na bezpośrednie odwołanie się autorów do teorii inteligentnego projektu. Nawiązanie to wyraża się na dwa sposoby: po pierwsze, mamy tu do czynienia z zastosowaniem metodologii i narzędzi rozwijanych przez teoretyków projektu – Thorvaldsen i Hössjer z aprobatą powołują się na publikacje naukowców będących zwolennikami teorii ID (Williama Dembskiego, Roberta Marksa, Daniela Díaza-Pachóna); po drugie, autorzy powołują się na prace Douglasa Axe’a, amerykańskiego biologa molekularnego i teoretyka projektu, który na przykładzie jednego z białek oszacował prawdopodobieństwo występowania funkcjonalnych sekwencji w zakresie wszystkich możliwych sekwencji4. Okazuje się, że funkcjonalne sekwencje są jedynie małymi wyspami w oceanie sekwencji niefunkcjonalnych. Axe na przykładzie białka β-laktamazy o długości 153 aminokwasów wykazał, że funkcjonalne sekwencje lokują się w przedziale od 10−53 do 10−77. Oznacza to, że nawet gdyby utworzyć magazyn białek (długości 100 aminokwasów) o masie całej Ziemi (5,98 × 1024 kg), to zawierałby on co najwyżej 3,3 × 1047 różnych sekwencji, co jest znacznie mniej niż przedział otrzymany przez Axe’a. Thorvaldsen i Hössjer konstatują, że jedyne sensowne wyjaśnienie sekwencji funkcjonalnych musi odwoływać się do projektu, ilościowej i jakościowej optymalizacji i ukierunkowanej selekcji.

Wbrew twierdzeniom darwinistów projekt w nauce ma się zatem całkiem nieźle. Skandynawscy badacze nie tylko mocno oparli się na stosowanych przez teoretyków projektu metodach pomiaru informacji w systemach biologicznych, ale i otwarcie stwierdzili, że uzyskane w ten sposób wyniki nieodzownie prowadzą do wniosku, że za istnieniem informacji biologicznej musi stać projekt.

Piotr Kublicki

 

Źródło zdjęcia: Pixabay

Ostatnia aktualizacja strony: 31.01.2023

Przypisy

  1. Cyt. za: R. Lahoz-Beltra, Cellular Computing: Towards an Artificial Cell, „Information Theories and Applications” 2012, Vol. 19, No. 4, s. 316 [313‒318].
  2. Por. S. Thorvaldsen, O. Hössjer, Estimating the Information Content of Genetic Sequence Data, „Journal of the Royal Statistical Society Series C: Applied Statistics” 2023, Vol. 72, No 5, s. 1310–1338, https://doi.org/10.1093/jrsssc/qlad062.
  3. Por. J. Szostak, Functional Information: Molecular Messages, „Nature” 2003, Vol. 423, No. 6941, s. 689, https://doi.org/10.1038/423689a.
  4. Por. D.D. Axe, Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds, „Journal of Molecular Biology” 2004, Vol. 341, No 5, s. 1295–1315, https://doi.org/10.1016/j.jmb.2004.06.058.

Literatura:

1. Axe D.D., Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds, „Journal of Molecular Biology” 2004, Vol. 341, No 5, s. 1295–1315, https://doi.org/10.1016/j.jmb.2004.06.058.

2. Lahoz-Beltra R., Cellular Computing: Towards an Artificial Cell, „Information Theories and Applications” 2012, Vol. 19, No. 4, s. 313‒318.

3. Szostak J., Functional Information: Molecular Messages, „Nature” 2003, Vol. 423, No. 6941, s. 689, https://doi.org/10.1038/423689a.

4. Thorvaldsen S., Hössjer O., Estimating the Information Content of Genetic Sequence Data, „Journal of the Royal Statistical Society Series C: Applied Statistics” 2023, Vol. 72, No 5, s. 1310–1338, https://doi.org/10.1093/jrsssc/qlad062.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *



Najnowsze wpisy

Najczęściej oglądane wpisy

Wybrane tagi