Sekvenca smisla života

    Tokom poslednjih par nedelja (iz razloga koji su suviše komplikovani za objašnjavanje), kopao sam po literaturi tražeći poznate “superočuvane” (ultraconserved) sekvence u genomima kičmenjaka.

    Radi se o DNK sekvencama koje su ostale *potpuno* nepromenje od vrste koja je poslednji zajednički predak svih kičmenjaka do svih njenih potomaka danas. Identifikacija i potvrda ovakvih sekvenci nije jednostavna, i zahteva velike bioinformatičke resurse (dane i nedelje rada velikih superkompjutera). Što je sekvenca duža, to je više rada potrebno. Ali kroz godine i mnogo sporog, mukotrpnog rada, nađene su stotine i stotine primera, i meni nije bio problem da nađem nekoliko koje mi odgovaraju. (Za slučaj de se pitate čemu sve to služi, ove koje sam izabrao će biti kontrolni aspekt za grupu genetskih testova koji će služiti da se detektuju neke genetske bolesti, kao i određene grupe mutacija kod ljudi koji boluju od raka.)

    No, zašto o ovome pričam? U toku kopanja po literaturi, naleteo sam na primer iz 2003-će godine, kada je najduža sekvenca ovakve vrste koja je mogla biti identifikovana tadašnjim resursima i na osnovu tada dostupnih informacija bila dugačka samo 42 bazna para (ove koje ja danas koristim su 200-300 bp duge). Pošto je dužine 42, naučnici koji su je pronašli su je, naravno, nazvali “Sekvenca Suštine Života” (“Meaning of Life Sequence,” u skladu sa Adamsovim Postulatom).

   Par godina kasnije, Pahter i Strumfels, poznatiji po svom udžbeniku statistike i statističke metodologije (dotični udžbenik je besplatno dostupan, dajem link na dnu), su odlučili da urade detaljniju analizu koja je vrlo zanimljiva.

   Naime, uporedili su deset genoma kičmenjaka: čovek, šimpanza, miš, pacov, pas, kokoška, Xenopus tropicalis (žaba), Danio rerio (riba iz reda Cypriniformes), fugu (riba iz reda Tetraodontiformes), i tetraodon (još jedna riba iz reda Tetraodontiformes). Onda su uradili kompleksnu probabilističku kalkulaciju verovatnoće da se ova sekvenca pojavi u svim genomima bez evolucione konzervacije. Dakle, sa kolikom sigurnošću možemo reći da je ova sekvenca od 42 nukleotida bila prisutna u pretku svih pomenutih vrsta?

   Radi reference, i po molekularnim kalkulacijama i po fosilnim podacima, ova predačka vrsta bi bila košljoriba (Osteichthyes) koja je živela pre oko 435 miliona godina, pre podele između Actinopteryges (zrakoperki) i Sarcopteriges (šakoperke, koje su preci svih kopnenih tetrapoda). Izračunata verovatnoća je reda veličine 1 prema 1050, za šta bih rekao da stoji u “prilično sigurno” kategoriji. 😉

Sekvenca je sledeća:

TTTAATTGAAAGAAGTTAATTGAATGAAAATGATCAACTAAG

Tako da kada vas sledeći put neko pita “šta je suština života,” sada im možete dati odgovor objavljen u naučnom žurnalu, sa sve matematičkim dokazom koji statistički pokazuje da je dotični odgovor veoma matematički čvrst. 😃

Studija se može besplatno pročitati ovde. A pomenuti udžbenik se može skinuti ovde.