Analiza sekwencji
Analiza sekwencji w biologii molekularnej polega na identyfikacji sekwencji nukleotydów w kwasie nukleinowym lub aminokwasów w peptydzie lub białku. Po uzyskaniu próbki, sekwencje DNA mogą być produkowane automatycznie przez maszynę, a wynik wyświetlany na komputerze. Interpretacja tych wyników jest nadal zadaniem dla człowieka.Nie
Informacje pochodzące z analizy sekwencji są wykorzystywane w wielu dziedzinach biologii. Daje ona informacje o pokrewieństwie między poszczególnymi organizmami lub między grupami organizmów. Pokazuje jak blisko są one spokrewnione.
sekwencja par zasad DNA
Sekwencja DNA to sekwencja nukleotydów w cząsteczce DNA. Jest ona zapisywana jako ciąg liter reprezentujących pierwotną strukturę cząsteczki lub nici DNA. Jeśli jest funkcjonalna, sekwencja taka niesie informację o sekwencji aminokwasów w cząsteczce białka. Możliwe litery to A, C, G i T, reprezentujące cztery zasady nukleotydowe nici DNA - adenina, cytozyna, guanina, tymina. Sekwencje są drukowane obok siebie, bez odstępów, jak w sekwencji AAAGTCTGAC.
Badanie RNA i białek jest bardziej złożone. Ogólna struktura DNA jest prosta i przewidywalna (podwójna helisa). Badanie RNA i białek musi obejmować badanie ich trójwymiarowej struktury, która jest zróżnicowana i wpływa na sposób ich działania. Do pewnego stopnia może to być wspomagane komputerowo, ale musi być każdorazowo weryfikowane.
Informacje o sekwencjach przechowywane są w bazach danych. Od czasu rozwoju szybkiej produkcji sekwencji genów i białek w latach 90-tych, tempo dodawania nowych sekwencji do baz danych stale wzrasta.
Wynik
Pełna analiza genomu została przeprowadzona na ponad 800 gatunkach i szczepach. Pracę wykonuje maszyna - sekwenator DNA, która analizuje sygnały świetlne z fluorochromów przyłączonych do nukleotydów. Tego typu prace stają się stopniowo coraz tańsze.
"Obecnie [2009] istnieje ponad 90 gatunków kręgowców, których sekwencje całych genomów są ukończone, w trakcie realizacji lub na zaawansowanym etapie planowania.
Sumy przybliżone
Według stanu na grudzień 2012, analiza całego genomu została zakończona na około 800 do 900 żyjących gatunkach i szczepach gatunków. Liczby są przybliżone i ulegają zmianie.
- Zwierzęta: 111 gatunków
- Rośliny: 53 gatunki
- Grzyby: 81 gatunków
- Protisty: 50 gatunków
- Archaea: 139 gatunków i szczepów
- Bakterie: ~4/500 gatunków i szczepów
Sekwencja DNA człowieka
Ludzki genom zapisany jest na 23 parach chromosomów w jądrze komórkowym oraz w małym mitochondrialnym DNA. Wiele wiadomo już o sekwencjach DNA, które znajdują się na naszych chromosomach. Częściowo wiadomo też, co tak naprawdę robi DNA. Zastosowanie tej wiedzy w praktyce dopiero się zaczyna.
W ramach projektu Human Genome Project (HGP) stworzono sekwencję referencyjną, która jest wykorzystywana na całym świecie w biologii i medycynie. Nature opublikowało raport z projektu finansowanego ze środków publicznych, a Science opublikowało pracę firmy Celera. Prace te opisywały, w jaki sposób powstał projekt sekwencji i przedstawiały jej analizę. W latach 2003 i 2005 ogłoszono poprawione wersje robocze, wypełniające do ≈92% sekwencji.
Najnowszy projekt ENCODE bada sposób, w jaki geny są kontrolowane.
Praca kryminalistyczna
Posiadanie sekwencji całego genomu nie jest konieczne w przypadku prac kryminalistycznych, takich jak identyfikacja przestępcy na podstawie śladów DNA pozostawionych na miejscu zbrodni, czy w przypadku spraw o ustalenie ojcostwa. Obecnie sekwencjonowanie całych genomów jest nadal bardzo drogie, ale na szczęście dostępne są prostsze i tańsze metody.
Podstawową ideą jest spojrzenie na pewne loci (miejsca) w genomie, które są wysoce zmienne między ludźmi. Około 10 do 15 z tych loci jest potrzebnych do dopasowania, a szczegóły prawne różnią się w zależności od kraju. Zgodność próbki z podejrzaną osobą daje ogromne prawdopodobieństwo, że osoba ta była źródłem próbki. Dowód ten stanowiłby podstawę oskarżenia w sprawie o przestępstwo. Podobna analiza wykazałaby, że mężczyzna z dużym prawdopodobieństwem jest ojcem dziecka. Jest to tak naprawdę nowoczesny sposób robienia tego, co robiono z grupami krwi, zanim można było analizować szczegóły DNA. Metody te zostały opracowane głównie dzięki pracy Aleca Jeffreysa.
DNA każdej osoby zawiera dwa allele danego genu lub 'markera': jeden od ojca i jeden od matki. Markery" to geny wybrane ze względu na liczbę różnych alleli występujących często w danej populacji. Poniższa tabela pochodzi z komercyjnego eksperymentu badania DNA na ojcostwo. Pokazuje ona, w jaki sposób pokrewieństwo między rodzicami a dzieckiem jest wykazywane za pomocą pięciu markerów:
Marker DNA | Matka | Dziecko | Domniemany ojciec |
D21S11 | 28, 30 | 28, 31 | 29, 31 |
D7S820 | 9, 10 | 10, 11 | 11, 12 |
TH01 | 14, 15 | 14, 16 | 15, 16 |
D13S317 | 7, 8 | 7, 9 | 8, 9 |
D19S433 | 14, 16.2 | 14, 15 | 15, 17 |
Wyniki pokazują, że DNA dziecka i domniemanego ojca pasują do siebie dla tych pięciu markerów. Kompletne wyniki testu wykazały taką korelację na 16 markerach między dzieckiem a badanym mężczyzną. Jeśli sprawa jest badana w sądzie, naukowiec z zakresu medycyny sądowej złożyłby zeznania na temat prawdopodobieństwa uzyskania takiego wyniku przez przypadek.
Badania DNA w USA
We wszystkich 50 stanach Stanów Zjednoczonych istnieją przepisy stanowe dotyczące profilowania DNA. Szczegółowe informacje na temat przepisów dotyczących baz danych w poszczególnych stanach można znaleźć na stronie internetowej Krajowej Konferencji Ustawodawstwa Stanowego (National Conference of State Legislatures).
Chemik Urzędu Celnego i Ochrony Granic USA odczytuje profil DNA, aby dowiedzieć się, skąd pochodzi towar.
Starożytne DNA
Starożytne DNA zostało odzyskane z niektórych źródeł. Rekord przetrwania DNA nadającego się do analizy sekwencji wynosi 700 000 lat. Szkielet konia zakopany w wiecznej zmarzlinie dostarczył kości z zachowanym DNA. Sekwencja była kompletna tylko w 70%, ale wystarczyła, by naukowcy mogli stwierdzić: "Nie wyglądałby jak koń, jakiego znamy... ale spodziewalibyśmy się, że byłby to koń jednokopytny". Dla porównania, badacze mieli dostęp do sekwencji DNA współczesnych koni, osłów i konia Przewalskiego.
Powiązane strony
- George Church
- Walter Gilbert
- John Sulston
- Fred Sanger
- ENCODE: pełna analiza ludzkiego genomu
- Genom ludzki
- Complete Genomics
- Bioinformatyka