Back

ⓘ Poravnavanje višestrukih sekvenci




Poravnavanje višestrukih sekvenci
                                     

ⓘ Poravnavanje višestrukih sekvenci

Poravnavanje višestrukih sekvenci je poravnavanje sekvenci tri ili više bioloških sekvenci, generalno proteina, DNK, ili RNK. U mnogim slučajevima se podrazumeva da postoji evolucioni odnos izmedu sekvenci koje se poravnavaju. Poravnavanja više sekvenci su polazna tačka za izučavanje homologije i dalju filogenetičku analizu. Vizuelni prikaz poravnavanja je ilustracija mutacija, poput promena jedne aminokiseline ili nukleotida, koje sa prikazane kao različita slova u datoj koloni poravnavanja. Vidne su i mutacije umetanja ili brisanja koje su prikazane kao crtice u jednoj ili više sekvenci. Poravnavanje višestrukih sekvenci se često koristi za procenjivanje konzervacije proteinskih domena, tercijarne i sekundarne strukture, i individualnih aminokiselina ili nukleotida.

Poravnavanje višestrukih sekvenci se isto tako odnosi na sam proces poravnavanja. Pošto je manuelno poravnavanje tri ili više sekvenci se biološki relevantnim dužinama nepraktično, računarski algoritmi se uvek koriste za formiranje i analizu poravnavanja. Poravnavanje višestrukih sekvenci zahteva sofisticiranije metodologije od poravnavanja para sekvenci, jer je ono računski kompleksnije. Većina programa za poravnavanje višestrukih sekvenci koristi heurističke metode umesto globalne optimizacije, jer je identifikacija optimalnog poravnavanja izmedu više od nekolicine sekvenci umerene dužine izuzetno računski skupa.

                                     

1. Dinamičko programiranje i računarska kompleksnost

Direktni metod za formiranje poravnavanja višestrukih sekvenci koristi tehnike dinamičkog programiranja za identifikaciju globalno optimalnih poravnavanja. Za proteine, ovaj metod obično koristi dve grupe parametara: penale praznina i supstitucione matrice za dodeljivanje vrednosti ili verovatniće poravnavanja svakog mogućeg para aminokiselina. Ovi parametri su bazirani na sličnosti hemijskih osobina aminokiselina i evolucionoj verovatnoći mutacije. Za nukleotidne sekvence se koriste slični penali praznina, ali su supstitucione matrice znatno jednostavnije, tipično se jedino identična preklapanja uzimaju u obzir. Parametri u supstitucionoj matrici mogu da budu bilo svi pozitivni, ili mešavina pozitivnih i negativnih u slučaju globalnog poravnavanja. U slučaju lokalnog poravnavanja oni moraju da budu pozitivni i negativni.

Za n individualnih sekvenci, za primenu naivnog metoda je neophodno konstruisati n -dimenzioni ekvivalent matrice koja se formira u standardnom poravnavanju para sekvenci. Prostor pretrage se stoga eksponencijalno povećava sa povećanjem broja sekvenci i veoma je zavistan od dužine sekvenci. Naivnom algoritmu je potrebno ODužina Nsekv vreme da proizvede rezultat. Nalaženje globalnog optimuma za n sekvenci na ovaj način je NP-kompletan problem.

Na bazi Karilo-Lipmanovog algoritma, Alčal je uveo 1989. praktični metod koji koristi poravnavanja parova za ograničavanje n-dimenzionog prostora pretrage. U ovom pristupu dinamički programirana poravnavanja parova se izvode za svaki par sekvenci upitnog seta, i pretražuje se jedino prostor u blizini n-dimenzionog preseka tih poravnavanja. Ovaj program optimizuje sumu svih parova slova u svakoj poziciji poravnavanja takozvani parametar sume parova.

                                     
  • Analiza sekvence u biologiji podrazumeva izlaganje DNK ili peptidnih sekvenci poravnavanju sekvenci pretragu baza podataka sekvenci pretragu za ponovljenim
  • podataka proteinskih familija koja sadrži njihove anotacije i poravnavanja višestrukih sekvenci generisane koristeći skrivene Markovljeve modele. Za svaku
  • konzerviranih domena CDD je baza podataka dokumentovanih modela poravnavanja višestrukih sekvenci i modela izvedenih putem pretraživanja baze, za drevne domene
  • Ona je rezultat višestrukih poravnavanja sekvenci u kojima se srodne sekvence medusobno porede i izračunavaju se slični motivi sekvenci Ova informacija
  • МSA се може односити на: 5 - Метоксисалицилна киселина Метансулфонска киселина Поравнавање вишеструких секвенци
  • sekvence u familije na bazi evolucije iz zajedničlig pretka. Poravnavanja višestrukih sekvenci MSA tih familija može da pruži uvid u njihovou strukturu