Koja je razlika između FASTA-e i FASTQ-a

Sadržaj:

Koja je razlika između FASTA-e i FASTQ-a
Koja je razlika između FASTA-e i FASTQ-a

Video: Koja je razlika između FASTA-e i FASTQ-a

Video: Koja je razlika između FASTA-e i FASTQ-a
Video: #Карника и #Бакфаст: в чем разница? Часть #1 2024, Juli
Anonim

Ključna razlika između FASTA-e i FASTQ-a je u tome što je FASTA format zasnovan na tekstu koji pohranjuje samo sekvence nukleotida ili proteina, dok je FASTQ format zasnovan na tekstu koji pohranjuje i sekvencu i povezane vrijednosti kvaliteta sekvence.

Bioinformatika je polje koje koristi različite softvere za analizu i razumijevanje bioloških podataka, posebno kada je skup podataka složen i velik. Ovo polje kombinuje biologiju, hemiju, fiziku, računarstvo, informacioni inženjering, matematiku i statistiku za analizu i tumačenje bioloških podataka. FASTA i FASTQ su dva formata predstavljanja sekvenci u oblasti bioinformatike za usklađivanje i analizu sekvenci. U stvari, FASTQ je format datoteke sekvence koji proširuje FASTA format mogućnošću pohranjivanja kvaliteta sekvence.

Šta je FASTA?

FASTA je softver za usklađivanje sekvence DNK i proteina. FASTA softver koristi FASTA format. To je tekstualni format koji predstavlja ili nukleotidne sekvence ili sekvence aminokiselina (proteina). Ovdje jednoslovni kodovi predstavljaju obje ove sekvence. FASTA je važan alat u oblastima bioinformatike i biohemije. Ovaj format dozvoljava da imena sekvenci i komentari prethode sekvencama.

FASTA vs FASTQ u tabelarnom obliku
FASTA vs FASTQ u tabelarnom obliku

Slika 01: FASTA sekvenca

Ovaj format je nastao iz softvera FASTA, a uveli su ga David J. Lipmann i William R. Pearson 1985. Alat FASTA je imao mnoge modifikacije tokom vremena, a najnovija verzija se sastoji od programa za protein:protein, DNK:DNK, protein: prevedena DNK (sa pomakom okvira) i poređana ili neuređena pretraga peptida. FASTA čita datu sekvencu nukleotida ili aminokiselina i traži odgovarajuću bazu podataka sekvenci koristeći lokalno poravnanje sekvenci da pronađe podudaranja sa sličnim sekvencama baze podataka.

Šta je FASTQ?

FASTQ je softver za usklađivanje koji se koristi u oblasti bioinformatike, koji pohranjuje i biološku sekvencu (obično nukleotidnu sekvencu) i njene odgovarajuće rezultate kvaliteta. FASTQ je prvobitno razvijen da objedini sekvencu formatiranu FASTA i povezane podatke o kvalitetu od strane Wellcome Trust Sanger Instituta. Sa razvojem u oblasti bioinformatike, FASTQ je postao de facto standard za pohranjivanje rezultata mnogih instrumenata za sekvencioniranje visoke propusnosti.

FASTQ format koristi četiri različita reda po sekvenci. Red 1 počinje znakom @ i prati ga identifikator sekvence (slično naslovnoj liniji FASTA). Red 2 se sastoji od neobrađenih slova niza. U redu 3, sekvenca počinje znakom '+' i opciono je praćena istim identifikatorom sekvence. Red 4 kodira vrijednosti kvaliteta sekvence u redu 2 i treba da se sastoji od istog broja simbola kao slova u nizu.

Koje su sličnosti između FASTA i FASTQ?

  • FASTA i FASTQ su alati za poravnanje.
  • To su dva formata sekvence.
  • Oba se odnose na oblast bioinformatike.
  • I FAST i FASTQ su važni alati za potrebe skladištenja i sekvenciranja.
  • FASTQ je proširenje FASTA formata sa mogućnošću pohranjivanja kvaliteta sekvence.

Koja je razlika između FASTA-e i FASTQ-a?

FASTA je tekstualni format koji pohranjuje samo sekvence nukleotida ili proteina, dok je FASTQ format zasnovan na tekstu koji pohranjuje i sekvencu i pridružene vrijednosti kvaliteta sekvence. Dakle, ovo je ključna razlika između FASTA-e i FASTQ-a. Štaviše, FASTA pohranjuje fragmente sekvence nakon mapiranja, dok FASTQ pohranjuje fragmente sekvence prije mapiranja. Osim toga, druga razlika između FASTA i FASTQ je ta što se FASTA sastoji od jednog reda opisa, a FASTAQ se sastoji od četiri reda.

Infografika ispod predstavlja razlike između FASTA i FASTQ u tabelarnom obliku radi usporedbe.

Sažetak – FASTA vs FASTQ

Bioinformatika koristi različite formate sekvenci kao što su FASTA i FASTQ, itd. FASTA skladišti fragmente sekvence nakon mapiranja, dok FASTQ pohranjuje fragmente sekvence prije mapiranja. FASTA je softver za usklađivanje sekvence DNK i proteina. Sastoji se od programa za protein:protein, DNK:DNK, protein:translated DNK (sa pomakom okvira) i poređane ili neuređene pretrage peptida. FASTQ je softver za usklađivanje koji se koristi u području bioinformatike i pohranjuje i biološku sekvencu (obično nukleotidnu sekvencu) i njene odgovarajuće ocjene kvaliteta. FASTA se sastoji od jednog reda opisa, a FASTQ se sastoji od četiri reda. Dakle, ovo rezimira razliku između FASTA i FASTQ.

Preporučuje se: