Proteinska banka podataka
Proteinska banka podataka, (engl. Protein Data Bank, PDB), je kolekcija 3D strukturnih podataka velikih bioloških molekula, kao što su proteini i nukleinske kiseline. Podaci su tipično dobijeni rendgenskom strukturnom analizom ili NMR spektroskopijom. Biolozi i biohemičari iz celog sveta doprinose stvaranju ove kolekcije. PDB je slobodno dostupan na Internetu. PDB nadzire organizacija pod nazivom Svetska proteinska banka podataka (engl. Worldwide Protein Data Bank, wwPDB).
PDB je ključni resurs u strukturno biološkim oblastima, poput strukturne genomike. Većina vodećih naučnih časopisa, i pojedine agencije za finansiranje, kao što je NIH u SAD, zahtevaju od istraživača da unesu njihove strukturne podatke u PDB. PDB sadržaj se smatra primarnim podacima, i postoje stotine izvedenih baza podataka koje kategorizuju podatke na razne načine. Na primer, SCOP i CATH kategorizuju strukture na osnovu strukturno tipa i pretpostavljenih evolucionih odnosa; a GO kategorizuje strukture na osnovu gena.[1]
PDB je formiran 1971. godine[1]. Njen osnivač je Valter Hamilton sa Brukhaven nacionalne laboratorije. Nakon Hamiltonove smrti 1973, Tom Koeztle je preuzeo nadzor nad PDB-om. Januara 1994, Joel Susman je bio imenovan za PDB rukovodioca. Oktobra 1998,[2] PDB je transformisan u RCSB (engl. Research Collaboratory for Structural Bioinformatics) [3]. Transfer je završen juna 1999. Novi direktor je bila Helen M. Berman sa Rutgers univerziteta (jednog od RCSB institucija članica).[4] 2003 sa wwPDB formiranjem, PDB je postao internacionalna organizacija. Svaki od četiri wwPDB člana dejstvuje kao centar za depoziciju, obradu i distribuciju PDB podataka. Obrada podataka se odnosi na činjenicu da wwPDB osoblje pregleda i anotira svaki podneti upis. Nakon toka se verodostojnost podataka se proverava. Izvorni kod tog softvera za validaciju je javno dostupan.[5]
PDB baza podataka se ažurira sedmično (utorkom). U septembru 2010 PDB je imao sledeći sadržaj[6]:
Eksperimentalni metod |
Proteini | Nukleinske kiseline | Protein/Nukleinska kiselina kompleksi |
Drugo | Total |
---|---|---|---|---|---|
difrakcija X-zraka | 55480 | 1231 | 2605 | 17 | 59333 |
NMR | 7512 | 925 | 162 | 7 | 8606 |
Elektronska mikroskopija | 214 | 17 | 77 | 0 | 308 |
Hybrid | 24 | 1 | 1 | 1 | 27 |
Other | 126 | 4 | 4 | 13 | 147 |
Total: | 63356 | 2178 | 2849 | 38 | 68421 |
- 48,715 struktura u PDB imaju strukturni faktor fajl.
- 5,901 struktura imaju NMR podatke.
Ovi podaci pokazuju da je većina struktura određena difrakcijom X-zraka, dok je oko 15% struktura određeno putem protein NMR. Kad se koristi difrakcija X-zraka dobijaju se aproksimativne koordinate atoma proteina. NMR eksperimenti daju procene rastojanja između parova atoma proteina, a konformacija proteina se dobija rešavanjem problema geometrije rastojanja. Nekoliko proteinskih struktura je određeno krio-elektronskom mikroskopijom.
U prošlosti[7] PDB je rastao približno eksponencijalnom brzinom. Međutim, od 2007 brzina akumulacije novih proteina izgleda da je dostigla plato, sa 7263 proteina dodatih u 2007, 7073 u 2008, i 7448 u 2009.
Fajl format koji je PDB inicijalno koristio se zove PDB fajl format. Taj originalni format je bio ograničen širinom računarskih bušenih karti na 80 slova po liniji. "Makromolekularni kristalografski informacioni fajl" format, mmCIF, je počeo da se primenjuje 1996. godine,. XML verzija ovog formata, zvana PDBML, se pojavila 2005. godine.[8]
Proteinske strukture se mogu preuzeti u bilo kom od tih formata. Grafički paketi mogu direktno da pristupe strukturama na PDB sajtu:
- Za PDB fajlove, npr.,
http://www.pdb.org/pdb/files/4hhb.pdb.gz
- Za PDBML (XML) fajlove, npr.,
http://www.pdb.org/pdb/files/4hhb.xml.gz
- Kristalografska baza podataka
- Proteinska struktura
- Baze podataka proteinskih struktura
- Proteopedia — kolaborativna 3D enciklopedija proteina i drugih molekula
- ↑ 1,0 1,1 Berman, H. M. (January 2008). „The Protein Data Bank: a historical perspective”. Acta Crystallographica Section A: Foundations of Crystallography A64 (1): 88–95. DOI:10.1107/S0108767307035623. PMID 18156675.
- ↑ Berman, H. M.; et al. (January 2000). „The Protein Data Bank”. Nucleic Acids Res. 28 (1): 235–242. DOI:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
- ↑ „Research Collaboratory for Structural Bioinformatics (RCSB)”. Arhivirano iz originala na datum 2007-02-05. Pristupljeno 2013-12-25.
- ↑ „RCSB PDB Newsletter Archive”. RCSB Protein Data Bank.
- ↑ „PDB Validation Suite”. Arhivirano iz originala na datum 2016-03-03.
- ↑ „RCSB Protein Data Bank - Holdings Report”. Arhivirano iz originala na datum 2007-07-04.
- ↑ „Number of structures”. Arhivirano iz originala na datum 2007-04-28. Pristupljeno 2013-12-25.
- ↑ Westbrook, J.; et al. (2005). „PDBML: the representation of archival macromolecular structure data in XML”. Bioinformatics 21 (7): 988–992. DOI:10.1093/bioinformatics/bti082. PMID 15509603.
- wwPDB — (engl. The Worldwide Protein Data Bank)
- RCSB (SAD)
- PDBe (Evropa)
- PDBj (Japan)
- BMRB Arhivirano 2020-10-20 na Wayback Machine-u (SAD) – (engl. Biological Magnetic Resonance Data Bank )
- wwPDB dokumentacija
- PDB uvod u kristalografiju Arhivirano 2011-03-24 na Wayback Machine-u
- PDBWiki Arhivirano 2010-09-12 na Wayback Machine-u
- PDBsum
- Baza podataka nukleinskih kiselina, NDB Arhivirano 2021-04-17 na Wayback Machine-u
- PSAP veb oruđa za proteinsku analizu