UniProt | ||
---|---|---|
Skaperen | European Institute of Bioinformatics | |
Fyr | biologisk database , online database , datalager , graforientert database og ELIXIR Core Data Resource | |
Nettsted | www.uniprot.org og www.uniprot.org | |
UniProt (fra universal prot ein ) er et gratis sentrallager for proteindata . Dette har gjort den til verdens ledende ressurs for lagring av proteininformasjon. De fleste bidragene kommer fra genomsekvenseringsprosjekter , og finnes i vitenskapelige tidsskrifter.
UniProt-konsortiet består av European Bioinformatics Institute (EBI), Swiss Institute for Bioinformatics (SIB) og Protein Information Resource (PIR). EBI er lokalisert på Wellcome Trust Genome Campus i Hinxton, Storbritannia. Den har en stor kilde til databaser og bioinformatikktjenester. SIB er lokalisert i Genève (Sveits). Den vedlikeholder ExPASy (Expert Protein Analysis System)-servere, som er en sentral ressurs for proteomikkverktøy, så vel som databaser. PIR er lokalisert ved National Biomedical Research Foundation (NBRF), lokalisert ved Georgetown University Hospital, i Washington D.C. (USA). PIR er arving til den eldste databasen med proteinsekvenser, Atlas of Protein Sequence and Structure, publisert i 1965 av Margaret Dayhoff . [ 1 ] I 2002 slo EBI, SIB og PIR seg sammen i UniProt-konsortiet. [ 2 ]
Hvert medlem av konsortiet er sterkt involvert i vedlikehold og merknader av proteindatabasen. Inntil nylig produserte EBI og SIB i fellesskap Swiss-Prot- og TrEMBL-databasene, mens PIR produserte proteinsekvensdatabasen (PIR-PSD). [ 3 ] [ 4 ] Disse databasene eksisterte side om side med forskjellige annoteringsprioriteringer og dekning av proteinsekvenser.
Swiss-Prot ble opprettet i 1986 av Amos Bairoch under sin doktorgrad og utviklet av Swiss Institute for Bioinformatics og videreutviklet av Rolf Apweiler ved European Bioinformatics Institute . [ 5 ] Swiss-Prot hadde som mål å gi pålitelige proteinsekvenser assosiert med et høyt annoteringsnivå (som å beskrive et proteins funksjon, dets domenestruktur, post-translasjonelle modifikasjoner, varianter, etc.), et minimalt nivå av redundans og høyt nivå integrasjon med andre databaser. Ved å erkjenne at sekvensdata ble generert med en hastighet som oversteg Swiss-Prots evne til å følge med, ble TrEMBL (Translated EMBL Nucleotide Sequence Data Library) opprettet for å gi automatiserte merknader for de proteinene som ikke er i Swiss-Prot. . I mellomtiden opprettholdt PIR PIR-PSD og relaterte databaser, inkludert iProClass, en database med proteinsekvenser og utvalgte familier.
Konsortiets medlemmer kombinerte sine overlappende ressurser og ekspertise og lanserte UniProt i desember 2003. [ 6 ]