UniProt

UniProt
Skaperen European Institute of Bioinformatics
Fyr biologisk database , online database , datalager , graforientert database og ELIXIR Core Data Resource
Nettsted www.uniprot.org og www.uniprot.org

UniProt (fra universal prot ein ) er et gratis sentrallager for proteindata . Dette har gjort den til verdens ledende ressurs for lagring av proteininformasjon. De fleste bidragene kommer fra genomsekvenseringsprosjekter , og finnes i vitenskapelige tidsskrifter.

UniProt-konsortiet

UniProt-konsortiet består av European Bioinformatics Institute (EBI), Swiss Institute for Bioinformatics (SIB) og Protein Information Resource (PIR). EBI er lokalisert på Wellcome Trust Genome Campus i Hinxton, Storbritannia. Den har en stor kilde til databaser og bioinformatikktjenester. SIB er lokalisert i Genève (Sveits). Den vedlikeholder ExPASy (Expert Protein Analysis System)-servere, som er en sentral ressurs for proteomikkverktøy, så vel som databaser. PIR er lokalisert ved National Biomedical Research Foundation (NBRF), lokalisert ved Georgetown University Hospital, i Washington D.C. (USA). PIR er arving til den eldste databasen med proteinsekvenser, Atlas of Protein Sequence and Structure, publisert i 1965 av Margaret Dayhoff . [ 1 ] I 2002 slo EBI, SIB og PIR seg sammen i UniProt-konsortiet. [ 2 ]

Røttene til UniProt-databasene

Hvert medlem av konsortiet er sterkt involvert i vedlikehold og merknader av proteindatabasen. Inntil nylig produserte EBI og SIB i fellesskap Swiss-Prot- og TrEMBL-databasene, mens PIR produserte proteinsekvensdatabasen (PIR-PSD). [ 3 ] [ 4 ] Disse databasene eksisterte side om side med forskjellige annoteringsprioriteringer og dekning av proteinsekvenser.

Swiss-Prot ble opprettet i 1986 av Amos Bairoch under sin doktorgrad og utviklet av Swiss Institute for Bioinformatics og videreutviklet av Rolf Apweiler ved European Bioinformatics Institute . [ 5 ] Swiss-Prot hadde som mål å gi pålitelige proteinsekvenser assosiert med et høyt annoteringsnivå (som å beskrive et proteins funksjon, dets domenestruktur, post-translasjonelle modifikasjoner, varianter, etc.), et minimalt nivå av redundans og høyt nivå integrasjon med andre databaser. Ved å erkjenne at sekvensdata ble generert med en hastighet som oversteg Swiss-Prots evne til å følge med, ble TrEMBL (Translated EMBL Nucleotide Sequence Data Library) opprettet for å gi automatiserte merknader for de proteinene som ikke er i Swiss-Prot. . I mellomtiden opprettholdt PIR PIR-PSD og relaterte databaser, inkludert iProClass, en database med proteinsekvenser og utvalgte familier.

Konsortiets medlemmer kombinerte sine overlappende ressurser og ekspertise og lanserte UniProt i desember 2003. [ 6 ]

Referanser

  1. Dayhoff, Margaret O. (1965). National Biomedical Research Foundation, red. Atlas over proteinsekvens og struktur . Silver Spring, MD. 
  2. ^ "2002-utgivelse: NHGRI Funds Global Protein Database" . National Human Genome Research Institute (NHGRI) . Arkivert fra originalen 24. september 2015 . Hentet 14. april 2018 . 
  3. Nucclec Acids Research, red. (1. januar 2003). "Proteininformasjonsressursen " . Hentet 3. mai 2021 . 
  4. Boeckmann, Brigitte; Bairoch, Amos; Apweiler, Rolf; Blatter, Marie-Claude; Estreicher, Anne; Gasteiger, Elisabeth; Martin, Maria J.; Michoud, Karine et al. (1. januar 2003). "SWISS-PROT proteinkunnskapsbasen og dets supplement TrEMBL i 2003" . Nucleic Acids Research 31 (1): 365-370. ISSN  0305-1048 . PMID  12520024 . Hentet 3. mai 2021 . 
  5. Bairoch, A; Apweiler, R (1. januar 1996). "SWISS-PROT proteinsekvensdatabanken og dets nye supplement TREMBL." . Nucleic Acids Research 24 (1): 21-25. ISSN  0305-1048 . PMID  8594581 . Hentet 3. mai 2021 . 
  6. ^ "Proteinsekvensdatabaser" . Current Opinion in Chemical Biology 8 ( 1):76-80. 1. februar 2004. ISSN 1367-5931 . doi : 10.1016/j.cbpa.2003.12.004 . Hentet 3. mai 2021 .  

Eksterne referanser