Ensemble

ensemble
Fyr Biologisk og online database for Ensembl-prosjektet
Hovedkvarter European Bioinformatics Institute (EBI)
Nettsted https://www.ensembl.org
Yachts, et al. (2020) [ 1 ]

Ensembl er et bioinformatikk - forskningsprosjekt som søker å "utvikle et programvaresystem som produserer og vedlikeholder automatiske merknader på utvalgte eukaryote genomer." Det fungerer som et samarbeid mellom Wellcome Trust Sanger Institute og European Bioinformatics Institute , en avdeling av European Molecular Biology Laboratory . All informasjon og programvare som genereres i prosjektet er gratis å bruke og få tilgang til. [ 2 ]​ [ 3 ]

Det meste av programvaren som produseres og brukes er skrevet i programmeringsspråket Perl , og er basert på BioPerl- bibliotekene . Perls applikasjonsprogrammeringsgrensesnitt kan enkelt brukes i andre genomiske prosjekter, for eksempel genannotering eller klonlister . En API for Java er også tilgjengelig .

Historikk

Det menneskelige genomet består av 3 milliarder baser , som koder for omtrent 20 000-25 000 gener . Men genomet alene er til liten nytte uten å identifisere plasseringen og forholdet mellom individuelle gener. Et alternativ er å annotere dem manuelt, hvor et team av forskere kan lokalisere gener ved å bruke eksperimentelle data hentet fra vitenskapelige tidsskrifter og offentlige data. Denne manuelle prosedyren er en langsom og kjedelig prosess. Alternativet er automatisk merknad, der mønstre søkes ved hjelp av beregningsverktøy fra proteiner til DNA . [ 4 ] [ 5 ] I 1999 ble Ensembl-prosjektet lansert som svar på den nært forestående fullføringen av Human Genome Project , med de første målene om automatisk å kommentere det menneskelige genomet, integrere denne merknaden med tilgjengelige biologiske data og gjøre denne kunnskapen offentlig. . [ 6 ]

I Ensembl-prosjektet blir sekvenseringsdataene behandlet av genannoteringssystemet (en samling rørledninger skrevet i Perl ), som forutsier et sett med gener og lagrer dem i en MySQL-database for videre analyse og visualisering. Ensembl publiserer disse dataene til hele det globale vitenskapelige samfunnet. All data og kode produsert av Ensembl-prosjektet er tilgjengelig for nedlasting, og det er også en ekstern tilgangsserver for å få tilgang til den. [ 7 ] I tillegg kan mye av de beregningsmessig genererte dataene sees på Ensembls nettsted.

Prosjektet har utvidet seg over tid, inkludert nye arter ( relevante modellorganismer som mus , Drosophila melanogaster og sebrafisk ), samt et større repertoar av genomiske data, inkludert genetiske varianter og regulatoriske elementer. Siden april 2009 har søsterprosjektet Ensembl Genomes utvidet omfanget av Ensembl mot virvelløse organismer, både dyr , planter , sopp , bakterier og protister , med fokus på å beskrive den taksonomiske og evolusjonære konteksten til gener, mens det opprinnelige prosjektet fortsetter å fokusere på vertebrater. organismer. [ 8 ]​ [ 9 ]

Fra og med 2020 lagret Ensembl mer enn 50 000 genomer mellom Ensembl og Ensembl Genomes databaser, inkludert noen innovative funksjoner som Rapid Release , et nettsted designet for raskere å publisere genomkommentardata, og COVID-19 , en tilgangsportal til referansegenomet til SARS - CoV-2- viruset .

Kommenterte genomer

Annoterte genomer inkluderer de mest komplette virveldyrene og utvalgte modellorganismer . Fra 2022 er det 271 arter registrert i databasen, inkludert: [ 10 ]

Arter
Chordata pattedyr Euarchontoglires primater bavian , bonobo , capuchin , sjimpanse , angolansk colobus , ugandisk rød colobus , boliviansk ekornape , drill , granat bushbaby , gelada , gibbon , gorilla , menneske , gylden snub - nosed langur , black snub - nosed langur , black snub - nos lemo stor grå , krabbespisende makak , sørlig grisehalemakak , rhesusmakak , grå mangabey , Nancy Ma's nattape , vervet ape , Sumatran orangutang , Coquerels sifaka , filippinsk tarsier , vanlig silkeape
scandentia Tupaya fra Belanger
Glires (gnagere + lagomorfer) Jordekorn , rødt ekorn , amerikansk bever , langhale chinchilla , marsvin , kanin , vanlig marsvin , degu , mongolsk gerbil , kinesisk hamster , gullhamster , egyptisk gerbil , alpin murmeldyr , Mus caroli , Musann pahari , amerikansk gjedde , brun rotte , Damara mol rotte , naken mol rotte , mus , kenguru mus , steppe mus , hjort mus , maurisk mus , Spermophilus dauricus , arktisk jordekorn , prærie vole
laurasiatheria Alpakka , esel , blåhval , hvithval , amerikansk bison , hest , geit , spermhval , gris , Cervus hanglu yarkandensis , sibirsk moskus , delfin , dingo , dromedar , vanlig pinnsvin , katt , ilderhav_ , løve tiger , California _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ sibirsk , ku , vaquita nise , amerikansk mink , yak , rødrev
Afrotheria Cape hyrax , afrikansk elefant , tenrec
Xenarthra Ni-båndet beltedyr , dovendyr
marsupialia Kort -grå cougar , tasmansk djevel , koala , Tammar wallaby , wombat
monotremata Platypus
Reptil Grønn anole , indisk kobra , saltvannskrokodille , skjeggete drage , komododrage , blåbåndet havkrait , hvit øgle , steinøgle , østlig brun slange , tigerslange , Terrapene carolina triunguis , kinesisk softshell skilpadde , vestafrikansk , pinnartojaveise kjempeskilpadde , alligatorskilpadde , malt skilpadde , Sinaloan scrub skilpadde , tuatara
Fugler Kongeørn , gulnebb amason , kinesisk flekkand , kortnebbgås, stokkand , grårygg hvitøyd , Athene cunicularia , østlig ugle , blåhalset struts , ørnugle , japansk musvåg , huskanarifugl , japansk kapusiner , Zebu , Toppmeis , Tårnfalk , Japansk vaktel , fighter , spadepipe , Nykaledonsk kråke , Cyanoderma ruficeps , sebra diamantrygg , Goulds diamantrygg , vanlig emu , gullfasan , høne , hane , spurvehalsspurv , , blåmeis , Slaty Junco , Kakapo , Okarito Kiwi , Storflekkkiwi , dvergflekkkiwi , nordlig flekkugle , kragefluesnapper , and , moskusand , kalkun , påfugl , chilensk rapphøns , parakit , dråpevine , småvine sin picomedium fink , australsk blåmus , blåkronet manakin , gullhalset manakin , Swainsons trost
Lissamphia Leptobrachium leishanense , Xenopus tropicalis
Teleostei Acanthochromis polyacanthus ,Amphilophus citrinellus , Amphiprion percula , gjørmeål , elektrisk ål , vanlig sild , Astatotilapia calliptera ,Astyanax mexicanus , vanlig torsk , barramundi , Calabar bichir , Callorhinchus mili garca , flekker ,carpigna semi Cyprinodon variegatus , Danio rerio , Denticeps clupeoides , brasmer , Eptatretus burgeri, pinnerygg , Fundulus heteroclitus , gambusino , Gouania willdenowi , Haplochromis burtoni, Hippocampus kommer, hestmakrell , pikea , havsabbor , pikea , mark Mastacembelus Armatus Maylandia Zebra , Chinese Medaka , Common Medaka , Java Medaka , Myripristis Murdjan , Neogobius Melanostomus , Neolamprologus Brichardi , Nothobanchius Furzeri , OreoChatle ,, Peryus , Peryus, og Peryus , Peryus , Peryus , Peryus , Peryus , Goldfisk , Goldfisk , Goldfisk, Goldfisk , Goldfisk, Goldfish, Goldfish, Good, Good, Good, Gold ,. amberjack , siamesisk kampfisk , solfisk , millionfisk , vanlig klovnefisk ,rødbuget piraja , platy , Poecilia formosa , Poecilia latipinna , Poecilia mexicana , grønn puffer , Pundamilia nyererei , mangrovestripet remora rivulin , salmon salta fascie , piggvar , Stillehavslaks , Kongelaks , Scleropages formosus , Sinocyclocheilus anshuiensis , Sinocyclocheilus grahami , Sinocyclocheilus neshorn , Sphaeramia orbicularis , Stegastes partitus , Takifugu rubripes (fugu) ,Nile tilapia ørret , Rain tilapia ørret , Xiin tilapia ørret
cyklostomi sjølamprey
Urochordata Ciona intestinalis , Ciona savignyi
virvelløse dyr insekt Aedes aegypti , Anopheles gambiae , Drosophila melanogaster
ormer Caenorhabditis elegans
Gjær Saccharomyces cerevisiae

Denne tjenesten brukes av molekylærbiologer og bioinformatikere over hele verden som jobber med genomer til listeførte arter. Forutsigelser om koding, kontroll og andre elementer i genomer kan sammenlignes med primærforskningsdata og med primærkilder for oppdatert genomisk kunnskap ( "biologiske databaser" ). Synteny er av pedagogisk verdi i skolen.

Applikasjoner

I en undersøkelse utført i 2014 ble Ensembl brukt til genomisk analyse av kaniner på jakt etter fenotypiske endringer under domestiseringen deres, og dermed ble sammenstillingen av genomet utført, som sammen med sekvensering av kanin-RNA og data fra mennesker orthologer , ble oppnådd, utranslaterte regioner (UTR) (168 286 distinkte trekk), RNA ikke-kodende regioner (n=9666) og konserverte ikke-ikke-kodende elementer (2 518 476 distinkte trekk). Denne informasjonen gjorde det mulig å gruppere prøvene for analyse av den genomiske sekvenseringen og dens modifikasjoner under domestisering av kaniner [ 11 ]

Gratis tilgang/speil

Alle data fra Ensembl-prosjektet, så vel som programvaren, er fritt tilgjengelig, og er tilgjengelig for hele det vitenskapelige samfunnet under en CC BY 4.0-lisens. For øyeblikket har Ensembl-nettstedet fire forskjellige speil i verden for å forbedre tjenesten.

Offisielle speilnettsteder
UK Server (Sanger Institute) ---- Hovednettsted
US West Coast Server (Amazon AWS) ---- Cloud Mirror
US East Coast Server (Amazon AWS) ---- Cloud Mirror
Asia Server (Amazon AWS) ---- Cloud Mirror, i Singapore

Se også

Referanser

  1. Yachts A.D. (januar 2020). «Ensembl 2020» . Nucleic Acids Res. 48 (Dl): D682-D688. PMC  7145704 . PMID  31691826 . doi : 10.1093/nar/gkz966 . 
  2. ^ "Ensembl 2011" . Nukleinsyreforskning . _ Hentet 2. mai 2021 . 
  3. ^ Flickek, Paul; Aken, Bronwen L.; Ballester, Benoit; Beal, Kathryn; Bragin, Eugene; Brent, Simon; Chen, Yuan; Clapham, Peter et al. (2010-1). Ensembls 10. år . Nucleic Acids Research 38 (Databaseutgave): D557-D562. ISSN  0305-1048 . PMC  2808936 . PMID  19906699 . doi : 10.1093/nar/gkp972 . Hentet 25. juni 2021 . 
  4. ^ "Medisinsk definisjon av genomkommentar " . 29. mars 2021. Arkivert fra originalen 14. juni 2021 . Hentet 7. august 2022 . 
  5. ^ Curwen, Val; Eyras, Eduardo; Andrews, T. Daniel; Clarke, Laura; Mongin, Emmanuel; Searle, Steven MJ; Clamp, Michele (1. mai 2004). "Ensembl Automatic Gene Annotation System" . Genome Research (på engelsk) 14 (5): 942-950. ISSN  1088-9051 . PMC  479124 . PMID  15123590 . doi : 10.1101/gr.1858004 . Hentet 7. august 2022 . 
  6. Hubbard, T. (1. januar 2002). "Ensembl genomdatabaseprosjektet" . Nucleic Acids Research 30 (1): 38-41. ISSN  1362-4962 . PMC  99161 . PMID  11752248 . doi : 10.1093/nar/30.1.38 . Hentet 7. august 2022 . 
  7. Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proktor, Glenn; Searle, Steve et al. (1. januar 2017). "Ensembl kjerneprogramvareressurser: lagring og programmatisk tilgang for DNA-sekvens og genomkommentar" . Database 2017 . ISSN  1758-0463 . PMC  5467575 . PMID  28365736 . doi : 10.1093/database/bax020 . Hentet 7. august 2022 . 
  8. Hubbard, T.J.P.; Aken, BL; Ayling, S.; Ballester, B.; Beal, K.; Bragin, E.; Brent, S.; Chen, Y. et al. (2009-01). «Ensembl 2009» . Nucleic Acids Research 37 ( Databaseutgave): D690-697. ISSN 1362-4962 . PMC 2686571 . PMID 19033362 . doi : 10.1093/nar/gkn828 . Hentet 7. august 2022 .    
  9. Howe, Kevin L.; Contreras-Moreira, Bruno; DeSilva, Nishadi; Maslen, Gareth; Akanni, Wasiu; Allen, James; Alvarez-Jarreta, Jorge; Beard, Matthieu et al. (8. januar 2020). "Ensembl Genomes 2020-muliggjør ikke-vertebrat genomisk forskning" . Nucleic Acids Research 48 ( D1): D689-D695. ISSN 1362-4962 . PMC 6943047 . PMID 31598706 . doi : 10.1093/nar/gkz890 . Hentet 7. august 2022 .    
  10. ^ "Artsliste" . uswest.ensembl.org . Hentet 14. august 2022 . 
  11. Carneiro, Miguel; Rubin, Carl-Johan; DiPalma, Federica; Albert, Frank W; Alfoldi, Jessica; Martinez Barrio, Alvaro; Pielberg, Gerli; Rafati, Nima; Sayyab, Shumaila; Turner-Maier, Jason; Younis, Shady; Alfonso, Sandra; Aken, Bronwen; Alves, Joel M; Barrell, Daniel; Bolet, Gerard; Boucher, Samuel; Burbano, Hernan A; Fields, Rita; Chang, Jean L; Duranthon, Veronique; Fontanesi, Luca; Garreau, Herve; Heman, David; Johnson, Jeremy; Mage, Rose; Peng, Ze; Queney, Guillaume; Roger-Gaillard, Claire; Ruffier, Magali; Searle, Steve; Villafuerte, Raphael; Xiong, Anqi; Ung, Sarah; Forsberg-Nilsson, Karin; Bra, Jeffrey M; Lander, Eric S; Ferrand, Nuno; Lindblad-Toh, Kerstin; Andersson, Leif|tittel=Kaningenomanalyse avslører et polygent grunnlag for fenotypisk endring under domestisering|publikasjon=Vitenskap|dato=2014|nummer=345|pages=1074|doi=10.1126/vitenskap.1253714

Eksterne lenker