Kaggle

kaggle
Fyr datterselskap
Industri datavitenskap
Fundament juni 2010
Grunnlegger Anthony Goldbloom
Hovedkvarter San Francisco ( USA )
President Max Levichin
Produkter Konkurranser, Kaggle-kjerner, Kaggle-datasett, Kaggle Learn
Eieren Alphabet Inc.
Moderselskap Google
Nettsted kaggle.com

Kaggle , et datterselskap av Google LLC , er et nettsamfunn av datavitere og maskinlæringseksperter . Kaggle lar brukere finne og publisere datasett, utforske og lage modeller i et nettbasert datavitenskapelig miljø; jobbe med andre dataforskere og maskinlæringsingeniører og delta i konkurranser for å løse datavitenskapelige utfordringer.

Kaggle startet i 2010 med å tilby maskinlæringsquizer og tilbyr nå også en offentlig dataplattform, en skybasert arbeidsbenk for datavitenskap og AI-utdanning. Hans viktigste tidlige personell var Anthony Goldbloom og Jeremy Howard. Nicholas Gruen var grunnleggende styreleder, etterfulgt av Max Levchin. I 2011 steg egenkapitalen til å verdsette selskapet til 25 millioner amerikanske dollar. 8. mars 2017 annonserte Google at de kjøper opp Kaggle. [ 1 ]​ [ 2 ]

Kaggle-fellesskapet

I juni 2017 kunngjorde Kaggle at den hadde passert én million registrerte brukere, eller Kagglers. [ 3 ] Fellesskapet spenner over 194 land. Det er et mangfoldig samfunn, alt fra de som nettopp har startet opp til mange av verdens mest kjente forskere. [ 4 ]

Kaggle-konkurranser tiltrekker seg jevnlig over tusen lag og enkeltpersoner. Kaggle-fellesskapet har tusenvis av offentlige datasett og kodebiter (kalt "Kaggle-kjerner" i Kaggle). Mange av disse forskerne publiserer artikler i fagfellevurderte tidsskrifter basert på deres prestasjoner i Kaggle-konkurranser. [ 5 ]

I mars 2017 kjørte Two Sigma Investments-fondet en konkurranse på Kaggle for å kode en algoritme for kjøp og salg av eiendeler. [ 6 ]

Kaggle tjenester

Hvordan Kaggle-konkurranser fungerer

  1. Verten for konkurransen forbereder dataene og en beskrivelse av problemet.
  2. Deltakerne eksperimenterer med ulike teknikker og konkurrerer mot hverandre om å produsere de beste modellene. Arbeidet deles offentlig via Kaggle Kernels for å bedre benchmark og inspirere til nye ideer. Innleveringer kan gjøres via Kaggle Kernels, ved manuell opplasting eller ved å bruke Kaggle API . For de fleste konkurranser blir bidragene umiddelbart scoret (basert på deres prediktive nøyaktighet i forhold til en skjult løsningsfil) og oppsummert i en live leaderboard.
  3. Etter fristen betaler konkurranseverten premiepengene i bytte mot "en verdensomspennende, evigvarende, ugjenkallelig, royaltyfri lisens [...] for å bruke vinnerbidraget", dvs. algoritmen, programvaren og relaterte intellektuelle eiendommer som er utviklet. som er "ikke-eksklusiv med mindre annet er spesifisert." [ 7 ]

I tillegg til sine offentlige konkurranser, tilbyr Kaggle også begrensede private konkurranser til topp Kaggle-deltakere. Kaggle tilbyr et gratis verktøy for lærere i datavitenskap til å kjøre akademiske maskinlæringskonkurranser, Kaggle In Class. [ 8 ] Kaggle arrangerer også rekrutteringskonkurranser der dataforskere konkurrerer om muligheten til å intervjue ved ledende datavitenskapsselskaper som Facebook , Winton Capital og Walmart .

Effekten av Kaggle-konkurranser

Kaggle har kjørt hundrevis av maskinlæringskonkurranser siden selskapet ble grunnlagt. Konkurranser spenner fra å forbedre gestgjenkjenning for Microsoft Kinect [ 9 ] til å lage en fotball - AI for Manchester City eller forbedre søket etter Higgs-bosonenCERN . [ 10 ]

Konkurransene har gitt opphav til mange vellykkede prosjekter, inkludert forbedring av toppmoderne innen HIV-forskning, [ 11 ] sjakkvurderinger [ 12 ] og trafikkprognoser. [ 13 ] Mest kjent brukte Geoffrey Hinton og George Dahl dype nevrale nettverk for å vinne en konkurranse organisert av Merck . Og Vlad Mnih (en av Hintons elever) brukte dype nevrale nettverk for å vinne en konkurranse arrangert av Adzuna. Dette bidro til å vise frem kraften til dype nevrale nettverk og resulterte i at teknikken ble tatt i bruk av andre i Kaggle-samfunnet. Tianqi Chen fra University of Washington brukte også Kaggle for å vise frem kraften til XGBoost, som siden har erstattet Random Forest som en av hovedmetodene som brukes for å vinne Kaggle-konkurranser.

Flere vitenskapelige artikler har blitt publisert basert på funnene fra Kaggle-konkurransene. [ 14 ] En nøkkel til dette er live leaderboard-effekten, som oppmuntrer deltakere til å fortsette å innovere utover eksisterende beste praksis. [ 15 ] Vinnermetoder er ofte skrevet på Kaggle-bloggen.

Finans

I mars 2017 kunngjorde Fei-Fei Li , Googles vitenskapelige sjef, at Google kjøpte opp Kaggle under hovedtalen hennes på Google Next. [ 16 ]

Referanser

  1. Lardinois, Frederic (8. mars 2017). "Google kjøper datavitenskapsfellesskapet Kaggle" . Techcrunch . Arkivert fra originalen 9. mars 2017 . Hentet 9. mars 2017 . «Kilder forteller oss at Google kjøper Kaggle [...] den offisielle kunngjøringen kan komme så tidlig som i morgen. » 
  2. ^ "Google kjøper Kaggle og dens gaggle av AI-nerder " . 8. mars 2017 . Hentet 1. juni 2018 . 
  3. ^ "Vi har passert 1 million medlemmer" (på amerikansk engelsk) . 06-06-2017 . Hentet 19. august 2018 . 
  4. Markoff, John. Forskere ser fremskritt innen dyp læring, en del av kunstig intelligens . Hentet 19. august 2018 . 
  5. ^ "Google Scholar" . scholar.google.com . Hentet 19. august 2018 . 
  6. Wigglesworth, Robin (8. mars 2017). "Hedgefond tar i bruk nye metoder for å jakte på nye teknologiske talenter" . Storbritannia . Hentet 29. oktober 2017 . 
  7. Kaggle. "Vilkår og betingelser - Kaggle" . 
  8. Kaggle. "Kaggle i klassen" . Arkivert fra originalen 16. juni 2011 . Hentet 12. august 2011 . 
  9. Byrne, Ciara (12. desember 2011). "Kaggle lanserer konkurranse for å hjelpe Microsoft Kinect med å lære nye bevegelser" . VentureBeat . Hentet 13. desember 2011 . 
  10. ^ "Maskinlæringsfellesskapet tar på seg Higgs" . Symmetry Magazine . 15. juli 2014 . Hentet 14. januar 2015 . 
  11. Carpenter, Jennifer (februar 2011). "Måtte den beste analytikeren vinne" . Vitenskapsmagasinet . Hentet 1. april 2011 . 
  12. Sonas, Jeff (20. februar 2011). "Deloitte/FIDE Chess Rating Challenge" . Chessbase . Hentet 3. mai 2011 . 
  13. Foo, Fran (6. april 2011). "Smarttelefoner for å forutsi NSW reisetider?" . Den australske . Hentet 3. mai 2011 . 
  14. 42 . mangler ( hjelp )   |título=
  15. Athanasopoulos, George (2011). "Verdien av tilbakemeldinger i prognosekonkurranser" 27 . s. 845-849. 
  16. "Velkommen Kaggle til Google Cloud " . Hentet 19. august 2018 . 

Annen lesning

Eksterne lenker