Maskinlæring

Automatisk læring eller automatisert læring eller maskinlæring (fra engelsk, maskinlæring ) er underfeltet til informatikk og en gren av kunstig intelligens , hvis mål er å utvikle teknikker som lar datamaskiner lære . En agent sies å lære når ytelsen forbedres med erfaring og gjennom bruk av data; det vil si når evnen ikke var til stede i hans genotype eller egenskaper ved fødselen. [ 1 ] "I maskinlæring ser en datamaskin på data, bygger en modell basert på disse dataene, og bruker den modellen som både en hypotese om verden og et stykke programvare som kan løse problemer." [ 2 ]

Ved mange anledninger overlapper handlingsfeltet for maskinlæring med slutningsstatistikk , siden begge disipliner er basert på dataanalyse . Imidlertid inkluderer maskinlæring bekymringer om beregningskompleksiteten til problemer. Mange problemer er av klasse NP-harde , så mye av forskningen som gjøres innen maskinlæring er fokusert på utforming av gjennomførbare løsninger på disse problemene. Maskinlæring er også nært knyttet til mønstergjenkjenning . Maskinlæring kan sees på som et forsøk på å automatisere enkelte deler av den vitenskapelige metoden ved hjelp av matematiske metoder. Derfor er det en prosess med kunnskapsinduksjon .

Maskinlæring har et bredt spekter av applikasjoner, inkludert søkemotorer , medisinsk diagnostikk, oppdagelse av kredittkortsvindel , markedsanalyser for ulike aktivitetssektorer, DNA-sekvensklassifisering , tale- og språkgjenkjenning , skriftspråk , spill og robotikk .

Sammendrag

Noen maskinlæringssystemer prøver å fjerne ethvert behov for intuisjon eller ekspertkunnskap fra dataanalyseprosesser, mens andre prøver å etablere et samarbeidsrammeverk mellom eksperten og datamaskinen. I alle fall kan menneskelig intuisjon ikke erstattes i sin helhet, siden systemdesigneren må spesifisere formen for datarepresentasjon og metodene for manipulering og karakterisering av samme. Imidlertid brukes datamaskiner over hele verden til svært gode teknologiske formål.

Modeller

Maskinlæring resulterer i en modell for å løse en gitt oppgave. Blant modellene skilles [ 3 ]

Modellene kan også klassifiseres som klyngemodeller og gradientmodeller . Førstnevnte prøver å dele instansrommet inn i grupper. Sekundene, som navnet indikerer, representerer en gradient der hver forekomst kan differensieres. Geometriske klassifikatorer som støttevektormaskiner er modeller av gradienter.

Typer algoritmer

De forskjellige maskinlæringsalgoritmene er gruppert i en taksonomi basert på produksjonen deres. Noen typer algoritmer er:

veiledet læring Algoritmen produserer en funksjon som etablerer samsvar mellom inngangene og de ønskede utgangene til systemet. Et eksempel på denne typen algoritmer er klassifiseringsproblemet , der læringssystemet prøver å merke (klassifisere) en serie vektorer ved å bruke en av flere kategorier (klasser). Systemets kunnskapsbase er bygd opp av eksempler på tidligere tagging. Denne typen læring kan bli svært nyttig i biologisk forskning, beregningsbiologi og bioinformatikkproblemer . uovervåket læring Hele modelleringsprosessen utføres på et sett med eksempler kun dannet av inndata til systemet. Det er ingen informasjon om kategoriene til disse eksemplene. Derfor, i dette tilfellet, må systemet være i stand til å gjenkjenne mønstre for å merke de nye oppføringene. semi-veiledet læring Denne typen algoritmer kombinerer de to tidligere algoritmene for å kunne klassifisere riktig. Merkede og umerkede data tas i betraktning. forsterkende læring Algoritmen lærer ved å observere verden rundt den. Dine innspill er tilbakemeldingene du får fra omverdenen som svar på dine handlinger. Derfor lærer systemet ved prøving og feiling. Forsterkende læring er den mest generelle blant de tre kategoriene. I stedet for at en instruktør forteller agenten hva han skal gjøre, må den intelligente agenten lære hvordan omgivelsene oppfører seg gjennom belønninger (forsterkninger) eller straff, avledet av henholdsvis suksess eller fiasko. Hovedmålet er å lære verdifunksjonen som hjelper den intelligente agenten til å maksimere belønningssignalet og dermed optimalisere sine retningslinjer for å forstå miljøets oppførsel og ta gode beslutninger for å nå sine formelle mål. De viktigste forsterkningslæringsalgoritmene er utviklet innenfor metodene for å løse endelige Markov-avgjørelsesproblemer, som inkluderer Bellman-ligningene og verdifunksjonene. De tre hovedmetodene er: Dynamisk programmering , Monte Carlo-metoder og tidsforskjellslæring. [ 4 ] Blant implementeringene som er utviklet er AlphaGo , et AI-program utviklet av Google DeepMind for å spille brettspillet Go. I mars 2016 vant AlphaGo en kamp mot den profesjonelle spilleren Lee Se-Dol som har 9. dan og 18 verdenstitler. Blant algoritmene den bruker er Monte Carlo-søketreet, det bruker også dyp læring med nevrale nettverk. Du kan se hva som skjedde i Netflix-dokumentaren «AlphaGo». transduksjon Ligner på veiledet læring, men konstruerer ikke eksplisitt en funksjon. Den prøver å forutsi kategoriene for fremtidige eksempler basert på inndataeksemplene, deres respektive kategorier og eksemplene som er nye i systemet. fleroppgavelæring Læringsmetoder som bruker kunnskap som systemet tidligere har lært for å møte problemer som ligner på de som allerede er sett.

Beregnings- og ytelsesanalyse av maskinlæringsalgoritmer er en gren av statistikk kjent som beregningsbasert læringsteori .

Folk utfører maskinlæring automatisk siden det er en så enkel prosess for oss at vi ikke engang skjønner hvordan det gjøres og alt det innebærer. Fra vi blir født til vi dør, gjennomfører mennesker ulike prosesser, blant dem finner vi læring der vi tilegner oss kunnskap, utvikler ferdigheter til å analysere og vurdere gjennom metoder og teknikker så vel som gjennom vår egen erfaring. Maskiner må imidlertid bli fortalt hvordan de skal lære, for hvis en maskin ikke er i stand til å utvikle sine evner, vil læringsprosessen ikke finne sted, men vil bare være en repeterende sekvens.

Klassifiseringsteknikker

Beslutningstrær

Denne typen læring bruker et beslutningstre som en prediktiv modell. Observasjoner om et objekt er kartlagt til konklusjoner om den endelige verdien av det objektet.

Trær er grunnleggende strukturer i databehandling. Attributttrær er grunnlaget for beslutninger. En av de to hovedformene for beslutningstrær er den utviklet av Quinlan for å måle entropi -urenheten i hver gren, noe han først utviklet i ID3 -algoritmen og senere i C4.5 . En annen strategi er basert på GINI-indeksen og ble utviklet av Breiman, Friedman et al. CART-algoritmen er en implementering av denne strategien. [ 5 ]

Foreningsregler

Assosiasjonsregelalgoritmer søker å oppdage interessante sammenhenger mellom variabler. Blant de mest kjente metodene er a priori-algoritmen, Eclat-algoritmen og Frequent Pattern-algoritmen.

Genetiske algoritmer

Genetiske algoritmer er heuristiske søkeprosesser som simulerer naturlig utvalg. De bruker metoder som mutasjon og crossover for å generere nye klasser som kan tilby en god løsning på et gitt problem.

Kunstige nevrale nettverk

Kunstige nevrale nettverk (ANN) er et maskinlæringsparadigme inspirert av nevroner i dyrs nervesystem. Det er et system av koblinger av nevroner som samarbeider med hverandre for å produsere en utgangsstimulus. Forbindelser har numeriske vekter som tilpasser seg basert på erfaring. På denne måten tilpasser nevrale nettverk seg til en impuls og er i stand til å lære. Betydningen av nevrale nettverk falt for en tid med utviklingen av støttevektorer og lineære klassifikatorer, men steg igjen på slutten av 2000-tallet med bruken av dyp læring .

Støtte vektormaskiner

MVS er en serie veiledede læringsmetoder som brukes for klassifisering og regresjon. MVS-algoritmer bruker et sett med treningseksempler klassifisert i to kategorier for å bygge en modell som forutsier om et nytt eksempel tilhører den ene eller den andre av disse kategoriene.

Klyngealgoritmer

Klyngeanalyse er klassifisering av observasjoner i undergrupper — klynger — slik at observasjonene i hver gruppe ligner hverandre i henhold til bestemte kriterier.

Klyngeteknikker gjør forskjellige slutninger om strukturen til dataene; de styres vanligvis av et spesifikt mål på likhet og av et nivå av intern kompakthet (likhet mellom medlemmer av en gruppe) og separasjonen mellom ulike grupper.

Clustering er en uovervåket læringsmetode og er en veldig populær teknikk for statistisk dataanalyse.

Bayesianske nettverk

Et Bayesiansk nettverk, trosnettverk eller rettet asyklisk modell er en sannsynlighetsmodell som representerer en serie tilfeldige variabler og deres betingede uavhengigheter gjennom en rettet asyklisk graf. Et Bayesiansk nettverk kan for eksempel representere de sannsynlige sammenhengene mellom sykdommer og symptomer. Gitt visse symptomer kan nettverket brukes til å beregne sannsynlighetene for at visse sykdommer er tilstede i en organisme. Det er effektive algoritmer som utleder og lærer ved å bruke denne typen representasjon.

Kunnskap

I maskinlæring kan vi oppnå 3 typer kunnskap, som er:

1. Vekst Det er den som er hentet fra det som omgir oss, som lagrer informasjonen i minnet som om den etterlot seg spor. 2. Omstrukturering Ved fortolkning av kunnskap resonnerer og genererer den enkelte ny kunnskap som kalles restrukturering. 3. Juster Det er den som oppnås ved å generalisere flere konsepter eller generere sine egne.

Alle tre typene utføres under en maskinlæringsprosess, men viktigheten av hver type kunnskap avhenger av egenskapene til det den prøver å lære.

Læring er mer enn en nødvendighet, det er en primær faktor for å møte behovene til kunstig intelligens .

Skille mellom veiledet og uovervåket læring

Veiledet læring kjennetegnes ved å ha informasjon som spesifiserer hvilke datasett som er tilfredsstillende for læringsmålet. Et eksempel kan være programvare som gjenkjenner hvorvidt et gitt bilde er bildet av et ansikt eller ikke: for at programmet skal lære, må vi gi det forskjellige bilder, og spesifisere i prosessen om de er ansikter eller ikke.

Ved uveiledet læring har programmet derimot ikke data som definerer hvilken informasjon som er tilfredsstillende eller ikke. Hovedmålet med disse programmene er vanligvis å finne mønstre som gjør at data kan separeres og klassifiseres i forskjellige grupper, basert på deres attributter. Etter det forrige eksemplet vil ikke en uovervåket læringsprogramvare ikke kunne fortelle oss om et gitt bilde er et ansikt eller ikke, men det kan for eksempel klassifisere bildene mellom de som inneholder menneskeansikter, dyreansikter eller de som gjør det. ikke. Informasjonen innhentet av en uovervåket læringsalgoritme må senere tolkes av en person for å gjøre den nyttig.

Applikasjoner

Maskinlæringsproblemer

Nedenfor er en rekke temaer som kan være en del av pensum for et kurs om maskinlæring.

Historie og forhold til andre emner

Maskinlæring ble født fra søket etter kunstig intelligens. Tilbake i de tidlige dagene av AI som en akademisk disiplin, var noen forskere interessert i å få maskiner til å lære. De prøvde å løse problemet med ulike symbolske metoder, samt det de kalte 'nevrale nettverk' som generelt var perseptroner og andre modeller som i utgangspunktet var basert på generaliserte lineære modeller slik de er kjent i statistikk.

Programvare

Mange programmeringsspråk kan brukes til å implementere maskinlæringsalgoritmer. De mest populære for 2015 var R og Python . [ 6 ] R er mye brukt først og fremst i akademia, mens Python er mer populært i privat virksomhet.

Programvarepakker som inkluderer maskinlæringsalgoritmer inkluderer:

Programvare med åpen kildekode

Kommersiell programvare

Bias

Maskinlæringsalgoritmer kan ofte påvirkes av hvor partisk dataene kan være (Se algoritmisk skjevhet ). For eksempel vil det ikke være mulig å klassifisere alle de oppføringene som det ikke er mottatt informasjon om i opplæringsfasen. Faktisk, når trening utføres med menneskeklassifiserte data, har maskinlæring en tendens til å skape de samme skjevhetene som finnes i samfunnet. Noen eksempler på dette er da Google Photos-algoritmen i 2015 identifiserte noen svarte mennesker med gorillaer, eller i 2016 da Microsofts Twitter-bot utviklet rasistisk og sexistisk oppførsel basert på observasjon av datatrafikk på nevnte sosiale nettverk. Av denne grunn har det de siste årene vært en tendens til å utvikle metoder for å øke rettferdigheten , det vil si å redusere skjevheten i denne typen algoritmer fra AI-eksperter. Siterer Fei-fei Li "Det er ikke noe spesielt med AI. Det er inspirert av mennesker, det er skapt av mennesker, og viktigst av alt påvirker det mennesker. Det er et veldig kraftig verktøy som vi bare så vidt har begynt å forstå, og det er et stort ansvar" [ 7 ]

Se også

Referanser

  1. Russell, Stuart ; Norvig, Peter (2009). Artificial Intelligence: A Modern Approach (3. utgave). s. 229. 
  2. ^ Russell og Norvig (2021). Kunstig intelligens : en moderne tilnærming . Pearson. s. 651. ISBN  9780134610993 . 
  3. Flach 2012 s. 20-21
  4. Sutton, Richard S., Barto, Andrew G. Reinforcement Learning: An Introduction . MIT Press. 
  5. Flach 2012 s. 155-156
  6. Fire hovedspråk for analyse- og datautvinningsvitenskap (KD Nuggets)
  7. "Fei-Fei Lis søken etter å gjøre maskiner bedre for menneskeheten" . Kablet . _ ISSN  1059-1028 . Hentet 17. desember 2019 . 

Bibliografi

Eksterne lenker