A gépi tanulás (machine learning vagy későbbiekben: ML)
Ez az a folyamat, ami során a számítógépes algoritmusok lehetővé teszik a programok számára, hogy automatikusan fejlődjenek múltbéli tapasztalatok |azaz rekordok| alapján.” Az ML a mesterséges intelligencia egy alfaja, a fenti definíció a tudomány egy úttörőjétől, Tom Mitchell amerikai professzortól származik. Az algoritmus jelenthet egy szabályrendszert vagy instrukciók sorát, ami alapján egy program dolgozik. A „tapasztalati úton történő tanulást” hasonlóan lehet érteni, mint az emberek esetében, sőt ez többet jelent, mint múltbéli adatok rendszerezése. Például: vegyünk egy sportautót, amiről azt az információt tápláljuk be a gépbe, hogy az egy autó, de hogy milyen elemek, megjelenés definiál egy autót már nem specifikáljuk. Ha a számítógép „elé” teszünk egy kamion, azt az ML szintén autónak fogja definiálni, hiszen automatikusan felismeri, hogy rengeteg közös elem van a sportautó és a kamion között (4 kerék, fémváz, ajtók, szélvédő stb.)
Az ML és a mátrix kapcsolata
A felismerés azért érdekes a számítógépek esetében, mert a képek, tárgyak egy gép számára egy mátrixot jelentenek (pixelek) tele számokkal. Egyszerűen szólva, annak függvényében, hogy a két mátrix tartalma milyen mértékig egyezik meg, képes eldönteni az ML segítségével egy számítógép, hogy mindkét dolog autó-e vagy sem. Az ML többféle módszertant alkalmaz, hogy eredményesen tudjon kezelni nagy és összetett információ-halmazokat (pl. kép) és helyes döntést, előrejelzést tudjon készíteni.
Hogyan ismeri fel az ML a mintázatokat
A gyakorlatban nagyon nehéz elmagyarázni hogy hogyan tanul meg és ismer fel mintázatokat egy ML rendszer. Ha beírjuk a Google-ba, hogy „sportautó”, akkor autós képeket kapunk eredményül, de hogyan képes a Google különbséget tenni sportautó és kamion között? A Google először vesz rengeteg autós képet (adatbázist), amik mind autók, majd kikeres közülük sportautónak elnevezett képeket. A sportautós képeket elemezve képes aztán eldönteni (megjósolni) a fel nem címkézett képekről is, hogy azok sportautók-e vagy sem. Ha egy konkrét sportautóra szeretnénk rákeresni, például egy Ferrarira, akkor több információt kell figyelembe vennie az ML-nek. Ezzel megadtunk egy paramétert, aminek mindenképpen egyeznie kell az elemzett és a tippelt találatok esetében is, ami a márkajelzés. Természetesen előfordul, hogy helytelen találat is lesz, de ahogy fejlődik az ML, a hibaráta évről-évre kisebb. Elméletben nagyon meg lehet nehezíteni a számítógép dolgát, ha feltöltünk kutyás fotókat, de „autó”-nak nevezzük el a képet, de ha a hibás címkék vannak kissebségben, akkor az ML még képes jó döntést hozni, felismerni, hogy van hibás információ is a mintában.
A képek elemzését, a tanulási fázist csak egyszer kell elvégezni, csak úgy, mint az embernél. A szerzett „tudás” később is felhasználható, esetleg kiegészítendő új információkkal és találatokkal (pl. új sportautók megjelenése).
Összességében a következő folyamatot jelenti az ML. Először is szükséges rengeteg felcímkézett kép. Másodszor, azok elemzése után azonosítani kell azokat a mintázatokat, amik alapján a felcímkézett képek hasonlóak és különbözőek. Ezután névtelen képek azonosítása következik, ami ha sikerül, akkor egy új variáns adható hozzá a már meglévő mintához (pl. egy új sportautó modell), ha nem akkor az elvetésre kerül. Minél nagyobb a minta, ami alapján az ML tájékozódik, annál megbízhatóbb eredménnyel fog tudni szolgálni.
Miért fontos a gépi tanulás?
„Ahogy az elektromosság mindent megváltoztatott 100 éve, ma nehezen tudom elképzelni azt az iparágat, amit nem fog átformálni a mesterséges intelligencia a következő néhány évben (Andrew Ng).” Az ML hihetetlenül fontos manapság. Először is, mivel ez a technika képes megoldani valós problémákat relative rövid idő leforgása alatt, mivel gyorsan elemez. Másrészről, már ma is sok iparágat áthatott az ML az elmúlt évtizedben és a tendencia csak erősödik azóta is. Míg néhány évtizede a mai léptékhez képest szinte sehol nem tartott a mesterséges intelligencia és az ML, ma már az háttérelméletek is ki vannak dolgozva, gyakorlati implementációk és tapasztalatok is vannak és a beazonosított mintázatok száma is hatalmas. Ráadásul egyre több iparágból adódnak hozzá adatok és információk a kollektív adatbázisokhoz és tudáshoz.
A pénzben mérhető eredmény már most is meglepően meggyőző, pedig a fejlesztés még most is masszív forrásokat emészt fel. A mindezt megtámogatandó adattároló kapacitások és számítási sebesség szintén nagy léptékkel fejlődik. Ezzel párhuzamosan egyre több ember és cég szeretne hozzáférni a technológiához, látva annak kedvező hatását, amiért emberi-, gépi-, és anyagi erőforrásokat sem sajnál. Az, hogy az inputok növekvő mennyisége milyen kimenetellel fog járni, hamarosan kiderül.