Gépi tanulás és mesterséges intelligencia 2.rész

Gépi tanulás kontra mesterséges intelligencia – az alapvető különbségek

Mire használják a vállalatok az ML-t?

Sok vállalat igyekszik innovatívnak feltűntetni magát azt állítva, hogy mesterséges intelligenciát (artificial intelligence, későbbiekben: AI) és ML-t is használnak a termékeikhez és szolgáltatásaikhoz. Viszont, mint kiderült, ez nem elsősorban a gyártást érinti, hanem a marketinget. A cégek adatgyűjtésre használják elsősorban az AI-t és az ML-t, próbálják feltérképezni a potenciális vásárlók preferenciáit és igényeit, amik alapján testreszabhatják vagy a terméket, szolgáltatást magát, vagy rosszabb esetben csak a következő reklámkampányt.
Sajnos a médiában és így a laikus közönség körében is gyakran összekeverik az ML-t és az AI-t. A két fogalom szinonimaként használják, ami hiba. Más esetekben két teljesen különálló, diszrét dologként van emlegetve a két technológia, amiket csak párhuzamosan fejlesztenek, de nem függnek össze. Mindenki igyekszik a saját „egyedi” interpretációjának hangot adni, figyelmet szerezve ezzel és nagyobb eladást és bevételt generálva. Ez utóbbival nehéz mit kezdeni, de a két technológia közötti határvonalat érdemes tisztába tenni és így a gyanútlan médiafogyasztót is nehezebb lesz majd megtéveszteni.

A fent idézett Mitchell professzor szerint… 

„egy tudományterületet a legjobban az általa kutatott kérdéssel lehet definiálni. Az ML a következő kérdésre keresi a választ: Hogyan építhetünk olyan számítógépes rendszereket, amik automatikusan fejlődnek tapasztalat alapján és mik azok a fundamentális törvények, amik irányítják a tanulási folyamatokat?”
Az ML az AI egy ágazata, egy lehetséges útvonal annak fejlesztéséhez. Tanulással intelligencia keletkezik, illetve az intelligens gép képes a tanulásra. Nehéz megszemélyesítés nélkül beszélni ezekről a technológiákról, amik már az ember képességeivel vetekednek.

Az ML elemzés

Az ML kicsi és nagy adatbázisokat elemez, összehasonlítva a közös mintázatokat és felfedez további részleteket, amik értelmet nyerhetnek a felismert elemek alapján. Ez gyakorlatiasabb, mint gondolnánk. Például vegyünk néhány zenét, amiket szeretünk és megjelöljük őket kedvencnek. A ML elemzi azt a zeneszámot: ritmus, hangzásvilág, műfaj vagy azok keveréke, előadó hangszíne, nyelvezet, szöveg témája, stb. A kedvenc számok közös jellemzőik alapján ajánl a felhasználónak új számokat az ML, olyanokat, amik nagy százalékban megegyeznek a kedvencekkel, tehát nagy eséllyel tetszeni is fognak. Így működnek a YouTube, Spotify és Netflix ajánlások is.

Természetesen nem csak tisztán üzleti, szórakoztatási és „eladás-generáló” potenciál van ebben a technológiában. Az elemzett adatbázis állhat Röntgen-felvételekből és az azokhoz tartozó ambuláns lapok leírásából is, amik tartalmazzák a tüneteket, lehetséges okokat, alapbetegségeket, szedett gyógyszereket, a beteg korát, nemét, stb. Bizonyos tünetek együttes előfordulása utalhat rákos elváltozásra, de historikus adatok bevonása, mint például, hogy felmenők között volt-e rákos eset, ami utal a genetikai hajlamra, segít pontosítani a gépi diagnózis eredményét és megbízhatóságát. Ilyen értelemben az ML felér egy szakorvossal, sőt egy gép lexikális tudáskapacitása és elemzési sebessége jellemzően meghaladja egy emberét. Persze ez azon a feltételezésen alapul, hogy az ML megfelelő algoritmusokkal dolgozik új esetek, új Röntgen-felvételek diagnosztizálás alatt. Hogy ez a feltétel teljesüljön a kiinduló adatbázist nagyon pontosan kell betáplálni a gépbe és minél részeletesebben. Talán olyan összefüggéseket (indikátorokat) is képes felfedezni a gép, amikre ember nem is volt korábban figyelmes. Ezt a típusú ML-t „felügyelt tanulásnak” nevezzük (supervised learning).

A felügyeleti tanulás

A felügyelt tanulási algoritmusok célja, hogy modellezék a kapcsolatot és az összefüggéseket a kimenetel és a kiindulási, input jellemzők között. Hogyan jósolhatók meg a kimeneti értékek új input adatok esetében ezen kapcsolat-modellek segítségével?
A nem-felügyelt tanulás (unsupervised learning) egy másik családja az ML algoritmusoknak, aminek feladata nem a modellek kitalálása, hanem mintázatok detektálása és azok leírása, jellemzése. Ezek az algoritmusok nem szolgálnak output adatokkal, mivel címkézetlen adatok analizálása történik. (Nincsen kiinduló adatbázis, ami alapján az ML megbízhatóan elemezhetne más adatokat.)

A megerősített tanulás

A megerősített tanulás (reinforced learning) a harmadik legnépszerűbb típusa az ML-nek. Ez a típus a  környezeti interakciók megfigyelésével gyűjt adatot (tanul) és az alapján avatkozik be úgy, hogy az a legkedvezőbb kimenetellel járjon, vagy a legalacsonyabb kockázattal. A megerősített tanulási algoritmus, amit „ügynöknek (agent)” nevez a szakirodalom folyamatosan és ismételten tanul a környezettől. Ennek az ML-nek a leghírhedtebb eredménye, hogy a világ legjobb sakkozója egy gép és nem egy ember.

Az ML képességei nagyon kápráztatóak, főleg a legfejlettebb alfajai, mint a mélytanulás (deep learning) vagy az idegi hálózatok (neural networks). Mindenesetre a számítási tanulási elmélet (computational learning theory) még messze van a hibátlantól. Néhányan össze szokták hasonlítani a deep learninget és az neural networköt az emberi agy működésével az alapvető különbségek ellenére.

Mi a mesterséges intelligencia?

Az ML-hez képest az AI egy hihetetlenül tág tudományterület. Andrew Moore professzor szerint
„az AI az a tudomány és eszköz, ami által a számítógépek oly módon viselkednek, amiről korábban azt hittük, hogy emberi intelligencia nélkül nem lehetséges.”

50 évvel ezelőtt, az első sakk-programra mondtak először, hogy mesterséges intelligencia. Addig a pontig a játékelmélet megértéséről és a játékstratégiák kigondolásáról azt tartották, hogy ezekre csak az emberi intelligencia képes. Ma már a legalapabb számítógépek, de még telefonok is képesek sakkozni, sőt meg is tudják verni a lakosság nagy részét. A stratégia-alkotás logika kérdése, a számítógépes mechanizmusok szintén. A Deep Blue nevű AI 1997-ben győzte le az akkori világbajnok sakkozót egy olyan algoritmussal (tree search vagy „fa keresés”), ami lépések millióit képes elemezni minden lépésnél. Ahhoz hasonlóan, ahogyan a fa törzséből ágak válnak ki, amikből még kisebb ágak, úgy elemzett a Deep Blue egy-egy lépést, az azt követő lehetséges lépéseket és így tovább.

Az AI elsődleges funkciója ma nem az emberrel való versenyzés, hanem az ember támogatása. Intelligens asszisztensenként funkcionálnak, amik a meglévő lexikális tudásból képesek kiszűrni az adott helyzetben releváns információkat. Egyes alfajok ennél többre is képesek, mint ahogy fent tárgyaltuk. De a mindennapi életünkben csak kisegítenek minket, de döntést nem hoznak helyettünk.

pub.towardsai.net