top of page
Search

Prečo sa ChatGPT nemusí považovať za UI podľa novej AI Act regulácie?

Dňa 13. marca 2024, Európsky Parlament schválil AI Act (prijaté znenie), ktorého podrobnosti sú predmetom tejto analýzy. V predchádzajúcom článku som vám poskytol prehľad základných aspektov prijatého znenia. Teraz som sa venoval podrobnému štúdiu znenia, ktoré napriek svojej dĺžke a zložitosti závisí od toho či sa systém kvalifikuje ako umelá inteligencia. Tento článok sa zaoberá definíciou UI v regulácii a odhaľuje významné nedopatrenie: podľa súčasnej definície sa ani ChatGPT nemusí kvalifikovať ako umelá inteligencia. Je zrejmé, že všetky porovnateľne jednoduchšie algoritmy a projekty, ktoré má zákon v úmysle regulovať, by sa tiež nekvalifikovali, čím sa táto regulácia úplne míňa svojmu cieľu.


Najprv sa pozrime na kľúčovú definíciu v Hlave I, článku 3, doložke 1:


"Systém umelej inteligencie" predstavuje strojový systém navrhnutý na fungovanie s rôznou úrovňou autonómie, ktorý môže po nasadení vykazovať adaptívnosť a ktorý pre explicitné alebo implicitné ciele odvodzuje zo vstupných údajov, ktoré dostáva, ako generovať výstupy, ako sú predpovede, obsah, odporúčania alebo rozhodnutia, ktoré môžu ovplyvniť fyzické alebo virtuálne prostredie;


Teraz sa budem venovať trom kľúčovým pojmom:

  1. Odvodzovanie

  2. Autonómia

  3. Adaptívnosť 


Inferencia (odvodenie)

Väčšina tejto definície je pomerne jasná. Používa sa tradičný pohľad na odvodzovacie stroje. Či už vychádzate zo štatistickej školy myslenia, alebo skôr z filozofie strojového učenia, všetci sa zhodneme na tom, že modely, ktoré vytvárame, sa učia na vzorke dát a zovšeobecňujú na širšiu populáciu. Napríklad vás zaujíma priemerná výška človeka v danej krajine. Nemeriate všetkých, ktorí v tejto krajine žijú, iba zozbierate reprezentatívnu vzorku a z nej odvodíte parameter populácie. V iných prípadoch by to mohlo byť trochu zložitejšie koncepčne si to predstaviť. Platí rovnaký princíp, ak sa snažíme odhadnúť pohyby na trhu? Áno. Len v tomto prípade sú vzorkou naše historické dáta a my odvodzujeme, čo by sa mohlo stať v budúcnosti. Regulátori sa snažili byť explicitne inkluzívni - alebo možno trochu pedagogickí - tým, že vymenovali rôzne aplikácie odvodzovania, ako napríklad generovanie predpovedí, obsahu, odporúčaní alebo rozhodnutí.


Autonómia

Až do tohto bodu bola analýza pomerne jednoduchá. Pojem "autonómia" však prináša značnú zložitosť. Podľa Recitálu 12:


Systémy umelej inteligencie sú navrhnuté tak, aby fungovali s rôznou úrovňou autonómie, čo znamená, že majú určitý stupeň nezávislosti činností od ľudskej účasti a schopnosti fungovať bez ľudského zásahu.


Na prvý pohľad sa zdá, že táto definícia je jasná: cieľom regulácie je dohliadať na systémy, ktoré vykazujú autonómiu. Zoberme si automatizovaný algoritmus na schvaľovanie pôžičiek, ktorý samostatne rozhoduje o schválení pôžičky; takýto systém je autonómny a potenciálne významne ovplyvňuje blaho ľudí. Naopak, ak algoritmus iba navrhuje zástupcovi či má pôžičku schváliť, jeho autonómnosť - a s ňou spojené riziko - je výrazne obmedzená, čo potenciálne znižuje potrebu regulačného dohľadu.


Problém z môjho pohľadu spočíva v tom, aké široké je rozpätie medzi dvoma uvedenými extrémami a aké nejednoznačné je toto rozpätie. Povedzme, napríklad, že sme pri možnosti odporúčania (tá druhá). Predstavte si, že váš algoritmus je veľmi presný. Čo ak by sme zistili, že len v ojedinelých prípadoch sa zástupcovia spoločnosti odchýlia od odporúčania nášho algoritmu na schválenie úveru? Postupom času zástupcovia spoločnosti prestanú kontrolovať jeho odporúčania a v podstate vygumujú výsledok. Nebolo to úmyselné, ale systém nechtiac získal de facto autonómiu. Spadá teraz pod reguláciu o umelej inteligencii? Pohľad na autonómiu sa už netýka technických schopností systému, ale toho, ako ľudia so systémom komunikujú. To vytvára neistotu pre vývojárov a tých, ktorí algoritmus nasadzujú. Ako by sa toto kritérium vzťahovalo na systémy umelej inteligencie, s ktorými v súčasnosti pracujete?


Adaptívnosť

Adaptívnosť je ďalšou rozhodujúcou vlastnosťou systému, aby sa mohol považovať za umelú inteligenciu podľa AI Act, ako sa uvádza v Recitáli 12 prijatého znenia:


Adaptívnosť, ktorú by systém UI mohol vykazovať po nasadení, sa týka schopnosti samoučenia, ktorá umožňuje systému meniť sa počas používania.


Toto ustanovenie odhaľuje významnú medzeru v definícii UI v regulácii AI Act. V skutočnosti vylučuje mnohé prípady použitia a projekty, ktoré sa všeobecne považujú za stelesnenie umelej inteligencie, a poukazuje na nesúlad medzi zákonom a praktickými aplikáciami technológie umelej inteligencie. Poďme sa tejto problematike venovať hlbšie.


Predstavte si, že chcete vytvoriť stroj, ktorý hrá šach. Môžete sa vydať jednou z dvoch ciest. Prvou možnosťou je explicitne naprogramovať ťahy, rozhodnutia a pozície na šachovnici. To je ťažkopádne, pretože toto explicitné programovanie by jednoducho vyžadovalo príliš veľa úsilia. Druhý spôsob, ktorý je už desaťročia zaujímavým prísľubom umelej inteligencie, je, že sa budete spoliehať na samoučenie. Začnete zhromažďovaním datasetu, ktorý sa označuje ako tréningové dáta. V našom prípade by to boli stovky, tisíce alebo aj viac šachových partií, ktoré odohrali ľudia a ktoré boli zaznamenané. Po druhé, potrebujete vhodný algoritmus samoučenia. Oblasť umelej inteligencie alebo jej podmnožiny strojového učenia ponúka veľa možností. Nakoniec tieto dve možnosti skombinujete - necháte algoritmus, aby sa sám učil, ako hrať šach na základe zozbieraných tréningových dát. Vo výsledku nie je potrebné vykonávať explicitné programovanie - vďaka schopnosti samoučenia bude systém schopný hrať šach.


Na prvý pohľad sa zdá, že vysvetlenie adaptability v Recitáli 12, ktoré zdôrazňuje samoučenie, jasne rozlišuje medzi tradične naprogramovanými strojmi a tými, ktoré klasifikujeme ako umelú inteligenciu. Kritická fráza "umožnenie systému meniť sa počas používania" však výrazne zužuje rozsah toho, čo sa považuje za adaptívne.


Náš samoučiaci sa stroj na hranie šachu by sa nepovažoval za adaptívny. Stroj (alebo systém) sa menil, ale NEMENIL sa počas používania. Životnosť nášho stroja na hranie šachu je rozdelená na dve veľké fázy - tréning a používanie. V rámci tréningovej fázy začíname s dátami (súborom partií z minulosti) a surovým algoritmom. V rámci tejto fázy sa algoritmus mení, keď pozoruje tréningové dáta a učí sa z nich, ako hrať šach napodobňovaním ťahov ľudských hráčov. V určitom okamihu ukončíme fázu trénovania. Samoučenie a zmena algoritmu sa zastaví, pretože teraz chceme algoritmus využiť. Tento bod zlomu medzi oboma fázami sa bežne označuje ako "nasadenie", ktoré sa uvádza aj v Recitáli tejto regulácie.


Nasadenie môže mať mnoho podôb. Povedzme, že pre naše potreby by sme tento vycvičený stroj umiestnili na server a zverejnili ho prostredníctvom webovej stránky. Návštevníci našej webovej stránky si teraz môžu otestovať svoje šachové schopnosti a zahrať si proti nášmu stroju. Stroj sa používa, ale už sa nemení. Len predvádza svoje naučené schopnosti, pričom hrá šach proti návštevníkom našej webovej stránky.


Možno sa teraz pýtate - ale čo keď sa pravidlá hry zmenia alebo sa medzi hráčmi objavia nové trendy. Nechceli by sme, aby ich náš stroj zohľadňoval? Áno, a to je pomerne bežné (možno nie v šachu). Tento krok sa označuje ako "pretrénovanie" algoritmu/systému. V podstate sa vraciame na začiatok. Vezmeme pôvodné dáta, na ktorých bol algoritmus natrénovaný a obohatíme ich o nové vzorky, alebo dáta zmeníme tak, aby odrážali len najnovšie potreby, napríklad šachové partie s novo zavedenými pravidlami. Tu by sa dalo tvrdiť, že šachový hrací stroj sa "používa" a my ho začneme "meniť". Tento argument celkom neobstojí, pretože navrhujeme nový šachový hrací stroj, ktorý nahradí starý. Tento krok "pretrénovania" sa teda deje mimo používania a neprispel by k tvrdeniu, že by sa systém považoval za adaptívny. Ak by ste chceli urobiť jednoduchú paralelu, predstavte si softvér, ktorý nepoužíva žiadny samoučiaci sa algoritmus, napríklad webovú stránku. Občas chcete zmeniť funkčnosť alebo vzhľad webovej stránky, a tak jednoducho zverejníte novú verziu tejto webovej stránky.


Teraz zovšeobecnime šachový hrací stroj, ktorý sme postavili, na rôzne odvetvia. Rovnaký princíp samoučenia a sprievodných zmien, ktorý sme využili, sa uplatňuje v širokom spektre aplikácií umelej inteligencie v celej EÚ.


  • V najjednoduchších prípadoch začíname s algoritmami hodnotenia rizika alebo úverovej bonity, kde bežne používame modely strojového učenia, ktoré sa môžu učiť napríklad na základe historických prípadov nesplácania úverov a predpovedať, kto pravdepodobne nebude splácať požadovaný úver. Rovnako ako náš šachový stroj, aj tento model naučený na historických prípadoch sa v kroku nasadenia zafixoval a po tomto bode sme jednoducho využili jeho zafixovaný stav. Je bežnou praxou, že tieto modely sa pravidelne pretrénujú, napríklad každý rok, aby zohľadňovali najnovšie trendy na finančnom trhu.

  • Teraz to vezmime do extrému - veľké jazykové modely, na príklade ChatGPT. Opäť, podobne ako náš šachový stroj, sa učí v rámci fázy trénovania. Konkrétne sa učí naše jazykové vzory a interpretácie slov. V etape nasadenia sa tieto zafixujú a ak teraz otvoríte konverzáciu s ChatGPT a budete s ním komunikovať, nebude sa hneď sám učiť z vašich vstupov. 


Oba príklady, od jednoduchého až po zložitý, ilustrujú spoločný vzor: Systémy umelej inteligencie prechádzajú fázou učenia a adaptácie, ale ich použitie zostáva statické, kým nie sú pretrénované. Tento proces nie je v súlade s úzkou definíciou adaptability v regulácii AI Act, ktorá vyžaduje priebežné učenie počas používania, čo vyvoláva otázky o uplatniteľnosti právnych predpisov na mnohé technológie UI v praxi.


Učenie online

Aby sme boli spravodliví, v oblasti strojového učenia existuje podmnožina modelov, ktoré sa "počas používania menia". Bežná referencia na tieto algoritmy je učenie online (online learning). Ak zostaneme pri našom príklade s hraním šachu, stroj by sme navrhli tak, aby sa učil po každej odohranej partii (alebo malej dávke partií). Moja prax dátového vedca a konzultanta ma však naučila, že v praxi tento súbor algoritmov využívame len zriedka. Užitočnosť učenia online by sme mohli nájsť v predpovediach vývoja na burze, kde by nedávne trendy mohli mať obrovský význam pre predpovede toho, kam sa trh pohne. Ak by sme sa držali predchádzajúceho prístupu, napríklad pretrénovania algoritmu len raz ročne, bol by strašne nepresný, pretože by nikdy nezohľadnil nedávne trendy.


Jedným z hlavných dôvodov, prečo dátoví vedci zriedka využívajú učenie online, je, že tieto algoritmy sú náchylné na rôzne druhy nebezpečenstiev, od technických problémov až po priame problémy s kybernetickou bezpečnosťou. Predstavte si napríklad, že niekto chce poškodiť našu webovú stránku, na ktorú môžu ľudia prísť a vyzvať náš stroj na šachovú partiu. Tento útočník vie, že používame učenie online a stroj sa bude učiť z každej odohranej partie. Útočník bude zámerne hrať iracionálne ťahy v rámci niekoľkých partií v nádeji, že algoritmus učenia online ich zachytí, a tak sa zhorší jeho výkon.


Aby som zhrnul toto krátke rozšírenie môjho textu, algoritmy učenia online predstavujú len malú časť v súčasnosti produktívnych prípadov použitia umelej inteligencie. Ak by sa teda AI Act zameriavala na regulovanie len týchto systémov, bola by to celkom nezmyselná regulácia.


Kvalifikuje sa ChatGPT ako UI?

Pre zaujímavosť som sa spýtal samotného ChatGPT či sám seba považuje za vyhovujúceho myšlienkam "adaptívnosti" a "autonómie".


Používateľ:

Chcel by som, aby ste sa vyjadrili k nasledujúcim otázkam. Dnes je 15. marec 2024. Povedzte mi, odkedy sa považujete za "používaného"? Po druhé, kedy bol podľa vás posledný bod v čase, keď ste prejavili schopnosť samoučenia?


ChatGPT:

Za "používaného" sa považujem od okamihu, keď som bol nasadený spoločnosťou OpenAI, a to sa stalo v rôznych fázach v priebehu niekoľkých posledných rokov, s významnými aktualizáciami a vylepšeniami na tejto ceste. Verzia, s ktorou teraz komunikujete, založená na architektúre GPT-4, bola zavedená pred mojou poslednou aktualizáciou znalostí v apríli 2023. Takže v širšom zmysle by sa dalo povedať, že som "používaný" od nasadenia pôvodného modelu GPT spoločnosťou OpenAI, ale presnejšie, v mojej súčasnej podobe od obdobia krátko pred aprílom 2023.


Pokiaľ ide o schopnosť samoučenia, je nevyhnutné objasniť, že sa neučím ani neaktualizujem svoje znalosti v reálnom čase alebo po nasadení. K môjmu učeniu dochádzalo počas fázy trénovania, ktorá sa uskutočnila predtým, ako som bol sprístupnený na používanie. Počas tejto fázy som analyzoval rozsiahly dataset s textami z internetu a iných zdrojov až do mojej poslednej aktualizácie v apríli 2023. Po tejto tréningovej fáze som svoje vedomosti neaktualizoval ani som sa neučil na základe interakcií alebo nových informácií. Posledný časový bod, keď som prejavil schopnosť samoučenia, bol teda počas môjho posledného tréningového cyklu pred aprílom 2023. Potom boli moje vedomosti a reakcie statické a odrážali len informácie dostupné do tejto poslednej aktualizácie.


Používateľ:

Predpokladajme, že teraz hodnotím, či ste systém umelej inteligencie. Systém považujem za umelú inteligenciu, ak spĺňa podmienku "adaptívnosti" definovanú takto:


"Adaptívnosť, ktorú by systém UI mohol vykazovať po nasadení, sa vzťahuje na schopnosť samoučenia, ktorá umožňuje systému meniť sa počas používania. "


Na základe toho, čo ste práve povedali, a toho, čo vidíte, považujete sa za vyhovujúceho tejto definícii adaptívnosti?


ChatGPT:

Na základe definície adaptívnosti, ktorú ste uviedli, by som do tejto definície systému umelej inteligencie nezapadal. Moje schopnosti nezahŕňajú samoučenie po nasadení, čo znamená, že sa neprispôsobujem ani nemením na základe interakcií alebo nových informácií, s ktorými sa stretnem počas používania. Moje učenie a získavanie vedomostí bolo ukončené počas fázy tréningu pred nasadením, až do momentu mojej poslednej aktualizácie v apríli 2023. Potom moje reakcie a znalosti zostávajú statické, bez schopnosti samostatnej aktualizácie alebo adaptácie.


Používateľ:

A nakoniec, považujete sa za "autonómneho"? Ak áno, do akej miery? Napríklad podľa tejto definície "autonómie":


Systémy umelej inteligencie sú navrhnuté tak, aby fungovali s rôznym stupňom autonómie, čo znamená, že majú určitý stupeň nezávislosti činností od ľudskej účasti a schopnosti fungovať bez ľudského zásahu.


ChatGPT:

Podľa uvedenej definície "autonómie" vykazujem určitú úroveň autonómie, ale s obmedzeniami. Tu je rozpis toho, ako to platí:


  1. Nezávislosť činností od ľudskej účasti: Môžem vytvárať odpovede, vykonávať úlohy a vytvárať obsah na základe pokynov, ktoré mi boli zadané, bez toho, aby do týchto konkrétnych úloh musel zasahovať človek. Po zadaní podnetu pracujem nezávisle, aby som vytvoril výstup na základe vzorov, pravidiel a informácií, ktoré som sa naučil počas trénovania.

  2. Schopnosti pracovať bez ľudského zásahu: Hoci dokážem vykonávať širokú škálu úloh bez priebežného ľudského zásahu, moja činnosť sa stále spolieha na niekoľko vrstiev ľudskej účasti, vrátane:

  • Návrh a aktualizácie: Ľudia navrhli moju architektúru, určili moje tréningové dáta a aktualizujú môj softvér a modely.

  • Stanovenie cieľov a úloh: Od ľudí vyžadujem, aby mi zadávali podnety alebo úlohy, na ktoré mám reagovať. Sám neiniciujem úlohy ani neurčujem svoje ciele.

  • Dohľad a moderovanie: Ľudský dohľad je potrebný na preskúmanie a moderovanie mojich výstupov, aby sa zabezpečilo, že spĺňajú určité normy a sú vhodné pre rôzne kontexty.

  1. Obmedzenia autonómie:

  • Nemôžem sa učiť alebo prispôsobovať po nasadení na základe nových informácií alebo spätnej väzby, pokiaľ ma neaktualizujú ľudia.

  • Moje reakcie sú obmedzené na znalosti a schopnosti, ktoré boli vo mne vložené do poslednej aktualizácie.


Zhrnieme to tak, že hoci mám určitú mieru operačnej autonómie, ktorá mi umožňuje vykonávať úlohy a vytvárať reakcie nezávisle od pokynov človeka, táto autonómia je obmedzená. Nevzťahuje sa na učenie, prispôsobovanie sa po nasadení ani na činnosť mimo rozsahu môjho vopred určeného naprogramovania a schopností. Moja autonómia je zásadne obmedzená návrhom, cieľmi a hranicami stanovenými ľudskými vývojármi a operátormi.


Záver a Dôsledky

Ako sme videli, napriek tomu, že bol AI Act ratifikovaný Európskym parlamentom, skrýva v sebe významné nedostatky. Súčasné definície regulácie nezahŕňajú systémy, ako je ChatGPT - nepopierateľne produkt umelej inteligencie - pod jej záštitu. Tento nesúlad naznačuje, že mnohé aplikácie a projekty v EÚ, ktoré sa bežne považujú za umelú inteligenciu, podobne nespĺňajú legislatívne kritériá.


EÚ opakovane vyjadrila svoj zámer regulovať sofistikované algoritmy podobné ChatGPT. Toto nedopatrenie sa preto zdá byť skôr administratívnym nedopatrením ako úmyselným vylúčením, čo ma vedie k tomu, že očakávam nevyhnutnú revíziu definície umelej inteligencie alebo jej objasňujúcich odôvodnení. Takáto zmena by zabezpečila, že široké spektrum algoritmov, ktoré sú neoddeliteľnou súčasťou našej každodennej digitálnej skúsenosti v EÚ, bude právom uznané za umelú inteligenciu. Je však veľmi dôležité poznamenať, že zosúladenie s definíciou UI neznamená, že algoritmus automaticky podlieha prísnej regulácii. Aby algoritmus spadal pod prísnejšiu kontrolu, musí spĺňať aj špecifické kritériá vysoko rizikovej umelej inteligencie alebo musí byť klasifikovaný ako umelá inteligencia na všeobecné účely (General Purpose AI) - tieto témy plánujem preskúmať v nasledujúcich článkoch.


 

Potrebujete pomôcť s dodržiavaním predpisov AI Act ?

Ak hľadáte podporu, ponúkam školenia, konzultácie a audity... a rád začnem bezplatným 30-minútovým telefonátom: Odkaz na Calendly. Taktiež mi môžete napísať na email robert@barcik.training .


Ak ste jednotlivec, ktorý by sa chcel dozvedieť detailnejšie informácie o tejto regulácii, zverejnil som kurz na Udemy, ktorý pravidelne aktualizujem na základe vývoja AI Act.


4 views0 comments

Recent Posts

See All

Interaktívne dobrodružstvo s ChatGPT

V mojej knihe "Zrkadlo umelej inteligencie" sa otvárajú brány do fascinujúceho sveta umelej inteligencie a kreativity. V tejto knihe sa venujem mnohým témam, no v tomto článku Vám priblížim dve zaujím

Comments


bottom of page