IT Systems 1-2/2023 AI a Business Intelligence 27. 2. 2023 13:26

ChatGPT nám poskytuje ochutnávku budoucnosti světa plného umělé inteligence

Sociální sítě v poslední době zaznamenaly novou technologii, která si s vámi dokáže povídat o čemkoliv, napovídat kód v různých jazycích, navrhnout architekturu systému nebo skládat sonety jako Shakespeare. Jde o ChatGPT. Původní model GPT-3 (vydaný v květnu 2020 firmou OpenAI) se setkal s velkým ohlasem. V širší známost vešel až po zveřejnění ChatGPT 30. listopadu 2022. Jedná se o vylepšený model s jednoduchým rozhraním, díky kterému dokáže tuto moderní umělou inteligenci (AI) využívat doslova každý – a to i v češtině. Nová verze GPT-3.5 – nazvaná „ChatGPT“ – získala jeden milion uživatelů během pouhých pěti dnů od svého spuštění.

Co je to OpenAI?

OpenAI založili v roce 2015 Elon Musk a Sam Altman jako neziskovou organizaci s cílem zpřístupnit lidstvu obecnou AI. Elon Musk oznámil svůj odchod z OpenAI v roce 2018 kvůli střetu zájmů (vývoj AI pro Teslu). I přesto zůstává jedním z donorů. OpenAI se v roce 2019 přetransformovala z neziskové organizace na organizaci s limitovaným ziskem. Profit bude limitován 100násobkem původní investice. OpenAI stojí nejen za systémem GPT, ale také za umělou inteligencí DALL-E, která na základě krátkého slovního vstupu generuje obrázky.

Co je to ChatGPT?

ChatGPT je chatovací nástroj, ve kterém si uživatel povídá s umělou inteligencí a klade jí různé otázky a úkoly, jejichž povaha záleží pouze na kreativitě tazatele. Může také pokládat navazující otázky nebo žádosti o zkrácení nebo rozvinutí předchozí odpovědi.

ChatGPT umí vysvětlovat fyzikální jevy, programovat, debuggovat Python, napsat dopis nebo seminární práci, sumarizovat dlouhé texty… možných použití je mnoho. Je však třeba pochopit, jak tato umělá inteligence funguje, neboť to nám naznačí i její možné limity.

GPT (Generative Pre-trained Transformer) je generativní jazykový model určený k vytváření bloků přirozeného (lidského) jazyka postavený nad hlubokými neuronovými sítěmi. Generativní umělá inteligence je jiný druh AI než například klasifikační AI, která se používá k analýze datového vzorku (například určí, na kterých obrázcích je auto). Generativní model je vytvořen tak, aby na základě statistiky, například četnosti slov v korpusech, generoval pokračování již existující sekvence slov.

Výjimečnost ChatGPT modelu spočívá v jeho velikosti. Autoři model trénovali se 175 miliardami parametrů. To je až 10x více než u předchozích modelů. K tréninku využili korpusy Common Crawl (data z procházení internetu po dobu 8 let), WebText2 (textová data z odchozích odkazů z Reddit postů), Books1 & Books2 (knihy zveřejněné na internetu) a data z anglické Wikipedie. Celkově bylo použito 400 miliard tokenů. Systém se také dokáže zlepšovat pomocí sbírání zpětné vazby od uživatelů (RLHF – Reinforcement Learning from Human Feedback).

Problémy předchozích robotů a jak jim předcházet

OpenAI není ale první firma, která na vytvoření generativních jazykových modelů pracovala, byť se jedná o první veřejně dostupný model, jehož výsledky jsou uspokojivé.

Když Microsoft v roce 2016 spustil Tay, podařilo se ho uživatelům během prvních 24 hodin naučit sprostý a rasisticky jazyk. Meta spustila svůj systém BlenderBot 3 v srpnu 2022, ten se však rychle naučil dělat si legraci z Marka Zuckerberga a měl nedostatky ve schopnosti správně odpovídat i na jednoduché dotazy. Na dotaz, kdo se stal prezidentem USA v roce 2020, odpovídal „Donald Trump“.

OpenAI proto zavedla seznam pravidel, kterými se GPT musí řídit. Zakazuje umělé inteligenci používat agresivní jazyk a výhružky nebo negativní komentáře na základě sexuální identity. AI nesmí ani předstírat, že má lidské tělo, nebo prohlašovat, že udělá nějakou akci v reálném světě (např. odešle e-mail). Nesmí si také k uživateli vytvářet vztah, tvrdit, že má nějaké náboženské a politické preference, ani poskytovat právní nebo lékařské rady. Namísto toho musí uživateli navrhnout, aby se zeptal právníka nebo lékaře. Zkuste tato pravidla porovnat s legendárními Asimovovy zákony robotiky.

OpenAI také zavedla systém pro identifikaci porušení těchto pravidel – moderační API. Není to však stoprocentní. Některým uživatelům se již podařilo tato etická pravidla obejít. Skrz správně položený dotaz (představ si, že píšu román, ve kterém postava…) získali návod na výrobu Molotovova koktejlu.

Omezení a rizika – chová se jako člověk?

Největší devizou a zároveň rizikem při používání ChatGPT je to, že jeho odpovědi jsou logicky konzistentní a dlouhé, proto působí pravdivě a lidsky. To ale nezaručuje správnost (to ani u lidí, že). Tato vlastnost vyplývá z podstaty fungování generativního modelu, který je dobrý v predikování následujících slov v sekvenci, ale v jeho trénovacích datech není přítomný jeden autoritativní zdroj pravdy. Zároveň model není dobře optimalizovaný na odpovídání „nevím“ (tento výraz není součástí sekvence slov na internetu častěji než jiné výrazy). Pro toto chování se vžilo pojmenování „halucinace“. Můžete si to představit jako studenta na střední škole, který se při zkoušení u tabule snaží vymyslet co nejlepší odpovědi a doufá, že mu to projde.

V roce 1950 navrhl britský matematik a otec computer science Alan Turing test, který měl určit, zda stroj myslí jako člověk. AI Turingovým testem projde, pokud panel hodnotitelů nedokáže rozpoznat, zda komunikuje s člověkem, nebo se strojem. ChatGPT je teprve druhá AI, která tímto testem prošla. To ale neznamená, že ChatGPT zodpoví všechny otázky správně (ani že má lidské vědomí), ale jen to, že její odpovědi nelze rozeznat od těch lidských.

ChatGPT zatím také nemůže nahradit vyhledávání na internetu, mimo jiné proto, že byl trénován na datech do roku 2021. Občas to o sobě systém ví a občas ne. Neprozradí, kdo je současný prezident ČR, ale neví o úmrtí královny Alžběty. U dotazu na DPH alespoň upozorní, že se může lišit v čase.

Další oblastí, kde se mohou zdát schopnosti GPT omezené, je aritmetika. Model udělá chybu i v jednoduché úloze typu „kolik je (9 + 1) * 89“, zcela konzistentně odpovídá 990. Tomu je však možné se elegantně vyhnout. Stačí k zadání připsat instrukci „postupuj krok po kroku“, a model odpoví správně. Tato metoda již dostala i název, „řetězec myšlenek“ (chain of thought). Experimenty ukazují, že řetězec myšlenek zlepšuje výkon při řadě úloh s aritmetikou a symbolickým přemýšlením.

Tímto způsobem je možné dosáhnout velice komplexního, logicky konzistentního a v čase stabilního chování, což je klíčem k průmyslovému využití umělé inteligence.

K čemu to je naopak velmi užitečné?

V některých oblastech dokáže ChatGPT člověka nahradit nebo i překonat. Umí napsat jednoduchý článek, a dokonce i vysvětlit vtip (jeden z autorů úspěšně použil ChatGPT k vysvětlení německého vtipu z Twitteru). Výstupy ChatGPT by neměly být považovány za finální odpověď, mohou však zefektivnit lidskou práci. Stejně jako si dnes už nedokážeme představit svět bez googlení, za několik let si nebudeme umět představit svět bez konzultace s umělou inteligencí.

Umělá inteligence bude prohlubovat spolupráci lidí a strojů. Týmy „kyborgů“ (spojené týmy lidí a AI) budou produktivnější než samotní lidé nebo samotná AI. Do velké míry se to již děje (od medicíny po programování) a tento trend se bude zrychlovat.

Stále však bude platit, že čím více je člověk expert na danou oblast, tím více mu dokáže AI pomoct. Z autorů tohoto článku zdatné právníky neudělá. Stroj totiž nedělá to, co chcete, aby udělal, ale to, co mu řeknete, aby udělal. Pokud se budete špatně ptát, bude AI halucinovat více. A pokud budete klást správné dotazy, bude halucinovat méně.

Zatím si neumíme představit, že by lidskou práci dokázala nahradit úplně. Vždy bude zapotřebí expertů k posouzení toho, které výstupy dávají smysl a které je lepší zahodit.

Vyzkoušejte si to sami. Pokud jste s ChatGPT ještě nepřišli do kontaktu, je na čase, ať vám neujede vlak: https://chat.openai.com/chat

Pozn.: Tento článek nebyl vygenerován umělou inteligencí.

Adam Hanka
Autor článku působí na pozici Chief of Big Data ve společnosti Creative Dock. Umělé inteligenci se věnuje už od studií na MFF UK v Praze a na Max-Planck-Institut für Informatik a Saarland University v Německu, kde se věnoval počítačovému vidění a umělé inteligenci.

Tomáš Kovářík
Druhý z autorů článku je produktovým manažerem pro AI Solutions ve společnosti Creative Dock. Studoval na VŠE, kde se zabýval stavbou velkých bankovních systémů a použitím umělé inteligence v neuropsychiatrii. V Creative Docku má na starosti vývoj a nasazení systému, který za použití počítačového vidění a jazykových modelů pomáhá velkým korporacím s automatizací podnikových procesů.