Fakta, mýty a spekulace o DeepSeek
Pro využívání ve firmách je DeepSeek hodně rizikový
Pokud si dnes otevřete libovolnou sociální síť, je téměř nemožné přehlédnout diskuse o nové čínské umělé inteligenci, přesněji o velkém jazykovém modelu DeepSeek. A podobně jako u jakéhokoliv jiného tématu obíhá internetovým éterem o DeepSeek spousta mýtů, polopravd a spekulací. Pojďme si je rozebrat.
Fakta
DeepSeek je velmi schopný LLM (velký jazykový model), i když jeho výsledky se velmi liší v závislosti na způsobu použití. DeepSeek umí přemýšlet podobně jako modely o1 a o3 od OpenAI. Je přitom sdílnější, co se popisu přemýšlení týče. Pro jeho výstupy je charakteristická velká míra detailů a skoro až „roztomilost“.
DeepSeek je minimálně zčásti otevřený (open source), což zavdalo ke vtipům na vrub modelu OpenAI, který už má otevřenost spíše jen v názvu. DeepSeek existuje v několika verzích, které se liší jednak velikostí a jednak také podkladovým modelem – jde o tzv. distilled modely postavené nad modely Llama od Mety a Qwen od Alibaby.
DeepSeek je velmi levný, ve webovém rozhraní dokonce zdarma, k tématu ceny se nicméně dostaneme dále. A soukromí rozhodně není silnou stránkou DeepSeeku, respektive je to něco na způsob přímé linky mezi uživatelem a ústředím Komunistické strany Číny.
Jedna spekulace a dvě polopravdy
DeepSeek sám je možná distilled verzí GPT. Cena jeho vytvoření (v jednotkách milionů USD) možná nepokrývá celý proces, ale pouze jeho finální část. Potvrzené ovšem tohle tvrzení zatím není. Co je oproti tomu v mnoha komentářích k DeepSeeku zcela, nebo alespoň částečně špatně, jsou následující tvrzení:
1. Jedná se o tzv. ChatGPT killer. Pokud ho budeme brát jako zhruba tisící položku na seznamu těchto killerů, tak nepochybně ano. Funkčně? Spíš ne. Z bezpečnostního hlediska, resp. pro uživatele, pro které je určitá míra ochrany informací důležitá? Určitě ne.
2. Bezpečnost se dá zaručit tím, že si model spustíte lokálně. Ano, tím se soukromí víceméně zaručí, nicméně pokud doma nemáte sestavu grafických karet s celkovou VRAM kolem 500 GB, pak budete na jednu odpověď čekat opravdu velice dlouho. nebo musíte provozovat „zmenšenou“ verzi s nižší počtem parametrů, některou z quantized verzí a nebo nějakou z distilled verzí. V obou případech ovšem dostanete výrazně hloupější model. Obejít se to samozřejmě dá i hrubou výpočetní silou, kdy si pronajmete GPU v cloudu od některého z mnoha poskytovatelů, využijete jej v prostředí Azure, anebo jej vyzkoušíte v Poe či Perplexity. Nebude to ale zadarmo.
Čím nás DeepSeek překvapil?
Určitě tím, že jeden model z Číny dokázal vymazat 20 % hodnoty společnosti Nvidia a mnoha dalších firem spojených s AI. Vzhledem k tomu, že za DeepSeekem je společnost zabývající se tradingem, otevírá to takřka nekonečný prostor konspiračním teoriím. Zároveň to ukazuje bohužel asi i neznalost na straně investorů. Celý DeepSeek byl vytrénován na Nvidia kartách, používá Nvidia karty, a i kdyby se objevil princip, který výrazně zjednoduší a tím i zlevní provoz AI na těchto grafických kartách, bude karet potřeba možná i více (viz pasáž o lokální instalaci modelu kvůli bezpečnosti).
Překvapivé bohužel není, jak aplikace DeepSeek dokázala zválcoval App Store, kde se velmi rychle stala nejstahovanější aplikací. Tím se jen potvrzuje, že uživatele absolutně nezajímá ani bezpečnost, ani soukromí, ani původ aplikace. (Pozn. red.: Hlavně, že máme GDPR a na každém webu se prokousáváme souhlasem s používáním cookies).
Na školeních proto vždy opakuji: nenaskakujte na každou novou cool AI aplikaci a už vůbec ne, pokud je zdarma. A budu to dělat dál, protože „žádný oběd není zdarma“.
Odkud vítr vane
Čína udělala to, co Čína dělá. Pokud se potvrdí spekulace o distilled verzi GPT modelu, tak si zkrátka trošku přiohnula pravidla ve svůj prospěch. Nicméně zde jsme trochu v rovině „zloděj křičí chyťte zloděje“, protože jen bůh a OpenAI ví, kde se vzala původní tréninková data pro GPT modely.
Spekuluje se také o vládní subvenci ze strany Číny pro snížení ceny DeepSeeku a jisté formě dumpingu,což zde bude těžké potvrdit či vyvrátit, ale faktem je, že subvence jsou jednou z praktik, které Čína používá v různých odvětvích, tak proč ne v IT.
Jak se k tomu postavit?
Pokud si chcete DeepSeek vyzkoušet pro zábavu či osobní potřebu, vyzkoušejte ho. Bude vám odpovídat podobně, jako by vám odpovídalo ChatGPT, ovšem ovlivněné cenzurou a jiným pohledem na uspořádání světa. Jistě, ani ChatGPT a další nástroje/modely vám neřeknou všechno a trpí jistou formou cenzury, ale ta čínská je pochopitelně jiná. Pokud tedy potřebujete materiál pro příspěvek na Linkedin, abyste byli in, vyzkoušejte ho. Pokud ale budete mít nutkání do jeho originální verze na čínských serverech nahrát nějaké firemní soubory, NEDĚLEJTE TO! Pokud jste majitel či ředitel firmy, která dbá na elementární bezpečnost dat, zakažte ho pro jakékoli firemní použití. Své kolegy a zaměstnance tím o žádnou revoluci nepřipravíte.
Pokud potřebujete snížit náklady na AI, počkejte. Jedna věc totiž bude na DeepSeek pozitivní. Konkurence, a to i čínská, umí vyburcovat ostatní, od kterých tak očekávám pokles cen, nebo nové funkce. Například OpenAI už v posledních dnech zařadilo vyšší rychlosti stupeň a i díky DeepSeeku teď máme v ChatGPT k dispozici první vlaštovky z rodiny modelů o3 a k tomu Deep research funkci, která sice existovala už dříve u jiných poskytovatelů AI, ale její implementace v ChatGPT je jednoduše skvělá. Pokud tedy máte Pro předplatné za 200 USD/měsíc. Ale je na cestě i do levnějších variant.
Co bude dál?
Závěrem si dovolím předpovědět, že z hlediska využití umělé inteligence ve firemním sektoru se uvedením DeepSeek zatím nic zásadního nemění. Nezatracujte své oblíbené modely (ChatGPT, Claude, Gemini...) a soustřeďte se především na to, jak AI ve vaší firmě co nejlépe využít.
Autor článku je lektor a konzultant Počítačové školy Gopas. Článek byl redakčně stylisticky upraven.