Tvrdý úder v studenej technologickej vojne? Číňania spôsobili paniku, bublina AI praská

Lacný DeepSeek konkuruje slávnemu ChatGPT.

Akcie veľkých technologických gigantov ťažili v uplynulom roku z horúčky okolo umelej inteligencie (AI). OpenAI, Alphabet, Anthropic či Meta investovali miliardy dolárov, aby ich modely takzvanej generatívnej AI ako ChatGPT, Gemini, Claude či LLaMA boli čo najpresnejšie a najvýkonnejšie.

Lídrom v oblasti AI sú Spojené štáty, ktoré majú náskok vo vývoji a obrovský kapitál od investorov. Aby si náskok udržali, vstúpili do obchodnej vojny s Čínou. Jej súčasťou je obmedzenie exportu najpokročilejších čipov a zariadení na ich výrobu.

Zdá sa však, že Čína si poradila aj bez polovodičov z USA a z rukáva vytiahla eso, s ktorým nik vážnejšie nepočítal.

Startup DeepSeek minulý týždeň predstavil jazykový model R1. Jeho nezávislé testovanie cez víkend odhalilo, že je nielen lacnejší, lebo používa menej výkonné čipy s nižším nárokom na energiu, ale výkonom je porovnateľný s ChatGPT od OpenAI.

V reakcii na „ChatGPT z Temu“ (čo je odkaz na lacný čínsky e-shop) zažili burzy v pondelok tvrdý pád. Technologický index Nasdaq ešte pred začiatkom obchodovania klesol o viac ako štyri percentá.

Straty pocítili akcie všetkých polovodičových a technologických firiem v Európe a USA. Nvidia spadla o 15 percent, holandský výrobca strojov na výrobu polovodičov ASML o viac ako sedem percent, výrobca čipov TSMC o 13 percent. Ide do značnej miery o unáhlenú reakciu trhu a víťazom AI bitky aj tak môžu byť veľké americké technologické spoločnosti.

Súvisiaci článok Súvisiaci článok Lovec podvodníkov zarábal milióny, no trh ho zničil. Nad mániou nedokázal vyhrať Čítajte

Priepasť v nákladoch

V pondelok bol DeepSeek najsťahovanejšou aplikáciou v americkom AppStore. Okrem toho, formou otvoreného zdrojového kódu (open source) je otvorený aj pre nezávislých vývojárov z celého sveta, čo môže prispieť k ďalšiemu rozmachu čínskej AI technológie.

Pôvodne sa predpokladalo, že pre embargo na export najvýkonnejších čipov bude Čína musieť investovať miliardy do budovania klastrov s menej výkonnými čipmi, ktoré sa použijú na trénovanie veľkých jazykových modelov.

DeepSeek však zrejme ukázal, že sa to dá dosiahnuť aj inak. Podľa denníka The Wall Street Journal si vývoj modelu R1 vyžiadal len 5,6 milióna dolárov. Magazín Wired zasa tvrdí, že na jeho vytrénovanie bolo použitých desaťtisíc starších čipov od Nvidie, ktoré nepodliehajú sankciám (vzhľadom na sankcie USA Čína nemôže dovážať čipy H100 od Nvidie a namiesto toho dováža čipy H800, ktoré majú nižšiu rýchlosť prenosu dát, pozn. red.).

Ak by bola pravda, že DeepSeek vyvinul model pri takých nízkych nákladoch, v očiach investorov amerických technologických firiem by to spochybnilo oprávnenosť vysokých výdavkov, ktoré sypú do vývoja AI.

DeepSeek by mohol narušiť dominanciu amerických firiem v oblasti AI. A to v čase, keď sa predbiehajú v tom, kto do nej investuje väčší balík peňazí.

Šéf spoločnosti Antropic Dario Amodei, ktorá vyvíja umelú inteligenciu s názvom Claude, nedávno upozornil, že ich náklady na AI sa minulý rok hýbali medzi stovkou miliónov až jednou miliardou dolárov.

Meta (Facebook) pred pár dňami vyhlásila, že v tomto roku do vývoja AI investuje 60 až 65 miliárd dolárov. Microsoft plánuje zasa v tomto roku vynaložiť 80 miliárd dolárov na rozšírenie dátových centier pre AI.

Minulý týždeň americký prezident Donald Trump predstavil projekt s názvom Stargate (Hviezdna brána), v rámci ktorého by mali firmy investovať 500 miliárd dolárov do infraštruktúry pre AI.

Zakladateľmi Stargatu, ktorý podľa Trumpa vytvorí v USA stotisíc pracovných miest, sú spoločnosti OpenAI (investorom v nej je Microsoft), SoftBank a Oracle.

Prebehli aj Muska

Ešte pred R1 predstavil DeepSeek v decembri svoj druhý jazykový model V3, ale veľa mediálnej vody nenamútil.

Zaujímavosťou bolo, že používateľom, ktorí si ho nainštalovali, odmietal odpovedať na citlivé politické otázky o Číne a jej vodcovi Si Ťin-pchingovi. Miestami poskytoval odpovede v súlade s oficiálnou propagandou Pekingu a nezohľadnil hlasy kritikov, ako to robí ChatGPT.

Napriek tomu sa oba modely dostali do top desiatky platformy vedcov z Kalifornskej univerzity Chatbot Arena. Modely Googlu (Gemini) skončili na prvom a druhom mieste, na treťom mieste sa umiestnil ChatGPT.

DeepSeek R1 je na štvrtom mieste, keď porazil model Claude od Antropicu a Grok od spoločnosti xAI Elona Muska. Celý report zverejnila čínska firma na portáli Github. Podľa neho prekonala konkurenciu v matematiky a kódovacích schopnostiach.

Nechcený dôsledok

Za firmou DeepSeek stojí čínsky hedžový fond High-Flyer, ktorý spravuje aktíva v objeme osem miliárd dolárov. Zaoberá sa algoritmickým obchodovaním prostredníctvom výkonných počítačov. Vývoj AI modelu je bokovka, ktorú financuje zo ziskov.

„Keď sa ľudia rozhodujú o investíciách, je to umenie. Keď robia takéto rozhodnutia počítačové programy, je to veda a má to optimálne riešenie,“ povedal šéf fondu Liang Wenfeng v roku 2019.

Jazykový model DeepSeeku je pre bežných používateľov bezplatný. Príjmy mu prichádzajú od firiem, ktoré ho využívajú vo svojich aplikáciách, napríklad ako základ chatbotu na zodpovedanie otázok zákazníkov. Poplatok za využitie modelu je oproti konkurencii výrazne nižší.

DeepSeek využíva aj startup Great Eastern so sídlom v Silicon Valley. Jeho generatívnu AI používa na predikciu výnosov na finančných trhoch. Zakladateľ firmy Anthony Poo pre WSJ povedal, že prechodom z modelu Claude od Anthropicu na DeepSeek ušetril 75 percent nákladov.

Dá sa povedať, že jazykový model DeepSeeku je nechceným dôsledkom studenej technologickej vojny. Číňania boli pre embargo nútení využiť lacnejšie technológie.

Výsledkom je technológia DeepSeekMoESparse, ktorá sa zameriava na efektívne spracovanie dát pomocou metód strojového učenia. Snaží sa minimalizovať množstvo aktívnych parametrov v modeli, čím znižuje výpočtové nároky a zvyšuje rýchlosť spracovania.

Ak by bol DeepSeek skutočne prelomový, ako to tvrdí čínsky manažment, ide o dvojsečnú zbraň. Víťazom AI horúčky by mohli byť paradoxne znova veľké technologické firmy, ako je Alphabet, OpenAI či Meta, ktoré by mohli čínsky open source z DeepSeeku zapracovať do vlastných modelov. Výsledkom by vyšší výkon vo vlastných jazykových modeloch a nižšie investičné náklady do AI.

Na druhej strane by zrejme škody utrpeli firmy, ktoré z AI investícií big techu ťažili najviac – ide najmä o Nvidiu, ASML či TSMC. Energeticky úspornejšie modely by si nevyžadovali miliardy do nákupov stále výkonnejších GPU polovodičov. Uškodiť to môže aj viacerým energetickým spoločnostiam, ktoré za ostatný rok vyrástli na vlne AI. Firma Vistra Energy odpísala v pondelok 27 percent, v Európe zasa padli akcie Siemens Energy o 20 percent.

Čínsky DeepSeek však pre Nvidiu či Vistru Energy môže priniesť paradoxne aj opačný efekt. Hovoríme o takzvanom rebound efekte. Tento fenomén nastáva, keď zlepšenie efektívnosti technológie vedie k nižším nákladom na jej používanie, čo následne motivuje používateľov k častejšiemu alebo intenzívnejšiemu používaniu tejto technológie, čím sa nakoniec môže zvýšiť celková spotreba energie alebo čipov.