DeepSeek: Co je chatbot, o kterém mluví celý svět? Budíček pro americké technologické firmy i šance na snížení nákladů AI
Aplikace se v App Store objevila 20. ledna a brzy si získala pozornost celého světa. To, co dělá DeepSeek výjimečným, je tvrzení společnosti, že se téměř vyrovná svým mnohem slavnějším konkurentům, jako je ChatGPT-4 od OpenAI, ale za zlomek ceny, protože používá méně pokročilých čipů. Prohlášení způsobilo, že Nvidie – přední americký výrobce čipů – v pondělí odepisovala téměř 600 miliard dolarů (14 bilionů korun) ze své tržní hodnoty, což je největší jednodenní ztráta v historii USA.
Co je DeepSeek?
DeepSeek je chatbot s umělou inteligencí, který funguje podobně jako například Gemini od Googlu. Jedná se o bezplatnou aplikaci, kterou lze stáhnout v App Store. DeepSeek uvádí, že je navržen tak, aby „efektivně odpovídal na vaše otázky a zlepšoval váš život“. Model umělé inteligence, který chatovacího robota pohání se nazývá R1. V matematice, kódování a uvažování je údajně stejně výkonný jako model O1 společnosti OpenAI, díky kterému funguje ChatGPT.
Jaké má chatbot nedostatky?
Stejně jako ostatní čínské modely umělé inteligence se DeepSeek sám cenzuruje v tématech, která jsou v Číně považována za citlivá. Odráží dotazy týkající se protestů na náměstí Nebeského klidu v roce 1989 nebo geopoliticky závažných otázek, jako je možnost invaze Číny na Tchaj-wan. Je také schopen poskytnout podrobné odpovědi o politických osobnostech, jako je indický premiér Naréndra Módí, ale odmítá tak učinit v případě čínského prezidenta Si Ťin-pchinga. Čínská vládní cenzura byla považována za velkou výzvu pro vývoj AI. Zdá se však, že DeepSeek byl vycvičen na modelu s otevřeným zdrojovým kódem, což mu umožňuje provádět složité úkoly a zároveň zatajovat určité informace.
Cloudovou infrastrukturu DeepSeeku pravděpodobně prověří jeho náhlá popularita. Společnost v pondělí krátce zažila velký výpadek poté, co se chatbot údajně stal terčem kybernetického útoku. Dočasně proto omezila registrace nových uživatelů.
Jak se DeepSeek liší od ostatních modelů?
Chatbot používá jiný druh vnitřní architektury, která vyžaduje menší využití paměti, čímž výrazně snižuje výpočetní náklady na každé vyhledávání nebo interakci. Zdá se, že při zlomku výpočetního výkonu dosahuje výsledků srovnatelných s konkurencí. Aplikace se od ostatních chatbotů, jako je ChatGPT, navíc odlišuje tím, že před poskytnutím odpovědi na výzvu formuluje své úvahy.
Kolik stál vývoj chatovacího robota?
Společnost DeepSeek uvedla, že vývoj modelu zabral dva měsíce a vyšel na necelých 6 milionů dolarů (přes 144 milionů korun), i když někteří experti upozorňují, že je to pravděpodobně podhodnocený údaj. Společnost vyvíjí modely AI, které jsou open-source, což znamená, že široká komunita vývojářů může software kontrolovat a vylepšovat.
VIDEO: S cihlou zlata se vyfotíte líp, než s bitcoinem. ČNB to dělá pro PR, ze stejného důvodu by měla nakoupit krypto, řekl ekonom Krištoufek pořadu FLOW
FLOW: S cihlou zlata se vyfotíte líp, než s bitcoinem. ČNB to dělá pro PR, ze stejného důvodu by měla nakoupit krypto, říká oceněný ekonom Krištoufek • e15
V porovnání s miliardami, které vynakládají na vývoj svých modelů firmy zabývající se umělou inteligencí v USA, se jedná velmi nízký rozpočet. Zatím není zcela jasné, jak se to DeepSeeku povedlo. Zakladatel společnosti si údajně vytvořil zásobu čipů Nvidia A100, jejichž vývoz do Číny je od září 2022 zakázán. Odborníci se domnívají, že tato sbírka – která podle některých odhadů čítá až 50 tisíc kusů – ho vedla k vytvoření výkonného modelu umělé inteligence, a to tak, že tyto čipy spojil s levnějšími, méně sofistikovanými, popsala BBC.
Kdo stojí za společností DeepSeek?
Start-up se sídlem v Chang-čou založil v roce 2023 Liang Wen-feng a hned následující rok představil svůj první velký jazykový model. O Liangovi, který vystudoval Čeťiangskou univerziu, kde získal tituly z elektronického inženýrství a informatiky, se toho ví jen málo. Liang je šéfem hedgeového fondu High-Flyer, který využívá umělou inteligenci k analýze finančních dat za účelem přijímání investičních rozhodnutí. Nedávno byl viděn na schůzce, kterou pořádal čínský premiér Li Čchiang, což odráží rostoucí význam společnosti DeepSeek v odvětví umělé inteligence.
DeepSeek v uplynulém roce vydal různé konkurenční modely AI, které upoutaly pozornost průmyslu. Model V3 vzbudil určité povědomí o společnosti, ačkoli jeho obsahová omezení týkající se citlivých témat o čínské vládě a jejím vedení vyvolala pochybnosti o jeho životaschopnosti jako konkurenta, uvedl The Wall Street Journal (WSJ). To změnilo odhalení modelu R1 a nízkých nákladů na jeho vývoj.
Jak DeepSeek zasáhl technologický sektor?
Úspěch chatovacího robota podkopal přesvědčení, že větší rozpočty a špičkové čipy jsou jedinou cestou k pokroku v oblasti umělé inteligence. „DeepSeek dokázal, že špičkové modely AI lze vyvíjet s omezenými výpočetními zdroji,“ řekla BBC Wei Sun, hlavní analytička ve společnosti Counterpoint Research. „Naproti tomu společnost OpenAI, jejíž hodnota je 157 miliard dolarů, je pod drobnohledem, zda si dokáže udržet dominantní náskok v oblasti inovací nebo zda dokáže ospravedlnit své obrovské ocenění a výdaje, aniž by přinesla významné zisky,” dodala.
Nižší náklady společnosti rozbouřily v pondělí finanční trhy, což vedlo k poklesu indexu Nasdaq Composite, v němž je zastoupeno mnoho firem z odvětví vyspělých technologií, o více než tři procenta. Nejvíc vykrvácela Nvidia, cena jejích akcií se v průběhu dne propadla o 17 procent. Výrobce čipů byl podle tržní kapitalizace nejhodnotnější společností na světě, ale v pondělí se spadl na třetí místo za Apple a Microsoft, když se jeho tržní hodnota snížila z 3,5 bilionu dolarů na 2,9 bilionu dolarů. Dění na trzích stáhlo dolů i bitcoin a další kryptoměny.
Americké technologické společnosti nedávno přislíbily další stovky miliard dolarů na investice do umělé inteligence – většina z nich půjde do budování výpočetní infrastruktury a energetických zdrojů. AI je energeticky náročná a nákladná technologie – natolik, že nejmocnější američtí technologičtí lídři skupují malé modulární reaktory, aby mohli svým modelům dodávat potřebnou elektřinu.
Společnost Meta minulý týden uvedla, že letos utratí za vývoj AI až 65 miliard dolarů. Sam Altman, generální ředitel společnosti OpenAI, loni uvedl, že odvětví umělé inteligence bude potřebovat investice v řádu bilionů dolarů, aby podpořilo vývoj čipů, které jsou nutné k napájení datových center.
Představa, že podobných schopností, jako mají nejvýkonnější americké modely, lze dosáhnout za zlomek nákladů – a s méně výkonnými čipy – tak představuje zásadní obrat úvahách o tom, kolik investic do AI je potřeba. Pokud se podaří dosáhnout srovnatelného výkonu při výrazně nižších nákladech, otevírají se tím nové možnosti – a hrozby – pro planetu.
Co říká konkurence?
Altman v pondělí označil DeepSeek za „působivý model“, ale vzápětí dodal, že jeho společnost do budoucna zveřejní „mnohem lepší modely“. Připustil, že je „osvěžující“ mít konkurenci, ale svět podle něj „bude chtít používat HODNĚ“ umělé inteligence, a věří proto, že „více výpočetní techniky je nyní důležitější než kdykoli předtím, abychom uspěli v našem poslání“. Společnost Nvidia označila model R1 společnosti DeepSeek za „vynikající pokrok v oblasti umělé inteligence“, přestože kvůli němu vykrvácela na Wall Street.
Přední americký investor Marc Andreessen přirovnal spuštění modelu R1 ke klíčovému okamžiku vesmírných závodů mezi USA a SSSR. Napsal, že se jedná o „okamžik Sputniku“, kdy Sovětský svaz ohromil svého soupeře vypuštěním družice na oběžnou dráhu.
Co hrozí společnosti Nvidia?
Nvidia je jednou ze společností, které na boomu umělé inteligence vydělaly nejvíce. Z výrobce grafických karet pro videohry se stala dominantním výrobcem čipů pro nenasytný průmysl umělé inteligence. Technologické společnosti, které se na DeepSeek dívaly shora, nyní pravděpodobně přemýšlejí, zda skutečně potřebují tolik čipů od společnosti Nvidia.
Co průlom DeepSeeku znamená pro USA?
Spojené státy se domnívaly, že by mohly díky sankcím získat dominantní postavení v klíčovém průmyslu, o kterém věří, že pomůže posílit jejich národní bezpečnost. Pouhý týden před odchodem z funkce exprezident Joe Biden zdvojnásobil omezení vývozu počítačových čipů s umělou inteligencí, aby zabránil soupeřům, jako je Čína, v přístupu k této pokročilé technologii.
DeepSeek však tuto představu zpochybnil a ohrozil auru neporazitelnosti obklopující americký technologický průmysl. USA si omezením vývozu čipů možná získaly čas, ale jejich náskok v oblasti umělé inteligence se navzdory těmto opatřením právě dramaticky zmenšil. DeepSeek může ukázat, že vypnutí přístupu ke klíčové technologii nemusí nutně znamenat, že Spojené státy zvítězí. Nynější šéf Bílého domu Donald Trump již varoval, že průlom je „budíčkem“ pro americké firmy, které se podle něj musí soustředit na to, aby „zvítězily“.
Jak zareagovala Čína?
Vzestup DeepSeek je velkou vzpruhou pro čínskou vládu, která se snaží budovat technologie nezávislé na Západu. Zatímco komunistická strana se k průlomu zatím nevyjádřila, čínská státní média poznamenala, že giganti ze Silicon Valley a Wall Sreet „přicházejí o spánek“ kvůli DeepSeek, který rozvrátil americký akciový trh.
Je nový chatbot dobrou zprávou?
Jednou z možností je, že pokročilé schopnosti umělé inteligence by nyní mohly být dosažitelné bez obrovského množství výpočetního výkonu, mikročipů, energie a chladicí vody, které se dříve považovaly za nezbytné. Stejně jako u všech technologických průlomů pomůže čas ukázat, zda to skutečně půjde.
Vývojáři po celém světě již se softwarem DeepSeek experimentují. To by mohlo urychlit zavádění pokročilých modelů uvažování pomocí umělé inteligence – a zároveň by to mohlo vyvolat další obavy ohledně potřeby ochranných opatření při jejich používání. Pokroky společnosti DeepSeek mohou urychlit regulaci, která bude kontrolovat vývoj umělé inteligence.
Protože DeepSeek je cenově dostupnější, již sehrál roli při snižování nákladů vývojářů AI v Číně, kde se větší hráči zapojili do cenové války, v níž v posledním roce a půl docházelo k postupným vlnám snižování cen. Úspěch DeepSeek může přimět OpenAI a další americké poskytovatele, aby snížili své ceny a udrželi si tak svůj náskok.
Jeden úspěch, i když ohromující, ale nemusí stačit na to, aby vyvážil roky pokroku amerického vedení v oblasti umělé inteligence. A masivní přesun zákazníků k čínskému startupu je nepravděpodobný. Ačkoli dosažení úspory nákladů může být významné, model R1 zatím neprokázal, že zvládne některé úkoly.