Deepseek našiel spôsob, ako vytvoriť výkonnú umelú inteligenciu za menej peňazí

Článok pôvodne vyšiel v denníku Financial Times.

Čínske laboratórium umelej inteligencie DeepSeek použilo inovatívne techniky a vyvinulo model umelej inteligencie, ktorý bol vyškolený s obmedzeným ľudským vplyvom. Vďaka tomu nastal náhly moment pochopenia, ktorý by mohol zmeniť náklady vývojárov na vytváranie kľúčových aplikácií založených na tejto technológii.

Upravili modely konkurentov

Zverejnená výskumná správa o fungovaní „argumentačného“ modelu R1 spoločnosti DeepSeek odhaľuje, ako skupina pod vedením miliardára z hedžového fondu Lianga Wenfenga dosiahla výrazné výsledky odstránením úzkych miest pri vývoji umelej inteligencie.

V štúdii sa uvádza, ako spoločnosť DeepSeek využila sériu efektívnejších techník na vývoj modelu R1, ktorý podobne ako konkurenčný model o1 spoločnosti OpenAI generuje presné odpovede tým, že o svojich odpovediach „premýšľa“ krok za krokom dlhšie ako väčšina veľkých jazykových modelov.

ilustračná snímka

Prečítajte si tiež:

Prelomové výsledky DeepSeek pochádzajú z použitia „učenia formou odmeňovania“, ktoré znižuje ľudskú účasť pri vytváraní odpovedí na výzvy. Spoločnosť tiež vytvorila menšie modely s menším počtom parametrov, teda premenných používaných na trénovanie systému umelej inteligencie a formovanie jeho výstupu, s výkonnými schopnosťami uvažovania. Dosiahla to úpravou veľkých modelov vyškolených konkurentmi, ako sú Meta a Alibaba.

Je to len špička ľadovca

Toto všetko otriaslo celým Silicon Valley, pretože R1 dosahuje v niektorých úlohách lepšie výsledky ako nedávno vydané modely spoločností OpenAI, Anthropic a Meta, ale jej vývoj stál zlomok finančných prostriedkov.

V utorok spoločnosť OpenAI uviedla, že našla dôkazy o tom, že DeepSeek využil jej technológiu a použil výstupy z jej modelov na trénovanie svojich veľkých jazykových modelov s nižšími nákladmi, čo je bežná prax v prípade akademikov a slabšie financovaných začínajúcich podnikov.

ilustračná snímka

Prečítajte si tiež:

Napriek tomuto sporu odborníci uviedli, že spoločnosť DeepSeek predviedla skutočnú inováciu. Výskumníci v oblasti umelej inteligencie tiež ocenili jej ochotu zverejniť podrobnú technickú správu, v ktorej opisuje, ako vytvorila svoj model uvažovania. Laboratórium tak urobilo po prvýkrát.

„Myslím si, že je to len špička ľadovca, pokiaľ ide o typ inovácií, ktoré môžeme v týchto modeloch očakávať,“ povedal Neil Lawrence, profesor strojového učenia DeepMind na univerzite v Cambridge. „História ukazuje, že veľké firmy majú problém s inováciami, keď sa zväčšujú. Pri mnohých z týchto veľkých firiem sme videli nahrádzanie investícií do výpočtovej techniky intelektuálnou tvrdou prácou.“

Palce a moment uvedomenia

Veľké jazykové modely sa vytvárajú v dvoch fázach. Prvá sa nazýva „predtréning“. Vývojári v nej používajú obrovské súbory údajov, ktoré modelom pomáhajú predpovedať ďalšie slovo vo vete. Druhá fáza sa nazýva „post-tréning“. Prostredníctvom nej vývojári učia model postupovať podľa inštrukcií, ako je napríklad riešenie matematických úloh alebo kódovanie.

Jeden zo spôsobov, ako prinútiť chatboty generovať užitočnejšie odpovede, sa nazýva „posilňovacie učenie z ľudskej spätnej väzby“ (reinforcement learning from human feedback – RLHF), čo je technika, ktorú ako prvá zaviedla spoločnosť OpenAI na zlepšenie ChatGPT.

RLHF funguje tak, že ľudskí anotátori označujú odpovede modelu umelej inteligencie na výzvy a vyberajú odpovede, ktoré sú najlepšie. Tento krok je často prácny, drahý a časovo náročný a často si vyžaduje malú armádu ľudských označovačov údajov.

ilustračná snímka

Prečítajte si tiež:

Veľkou inováciou spoločnosti DeepSeek je automatizácia tohto záverečného kroku pomocou techniky nazývanej učenie formou odmeňovania (Reinforcement Learning – RL), pri ktorej je model umelej inteligencie odmeňovaný za to, že robí správne veci.

Spoločnosť DeepSeek najprv vyvinula výkonný prediktívny textový model s názvom V3. Potom použila RL na jeho „odmeňovanie“, napríklad tak, že mu dala palec hore za vygenerovanie správnej odpovede. Čínska spoločnosť zistila, že ak tento proces vykonala dostatočne krát, model dokázal spontánne riešiť problémy bez ľudského dohľadu.

Túto techniku použila aj spoločnosť Google DeepMind na vytvorenie systému umelej inteligencie AlphaGo, ktorý pred takmer desiatimi rokmi porazil ľudských hráčov v starobylej stolovej hre Go a odštartoval súčasný rozmach výpočtových techník hlbokého učenia.

ilustračná snímka

Prečítajte si tiež:

Spoločnosť DeepSeek uviedla, že zistila, že model mal moment náhleho uvedomenia, keď prehodnotil svoje odpovede a upravil čas spracovania na riešenie rôznych otázok.

„Tento moment slúži ako silná pripomienka potenciálu [RL] na odomknutie nových úrovní inteligencie v umelých systémoch, čím sa otvára cesta pre autonómnejšie a adaptívnejšie modely v budúcnosti,“ napísali tvorcovia DeepSeek vo svojej výskumnej správe.

Lewis Tunstall, výskumný pracovník spoločnosti Hugging Face, ktorá sa zaoberá výskumom umelej inteligencie, uviedol: „Zdá sa, že tajnou prísadou, aby to fungovalo, je mať veľmi, veľmi silný predtrénovaný model a potom mať veľmi, veľmi dobrú infraštruktúru na vykonávanie tohto procesu posilňovania učenia vo veľkom meradle.“

Malé a veľké modely

Zatiaľ čo OpenAI a Google investujú miliardy dolárov do budovania veľkých jazykových modelov, spoločnosť DeepSeek vybudovala aj menšie modely, ktoré možno spustiť v telefónoch alebo webových prehliadačoch. Dosiahla to „destiláciou“ rozumových schopností väčších modelov.

Spoločnosť DeepSeek použila svoj model R1 na vytvorenie relatívne malého súboru 800-tisíc dátových bodov a potom pomocou týchto údajov vytvorených umelou inteligenciou upravila modely vytvorené konkurentmi, ako sú Qwen spoločnosti Alibaba a Llama spoločnosti Meta.

Spoločnosť DeepSeek zistila, že tieto vydestilované modely boli obzvlášť silné pri porovnávaní argumentov, pričom v niektorých prípadoch prekonali vlajkové modely, ako napríklad Claude od spoločnosti Anthropic. „V podstate dokáže vyriešiť väčšinu matematických problémov, ktoré som riešil na bakalárskom stupni,“ povedal Tunstall.

ilustračná snímka

Prečítajte si tiež:

Tento vývoj by mohol byť prínosom pre vývojárov aplikácií, ktorí majú k dispozícii lacný a efektívny spôsob vytvárania produktov. Podľa výskumníka z think-tanku Rand Lennarta Heima je učenie modelov umelej inteligencie uvažovať počas „inferencie“, keď model generuje odpovede, oveľa efektívnejšie ako proces predtrénovania, ktorý si vyžaduje veľký výpočtový výkon.

Dodal, že táto nová paradigma by mohla umožniť konkurentom vytvoriť konkurencieschopné modely s oveľa menším výpočtovým výkonom a vynaložením omnoho menej peňazí. Avšak bez peňazí na čipy „ich jednoducho nemôžu nasadiť v rovnakom rozsahu“, povedal Heim.

Spoločnosť DeepSeek neuviedla, koľko minula na vytvorenie modelu R1, ale tvrdí, že model V3, na ktorom je R1 založený, vycvičila len za 5,6 milióna dolárov. Táto suma nezahŕňa ďalšie náklady, ako napríklad pravdepodobné obstaranie tisícov grafických procesorov na trénovanie modelu, alebo platy, experimenty, školenia a nasadenie, povedal Heim.

Ilustračná foto

Prečítajte si tiež:

A hoci spoločnosť DeepSeek ako prvá použila svoje konkrétne techniky, očakáva sa, že ju budú nasledovať aj ďalšie laboratóriá umelej inteligencie, pričom spoločnosť Hugging Face už pracuje na replikácii R1.

Americké spoločnosti zaoberajúce sa umelou inteligenciou tiež pracovali na využití schopností svojich veľkých, najmodernejších modelov v menších, svižnejších modeloch. Spoločnosť Google minulý rok uviedla na trh model Gemma, ktorý je odľahčený a vychádza z jej modelu Gemini.

„Recept na inteligenciu je celkom jednoduchý,“ hovorí spoluzakladateľ a vedecký riaditeľ spoločnosti Hugging Face Thomas Wolf, a dodáva, že techniky spoločnosti DeepSeek ostatní v tejto oblasti pochopili veľmi dobre. „A preto očakávam, že to dokáže zopakovať veľa tímov.“

Doplnkové spravodajstvo: Cristina Criddle v San Franciscu a Madhumita Murgia v Londýne.

© The Financial Times Limited 2025.Všetky práva vyhradené.Nesmie sa ďalej šíriť, kopírovať ani nijako upravovať. Za poskytnutie tohto prekladu je zodpovedný výlučne Ringier Slovakia Media. Spoločnosť Financial Times Limited nenesie žiadnu zodpovednosť za presnosť alebo kvalitu prekladu.

Celý článek zde | Podnikání za 500 Kč ? – ANO