Dat hele gedoe rond kunstmatige intelligentie is veel geblaat en gebakken lucht. De Amerikanen dachten zich tegen de concurrentie te kunnen indekken door geavanceerde apparatuur en chips niet naar China te exporteren en bedrijven elders, zoals in Nederland, dat ook te verbieden op straffe van handelsbelemmering. Nu blijken de Chinezen toch in staat te zijn geweest een ki-model te ontwikkelen (DeepSeek, dus) dat de wereld verbaasd. Daar zou door de Chinezen maar iets meer dan vijfmiljoen euro aan zijn uitgegeven.
Het ziet er naar uit dat China de Amerikaanse pochers en pokeraars in hun hemd heeft gezet met een ki-systeem dat maar een schijntje zou hebben gekost wat de Amerikaanse techbedrijven er een hebben verspild. Inmiddels is DeepSeek retepopulair op internet, maar die liefde kan ook zo weer verleden tijd zijn. Ook e-krakers, van Amerikaanse origine?, (b)lijken het op DeepSeek te hebben voorzien.
DeepSeek is ontwikkeld door een jong bedrijf in Hangzhou in het oosten van China. Je kunt met het systeem veel doen wat ook de grote taalmodellen van de Amerikaanse techbedrijven kunnen en beter. Overigens praat DeepSeek liever niet over zaken die in China moeilijk liggen.
Het systeem schrijft liedjes voor je, maar lost kennelijk ook moeilijke wiskundige problemen op en zou daarmee zijn Amerikaanse ‘concurrenten’ met vlag en wimpel verslaan. Dat zijn bereikt met heel wat bescheidener techniek dan de Amerikanen gebruiken. De Chinezen bleken die geavanceerde Amerikaanse chips niet eens nodig te hebben.
Mij(=as) doet dat me weer aan een mijn favoriete verhaal denken uit het Sovjettijdperk. De Amerikanen hadden voor ruimtevaarders een zeer geavanceerde pen ontwikkeld om de ruimtevaarders notities op het papier te laten maken (zal nu niet meer gebeuren, denk ik). Op een bijeenkomst vroegen de Amerikanen aan de Russen hoe zij dat probleem hadden opgelost. Wij gebruiken een potloodje, zeiden die.
De Russen waren met hun houtjetouwtjetechnieken ook de eersten die een man de ‘ruimte’ in schoten. DeepSeek is ook gebaseerd op een open, door eenieder te bewerken algoritme, waarbij de Amerikanen hun bedrijfsgeheime codes angstvallig voor vreemde ogen verborgen houden.
Energieverspiller?
De mijn grote vraag is of het grote taalmodel van de Chinezen ook zo’n gigantische energieverspiller is zoals die Amerikaanse modellen. Een andere grote vraag is hoe transparant het systeem is. Geeft DeepSeek aan op basis van welke overwegingen het model tot een bepaalde conclusie of uitkomst is gekomen? Dat zijn natuurlijk twee belangrijke vragen die om een antwoord schreeuwen en in ieder geval mijhet standpunt hebben doen innemen om voorlopig maar heel voorzichtig met ki te zijn.
We introduceren onze eerste generatie redeneermodellen, DeepSeek-R1-Zero en DeepSeek-R1, schrijven de modelbouwers van DeepSeek. Ze gebruikten daar een vorm van versterkt leren zonder een door mensen begeleide fijnafstemming. Het nulmodel zou goed resultaten hebben opgeleverd, maar problemen hebben gehad met leesbaarheid en vermenging van talen (DeepSeek spreekt vooralsnog alleen Chinees en Engels, heb ik begrepen).
Vervolgens hebben de ‘bouwers’ DeepSeek-R1 gemaakt, waarbij de leerfase in stappen verloopt. DeepSeek-R1 zou net zo goed presteren als OpenAI-o1-1217 bij redeneertaken. Ter ondersteuning van de onderzoeksgemeenschap, hebben we DeepSeek-R1-Zero, DeepSeek-R1 en zes dichte modellen (1,5B, 7B, 8B, 14B, 32B, 70B) toegankelijk gemaakt voor andere ki-ers.
De New York Times heeft nogal wat bedenkingen bij de beweringen van DeepSeek over kosten en gebruikte technieken, maar moet ook toegeven dat DeepSeek (en China) een opmerkelijke prestatie hebben geleverd. Diverse privacydeskundigen zouden, net als bij TikTok en Huawei, ervan uit gaan dat DeepSeek gemene zaak met de Chinese overheid maakt, die, zoals bekend, een geheel eigen opvatting over privacy heeft.
De afgelopen week had Wenfeng Liang, de oprichter van DeepSeek en de (rijke) baas van een investeringsfonds, een ontmoeting met China’s eerste minister Qiang Li om aan te geven dat ook de Chinese top trots is op de prestaties van een jong Chinees bedrijf.
Bronnen: Futura-Sciences, New York Times