Galbūt kinų kalbos modelis „DeepSeek“, kurio paleidimas sugriovė JAV akcijų rinką ir dėl kurio „Nvidia“ kapitalizacija sumažėjo neįtikėtinais 600 mlrd. dolerių, iš tikrųjų Kinijos bendrovei kainavo daug daugiau, nei pranešta.
Prisiminkime, modelio apmokymo išlaidos esą siekė tik 5-6 mln. dolerių, o tai stulbina. Tačiau „SemiAnalysis“ analitikai išanalizavo turimus duomenis ir praneša, kad „DeepSeek“ išlaidos iš tikrųjų buvo maždaug du kartus didesnės!
Ataskaitoje teigiama, kad „DeepSeek“ turi apie 10 000 Kinijos rinkai skirtų „Nvidia H800“ GPU ir 10 000 brangesnių H100 lustų. Dar daugiau, bendrovė investavo į H20 greitintuvus ir turi išteklių, kuriuos „DeepSeek“ ir Kinijos rizikos draudimo fondas „High-Flyer“ dalijasi prekybai, produkcijai, mokymams ir tyrimams. Visa tai iš viso jau dabar traukia apie 1,6 mlrd. dolerių, ir tai tik kapitalo investicijos. Kalbama, kad veiklos sąnaudos sudaro apie 944 mln. dolerių. Šie skaičiai yra maždaug keturis šimtus kartų didesni, nei iš pradžių manė rinkos.
Matyt, tie patys 5-6 mln. dolerių yra tam tikra dalis mokymo išlaidų, greičiausiai susijusių su galutinio modelio eksploatavimu.
Taigi, jei šaltinio skaičiavimai teisingi, joks stebuklas neįvyko ir DeepSeek nepavyko pakeisti rinkos taisyklių, kai dideliems kalbų modeliams reikia milžiniškų pinigų sumų.