Biaya Latih AI DeepSeek Cuma Rp 4,8 Miliar

avatar
· 阅读量 21
Biaya Latih AI DeepSeek Cuma Rp 4,8 Miliar
Foto: Joel Saget via The Guardian
Jakarta

DeepSeek, perusahaan kecerdasan buatan (AI) asal China mengungkap biaya yang mereka habiskan untuk melatih model R1 jagoannya. Sesuai klaim sebelumnya, biaya melatih DeepSeek R1 jauh lebih rendah dibandingkan pesaing seperti ChatGPT,

Dalam artikel peer-review yang diterbitkan di jurnal akademik Nature, DeepSeek mengatakan mereka menghabiskan USD 294.000 atau sekitar Rp 4,8 miliar untuk melatih model R1. Artikel itu mencantumkan nama CEO dan pendiri DeepSeek Liang Wenfeng sebagai salah satu penulisnya.

Artikel itu juga mengungkap DeepSeek melatih model R1 menggunakan 512 unit chip Nvidia H800. Artikel versi sebelumnya yang diterbitkan pada Januari 2025 tidak memuat informasi ini.

SCROLL TO CONTINUE WITH CONTENT

Baca juga: Uni Emirat Arab Luncurkan AI Murah, Tantang ChatGPT dan DeepSeek

Biaya pelatihan untuk large language model yang mengotaki chatbot AI merujuk pada biaya yang dikeluarkan untuk menjalankan sekumpulan chip canggih selama berbulan-bulan guna memproses teks dan kode dalam jumlah besar.

ADVERTISEMENT

Proses pelatihan AI biasanya membutuhkan biaya yang sangat besar. Pada tahun 2023, CEO OpenAI Sam Altman mengatakan pelatihan model yang mendasari ChatGPT membutuhkan lebih dari USD 100 juta atau sekitar Rp 1,6 triliun.

Sejumlah pernyataan DeepSeek tentang biaya dan teknologi yang digunakan untuk melatih model AI-nya diragukan oleh pejabat dan perusahaan Amerika Serikat.

Chip H800 yang dipakai melatih model R1 dirancang khusus oleh Nvidia untuk pasar China setelah pemerintah AS melarang raksasa chip itu mengekspor GPU AI H100 dan A100 yang lebih bertenaga ke China.

Pada bulan Juni lalu, petinggi AS mengatakan DeepSeek memiliki chip H100 dalam jumlah besar yang diperoleh setelah larangan ekspor diberlakukan pada Oktober 2022. Nvidia saat itu mengatakan DeepSeek menggunakan chip H800 yang didapatkan secara legal, bukan chip H100.

Baca juga: DeepSeek V3.1 Resmi Hadir: Apa Saja Fitur Terbaru dan Peningkatannya?

Dalam dokumen pendukung yang menyertai artikel Nature, DeepSek untuk pertama kalinya mengakui memiliki chip A100 yang dipakai untuk tahap persiapan pengembangan model R1. Setelah fase awal ini, model R1 dilatih menggunakan chip H800 selama 80 jam.

"Mengenai penelitian kami terkait DeepSeek-R1, kami menggunakan GPU A100 untuk mempersiapkan eksperimen dengan model yang lebih kecil," tulis peneliti DeepSeek, seperti dikutip dari Reuters, Minggu (21/9/2025).



Video: Korea Selatan Blokir Aplikasi DeepSeek

Video: Korea Selatan Blokir Aplikasi DeepSeek


(vmp/fay)

风险提示:本文所述仅代表作者个人观点,不代表 Followme 的官方立场。Followme 不对内容的准确性、完整性或可靠性作出任何保证,对于基于该内容所采取的任何行为,不承担任何责任,除非另有书面明确说明。

喜欢的话,赞赏支持一下
avatar
回复 0

加载失败()

  • tradingContest