Kejutan: Produk Kebanggaan China Ternyata Menggunakan Teknologi AS

Jakarta – Kemunculan model AI R1 DeepSeek dari China sempat menggemparkan dunia dan mengguncang perusahaan teknologi besar di Amerika Serikat (AS). Pasalnya, sistem AI ini berhasil mematahkan anggapan bahwa pengembangan AI memerlukan biaya yang sangat tinggi.

DeepSeek mengklaim mampu menciptakan AI berkinerja tinggi yang mampu bersaing dengan AI buatan AS dengan biaya yang jauh lebih rendah. Saat diperkenalkan, harga saham perusahaan teknologi besar AS langsung merosot.

Apalagi, DeepSeek hadir ketika AS sedang gencar memblokir akses chip dan alat pembuat chip canggih ke China. DeepSeek menunjukkan bahwa China mampu mengembangkan AI canggih secara mandiri tanpa tergantung pada AS.

Minggu lalu, DeepSeek meluncurkan versi terbaru R1 yang berprestasi gemilang dalam memproses angka matematika dan pengkodean. Perusahaan tidak mengungkap sumber data yang digunakan untuk model tersebut, tetapi para peneliti AI berspekulasi bahwa sebagian datanya berasal dari keluarga AI Gemini milik Google.

Sam Paech, pengembang asal Melbourne yang membuat sistem evaluasi intelijen emosional untuk AI, merilis laporan yang diklaim sebagai bukti bahwa model terbaru DeepSeek dilatih dengan keluaran dari Gemini.

Ia menyatakan bahwa model baru DeepSeek yang dinamai R1-0528 menggunakan kata-kata dan ekspresi yang mirip dengan Gemini 2.5 Pro milik Google.

Meskipun laporan tersebut bukanlah bukti kuat, pengembang lain yang menciptakan sistem evaluasi AI bernama SpeechMap, mencatat bahwa model DeepSeek tampak seperti jejak Gemini.

Jejak model adalah ‘pemikiran’ yang dikumpulkan oleh model AI untuk menghasilkan kesimpulan.

DeepSeek sudah lama dicurigai menggunakan data dari sistem AI pesaing untuk melatih model AI-nya. Pada bulan Desember lalu, beberapa pengembang mengamati model V3 milik DeepSeek dan melaporkan bahwa sistem tersebut sering mengidentifikasi dirinya sebagai ChatGPT buatan OpenAI dari AS.

Hal ini menunjukkan bahwa model V3 milik DeepSeek kemungkinan dilatih menggunakan log obrolan milik ChatGPT.

Awal tahun ini, OpenAI memberi tahu bahwa mereka menemukan bukti yang menghubungkan DeepSeek dengan penggunaan distilasi, sebuah teknik untuk melatih model AI dengan mengekstrak data dari model yang lebih besar dan lebih canggih.

Menurut laporan, Microsoft, mitra dan investor dekat OpenAI, mendeteksi bahwa sejumlah besar data diekstraksi melalui akun pengembang OpenAI pada akhir tahun 2024. Akun tersebut diyakini berafiliasi dengan DeepSeek.

Distilasi bukanlah praktik yang tidak umum, tetapi ketentuan layanan OpenAI melarang pelanggan menggunakan keluaran model perusahaan untuk membangun AI saingan.

Pakar AI seperti Nathan Lambert, seorang peneliti di lembaga penelitian AI nirlaba AI2, menganggap bahwa bukan hal yang mustahil jika DeepSeek melatih modelnya menggunakan data dari Gemini milik Google.

“Jika saya adalah DeepSeek, saya pasti akan menghasilkan banyak data sintetis dari model API terbaik yang tersedia,” tulis Lambert dalam sebuah posting di media sosial.

“[DeepSeek] kekurangan GPU namun memiliki banyak dana. Secara harfiah, komputasinya jauh lebih efisien,” tambahnya.