Singkatnya
- Z.AI dari Tiongkok merilis model gambar open-source utama yang seluruhnya dilatih menggunakan chip Huawei.
- Model ini menggunakan desain hybrid autoregressive-diffusion yang meningkatkan akurasi teks dan kontrol spasial.
- Perilisan ini menandakan dorongan Tiongkok menuju kemandirian AI tanpa GPU dari AS.
Perusahaan kecerdasan buatan asal Tiongkok, Z.AI, pada hari Rabu merilis model generasi gambar open-source yang seluruh pelatihannya dilakukan menggunakan prosesor Huawei, menandai pertama kalinya model AI besar menyelesaikan seluruh siklus pelatihannya tanpa bergantung pada perangkat keras Amerika.
Langkah ini menyoroti tantangan jangka panjang potensial terhadap dominasi Nvidia di chip AI, karena menunjukkan bahwa salah satu perusahaan AI teratas di Tiongkok dapat melatih model besar tanpa mengandalkan GPU buatan AS.
Model ini sudah tersedia untuk diunduh dan menghasilkan hasil yang baik—meskipun tidak mengesankan menurut standar saat ini—dalam hal estetika dan teks yang koheren, serta menunjukkan kesadaran spasial yang sangat baik berdasarkan pengujian cepat kami.

Gambar dihasilkan dengan model baru Z.AI.
Perusahaan yang berbasis di Beijing ini, yang mengumpulkan dana sebesar $558 juta dalam IPO Hong Kong minggu lalu, melatih model bernama GLM-Image ini pada server Ascend Atlas 800T A2 milik Huawei menggunakan framework MindSpore.
"Kami berharap ini dapat memberikan referensi berharga bagi komunitas untuk mengeksplorasi potensi kekuatan komputasi domestik," kata Z.AI dalam sebuah pernyataan yang dibagikan kepada
South China Morning Post
.
Memperkenalkan GLM-Image: Tonggak baru dalam generasi gambar open-source.
GLM-Image menggunakan arsitektur hybrid auto-regressive plus diffusion, menggabungkan pemahaman semantik global yang kuat dengan detail visual berkualitas tinggi. Model ini menyamai model diffusion arus utama dalam kualitas keseluruhan…
— Z.ai (@Zai_org) 14 Januari 2026
GLM-Image menggabungkan teknik autoregressive dan diffusion dalam arsitektur hybrid dengan total 16 miliar parameter. Komponen autoregressive, yang didasarkan pada model bahasa GLM-4 milik Z.AI, menangani pemahaman instruksi dan komposisi gambar, sementara decoder diffusion memperhalus detail-detail halus. Pendekatan ini mencerminkan teknik yang digunakan oleh model generasi gambar terbaru OpenAI, gpt-image-1.5, yang telah menunjukkan kemampuan rendering teks dan kepatuhan prompt yang lebih baik dibandingkan model diffusion murni seperti Stable Diffusion.
Model diffusion membuat gambar dengan memulai dari noise visual acak dan secara perlahan menyempurnakannya menjadi gambar, sementara model autoregressive membangun gambar langkah demi langkah, memprediksi setiap bagian berdasarkan sebelumnya. Diffusion sangat baik dalam menghasilkan realisme secara keseluruhan tetapi bisa kesulitan dengan detail presisi seperti teks atau tata letak, sementara model autoregressive unggul dalam struktur dan mengikuti instruksi. Saat ini, diffusion adalah teknik utama di antara generator gambar AI open-source.
Sistem hybrid baru menggabungkan kedua pendekatan tersebut, menggunakan generasi autoregressive untuk merencanakan gambar dan diffusion untuk memoles hasil akhirnya.

Gambar: Z.AI
Perilisan ini memiliki arti penting bagi Z.AI, yang masuk daftar hitam Washington pada 2025 karena diduga memiliki hubungan dengan militer Tiongkok. Penetapan itu memutus akses perusahaan dari prosesor Nvidia H100 dan A100. Kini, Z.AI telah membuktikan bahwa perusahaan yang masuk daftar hitam masih dapat menghasilkan sistem AI yang kompetitif menggunakan perangkat keras domestik, sebuah perkembangan yang telah lama ingin dibuktikan oleh Beijing.
Segera setelah pengumuman Z.AI,
Reuters
melaporkan bahwa otoritas bea cukai Tiongkok telah menginstruksikan petugas untuk memblokir chip Nvidia H200 agar tidak masuk ke negara tersebut. Pejabat pemerintah memanggil perusahaan teknologi ke pertemuan di mana mereka diberitahu untuk tidak membeli chip tersebut kecuali benar-benar diperlukan. Menurut sumber, kata-katanya cukup tegas sehingga dianggap sebagai "pada dasarnya larangan untuk saat ini."
Beijing tampaknya ingin menunjukkan bahwa laboratorium AI Tiongkok dapat membangun model yang mumpuni tanpa silikon Amerika, sehingga mengurangi urgensi perusahaan Tiongkok untuk menimbun perangkat keras Nvidia. H200, yang menghasilkan performa sekitar enam kali lipat dari chip H20 yang sudah diblokir Beijing pada Agustus lalu, telah menghasilkan pesanan lebih dari dua juta unit dari perusahaan Tiongkok dengan harga $27.000 per unit.
Analis di Center for Security and Emerging Technologies Georgetown mencatat bahwa strategi chip Tiongkok bergantung pada kompensasi performa per chip yang lebih rendah dengan kluster besar prosesor Huawei. Pendekatan ini berhasil, tetapi memerlukan lebih banyak perangkat keras, lebih banyak daya, dan upaya rekayasa yang lebih besar.
"Salah satu kendala utama dalam strategi ini adalah kapasitas Tiongkok untuk memproduksi cukup chip di dalam negeri guna menutup dan mengejar kesenjangan kapabilitas," kata analis riset senior Hanna Dohmen kepada
CNBC
pada November.
Menurut roadmap Huawei sendiri, chip generasi berikutnya di tahun 2026 justru akan lebih buruk daripada flagship saat ini dalam hal daya mentah. Namun penilaian semacam itu mungkin meremehkan apa yang dapat dicapai laboratorium Tiongkok melalui efisiensi algoritmik, seperti yang ditunjukkan DeepSeek dengan melatih model kompetitif menggunakan lebih sedikit chip melalui optimasi GPU tingkat assembly.

Sumber: Council on Foreign Relations
Menurut laporan teknis perusahaan, GLM-Image milik Z.AI mencapai skor tolok ukur terdepan di industri di antara model open-source untuk rendering teks dan generasi karakter Tiongkok. Bagi mereka yang tidak memiliki perangkat keras yang sesuai, model ini juga dapat dicoba secara online dengan akses API seharga $0,014 per gambar yang dihasilkan, atau melalui Hugging Face Space gratis yang dikelola oleh Z.AI.
Z.AI menjadi yang pertama dari "macan AI" Tiongkok, kelompok startup yang membangun large language model untuk menyaingi OpenAI dan Anthropic, yang melantai di bursa. Sahamnya telah naik sekitar 80% sejak pencatatan, mengikuti antusiasme investor terhadap perusahaan AI Tiongkok seperti DeepSeek atau Alibaba di tengah ambisi chip domestik Tiongkok.
Sementara itu, Huawei bersiap untuk secara tajam meningkatkan produksi prosesor Ascend miliknya tahun ini. Kehadiran booth perusahaan di konferensi AI di seluruh Tiongkok semakin menonjol karena mereka berusaha memposisikan diri sebagai tulang punggung infrastruktur AI nasional yang tidak lagi bergantung pada Santa Clara.