Alibaba Gebrak Pasar AI! Model Open-Source Baru Lebih Hebat dari OpenAI?

Avatar photo

- Penulis Berita

Senin, 28 Juli 2025 - 18:48 WIB

facebook twitter whatsapp telegram line copy

URL berhasil dicopy

facebook icon twitter icon whatsapp icon telegram icon line icon copy

URL berhasil dicopy

Alibaba Luncurkan Qwen3-Thinking: AI Open-Source Terbaru yang Memimpin di Berbagai Benchmark Global

Alibaba, raksasa teknologi global, baru-baru ini memperkenalkan inovasi terbarunya di ranah kecerdasan buatan (AI): model penalaran canggih bernama Qwen3-235B-A22B-Thinking-2507. Sebagai bagian dari seri Qwen3-Thinking yang bersifat *open-source*, model *AI kelas tinggi* ini tidak hanya dirancang untuk kecerdasan dan ketangguhan luar biasa, tetapi juga diklaim telah melampaui kemampuan model AI sejenis dari kompetitor raksasa seperti Google dan OpenAI.

Kehadiran Qwen3-Thinking-2507 menandai babak baru dalam pengembangan *model AI open-source*. Model ini telah menunjukkan performa yang benar-benar luar biasa, mendominasi berbagai pengujian dan aspek krusial, mulai dari kemampuan *penalaran yang kompleks* hingga efisiensi dalam *pembuatan kode (coding)*. Tak heran, kapabilitas model *AI Alibaba* ini telah digaungkan sebagai “standar baru” di industri.

Ketangguhan *Qwen3-Thinking* semakin nyata dalam *pengujian penalaran matematika dan logika tingkat lanjut*. Melalui *benchmark AI* AIME25, *model AI Alibaba* ini berhasil mencetak skor impresif 92,3. Angka ini secara signifikan melampaui Gemini-2.5 Pro dari Google, yang hanya meraih 88,0 dalam pengujian yang serupa, menegaskan dominasi *Qwen3-Thinking* di bidang ini.

Tidak hanya unggul dalam penalaran, *model AI terbaru Alibaba* ini juga membuktikan kemampuannya yang mumpuni dalam *pengembangan perangkat lunak* dan *coding*. Dalam *benchmark* LiveCodeBench v6, Qwen3-Thinking-2507 sukses meraih skor 74,1. Angka ini kembali melampaui para pesaing utamanya, termasuk Gemini-2.5 Pro (72,5) dan bahkan o4-mini milik OpenAI (71,8).

Model ini juga menunjukkan keunggulan yang signifikan dalam *memahami dan merespons preferensi manusia*. Pada platform *benchmark* Arena-Hard v2, yang mengevaluasi seberapa baik *model AI* menjawab pertanyaan dari perspektif manusia, Qwen3-Thinking-2507 mencatatkan skor tertinggi 79,7. Pencapaian ini jauh melampaui Gemini 2.5 Pro (72,5) dan Deepseek-R1-0528 (72,2), mengukuhkan posisinya sebagai yang terdepan dalam interaksi mirip manusia.

Di balik performa impresifnya, Qwen3-Thinking-2507 dibangun di atas fondasi arsitektur *Mixture-of-Experts (MoE)* yang inovatif. Arsitektur ini tidak hanya dirancang untuk efisiensi tinggi, tetapi juga menawarkan fleksibilitas luar biasa dalam menangani beragam tugas dan pertanyaan. Dengan *MoE*, *model AI* ini mampu mengaktifkan hanya subset 22 miliar parameter untuk tugas spesifik, meskipun secara keseluruhan memiliki 235 miliar parameter, menjadikannya sangat adaptif.

Keunggulan teknis lainnya dari *Qwen3-Thinking* adalah kapasitas *jendela konteks (context window)* yang sangat luas, mencapai 262.144 token. *Context window* ini merepresentasikan jumlah total token yang dapat diproses oleh *model AI* dalam satu interaksi tunggal, meliputi baik input maupun output, memungkinkan pemahaman dan respons yang lebih mendalam serta koheren.

Pendekatan Pengembangan AI yang Diperbarui

*Inovasi AI* Alibaba tidak berhenti pada performa, melainkan juga pada metodologi pengembangan. Untuk Qwen3-Thinking-2507, *Alibaba* mengadopsi pendekatan yang sepenuhnya baru, meninggalkan teknik “hybrid thinking” yang diterapkan pada versi Qwen3 sebelumnya.

Teknik “hybrid thinking” sebelumnya mengharuskan pengembang untuk secara manual beralih antara mode instruksi cepat (Instruct) atau penalaran mendalam (Thinking) menggunakan token khusus. Pendekatan ini terbukti merepotkan dan seringkali menghasilkan kualitas respons yang kurang konsisten, menjadi sebuah tantangan tersendiri bagi para pengembang.

Merespons masukan berharga dari komunitas pengembang, *tim Qwen Alibaba* mengambil keputusan strategis untuk sepenuhnya meninggalkan mode “hybrid thinking.” Sebagai gantinya, mereka kini menerapkan strategi pelatihan model Instruct dan Thinking secara terpisah. “Kami kini melatih model Instruct dan Thinking secara terpisah untuk kualitas terbaik,” jelas tim *pengembangan AI Qwen*, menjanjikan peningkatan signifikan.

Pendekatan pelatihan terpisah ini terbukti lebih optimal dan efisien. Model Instruct kini dapat diatur secara spesifik untuk kecepatan dan eksekusi perintah yang responsif, sementara model Thinking dapat fokus pada *tugas penalaran multi-step yang kompleks*, memastikan setiap model memberikan performa puncak di bidangnya masing-masing.

*Qwen3-Thinking-2507* kini telah tersedia dan dapat diakses publik melalui platform *AI* terkemuka, Hugging Face, serta melalui API-nya. Untuk biaya penggunaan, model ini dibanderol dengan harga kompetitif: 0,70 dollar AS (sekitar Rp 11.453) per sejuta token input dan 8,40 dollar AS (sekitar Rp 137.443) per sejuta token output. Ini membuka peluang bagi *pengembang AI* dan perusahaan untuk memanfaatkan *teknologi AI* mutakhir dari *Alibaba*.

Berita Terkait

AI Digarap! Indonesia-Inggris Rancang Regulasi di 6 Sektor
Trading Saham AS 24 Jam? Pluang Sekarang Punya Fitur Ini!
Indihome Ekspansi: Mitratel & Telkom Optimalkan Jaringan Fiber
Infinix HOT 60 Pro: HP 2 Jutaan Terbaik dengan Fitur AI Canggih
Google Keep Update: Material Design 3 & Fitur Sandi Baru!
Ampuh! Cara Mudah Hilangkan Iklan Mengganggu di HP Realme
Trump Jadikan AI Landasan Inovasi AS, Ini 4 Kebijakan Utamanya
AI Baru Bikinan Google Bisa Baca dan Pahami Tulisan Kuno

Berita Terkait

Senin, 28 Juli 2025 - 18:48 WIB

Alibaba Gebrak Pasar AI! Model Open-Source Baru Lebih Hebat dari OpenAI?

Senin, 28 Juli 2025 - 18:20 WIB

Trading Saham AS 24 Jam? Pluang Sekarang Punya Fitur Ini!

Senin, 28 Juli 2025 - 15:32 WIB

Indihome Ekspansi: Mitratel & Telkom Optimalkan Jaringan Fiber

Minggu, 27 Juli 2025 - 01:44 WIB

Infinix HOT 60 Pro: HP 2 Jutaan Terbaik dengan Fitur AI Canggih

Sabtu, 26 Juli 2025 - 15:41 WIB

Google Keep Update: Material Design 3 & Fitur Sandi Baru!

Berita Terbaru

Public Safety And Emergencies

Taman Puring Rawan Roboh Pasca Kebakaran: Pedagang Dilarang Masuk!

Selasa, 29 Jul 2025 - 02:02 WIB

Finance

Payment ID Bansos: Uji Coba BI Mulai 17 Agustus 2025

Selasa, 29 Jul 2025 - 01:27 WIB

Public Safety And Emergencies

Kebakaran Taman Puring: Damkar Pastikan Tak Ada Korban Jiwa

Selasa, 29 Jul 2025 - 00:59 WIB

Sports

Thailand Juara 3 AFF U-23 2025! Taklukkan Filipina

Selasa, 29 Jul 2025 - 00:45 WIB