AMD Giat Pimpin Standar Benchmark GenAI dengan MLPerf Endpoints, Dorong Transparansi AI

123Berita – 07 April 2026 | Jakarta – Industri kecerdasan buatan generatif (GenAI) kini memasuki fase evaluasi yang lebih realistis. AMD mengumumkan partisipasinya sebagai kolaborator awal dalam inisiatif MLPerf Endpoints, sebuah rangkaian benchmark inferensi AI yang dikembangkan oleh konsorsium MLCommons. Langkah strategis ini menandai pergeseran signifikan dari sekadar mengukur kecepatan hardware ke penilaian kualitas layanan yang dirasakan oleh pengguna akhir melalui antarmuka pemrograman aplikasi (API).

Selama ini, metrik utama dalam menilai performa AI biasanya berfokus pada throughput token per GPU, sebuah pendekatan yang mengabaikan aspek penting seperti latensi layanan, konsistensi respon, dan efisiensi penyampaian token kepada pelanggan. AMD menegaskan bahwa di era layanan AI terkelola, kemampuan infrastruktur untuk menyajikan token secara cepat dan dapat diandalkan melalui API menjadi prioritas utama.

MLPerf Endpoints dirancang khusus untuk meniru beban kerja dunia nyata pada layanan GenAI. Berbeda dengan benchmark tradisional yang cenderung bersifat statis, MLPerf Endpoints mengadopsi arsitektur berbasis API dan sistem pengiriman bergulir (rolling submission). Fitur ini memungkinkan penyedia layanan memperbarui hasil benchmark seiring dengan rilis model baru, sehingga hasil evaluasi tetap relevan dengan kecepatan inovasi model GenAI modern.

“AMD telah lama mendukung standar terbuka dan benchmarking berbasis komunitas,” kata Emad Barsoum, Corporate Vice President AMD. “Transparansi dalam evaluasi memberikan manfaat besar bagi seluruh ekosistem teknologi. Kami terlibat sejak hari pertama dalam mendefinisikan beban kerja, aturan, serta infrastruktur evaluasi baru ini.”

Kontribusi AMD tidak hanya terbatas pada partisipasi formal. Perusahaan mengirimkan tim teknik untuk membantu menyusun beban kerja yang mencerminkan skenario penggunaan layanan AI populer, termasuk penyelesaian teks, gambar, dan kode. Selain itu, AMD menyediakan panduan reproduksibilitas yang memanfaatkan kerangka kerja AI open‑source, memastikan bahwa hasil benchmark dapat diverifikasi secara independen oleh komunitas.

David Kanter, salah satu pendiri MLCommons, memuji peran AMD dalam membangun standar yang mengandalkan infrastruktur produksi nyata. “Dengan dukungan AMD, MLPerf Endpoints semakin kuat sebagai standar industri yang dapat dipercaya. Kolaborasi ini memperkuat ekosistem benchmark yang transparan dan dapat direproduksi,” ujarnya.

Bagi AMD, kepemimpinan dalam bidang AI tidak hanya berarti mengeluarkan produk hardware kelas atas seperti seri Instinct, tetapi juga berperan aktif dalam menciptakan fondasi evaluasi yang adil dan terbuka. Rencana selanjutnya adalah mempublikasikan hasil kinerja GPU AMD Instinct pada platform MLPerf Endpoints secara berkala, memberikan gambaran performa yang realistis bagi penyedia layanan cloud, startup AI, dan perusahaan yang berencana mengadopsi solusi GenAI dalam skala besar.

Penggunaan MLPerf Endpoints diperkirakan akan memberikan dampak signifikan pada cara perusahaan menilai pilihan infrastruktur mereka. Dengan menekankan metrik layanan end‑user, seperti waktu respon API dan konsistensi hasil, organisasi dapat membuat keputusan yang lebih tepat mengenai investasi hardware, optimasi perangkat lunak, dan strategi deployment.

Pengembangan standar ini juga membuka peluang bagi kolaborasi lintas vendor. Karena MLPerf Endpoints bersifat terbuka, produsen GPU lain, penyedia chip khusus AI, serta platform cloud dapat berpartisipasi dalam pengujian yang sama, menciptakan perbandingan yang lebih adil dan transparan di seluruh pasar.

Secara keseluruhan, inisiatif AMD dalam MLPerf Endpoints menegaskan komitmen perusahaan terhadap ekosistem AI yang berkelanjutan dan terbuka. Dengan menyoroti kualitas layanan daripada sekadar kecepatan mentah, AMD membantu mengarahkan industri menuju paradigma evaluasi yang lebih relevan dengan kebutuhan pengguna akhir.

Ke depan, publikasi rutin hasil benchmark AMD di MLPerf Endpoints diharapkan menjadi acuan penting bagi pelaku industri yang ingin menilai performa GPU Instinct dalam skenario GenAI nyata. Transparansi, reproduksibilitas, dan kecepatan pembaruan hasil menjadi tiga pilar utama yang akan membentuk standar baru dalam penilaian AI generatif.

Dengan langkah ini, AMD tidak hanya memperkuat posisinya sebagai pemimpin hardware AI, tetapi juga sebagai arsitek standar industri yang mendukung inovasi berkelanjutan dan kepercayaan pasar.

Pos terkait