×
Kanal
    • partner tek.id realme
    • partner tek.id samsung
    • partner tek.id acer
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd

Kolaborasi F5 dan NVIDIA Dorong Efisiensi AI Factory, Pangkas Biaya dan Percepat Inferensi

Oleh: Tek ID - Senin, 04 Mei 2026 16:35

F5 dan NVIDIA optimalkan AI factory, tingkatkan throughput hingga 40% dan tekan biaya inferensi lewat teknologi infrastruktur cerdas.

Kolaborasi F5 dan NVIDIA Dorong Efisiensi AI Factory Kolaborasi F5 dan NVIDIA. dok. F5

Transformasi industri kecerdasan buatan (AI) kini memasuki fase baru dengan efisiensi infrastruktur menjadi kunci utama. 

Menjawab tantangan tersebut, F5 bersama NVIDIA memperluas kolaborasi untuk mengoptimalkan performa inferensi AI melalui peningkatan teknologi pada AI factory.

Integrasi terbaru menggabungkan BIG-IP Next for Kubernetes milik F5 dengan NVIDIA BlueField-3 DPU, menciptakan lapisan infrastruktur cerdas yang mampu meningkatkan throughput token, menekan latensi, serta menghadirkan sistem AI multi-tenant yang aman dalam skala besar.

Dalam ekosistem AI modern, token menjadi indikator utama performa. Kecepatan dan volume produksi token tidak hanya memengaruhi pengalaman pengguna, tetapi juga menentukan efisiensi biaya hingga potensi pendapatan dari infrastruktur berbasis GPU.

Seiring meningkatnya kebutuhan monetisasi AI, perusahaan kini tidak lagi berfokus pada kapasitas GPU semata, melainkan pada efisiensi ekonomi token—mulai dari throughput, time to first token (TTFT), hingga biaya per token.

Chief Product Officer F5 Kunal Anand mengatakan paradigma ini telah berubah secara fundamental.

“Infrastruktur AI bukan hanya tentang akses ke GPU, tetapi memaksimalkan output ekonomi per akselerator,” ujarnya.

Pengujian independen menunjukkan hasil signifikan. Solusi yang dikembangkan mampu meningkatkan throughput token hingga 40%, mempercepat TTFT hingga 61%, serta menurunkan latensi permintaan hingga 34%.

Efisiensi ini dicapai dengan memindahkan sejumlah fungsi seperti networking, enkripsi, dan manajemen trafik ke DPU, sehingga GPU dapat difokuskan sepenuhnya pada proses inferensi. 

Dampaknya, utilisasi GPU meningkat, antrian data berkurang, dan biaya per token dapat ditekan tanpa perlu mengubah model AI yang sudah ada.

Senior Vice President NVIDIA Kevin Deierling mengatakan kolaborasi ini sebagai langkah strategis dalam membuka potensi ekonomi AI.

“Infrastruktur komputasi terakselerasi dari NVIDIA… menghadirkan inferensi yang skalabel dan hemat biaya tanpa perlu perubahan pada model,” ujarnya.

Selain efisiensi, solusi ini juga dirancang untuk mendukung tren AI berbasis agen (agentic AI) yang semakin kompleks. 

Sistem baru memungkinkan routing berbasis inferensi, integrasi platform NVIDIA DOCA, serta pengelolaan multi-tenant yang aman melalui teknologi jaringan canggih.

Dengan pendekatan ini, perusahaan dapat berbagi infrastruktur GPU secara aman antar unit bisnis atau pelanggan tanpa mengorbankan performa maupun keamanan.

Kolaborasi F5 dan NVIDIA juga menghadirkan konsep baru control plane untuk AI factory, yang mampu mengelola konsumsi token, mengoptimalkan trafik, serta meningkatkan return on investment dari infrastruktur AI.

×
back to top