Bagikan:

JAKARTA - Belum lama ini insinyur perangkat lunak senior Netflix, Drew Gallatin, mengungkapkan tentang upaya perusahaan untuk mengoptimalkan arsitektur perangkat keras dan perangkat lunak, yang memungkinkan streaming hiburan video dalam jumlah besar ke lebih dari 209 juta pelanggan.

Perusahaan saat ini mampu memeras sebanyak 200 GB per detik dari satu server, tetapi pada saat yang sama ingin meningkatkannya. Hasil dari upaya tersebut dipresentasikan pada konferensi EuroBSD 2021, seperti dikutip dari Tom's Hardware, Rabu, 22 September.

Gallatin mengatakan bahwa Netflix mampu mendorong konten hingga 400 Gb per detik dengan menggunakan kombinasi CPU 32-core Epyc 7502p (Roma), 256 GB memori DDR4-3200, 18 drive 2-terabyte Western Digital SN720 NVMe, dan dua adapter jaringan PCIe 4.0 x16 Nvidia Mellanox ConnectX-6 Dx, masing-masing mampu menampung dua koneksi 100 GB.

Untuk mendapatkan gambaran tentang throughput teoritis maksimum dari sistem ini, ada delapan saluran memori yang menyediakan bandwidth sekitar 150 GB per detik, dan 128 jalur PCIe 4.0 yang memungkinkan bandwidth I/O hingga 250 GB. Dalam unit jaringan, masing-masing sekitar 1,2 TB per detik dan 2 TB per detik. Perlu juga dicatat bahwa inilah yang digunakan Netflix untuk menyajikan kontennya yang paling populer.

Konfigurasi ini biasanya dapat menyajikan konten hingga 240 GB per detik, terutama karena keterbatasan bandwidth memori. Netflix kemudian mencoba konfigurasi Non Uniform Memory Architecture (NUMA) yang berbeda, dengan satu node NUMA mampu menghasilkan 240 GB per detik dan empat node NUMA menghasilkan sekitar 280 GB per detik.

Namun, pendekatan ini memiliki sejumlah masalah tersendiri, seperti latensi yang lebih tinggi. Idealnya, harus menyimpan sebanyak mungkin data massal dari NUMA Infinity Fabric untuk mencegah kemacetan dan penghentian CPU sebagai akibat bersaing dengan akses memori normal.

Gallatin menjelaskan bahwa mengatasi keterbatasan ini dimungkinkan dengan menggunakan pengoptimalan perangkat lunak. Dengan membongkar tugas enkripsi TLS ke dua adaptor Mellanox, perusahaan meningkatkan total throughput menjadi 380 GB per detik (hingga 400 GB dengan penyesuaian tambahan), atau 190 GB per detik per kartu antarmuka jaringan (NIC).

Dengan CPU tidak lagi harus melakukan enkripsi apa pun, utilisasi keseluruhan turun menjadi 50 persen dengan empat node NUMA dan 60 persen tanpa NUMA. Di samping itu, Netflix juga mengeksplorasi konfigurasi berdasarkan platform lain, termasuk satu dengan CPU Intel Xeon Platinum 8352V (Ice Lake), dan Altra Q80-30 dari Ampere yakni raksasa dengan 80 inti Arm Neoverse N1 yang berjalan hingga 3 GHz.

Testbed Xeon mampu mencapai 230 GB per detik tanpa pembongkaran TLS, dan sistem Altra mencapai 320 GBper detik. Tidak puas dengan hasil 400 GB per detik, perusahaan sudah membangun sistem baru yang menangani koneksi jaringan 800 GB per detik. Namun, beberapa komponen yang diperlukan tidak tiba tepat waktu untuk melakukan tes apa pun.