Intel Memperkenalkan Intel Gaudi 3 AI Accelerator di Ajang Intel Vision 2024

Saintek » Mashudi | 13/04/2024 09:56:00 WIB

Dalam ajang konferensi pelanggan dan mitra  Intel Vision 2024 Intel memperkenalkan Intel Gaudi 3 accelerator yang memberikan performa, keterbukaan dan pilihan untuk generative AI (GenAI) enterprise.

Intel juga mengumumkan jajaran sistem-sistem AI baru yang skalabel dan terbuka, produk-produk generasi berikutnya dan kolaborasi strategis untuk mempercepat pengadopsian GenAI. Dengan hanya 10% perusahaan skala enterprise sukses menjadikan proyek-proyek GenAI menjadi produk pada tahun lalu, penawaran terbaru dari Intel ini menjawab berbagai tantangan yang dihadapi perusahaan-perusahaan dalam meningkatkan inisiatif AI mereka.

“Inovasi terus berkembangan dengan kecepatan yang belum pernah terjadi sebelumnya. Hal ini dimungkinkan oleh teknologi silikon—dan setiap perusahaan dengan cepat menjadi sebuah perusahaan AI,” kata CEO Intel Pat Gelsinger.

Pat Gelsinger menuturkan, Intel menghadirkan AI di mana saja di lingkungan enterprise, dari PC hingga data center dan edge. Platform Gaudi, Xeon dan Core Ultra kami yang terbaru menghadirkan rangkaian solusi kohesif dan fleksibel yang dirancang khusus untuk memenuhi kebutuhan yang terus berubah dari para pelanggan dan mitra kami serta memanfaatan berbagai peluang yang luar biasa besar di depan mata.

Berbagai perusahaan berupaya meningkatkan GenAI dari proyek uji coba menjadi produk. Untuk itu, mereka membutuhkan solusi-solusi yang siap digunakan serta dibangun dengan prosesor berkinerja tinggi yang hemat energi dan hemat biaya seperti Intel Gaudi 3 AI accelerator, yang juga bisa menjawab kebutuhan akan kompleksitas, fragmentasi, keamanan data dan ketaatan terhadap peraturan.

Memperkenalkan Gaudi 3 untuk Pelatihan dan Inferensi AI

Intel Gaudi 3 AI accelerator akan menjadi sumber kekuatan bagi sistem-sistem AI yang memiliki hingga puluhan akselerator yang terhubung melalui Ethernet standar umum. Intel Gaudi 3 menjanjikan kemampuan komputasi AI empat kali lipat untuk BF16 dan peningkatan bandwidth memori sebesar 1.5 kali lipat dibandingkan produk pendahulunya. Akselerator ini akan memberikan lompatan yang signifikan dalam pelatihan dan inferensi AI bagi perusaahaan-perusahaan global yang ingin menerapkan GenAI dalam skala besar.

Dibandingkan dengan Nvidia H100, Intel Gaudi 3 secara rata-rata diproyeksikan bisa melakukan pelatihan 50% lebih capat dalam model-model Llama2 dengan parameter 7B dan 13B, dan model parameter GPT-3 175B. Selain itu, throughput inferensi Intel Gaudi 3 accelerator secara-rata-rata diproyeksikan akan mengungguli H100 sebesar 50% and 40% untuk rerata efisiensi daya inferensi dalam parameter Llama 7B dan 70B, dan model-model parameter Falcon 180B. 

Intel Gaudi 3 menyediakan software terbuka berbasis komunitas dan jaringan Ethernet standar industri. Intel Gaudi 3 juga memungkinkan perusahaan-perusahaan untuk secara fleksibel melakukan peningkatan dari single node ke cluster, super-cluster dan mega-cluster dengan ribuan node, sehingga mendukung inferensi, fine-tuning dan pelatihan dengan skala terbesar.

Intel Gaudi 3 akan tersedia bagi para OEM—termasuk Dell Technologies, HPE, Lenovo dan Supermicro—pada kuartal kedua 2024.

Menciptakan Nilai untuk Pelanggan dengai Solusi Intel AI

Intel menegaskan strateginya untuk sistem AI skalabel yang terbuka, yang mencakup hardware, software, kerangka kerja (framework) dan tools. Pendekatan Intel ini memungkinkan ekosistem pemain AI terbuka yang luas untuk menawarkan beragam solusi yang memenuhi kebutuhan GenAI enterprise yang spesifik. Ekosistem tersebut mencakup produsen peralatan, penyedia database, integrator sistem, penyedia software dan layanan dan banyak lagi. Strategi Intel tersebut juga memungkinkan berbagai perusahaan untuk menggunakan mitra dan solusi ekosistem yang sudah mereka ketahui dan percaya.

Intel membagikan momentum yang luas kepada para pelanggan dan mitra enterprise di seluruh industri untuk menerapkan solusi-solusi Intel Gaudi accelerator untuk aplikasi-aplikasi generative AI baru dan inovatif:

Intel juga mengumumkan kolaborasi dengan Google Cloud, Thales dan Cohesity untuk memanfaatkan kemampuan Intel confidential computing dalam solusi-solusi cloud mereka. Teknologi Intel yang dikolaborasikan mencakup Intel® Trust Domain Extensions (Intel® TDX), Intel® Software Guard Extensions (Intel® SGX) dan Intel’s attestation service. Para pelanggan dapat menjalankan berbagai model dan algoritma AI mereka dalam sebuah lingkungan eksekusi terpercaya (TEE) dan memanfaatkan Intel’s trust services untuk secara independent memverifkasi apakah TEE tersebut bisa dipercaya.

Ekosistem Berlomba untuk Mengembangkan Platform Terbuka untuk Enterprise AI

Melalui kerjasama dengan Anyscale, Articul8, DataStax, Domino, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, Red Hat, Redis, SAP, VMware, Yellowbrick dan Zilliz, Intel mengumumkan keinginan untuk menciptakan sebuah platform terbuka untuk enterprise AI. Upaya di lingkungan industri yang luas ini bertujuan untuk mengembangkan sistem-sistem GenAI multivendor terbuka yang memberikan kemudahan dalam implementasi, kinerja dan nilai yang terbaik di kelasnya, yang didukung oleh retrieval-augmented generation (RAG). RAG memungkinkan sumber data proprietary sangat besar yang berjalan dalam infrastruktur cloud standar dilengkapi dengan kemampuan LLM terbuka sehingga mempercepat penggunaan GenAI di perusahaan-perusahaan.

Sebagai langkah awal dalam upaya ini, Intel akan merilis implementasi acuan untuk GenAI pipeline dalam solusi-solusi berbasis Intel Xeon dan Gaudi yang aman, mempublikasikan kerangka kerja konseptual, dan terus menambah kapasitas infrastruktur dalam Intel Tiber Developer Cloud untuk pengembangan ekosistem dan validasi RAG dan pipeline di masa depan. Intel mendorong partisipasi lebih lanjut dari ekosistem untuk bekerjasama dalam upaya terbuka ini guna memfasilitasi pengadopsian AI open perusahaan, memperluas cakupan solusi dan mengakselerasi hasil bisnis.

Roadmap AI yang Diperluas dan Pendekatan Ekosistem Terbuka dari Intel

Selain Intel Gaudi 3 accelerator, Intel memberikan informasi terbaru mengenai produk dan layanan generasi berikutnya di seluruh segmen enterprise AI.

Prosesor Intel® Xeon® 6 terbaru: Prosesor Intel Xeon menawarkan solusi-solusi yang berkinerja tinggi namun efisien untuk menjalankan solusi-solusi GenAI sat ini, termasuk RAG, yang menciptakan hasil sesuai bisnis yang spesifik dengan menggunakan data proprietary. Intel memperkenalkan brand baru untuk prosesor generasi berikutnya untuk data center, cloud dan edge: Intel Xeon 6. Prosesor Intel Xeon 6 processors dengan Efficient-core (E-core) terbaru akan memberikan efisiensi yang luar biasa dan akan diluncurkan pada kuartal ini, sedangkan Intel Xeon 6 dengan Performance-core (P-cores) akan menawarkan kinerja AI yang meningkat dan akan diluncurkan segera setelah prosesor E-core.

o   Peningkatan kinerja per watt 2.4x dan densitas rak 2.7x lebih baik dibandingkan dengan prosesor 2nd Gen Intel® Xeon®.

o   Pelanggan dapat mengganti sistem lama dengan rasio hampir 3 banding 1, sehingga konsumsi energi berkurang secara drastis dan membantu memenuhi tujuan keberlanjutan.

o   Menyertakan dukungan software untuk format data MXFP4, yang mengurangi next token latency hingga 6.5x dibandingkan prosesor 4th Gen Intel® Xeon® yang menggunakan FP16, dengan kemampuan menjalankan 70 miliar parameter model-model Llama-2.

 

Client, Edge dan Konektivitas: Intel mengumumkan momentum untuk client dan pembaruan pada roadmap untuk edge dan konektivitas, yang meliputi: 

 

Portofolio Solusi Bisnis Intel Tiber

Intel mengumumkan portofolio solusi bisnis Intel® Tiber™ untuk menyederhanakan penerapan software dan layanan enterprise, termasuk untuk GenAI.

 

Pengalaman terpadu memudahkan pada pelanggan dan pengembang enterprise untuk menemukan solusi-solusi yang cocok dengan kebutuhan mereka, mengakselerasi inovasi dan menciptakan nilai tanpa mengorbankan keamanan, ketaatan pada peraturan atau kinerja. Pelanggan dapat mulai mengeksplorasi portofolio Intel Tiber mulai hari ini, dengan penggelaran menyeluruh direncanakan pada kuartal ketiga 2024. Pelajari lebih lanjut di website Intel Tiber.

Pengumuman yang dilakukan Intel dalam ajang Vision 2024 menegaskan komitmen perusahaan untuk membuat AI mudah diakses, terbuka dan aman bagi berbagai perusahaan di seluruh dunia. Dengan berbagai solusi dan kolaborasi ini, Intel siap memimpin dalam revolusi AI, menciptakan nilai yang belum pernah ada sebelumnya bagi perusahaan-perusahaan di mana saja.

Untuk mengetahui solusi-solusi Intel AI dan pengumuman Vision 2024, silakan kunjungi Intel Newsroom

(rr/Syam)

Artikel Terkait :

Share : Twitter | Facebook

Kirim Komentar