تم تحسين مثيلات Amazon EC2 P5 الجديدة التي تم نشرها في مجموعات الحوسبة فائقة النطاق EC2 UltraClusters بشكل كامل لتسهير وحدات معالجة الرسومات NVIDIA Hopper في عملية تسريع نماذج تدريب الذكاء الاصطناعي والاستدلال على نطاق واسع
أعلنت كل من "أمازون ويب سيرفيسز" (AWS)، التابعة لشركة Amazon.com المدرجة في بورصة (ناسداك NASDAQ) تحت الرمز AMZN و"إنفيديا" – NVIDIA، (المسجلة في بورصة ناسداك تحت الرمز NVIDIA) اليوم، عن إبرام اتفاقية تعاون متعددة الجوانب تستهدف تطوير بنية تحتية للذكاء الاصطناعي (AI) حسب الطلب والتي ستكون الأكثر قابلية للتوسع في العالم والتي يتم تحسينها باستمرار لدعم تدريب نماذج اللغة الكبيرة المعقدة بشكل متزايد (LLMs) وتطوير تطبيقات الذكاء الاصطناعي التوليدية.
ويرتكز التعاون بين الجانبين على تسخير الجيل الأحدث من مثيلات (Amazon EC2) P5 المدعومة بوحدات معالجة الرسومات NVIDIA H100 Tensor Coreمن "إنفيديا" وشبكات "أمازون ويب سيرفيسز" الحديثة وقابلية التوسع التي ستوفر ما يصل إلى 20 إكسافلوبس من أداء الحوسبة لبناء وتدريب أكبر نماذج التعلم العميق. وستكون مثيلات P5 أول مثيلات تستند إلى وحدة معالجة الرسومات (GPU) وتستفيد من شبكات الجيل الثاني من الواجهة الشبكية (EFA) التي طورتها "أمازون ويب سيرفيسز"، والتي توفر 3200 جيجابت في الثانية من إنتاجية الشبكة ذات النطاق الترددي المنخفض وزمن انتقال منخفض للغاية، ما يتيح للعملاء توسيع نطاق أحجام العمل لتصل إلى 20,000 وحدة معالجة رسومات H100 في مجموعات الحوسبة فائقة النطاق EC2 UltraClusters للوصول حسب الطلب إلى أداء حوسبي فائق من فئة أجهزة الحاسوب العملاقة للذكاء الاصطناعي. وتُعد شركة بنترست Pinterest من بين الشركات المعروفة عالمياً التي تستفيد من هذه التكنولوجيا، إذ تعمل الشركة على تسريع تطوير منتجاتها وتقديم تجارب جديدة قائمة على الذكاء الاصطناعي لعملائها.
وقال آدم سيليبسكي، الرئيس التنفيذي لشركة "أمازون ويب سيرفيسز": "تربط أمازون ويب سيرفيسز وإنفيديا شراكة مميزة تعود لأكثر من 12 عاماً نجحتا خلالها في تطوير حلول مبتكرة واسعة النطاق ومنخفظة التكلفة قائمة على وحدة معالجة الرسومات ويتم تقديمها حسب الطلب لتطبيقات مختلفة مثل تعلم الآلة والذكاء الاصطناعي والرسومات والألعاب والحوسبة عالية الأداء. وتتمتع أمازون ويب سيرفيسز بسجل حافل في توفير تجارب فريدة قدمت خلالها مثيلات تخزين محسّنة تستند إلى وحدة معالجة الرسومات والتي عززت قابلية التوسع مع كل جيل جديد منها، فضلاً على تمكّن العديد من العملاء اليوم من توسيع نطاق العمليات وأعباء العمل ذات الصلة بتدريب تعلم الآلة إلى أكثر من 10000 وحدة معالجة رسومات. ومع الجيل الثاني من تقنية Elastic Fabric Adapter التي طورناها، سيتمكن العملاء من توسيع نطاق مثيلاتهم P5 إلى أكثر من 20,000 وحدة معالجة رسومات NVIDIA H100، ما يوفر إمكانيات الحواسيب العملاقة عند الطلب للعملاء بدايةً من الشركات الناشئة إلى المؤسسات الكبيرة".
ومن جهته قال جين سين هوانج، المؤسس والرئيس التنفيذي لشركة "إنفيديا": "يعتبر وصول تقنيات الحوسبة المتسارعة والذكاء الاصطناعي مثالياً للغاية على صعيد التوقيت. وبينما تسعى الشركات إلى تحقيق المزيد من التقدم بموارد أقل، توفر الحوسبة المتسارعة زخماً أكبر لدفع عملية تطوير وتسريع وظائف العمليات مع تقليل التكلفة وموارد الطاقة. وقد دفع ظهور الذكاء الاصطناعي التوليدي الشركات إلى إعادة تصور منتجاتها ونماذج أعمالها لتصبح أكثر ابتكاراً. وتعد أمازون ويب سيرفيسز شريكاً طويل الأمد بالنسبة لنا وكانت أول مزود خدمة سحابية يقدم وحدات معالجة الرسومات من إنفيديا NVIDIA. ويسعدنا الجمع بين خبرتنا ونطاقنا وإمكانيات الوصول التي نتمتع بها لمساعدة العملاء على تسخير قدرات الحوسبة المتسارعة والذكاء الاصطناعي التوليدي للاستفادة من الفرص الهائلة في المستقبل".
مجموعات الحوسبة الفائقة الجديدة وتصميمات الخوادم
تعد مثيلات P5 الجديدة التي يتم تشغيلها بواسطة وحدات معالجة الرسومات NVIDIA مثالية لتدريب نماذج اللغة الكبيرة LLM المعقدة بشكل متزايد ونماذج رؤية الحاسوب التي تعمل على تشغيل تطبيقات الذكاء الاصطناعي التوليدية الأكثر تطلباً والأكثر كثافة في مجال الحوسبة، مثل الإجابة عن الأسئلة، وإنشاء الأكواد، وإنشاء الفيديو والصور، والتعرف إلى الكلام. واستهدفت تصميمات الخادم الجديد الذكاء الاصطناعي الفعال والقابل للتطوير من خلال تسخير الخبرات الحرارية والكهربائية والميكانيكية للفرق الهندسية في كل من إنفيديا وأمازون ويب سيرفيسز، بغية بناء خوادم متطورة تسخّر وحدات معالجة الرسومات لتقديم حلول مدعومة بالذكاء الاصطناعي على نطاق واسع، مع التركيز على كفاءة الطاقة في البنية التحتية لسحابة AWS. وعادةً ما تكون وحدات معالجة الرسومات (GPU) أكثر كفاءة في استخدام الطاقة بمقدار 20 مرة من وحدات المعالجة المركزية (CPU) لأعباء عمل معينة من الذكاء الاصطناعي، حيث تعتبر وحدة معالجة الرسومات H100 أكثر كفاءة في استخدام الطاقة بما يصل إلى 300 مرة مقارنة بوحدات المعالجة المركزية لنماذج اللغات الكبيرة.