قوت سرسامآور تراشههای دیتاسنتر AMD نگاهها را خیره کرد

ابرکامپیوتر پرقدرت Frontier، تنها با منفعت گیری از نزدیک به ۳,۰۰۰ پردازنده AMD از ۳۷٬۸۸۸ پردازندهی گرافیکی خود یک مدل زبانی بزرگ (LLM) با نزدیک به یکتریلیون پارامتر را آموزش دهد.
بهگزارش سایت arXiv، محققان آزمایشگاه ملی Oak Ridge در آمریکا توانستند یک مدل زبانی بزرگ و در ابعاد GPT-4 را تنها با ۸ درصد از گرافیک AMD مدل MI250X حاضر در ابرکامپیوتر Frontier آموزش دهند.
ابرکامپیوتر Frontier تجهیزبه ۹,۴۷۲ پردازندهی AMD مدل Epyc 7A53 و ۳۷٬۸۸۸ پردازندهی گرافیکی AMD مدل Radeon Instinct است.
گروه تحقیقاتی آزمایشگاه ملی Oak Ridge بهترتیب از ۳,۰۷۲ پردازندهی گرافیکی این ابرکامپیوتر برای آموزش یک مدل زبانی بزرگ با یکتریلیون پارامتر و از ۱,۰۲۷ پردازندهی گرافیکی برای آموزش یک مدل زبانی بزرگ دیگر با ۱۷۵ میلیارد پارامتر منفعت گیری کردند.
ابرکامپیوتر Frontier در زمان انجام آزمایش، در منفعتوری مقیاسگذاری ضعیف، امتیاز کامل ۱۰۰ درصد را بهدست آورد. این مقیاس بدینمعنی است که با افزایش حجم کاری، تعداد پردازندههای بیشتری کارکرد بهینه خواهند داشت.
کارکرد سریعترین ابرکامپیوتر جهان در منفعتوری مقیاسگذاری قوی برای اجرای دو مدل زبانی بزرگ با ۱۷۵ میلیارد و یکتریلیون پارامتر بهترتیب برابر با ۸۹ و ۸۷ درصد می بود. این مقیاس به افزایش تعداد پردازندهها بدون تحول در حجم کاری اشاره میکند.
درحالحاضر، Frontier سریعترین کامپیوتر جهان با پردازندههای AMD است که از ابررایانه Aurora که تماماً از پردازنده اینتل منفعت گیری میکند و ابرکامپیوتر Eagle ساخت مایکروسافت با گرافیک انویدیا نیرومندتر است.
فردا کنفرانس مطبوعاتی AMD در نمایشگاه CES 2024 برگزار میبشود و به گمان زیادً جزئیات بیشتری از این آزمایش بزرگ نقل خواهد شد.