تکنولوژی

قوت سرسام‌آور تراشه‌های دیتاسنتر AMD نگاه‌ها را خیره کرد


ابرکامپیوتر پرقدرت Frontier، تنها با منفعت گیری از نزدیک به ۳,۰۰۰ پردازنده AMD از ۳۷٬۸۸۸ پردازنده‌ی گرافیکی خود یک مدل زبانی بزرگ (LLM) با نزدیک به یک‌تریلیون پارامتر را آموزش دهد.

به‌گزارش سایت arXiv، محققان آزمایشگاه ملی Oak Ridge در آمریکا توانستند یک مدل زبانی بزرگ و در ابعاد GPT-4 را تنها با ۸ درصد از گرافیک AMD مدل MI250X حاضر در ابرکامپیوتر Frontier آموزش دهند.

ابرکامپیوتر Frontier تجهیزبه ۹,۴۷۲ پردازنده‌ی AMD مدل Epyc 7A53 و ۳۷٬۸۸۸ پردازنده‌ی گرافیکی AMD مدل Radeon Instinct است.

گروه تحقیقاتی آزمایشگاه ملی Oak Ridge به‌ترتیب از ۳,۰۷۲ پردازنده‌ی گرافیکی این ابرکامپیوتر برای آموزش یک مدل زبانی بزرگ با یک‌تریلیون پارامتر و از ۱,۰۲۷ پردازنده‌ی گرافیکی برای آموزش یک مدل زبانی بزرگ دیگر با ۱۷۵ میلیارد پارامتر منفعت گیری کردند.

ابرکامپیوتر Frontier در زمان انجام آزمایش، در منفعت‌وری مقیاس‌گذاری ضعیف، امتیاز کامل ۱۰۰ درصد را به‌دست آورد. این مقیاس بدین‌معنی است که با افزایش حجم کاری، تعداد پردازنده‌های بیشتری کارکرد بهینه خواهند داشت.

مقاله٬های مرتبط

کارکرد سریع‌ترین ابرکامپیوتر جهان در منفعت‌وری مقیاس‌گذاری قوی برای اجرای دو مدل زبانی بزرگ با ۱۷۵ میلیارد و یک‌تریلیون پارامتر به‌ترتیب برابر با ۸۹ و ۸۷ درصد می بود. این مقیاس به افزایش تعداد پردازنده‌ها بدون تحول در حجم کاری اشاره می‌کند.

در‌حال‌حاضر، Frontier سریع‌ترین کامپیوتر جهان با پردازنده‌های AMD است که از ابررایانه Aurora که تماماً از پردازنده اینتل منفعت گیری می‌کند و ابرکامپیوتر Eagle ساخت مایکروسافت با گرافیک انویدیا نیرومندتر است.

فردا کنفرانس مطبوعاتی AMD در نمایشگاه CES 2024 برگزار می‌بشود و به گمان زیادً جزئیات بیشتری از این آزمایش بزرگ نقل خواهد شد.



منبع

نوشته های مشابه

دکمه بازگشت به بالا