تراشه‌ی GP100 انویدیا و ابرپردازنده‌ی Tesla P100 در کنار پردازنده‌ی Power8 و در آینده‌ی نزدیک Power9 کمپانی IBM، ابرکامپیوترهای جدیدی را در اختیار کمپانی‌های گوگل، فیس‌بوک، آمازون، رک‌اسپیس و … قرار می‌دهند. معماری مجموعه دستورات در پلتفرم متن‌بازی که حاصل همکاری IBM و انویدیا با گوگل و … است، RICS-V نام دارد که می‌خواهد x86 اینتل را با چالشی جدی مواجه کند. در ادامه به ابرکامپیوترهای سال آتی و تصمیم مهم IBM و انویدیا می‌پردازیم.

گوگل و رک‌اسپیس اخیراً اعلام کردند که روی یک معماری یا دقیق‌تر بگوییم پلتفرم سخت‌افزاری متن‌باز برای دیتاسنترها کار خواهند کرد که اساس آن پردازنده‌ی پاور۹ است. در سال ۲۰۱۴ گوگل نام خود را در لیست اعضای OpenPower Foundation ثبت کرده تا در طراحی و استفاده از تراشه‌های OpenPower کمپانی IBM سهیم شود و حالا پس از دو سال، نتایج جالبی به دست آمده است. پردازنده‌ی Power8 در کنار Tesla P100 قرار گرفته و قرار است Power9 هم در کنار همین پردازنده‌ی گرافیکی رده‌اول، استفاده شود.

پردازنده‌ی Power9 محصولی از IBM

پردازنده‌ی Power9 محصولی از IBM

تراشه‌ی Power9 با لیتوگرافی ۱۴ نانومتری تولید می‌شود و گلوبال فاندریز تولیدکننده‌ی آن است. این تراشه برای اجرای پردازش یادگیری عمیق و هوش مصنوعی که موردتوجه گوگل، فیس‌بوک، آمازون و … است، بهینه شده و در کنار تسلاهای انویدیا، عملکرد فوق‌العاده‌ای دارد.

ابرکامپیوترهای دنیا یک قدم بزرگ به جلو برمی‌دارند

در حال حاضر بهترین ابرکامپیوتر جهان، Tianhe-2 چین است که از قدرت پردازشی Xeon Phi اینتل بهره می‌برد و توان پردازشی آن ۳۴ پتافلاپس است.

ایالات متحده‌ی آمریکا قرار است با استفاده از Power9 و پردازنده‌های گرافیکی نسل بعدی (پس از پاسکال ولتا معرفی می‌شود) انویدیا، دو ابرکامپیوتر جدید بسازد. قدرت پردازشی بین ۱۵۰ تا ۳۰۰ پتافلاپس (هر پتافلاپس معادل ۱۰۰۰ ترافلاپس) است و از NVLink به عنوان راهکار ارتباطی استفاده می‌شود. در چنین ابرکامپیوترهایی، هر گره قدرت پردازشی ۴۰ ترافلاپس دارد و مجموعاً ۳۴۰۰ گره‌ی پردازشی فعال می‌شود. نام مدل برتر، Summit است.

ابرکامپیوترهای 150 تا 300 پتافلاپسی مبتنی بر Power9 و پردازنده‌های گرافیکی ولتای انویدیا

ابرکامپیوترهای ۱۵۰ تا ۳۰۰ پتافلاپسی مبتنی بر Power9 و پردازنده‌های گرافیکی ولتای انویدیا

قرار است اینتل و Cray در سال ۲۰۱۸ ابرکامپیوتری به اسم Aurora را معرفی کنند که قدرت پردازشی آن فقط ۱۸۰ پتافلاپس است. ممکن است تا آن زمان، انویدیا و IBM قدمی دیگر برداشته و رقیبی سرسخت‌تر معرفی کنند اما در هر حال آنچه مهم است، وجود رقیبی است که از اینتلی بودن همه‌ی ابرکامپیوترها، جلوگیری می‌کند.

معماری RISC-V به جای x86 اینتل

در حال حاضر اینتل در تولید تراشه‌های ویژه‌ی سرور و پردازش ابری، با سهم ۹۹ درصدی تقریباً بدون رقیب است و نتیجه روشن است: قیمت‌ها و سیاست‌ها همگی توسط اینتل تعیین می‌شود. گوگل اخیراً نشان داده که به تغییر منبع خود علاقه دارد و حتی گزینه‌ی جدیدی به اسم RISC-V مطرح می‌شود.

معماری جدیدی برای دستورات و نیاز به پورت کردن نرم‌افزارها

معماری مجموعه دستورات x86 که از گونه‌های CISC محسوب می‌شود، معماری مجموعه دستورات پردازنده‌های اینتل است و RISC معماری مجموعه دستورات پردازنده‌های ARM و برخی کمپانی‌های دیگر، RISC-V گونه‌ی جدیدی است که خوشبختانه متن‌باز و کم‌هزینه است و OpenPower از این معماری جدید بهره می‌گیرد. با توجه به پیشرفت IBM احتمالاً OpenPower در آینده‌ی نزدیک رقیب خوبی برای تراشه‌های سروری اینتل باشد. مشکل مهم در برابر پیشرفت Power8 و … این است که اپلیکیشن‌ها با توجه به تفاوت معماری مجموعه دستورات، می‌بایست پورت شوند. انویدیا و IBM برای ساده کردن مراحل بررسی و پورت اپلیکیشن‌ها، شبکه‌ای از آزمایشگاه‌های مختلف را برپاکرده‌اند و به نظر می‌رسد که این مورد مهم هم به سرعت پیگیری خواهد شد.

انویدیا با Tesla P100 و IBM با Power8 سریع‌تر از ابرکامپیوتر برتر جهان در سال ۲۰۰۴

تراشه‌ی Power8 دارای ۱۲ هسته است، هر یک از هسته‌ها ۸ ترد پردازشی را با وجود ۱۶ پایپ‌لاین خود اجرا می‌کنند لذا تردهای پردازشی بسیار زیاد است. سرعت کلاک هم بین ۳ تا ۳٫۵ گیگاهرتز است. برای هر هسته به طور متوسط ۵۱۲ کیلوبایت کش L2 در نظر گرفته شده و مجموعاً این کش ۶ مگابایت ظرفیت دارد. کش سطح سوم یک رکوردشکنی جالب توجه دارد و ۹۶ مگابایت است!

هر Power8 از ۱ ترابایت رم پشتیبانی می‌کند و خوشبختانه از هر دو نوع DDR3 و DDR4 پشتیبانی شده تا انعطاف‌پذیری بالایی به دست آید. پهنای باند مجموعه‌ی رم‌ها، می‌تواند حداکثر ۲۳۰ گیگابایت بر ثانیه باشد، با زئون‌ها مقایسه کنیم و ببینیم اینتل چه گزینه‌ای روی میز دارد: Xeon E5-2600 v4 در کنار رم‌های DDR4-2400 پهنای باند حداکثر ۷۶٫۸ گیگابایت بر ثانیه را پشتیبانی می‌کند.

Power8 تعداد زیادی کنترلر پی‌سی‌آی اکسپرس و حتی NVLink انویدیا را در آن واحد پشتیبانی کرده و از این نظر هم بسیار توانمند است.

انویدیا اخیراً با IBM و Wriston همکاری تازه‌ای را آغاز کرده تا پلتفرم محاسباتی با عملکرد بسیار بالا (به اختصار HPC) جدیدی مبتنی بر Power8 کمپانی IBM در نقش پردازنده‌ی اصلی و Tesla P100 در نقش پردازنده‌ی گرافیکی، وارد میدان رقابت شود. همان‌طور که در اسلاید زیر نمایان است، یک پردازنده می‌تواند در کنار حداکثر ۴ پردازنده‌ی گرافیکی انویدیا قرار گیرد.

ارتباط یک پردازنده با حداکثر 4 پردازنده‌ی گرافیکی مرتبط با هم از طریق NVLink

ارتباط یک پردازنده با حداکثر ۴ پردازنده‌ی گرافیکی مرتبط با هم از طریق NVLink

شایان ذکر است انویدیا در نمونه‌ی نمایشی NVIDIA DGX-1 نتیجه‌ی جالبی به دست آورده و ۴ هسته‌ی گرافیکی را در کنار ۱ پردازنده‌ی اصلی قرار داده است. در ابتدا رسانه‌ها از ۸ پردازنده‌ی گرافیکی در کنار ۲ هسته خبر داده بودند و شاید در محصول نهایی، همین پیکربندی لحاظ شود. با وجود چهار GP100 انویدیا، قدرت خام پردازشی بدون در نظر گرفتن پردازنده‌ی Power8، بسیار بالاست و در محاسبات FP64 به ۲۱٫۲ ترافلاپس می‌رسد!

ابرکامپیوتر IBM و انویدیا با قدرت پردازش 21.2 ترافلاپس (FP64)

ابرکامپیوتر IBM و انویدیا با قدرت پردازش ۲۱٫۲ ترافلاپس (FP64)

اگر پیکربندی دو هسته‌ای را مدنظر قرار دهیم، قدرت پردازشی FP64 به ۴۲٫۴ ترافلاپس می‌رسد. ابرکامپیوتر NEC Earth Simulator که سریع‌ترین ابرکامپیوتر جهان در سال‌های ۲۰۰۲ تا ۲۰۰۴ بود، ۳۵٫۸۶ ترافلاپس قدرت پردازش FP64 داشت و حالا پس از ۱۲ سال، یک ابرکامپیوتر نسبتاً کوچک با قدرتی بیش از این ابرکامپیوتر در اختیار سازمان‌ها و کمپانی‌های بزرگ قرار می‌گیرد. توان مصرفی هم کاهش شدیدی داشته، ابرکامپیوتر ۱۲ سال پیش، ۳۲۰۰ وات توان الکتریکی مصرف می‌کرد که به مراتب بیشتر از توان مصرفی پردازنده‌های قدرتمند امروزی است.

2 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 5 (2 نظر، امتیاز: 5٫00 از 5)
برای نظر دادن ابتدا باید ثبت نام کنید.
Loading...
لينک کوتاه:

FacebookTwitterGoogle


بيشتر بخوانيد:

دیدگاه بگذارید

اطلاع از
wpDiscuz

تبلیغات

ویژه‌ها

تبلیغات

تبلیغات

×