مشخصات کارت گرافیک‌های رده‌اول نسل جدید انویدیا با معرفی GTX 1080 و GTX 1070 قطعیت پیدا کرد. کارت گرافیک GTX 1070 با قیمتی در حد یک سوم GTX TITAN X هزار دلاری، بهترین محصولات نسل پیشین را پشت سر می‌گذارد. در ادامه به بررسی مشخصات پرچم‌دار جدید انویدیا و قدرت پردازشی آن می‌پردازیم.

ابرپردازنده‌ی تسلا P100 انویدیا با تراشه‌ی قدرتمند GP100 و معماری پاسکال

بررسی معماری پاسکال و تراشه‌ی GP100 انویدیا در ابرپردازنده‌ی Tesla P100

بررسی معماری پاسکال با معرفی تراشه‌ی قدرتمند GP100 انویدیا که قلب Tesla P100 است، آغاز می‌شود. تراشه‌ای با مساحت نزدیک به ۶۰۰ میلی‌متر مربع و قدرت پردازشی FP64 در حد ۵٫۳ ترافلاپس که بیش از هر ابرپردازنده‌ی دیگری است. انویدیا در این تراشه از موتور جابجایی صفحات حافظه، حافظه‌ی HBM2 و NVLink به جای پی‌سی‌آی اکسپرس ۳٫۰ استفاده کرده که نشان می‌دهد پاسکال فقط تحول معماری داخلی نیست و حرف‌های زیادی برای گفتن داد. با ما باشید.

ابرکامپیوتر DGX-1 انویدیا، اولین ابرکامپیوتر بهینه برای هوش مصنوعی با قدرت پردازشی خیره‌کننده معرفی شد

ابرکامپیوتر DGX-1 انویدیا، اولین ابرکامپیوتر بهینه برای هوش مصنوعی با قدرت پردازشی خیره‌کننده معرفی شد

انویدیا از قدرت پردازشی Tesla P100 در ابرکامپیوترهای متعددی استفاده خواهد کرد اما کامپیوتر NVIDIA DGX-1، اولین ابرکامپیوتر جهان برای مقصودی خاص به اسم یادگیری عمیق است. این روزها گوگل، فیس‌بوک و کمپانی‌های کوچک و بزرگ زیادی روی هوش مصنوعی و یادگیری ماشینی سرمایه‌گذاری کرده‌اند. کامپیوتر یا دقیق‌تر بگوییم، ابرکامپیوتر انویدیا DGX-1 علاوه بر سخت‌افزار بهینه، نرم‌افزارهای خاصی برای پردازش یادگیری عمیق دارد.

اکنون نوبت بازار مصرف‌کنندگان معمولی و گیمرهاست. این گروه از کاربران به گیگافلاپس بالا در محاسبات FP64 نیاز ندارند بلکه FP32 و تا حدی FP16 برایشان مهم است. مقوله‌ی قیمت تمام شده نیز موضوع بسیار مهمی است. کارت گرافیک GTX 1080 جای GTX 980 را می‌گیرد و GTX 1070 نیز جای GTX 970 را. شاید در آینده GTX 1080 Ti با تراشه‌ی GP100 و هسته‌های بیشتر، معرفی شود اما اگر چنین رویدادی اتفاق نیافتد هم GTX 980 Ti به راحتی توسط GTX 1080 کنار زده می‌شود. بهتر است سراغ اعداد و ارقام روی کاغذ برویم تا موضوع روشن شود. مشخصات دقیق را مقایسه کنید:

مقایسه مشخصات کارت گرافیک‌های GTX 1080 و GTX 1070 با GTX 980 و GTX ۷۸۰
  GTX 1080 GTX 1070 GTX 980 GTX 780 GTX 980 Ti
تعداد هسته‌های CUDA ۲۵۶۰ ? ۲۰۴۸ ۲۳۰۴ ۲۸۱۶
تعداد واحد بافت ۱۶۰ ? ۱۲۸ ۱۹۲ ۱۷۶
خروجی رندر ۶۴ ? ۶۴ ۴۸ ۹۶
سرعت هسته (مگاهرتز) ۱۶۰۷ کمتر از ۱۶۰۷ ۱۱۲۶ ۸۶۳ ۱۰۰۰
سرعت بوست (مگاهرتز) ۱۷۳۳ کمتر از ۱۷۳۳ ۱۲۱۶ ۹۰۰ ۱۰۷۶
قدرت پردازشی FP32 (ترافلاپس) ۹ ۶٫۵ ۵ ۴٫۱ ۵٫۶

قدرت پردازشی FP32

(کسری از FP32)

? ? ۱/۳۲ ۱/۲۴ ۱/۳۲

فرکانس موثر حافظه (گیگاهرتز)

نوع حافظه

۱۰ ؟ ۷ ۶ ۶

نوع حافظه

GDDR5X GDDR5 GDDR5 GDDR5 GDDR5
پهنای باس حافظه ۲۵۶ بیت ۲۵۶ بیت ۲۵۶ بیت ۲۵۶ بیت ۳۸۴ بیت
بافر ویدیویی (گیگابایت) ۸ ۸ ۴ ۳ ۶
توان طراحی حرارتی (وات) ۱۸۰ ؟ ۱۶۵ ۲۵۰ ۲۵۰
نام تراشه‌ی مرکزی GP104 GP104 GM204 GK110 GM200
تعداد ترانزیستور (میلیارد) ۷٫۲ ۷٫۲ ۵٫۲ ۷٫۱ ۸
لیتوگرافی TSMC 16nm TSMC 16nm TSMC 28nm TSMC 28nm TSMC 28nm
قیمت در زمان معرفی ۶۰۰ دلار ۴۵۰ دلار ۵۵۰ دلار ۶۵۰ دلار ۶۵۰

قدرت پردازشی GTX 1080 و مقایسه با نسل‌های قبلی

اگر بررسی عمیق معماری مکسول و کارت گرافیک GTX 980 را مطالعه کرده باشید، با بازدهی خوبی که این معماری جالب دارد، آشنایی کامل دارید. GTX 980 ظاهراً کارت گرافیکی ۵ ترافلاپسی است اما عملاً در حد کارت گرافیک‌های ۶ ترافلاپسی و حتی قوی‌تر ظاهر می‌شود. در حال حاضر بازدهی معماری جدید انویدیا دقیقاً آشکار نشده اما قدرت ۹ ترافلاپس و فرکانس موثر ۱۰ گیگاهرتزی حافظه و همین‌طور افزایش بافر ویدیویی از ۴ گیگابایت به ۸ گیگابایت، نشان می‌دهد که پرچم‌دار جدید برای اجرای سنگین‌ترین بازی‌ها در رزولوشن ۴K طراحی شده است و قطعاً سریع‌تر از GTX Titan X است!

پهنای باند حافظه در حد GTX 980 Ti و خروجی‌های رندر کمتر

تنها مواردی که به نظر می‌توانست بهتر باشد، پهنای باند حافظه و تعداد خروجی‌های رندر است. GTX 980 Ti از نظر پهنای باند با توجه به ۱٫۵ برابر بودن پهنای باس حافظه، تقریباً شبیه GTX 1080 است اما از نظر خروجی‌های رندر، ۱٫۵ برابر بهتر به نظر می‌رسد. ممکن است انویدیا با بهینه‌سازی الگوریتم‌های فشرده‌سازی تفاضلی بافت در معماری پاسکال، نیاز به پهنای باند بالا را کاهش داده باشد و از طرفی خروجی‌های رندر را با بهینه‌سازی‌های بیشتر، توانمندتر کرده باشد.

سرعت هسته‌های CUDA با توجه به بهبود لیتوگرافی (۲۸ نانومتر سابق به ۱۶ نانومتری FinFET تبدیل شده) ممکن است تا ۲٫۱ گیگاهرتز افزایش پیدا کند. کارت گرافیک GTX 1070 از نظر سرعت حافظه، هسته‌ها و تعداد هسته‌ها ضعیف‌تر است اما در نهایت ۶٫۵ ترافلاپس قدرت خام پردازشی داشته و سریع‌تر از Titan X است. به نظر می‌رسد که GTX 1070 یکی از پرفروش‌ترین کارت گرافیک‌های ماه‌های آتی است چرا که که قیمت نسخه‌ی معمولی آن فقط ۳۸۰ دلار است و با این وجود قدرت پردازشی در حد ۴ برابر پلی‌استیشن ۴ (حدود ۱٫۸ ترافلاپس) و یا ۵ برابر اکس‌باکس وان (حدود ۱٫۳ ترافلاپس) دارد.

انویدیا مدعی است که GTX 1080 در بازی‌های واقعیت مجازی تقریباً ۲ برابر سریع‌تر از GTX Titan X است! اگر این ادعا صحیح باشد، بازدهی معماری پاسکال خیره‌کننده است، حتی در بازی‌های معمولی.

مقایسه عملکرد GTX 1080 با برخی کارت گرافیک‌های رده‌اول در عرصه‌ی واقعیت مجازی

مقایسه عملکرد GTX 1080 با برخی کارت گرافیک‌های رده‌اول در عرصه‌ی واقعیت مجازی

لينک کوتاه:

FacebookTwitterGoogle


بيشتر بخوانيد:

دیدگاه بگذارید

اولین دیدگاه را بنویسید!

اطلاع از
wpDiscuz

تبلیغات

تبلیغات

تبلیغات

×