امروز ای‌ام‌دی با جزئیاتی از چهارمین نسل معماری GCN برای کارت گرافیک‌های خود به نمایشگاه CES 2016 آمده است. معماری جدیدی به اسم Polaris که قرار است مسیر رادئون‌ها را با قدرت ادامه دهد و از نظر عملکرد و توان مصرفی، بهینه‌تر از پیشینیان خود باشد. در ادامه به بررسی مقدماتی پولاریس می‌پردازیم.

سیستمی از معماری‌ها در یک تراشه‌ی گرافیکی

سیستمی از معماری‌ها در یک تراشه‌ی گرافیکی

و نام‌گذاری جدید احتمالاً بهتر از قبل است. در سال‌های اخیر معماری بخش گرافیک، GCN 1.0 و GCN 1.1 و GCN 1.2 بوده و شاید GCN 4 و یا GCN 1.3 به نظر نام کوتاه و مناسبی برسد. اما در نهایت نام عمومی تراشه‌ها مثل Southern Islands و Evergreen و نام رمز یکایک تراشه‌های گرافیکی مثل هاوایی، تونگا و … موضوع را پیچیده می‌کند.

با یک مثال ساده تفاوت روشن می‌شود. کارت گرافیک R9 380X مبتنی بر تراشه‌ی تونگاست که از نظر معماری، مشابه تراشه‌ی فیجی در R9 Fury X است. اما نکته‌ی جالب این است که AMD در فیجی، بلوکی برای دیکد کردن سخت‌افزاری HEVC اضافه کرده تا پخش محتوای ۴K، ساده شود و در تونگا چنین بخشی وجود ندارد! هر دو معماری یکسانی دارند اما IP خاصی به اسم موتور مالتی‌مدیا، یکسان نیست.

پولاریس نامی جدید و جذاب است که در کنار جذابیت و معنادار بودن، می‌خواهد نام‌گذاری را ساده‌تر و یک‌دست‌تر کند. متأسفانه امروزی جزئیاتی عمیق در مورد معماری شیدرها منتشر نشده و نمی‌توان حدس زد که تراشه‌های مبتنی بر پولاریس، از چه نظر یکسان و از چه نظر متفاوت هستند.

اما ببینیم پولاریس با چه تغییرات اساسی معرفی می‌شود؟

تغییرات نسل بعدی کارت گرافیک‌های ای‌ام‌دی با معماری پولاریس

اولین اسلاید از تغییرات بسیار جالب حکایت دارد و انتخاب پس‌زمینه‌ای از ستارگان شب هم بی‌ارتباط با نام پولاریس (ستاره‌ی قطبی) نیست:

تغییرات اساسی در معماری پولاریس، نسل بعدی GCNهای ای‌ام‌دی

تغییرات اساسی در معماری پولاریس، نسل بعدی GCNهای ای‌ام‌دی

همان‌طور که مشاهده می‌کنید قرار است از HDMI 2.0 و دیسپلی‌پورت ۱٫۳ پشتیبانی به عمل آید، چیزی که حتی در تراشه‌ی قدرتمند Fiji که قلب R9 Fury X و دو برادر دیگر آن بوده، وجود ندارد و در عین حال انویدیا در محصولات ارزان‌تری مثل GTX 970، پشتیبانی لازم را اضافه کرده تا گیمرها بتوانند با کابل پرکاربرد HDMI، نمایشگرهایی با نرخ نمایش ۴K@60 را بدون افت کیفیت، تغذیه کنند. دقت کنید که در دانش‌نامه‌ی اینتوتک به مقوله‌ی جالب فضای رنگ و نوع نمونه‌برداری و همین‌طور اثر کابل اشاره کرده بودم، پشتیبانی از ۴K@60 با نمونه‌برداری ۲۴ بیتی RGB با نمونه‌برداری YUV420 کاملاً متفاوت است.

پهنای باند کابل ارتباطی روی کیفیت تصویر نمایشگر موثر است

بررسی اثر کابل و پورت روی کیفیت تصویر تلویزیون و نمایشگر

شاید تصور کنید که کابل HDMI و دیسپلی‌پورت و پورت‌های مختلف روی تلویزیون و کارت گرافیک، همگی یکسان هستند اما در ادامه بررسی می‌کنیم که کیفیت تصویر در اثر استفاده‌ی نادرست چه قدر به این نکات وابسته است.

بنابراین در اواسط ۲۰۱۶، اولین محصول مبتنی بر پولاریس با پشتیبانی از دیسپلی‌پورت ۱٫۳ و HDMI 2.0 وارد گود می‌شود تا مشکلی با رزولوشن بالای نمایشگرهای امروزی، وجود نداشته باشد.

دیکد HEVC با عمق رنگ ۱۰ بیت

دومین تغییر اساسی، پشتیبانی از اینکد و دیکد سخت‌افزاری کدک H.265 با رزولوشن ۴K است. به این ترتیب پخش کردن ویدیوهای رزولوشن بالا، بدون بار سنگین پردازشی برای پردازنده، امکان‌پذیر می‌شود و البته مصرف انرژی سیستم هم پایین‌تر از روش نرم‌افزاری یا ترکیب روش نرم‌افزاری و سخت‌افزاری خواهد بود. دقت کنید که پشتیبانی از HEVC هم مثل H.264 شامل پروفایل‌های مختلف است. در فیجی از دیکد سخت‌افزاری ۸bit HEVC Main profile پشتیبانی شده بود و اکنون از ۱۰bit HEVC Main10 پشتیبانی می‌شود و این یعنی عمق رنگ به جای ۸ بیت، ۱۰ بیت است هر چند در اغلب ویدیوهای فشرده شده، برای کاهش حجم از عمق رنگ کافی ۸ بیت که به معنی ۱۶٫۷ میلیون رنگ مختلف است، استفاده می‌شود. در مقوله‌ی ویدیوهای HDR و همین‌طور ویدیوهایی با گستره‌ی رنگ Adobe RGB، عمق رنگ ۱۰ بیت مفید واقع می‌شود. در مورد اینکد اشاره‌ای به عمق رنگ و در واقع پشتیبانی از پروفایل Main10 نشده است.

سومین تغییر که مهم‌ترین مورد است، افزایش بازدهی است، البته منظور از بازدهی همان عملکرد نیست. در وب پارسی معمولاً این دو واژه به جای هم به کار می‌رود. منظور از بازدهی این است که عملکرد به ازای هر وات مصرف انرژی چگونه است و با توجه به شایعات قبلی، ممکن است تفاوت نسل بعدی GCN با نسل فعلی، در حد ۲ برابر باشد! همین تفاوت بین پاسکال و مکسول ۲ انویدیا هم پیش‌بینی می‌شود. در حقیقت لیتوگرافی ۱۴ یا ۱۶ نانومتری بخشی از کاهش مصرف انرژی را سبب شده و بخش دیگر، بهینه‌سازی معماری تراشه‌ی گرافیکی است.

اسلاید بعدی اشاره‌ای کوتاه به بهینه‌سازی‌های عمیق معماری پولاریس دارد:

بهینه‌سازی‌های معماری پولاریس ای‌ام‌دی

بهینه‌سازی‌های معماری پولاریس ای‌ام‌دی

همان‌طور که مشاهده می‌کنید واحد زمان‌بندی سخت‌افزاری یا Hardware Accelerator و پیش‌دریافت دستور یا Pre-Fetch دستخوش تغییر شده‌اند و فشرده‌سازی تفاضلی بافت و عملکرد یکایک شیدرها و شتاب‌دهی به واحد حذف مقدماتی، در دستور کار قرار گرفته است. در مورد فشرده‌سازی تفاضلی بافت که قبلاً در تراشه‌ی تونگا و سری ۹۰۰ انویدیا، موثر بوده، به بررسی عمیق مکسول ۲ انویدیا و کارت گرافیک GTX 980 مراجعه کنید تا مزایای آن روشن شود؛ خلاصه بگوییم، با فشرده‌سازی تفاضلی بافت، پهنای باند کمتری در بخش حافظه نیاز است:

تصویری از کارت گرافیک GTX 980 انویدیا با طراحی مرجع

بررسی GTX 980 و GTX 970 انویدیا و معماری Maxwell 2

نسل جدید کارت گرافیک‌های انویدیا با معماری مکسول ۲ و دو کارت گرافیک رده اول سری ۹۰۰ وارد بازار شده است. در ادامه به بررسی بررسی GTX 980 و معماری Maxwell 2 می‌پردازم.

واحد زمان‌بندی و پیش‌دریافت دستور برای استفاده‌ی بهینه‌تر از تمام توان پردازشی هسته‌های پردازشی GCN تغییر کرده و در حقیقت متحول شده است. واحد حذف مقدماتی دستورات هم احتمالاً برای حذف دستورات اضافی رندر و پردازش کاربرد دارد، به این ترتیب قبل از پردازش اضافی، عناصری که در تصویر دیده نخواهند شد، حذف شده و پردازش نمی‌شوند.

اسلاید زیر نشان می‌دهد که اغلب بخش‌های تراشه، تغییر کرده و کاملاً جدید است:

تراشه‌های مبتنی بر معماری Polaris ای‌ام‌دی و بلوک‌های بازطراحی شده

تراشه‌های مبتنی بر معماری Polaris ای‌ام‌دی و بلوک‌های بازطراحی شده

مجموعه‌ی بهینه‌سازی‌های فوق، به بازدهی ۱٫۵ برابر و حتی بهتر، منجر می‌شود و البته اطلاعات کامل و دقیق در باب بهینه‌سازی‌های صورت گرفته بعدها منتشر می‌شود.

ای‌ام‌دی در تراشه‌های رده‌اول بعدی، حافظه‌ی HBM نسل دوم را به خدمت می‌گیرد و با توجه به عدم نیاز، در میان‌رده‌ها و تراشه‌های کوچک، همچنان GDDR5 انتخاب می‌شود. در حقیقت پهنای باند بسیار بالا در میان‌رده‌ها، بی‌معنی است و نیازی به استفاده از تکنولوژی جالب HBM نیست.

لیتوگرافی صفحه‌ای ۲۸ نانومتر به ۱۴ نانومتری FinFET تبدیل می‌شود

از مشکلات بزرگی که در سال اخیر پیش روی صنعت تراشه‌های گرافیکی وجود داشته، می‌توان به بهینه نبودن لیتوگرافی ۲۰ نانومتری اشاره کرد. در سال ۲۰۱۱ اولین تراشه‌های گرافیکی مبتنی بر لیتوگرافی صفحه‌ای ۲۸ نانومتری معرفی شدند و تا سال ۲۰۱۵ تکنولوژی بهتری وجود نداشت! لیتوگرافی ۲۰ نانومتری تقریباً یک شکست برای کاربری تراشه‌های گرافیکی بود چرا که با وجود ظرافت بیشتر، نشت استاتیکی هم بیشتر شد. به این ترتیب لیتوگرافی ۱۴ یا ۱۶ نانومتری FinFET یک ضرورت جدی است چرا که مشکل نشت استاتیکی را حل می‌کند.

اما FinFET چیست و چه تفاوتی با لیتوگرافی تخت یا صفحه‌ای دارد؟

در روش صفحه‌ای، لایه‌ی وارون‌سازی که با رنگ آبی پررنگ در تصاویر زیر نشان داده شده، یک صفحه‌ی نسبتاً کوچک است. اینتل به جای استفاده از یک گیت، سه گیت برای ترانزیستور در نظر گرفته و لایه‌ی موردبحث را از حالت صفحه‌ای خارج کرده و دور تا دور فین، قرار داده است. نتیجه این است که کنترل جریان الکتریکی بهتر می‌شود و جریان الکتریکی بیشتری عبور می‌کند، البته در حالت خاموش هم جریان عبوری متأثر از ولتاژ Substrate نیست و کمتر است. تراکم ترانزیستور و توان مصرفی نیز بهینه‌تر از ترانزیستورهای صفحه‌ای با یک گیت است. به تصاویر توجه کنید:

ترانزیستور سه‌بعدیترانزیستور صفحه‌ایمقطع ترانزیستور سه‌بعدیمقطع ترانزیستور صفحه‌ای
ترانزیستور 3 بعدی دارای سه گیت، روش FinFET

ترانزیستور ۳ بعدی دارای سه گیت، روش FinFET

ترانزیستور صفحه‌ای دارای یک گیت

ترانزیستور صفحه‌ای دارای یک گیت

ترانزیستور 3 بعدی دارای سه گیت، روش FinFET

ترانزیستور ۳ بعدی دارای سه گیت، روش FinFET

ترانزیستور صفحه‌ای دارای یک گیت

ترانزیستور صفحه‌ای دارای یک گیت

و مقایسه‌ای کوتاه از عملکرد و توان مصرفی، دقت کنید که محور افقی توان مصرفی نسبی است و محور عمودی، عملکرد پایه‌ای:

توان مصرفی و عملکرد تراشه‌هایی با لیتوگرافی 14 و 28 نانومتر

توان مصرفی و عملکرد تراشه‌هایی با لیتوگرافی ۱۴ و ۲۸ نانومتر

ای‌ام‌دی هم در اسلاید زیر اشاره‌ای گذرا به مفهوم FinFET و تاریخچه‌ی آن کرده است. در سال ۱۹۸۹ مفهوم چنین ترانزیستور مطرح شد و در سال ۲۰۰۰ اولین ترانزیستور FinFET نام‌گذاری شد. بعدها در سال ۲۰۱۲، اینتل اولین محصول مبتنی بر چنین ساختاری را تولید کرد.

مزایا و تاریخچه‌ی FinFET

مزایا و تاریخچه‌ی FinFET

پولاریس رقیب مکسول ۲ انویدیا نیست! هدف پاسکال است

ای‌ام‌دی و در حقیقت گروه RTG برای نمایش قدرتمندی پولاریس، سیستمی با پردازنده‌ی Core i7 انتخاب کرده و بازی Star Wars Battlefront نیز برای بررسی عملکرد، انتخاب شده است. ای‌ام‌دی پولاریس را در برابر GTX 950 انویدیا قرار داده است و به نظر می‌رسد که تراشه‌ی انتخابی، یکی از میان‌رده‌های جدید باشد. تراشه‌ای که مساحت آن کمتر از ۱۲۰ میلی‌متر مربع است و می‌تواند بازی اشاره شده را در رزولوشن ۱۰۸۰p با سرعت ۶۰ فریم بر ثانیه، اجرا کند. اما مصرف انرژی چند وات است؟ ۸۶ وات برای کل سیستم، در حالی که GTX 950 با عملکرد مشابه، ۱۴۰ وات انرژی مصرف کرده است!

پولاریس ای‌ام‌دی در برابر مکسول 2 انویدیا، مصرف انرژی نصف می‌شود

پولاریس ای‌ام‌دی در برابر مکسول ۲ انویدیا، مصرف انرژی نصف می‌شود

قطعاً شما هم مثل من به نمایش ای‌ام‌دی انتقاد دارید چرا که ممکن است عملکرد کامل GTX 950 سرعتی مثل ۸۰ فریم بر ثانیه باشد و محصول بومی ای‌ام‌دی، سرعتی در حد ۶۰ فریم بر ثانیه داشته باشد. با فعال کردن V-Sync هر دو ظاهراً یکسان می‌شوند.

اگر مورد فوق را کنار بگذاریم، پولاریس نه عالی بلکه شاهکاری جدید در عرصه‌ی پردازش گرافیکی است. در واقع اگر توان مصرفی پردازنده و رم، بازدهی پاور سیستم و … را در نظر بگیریم، تراشه‌ی ناشناخته‌ی AMD توان مصرفی کمتر از ۶۰ وات دارد، عددی در حد نصف GTX 950 و این یعنی بازدهی پولاریس تفاوتی بیش از ۵۰ درصد با مکسول ۲ انویدیا دارد. ۵۰ درصد دیگر را به عنوان تخمینی از تفاوت توان مصرفی در اثر بهینه‌سازی لیتوگرافی کنار می‌گذاریم.

3 votes, average: 5٫00 out of 53 votes, average: 5٫00 out of 53 votes, average: 5٫00 out of 53 votes, average: 5٫00 out of 53 votes, average: 5٫00 out of 5 (3 نظر، امتیاز: 5٫00 از 5)
برای نظر دادن ابتدا باید ثبت نام کنید.
Loading...
لينک کوتاه:

FacebookTwitterGoogle


بيشتر بخوانيد:

دیدگاه بگذارید

اطلاع از
شاهین
خواننده

بعد از پنج سال بالاخره یه تغییر نود دیدیم. نکته جالب اینه که اینتل از سال ۲۰۱۲ شروع به استفاده از این تکنولوژی finfet کرد. چند ماه پیش هم تراشه های ۱۴nm رو تولید کرد. 

حسین
خواننده

سلام باتشکر از مقاله ی کاملتون 
به نظر من اگه amdکمی صبر میکرد تا از تراشه ۱۰nm finfet تی اس ام سی استفاده کنه خیلی بهتر بود چون همون طور که می دونید soc آ۹ اپل که به وسیله ی تی اس ام سی ساخته شده با وجود اینکه ۲nmاز تراشه ی سامسونگ بزرگتره  اما عملکرد بهتری داره و همین طور amd حتما باید به فکر افت فریم در صحنه های شلوغ باشه که متاسفانه تو این زمینه از رقیبش انویدیا خیلی عقب تره ولی اگه توان مصرفی معماری جدید  همونی باشه که توی تصویر مشخصه واقا عالی کار کرده که ترکیبش با حافظه ی hbm2 کارایی رو خیلی بالا می بره که احتمالا فقط توی پردازنده های پرجمدار استفاده بشه و gddr5x سهم میانرده وپایین رده خواهد شد ولی با توجه به معماری پاسکال کار سختی رو در پیش خواهد داشت

بهادر
خواننده

گمونم ۲۱۰۶ سالی میشه که واقعا میشه وسیله ای به اسم ((لپتاپ گیمینگ)) دید. وسیله ای که واقعا قابل حمله(کمتر از۲ کیلو) و میتونه به راحتی تو رز بالا۱۰۸۰ تولید محتوا کنه!

wpDiscuz

تبلیغات

ویژه‌ها

تبلیغات

تبلیغات

×