اولین بنچ‌مارک‌های دایرکت ایکس 12 نبردی تازه بین ای‌ام‌دی و انویدیا را کلید زد. انویدیا تا حدی معترض بود و از طرفی ای‌ام‌دی قدرت پردازشی و معماری خاص GCN را علت برتری می‌دانست. قبلاً به ACE در معماری پردازنده‌های گرافیکی ای‌ام‌دی و اثری که در محاسبات گرافیکی سنگین دارد، اشاره کردیم و اکنون نوبت بنچ‌مارک بعدی است! این بار کدام طرف دعوا پیروز است؟

وقتی بازی را با رزولوشن 1080p اجرا می‌کنیم، GTX Titan X انویدیا با قیمت 1000 دلاری خود، نزدیک به R9 Fury X است. با افزایش رزولوشن و استفاده از دایرکت ایکس 12، وضعیت برعکس می‌شود. به عبارت دیگر اگر رزولوشن 4K باشد و دایرکت ایکس 12 به عنوان API ایفای نقش کند، Titan X انویدیا قافیه را به R9 390X هم می‌بازد.

بنچ‌مارک بازی Hitman، رزولوشن 4K، دایرکت ایکس 12

بنچ‌مارک بازی Hitman، رزولوشن 4K، دایرکت ایکس 12

در بازی Ashes of the Singularity که در ژانر استراتژی است و در نتیجه بیشتر به پردازنده وابسته است هم قبلاً نتایج مشابه به دست آمده بود.

بازی سوم، Rise of the Tomb Raider است که قبلاً به بررسی آن پرداختیم. در این بازی هم با بسته‌ی بروزرسانی اخیر، دایرکت ایکس 12 آثار خود را نشان می‌دهد. همان‌طور که در نمودار زیر مشاهده می‌کنید، GTX 980 Ti انویدیا، R9 Fury X را مغلوب کرده و البته اختلاف کم است:

مقایسه عملکرد GTX 980 Ti و R9 Fury X در Rise of Tomb Raider با پشتیبانی از دایرکت ایکس 12

مقایسه عملکرد GTX 980 Ti و R9 Fury X در Rise of Tomb Raider با پشتیبانی از دایرکت ایکس 12

عنوان دیگر، Gears of War جدید است که بهتر است به نتایج بررسی آن توجه نکنیم چرا که پورت بسیار بدی بوده و به خصوص با سخت‌افزار ای‌ام‌دی، مشکلاتی جدی دارد. حتی روی سخت‌افزار انویدیا هم اجرای خوبی ندارد. سازنده چند بسته‌ی بروزرسانی منتشر کرده و مشخص نیست که آیا مشکلات کاملاً حل شده یا هنوز هم اجرا روان نیست.

بازی Fable Legends زمانی به عنوان دومین عنوان دایرکت ایکس 12 معروف بود و اکنون به نظر می‌رسد که قطعاً منتشر نمی‌شود.

آیا موفقیت GCN در گروی ACE است؟

موتور محاسباتی غیرهم‌زمان یا به اختصار ACE، در هر دو عنوانی که ای‌ام‌دی را بهتر نشان داده، استفاده می‌شود. Jonas Meyer رهبری تیم رندر بازی Hitman را عهده‌دار است و در GDC 2016 مدعی شده که استفاده از ACE عملکرد محصولات ای‌ام‌دی را در حد 5 تا 10 درصد بهتر می‌کند و در سخت‌افزار انویدیا، اثر خاصی ندارد.

ممکن است ACE علت برتری باشد اما آیا با ACE، کارت گرافیک R9 390X به راحتی از پس GTX Titan X انویدیا می‌گذرد؟ پاسخ روشن است، اختلاف بیش از 5 یا 10 درصد است، تفاوت عملاً در حد 20 الی 25 درصد است.

معماری مکسول و بهینه‌سازی در سطح درایور

به نظر می‌رسد که دایرکت ایکس 12 معضل درایور کارت گرافیک‌های ای‌ام‌دی را حل کرده است. درایور کارت گرافیک‌های ای‌ام‌دی پردازش اضافی یا اصطلاحاً overhead بیشتری دارد؛ لذا پردازنده‌ی اصلی و گرافیکی عملکرد بهینه‌ای ندارند و در نتیجه استفاده از دایرکت ایکس 12 به جای 11، می‌تواند موجب پیشرفت 10 یا 20 درصدی شود.

نکته‌ی جالب توجه این است که باید جمله‌ی: “درایور ای‌ام‌دی بهینه نیست!” را کاملاً باور نکرد. درایور ای‌ام‌دی بهینه نیست اما گاهی فضایی برای بهینه‌سازی وجود ندارد.

اگر یادتان باشد در معماری مکسول، به جای واحد تقسیم وظایف یا به عبارت دیگر واحد زمان‌بندی بزرگی که در کپلر استفاده شده بود، چندین واحد کوچک‌تر در نظر گرفته شد. این واحدهای کوچک‌تر در مجموع منابع بیشتری نیاز دارند اما مزیتشان کاهش توان مصرفی و تقسیم بهتر فرآیند پردازش است. لذا معماری مکسول انویدیا، ذاتاً برای بهینه‌سازی بیشتر درایور، مناسب‌تر است.

کپلر

ساختار یک SMX در معماری کپلر انویدیا

ساختار یک SMX در معماری کپلر انویدیا

مکسول

ساختار یک SMM در معماری مکسول انویدیا

ساختار یک SMM در معماری مکسول انویدیا

در عناوین جدید، سطح دسترسی به سخت‌افزار پایین‌تر است. دسترسی عمیق‌تر به این معنی است که نقش درایور در تقسیم بهینه‌ی دستورات و فرآیندها، کم‌رنگ‌تر است و در نتیجه انویدیا نمی‌تواند در حد قبل از برتری جالبی که مکسول داشته، استفاده‌ی لازم را ببرد و در مقابل توسعه‌دهندگان می‌توانند بازی را بهتر از قبل برای سخت‌افزار ای‌ام‌دی بهینه کنند. نمونه‌ی آن استفاده از توانایی ACE است که 5 الی 10 درصد موثر واقع شده است.