در نمایشگاه CES امسال، انویدیا یکی از دو کمپانی برتر تولیدکننده پردازنده گرافیکی، در مورد کارت گرافیکهای سری RTX 50 که البته به RTX 5000 معروف است، اطلاعات جدیدی منتشر کرده و حتی مشخصات و قیمت کارت گرافیک RTX 5090 اعلام شده است. اگر در فکر خرید سیستم گیمینگ جدید هستید یا میخواهید لپ تاپ با گرافیک RTX 5000 خریداری کنید، بد نیست در مورد ویژگیهای خاص و نقاط قوت نسل جدید نسبت به نسلهای قبلی، اطلاعات کافی داشته باشید.
در این مقاله به چند ویژگی برتر نسل جدید و پیشرفت انویدیا در عرصه بزرگ کردن تصویر به کمک هوش مصنوعی یا تکنولوژی DLSS و کاهش اثر تأخیر در بازیها با تکنولوژی NVIDIA Reflex و همینطور مقولهی Multi Frame Generation یا ایجاد فریمهای اضافی تصویر برای روانتر اجرا کردن بازیهای امروزی میپردازیم. با مقالهای دیگر از دانشنامهی اینتوتک در حوزهی گرافیک و سختافزار همراه باشید.
افزایش قدرت محاسبات هوش مصنوعی و اثرات آن
انویدیا در نمایشگاه CES امسال اطلاعات جالبی در خصوص کارت گرافیکهای نسل جدید با معماری Blackwell منتشر کرده است. ویژگی اصلی نسل جدید، افزایش توانمندی در محاسبات هوش مصنوعی است که در نتیجه آن، تکنولوژیهایی نظیر رندرینگ عصبی یا به کمک شبکه عصبی (Neural Rendering)، ایجاد فریمهای اضافی با پیشبینی حرکت عناصر (Multi Frame Generation)، تخصیص بافت یا تکسچر به عناصر به کمک شبکه عصبی (Neural Materials) و بزرگنمایی تصویر به کمک هوش مصنوعی یا DLSS شکل گرفته است. همهی این موارد مبتنی بر هوش مصنوعی است و در بهبود سرعت اجرای بازیها مفید است.
تفاوت اصلی معماری Blackwell این است که از محاسبات عدد اعشاری با دقت کم که به اختصار FP4 گفته میشود و در واقع اعداد اعشاری ۴ بیتی، به صورت نیتیو پشتیبانی شده است. البته در نسلهای قبلی نیز محاسبات اعشاری ۴ بیتی امکانپذیر بوده ولیکن قدرت محاسباتی ۲ برابر قدرت محاسبات اعشاری ۸ بیتی نبود! اما در نسل جدید قدرت محاسبات FP4 معادل ۲ برابر قدرت محاسبات FP8 است. با توجه به اینکه در شبکه عصبی و یادگیری عمیق، محاسبات با دقت پایین، متداول است، میتوان نتیجه گرفت کارت گرافیک سری 5000 با اولویت توانمندی بیشتر در عرصه محاسبات هوش مصنوعی طراحی شده است.
انویدیا در کنار بهبود معماری، مدلهای هوش مصنوعی را نیز بروزرسانی کرده تا از معماری جدید هستهها کمال استفاده را ببرند. نکتهی جالب این است که برخی از پیشرفتهایی که همزمان با معرفی کارت گرافیکهای RTX 50 به آن اشاره شده، فقط مختص نسل جدید نیست بلکه نسلهای قبلی کارت گرافیکهای RTX انویدیا نیز کم و بیش از آن بهرهمند میشوند. به عبارت دیگر حتی اگر لپتاپی با کارت گرافیک RTX 2050 داشته باشید که اولین خانوادهی RTX است، میتوانید از نسل جدید DLSS در بازیها استفاده کنید.
قبلاً مقالهای با موضوع مقایسه کارت گرافیک پرچمدار نسل جدید با برترین کارت گرافیک نسل قبل منتشر کردیم:
بهبود بافت با Neural Materials
یکی از تکنولوژیهای مهمی که انویدیا معرفی کرده، به تخصیص بافت در بازیها مربوط میشود. منظور از Neural Materials یا تخصیص بافت با بهینهسازی به کمک شبکه عصبی این است که هوش مصنوعی با بررسی بافت اجسام در بازیها، نیاز به دادههای تکراری را کاهش دهد. انویدیا مدعی است که هوش مصنوعی ممکن است میزان استفاده از رم کارت گرافیک را تا یک سوم کاهش دهد!
به عنوان مثال ممکن است حین اجرا کردن یک بازی بهینه شده برای استفاده از Neural Materials، به جای ۱۵ گیگابایت رم ویدیویی کارت گرافیک، فقط ۵ گیگابایت حافظه استفاده شود که تفاوت بسیار زیادی است، به خصوص اگر بازی به دلیل کمبود VRAM کارت گرافیک، از نظر سرعت اجرا محدود شده باشد.
البته دقت کنید که لازم که در ساخت بازی، از تکنولوژی Neural Materials انویدیا به شکل بهینهای استفاده شده باشد و طبعاً بازیهای قدیمی یا بازیهای جدیدی که از تکنولوژی جدید انویدیا استفاده نمیکنند، بهتر از قبل اجرا نخواهد شد.
انویدیا با همکاری مایکروسافت مدل جدیدی برای شیدرها ارایه کرده که نام آن Cooperative Vectors یا شیدرهای عصبی است. این شیوهی جدید، امکان ترکیب کردن کدهای تنسور و شیدر را فراهم میکند. البته هنوز مشخص نیست که آیا این مدل جدید، مختص کارت گرافیکهای RTX 50 است یا یک استاندارد متنباز و عمومی است و سایر کارت گرافیکها نیز از آن پشتیبانی میکنند ولیکن میتوان گفت که اجرا کردن محاسبات مربوطه، به کمک نسل جدید کارت گرافیکهای انویدیا با سرعت بیشتری انجام میشود.
پیچیدهتر شدن عناصر گرافیکی بازیها و افزایش تعداد مثلثها
نمودار زیر تعداد مثلثهایی است که در طراحی مش و گرافیک بازیهای مطرح در گذر زمان استفاده شده است. منظور از مثلثها و چندضعلیها، شبکهای از نقاط است که سطح اجسام را میسازد و روی آن بافت و رنگ اضافه میشود.
تعداد مثلثهای به کار رفته در طراحی بازیها در دهه ۱۹۹۰ در حد هزار تا ۱۰ هزار مثلث در یک فریم تصویر بوده، یک دهه بعد تعداد به ۵۰ هزار الی ۱ میلیون مثلث افزایش پیدا کرد. در دهه ۲۰۱۰ و بازیهایی نظیر Witcher 3، تعداد مثلثها به ۱ تا ۱۰ میلیون رسید. ۱۰ سال بعد در بازیهایی نظیر Cyberpunk 2077 این تعداد به ۱۰ الی ۵۰ میلیون رسیده است و انویدیا میگوید در نسل بعدی، باز هم تعداد مثلثها ۱۰ برابر میشود! دمویی به اسم Zorah برای به تصویر کشیدن صحنههایی با ۵۰۰ میلیون مثلث توسط انویدیا ارایه شده که میتوانید ویدیوی آن را در یوتیوب تماشا کنید.
DLSS چیست؟
با توجه به اینکه اجرا کردن یک بازی سنگین و گرافیکی در حالتی که ابعاد تصویر 4K باشد، به کارت گرافیک بسیار قوی نیاز دارد، سازندگان کارت گرافیک و به خصوص انویدیا، از سالها قبل به دنبال راهی برای بزرگ کردن تصویر با کمترین افت کیفیت بودهاند. در حالت عادی زمانی که روی عکس زوم میکنید، کیفیت آن کاهش پیدا میکند و اگر بیشتر زوم کنید، حتی حالت مربع مربع و شطرنجی پیدا میکند. انویدیا و AMD و سایر کمپانیها همواره به دنبال راهی برای جلوگیری از افت کیفیت بودهاند.
هدف DLSS انویدیا یا تکنولوژیهای مشابه این است که فریمهای بازی با همان رزولوشن معمولی نظیر Full HD یا 1080p پردازش و ساخته شود و سپس فریم آماده شده به کمک هوش مصنوعی، با کمترین افت کیفیت، به یک فریم با ابعاد 4K تبدیل شود. ایجاد فریم با ابعاد کمتر و بزرگنمایی آن به شکل بهینه، در مجموع بار پردازشی کمتری نسبت به اجرا کردن بازی با رزولوشن بالا دارد. لذا DLSS در بازیها، سرعت اجرای بازی را افزایش میدهد و تیک و لگ کمتر میشود.
نکتهی جالب توجه این است که طبق آمار، بیش از ۸۰ درصد گیمرها که کارت گرافیک RTX دارند، از گزینهی DLSS در بازیها استفاده میکنند. در واقع DLSS در بیش از ۵۴۰ بازی و اپلیکیشن گرافیکی به کار رفته است و عملکرد آن درخشان است.
به این سوال پاسخ دادیم که DLSS چیست، اما شاید متوجه شده باشید که در بازیهای امروزی، گزینهی دیگری که در تنظیمات بزرگنمایی تصویر دیده میشود، FSR است. این سوال مطرح میشود که FSR چیست؟!
هدف تکنولوژیهای مشابه DLSS انویدیا، نظیر FSR ایامدی یا XeSS اینتل مشابه است، گرافیک بازی با رزولوشن پایینتر پردازش شود و ابعاد تصویر خروجی به کمک هوش مصنوعی و الگوریتمهای بهینه، افزایش پیدا کند.
آشنایی با DLSS 4
انویدیا همزمان با معرفی کارت گرافیک RTX 5000 و تکنولوژیهای مربوط به آن، به DLSS 4 پرداخته است. در نسل جدید DLSS از الگوریتمها و در واقع مدل جدید هوش مصنوعی استفاده شده که نسبت به شبکههای عصبی سنتی یا Convolutional Neural Networks در DLSS 3.5 و نسلهای قبل، عملکرد بهتری دارد. انویدیا از مدلهای هوش مصنوعی مبتنی بر تبدیلها یا Transforms در بهینهسازی DLSS استفاده کرده است و نتیجهی آن افزایش جزئیات تصویر پس از بزرگنمایی است و حتی بار پردازشی کاهش پیدا میکند.
تصویر زیر به بازی Horizon Zero مربوط میشود و مقایسهای بین عملکرد DLSS ورژن قبل و نسل جدید انجام شده است:
در تصویر بعدی نیز عملکرد DLSS 4 را با نسخه قبلی در بازی Alan Wake 2 مقایسه شده است:
در هر دو تصویر فوق، عملکرد DLSS 4 در حفظ جزئیات بافت اجسام پس از بزرگ کردن تصویر، قابل توجه است اما اینکه محاسبات موردنیاز چقدر بیشتر است و سرعت اجرای بازی چه مقدار تغییر کرده، جای سوال دارد و به بررسی بیشتری نیاز است.
نکتهی مهم این است که شاید سرعت اجرای بازی با کیفیت برابر، بیشتر شده باشد. به عنوان مثال میتوان در تنظیمات گرافیک بازی، DLSS را روی حالت Performance یا 4X گذاشت و آن را با حالت Quality یا Balanced یا به عبارت دیگر حالت 2X نسل قبل مقایسه کرد.
ایجاد فریمهای اضافی با Multi Frame Generation
تکنولوژی ایجاد فریم یا Frame Generation در کنار DLSS 3.5 معرفی شد و کار آن ساخت فریمهای اضافی با استفاده از فریمهای رندر شده است که به روانتر اجرا شدن بازی کمک میکند. در واقع محاسبات کامل برای پردازش یک فریم، سنگین است در حالی که محاسبات لازم برای ساخت فریمی که در حد متوسط دو فریم متوالی باشد، کار پیچیدهای نیست. به عنوان مثال اگر در یک ثانیه ۴۰ فریم تصویر رندر شده باشد، به طور معمول امکان ایجاد حداکثر ۲۰ فریم اضافی وجود دارد. اما علیرغم تبلیغات زیادی که انویدیا در زمان معرفی این تکنولوژی جدید انجام داد، عملکرد آن موردرضایت بازیخورهای حرفهای نبود چرا که تأخیر را افزایش میداد و عملاً در شرایطی که سرعت اجرای بازی زیر ۴۰ فریم بر ثانیه باشد، چندان مفید نیست.
انویدیا برای رفع مشکل و بهبود تکنولوژی ایجاد فریم اضافی، الگوریتمهای جدیدی طراحی کرده که حرکت عناصر را به کمک هوش مصنوعی پیشبینی میکند و به جای میانگین گرفتن بین دو فریم آماده، تلاش میکند که فریم بعدی را حدس و تخمین بزند! این روش جدید از نظر تأخیری که گیمر حس میکند، بهتر است چرا که صرفاً بین فریمهای موجود میانگینگیری صورت نمیگیرد بلکه حرکت موس و حرکت عناصر در صحنه، در نظر گرفته میشود و فریم بعدی حاصل یک تخمین هوشمندانه است.
نکتهی جالبتر این است که نه یک فریم، بلکه چند فریم اضافی ساخته میشود و لذا نام این تکنولوژی، Multi Frame Generation یا به صورت اختصاری MFG است. با استفاده از MFG، اگر در یک ثانیه ۶۰ فریم رندر شده باشد، به ۲۴۰ فریم تبدیل میشود و این تعداد فریم برای نمایش روان تصویر در مانیتور یا تلویزیون 4K که از ریفرشریت بالا نظیر ۱۲۰ یا ۱۴۴ و یا ۱۶۰ هرتز و ارقام بالاتر پشتیبانی میکند، بسیار مفید است.
در مورد MFG نیز بهتر است صبر کنیم و عملکرد آن را در دنیای واقعی و بدون در نظر گرفتن ادعاهای NVIDIA بررسی کنیم ولیکن پیشرفت بزرگی نسبت به فریم جنریشن عادی نسل قبل است و گیمرهای حرفهای و علاقهمندان به بازیهای گرافیکی را امیدوار کرده است.
نمودار زیر سرعت اجرای چند بازی گرافیکی و سنگین امروزی به کمک کارت گرافیک RTX 5090 را در ۳ حالت مقایسه میکند:
- حالت اول بدون فعال بودن DLSS و اجرا کردن بازی با رزولوشن 4K و حداکثر تنظیمات گرافیکی
- حالت دوم استفاده از DLSS 3 برای پردازش فریمها با رزولوشن کمتر و بزرگنمایی تصویر به کمک هوش مصنوعی
- حالت سوم استفاده از DLSS 4 برای بزرگنمایی تصویر به کمک هوش مصنوعی است.
در برخی از عناوین نظیر Hogwarts Legacy عملکرد DLSS 4 در حد ۵.۶ برابر حالت عادی است و حدود ۲.۴۴ برابر حالتی است که از DLSS 3 استفاده شود. در برخی عناوین نیز اختلاف عملکرد DLSS 4 با DLSS 3 کمتر است، به عنوان مثال در Alan Wake 2 اختلاف در حد ۳۳ درصد است یا به عبارت دیگر سرعت اجرا ۱.۳۳ برابر شده است. ولیکن در هر صورت استفاده از DLSS در بازیها، سرعت اجرای بازی با رزولوشن 4K را بیش از ۲ برابر افزایش میدهد.
کاهش لگ در بازیها به کمک NVIDIA Reflex 2
قبل از آنکه به انویدیا ریفلکس ۲ بپردازیم، بهتر است به این سوال پاسخ دهیم که NVIDIA Reflex چیست؟!
انویدیا چند سال پیش تکنولوژی خاصی برای کاهش تأخیری که گیمرها حس میکردند، معرفی کرده که نام آن NVIDIA Reflex است. در حالت عادی زمانی که موس را حرکت میدهید یا دکمهای از کیبورد را فشار میدهید، سیگنال مربوطه به پردازنده ارسال میشود و پردازنده نیز موقعیت عناصر در بازی را محاسبه کرده و دستورات لازم برای پردازش گرافیک بازی را به کارت گرافیک ارسال میکند و کارت گرافیک نیز پس از مدتی پردازش کردن، فریم را رندر کرده و به مانیتور یا تلویزیون ارسال میکند. لذا بین حرکت موس و آنچه روی تلویزیون یا مانیتور مشاهده میکنید، تأخیر وجود دارد، هر چند در حتی میلیثانیه و بسیار ناچیز است. نکتهی مهم این است که همین تأخیر بسیار کوچک که فرضاً در حد ۱۴ میلیثانیه است، شاید در بازیهای شوتر اول شخص برای گیمرهای حرفهای، محسوس باشد و به عنوان مثال تیر دقیقاً به محلی که نشانهگیری کردهاند، اصابت نکند!
انویدیا ریفلکس تلاشی برای کاهش اثر تأخیر است و در واقع با فرض ادامه حرکت موس یا حرکت به کمک دکمههای کیبورد، موقعیت عناصر در فریم بعدی را پیشبینی میکند و لذا تأخیری که گیمر حس میکند، کمتر است و شاید مشکل نشانه رفتن دقیق گیمرهای حرفهای، با فعال کردن گزینهی NVIDIA Reflex در بازی حل شود.
تکنولوژی انویدیا ریفلکس ۲ برای تمام کارت گرافیکهای RTX قابل استفاده خواهد بود و تفاوت آن با نسل قبل در این است که نه فقط قبل از رندر شدن فریم، بلکه پس از رندر شدن فریم نیز یک مرتبهی دیگر ورودی موس و کیبورد بررسی میشود. ممکن است دوربین حرکت کرده باشد، در این صورت با استفاده از هوش مصنوعی، بخشهای خارج از تصویر با استفاده از فریمهای قبلی بازسازی میشود.
مثال زیر چیزی است که انویدیا ارایه کرده است. فرض کنید که در فریم اول، گیمر به سرعت تفنگ را حد ۳ درجه چرخانده تا به دشمن شلیک کند. به دلیل تأخیرهای موجود، اگر انویدیا ریفلکس فعال نباشد، شلیک به محل اشتباه صورت میگیرد که موردنظر گیمر نبوده اما با فعال کردن ریفلکس، محاسبات بر اساس چرخش تفنگ در حد ۲ درجه صورت میگیرد اما حرکت موس با سرعت بالاتر ادامه پیدا میکند و چرخش به ۳ درجه میرسد. در این صورت لازم است که پس از رندر شدن فریم با چرخش ۲ درجهای تفنگ، یک بار دیگر تصحیح به اندازه ۱ درجه انجام شود. به این ترتیب بخشی از صحنه که در کادر نیست، وارد کادر تصویر میشود. این بخش اضافی به کمک الگوریتمهای هوش مصنوعی ساخته میشود.
طبق تجربهی گیمرهای حرفهای، تکنولوژی انویدیا ریفلکس ۲ و همینطور نسل اول برای شرایطی که سرعت اجرای بازی کمتر از ۳۰ فریم بر ثانیه باشد، مناسب نیست و مشکلات گرافیکی محسوس میشود و در واقع بهتر است که سرعت اجرای بازی بیشتر از ۶۰ فریم بر ثانیه باشد تا عملکرد بهینهای داشته باشد.
اینتوتک