در نمایشگاه CES امسال، انویدیا یکی از دو کمپانی برتر تولیدکننده پردازنده گرافیکی، در مورد کارت گرافیک‌های سری RTX 50 که البته به RTX 5000 معروف است، اطلاعات جدیدی منتشر کرده و حتی مشخصات و قیمت کارت گرافیک RTX 5090 اعلام شده است. اگر در فکر خرید سیستم گیمینگ جدید هستید یا میخواهید لپ تاپ با گرافیک RTX 5000 خریداری کنید، بد نیست در مورد ویژگی‌های خاص و نقاط قوت نسل جدید نسبت به نسل‌های قبلی، اطلاعات کافی داشته باشید.

در این مقاله به چند ویژگی برتر نسل جدید و پیشرفت انویدیا در عرصه بزرگ کردن تصویر به کمک هوش مصنوعی یا تکنولوژی DLSS و کاهش اثر تأخیر در بازی‌ها با تکنولوژی NVIDIA Reflex و همین‌طور مقوله‌ی Multi Frame Generation یا ایجاد فریم‌های اضافی تصویر برای روان‌تر اجرا کردن بازی‌های امروزی می‌پردازیم. با مقاله‌ای دیگر از دانش‌نامه‌ی اینتوتک در حوزه‌ی گرافیک و سخت‌افزار همراه باشید.

افزایش قدرت محاسبات هوش مصنوعی و اثرات آن

انویدیا در نمایشگاه CES امسال اطلاعات جالبی در خصوص کارت گرافیک‌های نسل جدید با معماری Blackwell منتشر کرده است. ویژگی اصلی نسل جدید، افزایش توانمندی در محاسبات هوش مصنوعی است که در نتیجه آن، تکنولوژی‌هایی نظیر رندرینگ عصبی یا به کمک شبکه عصبی (Neural Rendering)، ایجاد فریم‌های اضافی با پیش‌بینی حرکت عناصر (Multi Frame Generation)، تخصیص بافت یا تکسچر به عناصر به کمک شبکه عصبی (Neural Materials) و بزرگ‌نمایی تصویر به کمک هوش مصنوعی یا DLSS شکل گرفته است. همه‌ی این موارد مبتنی بر هوش مصنوعی است و در بهبود سرعت اجرای بازی‌ها مفید است.

تفاوت اصلی معماری Blackwell این است که از محاسبات عدد اعشاری با دقت کم که به اختصار FP4 گفته می‌شود و در واقع اعداد اعشاری ۴ بیتی، به صورت نیتیو پشتیبانی شده است. البته در نسل‌های قبلی نیز محاسبات اعشاری ۴ بیتی امکان‌پذیر بوده ولیکن قدرت محاسباتی ۲ برابر قدرت محاسبات اعشاری ۸ بیتی نبود! اما در نسل جدید قدرت محاسبات FP4 معادل ۲ برابر قدرت محاسبات FP8 است. با توجه به اینکه در شبکه عصبی و یادگیری عمیق، محاسبات با دقت پایین، متداول است، می‌توان نتیجه گرفت کارت گرافیک سری 5000 با اولویت توانمندی بیشتر در عرصه محاسبات هوش مصنوعی طراحی شده است.

انویدیا در کنار بهبود معماری، مدل‌های هوش مصنوعی را نیز بروزرسانی کرده تا از معماری جدید هسته‌ها کمال استفاده را ببرند. نکته‌ی جالب این است که برخی از پیشرفت‌هایی که هم‌زمان با معرفی کارت گرافیک‌های RTX 50 به آن اشاره شده، فقط مختص نسل جدید نیست بلکه نسل‌های قبلی کارت گرافیک‌های RTX انویدیا نیز کم و بیش از آن بهره‌مند می‌شوند. به عبارت دیگر حتی اگر لپ‌تاپی با کارت گرافیک RTX 2050 داشته باشید که اولین خانواده‌ی RTX است، می‌توانید از نسل جدید DLSS در بازی‌ها استفاده کنید.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

قبلاً مقاله‌ای با موضوع مقایسه کارت گرافیک پرچم‌دار نسل جدید با برترین کارت گرافیک نسل قبل منتشر کردیم:

بهبود بافت با Neural Materials

یکی از تکنولوژی‌های مهمی که انویدیا معرفی کرده، به تخصیص بافت در بازی‌ها مربوط می‌شود. منظور از Neural Materials یا تخصیص بافت با بهینه‌سازی به کمک شبکه عصبی این است که هوش مصنوعی با بررسی بافت اجسام در بازی‌ها، نیاز به داده‌های تکراری را کاهش دهد. انویدیا مدعی است که هوش مصنوعی ممکن است میزان استفاده از رم کارت گرافیک را تا یک سوم کاهش دهد!

به عنوان مثال ممکن است حین اجرا کردن یک بازی بهینه شده برای استفاده از Neural Materials، به جای ۱۵ گیگابایت رم ویدیویی کارت گرافیک، فقط ۵ گیگابایت حافظه استفاده شود که تفاوت بسیار زیادی است، به خصوص اگر بازی به دلیل کمبود VRAM کارت گرافیک، از نظر سرعت اجرا محدود شده باشد.

البته دقت کنید که لازم که در ساخت بازی، از تکنولوژی Neural Materials انویدیا به شکل بهینه‌ای استفاده شده باشد و طبعاً بازی‌های قدیمی یا بازی‌های جدیدی که از تکنولوژی جدید انویدیا استفاده نمی‌کنند، بهتر از قبل اجرا نخواهد شد.

انویدیا با همکاری مایکروسافت مدل جدیدی برای شیدرها ارایه کرده که نام آن Cooperative Vectors یا شیدرهای عصبی است. این شیوه‌ی جدید، امکان ترکیب کردن کدهای تنسور و شیدر را فراهم می‌کند. البته هنوز مشخص نیست که آیا این مدل جدید، مختص کارت گرافیک‌های RTX 50 است یا یک استاندارد متن‌باز و عمومی است و سایر کارت گرافیک‌ها نیز از آن پشتیبانی می‌کنند ولیکن می‌توان گفت که اجرا کردن محاسبات مربوطه، به کمک نسل جدید کارت گرافیک‌های انویدیا با سرعت بیشتری انجام می‌شود.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

پیچیده‌تر شدن عناصر گرافیکی بازی‌ها و افزایش تعداد مثلث‌ها

نمودار زیر تعداد مثلث‌هایی است که در طراحی مش و گرافیک بازی‌های مطرح در گذر زمان استفاده شده است. منظور از مثلث‌ها و چندضعلی‌ها، شبکه‌ای از نقاط است که سطح اجسام را می‌سازد و روی آن بافت و رنگ اضافه می‌شود.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

تعداد مثلث‌های به کار رفته در طراحی بازی‌ها در دهه ۱۹۹۰ در حد هزار تا ۱۰ هزار مثلث در یک فریم تصویر بوده، یک دهه بعد تعداد به ۵۰ هزار الی ۱ میلیون مثلث افزایش پیدا کرد. در دهه ۲۰۱۰ و بازی‌هایی نظیر Witcher 3، تعداد مثلث‌ها به ۱ تا ۱۰ میلیون رسید. ۱۰ سال بعد در بازی‌هایی نظیر Cyberpunk 2077 این تعداد به ۱۰ الی ۵۰ میلیون رسیده است و انویدیا می‌گوید در نسل بعدی، باز هم تعداد مثلث‌ها ۱۰ برابر می‌شود! دمویی به اسم Zorah برای به تصویر کشیدن صحنه‌هایی با ۵۰۰ میلیون مثلث توسط انویدیا ارایه شده که می‌توانید ویدیوی آن را در یوتیوب تماشا کنید.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

DLSS چیست؟

با توجه به اینکه اجرا کردن یک بازی سنگین و گرافیکی در حالتی که ابعاد تصویر 4K باشد، به کارت گرافیک بسیار قوی نیاز دارد، سازندگان کارت گرافیک و به خصوص انویدیا، از سال‌ها قبل به دنبال راهی برای بزرگ کردن تصویر با کمترین افت کیفیت بوده‌اند. در حالت عادی زمانی که روی عکس زوم می‌کنید، کیفیت آن کاهش پیدا می‌کند و اگر بیشتر زوم کنید، حتی حالت مربع مربع و شطرنجی پیدا می‌کند. انویدیا و AMD و سایر کمپانی‌ها همواره به دنبال راهی برای جلوگیری از افت کیفیت بوده‌اند.

هدف DLSS انویدیا یا تکنولوژی‌های مشابه این است که فریم‌های بازی با همان رزولوشن معمولی نظیر Full HD یا 1080p پردازش و ساخته شود و سپس فریم آماده شده به کمک هوش مصنوعی، با کمترین افت کیفیت، به یک فریم با ابعاد 4K تبدیل شود. ایجاد فریم با ابعاد کمتر و بزرگ‌نمایی آن به شکل بهینه، در مجموع بار پردازشی کمتری نسبت به اجرا کردن بازی با رزولوشن بالا دارد. لذا DLSS در بازی‌ها، سرعت اجرای بازی را افزایش می‌دهد و تیک و لگ کمتر می‌شود.

نکته‌ی جالب توجه این است که طبق آمار، بیش از ۸۰ درصد گیمرها که کارت گرافیک RTX دارند، از گزینه‌ی DLSS در بازی‌ها استفاده می‌کنند. در واقع DLSS در بیش از ۵۴۰ بازی و اپلیکیشن گرافیکی به کار رفته است و عملکرد آن درخشان است.

به این سوال پاسخ دادیم که DLSS چیست، اما شاید متوجه شده باشید که در بازی‌های امروزی، گزینه‌ی دیگری که در تنظیمات بزرگ‌نمایی تصویر دیده می‌شود، FSR‌ است. این سوال مطرح می‌شود که FSR چیست؟!

هدف تکنولوژی‌های مشابه DLSS انویدیا، نظیر FSR ای‌ام‌دی یا XeSS‌ اینتل مشابه است، گرافیک بازی با رزولوشن پایین‌تر پردازش شود و ابعاد تصویر خروجی به کمک هوش مصنوعی و الگوریتم‌های بهینه، افزایش پیدا کند.

آشنایی با DLSS 4

انویدیا هم‌زمان با معرفی کارت گرافیک RTX 5000 و تکنولوژی‌های مربوط به آن، به DLSS 4 پرداخته است. در نسل جدید DLSS از الگوریتم‌ها و در واقع مدل جدید هوش مصنوعی استفاده شده که نسبت به شبکه‌های عصبی سنتی یا Convolutional Neural Networks در DLSS 3.5 و نسل‌های قبل، عملکرد بهتری دارد. انویدیا از مدل‌های هوش مصنوعی مبتنی بر تبدیل‌ها یا Transforms در بهینه‌سازی DLSS استفاده کرده است و نتیجه‌ی آن افزایش جزئیات تصویر پس از بزرگ‌نمایی است و حتی بار پردازشی کاهش پیدا می‌کند.

تصویر زیر به بازی Horizon Zero مربوط می‌شود و مقایسه‌ای بین عملکرد DLSS ورژن قبل و نسل جدید انجام شده است:

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

در تصویر بعدی نیز عملکرد DLSS 4 را با نسخه قبلی در بازی Alan Wake 2 مقایسه شده است:

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

در هر دو تصویر فوق، عملکرد DLSS 4 در حفظ جزئیات بافت اجسام پس از بزرگ کردن تصویر، قابل توجه است اما اینکه محاسبات موردنیاز چقدر بیشتر است و سرعت اجرای بازی چه مقدار تغییر کرده، جای سوال دارد و به بررسی بیشتری نیاز است.

نکته‌ی مهم این است که شاید سرعت اجرای بازی با کیفیت برابر، بیشتر شده باشد. به عنوان مثال می‌توان در تنظیمات گرافیک بازی، DLSS را روی حالت Performance یا 4X گذاشت و آن را با حالت Quality یا Balanced یا به عبارت دیگر حالت 2X نسل قبل مقایسه کرد.

ایجاد فریم‌های اضافی با Multi Frame Generation

تکنولوژی ایجاد فریم یا Frame Generation در کنار DLSS 3.5 معرفی شد و کار آن ساخت فریم‌های اضافی با استفاده از فریم‌های رندر شده است که به روان‌تر اجرا شدن بازی کمک می‌کند. در واقع محاسبات کامل برای پردازش یک فریم، سنگین است در حالی که محاسبات لازم برای ساخت فریمی که در حد متوسط دو فریم متوالی باشد، کار پیچیده‌ای نیست. به عنوان مثال اگر در یک ثانیه ۴۰ فریم تصویر رندر شده باشد، به طور معمول امکان ایجاد حداکثر ۲۰ فریم اضافی وجود دارد. اما علی‌رغم تبلیغات زیادی که انویدیا در زمان معرفی این تکنولوژی جدید انجام داد، عملکرد آن موردرضایت بازی‌خورهای حرفه‌ای نبود چرا که تأخیر را افزایش می‌داد و عملاً در شرایطی که سرعت اجرای بازی زیر ۴۰ فریم بر ثانیه باشد، چندان مفید نیست.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

انویدیا برای رفع مشکل و بهبود تکنولوژی ایجاد فریم اضافی، الگوریتم‌های جدیدی طراحی کرده که حرکت عناصر را به کمک هوش مصنوعی پیش‌بینی می‌کند و به جای میانگین گرفتن بین دو فریم آماده، تلاش می‌کند که فریم بعدی را حدس و تخمین بزند! این روش جدید از نظر تأخیری که گیمر حس می‌کند، بهتر است چرا که صرفاً بین فریم‌های موجود میانگین‌گیری صورت نمی‌گیرد بلکه حرکت موس و حرکت عناصر در صحنه، در نظر گرفته می‌شود و فریم بعدی حاصل یک تخمین هوشمندانه است.

نکته‌ی جالب‌تر این است که نه یک فریم، بلکه چند فریم اضافی ساخته می‌شود و لذا نام این تکنولوژی، Multi Frame Generation یا به صورت اختصاری MFG است. با استفاده از MFG، اگر در یک ثانیه ۶۰ فریم رندر شده باشد، به ۲۴۰ فریم تبدیل می‌شود و این تعداد فریم برای نمایش روان تصویر در مانیتور یا تلویزیون 4K که از ریفرش‌ریت بالا نظیر ۱۲۰ یا ۱۴۴ و یا ۱۶۰ هرتز و ارقام بالاتر پشتیبانی می‌کند، بسیار مفید است.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

در مورد MFG نیز بهتر است صبر کنیم و عملکرد آن را در دنیای واقعی و بدون در نظر گرفتن ادعاهای NVIDIA بررسی کنیم ولیکن پیشرفت بزرگی نسبت به فریم جنریشن عادی نسل قبل است و گیمرهای حرفه‌ای و علاقه‌مندان به بازی‌های گرافیکی را امیدوار کرده است.

نمودار زیر سرعت اجرای چند بازی گرافیکی و سنگین امروزی به کمک کارت گرافیک RTX 5090 را در ۳ حالت مقایسه می‌کند:

  • حالت اول بدون فعال بودن DLSS و اجرا کردن بازی با رزولوشن 4K و حداکثر تنظیمات گرافیکی
  • حالت دوم استفاده از DLSS 3 برای پردازش فریم‌ها با رزولوشن کمتر و بزرگ‌نمایی تصویر به کمک هوش مصنوعی
  • حالت سوم استفاده از DLSS 4 برای بزرگ‌نمایی تصویر به کمک هوش مصنوعی است.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

در برخی از عناوین نظیر Hogwarts Legacy عملکرد DLSS 4 در حد ۵.۶ برابر حالت عادی است و حدود ۲.۴۴ برابر حالتی است که از DLSS 3 استفاده شود. در برخی عناوین نیز اختلاف عملکرد DLSS 4 با DLSS 3 کمتر است، به عنوان مثال در Alan Wake 2 اختلاف در حد ۳۳ درصد است یا به عبارت دیگر سرعت اجرا ۱.۳۳ برابر شده است. ولیکن در هر صورت استفاده از DLSS در بازی‌ها، سرعت اجرای بازی با رزولوشن 4K را بیش از ۲ برابر افزایش می‌دهد.

کاهش لگ در بازی‌ها به کمک NVIDIA Reflex 2

قبل از آنکه به انویدیا ریفلکس ۲ بپردازیم، بهتر است به این سوال پاسخ دهیم که NVIDIA Reflex چیست؟!

انویدیا چند سال پیش تکنولوژی خاصی برای کاهش تأخیری که گیمرها حس می‌کردند، معرفی کرده که نام آن NVIDIA Reflex است. در حالت عادی زمانی که موس را حرکت می‌دهید یا دکمه‌ای از کیبورد را فشار می‌دهید، سیگنال مربوطه به پردازنده ارسال می‌شود و پردازنده نیز موقعیت عناصر در بازی را محاسبه کرده و دستورات لازم برای پردازش گرافیک بازی را به کارت گرافیک ارسال می‌کند و کارت گرافیک نیز پس از مدتی پردازش کردن، فریم را رندر کرده و به مانیتور یا تلویزیون ارسال می‌کند. لذا بین حرکت موس و آنچه روی تلویزیون یا مانیتور مشاهده می‌کنید، تأخیر وجود دارد، هر چند در حتی میلی‌ثانیه و بسیار ناچیز است. نکته‌ی مهم این است که همین تأخیر بسیار کوچک که فرضاً در حد ۱۴ میلی‌ثانیه است، شاید در بازی‌های شوتر اول شخص برای گیمرهای حرفه‌ای، محسوس باشد و به عنوان مثال تیر دقیقاً به محلی که نشانه‌گیری کرده‌اند، اصابت نکند!

انویدیا ریفلکس تلاشی برای کاهش اثر تأخیر است و در واقع با فرض ادامه حرکت موس یا حرکت به کمک دکمه‌های کیبورد، موقعیت عناصر در فریم بعدی را پیش‌بینی می‌کند و لذا تأخیری که گیمر حس می‌کند، کمتر است و شاید مشکل نشانه رفتن دقیق گیمرهای حرفه‌ای، با فعال کردن گزینه‌ی NVIDIA Reflex در بازی حل شود.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

تکنولوژی انویدیا ریفلکس ۲ برای تمام کارت گرافیک‌های RTX قابل استفاده خواهد بود و تفاوت آن با نسل قبل در این است که نه فقط قبل از رندر شدن فریم، بلکه پس از رندر شدن فریم نیز یک مرتبه‌ی دیگر ورودی موس و کیبورد بررسی می‌شود. ممکن است دوربین حرکت کرده باشد، در این صورت با استفاده از هوش مصنوعی، بخش‌های خارج از تصویر با استفاده از فریم‌های قبلی بازسازی می‌شود.

مثال زیر چیزی است که انویدیا ارایه کرده است. فرض کنید که در فریم اول، گیمر به سرعت تفنگ را حد ۳ درجه چرخانده تا به دشمن شلیک کند. به دلیل تأخیرهای موجود، اگر انویدیا ریفلکس فعال نباشد، شلیک به محل اشتباه صورت می‌گیرد که موردنظر گیمر نبوده اما با فعال کردن ریفلکس، محاسبات بر اساس چرخش تفنگ در حد ۲ درجه صورت می‌گیرد اما حرکت موس با سرعت بالاتر ادامه پیدا می‌کند و چرخش به ۳ درجه می‌رسد. در این صورت لازم است که پس از رندر شدن فریم با چرخش ۲ درجه‌ای تفنگ، یک بار دیگر تصحیح به اندازه ۱ درجه انجام شود. به این ترتیب بخشی از صحنه که در کادر نیست، وارد کادر تصویر می‌شود. این بخش اضافی به کمک الگوریتم‌های هوش مصنوعی ساخته می‌شود.

بررسی DLSS 4 و Reflex 2 و Multi Frame Generation در کارت گرافیک سری 5000 انویدیا

طبق تجربه‌ی گیمرهای حرفه‌ای، تکنولوژی انویدیا ریفلکس ۲ و همین‌طور نسل اول برای شرایطی که سرعت اجرای بازی کمتر از ۳۰ فریم بر ثانیه باشد، مناسب نیست و مشکلات گرافیکی محسوس می‌شود و در واقع بهتر است که سرعت اجرای بازی بیشتر از ۶۰ فریم بر ثانیه باشد تا عملکرد بهینه‌ای داشته باشد.