انویدیا یکی از دو کمپانی بزرگ طراحی کارت گرافیک، امسال در نمایشگاه CES نسل جدید کارت گرافیک‌ها که RTX 50 نام دارد را معرفی کرد. البته همه مدل‌های کارت گرافیک‌های RTX سری ۵۰۰۰ انویدیا با کد Blackwell معرفی نشده است و فعلاً مدل پرچم‌دار RTX 5090 معرفی شده که از نظر قیمت و توان مصرفی و همین‌طور قدرت پردازشی، فاصله قابل توجهی با RTX 4090 دارد.

در ادامه به مقایسه کارت گرافیک RTX 5090 با RTX 4090 بر اساس مشخصات و بنچ‌مارک‌های منتشر شده می‌پردازیم.

مقایسه مشخصات کارت گرافیک RTX 5090 با RTX 4090

انویدیا معمولاً‌ در هر نسل جدید از کارت گرافیک‌هایی که معرفی می‌کند، تکنولوژی‌های خاص و جدیدی نیز معرفی می‌کند. به نظر می‌رسد که ویژگی و تمایز اصلی سری ۵۰۰۰ با ۴۰۰۰، پشتیبانی از DLSS 4 باشد.

منظور از DLSS در کارت گرافیک‌های انویدیا، قابلیت بزرگ کردن تصویر به کمک هوش مصنوعی است به طوری که افت کیفیت تصویر نامحسوس باشد. این قابلیت برای افزایش سرعت اجرا کردن بازی‌ها بسیار مفید است چرا که فریم‌های تصویر با رزولوشن پایین‌تر نظیر فول اچ‌دی یا QHD رندر می‌شود که در واقع بار پردازشی کمتری دارد و سریع‌تر انجام می‌شود. سپس تصویر بزرگ می‌شود تا روی تلویزیون 4K یا مانیتورهای رزولوشن‌بالا، کیفیت خوبی داشته باشد.

جدول زیر مقایسه‌ای بین تراشه‌ی پردازنده گرافیکی در کارت گرافیک RTX 5090 و RTX 4090 است. مساحت تراشه بیشتر شده، واحدهای پردازشی افزایش پیدا کرده و البته توان مصرفی نیز بیشتر شده است!

کارت گرافیک RTX 5090 RTX 4090
معماری GB202 AD102
فرآیند ساخت TSMC 4NP TSMC 4N
تعداد ترانزیستور (میلیارد) 92 76.3
مساحت تراشه (میلی‌متر مربع) 744 608.4
واحدهای SM 170 128
تعداد شیدر 21760 16384
هسته‌های تنسور 680 512
هسته‌های رهگیری پرتو 170 128
سرعت بوست (مگاهرتز) 2407 2520
سرعت رم (گیگابیت بر ثانیه) 28 21
مقدار رم ویدیویی (گیگابایت) 32 24
پهنای باس رم (بیت) 512 384
کش L2 128 ؟ 72
تعداد خروجی رندر 240 ؟ 176
تعداد واحد نگاشت بافت 680 512

توان خام پردازشی (ترافلاپس)

(محاسبات اعشاری ۳۲ بیتی)

104.8 82.6

توان خام پردازشی (ترافلاپس)

محاسبات اعشاری ۱۶ بیتی

محاسبات عدد صحیح ۸ بیتی

1676

3352 ؟

661

1321 ؟

پهنای باند حافظه (گیگابایت بر ثانیه)

1792 1008
توان مصرفی 575 450
زمان معرفی Jan 2025 Oct 2022
قیمت کارت گرافیک در زمان معرفی 1999 دلار 1599 دلار

با نگاهی گذرا به مشخصات روی کاغذ، روشن است که کارت گرافیک RTX 5090 قوی‌تر است. قیمت RTX 5090 در زمان معرفی محصول، حدود ۲ هزار دلار است که ۲۵ درصد بالاتر از قیمت RTX 4090 در زمان معرفی است. این افزایش قیمت با توجه به بزرگ‌تر شدن تراشه‌ی مرکزی، منطقی به نظر می‌رسد ولیکن برای گیمرهای حرفه‌ای که شاید محدودیت بودجه داشته باشند، جالب نیست.

هنوز مشخصات کارت گرافیک‌های رده‌اول دیگر که قیمت مناسب‌تری دارند، اعلام نشده است. شاید قیمت RTX 5070 قابل قبول باشد یا گیمر با توجه به محدودیت بودجه سراغ مدل‌های رده متوسط سری ۵۰۰۰ نظیر کارت گرافیک RTX 5060 برود که به هر حال از مدل هم‌رده در نسل قبل که RTX 4060 و RTX 3060 است، قوی‌تر است.

اما به مقایسه مشخصات برگردیم، بعضی از واحدهای پردازشی مهم، از نظر تعداد رشد قابل توجهی دارند که بیشتر از افزایش مساحت تراشه است. به عنوان مثال تعداد چندپردازنده‌های جریانی یا Streaming Multiprocessors که به اختصار واحد SM گفته می‌شود، ۱۷۰ عدد است که از ۱۲۸ عدد RTX 4090، حدود ۳۳ درصد بیشتر است. تعداد واحدهای محاسباتی مرتبط با SM نیز به همین صورت افزایش پیدا کرده است، به عنوان مثال تعداد واحدهای محاسباتی برای Ray Tracing یا رهگیری پرتو نیز از ۱۲۸ به ۱۷۰ افزایش پیدا کرده است.

سرعت کلاک کارت گرافیک RTX 5090 اندکی پایین‌تر از RTX 4090 است. با در نظر گرفتن کاهش ۵ درصدی سرعت کلاک و افزایش ۳۳ درصدی تعداد واحدهای محاسباتی، قدرت خام پردازشی تقریباً ۲۷ درصد بیش از نسل قبلی است اما ممکن است با بهینه‌سازی‌های معماری پردازنده گرافیکی، سرعت اجرای بازی‌ها و امتیازی که در بنچ‌مارک‌ها به دست می‌آید، بیش از ۲۷ درصد افزایش پیدا کند.

تفاوت دیگر در مقدار و سرعت حافظه گرافیکی است. مقدار VRAM یا رم ویدیویی از ۲۴ به ۳۲ گیگابایت تغییر کرده که ۳۳ درصد بیشتر است و سرعت آن نیز افزایش پیدا کرده است چرا که از تکنولوژی GDDR7 استفاده شده است. حتی پهنای باس نیز از ۳۸۴ بیت به ۵۱۲ بیت تغییر کرده و در نتیجه پهنای باند حافظه ویدیویی کارت گرافیک، افزایش ۷۸ درصدی نشان می‌دهد!

پیشرفت قدرت محاسباتی هوش مصنوعی RTX 5090

بزرگ‌ترین تفاوت در مقایسه قدرت کارت گرافیک RTX 5090 و RTX 4090 به مقوله‌ی هوش مصنوعی مربوط می‌شود که معمولاً محاسبات اعشاری با دقت ۳۲ یا ۶۴ بیت موردنیاز نیست بلکه محاسبات اعشاری ۱۶ بیتی یا محاسبات اعداد صحیح ۸ بیتی، کاربرد بیشتری دارد. قدرت پردازشی RTX 5090 در محاسبات اعشاری ۱۶ بیتی، دقیقاً اعلام نشده اما با فرض تشابه معماری، قدرت پردازشی RTX معادل ۶۶۱ ترافلاپس است در حالی که قدرت پردازشی محاسبات اعشاری ۱۶ بیتی در RTX 5090 به ۱۶۷۶ ترافلاپس رسیده است که حدود ۲.۵۴ برابر نسل قبلی است. محاسبات عدد صحیح نیز با قدرت پردازشی ۲.۵۴ برابر نسل قبلی انجام می‌شود و معادل ۳۳۵۲ تاپس است.

منظور از ترافلاپس، Tera Floating Operations Per Second و به معنی تریلیون محاسبه اعشاری در ثانیه است.

منظور از تاپس، Tera Operations Per Second و به معنی تریلیون عمل در ثانیه است.

به عنوان مقایسه در نظر بگیرید که قدرت پردازشی RX 7900 XTX که کارت گرافیک پرچم‌دار نسل قبلی AMD است، در انجام محاسبات عدد صحیح ۸ بیتی فقط ۱۲۳ تاپس است و در محاسبات اعشاری ۱۶ بیتی نیز قدرت آن ۱۲۳ ترافلاپس است. این ارقام بسیار کمتر از قدرت پردازشی RTX 5090 است. به همین جهت است که در سیستم‌های مخصوص محاسبات هوش مصنوعی، استفاده از کارت گرافیک‌های انویدیا مرسوم است. با توجه به قدرت پردازشی، می‌توان گفت که انویدیا در طراحی RTX 5090 روی مقوله‌ی هوش مصنوعی حساب زیادی باز کرده است.

مقایسه عملکرد RTX 5090 با RTX 4090 در بازی‌ها

در حال حاضر با توجه به اینکه خرید RTX 5090 برای عموم گیمرها امکان‌پذیر نیست، بررسی تخصصی به صورت مستقل انجام نشده است و تنها بنچ‌مارک RTX 5090 در بازی‌ها، اسلایدی است که انویدیا منتشر کرده است. طبق ادعای انویدیا، سرعت اجرای بازی‌های مختلف با کارت گرافیک RTX 5090 تقریباً ۵۰ درصد بیشتر از نسل قبلی است. این تفاوت در حالتی که DLSS برای بزرگ کردن تصویر و قابلیت رهگیری پرتو برای بهبود نورپردازی و سایه‌زنی و بازتاب‌ها فعال باشد، افزایش پیدا می‌کند به طوری که بازی Alan Wake 2 با سرعتی بیش از ۲ برابر اجرا می‌شود. بازی سنگین و گرافیکی امروزی نظیر Cyberpunk 2077 یا Black Myth: Wukong نیز از قابلیت‌های هوش مصنوعی و رهگیری پرتو در نسل جدید، کمال بهره را می‌برند و سرعت اجرا افزایش بیش از ۲ برابر دارد. در برخی بازی‌ها که از DLSS و Ray Tracing استفاده نشده، عملکرد RTX 5090 حدود ۲۷ درصد بهتر از نسل قبلی است چرا که بهینه‌سازی‌های معماری و هوش مصنوعی، عملاً بلااستفاده مانده است.

مقایسه RTX 5090 با RTX 4090 از نظر قدرت پردازشی و برتری معماری و هوش مصنوعی

تکنولوژی NVIDIA DLSS 4 قطعاً برای بهبود سرعت اجرای بازی‌ها در رزولوشن‌های بالا نظیر 4K و 5K بسیار مهم است. در کنار معرفی نسل قبلی که DLSS 3.5 است، تکنولوژی ایجاد فریم اضافی یا Frame Generation معرفی شد. این تکنولوژی با استفاده از فریم‌های رندر شده، فریمی در حد واسط ۲ فریم پیاپی می‌سازد تا اجرای بازی روان‌تر و بهتر به نظر برسد. به هر حال ساخت فریم بر اساس چند فریم موجود، بار پردازشی کمتری نسبت به انجام همه‌ی محاسبات لازم برای ساخت فریم جدید است ولیکن اشکال این روش، افزایش تأخیر است که به خصوص در حالتی که سرعت اجرای بازی کم باشد، محسوس است.

مدیر انویدیا در اظهارنظر پیرامون DLSS 4 می‌گوید که از الگوریتم‌های هوش مصنوعی برای پیش‌بینی آینده و ایجاد فریم‌های بعدی تصویر، استفاده شده است که نتیجه ایجاد ۱ الی ۳ فریم بسته به شرایط است. تفاوت روش جدید با روش قبل این است که به جای محاسبه فریمی در حد واسط فریم‌های موجود، موقعیت آینده اجسام و بافت محاسبه می‌شود و در نتیجه ساخت فریم‌های اضافی، تأخیر کمتری ایجاد می‌کند. 

انویدیا در مورد برخی بهینه‌سازی‌های جدید صحبت کرده که برخی از بهینه‌سازی‌ها، مختص پردازنده‌های گرافیکی Blackwell است و برخی دیگر برای نسل‌های قبلی RTX نیز کاربرد دارد. به عنوان مثال RTX Neural Materials تکنولوژی جدیدی است که با استفاده از هوش مصنوعی، نیاز به بافت و توضیحات مواد را کاهش می‌دهد و مصرف حافظه ویدیویی کارت گرافیک را تا یک سوم کاهش می‌دهد. این تکنولوژی مختص نسل جدید است. مثال دیگر بهینه‌سازی DLSS با استفاده از تبدیل‌های هوش مصنوعی جدیدی است که بهتر از CNN یا شبکه عصبی حلقوی عمل می‌کند و کیفیت بزرگنمایی تصویر بیشتر می‌شود و در عین حال بار پردازشی کاهش پیدا می‌کند. این ویژگی برای کارت گرافیک‌های RTX نسل‌های قبلی نیز کاربرد دارد.

در پایان یادآوری می‌کنیم که قیمت RTX 5090 در ماه‌های ابتدایی عرضه محصول، بیش از حد بالاست و بهتر است کمی صبر کنید تا قیمت آن به خصوص در بازار ایران، منطقی و قابل قبول شود. صرف‌نظر از قیمت، منتظر بنچ‌مارک‌های تخصصی و مستقل باشید تا عملکرد واقعی مدل‌های مختلف و به خصوص میان‌رده نظیر کارت گرافیک RTX 5060 در بازی‌های سنگین و گرافیکی، مشخص شود.