انویدیا یکی از دو کمپانی بزرگ طراحی کارت گرافیک، امسال در نمایشگاه CES نسل جدید کارت گرافیکها که RTX 50 نام دارد را معرفی کرد. البته همه مدلهای کارت گرافیکهای RTX سری ۵۰۰۰ انویدیا با کد Blackwell معرفی نشده است و فعلاً مدل پرچمدار RTX 5090 معرفی شده که از نظر قیمت و توان مصرفی و همینطور قدرت پردازشی، فاصله قابل توجهی با RTX 4090 دارد.
در ادامه به مقایسه کارت گرافیک RTX 5090 با RTX 4090 بر اساس مشخصات و بنچمارکهای منتشر شده میپردازیم.
مقایسه مشخصات کارت گرافیک RTX 5090 با RTX 4090
انویدیا معمولاً در هر نسل جدید از کارت گرافیکهایی که معرفی میکند، تکنولوژیهای خاص و جدیدی نیز معرفی میکند. به نظر میرسد که ویژگی و تمایز اصلی سری ۵۰۰۰ با ۴۰۰۰، پشتیبانی از DLSS 4 باشد.
منظور از DLSS در کارت گرافیکهای انویدیا، قابلیت بزرگ کردن تصویر به کمک هوش مصنوعی است به طوری که افت کیفیت تصویر نامحسوس باشد. این قابلیت برای افزایش سرعت اجرا کردن بازیها بسیار مفید است چرا که فریمهای تصویر با رزولوشن پایینتر نظیر فول اچدی یا QHD رندر میشود که در واقع بار پردازشی کمتری دارد و سریعتر انجام میشود. سپس تصویر بزرگ میشود تا روی تلویزیون 4K یا مانیتورهای رزولوشنبالا، کیفیت خوبی داشته باشد.
جدول زیر مقایسهای بین تراشهی پردازنده گرافیکی در کارت گرافیک RTX 5090 و RTX 4090 است. مساحت تراشه بیشتر شده، واحدهای پردازشی افزایش پیدا کرده و البته توان مصرفی نیز بیشتر شده است!
کارت گرافیک | RTX 5090 | RTX 4090 |
---|---|---|
معماری | GB202 | AD102 |
فرآیند ساخت | TSMC 4NP | TSMC 4N |
تعداد ترانزیستور (میلیارد) | 92 | 76.3 |
مساحت تراشه (میلیمتر مربع) | 744 | 608.4 |
واحدهای SM | 170 | 128 |
تعداد شیدر | 21760 | 16384 |
هستههای تنسور | 680 | 512 |
هستههای رهگیری پرتو | 170 | 128 |
سرعت بوست (مگاهرتز) | 2407 | 2520 |
سرعت رم (گیگابیت بر ثانیه) | 28 | 21 |
مقدار رم ویدیویی (گیگابایت) | 32 | 24 |
پهنای باس رم (بیت) | 512 | 384 |
کش L2 | 128 ؟ | 72 |
تعداد خروجی رندر | 240 ؟ | 176 |
تعداد واحد نگاشت بافت | 680 | 512 |
توان خام پردازشی (ترافلاپس) (محاسبات اعشاری ۳۲ بیتی) |
104.8 | 82.6 |
توان خام پردازشی (ترافلاپس) محاسبات اعشاری ۱۶ بیتی محاسبات عدد صحیح ۸ بیتی |
1676 3352 ؟ |
661 1321 ؟ |
پهنای باند حافظه (گیگابایت بر ثانیه) |
1792 | 1008 |
توان مصرفی | 575 | 450 |
زمان معرفی | Jan 2025 | Oct 2022 |
قیمت کارت گرافیک در زمان معرفی | 1999 دلار | 1599 دلار |
با نگاهی گذرا به مشخصات روی کاغذ، روشن است که کارت گرافیک RTX 5090 قویتر است. قیمت RTX 5090 در زمان معرفی محصول، حدود ۲ هزار دلار است که ۲۵ درصد بالاتر از قیمت RTX 4090 در زمان معرفی است. این افزایش قیمت با توجه به بزرگتر شدن تراشهی مرکزی، منطقی به نظر میرسد ولیکن برای گیمرهای حرفهای که شاید محدودیت بودجه داشته باشند، جالب نیست.
هنوز مشخصات کارت گرافیکهای ردهاول دیگر که قیمت مناسبتری دارند، اعلام نشده است. شاید قیمت RTX 5070 قابل قبول باشد یا گیمر با توجه به محدودیت بودجه سراغ مدلهای رده متوسط سری ۵۰۰۰ نظیر کارت گرافیک RTX 5060 برود که به هر حال از مدل همرده در نسل قبل که RTX 4060 و RTX 3060 است، قویتر است.
اما به مقایسه مشخصات برگردیم، بعضی از واحدهای پردازشی مهم، از نظر تعداد رشد قابل توجهی دارند که بیشتر از افزایش مساحت تراشه است. به عنوان مثال تعداد چندپردازندههای جریانی یا Streaming Multiprocessors که به اختصار واحد SM گفته میشود، ۱۷۰ عدد است که از ۱۲۸ عدد RTX 4090، حدود ۳۳ درصد بیشتر است. تعداد واحدهای محاسباتی مرتبط با SM نیز به همین صورت افزایش پیدا کرده است، به عنوان مثال تعداد واحدهای محاسباتی برای Ray Tracing یا رهگیری پرتو نیز از ۱۲۸ به ۱۷۰ افزایش پیدا کرده است.
سرعت کلاک کارت گرافیک RTX 5090 اندکی پایینتر از RTX 4090 است. با در نظر گرفتن کاهش ۵ درصدی سرعت کلاک و افزایش ۳۳ درصدی تعداد واحدهای محاسباتی، قدرت خام پردازشی تقریباً ۲۷ درصد بیش از نسل قبلی است اما ممکن است با بهینهسازیهای معماری پردازنده گرافیکی، سرعت اجرای بازیها و امتیازی که در بنچمارکها به دست میآید، بیش از ۲۷ درصد افزایش پیدا کند.
تفاوت دیگر در مقدار و سرعت حافظه گرافیکی است. مقدار VRAM یا رم ویدیویی از ۲۴ به ۳۲ گیگابایت تغییر کرده که ۳۳ درصد بیشتر است و سرعت آن نیز افزایش پیدا کرده است چرا که از تکنولوژی GDDR7 استفاده شده است. حتی پهنای باس نیز از ۳۸۴ بیت به ۵۱۲ بیت تغییر کرده و در نتیجه پهنای باند حافظه ویدیویی کارت گرافیک، افزایش ۷۸ درصدی نشان میدهد!
پیشرفت قدرت محاسباتی هوش مصنوعی RTX 5090
بزرگترین تفاوت در مقایسه قدرت کارت گرافیک RTX 5090 و RTX 4090 به مقولهی هوش مصنوعی مربوط میشود که معمولاً محاسبات اعشاری با دقت ۳۲ یا ۶۴ بیت موردنیاز نیست بلکه محاسبات اعشاری ۱۶ بیتی یا محاسبات اعداد صحیح ۸ بیتی، کاربرد بیشتری دارد. قدرت پردازشی RTX 5090 در محاسبات اعشاری ۱۶ بیتی، دقیقاً اعلام نشده اما با فرض تشابه معماری، قدرت پردازشی RTX معادل ۶۶۱ ترافلاپس است در حالی که قدرت پردازشی محاسبات اعشاری ۱۶ بیتی در RTX 5090 به ۱۶۷۶ ترافلاپس رسیده است که حدود ۲.۵۴ برابر نسل قبلی است. محاسبات عدد صحیح نیز با قدرت پردازشی ۲.۵۴ برابر نسل قبلی انجام میشود و معادل ۳۳۵۲ تاپس است.
منظور از ترافلاپس، Tera Floating Operations Per Second و به معنی تریلیون محاسبه اعشاری در ثانیه است.
منظور از تاپس، Tera Operations Per Second و به معنی تریلیون عمل در ثانیه است.
به عنوان مقایسه در نظر بگیرید که قدرت پردازشی RX 7900 XTX که کارت گرافیک پرچمدار نسل قبلی AMD است، در انجام محاسبات عدد صحیح ۸ بیتی فقط ۱۲۳ تاپس است و در محاسبات اعشاری ۱۶ بیتی نیز قدرت آن ۱۲۳ ترافلاپس است. این ارقام بسیار کمتر از قدرت پردازشی RTX 5090 است. به همین جهت است که در سیستمهای مخصوص محاسبات هوش مصنوعی، استفاده از کارت گرافیکهای انویدیا مرسوم است. با توجه به قدرت پردازشی، میتوان گفت که انویدیا در طراحی RTX 5090 روی مقولهی هوش مصنوعی حساب زیادی باز کرده است.
مقایسه عملکرد RTX 5090 با RTX 4090 در بازیها
در حال حاضر با توجه به اینکه خرید RTX 5090 برای عموم گیمرها امکانپذیر نیست، بررسی تخصصی به صورت مستقل انجام نشده است و تنها بنچمارک RTX 5090 در بازیها، اسلایدی است که انویدیا منتشر کرده است. طبق ادعای انویدیا، سرعت اجرای بازیهای مختلف با کارت گرافیک RTX 5090 تقریباً ۵۰ درصد بیشتر از نسل قبلی است. این تفاوت در حالتی که DLSS برای بزرگ کردن تصویر و قابلیت رهگیری پرتو برای بهبود نورپردازی و سایهزنی و بازتابها فعال باشد، افزایش پیدا میکند به طوری که بازی Alan Wake 2 با سرعتی بیش از ۲ برابر اجرا میشود. بازی سنگین و گرافیکی امروزی نظیر Cyberpunk 2077 یا Black Myth: Wukong نیز از قابلیتهای هوش مصنوعی و رهگیری پرتو در نسل جدید، کمال بهره را میبرند و سرعت اجرا افزایش بیش از ۲ برابر دارد. در برخی بازیها که از DLSS و Ray Tracing استفاده نشده، عملکرد RTX 5090 حدود ۲۷ درصد بهتر از نسل قبلی است چرا که بهینهسازیهای معماری و هوش مصنوعی، عملاً بلااستفاده مانده است.
تکنولوژی NVIDIA DLSS 4 قطعاً برای بهبود سرعت اجرای بازیها در رزولوشنهای بالا نظیر 4K و 5K بسیار مهم است. در کنار معرفی نسل قبلی که DLSS 3.5 است، تکنولوژی ایجاد فریم اضافی یا Frame Generation معرفی شد. این تکنولوژی با استفاده از فریمهای رندر شده، فریمی در حد واسط ۲ فریم پیاپی میسازد تا اجرای بازی روانتر و بهتر به نظر برسد. به هر حال ساخت فریم بر اساس چند فریم موجود، بار پردازشی کمتری نسبت به انجام همهی محاسبات لازم برای ساخت فریم جدید است ولیکن اشکال این روش، افزایش تأخیر است که به خصوص در حالتی که سرعت اجرای بازی کم باشد، محسوس است.
مدیر انویدیا در اظهارنظر پیرامون DLSS 4 میگوید که از الگوریتمهای هوش مصنوعی برای پیشبینی آینده و ایجاد فریمهای بعدی تصویر، استفاده شده است که نتیجه ایجاد ۱ الی ۳ فریم بسته به شرایط است. تفاوت روش جدید با روش قبل این است که به جای محاسبه فریمی در حد واسط فریمهای موجود، موقعیت آینده اجسام و بافت محاسبه میشود و در نتیجه ساخت فریمهای اضافی، تأخیر کمتری ایجاد میکند.
انویدیا در مورد برخی بهینهسازیهای جدید صحبت کرده که برخی از بهینهسازیها، مختص پردازندههای گرافیکی Blackwell است و برخی دیگر برای نسلهای قبلی RTX نیز کاربرد دارد. به عنوان مثال RTX Neural Materials تکنولوژی جدیدی است که با استفاده از هوش مصنوعی، نیاز به بافت و توضیحات مواد را کاهش میدهد و مصرف حافظه ویدیویی کارت گرافیک را تا یک سوم کاهش میدهد. این تکنولوژی مختص نسل جدید است. مثال دیگر بهینهسازی DLSS با استفاده از تبدیلهای هوش مصنوعی جدیدی است که بهتر از CNN یا شبکه عصبی حلقوی عمل میکند و کیفیت بزرگنمایی تصویر بیشتر میشود و در عین حال بار پردازشی کاهش پیدا میکند. این ویژگی برای کارت گرافیکهای RTX نسلهای قبلی نیز کاربرد دارد.
در پایان یادآوری میکنیم که قیمت RTX 5090 در ماههای ابتدایی عرضه محصول، بیش از حد بالاست و بهتر است کمی صبر کنید تا قیمت آن به خصوص در بازار ایران، منطقی و قابل قبول شود. صرفنظر از قیمت، منتظر بنچمارکهای تخصصی و مستقل باشید تا عملکرد واقعی مدلهای مختلف و به خصوص میانرده نظیر کارت گرافیک RTX 5060 در بازیهای سنگین و گرافیکی، مشخص شود.
اینتوتک