در این مقاله به بررسی پردازنده‌ی گرافیکی مجتمع در CPUهای اینتل، قدرت پردازشی مدل‌های مختلف و ویژگی‌هایی مثل کوئیک سینک و مجازی‌سازی گرافیکی می‌پردازیم. HD Graphics و Iris پردازنده‌های Core و پنتیوم و سلرون، موضوع اصلی این مطلب است.

پردازنده‌های اینتل برخلاف محصولات AMD، دارای پردازنده‌ی گرافیکی مجتمع یا به اختصار iGPU هستند. AMD برای پردازنده‌هایی که در کنار خود پردازنده‌ی گرافیکی مجتمع دارند، نام APU را انتخاب کرده است و لذا CPU و APU در مقال AMD، مفهومی متفاوت دارد اما اینتل به تمام پردازنده‌های با یا بدون گرافیک مجتمع، CPU می‌گوید.

پردازنده‌های اینتل و APUهای AMD و چرایی وجود پردازنده‌ی گرافیکی مجتمع

پردازنده‌های اینتل برخلاف محصولات AMD، دارای پردازنده‌ی گرافیکی مجتمع یا به اختصار iGPU هستند. AMD برای پردازنده‌هایی که در کنار خود پردازنده‌ی گرافیکی مجتمع دارند، نام APU را انتخاب کرده است و لذا CPU و APU در مقال AMD، مفهومی متفاوت دارد اما اینتل به تمام پردازنده‌های با یا بدون گرافیک مجتمع، CPU می‌گوید.

هدف از اضافه کردن پردازنده‌ی گرافیکی مجتمع این است که نیازی به کارت گرافیک یا در واقع پردازنده‌ی گرافیکی مجزا نباشد. توان مصرفی بهینه شود و هزینه‌ی کمتری برای جمع کردن یک سیستم کامل صرف شود. AMD با دنبال کردن HSA و اینتل با پشتیبانی از OpenCL 2.0 در سری 6000 یا همان اسکای‌لیک، مقصود دیگری را دنبال می‌کنند که چیزی جز استفاده از قدرت پردازشی بخش گرافیک برای امور کلی نیست. به این کاربری به اختصار GPGPU گفته می‌شود.

قابلیت‌های پردازنده‌ی گرافیکی مجتمع در تراشه‌های اینتلی چندان متنوع نیست و شاید با کارت گرافیک‌های انویدیا و AMD قابل قیاس نباشد اما گاهی قابلیت‌های ساده، بسیار مفید واقع می‌شود. در ادامه به موارد مهم اشاره می‌کنم.

کوئیک سینک اینتل یا Quick Sync Video

ویدیوهای فشرده‌ی 4K را روان پخش کنید.

کوئیک سینک که در سال 2011 برای اولین بار معرفی شده، تکنولوژی جالبی برای دیکد سخت‌افزاری ویدیو است و خوشبختانه در اینکد ویدیو با سرعت بالاتر از حد معمول، کاربرد دارد. اینکدرهای تحت استاندارد H.264 و H.265 (دیکد ترکیبی) و برخی انواع مهم توسط کوئیک سینک پردازنده‌های جدید پشتیبانی می‌شوند ولیکن در مورد برخی کدک‌ها، دیکد سخت‌‎افزاری و نرم‌افزاری به صورت ترکیبی انجام می‌شود و در حقیقت پردازنده‌ی اصلی نیز تا حدی دخیل است. در واقع اگر تبدیل ویدیو با مقصودی مثل فشرده‌سازی در حد کم یا سازگار کردن ویدیو انجام شود، می‌توان از کوئیک سینک و سرعت بالای آن بهره جست. کوئیک سینک از نظر کیفیت مثل اینکدرهای قدرتمندی نظیر x264 نیست اما برای تبدیل ویدیو با سرعت بالا و مصرف انرژی کمتر، انتخابی بهینه است. به علاوه کوئیک سینک در دیکد ویدیوهای رزولوشن بالا مثل 1080p و 4K، بار پردازشی هسته‌های پردازنده‌ی اصلی را کم می‌کند و می‌توان با مصرف انرژی کمتر، کامپیوتر را به ایستگاه مالتی‌مدیا تبدیل کرد.

اینتل نام جالبی برای این قابلیت انتخاب کرده است: کوئیک سینک به معنی همگام‌سازی سریع است و منظور این است که ویدیو به سرعت بین کامپیوتر و وسایلی نظیر گوشی، همگام می‌شود. در حقیقت این همگام شدن صرفاً کپی شدن ویدیو نیست بلکه استریم ویدیویی تبدیل و سپس روی حافظه‌ی گوشی و تبلت ذخیره می‌شود.

در مقاله‌ی فوق سرعت x264 و کوئیک سینک اینتل و همین‌طور NVENC انویدیا بررسی شده و جدول زیر گویای خلاصه‌ی نتایج است:

سرعت کانورت کردن فایل و حجم خروجی
  مدت زمان تبدیل فایل (ثانیه) حجم فایل خروجی (مگابایت)
اینتل Quick Sync ۷۱ ۲۴۲
انویدیا NVDENC ۷۷ ۲۴۲
انویدیا CUDA ۸۲ ۲۵۲
x264 پریست Very Fast یک مسیره ۱۰۲ ۲۳۱
x264 پریست Ultra Fast یک مسیره ۳۱۵ ۱۵۲

مجازی‌سازی گرافیکی با Graphics Virtualization Technology

تکنولوژی مجازی‌سازی گرافیک در سال 2014 معرفی شده و در پردازنده‌ی گرافیکی مجتمع Iris Pro اینتل پیاده‌سازی شده است. البته در سال‌های آتی ممکن است دیگر انواع پردازنده‌های گرافیکی نیز از این ویژگی پشتیبانی کنند.

]با GVT-d، پردازش گرافیکی در ماشین مجازی سریع‌تر خواهد شد

Graphics Virtualization Technology یا به اختصار GVT اینتل مثل تکنولوژی VT اینتل برای تسریع شبیه‌سازی سیستم به کمک نرم‌افزارهای ماشین مجازی معرفی شده و پردازش گرافیکی در سیستم عاملی که به صورت مجازی درون سیستم عامل اصلی اجرا را تسریع می‌کند. به عنوان مثال در نرم‌افزار VirtualBox و تحت ویندوز 10، ویندوز 7 نصب و اجرا شده است. می‌توان با فعال کردن VT-d و GVT-d اینتل، پردازنده و پردازنده‌ی گرافیکی را برای پردازش امور مربوط به ویندوز 7، بهینه کرد. GVT-d به معنی تخصیص گرافیک مجتمع به ماشین مجازی است اما می‌توان با GVT-g و GVT-s از پردازنده‌ی گرافیکی در چند ماشین مجازی مختلف استفاده کرد. GVT-g به معنی استفاده‌ی مشترک به صورت زمانی است که در آن درایور گرافیک اصلی استفاده می‌شود و GVT-s به معنی استفاده‌ی مشترک از طریق درایور مجازی است.

در روش GVT-d یا روش مستقیم، درایور سیستم عامل مجازی برای استفاده از پردازنده‌ی گرافیکی انجام وظیفه می‌کند و بدیهی است که با این دسترسی مستقیم و بدون واسطه، عملکرد در بهترین حالت است مگر آنکه درایور سیستم عامل مجازی، مشکلات جدی داشته باشد.

اینتل به پردازنده‌های سری Xeon E3-1200 v3، مدل‌هایی با پردازنده‌ی گرافیکی مجتمع GT3e که در حقیقت آیریس پرو است، اضافه کرده و بدین ترتیب اجرای ماشین مجازی با بهره‌گیری از GVT در گروه زئون نیز امکان‌پذیر است.

کش eDRAM یا سطح چهارم برای پردازنده‌ی گرافیکی مجتمع

اینتل در مدل‌هایی که پردازنده‌ی گرافیکی قدرتمندی دارند، پهنای باند حافظه‌ی رم را کافی نمی‌داند و برای حل مشکل پهنای باند موردنیاز، کش سطح چهارم را اضافه کرده است. پسوند e نشان‌دهنده‌ی وجود eDRAM است و معمولی در گرافیک‌های Iris و Iris Pro چنین حافظه‌ای وجود دارد.

در جدول زیر خلاصه‌ای از نام‌ها و نسل‌های اخیر پردازنده‌ی گرافیکی مجتمع در تراشه‌های اینتلی، ذکر شده است:

مشخصات HD Graphics اینتل و نام مدل‌های مختلف آن
 

مدل سری

پنتیوم

مدل سری

سلرون

نسل نام مدل

حداکثر

گیگافلاپس

OpenGL دایرکت ایکس مدل شیدر OpenCL
Westmere

G6000

P6000

U5000

P4000

U3000

5 HD 43.2 2.1 10.0 4.0 -

سندی بریج

(سری 2000)

B900

G800

G600

B800

B700

G500

G400

6

HD Graphics

HD 3000

HD 2000

-

129.6

64.8

3.1 یا 3.3 10.1 4.1 -

آیوی بریج

(سری 3000)

G2000

A1000

G1600

G1000

G900

7

HD Graphics

HD 4000

HD 2500

332.8

110.4

4.0 11.0 5.0 1.2

سیلورمونت

(اتم)

J2000

N3000

J1000

N2000

7 HD Graphics   4.0 11.0 5.0 1.2

هسول

(سری 4000)

G3000

G1800

G2000

7.5

HD Graphics

HD 5000

HD 4600

HD 4400

HD 4200

P4600

P4700

Iris 5100

Iris Pro 5200

184

704

432

432

432

432

432

832

832

4.3 11.1 5.0 1.2

برودول

(سری 5000)

3000

3700

3200

8

HD Graphics

HD 6000

HD 5600

HD 5500

HD 5300

Iris Pro 6200

Iris 6100

163.2

768

403.2

364.8

34536

883.2

844.8

4.4 11.2 5.0 2.0

ایرمونت

(اتم)

N3700 N3000, N3050, N3150 8 HD Graphics   4.4 11.2 5.0 2.0

N3710

J3710

N3010

J3010

N3060

J3160

HD Graphics 400

HD Graphics 405

 

اسکای‌لیک

(سری 6000)

G4000

3900

3800

9

HD 510

HD 515

HD 520

HD 530

Iris 540

Iris 550

Iris Pro 580

 182.4

384

403.2

441.6

806.4

844.8

1152

4.4 12 5.1 2.0

همان‌طور که در جدول فوق مشاهده می‌کنید، تنوع مدل‌ها به مرور زمان بیشتر شده است و در سری 6000 برای ساده و کوتاه کردن نام‌ها، تغییر نام اساسی صورت گرفته است.

قدرت پردازشی خام پردازنده‌ی گرافیکی مجتمع اینتل

در نسل‌های مختلف قدرت پردازشی خام که بر حسب گیگافلاپس ذکر می‌شود، به صورت زیر است. در باب گیگافلاپس در مجالی دیگر توضیحات کامل خواهیم داد. دقت کنید که قدرت پردازشی در حداکثر سرعت کلاک بخش گرافیک ذکر شده است و طبعاً اگر پردازنده داغ شود و یا مصرف انرژی توسط سازنده‌ی لپ‌تاپ محدود شده باشد، قدرت خام کمتری به دست می‌آید.

Westmere

مدل HD با 12 واحد پردازشی: سرعت 900 مگاهرتز و قدرت خام 43.2 گیگافلاپس

Sandy Bridge (سندی بریج یا سری 2000 دستاپی)

  •  HD Graphics با 6 واحد پردازش
  • HD 2000 با 6 واحد پردازشی: سرعت 1350 مگاهرتز و قدرت خام 64.8 گیگافلاپس
  • HD 3000 با 12 واحد پردازشی: سرعت 1350 مگاهرتز و قدرت خام 129.6 گیگافلاپس

Ivy Bridge (آیوی بریج یا سری 3000 دستاپی)

  •  HD Graphics با 6 واحد پردازش
  • HD 2500 با 6 واحد پردازشی: سرعت 1150 مگاهرتز و قدرت خام 110.4 گیگافلاپس
  • HD 4000 با 16 واحد پردازشی: سرعت 1350 مگاهرتز و قدرت خام 332.8 گیگافلاپس

Haswell (هسول یا سری 4000 دستاپی)

  •  HD Graphics یا کانفیگ GT1 با 10 واحد پردازشی: سرعت 1150 مگاهرتز و قدرت خام 184 گیگافلاپس
  • HD 4200 و 4400 و 4600 و P4600 و P4700 یا کانفیگ GT2 با 20 واحد پردازشی: سرعت 1150 مگاهرتز و قدرت خام 432 گیگافلاپس
  • HD 5000 یا کانفیگ GT3 با 40 واحد پردازشی: حداکثر توان طراحی حرارتی 15 وات و حداکثر سرعت 1.1 گیگاهرتز و قدرت خام 704 گیگافلاپس
  • Iris 5100 یا کانفیگ GT3 با 40 واحد پردازشی: حداکثر توان طراحی حرارتی 28 وات و حداکثر سرعت 1.3 گیگاهرتز و قدرت خام 832 گیگافلاپس
  • Iris Pro 5200 یا کانفیگ GT3e با 40 واحد پردازشی: دارای 128 مگابایت eDRAM، حداکثر توان طراحی حرارتی 28 وات و حداکثر سرعت 1.3 گیگاهرتز و قدرت خام 832 گیگافلاپس

Broadwell (برودول یا سری 5000 دستاپی)

  •  HD Graphics یا کانفیگ GT1 با 12 واحد پردازشی: سرعت 850 مگاهرتز و قدرت خام 163.2 گیگافلاپس
  • HD 5300 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 900 مگاهرتز و قدرت خام 345.6 گیگافلاپس
  • HD 5500 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 950 مگاهرتز و قدرت خام 364.8 گیگافلاپس
  • HD 5600 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 900 مگاهرتز و قدرت خام 403.2 گیگافلاپس
  • HD 6000 یا کانفیگ GT3 با 40 واحد پردازشی: سرعت 1.0 گیگاهرتز و قدرت خام 768 گیگافلاپس
  • Iris 6100 یا کانفیگ GT3 با 40 واحد پردازشی: سرعت 1.1 گیگاهرتز و قدرت خام 844.8 گیگافلاپس
  • Iris Pro 6200 یا کانفیگ GT3e با 48 واحد پردازشی: دارای حداکثر 128 مگابایت eDRAM، سرعت 1.15 گیگاهرتز و قدرت خام 883.2 گیگافلاپس

علاوه بر این در سری Xeon E3 v4 نیز دو مدل دیگر موجود است:

  • HD P5700 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 1 گیگاهرتز و قدرت خام 384 گیگافلاپس
  • Iris Pro P6300 یا کانفیگ GT3e با 48 واحد پردازشی: دارای 128 مگابایت eDRAM، سرعت 1.15 گیگاهرتز و قدرت خام 883.2 گیگافلاپس

Skylake (اسکای‌لیک یا سری 6000 دستاپی)

  • HD 510 یا کانفیگ GT1 با 12 واحد پردازشی: سرعت 950 مگاهرتز و قدرت خام 182.4 گیگافلاپس
  • HD 515 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 1 گیگاهرتز و قدرت خام 384 گیگافلاپس
  • HD 520 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 1 گیگاهرتز و قدرت خام 403.2 گیگافلاپس
  • HD 530 یا کانفیگ GT2 با 24 واحد پردازشی: سرعت 1.15 گیگاهرتز و قدرت خام 441.6 گیگافلاپس
  • Iris 540 یا کانفیگ GT3e با 48 واحد پردازشی: دارای 64 مگابایت eDRAM، سرعت 1.05 گیگاهرتز و قدرت خام 806.4 گیگافلاپس
  • Iris 550 یا کانفیگ GT3e با 48 واحد پردازشی: توان طراحی حرارتی بالاتر از Iris 540، دارای 64 مگابایت eDRAM، سرعت 1.1 گیگاهرتز و قدرت خام 844.8 گیگافلاپس
  • Iris Pro HD 580 یا کانفیگ GT4e با 72 واحد پردازشی: دارای 64 یا 128 مگابایت eDRAM، سرعت 1 گیگاهرتز و قدرت خام 1152 گیگافلاپس

علاوه بر این در سری Xeon E3 v5 نیز دو مدل دیگر موجود است:

  • HD P530 یا کانفیگ GT2 با 24 واحد پردازشی
  • Iris P580 یا کانفیگ GT4e با 72 واحد پردازشی: دارای 64 یا 128مگابایت eDRAM، سرعت 1 گیگاهرتز و قدرت خام 1152 گیگافلاپس

عملکرد گرافیک مجتمع اینتل در قیاس با انویدیا

پردازنده‌ی گرافیکی Iris 540 اینتل، قدرت خام 800 گیگافلاپسی دارد و گرافیک GeForce 930M انویدیا که مبتنی بر معماری مکسول 2 است هم 712 گیگافلاپس قدرت خام دارد. GeForce 920M با وجود آنکه 732 گیگافلاس توان خام دارد، مبتنی بر معماری کپلر است و طبعاً مثل اغلب محصولات سری 900، بهتر از توان خام خود در بنچ‌مارک‌ها ظاهر نمی‌شود.

در بازی بایوشاک اینفینیت با تنظیمات حداکثری، 930M حدود 14 درصد سریع‌تر از Iris 540 اینتل است و 920M حدود 7 درصد کندتر از آن است:

مقایسه Iris 540 اینتل با GeForce 930M و 920M انویدیا از نظر عملکردی

HD 530 با قدرت خام 441 گیگافلاپس، 62 درصد قدرت GeForce 930M را در اختیار دارد و در بازی Mad Max، به همین نسبت، سریع است:

مقایسه عملکرد HD 530 اینتل با GeForce 930m انویدیا در Mad Max

در تصویر فوق R7 M340 با قدرت 600 گیگافلاپس، 10 درصد سریع‌تر از HD 530 است. R7 M370 هم با توان خام 690 گیگافلاپسی که 56 درصد بیشتر است، 48 درصد سریع‌تر است.

در واقع تخمین عملکرد با توجه به قدرت پردازشی خام امکان‌پذیر و ساده است. اسکای‌لیک و سری 900 با توان پردازشی خام یکسان و بدون بهینه‌سازی برخی بازی‌های خاص برای معماری مکسول 2 انویدیا، عملکرد مشابه دارد. برودول و هسول نیز با گیگافلاپس مشابه سری 700 (معماری کپلر) عملکرد مشابهی دارند.

در مقایسه‌ی گرافیکی مجتمع اینتل با محصولات AMD، می‌بایست گرافیک اینتلی را 20 درصد بهینه‌تر در نظر گرفت. به این ترتیب HD 530 با قدرت خام 441 گیگافلاپس، در حد 490 گیگافلاپسی‌های AMD است. البته دقت کنید که منظور سری 200 و 300 است.