حافظه‌ی HBM2 چیست؟ بررسی مزایا و معایب آن نسبت به GDDR5 و HBM نسل اول

نسل اول حافظه‌ی HBM در تراشه‌ی فیجی ای‌ام‌دی به کار رفت و اکنون نسل دوم یا HBM2 توسط JEDEC استاندارد شده است. در ادامه به معرفی حافظه‌ی HBM2 و مشخصه‌ها و ویژگی‌های آن می‌پردازم.

سامسونگ چند روز پیش اعلام کرد که تولید انبوه HBM2 را آغاز کرده است. هاینیکس هم به عنوان دیگر تولیدکننده‌ی بزرگ حافظه در جهان، حافظه‌های HBM2 تولید می‌کند و به این ترتیب در کارت گرافیک‌های جدید و رده‌اول، حافظه‌ی HBM2 متداول می‌شود.

مروری بر ویژگی‌های HBM

ویژگی اساسی HBM نسل اول این است که توان مصرفی با کوتاه شدن ارتباطات و در واقع مقاومت الکتریکی کمتر، کاهش پیدا می‌کند و از طرفی نیازی به تراشه‌های مجزا در سطحی بزرگ نیست بلکه این حافظه به صورت چندلایه در کنار پردازنده‌ی گرافیکی یا به طور کلی انواع تراشه قرار می‌گیرد. لذا سطح موردنیاز هم کمتر است. از طرفی HBM مخفف High Bandwidth Memory به معنی حافظه‌ای با پهنای باند بالاست، علت بالاتر بودن پهنای باند این است که مسیرهای ارتباطی بسیار زیاد است و در حقیقت پهنای باس ارتباطی چند برابر بیشتر از GDDR5 است.

کاهش سطح برد مدار چاپی و کاهش طول مسیرهای ارتباطی و ساختار لایه‌ای با مسیرهای ارتباطی بسیار زیاد دو ویژگی اساسی HBM است.

به این نوع مسیرهای ارتباطی خاص که حالت درون-سیلیکونی دارد، TSV (مخفف Through Silicon Via) گفته می‌شود. در استاندارد JESD235 به این نوع حافظه پرداخته شده است و استاندارد جدید JESD235A نیز برای تولید و کاربری نسل دوم HBM توسط JEDEC تصویب شده تا ظرفیت و پهنای باند باز هم بیشتر شود و البته توان مصرفی و قابلیت‌ها نیز بهتر از قبل خواهد بود.

ساختار HBM چندلایه‌ای است، لذا گاهی به آن حافظه‌ی سه‌بعدی یا 3D Memory هم می‌گویند، مثل اسلاید زیر که توسط انویدیا تهیه شده و ویژگی‌های پاسکال را برمی‌شمارد:

اشکالات نسل اول HBM

مزیت HBM را به خوبی می‌شناسیم. باس ارتباطی با پهنای 1024 بیت تنها برای یک ماژول HBM که چندلایه حافظه را شامل می‌شود، عدد فوق‌العاده‌ای است. در تراشه‌ی فیجی 4 پشته‌ی 1 گیگابایتی با پهنای باس 1024 بیت به کار رفته است. منظور از پشته یکی از حافظه‌های چندلایه است که به آن KGSD نیز گفته می‌شود. در حقیقت باس ارتباطی هر لایه‌ی HBM، پهنای 1024 بیتی دارد و نمی‌توان باس عریض‌تری برای 8 کانال درونی آن متصور شد. کانال‌های داخلی اساساً یک واسط DDR هستند که پهنای باس 128 بیت دارد. در تصویر زیر 4 پشته و در حقیقت 16 حافظه را مشاهده می‌کنید:

پهنای باس کلی 4 پشته، 4096 بیت است و با در نظر گرفتن سرعت پایین هم پهنای باند عالی 128 گیگابایت بر ثانیه به دست می‌آید.

مقایسه‌ای با GDDR5 داشته باشیم: در کارت گرافیک‌های رده‌اول مجهز به بافر GDDR5، پهنای باس معمولاً 384 بیت و یا نهایتاً 512 بیت است. به این ترتیب پهنای باس 8 برابر بیشتر شده و نیازی به فرکانس بسیار بالای حافظه نیست. فرکانس کاری باس، فقط 500 مگاهرتز است و در عین حال پهنای باند 0.5 ترابایت بر ثانیه به دست می‌آید.

محدودیت HBM نسل اول چیست؟

4 گیگابایت حافظه برای یک کارت گرافیک رده‌اول کافی نیست!

هاینیکس تنها سازنده‌ی نسل اول HBM، پشته‌های KGSD متشکل از چهار حافظه‌ی 256 مگابایتی با پهنای باند 1024 گیگابیت بر ثانیه (128 گیگابایت بر ثانیه) تولید کرده است و ای‌ام‌دی در فیجی، 4 پشته‌ی HBM به کار برده تا به مجموعاً 4 گیگابایت حافظه با پهنای باند 512 گیگابایت بر ثانیه، دست یابد. نتیجه‌‎ی خوبی است اما برای رزولوشن 4K و بازی‌های سنگین 2016 و حتی 2015، مطلوب نیست.

نسل دوم HBM یا HBM2

در HBM2 که مبتنی بر استاندارد JESD235A تولید و استفاده می‌شود، هر پشته‌ی KGSD مشخصاتی مثل قبل دارد. به این معنی که ولتاژ ورودی و خروجی 1.2 ولت است، حداکثر 8 حافظه‌ی DRAM در یک پشته‌ی 8 لایه‌ای موجود است و پهنای باس هر کانال داخلی، 128 بیتی است.

پهنای باند دو برابر و ظرفیت 8 برابر

تغییر اول این است که هر یک از DRAMها می‌تواند 1 گیگابایتی باشد و در حقیقت ظرفیت هر حافظه‌ی کوچک از 256 مگابایت به 1 گیگابایت تغییر کرده است و پهنای باند هر یک از لایه‌های حافظه هم محدودیت 1 گیگابیت بر ثانیه‌ای را پشت سر گذاشته و می‌تواند 1.6 گیگابیت بر ثانیه (200 مگابایت بر ثانیه) و حتی 2 گیگابیت بر ثانیه سرعت داشته باشد.

دقت کنید که هاینیکس در هر پشته فقط 4 لایه‌ی DRAM به کار برده بود و نه 8 عدد، درست مثل تصویر ابتدای مقاله؛ بنابراین با این تغییر می‌توان حافظه‌ی کارت گرافیک‌های رده‌اول را به 32 گیگابایت (8 لایه‌ی 1 گیگابایتی در هر پشته‌ی HBM، مجموعاً 4 پشته در یک تراشه‌ی بزرگ) افزایش داد و پهنای باند کلی نیز حداکثر 2 برابر می‌شود. رکوردی عالی برای بهترین محصولات گرافیکی 2016. می‌توان تنها از 4 لایه با حافظه‌های کوچک‌تر استفاده کرد و 8 یا 16 گیگابایت حافظه در نظر گرفت.

ویژگی دیگر HBM2 پشتیبانی از حالت Pseudo Channel یا کانال‌های کاذب است. هر کانال واقعی تبادل داده می‌تواند به دو کانال 64 بیتی تبدیل شود. پیش‌دریافت یا Prefetch هر حافظه 128 بیتی است و پهنای باند بالاتری به دست می‌آید. در حقیقت دو کنال کاذب با سرعت کلاک یکسان عمل می‌کنند، باس دستور هم ستون‌ها و ردیف‌های مشترک با کانال جفت دارد و ورودی CK و CKE نیز مشترک است. بانک‌ها و دیکد و اجرای دستور چیزی است که به صورت مجزا طراحی می‌شود. هاینیکس می‌گوید حالت کانال کاذب دسترسی به حافظه را بهینه کرده و تأخیر را کاهش می‌دهد. بنابراین کانال کاذب پهنای باند موثر را افزایش می‌دهد.

کانال کاذب با کاهش اندازه‌ی پیج از 2 کیلوبایت به 1 کیلوبایت، توان مصرفی را نیز کاهش می‌دهد.

اینکه پهنای باند عملی یا موثر HBM2 چقدر است، بستگی به کاربرد و بهینه‌سازی‌ها دارد. اگر تولیدکننده تشخیص دهد که استفاده از کانال‌های کاذب روش موثر و جالبی نیست، HBM2 می‌تواند به شیوه‌ی نسل اول عمل کند و مشکلی به وجود نمی‌آید.

ویژگی مفید دیگر HBM2 این است که برای بررسی و تعمیر داده علاوه بر روش‌های قبل یعنی بررسی سلول‌های حافظه‌ی DRAM، روش نگاشت مجدد مسیرهای ارتباطی و همین‌طور محافظت در برابر داغی از طریق آگاه کردن کنترلر حافظه نیز پشتیبانی می‌شود.

سامسونگ و هاینیکس اولین تولیدکنندگان HBM2

نسل دوم HBM با لیتوگرافی بهینه‌تر تولید می‌شود و طبعاً توان مصرفی و عملکرد، بهتر خواهد بود. هاینیکس از لیتوگرافی 29 نانومتری خود برای تولید HBM1 استفاده کرده بود و لیتوگرافی 21 نانومتری را برای نسل دوم در نظر گرفته است. سامسونگ جزئیات زیادی در مورد HBM2 منتشر نکرده است. هر پشته 4 گیگابایت ظرفیت دارد و متشکل از 4 لایه‌ی 8 گیگابیتی (معادل 1 گیگابایت) است. پهنای باند هر لایه نیز 2 گیگابیت بر ثانیه یا 256 مگابایت بر ثانیه است. بنابراین تولیدکنندگان کارت گرافیک می‌توانند 16 گیگابایت حافظه با پهنای باند 1 ترابایت بر ثانیه طراحی کنند. لیتوگرافی مورداستفاده، 20 نانومتری است و متأسفانه در مورد توان مصرفی، خبری منتشر نشده است.

ابعاد حافظه‌ی HBM1 تولید شده توسط هاینیکس، 5.48 در 7.29 میلی‌متر بود و مساحت 39.94 میلی‌متر است. در نسل دوم ابعاد به 7.75 در 11.87 میلی‌مترمربع افزایش پیدا می‌کند و در حقیقت مساحت 91.99 میلی‌مترمربع است، افزایشی بیش از 2 برابر. شاید به نظر برسد که هزینه‌ی تراشه‌های جدید بیشتر است ولیکن دقت کنید که پهنای باند هم دو برابر شده و به این ترتیب در مساحت سابق می‌توان پهنای باند مشابه به دست آورد و لذا هزینه‌ی کلی پردازنده‌ی گرافیکی و حافظه‌ی روی قالب، تغییر چندانی نمی‌کند.

ضخامت هر پشته‌ی حافظه هم از 0.49 میلی‌متر به 0.695 میلی‌متر و یا 0.72 و 0.745 میلی‌متر افزایش پیدا می‌کند. تغییر ارتفاع به این معنی است که تولیدکنندگان کارت گرافیک در نصب هیت‌سینک روی تراشه، مشکلات جدیدی خواهند داشت که البته حل کردن آن کار دشواری نیست.

به مشخصات مکانیکی توجه کنید:

کاربردهای جدید حافظه‌ی HBM پس از معرفی HBM2

تولید HBM نسل اول با توجه به مزایای آن، ادامه دارد ولیکن HBM2 کاربرد این نوع خاص حافظه را گسترش می‌دهد و بالطبع تولید آن با جدیت زیادی کلید می‌خورد. با توجه به افزایش ظرفیت و پهنای باند، کاربری HBM2 به عنوان حافظه‌ی کش سطح چهارم برای پردازنده‌ی اصلی و به خصوص پردازنده‌ی گرافیکی مجتمع، کامپیوترهایی در نقش مرکز محاسبه و سرور و شبکه‌ها، منطقی است. در سپتامبر 2015 بیش از 10 کمپانی از حافظه‌های HBM در محصولات خود استفاده کرده‌اند و در سال 2016 و 2017، کاربری HBM2 با روند سریع، رشد می‌کند.

در اخبار پردازنده‌ها، دیدیم که ممکن است AMD تراشه‌ای با حافظه‌ی HBM2 و قدرت پردازشی خیره‌کننده معرفی کند.

ممکن است اینتل بزرگ هم در محصولات پردازشی رده‌اول خود، سراغ HBM2 برود و البته AMD و انویدیا هر دو در کارت گرافیک‌های گران‌قیمت و سریع، از HBM2 استفاده می‌کنند.

اینتوتک

دانش‌نامه

سخت‌افزار

AMD

انویدیا

حافظه رم

سامسونگ

کارت گرافیک

حمید مومیوند

مهندس مکانیک، دوست‌دار آی‌تی و عاشق دنیای موسیقی، طراحی و هنر، رنگ و نقش، موسیقی، انیمه و فیلم

حمید مومیوند

مطالب مرتبط

سوالات و پاسخ‌ها و دیدگاه‌ها

szeus گفت:

ژانویه 23, 2016 در 4:52 ب.ظ

ضمن تشکر دو الی سه دور خودم ولی به شدت گیجم کرد

سوالی که برام پیش اومد چه طور میشه هر لایه چند حافظه dram باشه !؟ من میدونستم این حافظه ها بر خلاف gddr5 چند لایه هستند ولی این که هر لایه چند dram داشته باشه منو یاد پردازمنده های چند هسته ای میندازه

//تا به مجموعاً ۴ گیگابایت حافظه با پهنای باند ۵۱۲ گیگابایت بر ثانیه، دست یابد.//

اینجا فکنم گیگابیته درست

//گرافیک‌های رده‌اول را به ۳۲ گیگابایت (۸ ماژول ۱ گیگابایتی در هر لایه، مجموعاً ۴ لایه) افزایش داد//
پرانتز هر چیپه ؟ درست با توجه به اینکه کنار پردازنده گرافیکی چهارتا چیپ hbm2 جا میشه
//هر لایه ۴ گیگابایت ظرفیت دارد و متشکل از ۴ ماژول ۸ گیگابیتی است.//
فکنم اینطوریه هر چیپ 4 گیگ هست 4 لایه مشتکل که هر لایه 8گیگابیت بهتره بگیم یک گیگ
فکنم ایراد مقاله این باشه
——————-//
ضخامت هر لایه هم از ۰.۴۹ میلی‌متر به ۰.۶۹۵ میلی‌متر و یا ۰.۷۲ و ۰.۷۴۵ میلی‌متر افزایش پیدا می‌کند. تغییر ارتفاع به این معنی است که تولیدکنندگان کارت گرافیک در نصب هیت‌سینک روی تراشه، مشکلات جدیدی خواهند داشت که البته حل کردن آن کار دشواری نیست.

//افزایش ضخامت به خاطر base die نیست ؟ چون چون ورقه های silicon wafer زیاد زخیم نیستند ترانزیستورها تو سطح هستند پس اگه چند لایه هم بکنیم نباید از 8 تار مو بیشتر بشند

پاسخ
- علیرضا شیری گفت:
  
  ژانویه 23, 2016 در 6:29 ب.ظ
  
  سلام.
  اولاً از دقتتون تشکر ویژه میکنم چون موجب شد دو سه اشکال جدی رو شناسایی کنم و ابهاماتی که برای خودم وجود داشت رو حل کنم.
  
  من جور دیگه‌ای الان توضیحات رو نوشتم که واضح بشه. تو تراشه‌ی فیجی 4 لایه حافظه داشتیم. هر لایه خودش شامل 4 حافظه‌ی DRAM بوده. الان متن رو به این شکل تغییر دادم که 4 پشته (دسته‌ای از حافظه‌ها روی هم) داریم، هر پشته خودش 4 لایه حافظه‌ی DRAM داره و در کل میشه 16 حافظه. هر کدوم 2 گیگابیتی هست، پش میشه 32 گیگابیت یا همون 4 گیگابایت.
  
  در یک پشته، پهنای باس هر لایه 1024 بیت هست و چون 4 لایه داریم، میشه 4096 بیت.
  
  اون عبارت 512 گیگابایت درسته، پهنای باند حافظه‌ی فیجی همین عدده.
  
  برای حالت 32 گیگابایتی بنده اشتباه نوشتم. منظورم 8 لایه‌ی 1 گیگابایتی در هر پشته بود و مجموعاً 4 پشته که هر یک 8 گیگابایت ظرفیت داره.
  
  ضخامتی که ذکر شده، مربوط به پشته بوده و بنده اشتباهاً نوشتم لایه. هر پشته 50 60 درصد ضخیم‌تر شده و البته اگه 8 لایه‌ای باشه، فکر میکنم عدد سوم یعنی 0.735 میلی‌متر میشه ضخامت پشته.
  
  پاسخ
szeus گفت:

ژانویه 23, 2016 در 10:11 ب.ظ

ظاهرا پهنای باندی که تو gpuz مینوشت به گیگابایت بر ثانیست فکر میکردم گیگابیته ولی یه چیزی درست در نمی اد تراشه های HBM2 سامسونگ میزنه http://www.engadget.com/2016/01/19/samsung-next-gen-hbm2-dram/ دویست پنجا گیگ بر ثانیه سرعته تو جدولم همینو نوشتید (ماژولی 4 گیگ )در حالی که کارت 780ti با ممری gddr5 پهنای باند 336 گیگابایت بر ثانیه داره !

پاسخ
- szeus گفت:
  
  ژانویه 23, 2016 در 10:22 ب.ظ
  
  ظاهرا اینطور که از دوستان شنیدم با اظافه کردن هر چیپ پنای باند هم اظافه میشه 4 تا HBM2 دویست پنجا گیگ بر ثانیه میشه یک ترا بر ثانیه به عبارتی سرعتاشونم همراه با حجمشون جمع میشه gddr5 هم اینطور بود ؟
  
  پاسخ
  - علیرضا شیری گفت:
    
    ژانویه 23, 2016 در 10:31 ب.ظ
    
    دقت کنید تو جدول اون 8 لایه ایه ملاک نیست. همون 4 لایه ای احتمالا تو GTX 1080 Ti استفاده بشه. البته این گرافیک هم نمیدونم چه طراحی داره.
    4 تا پشته ی 4 گیگابایتی.
    
    در مورد GDDR5 کلا بحثش فرق میکنه. اونجا باس مثلا 384 بیته و ماژول ها به جای فرضا 128 مگ میشن 256 و 512. باس ثابت میمونه و پهنای باند زیر 400 گیگابایت میمونه.
    
    اعداد هم همون طور که متوجه شدید همه گیگابایت بر ثانیه هست.
    
    پاسخ

ديدگاه شما؟ لغو پاسخ

برای دنبال کردن نظرات و پاسخ‌ها، پایین صفحات سایت یا صفحه‌ی ۲۰۰ دیدگاه اخیر را دنبال بفرمایید.

آخرین دیدگاه‌ها

روش‌های رفع ارور آنتی چیپ پابجی و فورتنایت و غیره

دخی ......گفت:

سلام این فایل من پیدا نمیکنم در مرحله عکس دوم

پاسخ

رفع مشکل پروکسی در کروم ویندوز 11 و غیره

Amirگفت:

عالی و بینظیر

پاسخ

روش‌های رفع ارور آنتی چیپ پابجی و فورتنایت و غیره

ارنیکگفت:

سلام فایل ست اپ انتی جیت باز نمیشه چیکار کنم ؟

پاسخ

با اینکد و دیکد ویدیو، دیکدر سخت‌افزاری، کدک، فرمت و پسوند فایل‌ها آشنا شوید

جباریگفت:

سلام. با گوشی سامسونگ فیلم گرفتم . در انتقال به لپ تاپ ،فایل باز نمیشه و اعلام اینکد می کنه چطور می تونم فایل رو باز کنم یا دیکد کنم .

پاسخ

آموزش کوچک کردن و بزرگ کردن صفحه سایت در اندروید و ویندوز

هومنگفت:

نوشتار اصلی کوچک است

پاسخ

رم DDR4 چه فرقی با رم DDR3 دارد؟ نگاهی به تفاوت‌ها و عملکرد DDR4 و DDR3

donoma8686گفت:

این مقاله‌ی بسیار کامل و عالی در مورد تفاوت‌های رم DDR4 و DDR3 واقعاً آموزنده بود. پیشرفت در پهنای باند و کاهش مصرف انرژی در نسل‌های جدید حافظه، پایه و اساس سیستم‌های مدرن را تشکیل می‌دهد. این پیشرفت در سایر اجزای سیستم نیز به وضوح دیده می‌شود، به ویژه در حوزه‌ی ذخیره‌سازی. همان‌طور که DDR4 مسیر را برای پردازش داده‌های حجیم‌تر هموار کرد، فناوری‌های ذخیره‌سازی نیز برای همگامی با این حجم داده‌ها، جهش‌های بزرگی داشته‌اند. یک نمونه‌ی بارز، درایو حالت جامد PCI-E با ظرفیت 15.36 ترابایت است. تصور کنید سیستمی دارید که با رم‌های پرسرعت DDR4 و یک پردازنده‌ی قدرتمند، داده‌ها را با سرعت بالا پردازش می‌کند. اگر ذخیره‌ساز شما نتواند این داده‌ها را به اندازه‌ی کافی سریع تأمین یا ذخیره کند، کل سیستم با گلوگاه مواجه می‌شود. یک درایو PCI-E SSD با آن ظرفیت فوق‌العاده و پهنای باند بسیار بالا، دقیقاً همان حلقه‌ی گمشده است. این درایو نه تنها می‌تواند کتابخانه‌های عظیم چندترابایتی را در خود جای دهد، بلکه تضمین می‌کند که انتقال داده بین حافظه و ذخیره‌ساز با حداکثر سرعت ممکن انجام شود. این هماهنگی بین رم پرسرعت و ذخیره‌ساز فوق‌سریع است که یک سیستم truly high-end را می‌سازد. ممنون از مقاله‌ی مفیدتان!

پاسخ

۲۰۰ دیدگاه و پاسخ آخر