نسل اول حافظه‌ی HBM در تراشه‌ی فیجی ای‌ام‌دی به کار رفت و اکنون نسل دوم یا HBM2 توسط JEDEC استاندارد شده است. در ادامه به معرفی حافظه‌ی HBM2 و مشخصه‌ها و ویژگی‌های آن می‌پردازم.

سامسونگ چند روز پیش اعلام کرد که تولید انبوه HBM2 را آغاز کرده است. هاینیکس هم به عنوان دیگر تولیدکننده‌ی بزرگ حافظه در جهان، حافظه‌های HBM2 تولید می‌کند و به این ترتیب در کارت گرافیک‌های جدید و رده‌اول، حافظه‌ی HBM2 متداول می‌شود.

مروری بر ویژگی‌های HBM

ویژگی اساسی HBM نسل اول این است که توان مصرفی با کوتاه شدن ارتباطات و در واقع مقاومت الکتریکی کمتر، کاهش پیدا می‌کند و از طرفی نیازی به تراشه‌های مجزا در سطحی بزرگ نیست بلکه این حافظه به صورت چندلایه در کنار پردازنده‌ی گرافیکی یا به طور کلی انواع تراشه قرار می‌گیرد. لذا سطح موردنیاز هم کمتر است. از طرفی HBM مخفف High Bandwidth Memory به معنی حافظه‌ای با پهنای باند بالاست، علت بالاتر بودن پهنای باند این است که مسیرهای ارتباطی بسیار زیاد است و در حقیقت پهنای باس ارتباطی چند برابر بیشتر از GDDR5 است.

کاهش سطح برد مدار چاپی و کاهش طول مسیرهای ارتباطی و ساختار لایه‌ای با مسیرهای ارتباطی بسیار زیاد دو ویژگی اساسی HBM است.

به این نوع مسیرهای ارتباطی خاص که حالت درون-سیلیکونی دارد، TSV (مخفف Through Silicon Via) گفته می‌شود. در استاندارد JESD235 به این نوع حافظه پرداخته شده است و استاندارد جدید JESD235A نیز برای تولید و کاربری نسل دوم HBM توسط JEDEC تصویب شده تا ظرفیت و پهنای باند باز هم بیشتر شود و البته توان مصرفی و قابلیت‌ها نیز بهتر از قبل خواهد بود.

ساختار HBM چندلایه‌ای است، لذا گاهی به آن حافظه‌ی سه‌بعدی یا 3D Memory هم می‌گویند، مثل اسلاید زیر که توسط انویدیا تهیه شده و ویژگی‌های پاسکال را برمی‌شمارد:

حافظه‌ی HBM با عنوان حافظه‌ی سه‌بعدی نیز معرفی می‌شود

اشکالات نسل اول HBM

مزیت HBM را به خوبی می‌شناسیم. باس ارتباطی با پهنای 1024 بیت تنها برای یک ماژول HBM که چندلایه حافظه را شامل می‌شود، عدد فوق‌العاده‌ای است. در تراشه‌ی فیجی 4 پشته‌ی 1 گیگابایتی با پهنای باس 1024 بیت به کار رفته است. منظور از پشته یکی از حافظه‌های چندلایه است که به آن KGSD نیز گفته می‌شود. در حقیقت باس ارتباطی هر لایه‌ی HBM، پهنای 1024 بیتی دارد و نمی‌توان باس عریض‌تری برای 8 کانال درونی آن متصور شد. کانال‌های داخلی اساساً یک واسط DDR هستند که پهنای باس 128 بیت دارد. در تصویر زیر 4 پشته و در حقیقت 16 حافظه را مشاهده می‌کنید:

تراشه‌ی فیجی با چهار پشته‌ی HBM اطراف سیلیکون مرکزی

پهنای باس کلی 4 پشته، 4096 بیت است و با در نظر گرفتن سرعت پایین هم پهنای باند عالی 128 گیگابایت بر ثانیه به دست می‌آید.

مقایسه‌ای با GDDR5 داشته باشیم: در کارت گرافیک‌های رده‌اول مجهز به بافر GDDR5، پهنای باس معمولاً 384 بیت و یا نهایتاً 512 بیت است. به این ترتیب پهنای باس 8 برابر بیشتر شده و نیازی به فرکانس بسیار بالای حافظه نیست. فرکانس کاری باس، فقط 500 مگاهرتز است و در عین حال پهنای باند 0.5 ترابایت بر ثانیه به دست می‌آید.

محدودیت HBM نسل اول چیست؟

4 گیگابایت حافظه برای یک کارت گرافیک رده‌اول کافی نیست!

هاینیکس تنها سازنده‌ی نسل اول HBM، پشته‌های KGSD متشکل از چهار حافظه‌ی 256 مگابایتی با پهنای باند 1024 گیگابیت بر ثانیه (128 گیگابایت بر ثانیه) تولید کرده است و ای‌ام‌دی در فیجی، 4 پشته‌ی HBM به کار برده تا به مجموعاً 4 گیگابایت حافظه با پهنای باند 512 گیگابایت بر ثانیه، دست یابد. نتیجه‌‎ی خوبی است اما برای رزولوشن 4K و بازی‌های سنگین 2016 و حتی 2015، مطلوب نیست.

نسل دوم HBM یا HBM2

در HBM2 که مبتنی بر استاندارد JESD235A تولید و استفاده می‌شود، هر پشته‌ی KGSD مشخصاتی مثل قبل دارد. به این معنی که ولتاژ ورودی و خروجی 1.2 ولت است، حداکثر 8 حافظه‌ی DRAM در یک پشته‌ی 8 لایه‌ای موجود است و پهنای باس هر کانال داخلی، 128 بیتی است.

پهنای باند دو برابر و ظرفیت 8 برابر

تغییر اول این است که هر یک از DRAMها می‌تواند 1 گیگابایتی باشد و در حقیقت ظرفیت هر حافظه‌ی کوچک از 256 مگابایت به 1 گیگابایت تغییر کرده است و پهنای باند هر یک از لایه‌های حافظه هم محدودیت 1 گیگابیت بر ثانیه‌ای را پشت سر گذاشته و می‌تواند 1.6 گیگابیت بر ثانیه (200 مگابایت بر ثانیه) و حتی 2 گیگابیت بر ثانیه سرعت داشته باشد.

لایه‌های HBM2 با تعداد حافظه‌های داخلی متفاوت

دقت کنید که هاینیکس در هر پشته فقط 4 لایه‌ی DRAM به کار برده بود و نه 8 عدد، درست مثل تصویر ابتدای مقاله؛ بنابراین با این تغییر می‌توان حافظه‌ی کارت گرافیک‌های رده‌اول را به 32 گیگابایت (8 لایه‌ی 1 گیگابایتی در هر پشته‌ی HBM، مجموعاً 4 پشته در یک تراشه‌ی بزرگ) افزایش داد و پهنای باند کلی نیز حداکثر 2 برابر می‌شود. رکوردی عالی برای بهترین محصولات گرافیکی 2016. می‌توان تنها از 4 لایه با حافظه‌های کوچک‌تر استفاده کرد و 8 یا 16 گیگابایت حافظه در نظر گرفت.

حافظه‌ی HBM2 و پهنای باند دو برابری و ظرفیت 4 برابر هر لایه

ویژگی دیگر HBM2 پشتیبانی از حالت Pseudo Channel یا کانال‌های کاذب است. هر کانال واقعی تبادل داده می‌تواند به دو کانال 64 بیتی تبدیل شود. پیش‌دریافت یا Prefetch هر حافظه 128 بیتی است و پهنای باند بالاتری به دست می‌آید. در حقیقت دو کنال کاذب با سرعت کلاک یکسان عمل می‌کنند، باس دستور هم ستون‌ها و ردیف‌های مشترک با کانال جفت دارد و ورودی CK و CKE نیز مشترک است. بانک‌ها و دیکد و اجرای دستور چیزی است که به صورت مجزا طراحی می‌شود. هاینیکس می‌گوید حالت کانال کاذب دسترسی به حافظه را بهینه کرده و تأخیر را کاهش می‌دهد. بنابراین کانال کاذب پهنای باند موثر را افزایش می‌دهد.

حافظه‌ی HBM2 و تقسیم هر کانال ارتباطی به دو کانال کاذب یا PS

کانال کاذب با کاهش اندازه‌ی پیج از 2 کیلوبایت به 1 کیلوبایت، توان مصرفی را نیز کاهش می‌دهد.

اینکه پهنای باند عملی یا موثر HBM2 چقدر است، بستگی به کاربرد و بهینه‌سازی‌ها دارد. اگر تولیدکننده تشخیص دهد که استفاده از کانال‌های کاذب روش موثر و جالبی نیست، HBM2 می‌تواند به شیوه‌ی نسل اول عمل کند و مشکلی به وجود نمی‌آید.

ویژگی مفید دیگر HBM2 این است که برای بررسی و تعمیر داده علاوه بر روش‌های قبل یعنی بررسی سلول‌های حافظه‌ی DRAM، روش نگاشت مجدد مسیرهای ارتباطی و همین‌طور محافظت در برابر داغی از طریق آگاه کردن کنترلر حافظه نیز پشتیبانی می‌شود.

سامسونگ و هاینیکس اولین تولیدکنندگان HBM2

نسل دوم HBM با لیتوگرافی بهینه‌تر تولید می‌شود و طبعاً توان مصرفی و عملکرد، بهتر خواهد بود. هاینیکس از لیتوگرافی 29 نانومتری خود برای تولید HBM1 استفاده کرده بود و لیتوگرافی 21 نانومتری را برای نسل دوم در نظر گرفته است. سامسونگ جزئیات زیادی در مورد HBM2 منتشر نکرده است. هر پشته 4 گیگابایت ظرفیت دارد و متشکل از 4 لایه‌ی 8 گیگابیتی (معادل 1 گیگابایت) است. پهنای باند هر لایه نیز 2 گیگابیت بر ثانیه یا 256 مگابایت بر ثانیه است. بنابراین تولیدکنندگان کارت گرافیک می‌توانند 16 گیگابایت حافظه با پهنای باند 1 ترابایت بر ثانیه طراحی کنند. لیتوگرافی مورداستفاده، 20 نانومتری است و متأسفانه در مورد توان مصرفی، خبری منتشر نشده است.

ابعاد حافظه‌ی HBM1 تولید شده توسط هاینیکس، 5.48 در 7.29 میلی‌متر بود و مساحت 39.94 میلی‌متر است. در نسل دوم ابعاد به 7.75 در 11.87 میلی‌مترمربع افزایش پیدا می‌کند و در حقیقت مساحت 91.99 میلی‌مترمربع است، افزایشی بیش از 2 برابر. شاید به نظر برسد که هزینه‌ی تراشه‌های جدید بیشتر است ولیکن دقت کنید که پهنای باند هم دو برابر شده و به این ترتیب در مساحت سابق می‌توان پهنای باند مشابه به دست آورد و لذا هزینه‌ی کلی پردازنده‌ی گرافیکی و حافظه‌ی روی قالب، تغییر چندانی نمی‌کند.

ضخامت هر پشته‌ی حافظه هم از 0.49 میلی‌متر به 0.695 میلی‌متر و یا 0.72 و 0.745 میلی‌متر افزایش پیدا می‌کند. تغییر ارتفاع به این معنی است که تولیدکنندگان کارت گرافیک در نصب هیت‌سینک روی تراشه، مشکلات جدیدی خواهند داشت که البته حل کردن آن کار دشواری نیست.

به مشخصات مکانیکی توجه کنید:

مشخصات ابعادی پشته‌ی HBM2

کاربردهای جدید حافظه‌ی HBM پس از معرفی HBM2

تولید HBM نسل اول با توجه به مزایای آن، ادامه دارد ولیکن HBM2 کاربرد این نوع خاص حافظه را گسترش می‌دهد و بالطبع تولید آن با جدیت زیادی کلید می‌خورد. با توجه به افزایش ظرفیت و پهنای باند، کاربری HBM2 به عنوان حافظه‌ی کش سطح چهارم برای پردازنده‌ی اصلی و به خصوص پردازنده‌ی گرافیکی مجتمع، کامپیوترهایی در نقش مرکز محاسبه و سرور و شبکه‌ها، منطقی است. در سپتامبر 2015 بیش از 10 کمپانی از حافظه‌های HBM در محصولات خود استفاده کرده‌اند و در سال 2016 و 2017، کاربری HBM2 با روند سریع، رشد می‌کند.

در اخبار پردازنده‌ها، دیدیم که ممکن است AMD تراشه‌ای با حافظه‌ی HBM2 و قدرت پردازشی خیره‌کننده معرفی کند.

ممکن است اینتل بزرگ هم در محصولات پردازشی رده‌اول خود، سراغ HBM2 برود و البته AMD و انویدیا هر دو در کارت گرافیک‌های گران‌قیمت و سریع، از HBM2 استفاده می‌کنند.