نسل اول حافظهی HBM در تراشهی فیجی ایامدی به کار رفت و اکنون نسل دوم یا HBM2 توسط JEDEC استاندارد شده است. در ادامه به معرفی حافظهی HBM2 و مشخصهها و ویژگیهای آن میپردازم.
سامسونگ چند روز پیش اعلام کرد که تولید انبوه HBM2 را آغاز کرده است. هاینیکس هم به عنوان دیگر تولیدکنندهی بزرگ حافظه در جهان، حافظههای HBM2 تولید میکند و به این ترتیب در کارت گرافیکهای جدید و ردهاول، حافظهی HBM2 متداول میشود.
مروری بر ویژگیهای HBM
ویژگی اساسی HBM نسل اول این است که توان مصرفی با کوتاه شدن ارتباطات و در واقع مقاومت الکتریکی کمتر، کاهش پیدا میکند و از طرفی نیازی به تراشههای مجزا در سطحی بزرگ نیست بلکه این حافظه به صورت چندلایه در کنار پردازندهی گرافیکی یا به طور کلی انواع تراشه قرار میگیرد. لذا سطح موردنیاز هم کمتر است. از طرفی HBM مخفف High Bandwidth Memory به معنی حافظهای با پهنای باند بالاست، علت بالاتر بودن پهنای باند این است که مسیرهای ارتباطی بسیار زیاد است و در حقیقت پهنای باس ارتباطی چند برابر بیشتر از GDDR5 است.
کاهش سطح برد مدار چاپی و کاهش طول مسیرهای ارتباطی و ساختار لایهای با مسیرهای ارتباطی بسیار زیاد دو ویژگی اساسی HBM است.
به این نوع مسیرهای ارتباطی خاص که حالت درون-سیلیکونی دارد، TSV (مخفف Through Silicon Via) گفته میشود. در استاندارد JESD235 به این نوع حافظه پرداخته شده است و استاندارد جدید JESD235A نیز برای تولید و کاربری نسل دوم HBM توسط JEDEC تصویب شده تا ظرفیت و پهنای باند باز هم بیشتر شود و البته توان مصرفی و قابلیتها نیز بهتر از قبل خواهد بود.
ساختار HBM چندلایهای است، لذا گاهی به آن حافظهی سهبعدی یا 3D Memory هم میگویند، مثل اسلاید زیر که توسط انویدیا تهیه شده و ویژگیهای پاسکال را برمیشمارد:
اشکالات نسل اول HBM
مزیت HBM را به خوبی میشناسیم. باس ارتباطی با پهنای 1024 بیت تنها برای یک ماژول HBM که چندلایه حافظه را شامل میشود، عدد فوقالعادهای است. در تراشهی فیجی 4 پشتهی 1 گیگابایتی با پهنای باس 1024 بیت به کار رفته است. منظور از پشته یکی از حافظههای چندلایه است که به آن KGSD نیز گفته میشود. در حقیقت باس ارتباطی هر لایهی HBM، پهنای 1024 بیتی دارد و نمیتوان باس عریضتری برای 8 کانال درونی آن متصور شد. کانالهای داخلی اساساً یک واسط DDR هستند که پهنای باس 128 بیت دارد. در تصویر زیر 4 پشته و در حقیقت 16 حافظه را مشاهده میکنید:
پهنای باس کلی 4 پشته، 4096 بیت است و با در نظر گرفتن سرعت پایین هم پهنای باند عالی 128 گیگابایت بر ثانیه به دست میآید.
مقایسهای با GDDR5 داشته باشیم: در کارت گرافیکهای ردهاول مجهز به بافر GDDR5، پهنای باس معمولاً 384 بیت و یا نهایتاً 512 بیت است. به این ترتیب پهنای باس 8 برابر بیشتر شده و نیازی به فرکانس بسیار بالای حافظه نیست. فرکانس کاری باس، فقط 500 مگاهرتز است و در عین حال پهنای باند 0.5 ترابایت بر ثانیه به دست میآید.
محدودیت HBM نسل اول چیست؟
4 گیگابایت حافظه برای یک کارت گرافیک ردهاول کافی نیست!
هاینیکس تنها سازندهی نسل اول HBM، پشتههای KGSD متشکل از چهار حافظهی 256 مگابایتی با پهنای باند 1024 گیگابیت بر ثانیه (128 گیگابایت بر ثانیه) تولید کرده است و ایامدی در فیجی، 4 پشتهی HBM به کار برده تا به مجموعاً 4 گیگابایت حافظه با پهنای باند 512 گیگابایت بر ثانیه، دست یابد. نتیجهی خوبی است اما برای رزولوشن 4K و بازیهای سنگین 2016 و حتی 2015، مطلوب نیست.
نسل دوم HBM یا HBM2
در HBM2 که مبتنی بر استاندارد JESD235A تولید و استفاده میشود، هر پشتهی KGSD مشخصاتی مثل قبل دارد. به این معنی که ولتاژ ورودی و خروجی 1.2 ولت است، حداکثر 8 حافظهی DRAM در یک پشتهی 8 لایهای موجود است و پهنای باس هر کانال داخلی، 128 بیتی است.
تغییر اول این است که هر یک از DRAMها میتواند 1 گیگابایتی باشد و در حقیقت ظرفیت هر حافظهی کوچک از 256 مگابایت به 1 گیگابایت تغییر کرده است و پهنای باند هر یک از لایههای حافظه هم محدودیت 1 گیگابیت بر ثانیهای را پشت سر گذاشته و میتواند 1.6 گیگابیت بر ثانیه (200 مگابایت بر ثانیه) و حتی 2 گیگابیت بر ثانیه سرعت داشته باشد.
دقت کنید که هاینیکس در هر پشته فقط 4 لایهی DRAM به کار برده بود و نه 8 عدد، درست مثل تصویر ابتدای مقاله؛ بنابراین با این تغییر میتوان حافظهی کارت گرافیکهای ردهاول را به 32 گیگابایت (8 لایهی 1 گیگابایتی در هر پشتهی HBM، مجموعاً 4 پشته در یک تراشهی بزرگ) افزایش داد و پهنای باند کلی نیز حداکثر 2 برابر میشود. رکوردی عالی برای بهترین محصولات گرافیکی 2016. میتوان تنها از 4 لایه با حافظههای کوچکتر استفاده کرد و 8 یا 16 گیگابایت حافظه در نظر گرفت.
ویژگی دیگر HBM2 پشتیبانی از حالت Pseudo Channel یا کانالهای کاذب است. هر کانال واقعی تبادل داده میتواند به دو کانال 64 بیتی تبدیل شود. پیشدریافت یا Prefetch هر حافظه 128 بیتی است و پهنای باند بالاتری به دست میآید. در حقیقت دو کنال کاذب با سرعت کلاک یکسان عمل میکنند، باس دستور هم ستونها و ردیفهای مشترک با کانال جفت دارد و ورودی CK و CKE نیز مشترک است. بانکها و دیکد و اجرای دستور چیزی است که به صورت مجزا طراحی میشود. هاینیکس میگوید حالت کانال کاذب دسترسی به حافظه را بهینه کرده و تأخیر را کاهش میدهد. بنابراین کانال کاذب پهنای باند موثر را افزایش میدهد.
کانال کاذب با کاهش اندازهی پیج از 2 کیلوبایت به 1 کیلوبایت، توان مصرفی را نیز کاهش میدهد.
اینکه پهنای باند عملی یا موثر HBM2 چقدر است، بستگی به کاربرد و بهینهسازیها دارد. اگر تولیدکننده تشخیص دهد که استفاده از کانالهای کاذب روش موثر و جالبی نیست، HBM2 میتواند به شیوهی نسل اول عمل کند و مشکلی به وجود نمیآید.
ویژگی مفید دیگر HBM2 این است که برای بررسی و تعمیر داده علاوه بر روشهای قبل یعنی بررسی سلولهای حافظهی DRAM، روش نگاشت مجدد مسیرهای ارتباطی و همینطور محافظت در برابر داغی از طریق آگاه کردن کنترلر حافظه نیز پشتیبانی میشود.
سامسونگ و هاینیکس اولین تولیدکنندگان HBM2
نسل دوم HBM با لیتوگرافی بهینهتر تولید میشود و طبعاً توان مصرفی و عملکرد، بهتر خواهد بود. هاینیکس از لیتوگرافی 29 نانومتری خود برای تولید HBM1 استفاده کرده بود و لیتوگرافی 21 نانومتری را برای نسل دوم در نظر گرفته است. سامسونگ جزئیات زیادی در مورد HBM2 منتشر نکرده است. هر پشته 4 گیگابایت ظرفیت دارد و متشکل از 4 لایهی 8 گیگابیتی (معادل 1 گیگابایت) است. پهنای باند هر لایه نیز 2 گیگابیت بر ثانیه یا 256 مگابایت بر ثانیه است. بنابراین تولیدکنندگان کارت گرافیک میتوانند 16 گیگابایت حافظه با پهنای باند 1 ترابایت بر ثانیه طراحی کنند. لیتوگرافی مورداستفاده، 20 نانومتری است و متأسفانه در مورد توان مصرفی، خبری منتشر نشده است.
ابعاد حافظهی HBM1 تولید شده توسط هاینیکس، 5.48 در 7.29 میلیمتر بود و مساحت 39.94 میلیمتر است. در نسل دوم ابعاد به 7.75 در 11.87 میلیمترمربع افزایش پیدا میکند و در حقیقت مساحت 91.99 میلیمترمربع است، افزایشی بیش از 2 برابر. شاید به نظر برسد که هزینهی تراشههای جدید بیشتر است ولیکن دقت کنید که پهنای باند هم دو برابر شده و به این ترتیب در مساحت سابق میتوان پهنای باند مشابه به دست آورد و لذا هزینهی کلی پردازندهی گرافیکی و حافظهی روی قالب، تغییر چندانی نمیکند.
ضخامت هر پشتهی حافظه هم از 0.49 میلیمتر به 0.695 میلیمتر و یا 0.72 و 0.745 میلیمتر افزایش پیدا میکند. تغییر ارتفاع به این معنی است که تولیدکنندگان کارت گرافیک در نصب هیتسینک روی تراشه، مشکلات جدیدی خواهند داشت که البته حل کردن آن کار دشواری نیست.
به مشخصات مکانیکی توجه کنید:
کاربردهای جدید حافظهی HBM پس از معرفی HBM2
تولید HBM نسل اول با توجه به مزایای آن، ادامه دارد ولیکن HBM2 کاربرد این نوع خاص حافظه را گسترش میدهد و بالطبع تولید آن با جدیت زیادی کلید میخورد. با توجه به افزایش ظرفیت و پهنای باند، کاربری HBM2 به عنوان حافظهی کش سطح چهارم برای پردازندهی اصلی و به خصوص پردازندهی گرافیکی مجتمع، کامپیوترهایی در نقش مرکز محاسبه و سرور و شبکهها، منطقی است. در سپتامبر 2015 بیش از 10 کمپانی از حافظههای HBM در محصولات خود استفاده کردهاند و در سال 2016 و 2017، کاربری HBM2 با روند سریع، رشد میکند.
در اخبار پردازندهها، دیدیم که ممکن است AMD تراشهای با حافظهی HBM2 و قدرت پردازشی خیرهکننده معرفی کند.
ممکن است اینتل بزرگ هم در محصولات پردازشی ردهاول خود، سراغ HBM2 برود و البته AMD و انویدیا هر دو در کارت گرافیکهای گرانقیمت و سریع، از HBM2 استفاده میکنند.
اینتوتک
ضمن تشکر دو الی سه دور خودم ولی به شدت گیجم کرد
سوالی که برام پیش اومد چه طور میشه هر لایه چند حافظه dram باشه !؟ من میدونستم این حافظه ها بر خلاف gddr5 چند لایه هستند ولی این که هر لایه چند dram داشته باشه منو یاد پردازمنده های چند هسته ای میندازه
//تا به مجموعاً ۴ گیگابایت حافظه با پهنای باند ۵۱۲ گیگابایت بر ثانیه، دست یابد.//
اینجا فکنم گیگابیته درست
//گرافیکهای ردهاول را به ۳۲ گیگابایت (۸ ماژول ۱ گیگابایتی در هر لایه، مجموعاً ۴ لایه) افزایش داد//
پرانتز هر چیپه ؟ درست با توجه به اینکه کنار پردازنده گرافیکی چهارتا چیپ hbm2 جا میشه
//هر لایه ۴ گیگابایت ظرفیت دارد و متشکل از ۴ ماژول ۸ گیگابیتی است.//
فکنم اینطوریه هر چیپ 4 گیگ هست 4 لایه مشتکل که هر لایه 8گیگابیت بهتره بگیم یک گیگ
فکنم ایراد مقاله این باشه
——————-//
ضخامت هر لایه هم از ۰.۴۹ میلیمتر به ۰.۶۹۵ میلیمتر و یا ۰.۷۲ و ۰.۷۴۵ میلیمتر افزایش پیدا میکند. تغییر ارتفاع به این معنی است که تولیدکنندگان کارت گرافیک در نصب هیتسینک روی تراشه، مشکلات جدیدی خواهند داشت که البته حل کردن آن کار دشواری نیست.
//افزایش ضخامت به خاطر base die نیست ؟ چون چون ورقه های silicon wafer زیاد زخیم نیستند ترانزیستورها تو سطح هستند پس اگه چند لایه هم بکنیم نباید از 8 تار مو بیشتر بشند
سلام.
اولاً از دقتتون تشکر ویژه میکنم چون موجب شد دو سه اشکال جدی رو شناسایی کنم و ابهاماتی که برای خودم وجود داشت رو حل کنم.
من جور دیگهای الان توضیحات رو نوشتم که واضح بشه. تو تراشهی فیجی 4 لایه حافظه داشتیم. هر لایه خودش شامل 4 حافظهی DRAM بوده. الان متن رو به این شکل تغییر دادم که 4 پشته (دستهای از حافظهها روی هم) داریم، هر پشته خودش 4 لایه حافظهی DRAM داره و در کل میشه 16 حافظه. هر کدوم 2 گیگابیتی هست، پش میشه 32 گیگابیت یا همون 4 گیگابایت.
در یک پشته، پهنای باس هر لایه 1024 بیت هست و چون 4 لایه داریم، میشه 4096 بیت.
اون عبارت 512 گیگابایت درسته، پهنای باند حافظهی فیجی همین عدده.
برای حالت 32 گیگابایتی بنده اشتباه نوشتم. منظورم 8 لایهی 1 گیگابایتی در هر پشته بود و مجموعاً 4 پشته که هر یک 8 گیگابایت ظرفیت داره.
ضخامتی که ذکر شده، مربوط به پشته بوده و بنده اشتباهاً نوشتم لایه. هر پشته 50 60 درصد ضخیمتر شده و البته اگه 8 لایهای باشه، فکر میکنم عدد سوم یعنی 0.735 میلیمتر میشه ضخامت پشته.
ظاهرا پهنای باندی که تو gpuz مینوشت به گیگابایت بر ثانیست فکر میکردم گیگابیته ولی یه چیزی درست در نمی اد تراشه های HBM2 سامسونگ میزنه http://www.engadget.com/2016/01/19/samsung-next-gen-hbm2-dram/ دویست پنجا گیگ بر ثانیه سرعته تو جدولم همینو نوشتید (ماژولی 4 گیگ )در حالی که کارت 780ti با ممری gddr5 پهنای باند 336 گیگابایت بر ثانیه داره !
ظاهرا اینطور که از دوستان شنیدم با اظافه کردن هر چیپ پنای باند هم اظافه میشه 4 تا HBM2 دویست پنجا گیگ بر ثانیه میشه یک ترا بر ثانیه به عبارتی سرعتاشونم همراه با حجمشون جمع میشه gddr5 هم اینطور بود ؟
دقت کنید تو جدول اون 8 لایه ایه ملاک نیست. همون 4 لایه ای احتمالا تو GTX 1080 Ti استفاده بشه. البته این گرافیک هم نمیدونم چه طراحی داره.
4 تا پشته ی 4 گیگابایتی.
در مورد GDDR5 کلا بحثش فرق میکنه. اونجا باس مثلا 384 بیته و ماژول ها به جای فرضا 128 مگ میشن 256 و 512. باس ثابت میمونه و پهنای باند زیر 400 گیگابایت میمونه.
اعداد هم همون طور که متوجه شدید همه گیگابایت بر ثانیه هست.