نگاهی بر حافظه های نوین HBM؛ انقلابی در کارت های گرافیک
طی ماه های اخیر کمپانی AMD از بکار گیری نسل نوینی از حافظه ها ویدئویی (دستکم در R9 390X) خبر داده است و به رغم تاخیر فراوان در عرضه محصولات جدید، بسیاری را به جهشی بزرگ در کارایی کارت های گرافیک امیدوار کرده است. اما high-bandwidth memory که به اختصار HBM خوانده می شود چیست و چه برتری نسبت به تراشه های فعلی GDDR5 دارد؟ این موضوعی است که در ادامه به آن می پردازیم. با شهر سخت افزار همراه شوید.
هفته گذشته AMD طی کنفرانسی اعلام داشت که این کمپانی طی 7 سال اخیر مشغول کار بر روی HBM (حافظه با پهنای باند بالا) بوده است، فناوری جدیدی که چندین سال قبل ابداع و به ایده نابی برای حافظه های ویدئویی مبدل گشت. با پیشرفت فناوری ساخت، AMD زمان را برای مهاجرت به این فناوری نوین مناسب دیده است. اولین نسل از حافظه های HBM بزودی در محصولاتی از این کمپانی که جزئیات زیادی از آنها نداریم، معرفی خواهد شد. HBM هفت برتری نسبت به تراشه های GDDR5 و البته نقاط ضعفی نیز دارد. اما مهمترین نقطه قوت آن پهنای باند بالا است. اما چرا مهاجرت به حافظه های HBM ؟
AMD و دیگر سازندگان با این مشکل مواجه شده اند که با در نظر گرفتن کارایی نسبت به انرژی مصرفی، تراشه های GDDR5 به آرامی در حال از دست دادن کارایی خود هستند. این مشکل زمانی جدی تر می شود که روز به روز و با پیشرفت وضوح تصویر و بازی های ویدئوی، نیاز به حجم بیشتری از حافظه ویدئوی مطرح می شود و نتیجه آن بکار گیری تعداد بیشتری تراشه GDDR5 بر روی کارت است. HBM در مقایسه با GDDR5 تا سه برابر کارایی بیشتری نسبت به انرژی مصرفی ارائه می کند و کاهشی 50 درصدی را در میزان مصرف انرژی باعث می شود.
در حالی که GDDR5 هنوز هم توانا است و طی سالیان اخیر سرعت و پیرو آن پهنای باند این نوع از تراشه ها بالا رفته، اما نیاز به حجم بیشتر حافظه ویدئویی شدت گرفته و به استفاده از تعداد زیادی تراشه در کارت های گرافیک منجر شده است. این مسئله خود به نیاز بیشتر برای انرژی، مدار تغذیه قوی تر و اشغال فضای بیشتری بر روی برد PCB منجر می شود. اما تراشه های HBM را می توان روی همان قطعه سیلیکونی که پردازنده گرافیکی روی آن قرار می گیرد، گنجاند و از میزان مصرف انرژی و فضای مورد نیاز به طرز بسیار چشمگیری کاست.
گنجاندن تراشه های حافظه بر روی قطعه سیلیکونی و ارتباط مستقیم با پردازنده گرافیکی به تاخیر کمتر در ارتباط میان پردازنده گرافیکی و تراشه های حافظه، رابط حافظه عریض تر و برد PCB کوچکتر می انجامد. همانطور که در تصویر می بینید، پهنای رابط حافظه می تواند از 256 بیت به 1024 بیت افزایش یابد و طراحی برد PCB به طرز موثری جمع و جور تر شود. در ادامه نگاه عمیق تری خواهیم داشت بر حافظه های HBM و بکار گیری آن از سوی AMD.
ایده اصلی پشت HBM، قابلیت پشته سازی (استکینگ) تراشه های حافظه است که چندین تراشه بر روی هم انباشته و بصورت عمودی به هم وصل می شوند. حافظه پشته شده چندین برتری دارد؛ پهنای باند چند برابری، افزایش حجم حافظه و تاثیر چشمگیر بر بهره وری از انرژی در مقایسه GDDR5 که تراشه ها با فاصله از پردازنده گرافیکی قرار می گیرند.
همانند حافظه های NAND flash،ا HBM نیز یک حافظه پشته شده است. در نسل نخست از این فناوری می توان تا چهار لایه از حافظه ویدئویی را بر روی هم قرار داد و آنها را به هم وصل کرد. به بیانی ساده تر اصلی ترین خصیصه این این نوع از حافظه ها؛ امکان پشته سازی و وصل کردن آن ها به هم است.
نسل نخست از حافظه های HBM
این نوع از حافظه های پشته شده محدودیت هایی نیز دارند، در نسل نخست آن می توان تا چهار لایه و در هر لایه تا 256 مگابایت حافظه، یا به عبارتی 1024 مگابایت ( گیگابایت) را به ازای هر پکیج گنجاند و به ازای هر پردازنده گرافیکی نیز می توان حداکثر 4 گیگابایت از این نوع حافظه را بکار گرفت. از این رو نسل نخست از حافظه های HBM به 4 گیگابایت حافظه ویدئویی محدود می شود اما همین مقدار به دلیل پهنای رابط حافظه عریض، می تواند تا چند برابر حافظه های GDDR5 پهنای باند حافظه ارائه کند.
در معماری HBM هر تراشه رابط حافظه (Bus) مختص به خود را با پهنای 128 بیت خواهد داشت و با افزودن هر تراشه، رابط حافظه آن جمع بسته می شود، در حافظه های معمولی با هر حجمی رابط حافظه مشترک است، اما در این فناوری هر تراشه حافظه یک کانال مختص به خود دارد، یعنی هر تراشه حافظه از رابط خود استفاده می کند و سایر کانال ها را اشغال نمی کند، از این رو با افزودن هر تراشه پهنای باند نیز افزایش می یابد. از آنجایی که در هر لایه دو تراشه و در هر پکیج 4 لایه قرار میگیرد، رابط حافظه برای هر پکیج پشته شده 1024 بیت خواهد بود. همزمان چون با هر پردازنده گرافیکی می توان 4 پکیج 1 گیگابایتی را بکار گرفت، پهنای رابط حافظه نهایی مقدار عظیم 4096 بیت خواهد بود.
در این فناوری هر یک از پکیج های چهار گانه می تواند پهنای باند حافظه ای معادل 128 گیگابایت بر ثانیه را ارائه کند و با یک حساب سر انگشتی، پهنای باند 4 گیگابایت حافظه این نوع، بالای 400 گیگابایت بر ثانیه خواهد بود. در حالت بهینه و با بازنگری های بعدی، از نظر تئوری 4 گیگابایت حافظه HBM می تواند پهنای باند حافظه ای مابین 512 گیگابایت بر ثانیه تا 1 ترابایت بر ثانیه را فراهم کند. اگر این پهنای باند حافظه عظیم را با پهنای باند 337 گیگابایتی کارت گرافیک GeForce Titan X که 12 گیگابایت حافظه ویدئوی GDDR5 با رابط 384 بیتی دارد مقایسه کنید، مطمئناً بخوبی متوجه برتری مطلق آن می شوید.
تا این بخش از این مقاله به توضیح ساده این فناوری پرداختیم، اما برای درک درست تر این فناوی، اجازه دهید که در ادامه نگاهی فنی تر نیز داشته باشیم.
بر روی هر قطعه سلیکیونی HBM چندین بخش مختلف وجود خواهد داشت، در درجه نخست و پیش از هر چیز پردازنده مرکزی یا پردازنده گرافیکی جای گرافته است که بصورت فیزیکی و بر روی قطعه سیلیکونی، با تمامی اجزا در ارتباط خواهد بود. همچنین 4 تراشه HBM نسل نحست که هر یک از آنها دارای چهار لایه خواهد بود، آن را همراهی می کند.
از آنجایی که حافظه های HBM با پشته سازی چندین لایه حافظه بر روی هم خلق شده اند، می بایست در ارتباط مستقیم باشند. این ارتباط از طریق آنچه که TSVs نامیده می شود صورت می گیرد و مستقیماً با پردازنده گرافیکی یا مرکزی در ارتباط هستند. این ارتباط عمودی باعث می شود تا به ازای هر سیکل، داده های بیشتری بین تراشه های حافظه و پردازنده تبادل شوند که در پهنای رابط حافظه 4096 بیتی بخوبی مشهود است. در حالی که حافظه های HBM در مقایسه با GDDR5 فرکانس کمتری دارند، اما می توانند 8 تا 9 برابر سریعتر از GDDR5 عمل کنند.
از آنجایی که با بکار گیری حافظه های HBM، اجزای موجود بر روی قطعه سیلیکونی افزایش می یابد، به تعامل ویژه ای نیز برای ارتباط میان اجزای مختلف نیاز است. این تعامل از طریق لایه ای به نام interposer صورت می گیرد که ارتباط مابین کلیه اجزا را ممکن می سازد. در این حالت لایه های مختلفی بر روی هم قرار می گیرد:
- لایه فوقانی- پردازنده مرکزی یا گرافیکی
- لایه فوقانی- چهار واحد حافظه متشکل از 4 لایه
- لایه میانی- Interposer همه چیز را به هم وصل می کند
- لایه های زیرین- ارتباط با برد PCB
احتمالاً اکنون از خود می پرسید که با بکار گیری حافظه های HBM آیا اندازه قطعه سیلیکونی افزایش می یابد؟ در پاسخ AMD می گوید نه، تفاوت صرفاً در سطح داخلی است. اما با افزایش تعداد اجزای روی قطعه سیلیکونی، حرارت تولید شده چطور؟ باز هم AMD می گوید نه و خنک کننده بخوبی از پس آن بر می آید.
بر کسی پوشیده نیست که انقلاب کوچک اما به سرعت رو به رشدی در دنیای حافظه های ویدئویی در جریان است که HBM تنها یکی از آنها است. استاندارد های جدید نظیر HBM پهنای باند حافظه بیشتری را ممکن می سازند اما نباید فراموش کرد که دستیابی هم زمان و بصورت چندگانه به هریک از ماژول های حافظه، در چنین طراحی نقش کلیدی ایفا می کند و شاهد کاهش شدید تاخیر (latency) در سناریوهای مختلفی خواهیم بود.
در نظر داشته باشید که این تنها نسل نخست از حافظه های HBM است که به 4 گیگابایت محدود می شود و نسل های پیش رو می توانند به ازای هر لایه، تعداد بیشتری تراشه را پشته سازی کنند و با پیشروی به سمت فناوری های ساخت کوچکتر، بیشتر از همیشه می توان به پشته سازی حافظه ها خوش بین بود و حتی ممکن است که فناوری های جایگزین دیگری وارد عرصه شوند.
در آن سو کمپانی انویدیا از بکار گیری نسل نخست HBM صرف نظر کرده و در سال 2016 و با معماری Pascal، نسل دوم از این فناوری را در پردازنده های گرافیکی خود، مورد استفاده قرار می دهد.
منبع شهر سخت افزار