انویدیا از قدرت پردازشی Tesla P100 در ابرکامپیوترهای متعددی استفاده خواهد کرد اما کامپیوتر NVIDIA DGX-1، اولین ابرکامپیوتر جهان برای مقصودی خاص به اسم یادگیری عمیق است. این روزها گوگل، فیس‌بوک و کمپانی‌های کوچک و بزرگ زیادی روی هوش مصنوعی و یادگیری ماشینی سرمایه‌گذاری کرده‌اند. کامپیوتر یا دقیق‌تر بگوییم، ابرکامپیوتر انویدیا DGX-1 علاوه بر سخت‌افزار بهینه، نرم‌افزارهای خاصی برای پردازش یادگیری عمیق دارد.

در GP100 و Tesla P100 که مبتنی بر این تراشه است، چند نوآوری بسیار مهم و اساسی وجود دارد: حافظه‌ی HBM2 با توان مصرفی و ابعاد کم و پهنای باند فوق‌العاده بالا، لیتوگرافی ۱۶ نانومتری FinFET که مصرف انرژی و فرکانس کاری را بهینه کرده، معماری پاسکال با ویژگی‌های جالبی مثل موتور جابجایی صفحه (حافظه) و راهکار ارتباطی NVLink با سرعتی در حد ۲٫۵ برابر پی‌سی‌آی اکسپرس. در واقع تنها مسأله افزایش قدرت پردازشی نیست، در یادگیری عمیق پردازنده‌های گرافیکی می‌بایست با سرعت هر چه بیشتر در ارتباط باشند و NVLink برای همین منظور طراحی شده است. با چنین ویژگی‌هایی، طبیعی است که انتظار داشته باشیم ابرکامپیوتر جدید انویدیا، یک هیولای پردازشی در ابعاد کوچک باشد.

ابرکامپیوتر جدید انویدیا، قدرتی در حد ۲۵۰ سرور مبتنی بر پردازنده‌های x86 اینتل دارد اما از نظر ظاهری، بیشتر شبیه یک سرور است! بد نیست با محصول سال پیش انویدیا هم مقایسه کنیم، DGX-1 سرعت آموزش یک شبکه‌ی عصبی را نسبت به کامپیوتری با ۴ پردازنده‌ی گرافیکی مکسولی انویدیا در سال پیش، ۱۲ برابر بیشتر می‌کند. ۸ تراشه‌ی GP100 انویدیا به تنهایی ۵۶ برابر بیشتر از دو تراشه‌ی ۱۴ هسته‌ای زئون اینتل قدرت دارند و با توجه به معماری خاص و بهینه، تفاوت عملی به ۷۵ برابر می‌رسد.

قدرت پردازشی Tesla P100 به مراتب بیشتر از Xeonهای اینتلی است

قدرت پردازشی Tesla P100 به مراتب بیشتر از Xeonهای اینتلی است

کارت گرافیک Tesla P100 معماری بهینه برای یادگیری عمیق دارد

کارت گرافیک Tesla P100 معماری بهینه برای یادگیری عمیق دارد

نرم‎‌افزارهای بهینه شده برای تعلیم شبکه‌ی عصبی

انویدیا نرم‌افزار NVIDIA Deep Learning GPU Training System یا به اختصار DIGITS را به همراه ابرکامپیوتر جدید خود عرضه کرده است. این نرم‌افزار مجموعه‌ای کامل و تعاملی برای ساختن شبکه‌های عصبی و یادگیری عمیق است و در آن در کتابخانه‌ی جدید CUDA Deep Neural Network library که پردازش شبکه‌ی عصبی به کمک هسته‌های CUDA را بهینه می‌کند، استفاده شده است. نام اختصاری این کتابخانه cuDNN 5.0 است. سه فریم‌ورک مهم و پرکاربرد Caffe و Theano و Torch نیز با بهینه‌سازی‌های خاص، در این ابرکامپیوتر گنجانده شده تا مقوله‌ی نرم‌افزاری تکمیل شود.

مشخصات ابرکامپیوتر DGX-1 انویدیا در یک نگاه:

  • قدرت پردازشی حداکثر ۱۷۰ ترافلاپس (۵۶ برابر بیشتر از دو پردازنده‌ی Xeon E5-2697 v3 اینتل با ۱۴ هسته‌ی هسولی)
  • دو پردازنده‌ی ۱۶ هسته‌ای اینتل از گروه Haswell-EP به نام Xeon E5-2698 v3
  • ۸ تراشه‌ی GP100 انویدیا (هر یک دارای ۳۵۸۴ هسته‌ی CUDA)
  • ۵۱۲ گیگابایت رم DDR4-2133 به صورت LRDIMM
  • ۱۲۸ گیگابایت حافظه‌ی ویدیویی HBM2
  • ۴ درایو SSD سامسونگ PM863 با ظرفیت ۱٫۹۲ ترابایت
  • ۴ پورت شبکه‌ی Infiniband EDR و ۲ پورت اترنت ۱۰ گیگابیت بر ثانیه‌ای
  • توان مصرفی ۳۲۰۰ وات
2 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 52 votes, average: 5٫00 out of 5 (2 نظر، امتیاز: 5٫00 از 5)
برای نظر دادن ابتدا باید ثبت نام کنید.
Loading...
لينک کوتاه:

FacebookTwitterGoogle


بيشتر بخوانيد:

دیدگاه بگذارید

اطلاع از
بهادر
خواننده

چه رشد  انقلابی داشته این پاسکال! آقای شیری ۲۶۹۷ وی۳ ، ۱۴ هسته ایی هستش.به نظرتون این مقایسه کم سیاه نمایی نیستش؟! تو بحث قیمت که دوتا۲۵۰۰ دلاری رو دارن با یه سیستم ۱۳۰ هزار دلاری مقایسه میکنن!
قدرت ۲۶۹۷ هم یه کم عجیب برام! یعنی تو پردازش ۱۶ بیت فقط ۱٫۵ ترافلاپس قدرت داره؟! الان یه ۴ هسته ایی اینتل تو ۳۲ بیت حدود ۳۰۰-۴۰۰ گیگافلاپس قدرت داره، اونوقت چه طوری یه ۱۴ هسته ایی ۷۵۰ گیگافلاپس قدرت داره؟!! 

wpDiscuz

تبلیغات

ویژه‌ها

تبلیغات

تبلیغات

×