تراشه‌ی Exynos 7420 متشکل از پردازنده‌ی 8 هسته‌ی و پردازنده‌ی گرافیکی Mali-T760 MP8 اولین تراشه‌ی 14 نانومتری مبتنی بر ARMv8 است. در ادامه به بررسی اکسینوس 7420 و نگاهی دقیق به معماری و ساختار آن می‌پردازم.

لیتوگرافی 14 نانومتری اینتل بدون رقیب نیست.

اولین تراشه‌ی 14 نانومتری دنیای گوشی و تبلت، طبق معمولی محصولی از اینتل است و پس از اینتل، سامسونگ اولین تراشه با لیتوگرافی 14 نانومتری را به دنیای گوشی و تبلت آورده که چیزی جز اکسینوس 7420، قلب قدرتمند گلکسی اس6 و نسخه‌ی اج آن نیست.

اکسینوس 7420 رقیب مشابهی به اسم S810 دارد، محصولی 8 هسته‌ای و 64 بیتی که با توجه به لیتوگرافی 20 نانومتری، نمی‌تواند در برابر اکسینوس جدید سامسونگ ایستادگی کند. در واقع برتری لیتوگرافی همان چیزی است که اینتل را در بازار دستاپ و لپ‌تاپ، بدون رقیب باقی گذاشته و می‌تواند با کسب درآمد بسیار زیاد، مراحل تحقیق و توسعه‌ی پردازنده‌های بهتر و بهینه‌تر را به خوبی طی کند. سامسونگ هم می‌خواهد در امر تولید، از گلوبال فاندریز و TSMC پیشی بگیرد و علاوه بر تولید تراشه‌های عالی برای محصولات خویش، تراشه‌های موفق و قدرتمند آیفون‌ها و آیپدها و دیگر محصولات اندرویدی را هم در کارخانه‌های خویش تولید کرده و سودی سرشار روانه‌ی حساب‌های خویش کند.

برگی از تاریخ، Cortex-A15 در برابر Krait 400 کوآلکام

کوآلکام با مجتمع‌سازی بلوک‌های مختلف، همواره موفق است.

به سال قبل برگردیم، تراشه‌های 32 بیتی کاملاً در دنیای اندروید متداول بودند و کمتر در مورد 64 بیتی‌ها می‌شنیدیم. هسته‌های قدرتمند Cortex-A15 که توسط آرم طراحی شده و هسته‌های کریت 400 و کریت 450 که طرحی اختصاصی از کوآلکام است، مستقیماً با هم رقابت می‌کردند. در این رقابت پایاپای، تراشه‌های کوآلکام به علت داشتن توان مصرفی پایین‌تر و مجتمع‌سازی مودم LTE و نیز پردازشگر تصویر عالی برای بخش دوربین، پیروز بودند ولیکن سامسونگ، مدیاتک و انویدیا هم به تلاش خویش ادامه داده و بخش بزرگی از بازار تراشه را به خود اختصاص می‌دادند.

اینتل در تولید 64 بیتی‌های دستاپی و مدل‌های مشابه برای گوشی و تبلت، یک گام جلوتر از رقبا بوده ولیکن وجود کامپایلرهای سطح پایین، عملکرد و توان مصرفی را از حالت بهینه دور می‌کند. به همین جهت است که تراشه‌ی 64 بیتی آیفون 5S بسیار مورد توجه است.

اپل اولین 64 بیتی و سامسونگ اولین 14 نانومتری مبتنی بر ARM را معرفی کرد.

اپل اولین کمپانی‌ای نیست که از 4 هسته و بیشتر استفاده می‌کند اما اولین کمپانی است که با همان هسته‌های اندک، رکوردشکنی می‌کند. اپل با معرفی اولین تراشه‌ی 64 بیتی دنیای گوشی و تبلت که مبتنی بر معماری مجموعه دستورات ARMv8 است، رقبا را به وحشت انداخت. در ابتدا همه به اتفاق می‌گفتند که هسته‌های 64 بیتی خوب است اما انقلابی نیست ولیکن انتشار بنچ‌مارک‌ها و روان اجرا شدن iOS و اپ‌های متعدد، از حقایق دیگری حکایت می‌کرد.

انویدیا هسته‌ی قدرتمندی به اسم دنور معرفی کرد که در برخی زمینه‌ها، رکورد فراتر از تصور اپل و کوآلکام ثبت کرده و در برخی بنچ‌مارک‌های سبک و کوتاه، در حد بهترین‌ها نیست. اینتل با اتم‌های کم‌مصرف‌تر و بهینه‌تر وارد عمل شده و خلاصه رقابت جدیدی برای معرفی بهترین 64 بیتی‌ها آغاز شده است. اکنون به نقطه‌ای رسیده‌ایم که همه می‌دانند اهداف چیست و باید به چه امتیازاتی برسند.

به عنوان مثال اپل می‌داند که تولید تبلتی با نمایشگر رزولوشن بالا که شاید آیپد پرو با رزولوشن 2K باشد، به پردازنده‌ی گرافیکی قدرتمندی همچون تگرا ایکس‌وان انویدیا نیاز دارد. اینتل هم می‌داند که موفقیت Core M در بازار تبلت در گروی افزایش قدرت بخش گرافیک و همین‌طور کاهش توان مصرفی است. کوآلکام هسته‌های سریعی مثل Kryo با توان مصرفی اندک نیاز دارد و سامسونگ هم به این باور رسیده که بهتر است روی طرح‌های آرم برای پردازنده‌ی اصلی و گرافیکی حساب باز کند و در جهت بهبهود لیتوگرافی تراشه‌های خویش، تلاش بیشتری کند.

و این دانسته‌ها و رقابت پایاپای، به نفع مشتری نهایی است. در دنیای گوشی دیگر قطب‌های طراحی و تولید وجود ندارد، معماری‌های متفاوت و تراشه‌های مختلفی ارایه می‌شود که از نظر عملکرد و توان مصرفی اختلاف آنچنانی ندارند. بنابراین کسی نمی‌تواند یکه‌تازی کند و قیمت گزاف برای محصولات خویش در نظر بگیرد.

اکسینوس 7420 در نگاه اول

اکسینوس 7420 دارای 8 هسته است، 4 هسته‌ی Cortex-A57 و 4 هسته‌ی Cortex-A53 در آرایش بیگ.لیتل ، گروه اول بزرگ و پر‌مصرف و سریع هستند و گروه دوم کوچک، کم‌مصرف و با سرعت کلاک پایین‌تر. بسته به نوع بار پردازشی، هسته‌ها فعال و غیرفعال می‌شوند تا مصرف انرژی و قدرت پردازشی بهینه شود.

این ساختار در S810 کوآلکام با لیتوگرافی 20 نانومتری، در اکسینوس 5433 سامسونگ با لیتوگرافی 20 نانومتری که البته به صورت 64 بیتی پردازش نمی‌کند (شایدبعدها با بروزرسانی سیستم عامل گلکسی نوت 4 ، هسته‌ها به صورت 64 بیتی کار کنند) و در کرین 930 هوآوی (تراشه‌ی گوشی P8) نیز استفاده شده است.

گرافیک 8 هسته‌ای در کنار 8 هسته‌ی 64 بیتی.

سامسونگ در بخش گرافیک از Mali-T760 استفاده کرده، آن هم به صورت 8 هسته‌ای. چند ماه قبل در اکسینوس 5430 از Mali-T628 به صورت 6 هسته‌ای استفاده شده بود و این یعنی روند بروزرسانی بسیار سریع بوده است. گویا کره‌ای‌ها اکسینوس 5433 را با عجله طراحی و تولید کردند و به سرعت به مقصود اصلی خود که تراشه‌ای رده‌اول و بروز است، مهاجرت کرده‌اند. با این اوصاف احتمالاً اکسینوس‌های بعدی با هسته‌های Cortex-A72 و گرافیک سری 800 آرم هم به زودی سر از دنیای شایعات درمی‌آورند.

و به هر حال معرفی گلکسی اس6 بدون تراشه‌ی S810 کوآلکام، شوک بزرگی برای رقبای سامسونگ بوده چرا که لیتوگرافی و معماری آن از جهات مختلف برتر از S810 است.

تراکم Exynos 7420 نسبت به اکسینوس 5433

33 درصد کاهش مساحت و در عین حال افزایش عملکرد.

مساحت اکسینوس 7420 فقط 78 میلی‌متر مربع است در حالی که اکسینوس 5433، مساحت 113 میلی‌متر مربعی داشت. 33 درصد کاهش سطح نشان می‌دهد که سامسونگ واقعاً تمام بخش‌های تراشه را کوچک‌تر کرده است. موضوع این است که بزرگ‌ترین لایه‌ی فلزی تراشه یعنی BEOL هم احتمالاً مثل قبل 20 نانومتری نیست. سامسونگ چندی پیش در نشستی از لیتوگرافی 20 نانومتری LPM سخن گفته که با توجه به ظهور لیتوگرافی 14 نانومتری، کنار گذاشته شده است. تفاوت 20 نانومتری LPM با 20 نانومتری LPE که در اکسینوس 5433 و اکسینوس 5430 به کار رفته در گام  M1 است، چیزی که مستقیماً روی تراکم ترانزیستور و نیز مصرف انرژی اثر می‌گذارد. گام M1 در لیتوگرافی جدید 14 نانومتری سامسونگ 64 نانومتر است، درست مثل لیتوگرافی 20 نانومتری LPM. به همین جهت است که اکسینوس 7420 از نظر مساحت تراشه، 33 درصد کوچک‌تر از اکسینوس 5433 است و در عین حال قدرت پردازشی بالاتری دارد.

جدول زیر تراکم تراشه‌های مبتنی بر لیتوگرافی 14، 20 و 28 نانومتری سامسونگ را توضیح می‌دهد:

لیتوگرافی‌های سامسونگ
  28LPP 20LPE 20LPM 14LPE
ولتاژ VDD اسمی 1 0.9 0.87 0.8
گام گیت‌های تماسی 113.4nm 90nm 86nm 78nm
گام M1 90nm 80nm 64nm 64nm

تراکم

(حاصل‌ضرب دو گام قبلی)

10206 7200 5504 4992

اگر بخواهیم مساحت اختصاص داده شده به هسته‌های پردازنده‌ی اصلی که شامل گروه هسته‌های بزرگ و کوچک است و همین‌طور پردازنده‌ی گرافیکی را در یک نگاه مقایسه کنیم، به جدول زیر می‌رسیم:

مساحت هسته‌های اصلی و گرافیکی تراشه‌های مختلف سامسونگ
  Exynos5420 Exynos5430 Exynos5433 Exynos7420
هسته‌های بزرگ 2.74 1.67 2.05 1.20
گروه بزرگ 16.49 14.50 15.10 8.88
هسته‌های کوچک 0.58 0.40 0.70 0.48
گروه کوچک 3.80 3.30 4.58 2.71
پردازنده‌ی گرافیکی 30.05 حدود 25.00 حدود 25.00 17.70
مساحت تراشه 136.96 110.18 113.42 78.23

همان‌طور که در جدول فوق مشاهده می‌کنید هسته‌های کوچک حدود 33 درصد کاهش سطح دارند اما هسته‌های بزرگ در حد 59 درصد کوچک‌تر شده‌اند! بخش گرافیک هم 41 درصد کوچک‌تر شده است. هر یک از هسته‌های T760 حدود 1.75 میلی‌مترمربع مساحت دارد و در مجموع مساحت هسته‌ها معادل 14.2 میلی‌مترمربع است. 56 درصد کمتر از آنچه در اکسینوس 5433 سراغ داریم.

نکته‌ی مهم‌تر این است که بخش گرافیک حدود 22 درصد سطح تراشه را به خود اختصاص داده که نشان‌دهنده‌ی تمایل سامسونگ به استفاده از پردازنده‌ی گرافیکی بزرگ‌تر و سریع‌تر است. به خصوص که افزایش رزولوشن محصولات نیز اهمیت پردازنده‌ی گرافیکی را تقویت می‌کند.

بدین ترتیب سامسونگ با استفاده از سلول‌های بهینه‌تر یا بهینه‌سازی چیدمان و تراکم، تراشه‌ای طراحی کرده که کوچک‌تر است و در عین حال دو هسته‌ی گرافیکی و کنترلر DDR4 نیز به آن اضافه شده است.

ولتاژ کاری پایین‌تر در تمام بخش‌های اکسینوس 7420

لیتوگرافی 14 نانومتری سامسونگ که ارتباطات داخلی آن نیز بهینه شده، توان مصرفی و در واقع ولتاژ کاری بخش‌های مختلف تراشه را تحت تأثیر قرار می‌دهد. جدول زیر ولتاژ کاری هسته‌های پردازنده‌ی اصلی و گرافیکی در سرعت کلاک‌های مختلف است. با آنچه در اکسینوس 5433 سراغ داریم، مقایسه کنید:

اکسینوس 7420 سامسونگ در برابر اکسینوس 5433 از نظر ولتاژ کاری
  اکسینوس 5433 اکسینوس 7420 تفاوت
A57 1.9GHz (ASV9) 1200.00mV 975.00mV -225.00mV
A57 1.9GHz (ASV15) 1125.00mV 912.50mV -212.50mV
A57 800MHz (ASV9) 900.00mV 687.50mV -224.50mV
A57 800MHz (ASV15) 900.00mV 625.00mV -275.00mV
A53 1.3GHz (ASV9) 1112.50mV 950.00mV -162.50mV
A53 1.3GHz (ASV15) 1062.50mV 900.00mV -162.50mV
A53 400MHz (ASV9) 787.50mV 656.25mV -131.25mV
A53 400MHz (ASV15) 750.00mV 606.25mV -143.75mV
GPU 700MHz (ASV9) 1050.00mV 800.00mV -250.00mV
GPU 700MHz (ASV15) 1012.50mV 750.00mV -262.50mV
GPU 266MHz (ASV9) 800.00mV 668.75mV -131.25mV
GPU 266MHz (ASV15) 762.50mV 606.25mV -156.25mV

تراشه‌های بی‌کیفیت داغ‌تر بوده و ولتاژ بالاتری دارند.

منظور از ASV یا Adaptive Scaling Voltage این است که تراشه‌های مختلف با ولتاژ کاری متفاوتی به سرعت فرضاً 1.9 گیگاهرتز می‌رسند. در دنیای دستاپ می‌توان از تراشه‌هایی که کیفیت پایین‌تری دارند و در حقیقت به ولتاژ بالاتری برای رسیدن به سرعت مطلوب نیاز دارند، به عنوان مدل‌های رده پایین استفاده کرد. مثلاً برخی هسته‌ها را غیرفعال کرد یا سرعت کلاک پایین‌تری برای تراشه در نظر گرفت و آن را به عنوان مدل ارزان‌تر و کندتر روانه‌ی بازار کرد.

این روش در تراشه‌های موبایل استفاده نشده است. معمولاً برای رسیدن به سرعت کلاک مطلوب، ولتاژ افزوده می‌شود و بدین ترتیب با تراشه‌ای داغ‌تر و پرمصرف سروکار خواهیم داشت.

تفاوت بهترین و بدترین نمونه‌ها را در نمودار زیر می‌توان جست‌وجو کرد:

منحنی ولتاژ کاری و فرکانس هسته‌های Cortex-A57 در اکسینوس 7420

منحنی ولتاژ کاری و فرکانس هسته‌های Cortex-A57 در اکسینوس 7420

اختلاف در حد 150 میلی‌ولت است که به معنی تفاوت 32 درصدی در توان دینامیکی هسته‌های Cortex-A57 است. البته دقت کنید که بیشتر تراشه‌های به کار رفته در محصول نهایی، از نظر مقدار لاندا ASV10 و ASV11 هستند. به ندرت می‌توان محصولی با لاندای کمتر از 6 پیدا کرد چرا که داغ شدن تراشه بیش از حد خواهد بود.

تراشه‌ای که آناندتک مورد بررسی قرار داده، ASV10 برای پردازنده‌ی اصلی و AVS11 برای بخش گرافیک دارد. بنابراین تراشه‌ای معمولی است.

کنترل ولتاژ و سرعت کلاک با ظرافت بیشتر

سرعت مانیتورینگ در اکسینوس 7420 بسیار بالاست.

سامسونگ برای کنترل کردن ولتاژ و فرکانس از سیستم کنترلر حلقه بسته استفاده کرده به این صورت که مایکروکنترلر مبتنی بر ARM Cortex M3 مرتباً با استفاده از حسگرها عملکرد سخت‌افزار را بررسی می‌کند و تغییرات لازم را انجام می‌دهد. سامسونگ اسم این روش کنترلی را مدیریت تطبیقی توان یا به اختصار APM گذاشته است. این روش در قیاس با مکانیزم نرم‌‎افزاری DVFS سریع‌تر است و کنترل توان مصرفی را با ظرافت بیشتری انجام می‌دهد. در روش متداول DVFS فرکانس نمونه‌برداری بسیار پایین‌تر است و در حقیقت هر20 الی 80 میلی‌ثانیه یک بار حسگرها قرائت می‌شوند و این در حالی است که APM سامسونگ هر 1 میلی‌ثانیه وضعیت را کنترل می‌کند.

سیستم کنترلی حلقه بسته‌ی PowerWise  تگزاس‌اینسترومنت

سیستم کنترلی حلقه بسته‌ی PowerWise تگزاس‌اینسترومنت

سامسونگ پله‌های کاهش و افزایش ولتاژ را 6250 میکروولت در نظر گرفته و حداثل ولتاژ هسته‌های پردازنده را 25 میلی‌ولت تنظیم کرده است. پردازنده‌ی گرافیکی هم می‌تواند به حداقل ولتاژ کاری 12.5 میلی‌ولت برسد. اخیراً کوآلکام در S810 و انویدیا در تگرا کی‌وان نیز از کنترل حلقه بسته استفاده کرده‌اند با این تفاوت که روش کنترل ولتاژ همان روش بهینه‌ی سابق نیست.

در بخش دوم این مقاله به بررسی عمیق بخش‌های پردازشی متنوعی که در سطح کوچک اکسینوس 7420 به خدمت گرفته شده می‌پردازیم.

برگرفته از: آناندتک