تراشه‌ی Exynos 7420 متشکل از پردازنده‌ی 8 هسته‌ی و پردازنده‌ی گرافیکی Mali-T760 MP8 اولین تراشه‌ی 14 نانومتری مبتنی بر ARMv8 است. در ادامه به بررسی اکسینوس 7420 و نگاهی دقیق به معماری و ساختار آن می‌پردازم.

اولین تراشه‌ی 14 نانومتری دنیای گوشی و تبلت، طبق معمولی محصولی از اینتل است و پس از اینتل، سامسونگ اولین تراشه با لیتوگرافی 14 نانومتری را به دنیای گوشی و تبلت آورده که چیزی جز اکسینوس 7420، قلب قدرتمند گلکسی اس6 و نسخه‌ی اج آن نیست.

در بخش قبلی این مقاله دیدیم که چطور لیتوگرافی 14 نانومتری سامسونگ تراشه‌ی اکسینوس 5433 در گلکسی نوت 4 را 33 درصد کوچک‌تر و در عین حال کم‌مصرف‌تر و قدرتمندتر کرده است:

و حال می‌خواهیم به اندرونی یک تراشه‌ی پیشرفته نگاهی بیاندازیم و با چند بلوک پردازشی اصلی آن آشنا شویم.

معماری و ساختار تراشه‌ی اکسینوس 7420

هسته‌های بزرگ برای عملکرد سریع و هسته‌های کوچک برای مصرف انرژی اندک.

در تراشه‌ی اکسینوس 7420 هشت هسته‌ی گرافیکی به دو کش 512 سطح دوم مربوط می‌شوند. هسته‌های Cortex-A57 در یکی از گوشه‌های تراشه قرار گرفته‌اند تا حرارت تولید شده به خوبی دفع شود. هسته‌های این گروه از 2 مگابایت کش سطح دوم به صورت اشتراکی استفاده می‌کند. گروه هسته‌های کوچک Cortex-A53 در کنار گروه بزرگ قرار گرفته و کش سطح دوم آن 256 کیلوبایت است. سامسونگ برای ارتباط دو گروه هسته که برای رسیدن به عملکرد سریع و در زمان لازم توان مصرفی اندک، آرایش بیگ.لیتل دارند از  CCI-400 آرم استفاده کرده است.

تصویر زیر چیدمان احتمالی بلوک‌های مختلف اکسینوس 7420 است:

دیاگرام بلوکی تراشه‌ی اکسینوس 7420، طرح احتمالی آناندتک

دیاگرام بلوکی تراشه‌ی اکسینوس 7420، طرح احتمالی آناندتک

قبلاً در بررسی عمیق تراشه‌ی تگرا ایکس‌وان به CCI-500 آرم و مزایای آن اشاره کرده بودم؛ جالب است که سامسونگ ارتباط داخلی منسجم کش را هم با استفاده از آخرین طرح‌های آرم بروز نکرده است. توضیحات بیشتر در مورد CCI-500 را در مقاله‌ی زیر دنبال کنید:

کش منسجم داده‌های مشترک را در اختیار بلوک‌های پردازشی قرار می‌دهد.

کش منسجم CCI-400 دارای 5 پورت است و سامسونگ حداقل 4 پورت را به خدمت گرفته است. دو پورت برای دو گروه هسته‌ی پردازنده‌ی اصلی و پورت سوم برای بلوک G2D یا گرافیک دوبعدی که به صورت مشترک با پردازنده‌ی گرافیکی مورد استفاده قرار می‌گیرد. نقش بلوک موردبحث شتاب‌دهی به محاسباتی گرافیکی دوبعدی است، مثلاً بزرگ و کوچک کردن تصاویر. بخشی برای فشرده‌ کردن و دیکد کردن فرمت JPEG هم در این بلوک وجود دارد. دقت کنید که کش منسجم داده‌های را با حفظ هماهنگی کامل در اختیار بخش‌های پردازشی قرار می‌دهد و با کش معمولی متفاوت است. قبلاً در دانش‌نامه‌ی اینتوتک به ارتباط داخلی منسجم کش پرداخته‌ایم.

پورت چهارم به بلوک جدیدی به اسم فشرده‌کننده‌ی حافظه مربوط می‌شود. سامسونگ نام این بلوک را Exynos Memory Compressor گذاشته است. در اندروید 4.4 فشرده کردن اطلاعات موجود روی حافظه‌ی رم (DRAM) یکی از قابلیت‌های کرنل بوده و  البته سامسونگ هم کمی پیش‌تر در اندروید 4.1 این قابلیت را در محصولات خود در نظر گرفته بود. بیشتر تولیدکنندگان دنیای اندروید مکانیزمی برای انجام فشرده‌سازی داده در نظر گرفته‌اند به خصوص که اندروید در قرار دادن اپ‌ها روی رم عملکرد خوبی ندارد و هنوز هم بهینه نیست.

به نظر می‌رسد که نرم‌افزار فعلی گلکسی اس6 از zswap کمال استفاده را نمی‌برد.

سامسونگ در گلکسی اس6 از مکانیزم پیچیده‌تر و بهتری به اسم zswap استفاده کرده که می‌تواند صفحات حافظه را قبل از انتقال اطلاعات به حافظه‌ی ذخیره‌سازی، فشرده کند. عملکرد این مکانیزم در دنیای واقعی بسیار خوب است به طوری که 1.21 گیگابایت داده را روی 341 مگابایت حافظه‌ی فیزیکی ذخیره می‌کند. استفاده از بلوک اختصاصی و بهینه برای پردازش و فشرده‌سازی چیزی است که توان مصرفی و سرعت فرآیند را بهبود می‌بخشد و به همین علت است که در اکسینوس 7420 بلوک خاصی برای این مهم در نظر گرفته شده است. به نظر می‌رسد که فعلاً لایه‌ی نرم‌افزاری لازم برای استفاده از توانمندی این بلوک خاص در گلکسی اس6 وجود ندارد، بنابراین منتظر بروزرسانی‌های سامسونگ هستیم.

احتمالاً آخرین پورت برای بلوکی به اسم CoreSight استفاده شده که آرم آن را برای ردیابی و حل مشکلات سیستم روی چیپ‌ها در نظر می‌گیرد.

سرعت کش منسجم بیش از حد معمول تراشه‌های آرم است.

آرم در طراحی خود پردازنده‌ی گرافیکی را به دو پورت CCI مربوط می‌کند، دو پورت با پهنای باس 128 بیت برای خواندن و همین‌طور نوشتن. سازندگان و طراحان تراشه معمولاً سرعت باس پورت‌های CCI را نصف سرعت رم تعیین می‌کنند. بدین ترتیب استفاده از یک پورت 128 بیتی برای بخش گرافیک ممکن است کمبود پهنای باند ایجاد کند چرا که کنترلر حافظه دارای 2 کانال 32 بیتی است و لذا پهنای باند بخش گرافیک، نصف پهنای باند حافظه‌ی رم است. البته اگر سرعت کلاک پورت کش منسجم را نصف سرعت باس حافظه‌ی رم فرض کنیم. سامسونگ سرعت CCI را حداکثر 532 مگاهرتز در نظر گرفته تا این مشکل حل شود و لذا از قاعده‌ی کلی طراحان تراشه، سرپیچی کرده است. یک نتیجه‌ی دیگر افزایش سرعت پورت‌های کش CCI این است که یکی از گروه هسته‌های پردازنده‌ی اصلی به تنهایی نمی‌تواند پهنای باند حافظه را اشباع کند. پهنای باند هر پورت در فرآیند خواندن و نوشتن داده 8.5 گیگابایت بر ثانیه است و در دو جهت معادل 17 گیگابایت بر ثانیه.

مودم مجزا در کنار اکسینوس 7420

سامسونگ در اکسینوس 7420 برخلاف تراشه‌های مطرح کوآلکام از مودم مجتمع استفاده نکرده بلکه مودم بومی خویش یعنی Shannon 333 را از طریق باسی با تأخیر پایین یا به اختصار LLI به تراشه‌ی اصلی مربوط کرده است. مودم‌های اکسترنال سطح جداگانه و بیشتری اشغال می‌کنند و از طرف دیگر به حافظه‌ی اختصاصی خود نیازمند هستند. بدین ترتیب کوآلکام با تراشه‌هایی که مودم مجتمع دارند، بسیار محبوب است. سامسونگ از واسط LLI استفاده کرده تا مودم خارجی ارتباط سریعی با تراشه‌ی اکسینوس 7420 داشته باشد و حتی بتواند از حافظه‌ی آن استفاده کند. این روش کاملاً جدید نیست چرا که اینتل هم مودم XMM7260 خود را با واسط LLI به تراشه‌ی مرکزی گوشی گلکسی آلفا مربوط کرده بود.

مزیت دیگر LLI کاهش توان مصرفی است چرا که ارتباط نزدیک‌تری نسبت به واسط HSIC ایجاد می‌کند.

اما چرا سامسونگ مثل کوآلکام از مودم مجتمع استفاده نکرده است؟

پاسخ در چند مورد اصلی خلاصه می‌شود؛ اول اینکه طراحی مودم مجتمع از نقاط قوت کوآلکام است و شاید سامسونگ هنوز چنین توانمندی را در خود نمی‌بیند. دوم سازگار کردن مودم با رگولاتوری‌های مختلف است. شبکه‌های مخابراتی نسل چهارم در سراسر جهان یکسان نیستند و استفاده از مودم جداگانه که ویژه‌ی بازارهای مختلف طراحی شده، انتخاب بهتری است چرا که سرعت ارایه‌ی محصول و عملکرد مودم بهینه می‌شود. سوم کاهش هزینه‌ی تولید تراشه است، اکسینوس 7420 به خودی خود تراشه‌ی پیشرفته و پیچیده‌ای است و هر چقدر پیچیدگی آن افزایش یابد، بازدهی تولید تراشه و در واقع تعداد قطعات باکیفیتی که از خط تولید بیرون می‌آید، کمتر می‌شود.

سامسونگ در تراشه‌های رده متوسط و رده پایین همچنان به استفاده از مودم مجتمع می‌اندیشد چرا که بهینه‌سازی هزینه‌ی تولید در درجه‌ی اول اهمیت است. به عنوان مثال شایع شده که در تراشه‌ی اکسینوس 7580 سامسونگ که 8 هسته‌ی Cortex-A53 دارد و محصولی رده متوسط است، مودم داخلی Shannon 310 ایفای نقش می‌کند.

پردازنده‌ی صدا و تصویر مجتمع

در کنار هسته‌های Cortex-A53 ناحیه‌ی اسرارآمیز نسبتاً بزرگی نمایان است که آناندتک حدسی در خصوص کاربرد آن نمی‌زند.

Cortex A5 به جای SRP سامسونگ در بخش پردازش صدا.

سامسونگ در تراشه‌های قبل از اکسینوس 5430 برای پردازش صدا از Samsung Reconfigurable Processor استفاده کرده که معماری خاصی با قابلیت برنامه‌ریزی برای پردازش‌های خاص است. به عنوان مثال در دوربین‌های DSLR مثل NX-1 از SRP استفاده شده است. در اکسینوس 5430 و تراشه‌های جدید و پیشرفته، به جای بلوک سابق صدا از Cortex A5 آرم استفاده شده که می‌تواند دیکد، اینکد و پردازش‌های صوتی مثل اکولایزر را بر عهده بگیرد. سامسونگ قبلاً اعلام کرده که پردازنده‌ی جدید صدا می‌تواند در پردازش گفتار و تشخیص فرامین صوتی نیز مورد استفاده قرار گیرد.

در گوشه‌ی تصویری که در صفحه‌ی قبل دیدیم، بخش پردازش صدا و مالتی‌مدیا و همین‌طور پردازشگر تصویر نمایان است، یک بار دیگر نگاه کنیم:

دیاگرام بلوکی تراشه‌ی اکسینوس 7420، طرح احتمالی آناندتک

دیاگرام بلوکی تراشه‌ی اکسینوس 7420، طرح احتمالی آناندتک

بخش پردازش مالتی‌مدیا از سال 2007 و در حقیقت پس از S3C6400 مداوماً پیشرفت کرده و اکنون بخشی بزرگ و تا حدی ناشناخته است. سامسونگ نام شتاب‌دهنده‌ی سخت‌افزاری برای پخش و اینکد مالتی‌مدیا را MFC یا Multi-Format-Codec گذاشته که اشاره‌ای به پشتیبانی از کدک‌های مختلف صدا و تصویر است.

دیکد و اینکد کدک‌های ویدیویی MPEG4, H263, H264, VP8 و از همه مهم‌تر HEVC پشتیبانی شده و البته دیکد کدک‌های MPEG2, VC1 و از همه مهم‌تر در مرور صفحات وب VP9 نیز انجام می‌شود. سامسونگ قبلاً در اکسینوس 5430 و 5433 از بلوک جداگانه‌ای برای دیکد کردن کدک پیشرفته‌ی HEVC استفاده کرده بود اما در اکسینوس 7420، این بلوک هم به اندرونی MFC راه یافته است.

منظور از دیکد یا کدگشایی، خارج کردن ویدیو، عکس و صدا از حالت فشرده شده یا دقیق‌تر بگوییم، حالت کد و تبدیل آن به چیزی است که می‌توان دید و شنید. منظور از اینکد هم تبدیل یا فشرده‌‎سازی صدا، ویدیو و عکس است.

فقط 600 میلی‌وات برای پخش ویدیوی اولترااچ‌دی فشرده شده با H.265 !

و عملکرد بخش مالتی‌مدیای اکسینوس 7420 عالی است. پخش ویدیوی 4K با فریم‌ریت 30 آن هم با پایین‌ترین روشنایی نمایشگر به تنها 950 میلی‌وات انرژی نیاز دارد. بدین ترتیب احتمالاً تراشه‌ی اکسینوس 4720 حدود 600 میلی‌وات انرژی برای چنین کاری صرف می‌کند که در یک کلام حیرت‌انگیز است. عملکرد بخش مالتی‌مدیا به گونه‌ای است که دو هسته‌ی Cortex-A53 تنها 25 تا 30 درصد از سرعت حداکثری خود را دارند و با سرعت کلاک حدود 400 مگاهرتز فعالیت می‌کنند. متأسفانه دیکدر HEVC از ویدیوهایی با عمق رنگ 10 بیت پشتیبانی نمی‌کند و پس از 2 ثانیه پخش کردن ویدیوهای 4K که 60 فریم بر ثانیه‌ای هستند، از کار می‌افتد.

شاید تصور کنید که S810 کوآلکام از این منظر پیشتاز است ولیکن همین مشکلات در دیکدر HEVC تراشه‌ی S810 نیز مطرح است.

پردازشگر تصویر بخش دوربین تراشه‌های سامسونگ بسیار پیچیده و کامل است.

در مورد پردازشگر اطلاعات جدیدی منتشر نشده و باید به آنچه سامسونگ در معرفی اکسینوس 5420 واگویه کرده، بسنده کنیم. در سال 2013 سامسونگ با استفاده از بلوک‌های مختلف، پردازشگر تصویر قدرتمندی در تراشه‌ی اکسینوس 5420 تعبیه کرده بود. بلوک‌هایی برای جبران حرکات دوربین، 3A که سه عمل اتوفوکوس، اتو اکسپوژر (پرتوگیری خودکار) و اتو وایت بَلِنس (توازن رنگ سفید خودکار) را انجام می‌دهد، فوکوس خودکار با تشخیص فاز، کاهش نویز میان‌فریمی، کاهش مربعی شدن ویدیو، لرزش‌گیر آپتیکال و دیجیتال، تشخیص چهره، پایدارساز ویدیویی در تراشه‌ی موردبحث وجود داشت. بنابراین اکسینوس 7420 هم تمام قابلیت‌های سابق را در کنار موارد جدید در خود جمع کرده است. 4 پورت CSI با پشتیبانی از سه حسگر در تراشه‌ی موردبحث پیاده‌سازی شده بود.

کنترلر نمایشگر با قابلیت‌های بیشتر و مصرف انرژی واقعاً بهینه شده

در اندروید استاتوس‌بار و دکمه‌های لمسی جداگانه رندر می‌شوند.

سامسونگ برای کنترل کردن آنچه روی نمایشگر نمایان می‌شود از بخشی به اسم DECON استفاده می‌کند که مخفف Display and Enhancement Controller و به معنی کنترلر نمایشگر و بهینه‌سازی‌های آن است. نقش دیگر این بخش، ترکیب تصاویری است که باید روی نمایشگر نمایان شوند. توضیح اینکه در وسایل همراه از سخت‌افزار اختصاصی برای ترکیب چند تصویر استفاده می‌شود تا نیازی به رندر شدن کامل تمام بخش‌های صفحه نباشد. به عنوان مثال نوار وضعیت اندروید طی فرآیند پردازشی جداگانه رندر می‌شود، کلیدهای لمسی خانه و … در پایین صفحه نیز به صورت جداگانه رندر شده و در نهایت لایه‌ی سخت‌افزاری اختصاصی تصاویر را ترکیب می‌کند.

در اکسینوس 7420 دو کنترلر اصلی نمایشگر و یک خروجی HDMI جداگانه حضور دارد. هر یک از کنترلرها می‌توانند خروجی MIPI DSI یا دیسپلی‌پورت داشته باشند ولیکن در مورد رزولوشن و سرعت پشتیبانی شده، اطلاعات خاصی منتشر نشده است.

یکی از بخش‌های جدید در اکسینوس 7420 پس‌پردازش ویدیویی  یا به اختصار VPP است که به هر کنترلر ویدیویی اضافه شده و نقش آن به وضوح مشخص نیست. احتمالاً برای بهینه‌سازی رنگ‌ها و دیگر افکت‌های پس‌پردازشی از این بخش استفاده می‌شود.

گلکسی اس6 و گلکسی اس6 اج پروفایل‌های مختلف رنگ نمایشگر را به لحاظ سخت‌افزاری پشتیبانی می‌کنند و این چیزی است که توسط بلوک دیگری به اسم MDNIe امکان‌پذیر شده است.

MIC سامسونگ استریم ارسالی به نمایشگر 2K را با مصرف انرژی اندک فشرده می‌کند.

یکی دیگر از فناوری‌های اختصاصی سامسونگ بلوک MIC یا Mobile Image Compression است. برای تغذیه کردن نمایشگرهای 1440p نمی‌توان از خروجی 4 مسیره‌ی MIPI DSI استفاده کرد چرا که حتی با یک پورت 4 مسیره هم پهنای باند کافی وجود ندارد. یک روش حل مشکل استفاده از پیکربندی دوپورته و به عبارت دیگر 8 مسیر است که بالطبع پهنای باند و مصرف انرژی را دو برابر می‌کند. سامسونگ در گلکسی نوت 4 از MIC استفاده کرده تا استریم ارسال شده به نمایشگر، فشرده شود و با همان یک پورت بتوان نمایشگر 2K را تغذیه کرد. به زودی محصولات بیشتری با پیروی از استاندارد DSC یا Display Stream Compression با قابلیت مشابه معرفی می‌شوند.

ویژگی جالب توجه دیگری که در کنترلر نمایشگر سامسونگ سراغ داریم، قابلیت بروزرسانی بخشی از تصویر است که تغییر کرده و سایر بخش‌ها ثابت می‌مانند. این مهم نیز در کاهش مصرف انرژی نقش موثری دارد. در محصولی مثل ال‌جی جی3 زمانی که محتوای روی نمایشگر ثابت است، رفرش‌ریت به صورت پویا کاهش پیدا می‌کند اما در روشی که گلکسی نوت 4 استفاده کرده، گاهاً فقط بخش‌های بسیار کوچک صفحه مثل آنتن وای-فای و ساعت بروز می‌شوند.

برگرفته از: آناندتک