هر فایل ویدیویی شامل استریم صدا، تصویر و احتمالاً استریم‌های دیگری مثل زیرنویس است. Bit Rate از نظر لغوی نرخ بیت ترجمه می‌شود و بیت‌ریت استریم ویدیو به این معنی است که در هر ثانیه چند بیت داده برای فشرده‌کردن و یا پخش ویدیو به کار می‌رود. در ادامه با بررسی و محاسبه‌ی بیت‌ریت و همین‌طور بیت‌ریت مناسب جهت فشرده‌سازی ویدیوها و فایل‌های صوتی آشنا می‌شویم.

بیت‌ریت متغیر بهتر از بیت‌ریت ثابت است.

دقت کنید که در گذشته بیت‌ریت صدا و تصویر ثابت بود اما این روزها تمامی کدک‌های فشرده‌سازی صدا و تصویر از روش بیت‌ریت متغیر یا Variable Bitrate استفاده می‌کنند تا بسته به میزان داده‌ی مورد نیاز در هر زمان خاصی، بیت‌ریت مناسب انتخاب شود. بدین ترتیب گاهی بیت‌ریت بسیار زیاد است و گاهی در صحنه‌های ثابت و تیره، بیت‌ریت بسیار کم می‌شود. اگر از یک کدک خاص استفاده کنیم، هر چه بیت‌ریت نوسان بیشتری داشته باشد، کیفیت ویدیو هم بالاتر است البته به شرطی که الگوریتم تخصیص بیت‌ها کاملاً بهینه و هوشمند باشد.

به عنوان مثال اگر حجم یک فایل ویدیویی بدون صدا ۱۰ مگابایت باشد و مدت زمان آن ۱۰ ثانیه، در هر ثانیه به طور متوسط ۱ مگابایت داده (هر مگابایت معادل ۱۰۰۰ کیلوبایت است) به صورت تصویر متحرک پخش می‌شود و بایت‌ریت (هر بایت معادل ۸ بیت است) ۱۰۰۰ کیلوبایت بر ثانیه و بیت‌ریت ۸۰۰۰ بیت بر ثانیه به دست می‌آید.

بیت‌ریت صدا و ویدیوی فشرده شده

و چند عدد مفید که بهتر است حفظ کنیم:

  • بیت‌ریت ویدیوی ۷۲۰p با اینکدر x264 حدود ۹۰۰ کیلوبیت بر ثانیه
  • بیت‌ریت ویدیوی ۱۰۸۰p با اینکد x264 حدود ۱۸۰۰ کیلوبیت بر ثانیه
  • بیت‌ریت صدای ۲ کاناله با کدک AAC (اینکدر Nero یا Apple) برای فیلم‌های فشرده: حدود ۸۰ کیلوبیت بر ثانیه
  • بیت‌ریت صدای ۵٫۱ کاناله با کدک AAC (محصول Nero یا Apple) برای فیلم‌های فشرده: حدود ۱۶۰ کیلوبیت بر ثانیه
  • بیت‌ریت صدای ۲ کاناله برای فیلم‌های فشرده: حدود ۸۰ کیلوبیت بر ثانیه
  • بیت‌ریت MP3 معمولی: ۱۲۸ کیلوبیت بر ثانیه
  • بیت‌ریت MP3 با کیفیت بالا: ۳۲۰ کیلوبیت بر ثانیه

اعداد فوق واقعی است و با بررسی ویدیو‌های مختلف به دست آمده است. برای بررسی دقیق می‌توانید از نرم‌افزار Media info استفاده کنید که البته به صورت بخشی از پلیر حرفه‌ای و قدرتمند PotPlayer هم قابل استفاده است.

بررسی بیت‌ریت ویدیو توسط PotPlayer

بررسی بیت‌ریت ویدیو توسط PotPlayer

دو نمونه ویدیوی H.264 با اینکدر x264:

1080p720p
بیت‌ریت یک ویدیوی H.264 با کدک x264 و سرعت 24 فریم بر ثانیه و رزولوشن 1080p

بیت‌ریت یک ویدیوی H.264 با اینکدر x264 و سرعت ۲۴ فریم بر ثانیه و رزولوشن ۱۰۸۰p

بیت‌ریت یک ویدیوی H.264 با کدک x264 و سرعت 24 فریم بر ثانیه و رزولوشن 720p

بیت‌ریت یک ویدیوی H.264 با اینکدر x264 و سرعت ۲۴ فریم بر ثانیه و رزولوشن ۷۲۰p

در فیلم‌برداری با دوربین گوشی‌های امروزی که حتی از ۴K هم پشتیبانی می‌کنند بیت‌ریت بسیار بالاست و به ۳۰ کیلوبیت بر ثانیه می‌رسد. حتی ویدیوهای ۱۰۸۰p با سرعت ۲۴ فریم بر ثانیه هم حجم مشابهی دارند.

تصویر زیر گویای این حقیقت است که ویدیوها بدون فشرده‌سازی شدید، می‌توانند بسیار حجیم باشند و بیت‌ریت ویدیوی ۱۰۸۰p با کیفیت عالی، حدود ۱۲۰۰۰کیلوبیت بر ثانیه است.

بیت‌ریت متداول برای ویدیوهای مختلف

بیت‌ریت متداول برای ویدیوهای مختلف

بیت‌ریت فایل‌های صوتی و تفاوت MP3 128 با MP3 320 و AAC 80

در مورد فایل‌های صوتی اغلب این تصور وجود دارد که کیفیت MP3 با بیت‌ریت ۳۲۰ بسیار بالاتر از MP3های ۱۲۸ کیلوبیت بر ثانیه‌ای است و از طرفی AAC با بیت‌ریت ۸۰ کیفیت پایینی دارد. در نمودار زیر تخمینی از کیفیت شنیداری حالات مختلف ارایه شده و همان‌طور که مشاهده می‌کنید بیت‌ریت بالاتر از ۱۲۸ در بخشی از منحنی قرار گرفته که با شیب اندکی افزایش پیدا می‌کند. بنابراین MP3 با بیت‌ریت ۳۲۰ از نظر کیفیت اختلاف چندانی با AAC با بیت ۸۰ کیلوبیت بر ثانیه‌ای ندارد.

کیفیت صدا با فرمت‌ها و بیت‌ریت‌های مختلف

کیفیت صدا با فرمت‌ها و بیت‌ریت‌های مختلف

و نتیجه‌ی یک تست شنیداری عمومی نشان می‌دهد که Apple AAC با بیت‌ریت ۱۰۴ بهتر از اینکدر LAME (فایل‌های mp3) با بیت‌ریت حدود ۱۳۶ کیلوبیت بر ثانیه است:

کیفیت صدا با فرمت‌ها و بیت‌ریت‌های مختلف

کیفیت صدا با فرمت‌ها و بیت‌ریت‌های مختلف

کانورت ویدیو و محاسبه بیت‌ریت مناسب

دو برابر شدن سرعت ویدیو و دو برابر شدن بیت‌ریت موردنیاز.

سرعت ویدیو و رزولوشن آن در بیت‌ریت موثر است. اگر از x264 یا x265 برای تبدیل ویدیو و فشرده‌سازی استفاده کنیم، بیت‌ریت باید متناسب با رزولوشن و سرعت ویدیو و همین‌طور توجه به نوع ویدیو انتخاب شود. به عنوان مثال برای یک فیلم ۱۰۸۰p انتخاب بیت‌ریت ۲۰۰۰ مطلوب است اما به شرطی که ویدیو با سرعت ۲۴ یا ۲۵ فریم بر ثانیه ضبط شده باشد و نه سرعتی مثل ۶۰ فریم بر ثانیه. با دو برابر شدن سرعت بهتر است بیت‌ریت را هم دو برابر کنیم.

در x265 بیت‌ریت پایین‌تر هم کاربردی است و می‌توان بیت‌ریت ویدیوی ۱۰۸۰p را ۱۰۰۰ تا ۱۵۰۰ در نظر گرفت.

محتوای ویدیو در بیت‌ریت انتخابی بسیار موثر است. به عنوان مثال انیمیشن‌ها فاقد بافت ظریف هستند و رنگ‌ها یک‌دست و ساده است. لذا بیت‌ریت ۱۰۰۰ هم برای یک ویدیوی فول اچ‌دی انتخاب خوبی است. اگر از x265 استفاده شود، می‌توان بیت‌ریتی مثل ۷۰۰ یا ۸۰۰ را هم انتخاب کرد.

اما در مورد سایر رزولوشن‌ها و سرعت‌ها چه کنیم؟

بیت‌ریت متناسب با مساحت و در رزولوشن‌های پایین، کمی بیشتر.

ساده‌ترین حالت این است که تنها مساحت را در نظر بگیریم. به عنوان مثال ۷۲۰p مساحتی در حد ۱ مگاپیکسل دارد که نصف ۱۰۸۰p است. لذا بیت‌ریت از ۲۰۰۰ به ۱۰۰۰ تبدیل می‌شود. ۳۶۰p یا در حقیقت ۶۴۰ در ۳۶۰ پیکسل حدوداً یک چهارم ۷۲۰p است، بنابراین بیت‌ریت از ۱۰۰۰ به ۲۵۰ تبدیل می‌شود. انتخاب بیت‌ریت در رزولوشن‌های پایین‌تر، با در نظر گرفتن بازدهی کمتر الگوریتم‌های فشرده‌سازی انجام می‌شود، لذا به جای انتخاب ۲۵۰ کیلوبیت بر ثانیه، از ۴۰۰ کیلوبیت بر ثانیه استفاده می‌کنیم.

روش دیگر را در ادامه بررسی می‌کنیم که روشی کامل‌تر برای تمامی رزولوشن‌ها و سرعت‌هاست.

متوسط تعداد بیت‌ها برای هر پیکسل، فاکتور کلیدی و اصلی

در مدیا اینفو فاکتوری به اسم:

Bits/(Pixel * Frame)

نمایش داده شده است که با مراجعه به اسکرین‌شات‌ها مشخصات ویدیوی ۱۰۸۰p که قبلاً مرور کردیم، مقدار آن ۰٫۰۳۹ است. این عدد برای ویدیوهای مختلف متفاوت است و بهتر است از اعداد ۰٫۰۶ تا ۰٫۰۸ استفاده کنید تا کیفیت ویدیو مطلوب باشد. اما مفهوم آن:

متوسط بیت‌های لازم برای ایجاد یا اینکد کردن یک پیکسل، کمیت اصلی در تخمین بیت‌ریت ویدیو.

بیت تقسیم بر حاصل‌ضرب فریم‌ریت و پیکسل‌های یک فریم، در واقع مقدار بیت برای هر پیکسل تصویر را محاسبه شده است. بهتر است به صورت عددی مثال را دنبال کنیم. رزولوشن ویدیوی اشاره شده ۱۹۲۰ در ۱۰۴۰ است و در حقیقت بخش تیره‌ی بالا و پایین تصویر برای کاهش حجم ویدیو به کلی برش خورده است. البته برش زدن ویدیویی که قرار است با x264 فشرده شود، چندان مهم نیست چرا که این اینکدر بخش‌های ثابت تصویر را به راحتی و با سرعت بسیار بالا فشرده می‌کند.

تعداد پیکسل‌های یک فریم تصویر حدود ۲ میلیون پیکسل (۲ مگاپیکسل) است و با توجه به اینکه در هر ثانیه حدود ۲۴ فریم وجود دارد، به ۴۸ میلیون پیکسل در ثانیه می‌رسیم. برای ایجاد این تعداد پیکسل، ۱۸۰۰ کیلوبیت داده یا در واقع ۱٫۸ میلیون بیت داده استفاده شده ، اگر ۱٫۸ را بر ۴۸ تقسیم کنیم، به عددی در حدود ۰٫۰۴ بیت بر فریم پیکسل می‌رسیم، همان عددی که در مشخصات ویدیو دیدیم.

حال مثالی از کاربرد این عدد:

عدد مناسب را ۰٫۰۸ در نظر بگیرید، ویدیوی موردنظر برای فشرده‌سازی هم ۶۴۰ در ۳۶۰ پیکسلی است و سرعت آن ۲۴ فریم بر ثانیه. در یک ثانیه‌ی این ویدیو، تعداد پیکسل‌ها ۶۴۰ در ۳۶۰ در ۲۴ عدد است و مقدار بیت‌ریت احتمالاً مناسب ۶۴۰ در ۳۶۰ در ۲۴ در ۰٫۰۸، نتیجه‌ی نهایی بیت‌ریت ۴۴۲ کیلوبیت بر ثانیه‌ایست و به شخصه برای افزایش کیفیت ویدیوهای رزولوشن پایین که معمولاً فشرده‌سازی آنها اندکی دشوارتر است، بیت‌ریت ۵۰۰ را برای ویدیو انتخاب می‌کنم.

برای تبدیل کردن ویدیو به کمک x264 و x265 بهتر است از نرم‌افزارهایی مثل Hybrid ، Xvid4PSP و یا Handbrake که بسیار ساده طراحی شده استفاده کنید. آپشن‌ها بسیار زیاد و گاهاً گیج‌کننده است. برای سادگی فرآیند کانورت می‌توانید از پریست‌های موجود استفاده کنید.

دنیای کدک‌های صوتی و تصویری

بهترین روش فشرده‌سازی فیلم : کانورت با x264 و آشنایی با آپشن‌های مختلف آن

به بخش هفتم سری مقالات آشنایی با دنیای کدک‌های صوتی و تصویری رسیدیم و در این قسمت می‌خواهیم با آپشن‌های متنوع x264 و مقدمات کانورت با x264 آشنا شویم. با ما همراه شوید.

روش دیگر استفاده از CRF است که در مقاله‌ی فوق توضیح داده شد، بخشی از آن را مرور کنید ,و دقت داشته باشید که اصطلاح CRF نه تنها در x264 بلکه در اینکدرهای ویدیویی مختلفی که تحت استاندارد H.264 و H.265 معرفی شده‌اند، استفاده می‌شود.

کنترل بیت ریت و حجم ویدیو با روش CRF و QP

در x264 برای کنترل کیفیت و حجم ویدیوی تبدیل شده، سه روش کلی وجود دارد. ساده‌ترین روش مشخص کردن بیت ریت یا معادل آن، حجم فایل است. می‌توان از حالت دو مسیره هم استفاده کرد به این صورت که در مسیر اول، اینکدر به سرعت استریم ورودی را تحلیل و بررسی می‌کند و در مسیر دوم تبدیل را با دقتی بالا برای رسیدن به حجم یا بیت ریت متوسطی که مشخص شده، انجام می‌دهد.

منظور از Quantizer در تنظیمات تبدیل با x264 و بسیاری از اینکدرهای ویدیویی چیست؟
منظور از کوآنتایزر، بیان کیفیت به صورت یک کمیت یا Quantity است. کوآنتایز کردن یعنی چیزی را با عدد و رقم بیان کردن.
Constant Quantizer برای حفظ کیفیت صحنه‌های پرتحرک و گذرا مناسب است.

روش دوم یعنی qp استفاده از کوآنتایزر برای فریم‌های P است. هر چه کوآنتایزر بیشتر باشد، کیفیت پایین‌تر است. عدد ۰ به معنی اینکدینگ بدون افت کیفیت است و اعدادی در محدوده‌ی ۱۸ تا ۲۳، کیفیت خوب استریم خروجی را تضمین می‌کنند. در qp فقط کوآنتایزر فریم‌های P را به اینکدر می‌دهیم. کوآنتایزر دو نوع دیگر یعنی I و B با دو آپشن ipration و bpratio که نسبت کوآنتایزر این دو نوع فریم به کوآنتایزر فریم‌های P را بیان می‌کنند، محاسبه می‌شود. این روش Constant Quantizer نامیده شده چرا که کوآنتایزر همه‌ی فریم‌ها دقیقاً مشخص می‌شود.

حجم ویدیوی نهایی در این روش، قطعاً مشخص نیست اما می‌توان تخمینی از آن داشت. از این رو در برخی نرم‌افزارها، حالت دو مسیره برای تبدیل با آپشن qp و crf هم به چشم می‌خورد حال آنکه در اغلب نرم‌افزارها، qp و crf تنها به صورت یک مسیره قابل استفاده هستند.

CRF بهترین روش است اما کیفیت فریم‌های صحنه‌های پرتحرک و گذرا را پایین می‌آورد.

 روش جالب‌تر Constant Rate Factor است که به صورت مخفف crf گفته می‌شود. هدف این است که در صحنه‌های پرتحرک و فریم‌های پیچیده، کوآنتایزر به صورت هوشمندانه افزایش یابد و کیفیت کمتر شود چرا که چشم انسان آن قدر سریع و دقیق نیست که کیفیت این بخش‌ها را تشخیص دهد. در نتیجه کیفیت بصری حفظ می‌شود و در عین حال حجم فایل کمتر از روش qp خواهد شد. در این روش هم حجم فایل نهایی را می‌توان صرفاً تخمین زد.

x264 در حالت پیش‌فرض از روش سوم یعنی CRF استفاده می‌کند و مقدار کوآنتایزر را ۲۳ در نظر می‌گیرد که برای ویدیوهای باکیفیت خوب است. اگر کیفیت ورودی شما بسیار بالاست، بهتر است سراغ اعدادی مثل ۲۰ تا ۲۲ بروید.

نکته‌ی آخر اینکه عدد ۱۸ در این بخش به مثابه‌ی عدد ۴ در اینکدرهای قدیمی استاندارد H.263 است. منظورم به طور دقیق نسخه‌ی تحت H.263 دو اینکدر Xvid و DivX است.

crf-max و qp-max: پیش‌فرض به ترتیب غیرفعال و ۵۱

این دو آپشن برای مشخص کردن بیشترین کوآنتایزر کاربرد دارند. اگر بخواهیم کیفیت فریم‌های کم‌اهمیت هم بالا باشد، باید از اعداد پایین‌تر استفاده کنیم.

عمق رنگ و فضای رنگ و نوع سمپلینگ

در ویدیوهای بسیار باکیفیت از عمق رنگ معمولی که ۸ بیت است و می‌تواند ۲ به توان ۲۴ رنگ مختلف را ایجاد کند، استفاده نمی‌شود. به جای عمق رنگ ۸ بیت از عمق رنگ بالاتر مثل ۱۰ یا ۱۲ بیت استفاده می‌شود. بیت‌ریت چنین ویدیویی به صورت متناسب با عمق رنگ استفاده شده، بیشتر خواهد بود.

علاوه بر این نوع سمپلینگ هم در بیت‌ریت ویدیو تأثیر زیادی دارد. معمولاً ویدیوها و عکس‌ها با فضای رنگ YUV کدنگاری می‌شوند و این فضای رنگ خود به صورت‌های مختلف YUC444 و YUV420 به کار می‌رود.

حالت دوم یعنی YUV4:2:0 حالتی است که رزولوشن موثر و بیت‌ریت متوسط نصف می‌شود. تصویر زیر خلاصه‌ای از ماجراست:

مقایسه رزولوشن و میزان داده در فضای رنگ YUV420با YUV444 و RGB

مقایسه رزولوشن و میزان داده در فضای رنگ YUV420با YUV444 و RGB

و توضیحات بیشتر در این رابطه:

YUV و مشتقات آن

YUV، Y’UV و امروزه YCbCr و YPbPr همگی معادل هم هستند اما تفاوت بزرگی میان آنها وجود دارد. YUV در دوران آنالوگ ظهور کرده و برای سیگنال‌های آنالوگ کاربرد دارد حال آنکه امروزه از YCbCr استفاده می‌شود. مثلاً ویدیوها و فایل‌های تصویری با این فضای رنگ معرفی می‌شوند.

YUV و نوع نمونه‌برداری

همان‌طور که اشاره کردم YUV چیزی است که در دنیای فیلم و عکس به وفور استفاده می‌شود و هدف استفاده از آن کاهش حجم فایل‌ها و پهنای باند مورد نیاز است. البته هدف ابتدایی که در مورد XYZ مطرح شد، در نظر گرفتن حساسیت چشم انسان به رنگ‌های مختلف بود.

برای کاهش حجم و پهنای باند لازم، روش‌های مختلفی برای Sampling یا نمونه‌برداری وجود دارد که اساس همه‌ی آنها، ترکیب سه کمیت روشنایی و رنگ است.

حالت عادی YUV4:4:4 است، منظور از سه عدد ذکر شده در بیشتر حالت‌ها به ترتیب تعداد نمونه‌های افقی، تعداد نمونه‌های رنگ یا همان Cb و Cr در سطر اول و سطر دوم است.

انواع نمونه‌برداری و ترکیب پیکسل‌ها در YUV

انواع نمونه‌برداری و ترکیب پیکسل‌ها در YUV

مثلاً حالت ۴:۲:۲ که یکی از کاربردی‌ترین موارد است، در سطر اول و دوم دو نمونه برای رنگ در نظر می‌گیرد و ۴ نمونه هم برای روشنایی ۴ پیکسل افقی فرض می‌کند. بدین ترتیب ۴ نمونه‌ی رنگ و  ۸ نمونه‌ی روشنایی برای ۸ پیکسل استفاده می‌شود.

حالت فوق را با YUV4:4:4 که به اختصار YUV444 گفته می‌شود، مقایسه کنید؛ در این حالت ۸ نمونه برای ۸ پیکسل لازم است و لذا ۱٫۵ برابر داده‌ی بیشتری لازم دارد. اگر برای هر پیکسل سه نمونه‌ی RGB استفاده شود، مجموعاً ۲۴ نمونه لازم است و حجم فایل و پهنای باند، باز هم بیشتر می‌شود.

در برخی نرم‌افزارهای ویرایش و تبدیل ویدیو و تصویر، مستقیماً نام YUV422 و انواع دیگر نمونه‌برداری را می‌بینیم اما گاهی عبارات و اصطلاحات دیگری برای اشاره به فضای رنگ و نوع نمونه‌برداری استفاده می‌شود که شاید کمی گیج‌کننده به نظر برسد. مثلاً در تبدیل jpeg یا ویدیو دو مورد زیر را ببینید که از عبارت Subsampling 1×1,1×1,1×1 و i420 استفاده شده است:

تبدیل ویدیو با x264

تبدیل ویدیو با x264

تبدیل تصاویر jpeg

تبدیل تصاویر jpeg

 

5 votes, average: 5٫00 out of 55 votes, average: 5٫00 out of 55 votes, average: 5٫00 out of 55 votes, average: 5٫00 out of 55 votes, average: 5٫00 out of 5 (5 نظر، امتیاز: 5٫00 از 5)
برای نظر دادن ابتدا باید ثبت نام کنید.
Loading...
لينک کوتاه:

FacebookTwitterGoogle


بيشتر بخوانيد:

دیدگاه بگذارید

4 دیدگاه روشن "بیت‌ریت (Bit rate) چیست؟ بیت‌ریت ویدیو و صدا چه قدر است؟"

اطلاع از
مهدی
مهمان
سلام آقای شیری مقالاتتون عالین!بسیار کامل آموزنده. همچنین وبسایتتون که طراحی سبک و دلنشینی داره حتما وبسایتتون رو به بقیه معرفی میکنم. من همه مقالاتتون مربوط به اینکد کردن و اونایی که در زومیت بودند رو مطالعه کردم و چند تا سوال برام مطرح شده سپاسگزارم اگر راهنماییم کنید. ۱٫ منظورتون از بخشی که نوشتید چند عدد مفید، این هست که برای مثال به طور متوسط برای یک ویدیو ۷۲۰p با اینکدر x264 حداقل بیت ریتی که “سبب افت کیفیت ویدیو نمیشه” ۹۰۰ کیلوبیت هست؟ درست گفتم؟ همچنین ۲ بار نوشتید ۷۲۰p فکر میکنم از ۷۲۰p دومی منظورتون ۱۰۸۰p هست.… ادامه ...
ف_ش
خواننده
سلام. من کمی اطلاعات مورد این چیزا دارم ولی همچنان چند تا سوال مهم برام باقی مونده: ۱٫تعریف دقیق HD و FHD چیه؟ بعضیها اون رو فقط معادل رزولوشن میدونن که اشتباهه.آیا توی بیت ریت و بقیه چیزا هم تاثیر دارن؟ آیا ما میتونیم مثلا HD با هر بیت ریتی داشته باشیم یا استانداردهای مشخصی دارن؟ خیلی دنبال این سوال گشتم ولی تعریف فنی دقیقی راجع بهش پیدا نکردم. ۲٫وقتی فیلمی رو با x.264 فشرده میکنن کمی هم کیفیت پایین میاد. میخواستم ببینم حجم یک فیلم بعد از تبدیل با x.264 حدودا چقدر میشه(بدون افت کیفیت). چون بعضی سایتها تا… ادامه ...
wpDiscuz

تبلیغات

ویژه‌ها

تبلیغات

تبلیغات

×