در این مقاله می‌خواهیم به برخی سوالات مهم پاسخ بدهیم که مهم‌ترین مورد این است که صدا چطور ایجاد می‌شود؟ و در ادامه تعاریف فرکانس و دامنه‌ی موج صوتی و شدت صوت بر حسب دسی‌بل را مشخص کنیم.

مشخصات یک اسپیکر و هدست و یا گوشی و تبلت خوب از نظر کیفیت صدا چیست؟ در ادامه با شدت صوت و شدت کاهش نویز بر حسب دسی‌بل، تداخل استریو، اعوجاج THD و پاسخ فرکانسی اسپیکر و هدست و سیستم صوتی آشنا می‌شویم.

در بررسی محصولاتی مثل گوشی، تبلت، اسپیکر و هدست با جدولی شبیه جدول زیر سروکار داریم که کمیت‌ها و اصطلاحات مختلفی در آن به کار رفته است. اینکه این اصطلاحات به چه معنی هستند و چه اهمیتی دارند موضوع این مقاله است. در واقع می‌خواهیم ببینیم برای خرید یک محصول صوتی چه پارامترهایی مهم است و چطور باید کیفیت صدا را ارزیابی نمود.

کیفیت صدای تبلت‌های مختلف، با و بدون هدفون
  شدت پاسخ فرکانسی شدت نویز محدوده‌ی دینامیکی مجموع اعوجاج هارمونیک نویز و IMD تداخل استریو
می پد شیائومی +0.04, -0.42 -92 90.1 0.0055 0.069 -88.4
می پد شیائومی با هدفون +0.02, -0.43 -91.6 89.8 0.375 0.335 -46.3
گلکسی تب اس 8.4 سامسونگ +0.05, -0.02 -95.7 92.3 0.0044 0.0096 -96
گلکسی تب اس 8.4 سامسونگ با هدفون +0.01, -0.05 -95.7 92.1 0.012 0.014 -44.4
گلکسی تب پرو 8.4 سامسونگ +0.02, -0.07 -93.3 93.3 0.0019 0.011 -89.2
گلکسی تب پرو 8.4 سامسونگ با هدفون +0.04, -0.06 -93.1 93.1 0.0074 0.037 -70.2
جی پد 8.3 ال جی +0.14, -0.11 -93.8 92.9 0.0021 0.0082 -93.8
جی پد 8.3 ال جی با هدفون +0.29, -0.11 -90.7 92.7 0.0074 0.208 -53.6
نکسوس 7 ایسوس گوگل 2013 +0.00, -0.23 -92.2 92.3 0.036 0.02 -92.3
نکسوس 7 ایسوس گوگل 2013 با هدفون +0.83, -0.12 -92.4 92.3 0.01 0.208 -49.3
آیپد مینی 2 اپل +0.04, -0.39 -93.8 93.7 0.0011 0.0067 -82.9
آیپد مینی 2 اپل با هدفون +0.11, -0.00 -93.6 93.6 0.0023 0.03 -62.2

صدا چیست و چطور ایجاد می‌شود؟

در دنیای فیزیکی شاید تمام پدیده‌ها حالت پیوسته داشته باشند و یا لااقل آن قدر تغییرات کم و کوچک باشد که نتوان تغییرات پله‌پله را به راحتی مشاهده کرد. در مورد صدا هم همین‌طور است یعنی صدا هم مثل یک موج سینوسی کامل، هیچ پله‌ای ندارد.

لرزش یک جسم در هوا صدا ایجاد می‌‎کند.گوش انسان محدوده‌ی شنوایی 20 هرتز تا 20 کیلوهرتز دارد و در صفحه‌ی مشخصات بیشتر هدست‌ها، ایرفون‌ها، اسپیکرها و سایر تجهیزات صوتی بازه‌ی پاسخ فرکانسی کوچک‌تر از هزتز 15 الی 26 کیلوهرتز است. اما منظور از پاسخ فرکانسی چیست؟ این موضوع را در ادامه بررسی می‌کنیم لذا با دقت بخوانید.

فعلاً روشن است که:

صدا چیست و چطور ایجاد می‌شود؟

ماهیت صدا چیزی جز یک موج فشاری نیست. تنها کافی است جسمی در هوا مرتعش باشد و مولکول‌های را به صورت دسته‌جمعی به عقب و جلو حرکت می‌دهد.

صدای زیر و صدای بم

اگر یک صفحه در هوای اطراف ما، با سرعت 20 بار در ثانیه که همان 20 هرتز است، جلو و عقب شود، صدای بمی می‌شنویم. ساب‌ووفر سیستم صوتی درایوری با دیافراگم منطعف است که می‌تواند با دامنه‌ی زیاد و در عوض فرکانس و سرعت کم، جلو عقب رفته و صدای بم و قوی ایجاد کند.

حال فرض کنید یکی از سیم‌های ویولون دوست ما با فرکانس 16 کیلوهرتز که در واقع فرکانس بالا و صدای ریزی است، در حال ارتعاش است. یک موج صوتی 16 کیلوهرتزی هم توسط گوش ما قابل تشخیص است. بنابراین صدای نازک آن را به خوبی متوجه می‌شویم.

بنابراین حالا می‌توان سراغ اسپیکر و بلندگو رفت و طرز کار آن را توضیح داد. یک بلندگو یا هدست را در نظر بگیرید که ساختار کلی آن مثل شکل زیر است:

تصویری از ساختار داخلی یک درایور یا بلندگو عبور

سیگنال سینوسی یعنی آهن‌ربایی که مرتباً قطب‌های آن تغییر می‌کند و این یعنی لرزش دیافراگم بلندگو

سیم‌پیچی درون یک آهن‌ربا قرار دارد که با عبور جریان برق، میدان مغناطیسی ایجاد می‌شود و سطحی که سیم‌پیچ به آن متصل است، به جلو و عقب حرکت می‌کند. البته صفحه‌ی مورد نظر ما حالت فنری دارد و در مقابل حرکت سیم‌پیچ مقاومت می‌کند. در تصویر فوق ورودی ما ممکن است به شکل یک سیگنال سینوسی باشد. سیم‌پیچ آهن‌ربا می‌شود و مرتباً جهت میدان مغناطیسی تولید شده، تغییر می‌کند. Cone یا همان سطح مخروطی شکل اسپیکر شما، با حرکت سیم‌پیچ ظریفی که از آن یاد کردیم، می‌لرزد و هوای اطراف خود را مرتباً متراکم و سپس منبسط می‌کند و این یعنی یک موج فشاری که به سرعت یعنی با سرعت صوت که در هوای معمولی 333 متر بر ثانیه است، پراکنده می‌شود.

محدوده‌ی شنوایی انسان از نظر فرکانسی

محدوده‌ی شنوایی انسان همان‌طور که گفته شد 20 هرتز تا 20 کیلوهرتز است. به عبارتی دیگر اگر سرعت لرزش اجسام تولیدکننده‌ی صدا بین 20 بار تا 20 هزار بار در ثانیه باشد، صدای تولید شده را کم و بیش می‌شنویم.

دقت کنید که منظور از کم و بیش این است که برخی فرکانس‌ها را بهتر می‌شنویم و برخی را ضعیف‌تر تشخیص می‌دهیم.

در ضمن گوش من و شما یکسان نیست و ممکن است شما صدای 19 کیلوهرتزی را تشخیص بدهید اما بنده چیزی حس نکنم. وقتی پا به سن بگذاریم، قدرت شنوایی کمتر می‌شود به این معنی که صداها را ضعیف‌تر می‌شنویم و حتی برخی فرکانس‌ها را دیگر نمی‌شنویم.

شدت صدا و تعریف دسی‌بل

هر چه صفحه‌ی لرزانی که از آن صحبت کردم با دامنه‌ی حرکت بیشتر به مولکول‌های هوا ضربه بزند، فشار ایجاد شده هم بیشتر خواهد بود.

اگر به روابط مکانیک حرکت رجوع کنیم، می‌توان یک رابطه‌ی کلی و ساده برای فشار صدا مشخص کرد. فرض می‌کنیم مولکول‌های مجاور سطح لرزان جرمی برابر با m دارند و با ضربه‌ای که به آنها وارد می‌شود، سرعت V می‌گیرند. بنابراین نیروی عمل و عکس‌العمل بین مولکول‌ها و سطح حاصلضرب m و V تقسیم بر مدت زمان ضربه خواهد بود.

بنابراین فشار با سرعت لرزش رابطه‌ی مستقیم دارد:

رابطه‌ی فشار موج صوتی با سرعت و دامنه

از طرفی سرعت لرزش صفحه یعنی سرعت رفت و برگشت آن، از تقسیم دامنه‌ی حرکت صفحه بر نصف مدت زمان یک رفت و برگشت کامل به دست می‌آید. لذا سرعت برخورد یا همان سرعت صفحه با دامنه‌ی حرکت صفحه و فرکانس لرزش متناسب است.

بنابراین در مجموع رابطه‌ای فشار با دامنه و فرکانس لرزش صفحه به صورت زیر است:

فشار صوتی با سرعت و دامنه‌ی حرکت دیافراگم بلندگو متناسب است

با مشخص شدن تعریف و مفهوم فشار صوتی، به قدرت صدا می‌رسیم. کمیتی که معمولاً بر حسب دسی‌بل بیان می‌شود. بل ما را به یاد گراهام بل، مخترع تلفن می‌اندازد.

یک دسی‌بل، یک دهم بل است. وقتی می‌گوییم فشار یک موج صوتی برابر با 1 بل است یعنی مقدار فشار صدا 10 به توان 1 برابر بیشتر از فشار مرجع است. رابطه‌ی زیر را بررسی کنید:

شدت صدا بر حسب دسی‌بل از فشار یا قدرت محاسبه می‌شود

شدت نویز

شدت نویز دقیقاً مثل شدت صوت تعریف می‌شود اما عبارت نویز با صدا متفاوت است. نویز در حالت کلی صدای نامطلوبی مثل موسیقی پس‌زمینه یا صدای افراد حاضر در سالن موسیقی است اما آنچه معمول شده این است که نویز صداها و سیگنال‌هایی با فرکانس بالاست که به دلایل مختلف ایجاد شده‌اند و باید آنها را حذف کرد.

مثلاً یک میکروفون ساده می‌تواند صدای ما و بازتاب‌های مختلف آن را ضبط کند و به عبارتی صدایی با فرکانس بیشتر ایجاد کند که مطلوب نیست.

نویز در برابر سیگنال عادی و واقعی

در تصویر فوق سیگنال قرمز سیگنالی است که در آن نویز زیادی وجود دارد و با اضافه کردن فیلتر پایین‌گذر یا Low Pass می‌توان آن را به سیگنالی عاری از نویز بدل کرد. البته بخشی از صداهای واقعی و فرکانس بالا هم ممکن است حذف شود.

فیلتر پایین‌گذر فیلتری است که می‌توان امواج فرکانس پایین را عبور دهد و امواج فرکانس بالا را حذف کند.

شدت صدا و پاسخ فرکانسی

در بنچ‌مارک هدست، میکروفون، اسپیکر، گوشی، تبلت و به طور کلی هر چیزی که مرتبط با صداست، اصطلاحی موسوم به Frequency Response به معنی پاسخ فرکانسی داریم.

منظور از پاسخ فرکانسی این است که ابزار موردنظر موج‌های صوتی مختلف را با چه شدتی تولید یا تقویت و یا برعکس، تضعیف می‌کند.

شاید تعجب کنید، تولید، تقویت و تضعیف! سه فرآیند کاملاً متفاوت. اما دقیقاً بخوانید تا ببینیم موضوع از چه قرار است.

تولید صدا و کیفیت اسپیکر و تقویت‌کننده

تولید صدا چیزی است که توسط اسپیکر یا بلندگو صورت می‌گیرد. البته هر یک از باندهای داخل اسپیکر را یک درایور می‌گوییم که واژه‌ی درست‌تری است چرا که ممکن است یک اسپیکر ساده دارای دو درایور به نام توییتر و بیس باشد. توییتر صدای ظریف را ایجاد می‌کند و بیس با دامنه‌ی حرکتی بالاتر و فرکانس پایین‌تر، صدای بم را به خوبی بازسازی می‌کند.

نمودار زیر پاسخ فرکانسی یک اسپیکر معمولی را نشان می‌دهد که می‌تواند صداهایی با فرکانس 20 تا 20 کیلوهرتز ایجاد کند:

نمودار پاسخ فرکانسی یک اسپیکر

محور عمودی فشار همان موج صوتی است که به آن اشاره کردیم و محور افقی همان فرکانس امواج است.

 اسپیکری خوب است که همه‌ی فرکانس‌های شنوایی انسان را ایجاد کند و در ضمن، فرکانس‌های مختلف را با شدت صوت صحیح و دقیق بازسازی کند.

لذا اسپیکر بعدی که پاسخ فرکانسی متعادل‌تری دارد، بهتر است البته دقت کنید که صدای پخش شده در این آزمون شامل تمام فرکانس‌ها با شدت مساوی بوده است!

نمودار پاسخ فرکانسی یک اسپیکر خوب

کیفیت و پاسخ فرکانسی اسپیکر و تقویت کننده در بنچ‌مارک‌ها

همان‌طور که گفته شد، یک روش ساده‌ی ارزیابی کیفیت اسپیکر استفاده از پاسخ فرکانسی آن است.

یک روش ساده‌تر استفاده از نرم‌افزار RightMark Audio Analyser است که به صورت مخفف RMAA گفته می‌شود. این نرم‌افزار صدایی با طرح مشخص ایجاد می‌کند که می‌توان آن را توسط اسپیکر پخش کرد و سپس با یک میکروفون حرفه‌ای نتیجه را با طرح داده شده مقایسه کرد. در این صورت آنچه به عنوان نتیجه‌ی بنچ‌مارک اعلام می‌شود، اختلاف شدت صوت است که ممکن است به صورت متوسط یا به صورت بیشترین اختلاف بیان شود.

این مقایسه در تصویر زیر قابل بررسی است:

پاسخ فرکانسی یک گوشی و مقایسه با ورودی

دقت کنید که در نمودار فوق، اسکیل محور افقی لگاریتمی و نه خطی است. فرکانس اولین و آخرین خط عمودی 20 هرتز و 20 کیلوهرتز است و بیان اختلاف شدت صدا تنها برای امواجی بین 20 تا 20 کیلوهرتز صورت می‌گیرد، یعنی اولین و آخرین خط عمودی در نمودار فوق.

مثلاً می‌توان گفت که گوشی HTC One V پاسخ فرکانسی زیر را دارد:

+0.11 db, -0.10 db

معنی این عبارت این است که این گوشی صدا را حداکثر 0.11 دسی‌بل افزایش یا 0.10 دسی‌بل کاهش می‌دهد.

اما آمپلی‌فایر که تلفظ دقیق آن اَمپلی‌فایر است چیست و چه رابطه‌ای با اسپیکر دارد؟

کار امپلی‌فایر امپلفای کردن یا همان تقویت سیگنال است. شاید بتوان یک هدست و ایرفون ساده را به کامپیوتر متصل کرد اما در مورد اسپیکرهای بزرگ این کار ممکن نیست یا حداقل احتمال آسیب دیدن چیپ‌ست صدا وجود دارد. لذا امپلی‌فایر سیگنال ضعیف جک هدفون یا خروجی‌های دیگر را گرفته و تقویت می‌کند و سپس به درایورهای صدا در اسپیکرهای مختلف می‌دهد.

امپلی‌فایرها هم مثل اسپیکر در فرکانس‌های مختلف رفتاری یکسانی ندارند و می‌توان پاسخ فرکانسی آنها را اندازه‌گیری کرد. البته معمولاً مدار امپلی‌فایر در حد اسپیکر نوسانی ظاهر نمی‌شود و رفتار آن ثبات بیشتری دارد.

میکروفون و تضعیف نویز

همان‌طور که شدت صدای اسپیکر را با فشار صوتی و بر حسب دسی‌بل بیان کردیم، می‌توان شدت کاهش صدا در میکروفون‌ها را هم به همین صورت بیان کرد. Noise Cancellation یا حذف نویز که گاهی با عبارت Noise Reduction یا کاهش نویز بیان می‌شود، یک ویژگی و قابلیت بسیار مهم برای میکروفون است، مخصوصاً میکروفون‌هایی که قرار است تنها صدای انسان را ضبط کنند.

در مورد اینکه نویز چیست صحبت کردیم، حال به روش‌های حذف نویز می‌پردازیم.

میکروفون دقیقاً عکس کار یک اسپیکر را انجام می‌دهد، یعنی موج صوتی موج حرکت سیم‌پیچ و ایجاد الکتریسیته در آن می‌شود که به آن القای الکترومغناطیسی می‌گویند:

میکروفون موج صوتی را به الکتریسیته تبدیل می‌کند

ممکن است کنسل کردن نویز به صورت مکانیکی یا الکترونیکی صورت بگیرد. در حالت مکانیکی از اجزایی استفاده می‌شود که کارشان میرا (یا دمپ) کردن فرکانس‌های بالاست. اجسام لاستیکی معمولاً این کار را به نحو احسن انجام می‌دهند اما برای بهینه کردن این روش حذف نویز، می‌توان از لاستیک‌های مختلف و در اشکال متنوعی استفاده کرد. هر جنس و شکلی می‌تواند در مواجهه با امواج فرکانس بالا رفتار متفاوتی داشته باشد.

کاهش نویز با استفاده از قطعات و سیستم مکانیکی

روش دوم که الکترونیکی است، می‌تواند به دو شکل فیلتر نرم‌افزاری و سخت‌افزاری باشد. در هر دو صورت سیگنال‌هایی با فرکانس بالا از فیلتر عبور نمی‌کنند و حذف می‌شوند که قبلاً تحت عنوان فیلتر پایین‌گذر به آن اشاره کردم.

بیان میزان حذف نویز با نموداری مثل شکل زیر صورت می‌گیرد:

میزان کاهش نویز بر حسب دسی‌بل

در نمودار فوق سه هدست مختلف داریم که در فرکانس‌های مختلف، میزان کاهش نویز متفاوتی دارند. قطعاً نمی‌توان گفت که یکی از سه هدست بهترین است بلکه باید به کاربرد نگاه کرد. در مجموع هدست C در میان 3 هدست فرضی، بهترین عملکرد را دارد ولیکن اگرفرکانس خاصی موردنظر کاربر باشد، باید بیشتر دقت کرد.

مفهوم عبارتی مثل 60- دسی‌بل در بیان قدرت کاهش نویز یک میکروفون را در تصویر زیر جست‌وجو کنید:

میزان کاهش نویز در هدست‌های مختلف

سیگنال داده شده نویز است، هدست C با توانایی بیشتر خود آن را بیشتر فشرده کرده و به عبارتی دامنه یا شدت آن را به حداقل رسانده است.

اگر کاربرد دریافت و ضبط کردن صدای انسان یا سازهایی با صدای بم باشد، هدست A بهترین است چرا که شدت صدا را بیشتر کاهش داده است. اما وقتی به سایر فرکانس‌ها نگاه کنید، متوجه می‌شوید که کیفیت هدست C از نظر کاهش نویز بهتر است.

کاهش نویز در بنچ‌مارک‌ها

کاهش نویز را هم می‌توان به صورت بازه‌ای یا متوسط بیان کرد که حالت متوسط کاربرد بیشتری دارد.

مثلاً اگر بگوییم میکروفون یک تبلت سطح نویز 80- دسی‌بلی دارد به این معنی است که دامنه‌ی سیگنال نویز را به طور متوسط 80 دسی‌بل تضعیف می‌کند. بدیهی است که تبلتی که 90- دسی‌بل قدرت کاهش نویز دارد از نظر کاهش نویز باکیفیت‌تر است.

محدوده‌ی دینامیکی صدا و بنچ‌مارک‌ها

احتمالاً در عکاسی با محدوده‌ی دینامیکی یا Dynamic Range آشنایی دارید. نسبت بالاترین سطح روشنایی به پایین‌ترین سطح آن را محدوده‌ی دینامیکی می‌گوییم.

در صدا و دنیای اسپیکرها هم تعریف مشابهی داریم. نسبت بیشترین سطح سیگنال یا صدا به کمترین سطح آن که معمولاً فقط صدای نویز است، محدوده‌ی دینامیکی است.

به محدوده‌ی دینامیکی SNR یا Signal to Noise Ratio که نسبت سیگنال به نویز است هم گفته می‌شود. البته در حالت دیجیتال این دو اصطلاح یک معنی دارند ولیکن در حالت آنالوگ، SNR کمتر از محدوده‌ی دینامیکی است.

محدوده‌ی دینامیکی صدا و نسبت سیگنال به نویز

گوش انسان ضعیف‌ترین صداها و در عین حال صداهایی با شدت بسیار زیاد را می‌شنود ولیکن وقتی صداها با هم ترکیب شوند چطور؟

احتمالاً تمام صداهای ضعیف حذف می‌شوند و چیزی حس نمی‌کنیم.

در بنچ‌مارک‌های مربوط به اسپیکر و امپلی‌فایر با پخش کردن صداهای بلند و ضعیف به صورت هم‌زمان، مقدار محدوده‌ی دینامیکی محاسبه می‌شود. البته نه با گوش انسان بلکه با میکروفون‌های بسیار خوب.

مثلاً اگر بیشترین صدا، 100 دسی‌بل شدت داشته باشد و ضعیف‌ترین صدا 50 دسی‌بل، محدوده‌ی دینامیکی برابر با 50 دسی‌بل خواهد شد.

توجه کنید که دسی‌بل رابطه‌ی لگاریتمی داشت، لذا برای اینکه ببینیم شدت یک صدا چند برابر دیگری است، کافی شدت صوت دومین ابزار را از اولین ابزار کسر کنیم. تقسیم کردن شدت صدا کاملاً غلط است.

THD یا مجموع اعوجاج هارمونیک

THD یا Total Harmonic Distortion یکی دیگر از کمیت‌های مهم در ارزیابی سیستم‌های صوتی است.

منظور از اعوجاج این است که سیگنال اصلی به هر شکلی تغییر کند. شاید ساده‌ترین نمونه‌ی آن وقتی است که صدای موسیقی را بیش از حد زیاد می‌کنیم و سیستم صوتی متشکل از امپلی‌فایر و اسپیکر، به حد اشباع خود می‌رسد و مجبور است بخشی از سیگنال را تغییر دهد. نمودار زیر یک مثال آن است:

نمونه‌ای از اعوجاج که با افزایش دامنه‌ی سیگنال رخ داده است

در نمودار فوق، منحنی آخر نتیجه‌ی افزایش شدید دامنه‌ی صداست. موج سینوسی دارای سطح حداکثری و حداقلی صاف شده که با سیگنال اصلی همخوانی ندارد.

اعوجاج پدیده‌ای است که به شکل‌های مختلف ایجاد می‌شود. اما نوع خاص آن، اعوجاج هارمونیک است. منظور از هارمونیک این است که موج یا سیگنال اصلی با امواجی که فرکانس بالاتری دارند ترکیب شود.

نمودار زیر را بررسی کنید که در آن منحنی اول خروجی سیستم است و منحنی دوم، موجی که می‌بایست ایجاد می‌شد:

اعوجاج هارمونیک موج سینوسی ورودی و ترکیب هارمونیک‌ها

موج Fundamental یا اصلی با هارمونیک‌های 3، 5، 7 و 9 ترکیب شده است و نتیجه موجی شبیه آن اما با اندکی تغییرات است.

منظور از هارمونیک 3 و 5، موجی شبیه موج اصلی است که فرکانس 3 و 5 برابری دارد.

مثلاً اگر صدای بیس 50 هرتزی باشد، هارمونیک سوم آن فرکانس 150 هرتزی و به عبارت دیگر دوره تناوب یک سوم دارد. مطمئناً صدای بیس 50 هرتزی که با هارمونیک سوم 150 هرتزی خود ترکیب شود، یک جور شنیده نمی‌شود و مطلوب است که اعوجاج صفر درصد باشد.

در تصویر زیر موج اصلی آبی رنگ است، موج نارنجی که فرکانس آن 5 برابر است، هارمونیک پنجم آن است. فرکانس یعنی تعداد تکرار در یک ثانیه و روشن است که موج سبز در هر تکرار موج آبی، سه بار تکرار می‌شود و لذا هارمونیک سوم آن است.

هارمونیک 3 و 5 یک موج سینوسی

IMD یا اعوجاج میان هارمونیک

InterModulation Distortion یا اعوجاج غیر هارمونیک نوع دیگر اعوجاج است که به شکل هارمونیک‌هایی از موج اصلی نیست. مثلاً موج اصلی می‌تواند ترکیب دو موج سینوسی با دو فرکانس مختلف باشد و در صورت رفتار غیرخطی سیستم صوتی، خروجی به همراه اعوجاجی که فرکانس آن مضرب فرکانس هیچ یک از دو موج نیست، آشکار شود.

فرکانس اعوجاج IMD جمع و یا تفریق فرکانس دو موج سینوسی است. مثلاً اگر دو موج 200 و 300 هرتزی داشته باشیم، ممکن است IMD دو موج دیگر با فرکانس 500 و 100 هرتز به این دو موج اضافه کند.

در شکل زیر دو موج سینوسی با دامنه‌ی بزرگ و فرکانس نزدیک به هم داریم و IMD دو موج دیگری است که به شکل قله‌های کوچک‌تر در دو طرف دو موج اصلی دیده می‌شوند:

اعوجاج غیرهارمونیک دو موج سینوسی

مجموع اعوجاج هارمونیک در بنچ‌مارک‌ها

THD یا مجموع اعوجاج هارمونیک از تقسیم کردن توان تمام هارمونیک‌های اضافه شده به موج اصلی بر توان موج اصلی حاصل می‌شود. این کسر را می‌توان به صورت درصدی بیان کرد.

در مورد IMD یا اعوجاج غیر هارمونیک هم همین روش استفاده می‌شود.

روشن است که هر چه اعوجاج هارمونیک کمتر باشد، سیستم صوتی متشکل از امپلی‌فایر و اسپیکر و حتی خود میکروفون، کیفیت بالاتری دارد.

البته یادتان باشد که درصد اعوجاج هارمونیک بسیار کم است و به زحمت به چند درصد می‌رسد. اسپیکر و سیستم خوب THD کمتر از 1 درصد دارند.

نکته‌ی بسیار مهم دیگری که باید به آن توجه کنید، به خروجی هدفون گوشی‌ها و تبلت‌ها مربوط می‌شود که معمولاً مثل چیپ‌ست صدای قدرتمندی که روی مادربوردهای حرفه‌ایست، برای اتصال هر نوع هدفونی مناسب نیست.

به عبارت دیگر امپلی‌فایر ظریفی که در این وسایل به کار رفته، با درایورهای بزرگ یک هدست پیشرفته کمی مشکل دارد و مقدار THD ممکن است چند برابر بیشتر شود.

Stereo Crosstalk یا تداخل استریو

سیستم‌های صوتی بسیار قدیمی فقط یک خروجی داشتند و یا صدای اسپیکرهای مختلف یکسان بود اما حالت استریو یا دوتایی از دو اسپیکر برای پخش کردن دو صدای مختلف استفاده می‌کند و با این کار به صدا جهت می‌دهد.

حالت یک اسپیکری را Mono هم می‌گویند. البته مونو در حال حاضر به میکروفون‌های ساده محدود می‌شود و تقریباً استریو حالت اصلی تمام وسایل صوتی و تصویری است.

سیستم‌های 5.1 کاناله‌ و 7.1 کاناله هم به سرعت عمومیت پیدا کرده‌اند و خوشبختانه اصحاب سینما هم فیلم‌هایی با صدابرداری چند کاناله را در دستور کار قرار داده‌اند که تجربه‌ی جذابی از صدای جهت‌دار را برای بیننده فراهم می‌کند.

چیدمان و نام اسپیکرها در سیستم 7.1 کاناله

اما یک مشکل کوچک، تداخل استریو: بخشی از سیگنالی که قرار است در یکی از اسپیکرها پخش شود، به اسپیکر دیگر هم می‌رود و این تداخل واقعی و مطلوب نیست.

تداخل استریو چیزی است که در مورد هر سیستم صوتی رخ می‌دهد. منظورم بخشی از آن است که به خاطر شنیدن صدای اسپیکر سمت راست توسط گوش چپ رخ می‌دهد اما بخشی از آن که به سیستم صوتی برمی‌گردد، مطلوب نیست و به عبارت بهتر، نمی‌توان آن را از قبل پیش‌بینی کرد و اثر آن را صدابرداری و ویرایش صدا در نظر گرفت.

تداخل استریو به صورت طبیعی هم رخ می‌دهد

برای اندازه‌گیری تداخل استریو، یک سیگنال مشخص به عنوان ورودی به یکی از اسپیکرها داده می‌شود. اسپیکر دیگر می‌بایست در سکوت فعالیت کند اما کمی صدا ایجاد می‌کند. مقدار صدای ایجاد شده بر مقدار صدایی که سیگنال می‌بایست ایجاد کند تقسیم می‌شود و تداخل استریو به دست می‌آید.

تداخل استریو در بنچ‌مارک‌ها

با توضیحات فوق روشن است که تداخل استریو باید حداقل باشد. با توجه به اینکه شدت صدا بر حسب دسی‌بل اندازه‌گیری شده، تداخل استریو به صورت یک عدد منفی به دست می‌آید که هر چه کوچک‌تر باشد بهتر است.

البته چون مقدار تداخل استریو منفی است، هر چه عدد منفی بزرگ‌تری داشته باشیم بهتر است. مثلاً منفی 90 دسی‌بل بهتر از منفی 80 دسی‌بل است.

نکته‌ی دیگر این است که سیستم‌های صوتی رفتار یکسانی در فرکانس‌های مختلف نشان نمی‌دهند. ممکن است تداخل استریو در مورد صداهای فرکانس بالا بیشتر از صداهایی با فرکانس پایین باشد. لذا می‌توان میانگینی از تداخل استریو در فرکانس‌های مختلف را ملاک برتری یک سیستم صوتی در نظر گرفت.

تداخل استریو بر حسب دسی‌بل، هر چه منفی‌تر، بهتر

در نمودار فوق مقدار تداخل استریوی چهار چیپ‌ست صوتی ذکر شده است که در فرکانس‌های مختلف، مقدار آن کاملاً متفاوت است.