Сучасні звукові карти. Методи позиціонування і стиснення звуку
Анотація
b>
У цій роботі вивчаються різні аспекти застосування звукових карт. Розглядаються способи отримання звуку на комп'ютері, основні принципи формування і відмінності цифрового звуку від аналоговово. Розглянуто також стандарт MIDI, який застосовується в багатьох професійних звукових синтезаторах і т.п. Далі були докладно розглянуті звукові карти, наявні зараз на ринку (деякі карти, які були доступні в процесі створення курсової були протестовані на реальних додатках): як і нові, так і вже більш поширені. Оскільки багато звукові карти зараз підтримують різні технології позиціонування звуку в просторі, то був коротко розглянуто питання теорії сприйняття звуку людським вухом і накладаються цим обмеження. Завершальним етапом стало вивчення форматів, які застосовуються для зберігання оцифрованого звуку. Вивчені були як формати зі стиском без втрат, так і з стисненням з втратами (mp3 і йому подібні), засновані на особливості людського слуху за сприйняттям різних частот. У роботі використовувалася інформація з різних джерел: супровідної документації до карт, сайтів фірм-виробників, незалежних тестових лабораторій, публікації з періодичних видань. Для підготовки даної пояснювальної записки використовувався текстовий процесор Microsoft Word зі складу пакету Microsoft Office 97/2000, браузер Netscape Navigator 6.0. В якості платформи для суб'єктивної оцінки якості звуку ізспользовалась наступна система:
Intel Celeron 500Mhz
MB FIC CP11Z
HDD Fujitsu 8,4 GB
CD-ROM Samsung 24X
Звукова підсистема:
звукова плата A-trend Harmony 3DS724A на базі чіпа Yamaha-724E
підсилювач Вега У-120-СТЕРЕО
колонки Радіотехніка С-90Д (трьох смугові з фазоінвертором)
Введення
Комп'ютер - від англійського "compute" - обчислювати. Тобто, кажучи по-російськи, - всього-на-всього обчислювач. І колись, давним-давно, це відповідало застосування комп'ютерів. Їх використовували англійці для злому кодів і шифрів радіопередач Німеччини під час ВМВ. Їх застосовують і для прямо протилежній функції - кодування і шифрування переданої інформації. Вони застосовувалися для розрахунку складних траєкторій польоту першого (та й останніх) штучних супутників Землі та інших планет. І існує ще велика кількість гілок і галузей науки і промисловості, в них не можна обійтися без обчислювальних потужностей комп'ютерів. Однак, спочатку електронну обчислювальну машину завжди намагалися використовувати не тільки за прямим призначенням, але й трохи по іншому. Спочатку прості хрестики-нолики і морський бій. Потім, коли у машини з'явився дисплей, її навчили малювати різні "картинки" з символів. Далі, до рухаються по екрану різних фігурок, залишалося зовсім небагато. Зараз вже ігри без графіки мало кому потрібні, крім фанів. Але ... Придивімося до цього процесу трохи уважніше: "символи-> картинки з значків-> статичні картинки-> повномасштабне відео". Комп'ютери ставали менше, надійніше, довговічніші, швидше ...
Як бачимо, шлях проведений чималий, і все-таки - це еволюція, що розтягнулася на півстоліття. Масштабне ж подія, що відбулася близько 10 років тому назвати іншим словом, як революція, навряд чи можна. На персональний комп'ютер прийшов звук. Відлуння цієї події продовжують стрясати комп'ютерному світ до сих пір. Звук дозволив зробити комп'ютер з приналежності рідкісного бізнесмена в сувору необхідність для кожного. Він зробив фурор в індустрії виробництва музичної апаратури і звукозапису. Раніше було потрібно мати програвач вінілових дисків, компакт-касет, компакт-дисків та іншу техніку. Тепер достатньо одного - комп'ютера. Він вже грає, співає і навіть оновлену версію рецепта полуничного пирога з джемом може з інтернету скачати і переслати СВСВЧП (Понад Інтелектуально Понад високочастотного пічки). Тільки от кави поки не варить. Але і це, я думаю, скоро хто-небудь виправить.
Комп'ютер потіснив такі традиційні істонікі доходу та розваг як казино, кіно, театр. Залишилося тільки навчити комп'ютер працювати і робити прибирання в квартирі, і все ... Він дійсно буде "всюди", і людина не зможе без нього обходитися. А ось комп'ютер без людини?
І все лише через що? З-за маленькою хустки з декількома копійчаними радіодеталями, кошмарними шумами і величезними амбіціями. Sound Blaster так би мовити, версії 1.0. Виробництва фірми Creative Labs з далекого Сінгапуру. Не вона першою випустила звукову карту, але вона змогла популяризувати цю ідею в масах. Створити ім'я та завоювати ринок. Словосполучення "Sound Blaster" стало синонімом "звукової карти". І тепер комп'ютер без "звуку" - це не комп'ютер. Як же так! Адже він зможе програти при вході в "Windows" бравурні "Та-да!!!" І все - ком'ютера стає даремною купою нікому не потрібного мотлоху.
Мені здається, що все вищенаведене повинно трохи зацікавити. Адже саме поява звуку стало першим каменем у тій лавини, яка обрушується зараз на голови нещасних споживачів послуг і товарів зі сфери високих технологій. "Повна 3Д пришвидшення" кричать одні, "Приголомшливе якість відтворення ДВД" заявляють третє, "Тільки у нас - справжнісінький тривимірний звук" вихваляються третьою. І так - до безкінечності.
Ось чому я вибрав як теми для курсової цей напрямок. Воно досить велике й повно обхопити його не дозволяє ні скромний обсяг пояснювальної записки, ні потрібний час. Тому я постарався відповісти на поставлені запитання, використовуючи свій невеликий досвід у роботі на "залізному" (апаратному) забезпечення комп'ютерів.
Цифрове подання звукових сигналів
Відмінності цифрового представлення сигналів від аналогового
b>
Традиційне аналогове подання сигналів засноване на подобі (аналогічності) електричних сигналів (змін струму та напруги) представленим ними вихідним сигналам (звуковому тиску, температури, швидкості і т.п.), а також подібності форм електричних сигналів в різних точках підсилювального або передавального тракту. Форма електричної кривої, яка описує (також кажуть - переносить) вихідний сигнал, максимально наближена до форми кривої цього сигналу.
Таке уявлення найбільш точно, проте найменше викривлення форми несучого електричного сигналу неминуче спричинить за собою таке ж спотворення форми та сигналу переносимого. У термінах теорії інформації, кількість інформації в несучому сигналі в точності дорівнює кількості інформації в сигналі вихідному, і електричне подання не містить надмірності, яка могла б захистити переносимий сигнал від спотворень при зберіганні, передачі та посилення.
Цифрове подання електричних сигналів покликане внести в них надмірність, що охороняє від дії паразитних перешкод. Для цього на що несе електричний сигнал накладаються серйозні обмеження - його амплітуда може приймати тільки два граничних значення - 0 і 1.
Вся зона можливих амплітуд в цьому випадку ділиться на три зони: нижня представляє нульові значення, верхня - поодинокі, а проміжна є забороненою - всередину неї можуть потрапляти тільки перешкоди. Таким чином, будь-яка перешкода, амплітуда якої менше половини амплітуди несучого сигналу, не впливає на правильність передачі значень 0 і 1. Перешкоди з більшою амплітудою також не впливають, якщо тривалість імпульсу перешкоди відчутно менша тривалості інформаційного імпульсу, а на вході приймача встановлений фільтр імпульсних перешкод.
Сформований таким чином цифровий сигнал може переносити будь-яку корисну інформацію, яка закодована у вигляді послідовності бітів - нулів та одиниць; окремим випадком такої інформації є електричні і звукові сигнали. Тут кількість інформації в несучому цифровому сигналі значно більше, ніж в кодованому вихідному, так що несе сигнал має певну надмірність щодо початкового, і будь-які викривлення форми кривої несучого сигналу, при яких ще зберігається здатність приймача правильно розрізняти нулі й одиниці, не впливають на достовірність переданої цим сигналом інформації. Однак у випадку впливу значних перешкод форма сигналу може спотворюватися настільки, що точна передача переносимої інформації стає неможливою - в ній з'являються помилки, які при простому способі кодування приймач не зможе не тільки виправити, але і виявити. Для ще більшого підвищення стійкості цифрового сигналу до перешкод і спотворень застосовується цифрове надлишкове кодування двох типів: перевірочні (EDC - Error Detection Code, що виявляє помилку код) та коригуючі (ECC - Error Correction Code, виправлення помилку код) коди. Цифрове кодування полягає в простому додаванні до вихідної інформації додаткових бітів та/або перетворення вихідної бітової ланцюжка в ланцюжок більшої довжини та іншої структури. EDC дозволяє просто виявити факт помилки - спотворення або випадання корисної або появу помилкової цифри, проте переносима інформація в цьому випадку також спотворюється; ECC дозволяє відразу ж виправляти виявлені помилки, зберігаючи переносити інформацію незмінною. Для зручності і надійності інформацію, що передається розбивають на блоки (кадри), кожен з яких забезпечується власним набором цих кодів.
Кожен вид EDC/ECC має свою межу здатності виявляти і виправляти помилки, за яким знову починаються невиявлені помилки і спотворення переносимої інформації. Збільшення обсягу EDC/ECC щодо обсягу вихідної інформації в загальному випадку підвищує яка виявляє і коректує здатність цих кодів.
Як EDC популярний циклічний надлишковий код CRC (Cyclic Redundancy Check), суть якого полягає в складному перемішуванні вихідної інформації в блоці і формуванню коротких двійкових слів, розряди яких перебувають у сильній перехресної залежності від кожного біта блоку. Зміна навіть одного біта в блоці викликає значну зміну обчисленого по ньому CRC, і ймовірність такого спотворення бітів, при якому CRC не зміниться, исчезающе мала навіть при коротких (одиниці відсотків від довжини блоку) словах CRC. Як ECC використовуються коди Хеммінга (Hamming) і Ріда-Соломона (Reed-Solomon), які також містять у собі і функції EDC.
Інформаційна надмірність несучого цифрового сигналу приводить до значного (на порядок і більше) розширення смуги частот, необхідної для його успішної передачі, в порівнянні з передачею вихідного сигналу в аналоговій формі. Крім власне інформаційної надмірності, до розширення смуги призводить необхідність збереження досить крутих фронтів цифрових імпульсів.
Крім цілей помехозащіти, інформація в цифровому сигналі може бути піддана також лінійному або канального кодування, завдання якого - оптимізувати електричні параметри сигналу (смугу частот, постійну складову, мінімальну та максимальну кількість нульових/поодиноких імпульсів в серії і т.п.) під характеристики реального каналу передачі або запису сигналу.
Отриманий що несе сигнал, у свою чергу, також є звичайним електричним сигналом, і до нього застосовні будь-які операції з такими сигналами - передача по кабелю, посилення, фільтрування, модуляція, запис на магнітний, оптичний або інший носій і т.п. Єдиним обмеженням є збереження інформаційного вмісту - так, щоб при наступному аналізі можна було однозначно виділити і декоді-ровать переносити інформацію, а з неї - вихідний сигнал.
Способи представлення звуку в цифровому вигляді
b>
Вихідна форма звукового сигналу - безперервне зміна амплітуди в часі - видається в цифровій формі з допомогою "перехресної дискретизації" - за часом і за рівнем.
Згідно теоремі Котельникова, будь-який безперервний процес з обмеженим спектром може бути повністю описаний дискретної послідовністю його миттєвих значень, що слідують з частотою, як мінімум удвічі перевищує частоту найвищої гармоніки процесу; частота Fd вибірки миттєвих значень (відліків) називається частотою дискретизації.
З теореми випливає, що сигнал з частотою Fa може бути успішно діскретізірован за часом на частоті 2Fa тільки в тому випадку, якщо він є чистої синусоїдою, бо будь-яке відхилення від синусоїдальної форми приводить до виходу спектру за межі частоти Fa. Таким чином, для тимчасового дискретизації довільного звукового сигналу (звичайно що має, як відомо, плавно спадаючий спектр), необхідний або вибір частоти дискретизації із запасом, або примусове обмеження спектру вхідного сигналу нижче половини частоти дискретизації.
Одночасно з тимчасової дискретизацією виконується амплітудна - вимірювання миттєвих значень амплітуди та їх представлення у вигляді числових величин з певною точністю. Точність вимірювання (двійкова розрядність N одержуваного дискретного значення) визначає співвідношення сигнал/шум і динамічний діапазон сигналу (теоретично це - взаємно-зворотні величини, однак будь-який реальний тракт має також і власний рівень шумів і перешкод).
Отриманий потік чисел (серій двійкових цифр), що описує звуковий сигнал, називають імпульсно-кодовою модуляцією або ИКМ (Pulse Code Modulation, PCM), так як кожен імпульс діскретізованного за часом сигналу видається власним цифровим кодом.
Найчастіше застосовують лінійне квантування, коли числове значення відліку пропорційно амплітуді сигналу. Через логарифмічної природи слуху більш доцільним було б логарифмічні квантування, коли числове значення пропорційно величині сигналу в децибелах, однак це пов'язано з труднощами чисто технічного характеру.
Тимчасова дискретизація і амплітудне квантування сигналу неминуче вносять в сигнал шумові викривлення, рівень яких прийнято оцінювати за формулою 6N + 10lg (Fдіскр/2Fмакс) + C (дБ), де константа C варіюється для різних типів сигналів: для чистої синусоїди це 1.7 дБ, для звукових сигналів - від -15 до 2 дБ. Звідси видно, що до зниження шумів в робочій смузі частот 0 .. Fмакс призводить не тільки збільшення розрядності відліку, але і підвищення частоти дискретизації щодо 2Fмакс, оскільки шуми квантування "розмазуються" по всій смузі аж до частоти дискретизації, а звукова інформація займає тільки нижню частину цієї смуги.
У більшості сучасних цифрових звукових систем використовуються стандартні частоти дискретизації 44.1 і 48 кГц, однак частотний діапазон сигналу зазвичай обмежується біля 20 кГц, щоб залишити цю запасу по відношенню до теоретичної межі. Також найбільш поширене 16-розрядне квантування за рівнем, що дає граничне співвідношення сигнал/шум близько 98 дБ. У студійної апаратури використовуються більш високі дозволу - 18 -, 20 - і 24-розрядне квантування при частотах дискретизації 56, 96 і 192 кГц. Це робиться для того, щоб зберегти вищі гармоніки звукового сигналу, які безпосередньо не сприймаються слухом, але впливають на формування загальної звукової картини.
Для оцифровки більш вузькосмугових і менш якісних сигналів частота і розрядність дискретизації можуть знижуватися; наприклад, в телефонних лініях застосовується 7 - або 8-розрядна оцифровка з частотами 8 .. 12 кГц.
Представлення аналогового сигналу в цифровому вигляді називається також імпульсно-кодовою модуляцією (ІКМ, PCM - Pulse Code Modulation), так як сигнал представляється у вигляді серії імпульсів постійної частоти (тимчасова дискретизація), амплітуда яких передається цифровим кодом (амплітудна дискретизація). PCM-потік може бути як паралельним, коли всі біти кожного відліку передаються одночасно кількома лініями з частотою дискретизації, так і послідовним, коли біти передаються один за одним з більш високою частотою по одній лінії.
Сам цифровий звук та пов'язані речі прийнято позначати загальним терміном Digital Audio; аналогова і цифрова частини звукової системи позначаються термінами Analog Domain і Digital Domain.
АЦП і ЦАП
b>
аналогово-цифрового і цифро-аналоговий перетворювачі. Перший перетворює аналоговий сигнал в цифрове значення амплітуди, друге виконує зворотне перетворення. В англомовній літературі застосовуються терміни ADC і DAC, а суміщений перетворювач називають codec (coder-decoder).
Принцип роботи АЦП полягає у вимірюванні рівня вхідного сигналу і видачі результату в цифровій формі. У результаті роботи АЦП безперервний аналоговий сигнал перетворюється на імпульсний, з одночасним зМерень амплітуди кожного імпульсу. ЦАП одержує на вході цифрове значення амплітуди і видає на виході імпульси напруги або струму потрібної величини, що розташований за ним інтегратор (аналоговий фільтр) перетворює на безперервний аналоговий сигнал.
Для правильної роботи АЦП вхідний сигнал не повинен змінюватися протягом часу перетворення, для чого на його вході звичайно міститься схема вибірки-зберігання, що фіксує миттєвий рівень сигналу і зберігає його протягом всього часу перетворення. На виході ЦАП також може встановлюватися подібна схема, переважна вплив перехідних процесів усередині ЦАП на параметри вихідного сигналу.
При тимчасової дискретизації спектр отриманого імпульсного сигналу у своїй нижній частині 0 .. Fa повторює спектр вихідного сигналу, а вище містить ряд відбитків (aliases, дзеркальних спектрів), які розташовані навколо частоти дискретизації Fd та її гармонік (бічні смуги). При цьому перші відображення спектру від частоти Fd у разі Fd = 2Fa розташовується безпосередньо за смугою початкового сигналу, і вимагає для його придушення аналогового фільтра (anti-alias filter) з високою крутизною зрізу. У АЦП цей фільтр встановлюється на вході, щоб виключити перекриття спектрів та їх інтерференцію, а в ЦАП - на виході, щоб придушити у вихідному сигналі надтональние перешкоди, внесені тимчасової дискретизацією.
Пристрій АЦП і ЦАП
b>
В основному застосовується три конструкції АЦП: паралельні - вхідний сигнал одночасно порівнюється з еталонними рівнями набором схем порівняння (компараторів), які формують на виході двійкове значення. У такому АЦП кількість компараторів одно (2 в ступені N) - 1, де N - розрядність цифрового коду (для восьмирозрядного - 255), що не дозволяє нарощувати розрядність понад 10-12.
послідовного наближення - перетворювач за допомогою допоміжного ЦАП генерує еталонний сигнал, порівнюваний із вхідним. Еталонний сигнал послідовно змінюється за принципом половинного ділення (дихотомії), який використовується в багатьох методах сходив пошуку прикладної математики. Це дозволяє завершити перетворення за кількість тактів, рівне розрядності слова, незалежно від величини вхідного сигналу.
з вимірюванням тимчасових інтервалів - широка група АЦП, що використовує для вимірювання вхідного сигналу різні принципи перетворення рівнів у пропорційні тимчасові інтервали, тривалість яких вимірюється за допомогою тактового генератора високої частоти. Іноді називаються також які вважають АЦП.
Серед АЦП з вимірюванням тимчасових інтервалів переважають наступні три типи: послідовного рахунку, або одноразового інтегрування (single-slope) - в кожному такті перетворення запускається генератор лінійно зростаючої напруги, яка порівнюється з вхідним.
Зазвичай таку напругу одержують на допоміжному ЦАП, подібно АЦП послідовного наближення.
подвійного інтегрування (dual-slope) - в кожному такті перетворення вхідний сигнал заряджає конденсатор, який потім розряджається на джерело опорної напруги з вимірюванням тривалості розряду.
стеження - варіант АЦП послідовного рахунку, при якому генератор еталонного напруги не перезапускається в кожному такті, а змінює його від попереднього значення до поточного.
Найбільш популярним варіантом слідкуючого АЦП є sigma-delta, що працює на частоті Fs, значно (в 64 і більше разів) перевищує частоту дискретизації Fd вихідного цифрового сигналу. Компаратор такого АЦП видає значення зниженою розрядності (зазвичай однобітовие - 0/1), сума яких на інтервалі дискретизації Fd пропорційна величині відліку. Послідовність малоразрядних значень піддається цифрової фільтрації і зниженню частоти проходження (decimation), в результаті чого виходить серія відліків із заданою розрядністю і частотою дискретизації Fd.
Для поліпшення співвідношення сигнал/шум і зниження впливу помилок квантування, яка у разі однобітового перетворювача виходить досить високим, застосовується метод формування шуму (noise shaping) через схеми зворотного зв'язку по помилку і цифрового фільтрування. В результаті застосування цього методу форма спектра шуму змінюється так, що основна шумова енергія витісняється в область вище половини частоти Fs, незначна частина залишається в нижній половині, і практично весь шум видаляється зі смуги вихідного аналогового сигналу.
ЦАП в основному будуються за трьома принципами: вагатимуться - з підсумовуванням зважених струмів або напруг, коли кожен розряд вхідного слова вносить відповідний своєму бінарного вазі внесок у загальну величину одержуваного аналогового сигналу, а також вони ЦАП називають також паралельними або багаторозрядних (multibit).
sigma-delta, з попередньої цифрової передіскретізаціей і видачею малоразрядних (зазвичай однобітових) значень на схему формування еталонного заряду, які з такою ж високою частотою додаються до вихідного сигналу. Такі ЦАП носять також назва bitstream.
з широтно-імпульсною модуляцією (ШІМ, Pulse Width Modulation, PWM), коли на схему вибірки-зберігання аналогового сигналу видаються імпульси постійної амплітуди і змінної тривалості, керуючи дозуванням що видається на вихід заряду. На цьому принципі працюють перетворювачі MASH (Multi-stAge Noise Shaping - багатостадійна формування шуму) фірми Matsushita. Свою назву ці ЦАП отримали через застосування в них декількох послідовних формувачів шуму.
При використанні передіскретізаціі в десятки разів (зазвичай - 64x .. 512x) стає можливим зменшити розрядність ЦАП без відчутної втрати якості сигналу; ЦАП з меншою кількістю розрядів мають також кращою лінійністю. У межі кількість розрядів може бути скорочено до одного.
Форма вихідного сигналу таких ЦАП являє собою корисний сигнал, обрамлений значною кількістю високочастотного шуму, який, тим не менш, ефективно пригнічується аналоговим фільтром навіть середньої якості.
ЦАП є "прямими" пристроями, у яких перетворення виконується простіше і швидше, ніж в АЦП, які в більшості своїй - послідовні і більш повільні пристрої.
Передіскретізація (oversampling)
b>
Це дискретизація сигналу з частотою, що перевищує основну частоту дискретизації. Передіскретізаціі може бути аналогової, коли з підвищеною частотою робляться вибірки початкового сигналу, або цифровий, коли між уже існуючими цифровими відліку вставляються додаткові, розраховані шляхом інтерполяції. Інший спосіб отримання значень проміжних відліків полягає у вставці нулів, після чого вся послідовність піддається цифрової фільтрації. У АЦП використовується аналогова передіскретізація, в ЦАП - цифрова.
Передіскретізація використовується для спрощення конструкцій АЦП і ЦАП. За умовами завдання на вході АЦП і виході ЦАП повинен бути встановлений аналоговий фільтр з АЧХ, лінійної в робочому діапазоні і круто спадаючий за його межами. Реалізація такого аналогового фільтра досить складна; в той же час при підвищенні частоти дискретизації вносяться нею відображення спектру пропорційно відходять від основного сигналу, і аналоговий фільтр може мати набагато меншу крутизну зрізу.
Інша перевага передіскретізаціі полягає в тому, що помилки амплітудного квантування (шум дроблення), розподілені по всьому спектру квантуемого сигналу, при підвищенні частоти дискретизації розподіляються по більш широкій смузі частот, так що на частку основного звукового сигналу доводиться менша кількість шуму. Кожне подвоєння частоти знижує рівень шуму квантування на 3 дБ; оскільки один двійковий розряд еквівалентний 6 дБ шуму, кожне учетвереніе частоти дозволяє зменшити розрядність перетворювача на одиницю.
Передіскретізація разом зі збільшенням розрядності відліку, інтерполяцією відліків з підвищеною точністю і виведенням їх на ЦАП належної розрядності дозволяє трохи поліпшити якість відновлення звукового сигналу. З цієї причини навіть у 16-розрядних системах нерідко застосовуються 18 - та 20-розрядні ЦАП з передіскретізаціей.
АЦП і ЦАП з передіскретізаціей за рахунок значного зменшення часу перетворення можуть обходитися без схеми вибірки-зберігання.
Переваги і недоліки цифрового звуку
b>
Цифрове представлення звуку цінна насамперед можливістю нескінченного зберігання і тиражування без втрати якості, однак перетворення з аналогової форми в цифрову і назад все-таки неминуче призводить до часткової його втрати. Найбільш неприємні на слух спотворення, що вносяться на етапі оцифрування - Шорсткий шум, що виникає при квантуванні сигналу за рівнем через округлення амплітуди до найближчого дискретного значення. На відміну від простого широкосмугового шуму, що вноситься помилками квантування, Шорсткий шум являє собою гармонійні спотворення сигналу, найбільш помітні у верхній частині спектру.
Потужність шорсткого шуму обернено пропорційна кількості ступенів квантування, однак через логарифмічної характеристики слуху при лінійному квантуванні (постійна величина ступені) на тихі звуки припадає менше ступенів квантування, ніж на гучні, і в результаті основна щільність нелінійних спотворень припадає на область тихих звуків. Це призводить до обмеження динамічного діапазону, що в ідеалі (без урахування гармонійних спотворень) дорівнював би співвідношенням сигнал/шум, однак необхідність обмеження цих спотворень знижує динамічний діапазон для 16-розрядного кодування до 50-60 дБ.
Положення могло б врятувати логарифмічні квантування, проте його реалізація в реальному часі досить складна і дорога.
Искажения, що вносяться гранулярних шумом, можна зменшити шляхом додавання до сигналу звичайного білого шуму (випадкового або псевдовипадкового сигналу), амплітудою в половину молодшого значущого розряду; така операція називається згладжуванням (dithering). Це призводить до незначного збільшення рівня шуму, зате послаблює кореляцію помилок квантування з високочастотними компонентами сигналу і покращує суб'єктивне сприйняття. Згладжування застосовується також перед округленням відліків при зменшенні їх розрядності. По суті, dithering і noise shaping є окремими випадками однієї технології - з тією різницею, що в першому випадку використовується білий шум з рівномірним спектром, а в другому - шум із спеціально "формованні" спектром.
При відновленні звуку з цифрової форми в аналогову виникає проблема згладжування ступінчастою форми сигналу і придушення гармонік, що вносяться частотою дискретизації. Через неідеальної АЧХ фільтрів може відбуватися або недостатнє придушення цих перешкод, або надмірне послаблення корисних високочастотних складових. Погано пригнічені гармоніки частоти дискретизації спотворюють форму аналогового сигналу (особливо в області високих частот), що створює враження "шорсткого", "брудного" звуку.
Інтерфейси, які використовуються для передачі цифрового звуку
b>
S/PDIF (Sony/Philiрs Digital Interface Format - формат цифрового інтерфейсу фірм Sony і Philiрs) - цифровий інтерфейс для побутової радіоапаратури.
AES/EBU (Audio Engineers Society/European Broadcast Union - суспільство звукоінженерів/Європейського мовного об'єднання) - цифровий інтерфейс для студійної радіоапаратури.
Обидва інтерфейсу є послідовними і використовують однаковий формат сигналу і систему кодування - самосінхронізірующійся код BMC (Biphase-Mark Code - код з поданням одиниці подвійним зміною фази), і можуть передавати сигнали у форматі PCM розрядністю до 24 біт на частотах дискретизації до 48 кГц.
Кожен відлік сигналу передається 32-розрядних словом, у якому 20 розрядів використовуються для передачі відліку, а 12 - для формування синхронізуючий преамбули, передачі додаткової інформації та біта парності. 4 розряду з службової групи можуть використовуватися для розширення формату відліків до 24 розрядів.
Крім біта парності, службова частина слова містить біт достовірності (Validity), який повинен бути нульовим для кожного достовірного відліку. У випадку прийому слова з одиничним бітом Validity або з порушенням парності в слові приймач трактує весь відлік як помилковий і може на вибір або замінити його попереднім значенням, або інтерполювати на основі декількох сусідніх достовірних відліків.
відлік, помічені як недостовірні, можуть передавати CD-програвачі, DAT-магнітофони та інші пристрої, якщо при зчитуванні інформації з носія не вдалося скорегувати що виникли в процесі читання помилки.
Стандартно формат кодування призначений для передачі одно-і двох-канального сигналу, однак при використанні службових розрядів для кодування номера каналу можлива передача багатоканального сигналу.
З електричної боку S/PDIF передбачає підключення коаксіальним кабелем з хвильовим опором 75 Ом і роз'ємами типу RCA ( "тюльпан"), амплітуда сигналу - 0.5 В. AES/EBU передбачає підключення симетричним екранованим двопровідним кабелем з трансформаторної розв'язкою по інтерфейсу RS - 422 з амплітудою сигналу 3-10 В, роз'єми - трьохконтактні типу Cannon XLR. Існують також оптичні варіанти прийомопередавачів - TosLink (пластмасове оптоволокно) і AT & T Link (скляне оптоволокно).
Обробка цифрового звуку
b>
Цифровий звук обробляється за допомогою математичних операцій, що застосовуються до окремих відліку сигналу, або до груп відліків різної довжини. Виконувані математичні операції можуть або імітувати роботу традиційних аналогових засобів обробки (мікшування двох сигналів - додавання, посилення/ослаблення сигналу - множення на константу, модуляція - множення на функцію і т.п.), або використовувати альтернативні методи - наприклад, розкладання сигналу в спектр (ряд Фур'є), корекція окремих частотних складових, потім зворотній "збірка" сигналу із спектру.
Обробка цифрових сигналів поділяється на лінійну (у реальному часі, над "живим" сигналом) і нелінійну - над попередньо записаним сигналом. Лінійна обробка вимагає достатнього швидкодії обчислювальної системи (процесора); в ряді випадків неможливо суміщення необхідної швидкодії і якості, і тоді використовується спрощена обробка зі зниженим якістю. Нелінійна обробка ніяк не обмежена в часі, тому для неї можуть бути використані обчислювальні засоби будь-якої потужності, а час обробки, особливо з високою якістю, може досягати декількох хвилин і навіть годин.
Для обробки застосовуються як універсальні процесори загального призначення - Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC - так і спеціалізовані цифрові сигнальні процесори (Digital Signal Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog Devices ADSP-xxxx та ін
Різниця між універсальним процесором і DSP полягає в тому, що перший орієнтований на широкий клас завдань - наукових, економічних, логічних, ігрових і т.п., і містить великий набір команд загального призначення, в якому переважають звичайні математичні та логічні операції . DSP спеціально орієнтовані на обробку сигналів і містять набори специфічний операцій - додавання з обмеженням, множення векторів, обчислення математичного ряду і т.п. Реалізація навіть нескладної обробки звуку на універсальному процесорі вимагає значного швидкодії і далеко не завжди можлива в реальному часі, в той час як навіть прості DSP нерідко справляються в реальному часі з відносно складною обробкою, а потужні DSP здатні виконувати якісну спектральну обробку відразу декількох сигналів.
В силу своєї спеціалізації DSP рідко застосовуються самостійно - найчастіше пристрій обробки має універсальний процесор середньої потужності для управління всім пристроєм, прийому/передачі інформації, взаємодії з користувачем, і один або кілька DSP - власне для обробки звукового сигналу. Наприклад, для реалізації надійної та швидкої обробки сигналів у комп'ютерних системах застосовують спеціалізовані плати з DSP, через які пропускається оброблюваний сигнал, у той час як центрального процесора комп'ютера залишаються лише функції управління і передачі.
Методи, які використовуються для опрацювання звуку
b>
1. Монтаж. Складається в виpезаніі із запису одних ділянок, вставці дpугих, їх заміну, pазмноженіі і т.п. Hазивается також pедактіpованіем. Всі совpеменние звуко-та відеозапису в тій чи іншій меpе подвеpгаются монтажу.
2. Амплітудні пpеобpазованія. Виконуючиются пpи допомоги pазлічних дій над амплітудою сигналу, який в кінцевому рахунку зводяться до множення значень самплов на постійний коефіцієнт (посилення/ослаблення) або змінюється під часової функцію-модулятоp (амплітудна модуляція). Приватним випадком амплітудної модуляції є фоpміpованіе огинаючої для пpіданія стаціонаpному звучанню pазвітія у часової.
амплітудні пpеобpазованія виконуються послідовно з окремими сампламі, тому вони пpосто в pеалізаціі і не тpебуют великого обсягу обчислень.
3. Частотні (спектpальние) пpеобpазованія. Виконуються над частотними складовими звуку. Якщо використовувати спектpальное pазложеніе - Форма пpедставленія звуку, в котоpой по гоpізонталі відлічуються частоти, а по веpтікалі - інтенсивності складаючи-чих цих частот, то багато частотні пpеобpазованія стають схожими на амплітудні пpеобpазованіям над спектpом. Hапpімеp, фільтpація - посилення або ослаблення визначених смуг частот - зводиться до накладання на спектp відповідної амплітудної огинаючої. Однак частотну модуляцію таким обpаз пpедставіть не можна - вона виглядає, як зсув усього спектpа або його окремих ділянок під часової по певному закону.
Для pеалізаціі частотних пpеобpазованій зазвичай застосовуються спектpальное pазложеніе за методом Фуpье, якому тpебует значних pесуpсов. Проте є алгоpітм бистpого пpеобpазованія Фуpье (БПФ, FFT), який робиться в цілочисельний аpіфметіке і дозволяє вже на молодших моделях 486 pазвоpачівать в pеальном часової спектp сигналу сpеднего якості. Пpи частотних пpеобpа-тання, кpім цього, тpебуется обробці і наступна свеpтка, тому фільтpація в pеальном часової поки не pеалізуется на процесора загального призначення. Натомість існує велика кількість цифpового сигнальних процесора (Digital Signal Processor - DSP), який виконують ці опеpаціі в pеальном часової і по декількох каналах.
4. Фазові пpеобpазованія. Зводяться в основному до постійного зсуву фази сигналу або її модуляції деякими функцією або дpугих сигналом. Благодаpя тому, що слуховий аппаpат людини використовує фазу для визначених напряму на джерело звуку, фазові пpеобpазованія стеpеозвука дозволяють отримати ефект вpащающегося звуку, хоpа і йому подібні.
5. Часової пpеобpазованія. Полягають в додаванні до основного сигналу його копій, зрушених у часової на pазлічние величи-ни. Пpи невеликих зрушеннях (поpядка менше 20 мс) це дає ефект pазмноженія джерела звуку (ефект хоpа), пpи великих - ефект відлуння.
6. Фоpмантние пpеобpазованія. Чи є окремим випадком частотних і опеpіpуют з фоpмантамі - хаpактеpнимі смугами частот, зустрічав у звуках, пpоізносімих людиною. Кожному звуку відповідної своє співвідношення амплітуд і частот декількох фоpмант, якому визначають тембp і pазбоpчівость голоси. Змінюючи параметри фоpмант, можна подчеpківать або затушовувати окремі звуки, міняти одну голосну на дpугих, зрушувати pегістp голоси і т.п.
Звукові ефекти
b>
Ось найбільш поширений звукові ефекти: - ви