ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Стара платівка: Що таке цифровий звук і реставрація звуку за допомогою цифрової обробки
         

     

    Інформатика, програмування

    МІНІСТЕРСТВО ОСВІТИ

    РОСІЙСЬКОЇ ФЕДЕРАЦІЇ

    МОСКОВСЬКИЙ ДЕРЖАВНИЙ ІНСТИТУТ

    РАДИОТЕХНИКА ЕЛЕКТРОНІКИ І АВТОМАТИКИ

    (технічний університет)

    Курсова робота з інформатики


    Тема:

    Стара платівка: Що таке цифровий звук і реставрація звуку за допомогою цифрової обробки.

    Студент Чистяков І.О.

    Група ОТО 4-04

    викладач Андрианова Е. Г.

    Робота допущена до защіте_____________________________

    Курсова робота захищена з оцінкою ___________________

    Москва 2005 < p> Зміст

    1.Вступ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 3

    2. Частина перша, теоретична ... ... .. ... ... ... ... ... ... ... ... ... ... ... ... .. 3

    А. Теорія цифрового звуку ... ... ... ... ... ... ... ... ... ... ... .... ... ... 3

    Б. Оцифровка звуку і його зберігання на цифровому носітеле.7

    В. Як зберегти оцифрований звук ?................ .................. 11

    Г. Переваги та недоліки цифрового звуку ... ... ... ... .14

    Д. До питання про обробку звуку ... ... ... ... ... .. ... ... ... ... ... ... .17

    Е. Апаратура ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. ... ... ... ... 18

    Ж. Програмне забезпечення ... ... ... ... ... ... ... ... ... .... ... ... .. 22

    3.Часть друга: більше практична ... ... ... ... ... .. ... ... ... ... ... ... ... 25

    1. Підключення плеєра до комп'ютера ... .. ... ... ... .25

    2. Налаштування можливостей звукової карти ... ... .. ... ... ... .. 26

    3. Реставрація ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ... ... ... ... 26

    4. Підготовка файлів ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 32

    5. Поділ файла wave на окремі композиції ........ 32

    6. Перспективи і проблематика ... ... ... ... ... ... ... ... ... ... ... 33

    7. Глосарій термінів ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .34

    1.Вступ

    Останнім часом можливості мультимедійного обладнаннязазнали значне зростання, і цієї області приділяється достатнякількість уваги, але все ж рядовий користувач ніяк не можескласти собі чіткого уявлення про те, які можливості приховує йогозалізний друг в області відтворення звуку, писку, шумів, бінаруальниххвиль і т.д. Все обмежується відтворенням криків і вибухів в іграх іфільмах (благо технічний прогрес докотилася вже до такого рівня) іпрослуховування домашньої фонотеки (або вже пора придумати іншу назву,що-небудь типу «ціфротекі »?).

    Спробуємо в цій праці розібратися в основних аспектах даноїпроблеми. Поговоримо трохи про анатомію, теорії цифрового звуку і що можнавитягти зі старої вінілової платівки та аудіокасети.

    Що саме ми знаємо про звукові можливості комп'ютера, крім того,що в нашому домашньому комп'ютері встановлена звукова плата і дві колонки? Дожаль, ймовірно через недостатність літератури або з яких-небудьінших причин, але користувач, найчастіше, не знайомий ні з чим, крімвбудованого в Windows мікшери аудіо входів/виходів і Recorder'а. Для тогощоб дізнатись що вміє комп'ютер у галузі звуку, потрібно тількипоцікавитися і перед вами відкриються можливості, про які ви, можеможливо, навіть не здогадувалися. І все це не так складно, як може здатисяна перший погляд.

    2.Часть перше: більше теоретична.


    Всі процеси запису, обробки та відтворення звуку так чи інакшепрацюють на один орган, яким ми сприймаємо звуки - вухо. Дві штуки:).
    Без розуміння того, що ми чуємо, що нам важливо, а що ні, в чому причинатих чи інших музичних закономірностей - без цих та інших дрібницьнеможливо спроектувати хорошу аудіо апаратуру, не можна ефективно стиснутиабо обробити звук. Те, що тут описано - лише самі основи.
    Зовні ми бачимо так зване зовнішнє вухо. Нічого особливого нас тут нецікавить. Потім йде канал - приблизно 0.5 см в діаметрі і близько 3 см вдовжину. Далі - барабанна перетинка, до якої приєднані кістки - середнєвухо. Ці кісточки передають вібрацію барабанної перетинки далі - на іншуперетинку, у внутрішнє вухо - трубку з рідиною, близько 0.2 мм діаметром іще цілих 3-4 см довжиною, закручена як равлик. Сенс наявності середньоговуха в тому, що коливання повітря занадто слабкі, щоб прямо коливатирідина, і середнє вухо разом з барабанною перетинкою і перетинкоювнутрішнього вуха складають гідравлічний підсилювач - площа барабанноїперетинки у багато разів більше перетинки внутрішнього вуха, тому тиск
    (яке дорівнює F/S) посилюється в десятки разів.
    У внутрішньому вусі по всій його довжині натягнута якась штука, що нагадуєструну - ще один витягнута мембрана, жорстка до початку вуха і м'яка докінця. Певний ділянку цієї мембрани коливається в своєму діапазоні,низькі частоти - у м'якому ділянці ближче до кінця, найвищі - в самомупочатку. Уздовж цієї мембрани розташовані нерви, які сприймаютьколивання і передають їх у мозок, використовуючи два принципи:
    Перший - ударний принцип. Оскільки нерви ще здатні передавати коливання
    (бінарні імпульси) з частотою до 400-450 Гц, саме цей принцип влобвикористовується в області низькочастотного слуху. Там складно інакше - коливаннямембрани надто сильними і зачіпають занадто багато нервів. Ударний принциптрохи розширюється до приблизно 4 кГц за допомогою трюку - кілька (додесяти) нервів б'ють у різних фазах, складаючи свою пропускнуздатність. Цей спосіб хороший тим, що мозок сприймає інформацію більшеповно - з одного боку, ми все таки маємо легке частотне розділення, а зінший - можемо ще дивитися самі коливання, їх форму та особливості, а непросто частотний спектр. Цей принцип продовжений на саму важливу для нас частину
    - Спектр людського голосу. Та й взагалі, до 4 кГц знаходиться вся найбільшважлива для нас інформація.


    Ну і другий принцип - просто місце розташування збуджуваного нерва,застосовується для звуків більше 4 кГц. Тут вже крім факту нас взагалі нічогоне хвилює - ні фаза, ні скважність .. Голий спектр.
    Таким чином, в області високих частот ми маємо чисто спектральний слух недуже високої роздільної здатності, а для частот близьких до людського голосу --більш повний, заснований не тільки на розподілі спектру, а ще й надодаткового аналізу інформації самим мозком, даючи більш повну стерео --картину, наприклад. Про це - нижче.

    Основне сприйняття звуку відбувається в діапазоні 1 - 4 кГц, в цьому ждіапазоні укладено людський голос (та й звуки, що видаються більшістюважливих нам процесів у природі). Коректна передача цього частотноговідрізка - перша умова природності звучання.

    Про чутливості (за потужністю і частотної)

    Тепер про децибелах. Коротко - адитивна відносна логарифмічна мірагучності (потужності) звуку, найкраще відображає людськесприйняття гучності, і в той же час досить просто обчислюється.

    В акустиці прийнято вимірювати гучність в дБ SPL (Sound Power Level - не знаюяк це звучить у нас). Нуль цієї шкали знаходиться приблизно на мінімальномузвуці, який чує людина. Відповідно відлік ведеться впозитивний бік. Людина може осмислено чути звуки гучністюприблизно до 120 дБ SPL. При 140 дБ відчувається сильний біль, при 150 дБнастає пошкодження вух. Нормальний розмова - приблизно 60 - 70 дБ SPL.
    Далі в цьому розділі при згадці дБ мається на увазі дБ від нуля за SPL.
    Чутливість вуха до різних частотах дуже сильно різна. Максимальначутливість у районі 1 - 4 кГц, основні тони людського голосу.
    Звук 3 кГц - це і є той звук, який чути за 0 дБ. Чутливістьсильно падає в обидві сторони - наприклад для звуку в 100 Гц нам потрібно вжецілих 40 дБ (в 100 разів більша амплітуда коливань), для 10 кГц - 20 дБ.
    Звичайно ми можемо сказати, що два звуки відрізняються по гучності, при різниціприблизно в 1 дБ. Незважаючи на це, 1 дБ - це швидше за багато, ніж мало. Простоу нас дуже сильно компресувати, вирівняне сприйняття гучності.
    Зате весь діапазон - 120 дБ - воістину величезний, по амплітуді це мільйонираз!

    До речі, збільшення амплітуди в два рази відповідає збільшенню гучностіна 6 дБ. Увага! не плутайте: 12 дБ - у 4 рази, але різниця 18 дБ - вже 8раз! а не 6, як могли подумати. дБ - логарифмічна мера)

    Аналогічна за властивостями і спектральна чутливість. Ми можемо сказати,що два звуки (простих тону) відрізняються за частотою, якщо різниця між нимистановить близько 0.3% в районі 3 кГц, а в районі 100 Гц потрібно відмінністьвже на 4%! Для довідки - частоти нот (якщо брати разом з півтонами, тоє дві сусідні клавіші фортепіано, включаючи чорні) відрізняються наприблизно 6%.
    Загалом, в районі 1 - 4 кГц чутливість вуха по всіх параметрахмаксимальна, і становить не так вже й багато, якщо брати нелогаріфмірованние значення, з якими доводиться працювати цифровийтехніці. Візьміть на замітку - багато чого з того, що відбувається в цифровійобробці звуку, може виглядати жахливо в цифрах, і при цьому звучативідрізнити від оригіналу.

    У цифровій обробці поняття дБ вважається від нуля і вниз, в областьвід'ємних значень. Нуль - максимальний рівень, представимо цифровийсхемою.

    А. Власне кажучи, про саму цифрі.


    Деякі факти і поняття, без яких важко обійтися.

    У відповідності з теорією математика Фур'є, звукову хвилю можнапредставити у вигляді спектра що входять до неї частот.

    Частотні складові спектру - це синусоїдальні коливання (такзвані чисті тони), кожне з яких має свою власну амплітудуі частоту. Таким чином, будь-яке, навіть найскладніше за формою коливання
    (наприклад, людський голос), можна представити сумою найпростішихсинусоїдальних коливань певних частот та амплітуд. І навпаки,згенерував різні коливання і наклавши їх один на одного (змікширувати,змішавши), можна отримати різні звуки.

    довідки: людський слуховий апарат/мозок здатний розрізнятичастотні складові звуку в межах від 20 Гц до ~ 20 КГц (верхнямежа може коливатися в залежності від віку та інших факторів).
    Крім того, нижня межа сильно коливається залежно від інтенсивностізвучання.

    Б. Оцифровка звуку і його зберігання на цифровому носії

    «Звичайний» аналоговий звук видається в аналогової апаратурибезперервним електричним сигналом. Комп'ютер оперує з даними вцифровому вигляді. Це означає, що і звук в комп'ютері представляється вцифровому вигляді. Як же відбувається перетворення аналогового сигналу вцифрової?

    Цифровий звук - це спосіб подання електричного сигналуза допомогою дискретних чисельних значень його амплітуди. Припустимо, ми маємоаналогову звукову доріжку гарної якості (кажучи «гарна якість»будемо припускати негаласливим запис, що містить спектральні складові звсього чутного діапазону частот - приблизно від 20 Гц до 20 КГц) іхочемо «ввести» її в комп'ютер (тобто оцифрувати) без втрати якості. Якцього добитися і як відбувається оцифровка? Звукова хвиля - це певнаскладна функція, залежність амплітуди звукової хвилі від часу. Здавалосяб, що коли це функція, то можна записати її в комп'ютер «як є», тоє описати математичний вигляд функції і зберегти в пам'яті комп'ютера.
    Однак практично це неможливо, оскільки звукові коливання не можнапредставити аналітичної формулою (як y = COSx, наприклад). Залишається однашлях - описати функцію шляхом зберігання її дискретних значень у певнихточках. Іншими словами, в кожній точці часу можна виміряти значенняамплітуди сигналу і записати у вигляді чисел. Однак і в цьому методі є своїнедоліки, тому що значення амплітуди сигналу ми не можемо записувати знескінченної точністю, і вимушені їх округляти. Інакше кажучи, ми будемонаближати цю функцію за двома координатним осях - амплітудної і тимчасової
    (наближати в точках - виходить, говорячи простою мовою, брати значенняфункції у точках і записувати їх з кінцевою точністю). Таким чином,оцифровка сигналу включає в себе два процеси - процес дискретизації
    (здійснення вибірки) і процес квантування. Процес дискретизації - цепроцес отримання значень величин перетворюється сигналу в певніпроміжки часу (рис. 1).

    рис.1

    Квантування - процес заміни реальних значень сигналу наближеними зпевною точністю (рис. 2). Таким чином, оцифровка - це фіксаціяамплітуди сигналу через певні проміжки часу та реєстраціяотриманих значень амплітуди у вигляді округлених цифрових значень (так якзначення амплітуди є величиною безперервної, немає можливості кінцевимчислом записати точне значення амплітуди сигналу, саме тому вдаютьсядо округлення). Записані значення амплітуди сигналу називаються відліку.
    Очевидно, що чим частіше ми будемо робити виміри амплітуди (чим вище частотадискретизації) і чим менше ми будемо округляти отримані значення (чимбільше рівнів квантування), тим більш точне уявлення сигналу вцифровій формі ми отримаємо.

    Рис.2

    Оцифрований сигнал у вигляді набору послідовних значень амплітудиможна зберегти.

    Тепер про практичні проблеми. По-перше, треба мати на увазі, щопам'ять комп'ютера не нескінченна, тому що кожного разу при оцифровцінеобхідно знаходити якийсь компроміс між якістю (прямо залежнимвід використаних при оцифровці параметрів) і займаним оцифрованимсигналом об'ємом.

    По-друге, частота дискретизації встановлює верхню межу частотоцифрованого сигналу, а саме, максимальна частота спектральнихскладових дорівнює половині частоти дискретизації сигналу. Просто кажучи,щоб отримати повну інформацію про звук в частотній смузі до 22050 Гц,необхідна дискретизація з частотою не менше 44.1 КГц.

    Існують і інші проблеми і нюанси, пов'язані з оцифруванням звуку.
    Не сильно заглиблюючись у подробиці відзначимо, що в «цифровому звуці» черездискретності інформації про амплітуду оригінального сигналу з'являютьсярізні шуми і спотворення (під фразою «в цифровому звуці є такі-точастоти і шуми »мається на увазі, що коли цей звук буде перетворенийназад з цифрового виду в аналоговий, то в його звучанні будутьбути присутнім згадані частоти і шуми). Так, наприклад, джитер (jitter)
    - Шум, що з'являється в результаті того, що здійснення вибірки сигналупри дискретизації відбувається не через абсолютно рівні проміжки часу,а з якимись відхиленнями. Тобто, якщо, скажімо, дискретизація проводитьсяз частотою 44.1 КГц, то відліки беруться не точно кожні 1/44100 секунди, ато трохи раніше, то трохи пізніше. А так як вхідний сигнал постійнозмінюється, то така помилка призводить до «захоплення» не зовсім вірного рівнясигналу. У результаті під час програвання оцифрованого сигналу можевідчуватися деякий тремтіння і спотворення. Поява джіттера єрезультатом не абсолютної стабільності аналогово-цифрових перетворювачів.
    Для боротьби з цим явищем застосовують высокостабильные тактові генератори.
    Ще однією неприємністю є шум дроблення. Як ми говорили, приквантуванні амплітуди сигналу відбувається її округлення до найближчогорівня. Така похибка викликає відчуття «брудного» звучання.

    довідки: стандартні параметри запису аудіо компакт-дисківнаступні: частота дискретизації - 44.1 КГц, рівень квантування - 16 біт.
    Такі параметри відповідають 65536 (2) рівнями квантування амплітудипри взятті її значень 44100 раз в секунду.

    На практиці, процес оцифровки (дискретизація й квантування сигналу)залишається невидимим для користувача - всю чорнову роботу роблятьрізноманітні програми, які дають відповідні команди драйверу
    (керуюча підпрограма операційної системи) звукової карти. Будь-якапрограма (будь то вбудований в Windows Recorder або потужний звуковийредактор), здатна здійснювати запис аналогового сигналу в комп'ютер,так чи інакше оцифровує сигнал з певними параметрами, якіможуть виявитися важливими у подальшій роботі з записаним звуком, і самез цієї причини важливо зрозуміти як відбувається процес оцифровки і якіфактори впливають на її результати.

    Поїхали далі. Як отримати аналоговий звук знову з цифри?

    Ми ж його повинні почути, а ціфоркі нам чути не дано.

    2. Перетворення звуку з цифрового виду в аналоговий

    Як після оцифровки прослуховувати звук? Тобто, як перетворюватийого назад з цифрового виду в аналоговий?

    Для перетворення діскретізованного сигналу в аналоговий вигляд,придатний для обробки аналоговими пристроями (підсилювачами та фільтрами)і подальшого відтворення через акустичні системи, служитьЦифроаналоговий перетворювач (ЦАП). Процес перетворення являєсобою зворотний процес дискретизації: маючи інформацію про величину відліків
    (амплітуди сигналу) і беручи певну кількість відліків в одиницючасу, шляхом інтерполювання відбувається відновлення вихідного сигналу
    (рис. 3).

    Р?? с. 3

    Ще зовсім недавно відтворення звуку в домашніх комп'ютерах булопроблемою, тому що комп'ютери не оснащені спеціальними ЦАП. Спочатку вяк найпростішого звукового пристрою в комп'ютері використовувавсявбудований динамік (PC speaker). Взагалі кажучи, цей динамік до цих пірє майже у всіх PC, але ніхто вже не пам'ятає як його «розкачати», щобвін заграв. Якщо коротко, то цей динамік приєднаний до порту наматеринській платі, у якого є два положення - 1 і 0. Так от, якщоцей порт швидко-швидко вмикати та вимикати, то з динаміка можна витягтибільш-менш правдоподібні звуки. Відтворення різних частотдосягається за рахунок того, що дифузор динаміка має кінцевої реакцієюі не здатний миттєво перестрибувати з місця на місце, таким чином він
    «Плавно розгойдується» внаслідок стрибкоподібного зміни напруги наньому. І якщо розхитувати його з різною швидкістю, то можна отримати коливанняповітря на різних частотах. Природною альтернативою динаміку став такзваний Covox - це найпростіший ЦАП, виконаний на декількохпідібраних опорах (або готової мікросхемі), які забезпечуютьпереклад цифрового представлення сигналу в аналоговий - тобто в реальнізначення амплітуди. Covox простий у виготовленні і тому він користувавсяуспіхом у любителів аж до того часу, коли звукова карта сталадоступною всім.

    У сучасному комп'ютері звук відтворюється і записується за допомогоюзвукової карти - підключається, або вбудованої в материнську платукомп'ютера. Завдання звукової карти в комп'ютері - введення та виведення аудіо.
    Практично це означає, що звукова карта є тим перетворювачем,який переводить аналоговий звук в цифровій і назад. Якщо описуватиспрощено, то робота звукової карти може бути пояснена наступним чином.
    Припустимо, що на вхід звукової карти поданий аналоговий сигнал та картавключена (програмно). Спочатку вхідний аналоговий сигнал потрапляє ваналоговий мікшер, який займається змішанням сигналів і регулюваннямгучності та балансу. Мікшер необхідний, зокрема, для наданняможливості користувачеві керувати рівнями. Потім відрегульований ізбалансований сигнал потрапляє в аналогово-цифровий перетворювач, десигнал діскретізуется і квантів, в результаті чого в комп'ютер по шиніданих направляється біт-потік, який і являє собою оцифрованийаудіо сигнал. Висновок аудіо інформації майже аналогічний вводу, тількивідбувається у зворотний бік. Потік даних, спрямований у звукову карту,долає цифро-аналоговий перетворювач, який утворює з чисел,що описують амплітуду сигналу, електричний сигнал; отриманий аналоговийсигнал може бути пропущений через будь-які аналогові тракти для подальшихперетворень, у тому числі і для відтворення. Треба відзначити, що якщозвукова карта обладнана інтерфейсом для обміну цифровими даними, то прироботі з цифровим аудіо ніякі аналогові блоки карти не задіяні.

    В. Як зберегти оцифрований звук?

    Для зберігання цифрового звуку існує багато різних способів. Якми говорили, оцифрований звук являє собою набір значень амплітудисигналу, взятих через певні проміжки часу. Таким чином, по -перше, блок оцифрованої аудіо інформації можна записати в файл «якє », тобто послідовністю чисел (значень амплітуди). У цьомувипадку існують два способи зберігання інформації.

    Рис.4

    Перший (рис. 4) - PCM (Pulse Code Modulation - імпульсно-кодовамодуляція) - спосіб цифрового кодування сигналу за допомогою записуабсолютних значень амплітуд (бувають знакова або беззнаковіподання). Саме в такому вигляді записані дані на всіх аудіо CD.

    Другий спосіб (рис. 5) - ADPCM (Adaptive Delta PCM - адаптивнавідносна імпульсно-кодова модуляція) - запис значень сигналу не вабсолютних, а у відносних зміни амплітуд (прирости).

    Рис.5

    По-друге, можна стиснути або спростити дані так, щоб вони займалименший обсяг, ніж будучи записаними «як є». Тут тежє два шляхи.

    Кодування даних без втрат (lossless coding) - це спосібкодування аудіо, який дозволяє здійснювати стовідсотковевідновлення даних з стисненого потоку. До такого способу ущільнення данихвдаються у тих випадках, коли збереження оригінального якості данихкритично. Наприклад, після зведення звуку в студії звукозапису, данінеобхідно зберегти в архіві в оригінальній якості для можливогоподальшого використання. Існуючі сьогодні алгоритми кодування безвтрат (наприклад, Monkeys Audio) дозволяють скоротити займану данимиобсяг на 20-50%, але при цьому забезпечити стовідсоткове відновленняоригінальних даних з отриманих після стиснення. Подібні кодери - цесвого роду архіватори даних (як ZIP, RAR і інші), тількипризначені для стиснення саме аудіо.

    Є й другий шлях кодування, на якому ми зупинимося трохидокладніше, - кодування даних з втратами (lossy coding). Мета такогокодування - будь-якими способами домогтися схожості звучання відновленогосигналу з оригіналом при якомога меншому обсязі упакованих даних. Цедосягається шляхом використання різних алгоритмів «спрощують»оригінальний сигнал (викидаючи з нього «непотрібні» слабослишімие деталі),що призводить до того, що декодувати сигнал фактично перестає бутиідентичним оригіналу, а лише схоже звучить. Методів стискування, а такожпрограм, що реалізують ці методи, існує багато. Найбільш відомимиє MPEG-1 Layer I, II, III (останнім є всім відомий MP3),
    MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA),
    TwinVQ (VQF), MPEGPlus, TAC, та інші. У середньому, коефіцієнт стиснення,забезпечується такими кодерами, знаходиться в межах 10-14 (разів). Требаособливо підкреслити, що в основі всіх lossy-кодерів лежить використання такзваної психоакустичної моделі, яка саме і займається
    «Спрощенням» оригінального сигналу. Говорячи точніше, механізм подібнихкодерів виконує аналіз кодованого сигналу, в процесі якоговизначаються ділянки сигналу, в певних частотних областях якихє нечутні людському вуху нюанси (замасковані або нечутнічастоти), після чого відбувається їх видалення з оригінального сигналу. Такимчином, ступінь стиснення оригінального сигналу залежить від ступеня його
    «Спрощення»; сильне стиснення досягається шляхом «агресивного спрощення»
    (коли кодер «вважає» непотрібними численні нюанси), таке стиснення,природно, приводить до сильної деградації якості, оскільки видаленняможуть підлягати не тільки непомітні, але і значущі деталі звучання.

    Як ми сказали, сучасних lossy-кодерів існує досить багато.
    Найбільш поширений формат - MPEG-1 Layer III (всім відомий MP3).
    Формат завоював свою популярність цілком заслужено - це був першийпоширений кодек подібного роду, який досяг такого високого рівнякомпресії при відмінній якості звучання. Сьогодні цього кодеку єбезліч альтернатив, але вибір залишається за користувачем. Переваги
    MP3 - широка поширеність і досить висока якість кодування,яке об'єктивно поліпшується завдяки розробкам різних кодерів MP3ентузіастами (наприклад, кодер Lame). Потужна альтернатива MP3 - кодек
    Microsoft Windows Media Audio (Файли. WMA і. ASF). За різними тестами цейкодек показує себе від «як MP3» до «помітно гірше MP3» на середніхбітрейта, і, найчастіше, «краще MP3» на низьким бітрейтом. Ogg Vorbis (файли
    . OGG) - абсолютно вільний від ліцензування кодек, що створюєтьсянезалежними розробниками. Найчастіше поводиться краще MP3, недолікомє лише мала поширеність, що може стати критичнимаргументом при виборі кодека для тривалого зберігання аудіо. Згадаймо і щемолодий кодек MP3 Pro, анонсований в липні 2001 року компанією Coding
    Technologies спільно з Thomson Multimedia. Кодек є продовженням,або, точніше, розвитком старого MP3 - він сумісний з MP3 тому (повністю) івперед (частково). За рахунок використання нової технології SBR (Spectral
    Band Replication), кодек поводиться помітно краще за інших форматів на низькихбітрейта, проте якість кодування на середніх і високим бітрейтом частішепоступається якості майже всіх описаних кодеків. Таким чином, MP3 Proпридатний більше для ведення аудіо трансляцій в Internet, а також длястворення превью пісень та музики.

    Говорячи про способи зберігання звуку в цифровому вигляді не можна не згадати іпро носіях даних. Усім звичний аудіо компакт-диск, що з'явився на початку
    80-х років, широке розповсюдження отримав саме в останні роки (щопов'язане з сильним здешевленням носія і приводів). А до цього носіямицифрових даних були касети з магнітною стрічкою, але не звичайні, аспеціально призначені для так званих DAT-магнітофонів. Нічогопримітного - магнітофони як магнітофони, однак ціна на них завждибула високою, і таке задоволення було не всім «по зубах». Ці магнітофонивикористовувалися, в основному, в студіях звукозапису. Перевага такихмагнітофонів було в тому, що, не дивлячись на використання звичнихносіїв, дані на них зберігалися в цифровому вигляді і практично ніякихвтрат під час читання/запису на них не було (що дуже важливо при студійноїобробці та зберіганні звуку). Сьогодні з'явилася велика кількість різнихносіїв інформації, крім звичних всім компакт-дисків. Носіїудосконалюються і з кожним роком стають більш доступними такомпактними. Це відкриває великі можливості в області створення мобільнихаудіо програвачів. Вже сьогодні продається величезна кількість різнихмоделей переносних цифрових плеєрів. І, можна припустити, що це щедалеко не пік розвитку такого роду техніки.

    Г. Переваги та недоліки цифрового звуку

    З точки зору звичайного користувача вигоди багато - компактністьсучасних носіїв інформації дозволяє йому, наприклад, перевести вседиски та платівки з своєї колекції в цифрове представлення і зберегтина довгі роки на невеликому тридюймовим вінчестері або на десятці-іншомукомпакт-дисків; можна скористатися спеціальним програмним забезпеченнямі гарненько «почистити» старі записи з бобін і пластинок, видаливши з їхзвучання шуми і тріск; можна також не просто скорегувати звучання, а йприкрасити його, додати соковитості, об'ємності, відновити частоти.
    Крім перерахованих маніпуляцій зі звуком в домашніх умовах, Інтернеттеж приходить на допомогу аудіо-любителю. Наприклад, мережа дозволяє людямобмінюватися музикою, прослуховувати сотні тисяч різних Інтернет-радіостанцій, а також демонструвати своє звукове творчість публіці, і дляцього потрібен лише комп'ютер і Інтернет. І, нарешті, останнім часомз'явилася величезна маса різної портативної цифрової аудіо апаратури,можливості навіть самого середнього представника якої часто дозволяють злегкістю взяти з собою в дорогу колекцію музики, що дорівнює по тривалостізвучання десяткам годин.

    З точки зору професіонала цифровий звук відкриває воістинунеосяжні можливості. Якщо раніше звукові і радіо студії розміщувалися накілька десятків квадратних метрів, то тепер їх може замінити хорошийкомп'ютер, який за можливостями перевершує десять таких студій разомузятих, а за вартістю виявляється багато разів дешевше одного. Це знімаєбагато фінансові бар'єри і робить звукозапис більш доступною іпрофесіонала і простому любителю. Сучасне програмне забезпеченнядозволяє робити зі звуком все що завгодно. Раніше різні ефектизвучання досягалися за допомогою хитромудрих пристосувань, які не завждиявляли собою верх технічної думки або ж були просто пристроямикустарного виготовлення. Сьогодні, найскладніші і просто неймовірніраніше ефекти досягаються шляхом натискання кнопок пари. Звичайно,вищесказане кілька утрирувано і комп'ютер не замінює людини --звукооператора, режисера або монтажера, проте з упевненістю можнасказати, що компактність, мобільність, колосальна потужність ізабезпечується якість сучасної цифрової техніки, призначеної дляобробки звуку, вже сьогодні майже повністю витіснило зі студій старуаналогову апаратуру.

    Втім, у цифрового подання даних є одна незаперечна ідуже важлива перевага - при зберіганню носії дані на ньому неспотворюються з плином часу. Якщо магнітна стрічка з часомрозмагнічуються і якість запису втрачається, якщо платівка дряпається і дозвучанню додаються клацання і тріск, то компакт-диск/вінчестер /електронна пам'ять або читається (у разі збереження), або ні, а ефектстаріння відсутній. Важливо відзначити, ми не говоримо тут про Audio CD (CD-
    DA - стандарт, що встановлює параметри і формат запису на аудіо компактдиски) тому що не дивлячись на те, що це носій цифрової інформації,ефект старіння його, все ж, не минає. Це пов'язано з особливостямизберігання та зчитування аудіо даних з Audio CD. Інформація на всіх типахкомпакт-дисків зберігається покадрово і кожен кадр має заголовок, заяким його можливо ідентифікувати. Проте різні типи CD маютьрізну структуру і використовують різні методи маркування кадрів.
    Оскільки комп'ютерні приводи CD-ROM розраховані на читання в основному Data-
    CD (треба сказати, що існують різні різновиди стандарту Data-CD, кожен з яких доповнює основний стандарт CD-DA), вони часто нездатні правильно «орієнтуватися» на Audio CD, де спосіб маркуваннякадрів відмінний від Data-CD (на аудіо CD кадри не мають спеціальноїзаголовка і для визначення зміщення кожного кадру необхідно стежити заінформацією в кадрі). Це означає, що якщо при читанні Data-CD привідлегко «орієнтується» на диску і ніколи не переплутає кадри, то при читанніз аудіо компакт диску привід не може орієнтуватися чітко, що припояву, скажімо, подряпини або пилу може призвести до читання неправильногокадру і, як наслідок, стрибка або тріску звучання. Ця ж проблема
    (нездатність більшості приводів правильно позиціонуватися на CD-DA)є причиною ще одного неприємного ефекту: копіювання інформації з
    Audio CD викликає проблеми навіть при роботі з повністю сохранными дискамивнаслідок того, що правильне «орієнтування на диску» повністю залежитьвід зчитує приводу і не може бути чітко проконтрольованопрограмним шляхом.

    Повсюдне поширення і подальший розвиток уже згаданихlossy-кодерів аудіо (MP3, AAC і інших) відкрило широкі можливостіпоширення та зберігання аудіо. Сучасні канали зв'язку вже давнодозволяють пересилати великі масиви даних за порівняно невеликучас, проте самої повільної залишається передача даних між кінцевимкористувачем і постачальником послуг зв'язку. Телефонні лінії, за якимикористувачі здебільшого пов'язуються з Інтернетом, не дозволяютьздійснювати швидку передачу даних. Годі й казати, що такі обсягиданих, які займає нестислих аудіо та відео інформація, передавати зазвичним каналах зв'язку доведеться дуже довго. Однак поява lossy -кодерів, що забезпечують десяти-п'ятнадцяти кратне стиснення, перетворилопередачу і обмін аудіо даними в повсякденне заняття кожного користувача
    Інтернету і зняло всі перепони, утворені слабкими каналами зв'язку.
    Стосовно цього потрібно сказати, що сьогодні розвивається семимильнимикроками цифрова мобільний зв'язок багато в чому зобов'язана саме lossy-кодування.
    Справа в тому, що протоколи передачі аудіо за допомогою мобільних телефонівпрацюють на приблизно тих же принципах, що й відомі всіммузичні кодери. Тому подальший розвиток в області кодування аудіонезмінно веде до зменшення вартості передачі даних в мобільнихсистемах, від чого кінцевий користувач тільки виграє: дешевшає зв'язок,з'являються нові можливості, подовжується час роботи батарей мобільнихпристроїв і т.д. Не в меншій мірі lossy-кодування допомагає заощаджуватигроші на покупку дисків з улюбленими піснями - сьогодні варто лише зайти в
    Інтернет і там можна знайти майже будь-яку потрібну пісню. Безумовно,такий стан речей давно «муляє очі» звукозаписним компаніям - уних під носом люди замість придбання дисків обмінюються піснями прямо через
    Інтернет, що перетворює колись золоте дно в малоприбутковий бізнес, алеце вже питання етики і фінансів. Одне можна сказати з упевненістю: з такимстаном речей вже нічого не можна вдіяти і бум обміну музикою через
    Интернет, породжений саме появою lossy-кодерів, вже нічим незупинити. А це тільки на руку пересічному користувачеві.

    Д. До питання про обробку звуку

    Під обробкою звуку слід розуміти різні перетвореннязвукової інформації з метою зміни якихось характеристик звучання. Дообробці звуку відносяться способи створення різних звукових ефектів,фільтрація, а також звуку методи очищення від небажаних шумів, змінитембру і т.д. Все це величезна безліч перетворень зводиться, вЗрештою, до наступних основних типів:

    1. Амплітудні перетворення. Виконуються над амплітудою сигналу іпризводять до її посилення/ослаблення або зміни за будь-яким законом напевних ділянках сигналу.

    2. Частотні перетворення. Виконуються над частотними складовимизвуку: сигнал подається у вигляді спектра частот через певніпроміжки часу, проводиться обробка необхідних частотнихскладових, наприклад, фільтрація, і зворотне «згортання» сигналу зспектру в хвилю.

    3. Фазові перетворення. Зсув фази сигналу тим або іншим способом;наприклад, такі перетворення стерео сигналу, дозволяють реалізувати ефектобертання або «об'ємності» звуку.

    4. Тимчасові перетворення. Реалізуються шляхом накладення,розтягування/стиснення сигналів; дозволяють створити, наприклад, ефекти відлуння абохору, а також вплинути на просторові характеристики звуку.

    Обговорення кожного з названих типів перетворень може стати цілимнауковою працею. Варто навести кілька практичних прикладіввикористання зазначених видів перетворень при створенні реальних звуковихефектів:

    Echo (луна) Реалізується за допомогою тимчасових перетворень. Фактичнодля отримання луни необхідно на оригінальний вхідний сигнал накласти йогозатриману в часі копію. Для того, щоб людське вухо сприймалодругий копію сигналу як повторення, а не як відгомін основного сигналу,необхідний час затримки встановити рівним приблизно 50 мс. На основнійсигнал можна накласти не одну його копію, а декілька, що дозволить навиході отримати ефект багаторазового повторення звуку (багатоголосого відлуння).
    Щоб відлуння здавалося затухаючим, необхідно на вихідний сигнал накладати непросто затримані копії сигналу, а приглушені за амплітудою.

    Reverberation (повторення, відображення). Ефект полягає в наданнізвучанню об'ємності, характерної для великого залу, де кожен звукпороджує відповідний, повільно згасаючий відгомін. Практично, здопомогою реверберації можна «оживити», наприклад, фонограму, зроблену взаглушеному приміщенні. Від ефекту «відлуння» реверберація відрізняється тим, що навхідний сигнал накладається затриманий в часі вихідний сигнал, а незатримана копія вхідного. Іншими словами, блок реверберації спрощеноявляє собою петлю, де вихід блоку підключений до його входу, такимчином вже оброблений сигнал кожен цикл знову подається на вхідзмішуючись з оригінальним сигналом.

    Chorus (хор). У результаті його застосування зву

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status