Компрессия звука в Audacity

В принципе, записанный голос сразу же можно выкладыать в виде подкаста. Но лучше немного посидеть, разобраться хотя бы в азах и провести простую обработку звука. Есть одно минимальное действие, совсем не сложное ни в понимании, ни в реализации, при этом структура звучание резко изменится в лучшую сторону. Речь идет о компрессии звука.
Когда я впервые услышал о компрессии, я конечно подумал о mp3 или ogg, или любых других форматах, позволяющих сжать звуковые файлы в размере. Как оказалось, компрессия - вовсе не сюда :)
Чтобы понять, что такое компрессия, давайте сразу начнем с практики и по ходу будем вникать в суть дела. Перед вами фрагмент моей речи без какой-либо обработки (из какого-то выпуска первого сезона “Кадров”):
А вот так этот звук выглядит графически, в редакторе Audacity:

На первый взгляд, звук как звук. Но все познается в сравнении. У этого фрагмента есть один недочет - звук “скачет”. По графику можно легко увидеть, как мой голос становится то тише, то громче, передвигаясь по стулу я менял в процессе разговора расстояние до микрофона, да к тому же то шептал, то активно что-то доказывал, повышая голос и тон. В итоге, если слушать такую запись, звук будет то бить по ушам, то его будет слышно черезчур тихо.
Задача компрессии - “сжать” звучание, усреднить, сделать плотнее, уменьшить расстояние между самыми тихими моментами и самыми громкими. Вот и все! Это все, что делает компрессор!
Делает он это, конечно же, не как ему захочется, а как мы ему укажем. Здесь и начинается вроде как сложные термины и непонимание, на деле же все - проще простого.
Давайте выделим весь фрагмент (Ctrl+A, от английского “all” - “все”) и зайдем в Эффекты->Компрессор (Effects->Compressor). На скриншоте ниже я поставил все значения в максимум, просто чтобы показать, как выглядит это окно.

Здесь три ползунка.
Первый - “порог” (пороговое значение, threshold). Все, что выше указанного порога будет звучать тише после компрессии. Грубо говоря, порог - это значение, при достижении которого срабатывает компрессор, некая точка кипения.
Второй - “коэффициент” (ratio). Это значение выставляется как отношение число к числу. Максимальное значение на скриншоте - 10:1. Это означает, что как только сигнал достигнет порога, громкость уменьшится в 10 раз. Это происходит очень просто - на каждые 10 децибел входного сигнала, компрессор пропустит только 1, в результате громкость уменьшится.
Третий - время атаки (attack time). Это значение времени, за которое компрессор будет реагировать на повышение сигнала. В примере выше стоит значение 1,0 секунда. Вот как это работает: сигнал достигает значения порога, компрессор думает 1 секунду, если сигнал так и остается в этой зоне (не снижается ниже порга), то громкость понижается. Если в записи звучит выстрел из пистолета, то при значении 1 секунда его громкость даже не изменится - выстрел слишком быстрый, компрессор “не успеет” среагировать”. В более продвинутых редакторах компрессор имеет больше настроек, как минимум есть еще и release time - время восстановления. Это то же самое, только с другого конца: сколько времени нужно компрессору, чтобы перестать понижать громкость.
Галочка “Нормализовать до 0 Дб после компрессии” говорит сама за себя. После компресси общий уровень сигнала как правило уменьшится, звук станет хоть и плотнее, но тише. С этой галочкой звук станет громче, достигнет уровня 0 Дб, что является стандартом для подкастинга.
Это и есть весь механизм компрессии звука! Давайте попробуем на практике применить эти знания. Вот что я сделаю:
- Значение порога выставлю в -25 Дб
- Значение коэффициента - в 6:1
- Значение времени атаки - в 0,1 секунд
- Поставлю галочку “Нормализовать до 0 Дб после компрессии”
- …и нажму ОК :)

После недолгого процесса мы увидим следующую картину:

А звуком - такое вот:
Чувствуете разницу? Даже если вы скажете “нет”, то это поспешный вывод. Переслушайте первые 6 секунд обоих записей и вы поймете, что скомпрессированный звук слушать приятнее, не нужно прислушиваться “че он там промямлил??!..”. А если вы слушаете подкаст в полтора часа (О, Кадры!..), то плохо скомпрессированного или вообще без компрессии звука просто устают уши и мозг. Хорошее качество звучания не отвлекает, расслабляет.
Нужно понимать, что описанное в статье действие: во-первых, не самое лучшее. Этот же фрагмент звука можно скомпрессировать куда как лучше. Во-вторых, не является универсальным для всех записей: в вашем конкретном случае возможно понадобятся другие значения.
…
Как видите, совсем не сложно, а результат влияет на очень многое! Хотя бы из уважения к слушателям, им стоит преподносить хороший звук. Приятный.
Сам я с компрессией познакомился благодаря подкасту “Теория и Практика Звукозаписи” от небезызвестного Умпутуна. Чего и вам советую. У него же можно почитать небольшие статейки о компрессии:
- Компрессия (зачем она нужна)
- Как выглядит скомпрессированный звук в картинках
- Компрессия без использования мозга
В следующий раз займемся другими аспектами обработки звука.



О, спасибо)) А то замучился вручную звук подгонять))
Пожалуйста!
У меня возникло два вопроса правда немного не по теме:
1. Как можно удалить небольшие шумы и иногда треск?
2. Я установил такой же плеер как у вас тут, но он отображает русские мп3 теги иероглифами, вот как с этим быть?
1) как бороться с шумом и треском - в следующей статье, появится на днях
2) вы имеете ввиду flash-плеер? кхм… незнаю даже, если честно
Да как раз flash плеер, который при нажатии кнопки play раздвигается, может вы помните откуда его скачивали, он же как плагин подключается, у вас нет проблем с кирилическими mp3-тегами?
Вот ссылка: http://www.1pixelout.net/code/audio-player-wordpress-plugin/
я русскими тегами я даже не пробовал, поэтому не знаю честно говоря
подключается очень просто, нужно чтобы в папке plugins был один php-файл и папка, там на сайте объясняется
Спасибо!
А как плагины подключать я в курсе :) у меня в разделе о нас уже моя первая запись )))
Звучит очень прикольно :) Удачи!!
спасибо )) и вам успехов ))
Подкастеры, придумайте мобильную версию под-трансляций!
Что Вы имеете ввиду?
Полезная статья! Молодца!
Спасибо :)
офигенно полезно.
я-то раньше только Normalize делал. А теперь красота! Еще один шаг к хорошему звуку.
Спасибище!
Пожалуйста, коллега! :)