Как сделать компрессию голоса

Обновлено: 05.07.2024

Про компрессию вокала в лайве.

Если имеется два пульта, FOH и MON, всё просто – в мониторном пульте на ячейке артиста компрессора нет, а на FOH-пульте – есть. Но два пульта – это не всегда, это редко, а за МКАДом – почти никогда. К тому же, артист бывает прав – чаще всего компрессор ценой 200-300 долларов за канал только портит звук. И пусть Вы в райдере заказали 1176, всё равно прокатчики поставят то, что у них есть – 166XL. Пульт у Вас один, не подключать компрессор нельзя – вокал будет или торчать, как гвоздь, или будет неразличим за дремучей аранжировкой. Подключать компрессор тоже нельзя – артист услышит и заставит убрать – он же главный! Дилеммочка!

Преимущество такого подхода не только в том, что он позволяет тактично преодолеть патологический страх артистов перед компрессией их несравненного голоса, но и в расширении Ваших творческих возможностей. Микшируя сигналы этих двух ячеек, Вы получаете вокал, сохраняющий ясность и динамику некомпрессированного голоса и плотность компрессированного. Вы можете безбоязненно поставить ratio хоть 8:1, смело экспериментировать с атакой и релизом, и ещё Вы имеете отдельную эквализацию и aux-посылы на каждом канале. И даже недорогой прибор при таком способе подключения не испортит впечатления слушателей.

Базовая обработка голоса при и после записи. Динамическая компрессия.

Первичная обработка голоса в процессе записи.

УЗНАЙТЕ, КАК ЗАКАЗАТЬ ГОЛОС ДИКТОРА ДЛЯ ЛЮБОГО ПРОЕКТА!

Программная обработка голоса и специализированные плагины.

Динамическая компрессия звука (Dynamic Compression) – это процесс сжатия диапазона сигнала звукового файла. Другими словами, это выравнивание громких и тихих фрагментов нашей аудиозаписи в соответствии с заданными параметрами. Ни один записанный файл не обходится без этого процесса! Т.е. программная обработка голоса не заканчивается только на этом, но компрессор - это основа основ и мы в нее углубимся!

Настройки компрессора. Стандартные параметры динамической компрессии.

Основные настройки компрессора

– Threshold. Это порог срабатывания компрессора. Он выражается в децибелах и определяет тот максимальный уровень сигнала, на котором начинает срабатывать компрессор и его понижать.

– Ratio. Степень сжатия сигнала. Т.е. соотношение компрессии сигнала с максимально допустимым порогом.

- Attack. Это время отработки компрессора. Выражается в миллисекундах и устанавливает время от момента превышения порогового сигнала и моментом достижения заданного соотношения Ratio.

- Release. Этот параметр указывает время в миллисекундах, когда сигнал упал до допустимого порога и моментом, когда компрессор перестал его понижать.

Настройки компрессора для голоса.

Повторимся, что не существует универсальных настроек, а есть всего лишь базовые настройки компрессора для голоса, от которых можно отталкиваться. Дикторы же, настраивая свою аппаратуру, руководствуются характеристиками собственного голоса и их настройки могут "в корне" отличаться друг от друга. А большинство плагинов-компрессоров выставляют усредненные настройки для обработки голоса. Мы же можем предложить следующие параметры.

Attack time = 0.3 ms
Release time = 40ms
Threshold = -3 dB
Ratio = 4:1

- Если же у Вас график с незначительными скачками, то начнем компрессию голоса вот так:

Attack time = 0.3 ms
Release time = 50ms
Threshold = -8 dB
Ratio = 2:1

Что же, с базовой обработкой голоса мы немного разобрались. Далее можно переходить к следующему шагу – обработке голоса эффектами. Но эффекты для голоса, это очень обширная тема и мы, пожалуй, выделим ей полноценную статью. Не хочется говорить о таких серьезных вещах вскользь, т.к. это на самом деле очень интересный процесс и есть очень много отличных эффектов, которые применимы для разных целей.

Создание видеороликов, трансляция подкастов и стримов — все это становится популярнее с каждым годом. Растущая конкуренция выдвигает больше требований к качеству контента, особенно к технической части — мало кто будет терпеть хрипящий звук и едва различимую речь, которую заглушает фоновая музыка. В этой статье рассматриваются базовые методы обработки голоса, которые помогут сделать его сопоставимым по качеству с речью профессионального диктора или радиоведущего.

Общие советы

Идеально, если речь записана в акустически обработанной комнате. Если таковой нет, можно обойтись акустическим экраном для микрофона. Расстояние до микрофона индивидуально и зависит от громкости голоса, экспрессии и динамики. Главное, чтобы не было перегрузов или откровенно тихого сигнала. Оптимальное значение — от -18 до -12 дБ.

На микрофоне обязательно должна быть либо ветрозащита, либо поп-фильтр. Взрывные согласные сложно поддаются компьютерной обработке, так что лучше приобрести недорогой аксессуар, который избавит от большинства проблем с ними.

Набор неплохих бесплатных плагинов от DAW Reaper можно скачать с официального сайта — там есть все необходимое. Для тех, кто всерьез увлечется звукорежиссурой, можно посоветовать более продвинутые пакеты плагинов от Waves, Fabfilter, Softube — их существует множество на любой вкус.

Обработку стоит выполнять на студийных мониторах или в наушниках студийного уровня. Без качественного контроля будет сложно разобрать, что вообще происходит с аудиосигналом.

Обрабатываем звук для оффлайн-видео

Итак, голос записан, и теперь нужно его обработать.

Следующий шаг — шумоподавление. Нужно найти участок записи без какого-либо сигнала, чтобы на нем присутствовал только шум цепи звукозаписи. Если уровень шума ниже 50 дБ (как на скриншоте выше) — можно смело махнуть на него рукой и не делать ничего, такой шум никто не услышит. Если шум явно заметен, можно использовать специальные плагины (например, reafir от Reaper или denoiser в Cubase) для его удаления, либо подрезать эквалайзером пару самых шумных частот — точно так же, как будут удалятся резонансы в следующем пункте.

Фильтрация и удаление резонансов. Бывает, что низкий мужской голос начинает неприятно бубнить в районе 100–200 Гц, либо высокий женский тембр в сочетании с не самым лучшим микрофоном неприятно режет по ушам. Так и проявляются резонансы. Избавиться от них просто: нужно поставить в цепь обработки эквалайзер и узкой полосой с большим усилением (10–30 дБ) “пройтись” по всему частотному спектру, вычисляя самые неприятные места с режущим ухо свистом, звоном или гудением. Их необходимо ослабить узкой полосой на 3–5 дБ. Главное здесь не перестараться — удаления всего двух-трех основных резонансов обычно хватает для дикторского голоса.

Поиск и подрезание резонанса

Помимо этого, можно вовсе удалить целые куски спектра, в которых нет никакого полезного сигнала. Это делается с помощью low-pass и hi-pass фильтров, которые обрезают высокие и низкие частоты соответственно.

Чаще всего проблемы встречаются в следующих областях:

● Ниже 75–100 Гц — здесь находится, в основном, низкочастотный бубнящий шум. Можно смело применить hi-pass фильтр и обрезать все до этих значений.

● 100–150 Гц — тут нередко находятся гудящие частоты, особенно это касается мужского вокала, записанного в небольшой комнате. Можно подрезать их узкой полосой.

● Выше 16 кГц — в человеческой речи редко присутствует что-то полезное выше этой частоты, так что можно смело применять low-pass фильтр.

Так выглядит эквалайзер после вырезания резонансов и ненужных частот

Добавление недостающих частот. Теперь, когда остался только полезный сигнал, нужно сделать его четче и ярче. В качестве отправной точки будут полезны следующие данные:

● 180–240 Гц — прибавление 3–5 дБ широкой полосой в этой области сделает мужскую речь более полной и читаемой. Для женской речи это будет 200–300 Гц.

● 1.5–2 — 5 кГц — это самый важный диапазон для голоса, так называемая область разборчивости. Человеческий слух наиболее чувствителен именно к этим частотам, стоит прибавить их широкой полосой на 3–8 дБ.

● 9–11 кГц — эти частоты отвечают за яркость голоса. Их очень часто не хватает в речи, записанной даже на студийный микрофон, особенно в заглушенной комнате, которая с аппетитом пожирает верха вокала. Нередко приходится значительно прибавлять этот диапазон — на 6–12 дБ, чтобы придать речи ясности. Но нужно следить за шипящими согласными.

При эквализации низких частот лучше использовать узкие полосы, а при высоких — широкие, это сделает работу эквалайзера менее заметной.

Компрессия. Компрессором убирается разница между громкими и тихими участками записи. В итоге голос будет звучать равномерно, от хлопков и кашля слушатель не будет вздрагивать, а при шепоте ему не придется прибавлять громкость. Понять работу компрессора поможет аналогия с громкой музыкой в комнате, которая не нравится соседу за стенкой. Параметр threshold будет тем критическим уровнем громкости музыки, при превышении которого сосед начинает тарабанить по батарее монтировкой; attack — как быстро он бежит к батарее при превышении этого уровня; ratio — насколько нужно убавить громкость, чтобы успокоить соседа; а release — как долго сосед перестает возмущаться после убавления громкости. Сосед-компрессор заставляет несчастного меломана держать уровень громкости музыки в определенных пределах. Начать настройку можно со следующих значений:

● Ratio: 4:1 (таким образом, если сигнал превышает порог на 4 дБ, то он скомпрессируется до 1 дБ выше порога)

● Attack: как правило, для голоса хорошо работает быстрая атака в районе 5–10 мс, она позволяет компрессору срабатывать мгновенно. Если при этом компрессия начинает съедать согласные — атаку нужно увеличить.

● Release: если в компрессоре есть функция авторелиз, можно ей и воспользоваться. Если нет — начать стоит с 40–50 мс.

● Output или make-up: если в компрессоре есть функция автомейкапа, можно применить ее. В противном случае компенсацию громкости можно выполнить вручную на слух — главное, чтобы итоговый сигнал не попадал в красную зону.

● Threshold: здесь нужно смотреть по уровню громкости исходного трека. Начать можно с -8 дБ.

Лимитеринг. Это операция позволяет ограничить максимальный уровень громкости. Сигнал на мастер-шине не должен зашкаливать, и лимитер выступает в роли очень жесткого компрессора, который не позволяет сигналу выбраться за пределы установленного значения. Как правило, среднее арифметическое уровня сигнала (RMS) должно быть около -16 дБ. При рендере на мастер-шине нужно выставить уровень -0.5 дБ, потому что финальная конвертация аудио может сделать звук громче и добавить искажений. При отсутствии лимитера его роль может сыграть компрессор: достаточно выставить ratio на максимум, threshold на -0.5 дБ, и атаку на минимум.

Лимитер и компрессор в роли лимитера

Если фоновая музыка в видео заглушает речь, нужно выставить RMS музыки и RMS голоса одинаковыми, после чего убавить музыку на 5–10 дБ. Если в некоторых местах слова все еще неразборчивы, можно применить к музыкальной подложке эквализацию. Достаточно посмотреть на эквалайзер для речи и сделать все наоборот в эквалайзере для музыки: например, если в речи 5 кГц приподнято широкой полосой, то в музыке эти же 5 кГц нужно убавить.

Обрабатываем звук в онлайне

У стримов и подкастов есть своя специфика при обработке голоса — здесь важно, чтобы плагины не были ресурсоемкими и не сильно грузили компьютер. Поэтому стоит использовать минимально необходимый набор эффектов.

Чаще всего для стримов используется программа OBS Studio. В ней можно загружать точно те же VST-плагины для обработки звука, что и в DAW. Если используется не OBS Studio, то для обработки голоса можно воспользоваться отдельной программой для потоковой обработки звука VSTHost, она работает с любыми приложениями для стримов.

Так выглядит плагин ReaFIR в OBS Studio

Для обработки голоса потребуется необходимый минимум:

1. Шумоподавление. В отличие от оффлайн-видео, звук к которым нередко записывается отдельно на качественный микрофон, в стримах часто используется не самое лучшее оборудование. Недорогой микрофон вкупе со встроенной звуковой картой и включенной функцией Microphone Boost в настройках звука Windows будут сильно шуметь. Для того, чтобы избавиться от этого шума, можно использовать встроенный в OBS фильтр Noise Suppression. У него всего одна настройка — уровень шумоподавления, начать стоит со значения около -20 дБ.

2. Гейт. Если в звуке для оффлайн-видео можно вручную вырезать все крики детей за окном и рев соседского перфоратора за стеной, то с онлайном такой фокус не провернуть. Понадобится гейт.

● Release можно сделать длинным, около 200 мс, поскольку работа гейта будет слишком слышна при быстром релизе. Правильно настроенный гейт почти незаметен для слушателя и удаляет лишь шумы и призвуки в паузах между фразами.

● Уровень гейта нужно сделать чуть выше, чем фоновый шум, не стоит выставлять уровень рядом с уровнем голоса.

● Простой способ настройки гейта для речи — нужно сложить губы трубочкой и шумно выдохнуть воздух в сторону от микрофона, запомнить на индикаторе значение уровня этого шума и выставить его на гейте.

4. Компрессор. Для стримов он имеет даже большее значение, чем для оффлайн-видео — в онлайне ни один диктор не сможет уследить за динамикой своего голоса на протяжении нескольких часов. Следует быть готовым к тому, что речь будет то едва слышной, то слишком громкой. Поэтому нужно использовать более жесткие настройки компрессора, чем для оффлайн-видео. Начать можно с ratio 10:1, атаки 5 мс и релиза в 30 мс или автоматически.

При подобных настройках нет необходимости в лимитере — компрессор будет выполнять его роль. Но если динамика речи очень большая и не позволяет настроить гейт (то слова начинают обрезаться, то шум просачивается в эфир), тогда можно использовать два компрессора: первый, с более мягкими настройками (ratio 3:1) поставить перед гейтом, второй, в качестве лимитера — в конце цепи (ratio выкрутить на максимум, threshold — так, чтобы компрессор срабатывал только при очень громких фразах).

Дайте послушать результаты!

Разобраться в обработке звука по тексту бывает непросто, но результат того стоит. Смотрите сами. Точнее, слушайте.

Качественный звук в современных видео и стримах значит ничуть не меньше, чем видео в высоком разрешении. А порой и больше — ведь многие ставят ролики на фон, смотря их вполглаза и воспринимая происходящее в основном на слух.

При этом стоит учесть, что данное руководство дает лишь базовые настройки в качестве точки отсчета. Конечный результат должен подбираться аудиально, ведь главный инструмент в работе звукорежиссера — это его собственные уши.

Paulina Steel,

sound designer.

Что касается динамической обработки вокала, здесь речь пойдет о работе со значительно меньшими величинами, нежели те, что обозначаются в классической музыке, отчего имеющий дело с этой обработкой должен проявить незаурядную скрупулёзность. Итак, как уже было сказано выше, речь пойдет о громкостях, исходя из этого показательно, что основной параметр приборов динамической обработки выражен в следующих единицах - Дб. Какими же приборами можно воспользоваться для динамической обработки акапеллы?

Разберем, что в отношении вокала может дать нам каждый из них.

Gate ограничивает сигнал в зависимости от уровня входного сигнала. В нем есть некая пороговая величина (threshold), которую звукорежиссер выставляет сам и которая выражена в Дб. Все, что тише этой величины не будет пропускаться гейтом, проще говоря - обрежется.

На вокале гейт используется не слишком часто, больше в случаях, связанных с реставрацией. Работа его достаточно грубая, сильно заметна на таком нежном инструменте как вокал, поэтому рекомендуем включать в цепь гейт лишь в крайних случаях и с особой осторожностью.

Для чего же он нам может пригодиться? В случае если вокал записан в не очень профессиональных условиях и мы отчетливо слышим между словами фоновые и посторонние шумы и в случае, если вокалист имеет дурные привычки чавкать, причмокивать и громко дышать между словами. В гейте можно выставить порог таким образом, что все звуки более тихие, чем основной сигнал, не будут пропускаться. В нашем случае основной сигнал - это вокал, он самый громкий, все остальное-значительно тише, хотя, разумеется, тут все зависит от исполнителя. Стоит обратить внимание, что гейт может обрезать слишком грубо, в таком случае следует попробовать изменить в сторону увеличения показатель release (время восстановления сигнала). Также обязательно нужно послушать обработанную гейтом акапеллу от начала до конца и без музыки. Следует иметь в виду, что человек по своей природе начинает и заканчивает слова тише, чем произносит их по середине, то же с началом и концом фраз, а значит гейт при неаккуратно выставленном пороге может срезать у вокалиста все окончания слов. В случае с громким дыханием человека использование гейта может оставлять за собой нежелательные рудименты.

De-Esser. Из названия ясно, что прибор этот работает на устранение излишков в шипящих и свистящих звуках. По сути это полосовой компрессор, работающий начиная от частоты 2k. У каждого человека своя диктиция и особенности речевого аппарата, которые могут быть наиболее заметны в сфере произношения шипящих. Плюс существует множество 'верхастых' микрофонов, которые особенно чувствительны в той же сфере. Все это в купе может давать удручающие последствия в сфере звуков 'с','ш','щ','ч'. Порой сначала этих последствий может быть не слышно, но после использования эквалайзера и компрессора, они становятся очень явными.

Чаще всего в цифровых ди-эссерах есть пресеты типа Male vocal или Female vocal. В большинстве случаев они нуждаются в корректировке частоты, на которой он работает, порога срабатывания и ширины полосы. Также следует помнить о неповторимости дикции каждого человека, поэтому настройки ди-эссера в каждом случае индивидуальны.

Зачастую де-эссер как средство сглаживания шипящих вообще не используется, особенно в современной западной музыке. Такой подход также имеет право на жизнь и зависит от вкуса и слуха звукорежиссера.

Де-эссер может также использоваться для смягчения тембра голоса в диапазоне частот от 2k до 4k. У людей, обладающих резким тембром или не слишком профессиональных вокалистов при громком пении и речи зачастую заметен явный подъем в этом диапазоне так называемой второй форманты. В случае, если звукорежиссер решит сгладить его с помощью эквалайзера, это повлияет на весь сигнал, даже в тех местах, где это не нужно. В то время как ди-эссер позволяет смягчить именно те участки акапеллы, которые в этом нуждаются, за счет правильного подбора уровня порога.

Неумелой работой с этим прибором можно случайно сделать вокалиста шипилявым или чересчур глухим. Поэтому следует кропотливо подбирать глубину порога, а также аккуратно относиться к степени сжатия.

В цепи гейт и ди-эссер ставятся, как правило, в разрыв до эквалайзера и компрессора соответственно.

Compressor. Обычно ставится в разрыве цепи после эквалайзера, но существует множество точек зрения по этому поводу, и полемику в этом вопросе можно считать незавершенной.

Компрессор, как средство сжатия динамического диапазона как бы усредняет громкость акапеллы, приводя ее приблизительно к одному уровню. Этот уровень и есть порог (threshold) компрессора, который должен верно подобрать звукорежиссер. Если пороговая величина слишком высока, то вокал вообще не будет скомпрессирован, а если она слишком глубока, то будет наоборот пережиматься, что повлечет за собой эффекты перегруза на сигнале.

Если в композиции разные части спеты или прочитаны достаточно отличающимися уровнями и это входит в общую музыкальную концепцию песни, то следует разделить все более тихие и более громкие части по отдельным дорожкам и обрабатывать их соответственно различными компрессорами со своими уровнями порога, а возможно, вообще с различными настройками.

Есть несколько наиболее распространенных подходов к компрессии вокала:

- сильная и заметная компрессия

При естественной компрессии вокальная партия сохраняет свой характер. Работа компрессора в этом случае практически незаметна и служит своей прямой цели - сглаживанию пиков. Если стоит задача оставить вокалиста как можно более 'живым' и воздушным, то в компрессоре используется очень быстрая атака и очень быстрый релиз, при этом пороговая величина очень высока. В случае если эта величина будет чрезмерно занижена, то голос будет больше ужиматься, в голосе возникнет носовой призвук.

Сильная и заметная компрессия служит для изменения характера партии. Например, если вокал или речь вялые, неубедительные, с помощью средней атаки, довольно глубокого порога и степени сжатия компрессора можно сделать их более акцентированными и экспрессивными. Если сделать значения атаки, релиза прибора слишком большими, а порог достаточно занизить , то можно случайно сместить ударения в словах.

Бывает и такое, что на одной вокальной дорожке используется два компрессора: первый - для выделения акцентов, второй - для общего выравнивания партии или наоборот (последовательная компрессия).

Возможные манипуляции с приборами динамической обработки имеют широкое поле для творчества звукорежиссера. Работа динамических приборов, а особенно компрессора очень тонка и неопытному человеку может быть неслышна. В связи с этим главным в подходе к компрессии также как и в других видах обработки является главная заповедь звукорежиссера - не навредить.

Читайте также: