Как сделать искажение звука

Добавил пользователь Алексей Ф.
Обновлено: 04.10.2024

Традиционно слово “искажение” имеет негативную окраску в кругах аудиофилов. Обычно стремятся иметь усилитель низкой частоты с очень маленькими нелинейными и частотными искажениями. Обычные требования к звукозаписывающей и звуковоспроизводящей аппаратуре - нелинейные искажения меньше 0.01% и линейная (без выбросов и провалов, т.е. без искажений) частотная характеристика.

О т табличных синтезаторов звука обычно также требуется чистое неискажённое звучание. Однако при студийной обработке звука искажения всё же применяются в устройствах типа “Aural Exciter” производства фирмы Aphex. Но пожалуй единственная область музыкальной индустрии, где без искажений звука обойтись невозможно это электрогитара и всё что с ней связано. Поэтому в этой статье основное внимание будет уделено устройствам обработки сигналов электрогитары, использующим различным формам нелинейных и амплитудно-частотных искажений, но и принцип действия устройств подобных “Aural Exciter” также будет освещён. Понятие хорошего гитарного звука (“good guitar tone”) неразрывно связано с “правильными” нелинейными, частотными и другими искажениями, которым подвергается сигнал электрогитары гитары проходя через специальные гитарные предусилители, фуз(fuzz), овердрайв(overdriver), cустэйн (sustain), дистошн(distortion), гранж (grunge) фильтры, усилители мощности низкой частоты и “гитарные” (отнюдь не Hi-Fi) звуковые колонки. Причём, действительно хорошего гитарного звука обычно пытаются добиться используя в той или иной мере все эти компоненты, образующие все вместе как бы “устройство” или “цепочку” обработки (искажения) сигнала электрогитары. Многие фирмы предпринимают попытки реализовать алгоритмы искажений методами цифровой обработки сигналов (DSP) и объединить все искажающие элементы в единое (однокорпусное) устройство - гитарный процессор, добавляя в него также эффекты реверберации, хоруса, гармонайзера и компрессора, в той или иной мере изменяющие (искажающие) параметры входного сигнала. Одно из таких устройств вы можете видеть на Рис.1.

Рис.1. Типичный гитарный процессор.

Рис.2. Ламповый усилитель.

Для начала включим ламповый усилитель и гитарный процессор в режим “clean tube” или “чистый ламповый звук” и подадим на вход синусоидальный сигнал (Рис.3.) частотой 440 Гц.

Рис.3. Тестовый синусоидальный сигнал.

На выходе этих устройств мы увидим очень похожие сигналы, примерно такие как показан на Рис.4.

Рис.4. Форма выходного сигнала в режиме “чистый ламповый звук”

Очевидно, что исходный синусоидальный сигнал подвергся значительным нелинейным искажениям. Их уровень составляет примерно 9..10%, что очень далеко от типичных значений (0.01% и менее) для обычных, негитарных усилителей. Характерна также сильная асимметрия выходного сигнала, необходимая для обогащения его спектра чётными гармониками. В случае отсутствия чётных гармоник звук приобретает неестественный синтезаторный, плоский, “бедный”, “примитивный” оттенок. Спектр синусоидального сигнала, искаженного ламповым (или имитирующим его) предусилителем показан на Рис.5.

Рис.5. Спектр синусоидального сигнала, искаженного ламповым (или имитирующим его) предусилителем.

Хорошо видно (Рис.5.), что спектр сигнала после гитарного предусилителя значительно обогащён как чётными так и не чётными гармониками. Амплитуды гармоник достаточно быстро спадают начиная с -18 дБ для второй гармоники и до -72 дБ для 18 гармоники. Амплитудно-частотная характеристика, типичная для гитарных предусилителей, показана на Рис.6.

Рис.6. Амплитудно-частотная характеристика, типичная для гитарных предусилителей в режиме “чистый ламповый звук”.

Таким образом типичные “правильные” или “ламповые” нелинейные искажения на стадии предварительного усиления сигнала должны генерировать как чётные так и нечётные гармоники исходного сигнала с достаточно быстрым спадом их амплитуд в зависимости от номера гармоник. А типичные искажения амплитудно-частотной характеристики (АЧХ) вносимые на стадии предварительного усиления сигнала заключаются в небольшом подъёме усиления ( +6 дБ) в диапазоне частот 3..8 кГц и резком спаде АЧХ начиная с 16..18 кГц до -46 дБ в районе 22 кГц.

Фуз (fuzz), сустэйн (sustain), овердрайв (overdriver) и дисторшн (distortion) очень популярные звуковые эффекты, базирующиеся на использовании нелинейных и амплитудно-частотных искажениях. Это довольно схемотехнически несложные устройства, которые может самостоятельно изготовить любой даже начинающий радиолюбитель. Построены все эти устройства примерно на одних принципах. На Рис.7 приведена схема очень популярного в своё время (десять лет назад) овердрайва, скаченная из Интернета.

Рис.7. Типичная схема овердрайва, фуза или дисторшна.

Рис.8. Типичный график спектра гармоник на выходе фуза, дисторшн или овердрайва при подаче на вход синусоидального сигнала.

Таким образом общая логика работы исказителей сигнала типа фуз, дистошн, сустайн и овердрайв заключается в предварительном ослаблении самых низких частот (ниже 100..200 Гц) в спектре входного сигнала, в усилении сигнала в десятки (иногда в сотни) раз с одновременным искажением АЧХ в области средних частот (значительный “подъём” в области 3..6 кГц) и последующим двухсторонним симметричным ограничением сигнала и, наконец, окончательной отфильтровкой (ослаблением) высокочастотной части (выше 3..10 кГц) в спектре сигнала. На рис 9. показана типичная АЧХ устройства типа сустэйна. Аналогичная картина АЧХ наблюдается и для фуз, дисторшн и овердрайв.

Рис.9. Типичная АЧХ искажающих устройств типа фуз, дисторшн, овердрайв и сустайн.

Всем привет! Нормализация звука не проблема для того, кто умеет пользоваться Audacity даже на самом начальном уровне.

Начнем с определения.

Нормализовать звук — это, по простому говоря, так обработать его в аудиоредакторе, чтобы было приятно слушать, а именно:

убрать фоновые шумы,
выровнять громкость речи на протяжении всей звуковой дорожки,
убрать резкие выбросы/пики громкости,
убрать нежелательные звуки (кашель, например),
сделать громкость записи такой, чтобы ее можно было комфортно слушать на всех типах компьютеров и мобильных устройств, выставляя громкость устройства на средний уровень.

Профессионалы пользуются для этого звуковыми редакторами. Берут отдельно аудиодорожку и правят ее. В этом посте я научу вас, как пользоваться Audacity для нормализации звука.

Почему именно Audacity? Потому, что это:

Специализированная программа – аудиоредактор звуковых файлов.
Достаточно мощная для того, чтобы сделать со звуком что угодно.
Бесплатная.
Достаточно простая в освоении. Особенно когда дело касается стандартных не сложных операций со звуком.

Ну, давайте начнем.

Из этой статьи вы узнаете:

Для того, чтобы все было максимально приближенно к реальной жизни и понятно, возьмем видеозапись, сделанную на самый обычный смартфон – htc one v. Видео он снимает разрешением HD. На сегодня это уже не нечто запредельное, а стандарт. Звук захватывает как смартфон – если близко, то хорошо, если на расстоянии, то уже посредственно.
Итак, наша самая первая задача:

Как извлечь звук из видео в отдельный звуковой файл

Способов — масса. Чтобы не загромождать пост второстепенными подробностями, вкратце расскажу всего про три. Выберете удобный для себя.

Посредством бесплатной программы Freemake Video Converter
Посредством платной программы Total Video Converter
Посредством имеющего у вас видеоредактора. А иметься он у вас должен. Особенно если весь или часть вашего бизнеса — в интернете. Особенно если вы регулярно снимаете и выкладываете видео на ваш сайт. Конечно если вы хотите выкладывать хорошее видео, чтобы его смотрели много людей.

Первые два пункта подробно объяснять не стоит. Там все совершенно несложно, но если будут проблемы – пишите, объясню.

Вот на видеоредакторе остановлюсь поподробнее. В смысле как извлечь звук из видео с его помощью. Видеоредакторов тоже очень много. Я пользуюсь одним из самых популярных – Sony Vegas.

Копируем отснятое видео из смартфона на компьютер.

Через меню Файл – Открыть открываем видеофайл.

Теперь кликаем по кнопке Просчитать как.

и выбираем формат сохраняемого файла mp3. Нажимаем на Custom…

и выбираем параметры сохранения. Рекомендую выбрать Моно, битрейт 128 kbps и частоту 44 100 Hz.

Выбираем папку сохранения и желаемое имя сохраняемого mp3 файла.

Все аудиодорожку мы отдельно сохранили и теперь начнем нормализовать звук. Я распишу все пошагово.

Шаг 1. Первичное применение плагина Hard Limiter

На записанном звуке могут оказаться пики-выбросы по громкости. Если их не уменьшить, то они здорово раздражают или могут даже оглушать. Это может быть и кашель, и внезапно громко передвинутый стул, сигнал рядом проезжающей машины и так далее. Поэтому:

Кликаем по области управления свойствами дорожки левой кнопкой мышки и тем самым выделяем всю дорожку

Затем идем в меню Эффекты-Hard Limiter… и ставим вот такие параметры

Кликаем ОК. Готово.

Шаг 2. Нормализация звука

Обычно запись с микрофонов, смартфонов, диктофонов получается тихой для того, чтобы ее прямо вот в таком виде выложить в виде видео на ютюбе. Значит нам нужно поднять громкость звука. Но желательно сделать это так, чтобы звук был поднялся, но не выше заданного предела. Для этого применяется плагин Нормировка сигнала. Он увеличивает громкость, но так, что максимальная амплитуда – фиксированная. Для этого идем в меню Эффекты-Нормировка сигнала… Ставим в окошке -3.0 db.

Жмем ОК. Смотрим результат.

Шаг 3. Обработка аудиофайла плагином Компрессор…

Продолжаем пользоваться Audacity для нормализации звука и на этом шаге освоим плагин Компрессор… Обращаю ваше внимание, что обрабатывать дорожку нужно именно в таком порядке пошагово, не путая и не перескакивая. Для чего нужен Компрессор…? Компрессор усредняет, уменьшает разницу между самыми тихими и самыми громкими участками. Бывает, человек говорит в микрофон то громче, то тише и при слишком большой разнице слушать такую запись некомфортно. После обработки компрессором, громкость голоса становится более ровной, без скачков.

Итак идем в Эффекты-Компрессор… Ставим вот такие же параметры

и жмем ОК. Радуемся результату.

Шаг 4. Финишная обработка плагином Hard Limiter…

Как бы хорошо ни обрабатывал звук Компрессор, у его алгоритма тоже есть недостатки и при определенных условиях он снова выделяет пики. Чтобы избежать этого, еще раз обработайте дорожку плагином Hard Limiter…, только ставьте уровень не -10, как в первый раз, а -2.0 db.

Вот вобщем и всё. В большинстве случаев этих 4 шагов достаточно. Теперь рассмотрим более сложные случаи, а именно:

если предыдущие плагины – Нормировка сигнала… и Компрессор… — не совсем хорошо справились с нормализацией громкости по всей длине аудиодорожки
и если запись шла при высоком уровне фоновых шумов – рядом работал холодильник, шумел вентилятор, какое-нибудь гудение и тому подобное.

Ручное выравнивание громкости отдельных участков аудиодорожки

Итак, выделяем ту часть звуковой дорожки, где уровень сигнала явно ниже. Идем в меню Эффекты-Усиление сигнала… и подбором уровня усиления добиваемся выравнивания фрагментов аудиодорожки по громкости. Посмотрите на видео, как это происходит.

Как убрать шум из записи

Для этого визуально выбираем на диаграмме участок с нулевой или около того амплитудой и выделяем его мышью. Кликаем на кнопку Play в панели кнопок Audacity и внимательно слушаем. Если на фоновом шуме есть другие единичные звуки, то стараемся найти и выделить фрагмент без них.

Найдя наилучший фрагмент, выделяем его. Идем в меню Эффекты-Удаление шума-Создать модель шума.

Затем выделяем всю дорожку. Идем в меню Эффекты-Удаление шума. Оставляем вот эти параметры

Единственный параметр, с которым можно поэкспериментировать, это Подавление шума. Самое первое поле. Советую оставаться в пределах 12-24 db. Если сделать ниже 12, то шум может снизиться совсем незначительно. Если сделать выше 24, то могут появиться искажения на оставшихся участках со звуком.
Смотрим видео, где я все это делаю:

Вот и всё. Аудиодорожка нормализована, осталось сохранить ее в виде файла.

Сохранение обработанной Audacity дорожки в отдельный аудиофайл

Делается это через меню Файл-Экспортировать… Обращаю ваше внимание, что через меню Файл-Сохранить проект… вы сохраните аудиозапись именно в формате Audacity и только. Для того, чтобы сохранить в формате mp3 или wav нужно пользоваться именно Экспортировать… Далее все просто. Выбираете желаемый тип файла. Если необходимо – кликаете Параметры… и задаете нужные параметры. Например, если вы делаете экспорт в mp3, то вы сможете выбрать через Параметры качество звука. Рекомендую не делать его ниже 80 кбит/с и выше 128 кбит/с. Это для голоса, конечно. Если вы писали музыку и вам необходимо максимальное качество звучание, то можете поставить даже 320 кбит/с. Имейте только в виду, что чем выше битрейд (это качество звука), тем большего размера будет получаться итоговый файл.

Итак, из этого поста вы узнали как пользоваться Audacity в части нормализации звука.

Дополнено в декабре 2018 г. — Эта статья написана в 2014 году. За прошедшие 5 лет, к концу 2018го, накопился опыт, выявились тонкости и приемы, которые:

Эффект дисторшн, как компонент, присутствует в синтезаторах, эффект-процессорах и компьютерных программах для обработки звука.

Содержание

Принцип действия

Описанным способом можно добиться искажения лишь на больших громкостях. Чтобы получить тихий искажённый сигнал необходимо применять специальные искажающие каскады, передаточная характеристика которых имеет значительную нелинейность в широком диапазане амплитуд сигналов.

После ограничительного каскада уже искаженный звук поступает в цепь вторичной обработки сигнала. Вторичная обработка — это, главным образом, частотная обработка искаженного сигнала, которую выполняют различные фильтры. Одним из наиболее известных аналоговых эмуляторов перегруза считается устройство SansAmp [8] .

Первые попытки реализации дисторшн в полностью цифровом виде предпринимались еще в 90-х годах прошлого века. Например, первый российский простейший программный дисторшн GuitarFX [9] был выпущен в 1997 г. и работал под Windows 3.1 и Windows 95. GuitarFX v1.0 работал в реальном времени, имел программный ФВЧ, оригинальный динамический эмулятор дисторшн сложного, не клипового типа (навеянного аналоговыми патентами Fender), 8 полосный эквалайзер на БПФ и ФНЧ симулятор динамика. Все алгоритмы были реализованы в 16 битной оптимизированной целочисленной арифметике, работали на частоте дискретизации 22 кГц на процессоре Intel 486 и лучше [10] .

В то же время аппаратно-программные дисторшны Korg Pandora, Zoom, Line 6 и др. получили значительную популярность на рынках Америки и Европы. Прямое исследование алгоритмов цифровой обработки сигнала гитарного процессора Digitech 2000 выпуска 2000-го года показало, что уже в этом относительно старом устройстве не используется цифровое клипирование. При подаче на вход этого устройства синусоидального сигнала на выходе получался сложный сигнал со сложным спектральным составом как с четными так и нечетными гармониками и изменяющийся в зависимости от частоты и амплитуды входного сигнала [11] .

Характеристики звучания

Частотные характеристики

Также существует такое явление, как интермодуляция. Две одновременно звучащие ноты при искажении порождают еще один звук, определяемый разностью их частот. В случае двух нот этот звук находится в гармонии с двумя основными, но три ноты образуют три пары нот и порождают три вторичных звука, вносящих диссонанс. [4]

Временные характеристики

Длительность звучания искажённого сигнала можно разбить на несколько характерных частей. Начало сигнала называется атакой. Атака характеризуется определённым уровнем и частотным спектром сигнала. Так, у дисторшна атака фактически не выделяется (по уровню сигнала), в отличие от овердрайва, обладающего высоким уровнем атаки. [6] Частотный спектр дисторшна ровный, атака несколько богаче высокими гармониками по сравнению с фазой сустейна. [6] Сустейн — тянущаяся часть звука. Дисторшн имеет длинный сустейн, часто переходящий в самовозбуждение. [6] Конец сигнала следующего после сустейна называют затуханием. После затухания сигнала можно услышать уровень собственных шумов эффекта, гитары и кабеля, или сработает гейт. Уровень собственных шумов эффекта дисторшн, как правило, высок, из-за его высокой чувствительности.

Самовозбуждение сигнала

Акустическая обратная связь используется как прием гитарной игры, так как ею сравнительно легко управлять, и она имеет интересный тембр.

История

Ранние модели гитарных усилителей были примитивными и низкокачественными, соответственно они обладали врождённым искажением сигнала. К тому же звукосниматели гитар выдавали слабый и некачественный сигнал. Полые полуакустические гитары добавляли в звучание нежелательную обратную связь, которая чрезмерно усиливала басовые частоты. В начале 50-х получили распространение цельнокорпусные электрогитары, которые не страдали так сильно от обратной связи, как их предшественники, следовательно могли звучать громче. Ранние примеры дисторшн-звучания часто были результатами плохого усиления сигнала.

Влияние

Эффект дисторшн оказал большое влияние на современную технику игры на электрогитаре, сделав необходимым изучение таких приемов как palm muting (приглушение ладонью) и позволил року, исполнявшемуся в 1960-х годах, дать жизнь множеству разновидностей современного тяжелого метала. Также появилась необходимость подгонять технику игры для более читаемого звука. Поскольку при игре с перегрузом слишком сильно слышно как скрипят струны, различного рода удары по корпусу (деке) гитары. Появилась и более музыкальная, и продвинутая игра на соло.

Создание видеороликов, трансляция подкастов и стримов — все это становится популярнее с каждым годом. Растущая конкуренция выдвигает больше требований к качеству контента, особенно к технической части — мало кто будет терпеть хрипящий звук и едва различимую речь, которую заглушает фоновая музыка. В этой статье рассматриваются базовые методы обработки голоса, которые помогут сделать его сопоставимым по качеству с речью профессионального диктора или радиоведущего.

Общие советы

Идеально, если речь записана в акустически обработанной комнате. Если таковой нет, можно обойтись акустическим экраном для микрофона. Расстояние до микрофона индивидуально и зависит от громкости голоса, экспрессии и динамики. Главное, чтобы не было перегрузов или откровенно тихого сигнала. Оптимальное значение — от -18 до -12 дБ.

На микрофоне обязательно должна быть либо ветрозащита, либо поп-фильтр. Взрывные согласные сложно поддаются компьютерной обработке, так что лучше приобрести недорогой аксессуар, который избавит от большинства проблем с ними.

Набор неплохих бесплатных плагинов от DAW Reaper можно скачать с официального сайта — там есть все необходимое. Для тех, кто всерьез увлечется звукорежиссурой, можно посоветовать более продвинутые пакеты плагинов от Waves, Fabfilter, Softube — их существует множество на любой вкус.

Обработку стоит выполнять на студийных мониторах или в наушниках студийного уровня. Без качественного контроля будет сложно разобрать, что вообще происходит с аудиосигналом.

Обрабатываем звук для оффлайн-видео

Итак, голос записан, и теперь нужно его обработать.

Следующий шаг — шумоподавление. Нужно найти участок записи без какого-либо сигнала, чтобы на нем присутствовал только шум цепи звукозаписи. Если уровень шума ниже 50 дБ (как на скриншоте выше) — можно смело махнуть на него рукой и не делать ничего, такой шум никто не услышит. Если шум явно заметен, можно использовать специальные плагины (например, reafir от Reaper или denoiser в Cubase) для его удаления, либо подрезать эквалайзером пару самых шумных частот — точно так же, как будут удалятся резонансы в следующем пункте.

Фильтрация и удаление резонансов. Бывает, что низкий мужской голос начинает неприятно бубнить в районе 100–200 Гц, либо высокий женский тембр в сочетании с не самым лучшим микрофоном неприятно режет по ушам. Так и проявляются резонансы. Избавиться от них просто: нужно поставить в цепь обработки эквалайзер и узкой полосой с большим усилением (10–30 дБ) “пройтись” по всему частотному спектру, вычисляя самые неприятные места с режущим ухо свистом, звоном или гудением. Их необходимо ослабить узкой полосой на 3–5 дБ. Главное здесь не перестараться — удаления всего двух-трех основных резонансов обычно хватает для дикторского голоса.

Поиск и подрезание резонанса

Помимо этого, можно вовсе удалить целые куски спектра, в которых нет никакого полезного сигнала. Это делается с помощью low-pass и hi-pass фильтров, которые обрезают высокие и низкие частоты соответственно.

Чаще всего проблемы встречаются в следующих областях:

● Ниже 75–100 Гц — здесь находится, в основном, низкочастотный бубнящий шум. Можно смело применить hi-pass фильтр и обрезать все до этих значений.

● 100–150 Гц — тут нередко находятся гудящие частоты, особенно это касается мужского вокала, записанного в небольшой комнате. Можно подрезать их узкой полосой.

● Выше 16 кГц — в человеческой речи редко присутствует что-то полезное выше этой частоты, так что можно смело применять low-pass фильтр.

Так выглядит эквалайзер после вырезания резонансов и ненужных частот

Добавление недостающих частот. Теперь, когда остался только полезный сигнал, нужно сделать его четче и ярче. В качестве отправной точки будут полезны следующие данные:

● 180–240 Гц — прибавление 3–5 дБ широкой полосой в этой области сделает мужскую речь более полной и читаемой. Для женской речи это будет 200–300 Гц.

● 1.5–2 — 5 кГц — это самый важный диапазон для голоса, так называемая область разборчивости. Человеческий слух наиболее чувствителен именно к этим частотам, стоит прибавить их широкой полосой на 3–8 дБ.

● 9–11 кГц — эти частоты отвечают за яркость голоса. Их очень часто не хватает в речи, записанной даже на студийный микрофон, особенно в заглушенной комнате, которая с аппетитом пожирает верха вокала. Нередко приходится значительно прибавлять этот диапазон — на 6–12 дБ, чтобы придать речи ясности. Но нужно следить за шипящими согласными.

При эквализации низких частот лучше использовать узкие полосы, а при высоких — широкие, это сделает работу эквалайзера менее заметной.

Компрессия. Компрессором убирается разница между громкими и тихими участками записи. В итоге голос будет звучать равномерно, от хлопков и кашля слушатель не будет вздрагивать, а при шепоте ему не придется прибавлять громкость. Понять работу компрессора поможет аналогия с громкой музыкой в комнате, которая не нравится соседу за стенкой. Параметр threshold будет тем критическим уровнем громкости музыки, при превышении которого сосед начинает тарабанить по батарее монтировкой; attack — как быстро он бежит к батарее при превышении этого уровня; ratio — насколько нужно убавить громкость, чтобы успокоить соседа; а release — как долго сосед перестает возмущаться после убавления громкости. Сосед-компрессор заставляет несчастного меломана держать уровень громкости музыки в определенных пределах. Начать настройку можно со следующих значений:

● Ratio: 4:1 (таким образом, если сигнал превышает порог на 4 дБ, то он скомпрессируется до 1 дБ выше порога)

● Attack: как правило, для голоса хорошо работает быстрая атака в районе 5–10 мс, она позволяет компрессору срабатывать мгновенно. Если при этом компрессия начинает съедать согласные — атаку нужно увеличить.

● Release: если в компрессоре есть функция авторелиз, можно ей и воспользоваться. Если нет — начать стоит с 40–50 мс.

● Output или make-up: если в компрессоре есть функция автомейкапа, можно применить ее. В противном случае компенсацию громкости можно выполнить вручную на слух — главное, чтобы итоговый сигнал не попадал в красную зону.

● Threshold: здесь нужно смотреть по уровню громкости исходного трека. Начать можно с -8 дБ.

Лимитеринг. Это операция позволяет ограничить максимальный уровень громкости. Сигнал на мастер-шине не должен зашкаливать, и лимитер выступает в роли очень жесткого компрессора, который не позволяет сигналу выбраться за пределы установленного значения. Как правило, среднее арифметическое уровня сигнала (RMS) должно быть около -16 дБ. При рендере на мастер-шине нужно выставить уровень -0.5 дБ, потому что финальная конвертация аудио может сделать звук громче и добавить искажений. При отсутствии лимитера его роль может сыграть компрессор: достаточно выставить ratio на максимум, threshold на -0.5 дБ, и атаку на минимум.

Лимитер и компрессор в роли лимитера

Если фоновая музыка в видео заглушает речь, нужно выставить RMS музыки и RMS голоса одинаковыми, после чего убавить музыку на 5–10 дБ. Если в некоторых местах слова все еще неразборчивы, можно применить к музыкальной подложке эквализацию. Достаточно посмотреть на эквалайзер для речи и сделать все наоборот в эквалайзере для музыки: например, если в речи 5 кГц приподнято широкой полосой, то в музыке эти же 5 кГц нужно убавить.

Обрабатываем звук в онлайне

У стримов и подкастов есть своя специфика при обработке голоса — здесь важно, чтобы плагины не были ресурсоемкими и не сильно грузили компьютер. Поэтому стоит использовать минимально необходимый набор эффектов.

Чаще всего для стримов используется программа OBS Studio. В ней можно загружать точно те же VST-плагины для обработки звука, что и в DAW. Если используется не OBS Studio, то для обработки голоса можно воспользоваться отдельной программой для потоковой обработки звука VSTHost, она работает с любыми приложениями для стримов.

Так выглядит плагин ReaFIR в OBS Studio

Для обработки голоса потребуется необходимый минимум:

1. Шумоподавление. В отличие от оффлайн-видео, звук к которым нередко записывается отдельно на качественный микрофон, в стримах часто используется не самое лучшее оборудование. Недорогой микрофон вкупе со встроенной звуковой картой и включенной функцией Microphone Boost в настройках звука Windows будут сильно шуметь. Для того, чтобы избавиться от этого шума, можно использовать встроенный в OBS фильтр Noise Suppression. У него всего одна настройка — уровень шумоподавления, начать стоит со значения около -20 дБ.

2. Гейт. Если в звуке для оффлайн-видео можно вручную вырезать все крики детей за окном и рев соседского перфоратора за стеной, то с онлайном такой фокус не провернуть. Понадобится гейт.

● Release можно сделать длинным, около 200 мс, поскольку работа гейта будет слишком слышна при быстром релизе. Правильно настроенный гейт почти незаметен для слушателя и удаляет лишь шумы и призвуки в паузах между фразами.

● Уровень гейта нужно сделать чуть выше, чем фоновый шум, не стоит выставлять уровень рядом с уровнем голоса.

● Простой способ настройки гейта для речи — нужно сложить губы трубочкой и шумно выдохнуть воздух в сторону от микрофона, запомнить на индикаторе значение уровня этого шума и выставить его на гейте.

4. Компрессор. Для стримов он имеет даже большее значение, чем для оффлайн-видео — в онлайне ни один диктор не сможет уследить за динамикой своего голоса на протяжении нескольких часов. Следует быть готовым к тому, что речь будет то едва слышной, то слишком громкой. Поэтому нужно использовать более жесткие настройки компрессора, чем для оффлайн-видео. Начать можно с ratio 10:1, атаки 5 мс и релиза в 30 мс или автоматически.

При подобных настройках нет необходимости в лимитере — компрессор будет выполнять его роль. Но если динамика речи очень большая и не позволяет настроить гейт (то слова начинают обрезаться, то шум просачивается в эфир), тогда можно использовать два компрессора: первый, с более мягкими настройками (ratio 3:1) поставить перед гейтом, второй, в качестве лимитера — в конце цепи (ratio выкрутить на максимум, threshold — так, чтобы компрессор срабатывал только при очень громких фразах).

Дайте послушать результаты!

Разобраться в обработке звука по тексту бывает непросто, но результат того стоит. Смотрите сами. Точнее, слушайте.

Качественный звук в современных видео и стримах значит ничуть не меньше, чем видео в высоком разрешении. А порой и больше — ведь многие ставят ролики на фон, смотря их вполглаза и воспринимая происходящее в основном на слух.

При этом стоит учесть, что данное руководство дает лишь базовые настройки в качестве точки отсчета. Конечный результат должен подбираться аудиально, ведь главный инструмент в работе звукорежиссера — это его собственные уши.

Читайте также: