Обработка и пересжатие звуковых дорожек [инструкция]

Тема закрыта
 
Автор Сообщение

admin ®

Статус: Не в сети

Стаж: 7 лет 1 месяц

Сообщений: 23734

Репутация: 0 [+] [-]

Откуда: Россия

Создавать темы 17-Апр-2018 06:31 | #1

[Цитировать]

Для любых операций со звуком надо сначала конвертировать звук в несжатый формат WAV!
Аудиоредакторы работают только с несжатым звуком.

ЛЮБЫЕ ОПЕРАЦИИ ПЕРЕСЖАТИЯ ВЕДУТ К ПОНИЖЕНИЮ КАЧЕСТВА КОНЕЧНОГО МАТЕРИАЛА!
СТАРАЙТЕСЬ ИЗБЕГАТЬ ЛИШНИХ ОПЕРАЦИЙ ПЕРЕСЖАТИЯ.

Описание форматов

WAV
Несжатый звук. Именно с ним работают профессиональные аудио редакторы. Никаких потерь качества. Занимает кучу места.
AC3
Dolby Digital (AC-3, ATSC A/52) — система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.
Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.
Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.
В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, а так же обеспечивает абсолютную синхронность изображения и звука.
DTS
DTS — формат звука, созданный Digital Theater System, конкурирующий, но схожий с Dolby Digital. Формат DTS использует меньший уровень сжатия, чем Dolby, так что теоретически он звучит лучше, что доказывают на практике диски, на которых записаны дорожки и в DD, и в DTS. Формат DTS Stereo практически идентичен Dolby Surround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. Также называется DTS Surround Sound.
DTS в домашних театрах допускает полный битрейт full bitrate (1,536 kbit/s) при этом эксперты отмечают большую прозрачность и естественность звука, чем у AC-3 (Dolby Digital).
DTS — алгоритм кодирования, изначально предназначенный исключительно для многоканального звука в формате 5.1. В отличие от Dolby Digital, где в потоке некоторые каналы могут отсутствовать вообще, в потоке DTS место для всех шести каналов всегда зарезервировано, и, при отсутствии реальной информации в них, это место просто пропадает. То есть при одинаковом битрейте в DTS запись 4.0 будет того же объема, как и 5.1.
MP3
MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.
На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.
AAC
AAC (англ. Advanced Audio Coding) — собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).
Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

Редактирование ac3/dts без пересжатия

Сдвинуть/обрезать

Для того чтобы сдвинуть/обрезать дорожку или вставить тишины в начале/конце дорожки нужно воспользоваться программой delaycut скачать.
Резать ac3 и dts без пересжатия можно только на величины кратные 32мс для ac3 и 10.(6)мс для dts. Если рабочие значения не делятся нацело на указанные величины, то программа округлит значения до ближайших кратных.
В полях "Input file / Output file" указываем соответственно исходный и выходной файлы.

Резать

Иллюстрация

Для резки нужно использовать раздел "Cutting".
1. Для использования раздела отмечаем опцию "Cut file" .
2. В полях "start/end" выставляем время начала и окончания вырезаемого фрагмента в миллисекундах. При этом в разделе "Info", в поле "Duration" будет видна длина вырезаемого фрагмента.
3. Жмем кнопку "PROCESS" и ждем окончания процесса.

Сдвинуть

Иллюстрация

Для резки нужно использовать раздел "Delay".
1. Чтобы сдвинуть дорожку нужно задать значение сдвига в поле "Start" в миллисекундах. Положительное - для сдвига звука вперед, если он отстает от видео. Отрицательное - для сдвига звука назад, если он опережает видео.
2. Если нужно сохранить исходную длину дорожки, то надо отметить опцию "Original Length". В этом случае в конец дорожки будет добавляться/отрезаться фрагмент равный по длине отрезанному/добавленному в начале. В разделе "Info", в поле "Duration" будет видна новая длина дорожки, а так же длина неустранимой задержки в поле "NotFixedDelay", если значение сдвига не будет кратным длине фрейма для обрабатываемого формата.
3. Жмем кнопку "PROCESS" и ждем окончания процесса.

Программу не рекомендуется применять для DTS являющихся ядром DTS-HD.
Более новые версии delaycut можно брать здесь.
Примечание: программа delaycut не вносит никаких изменений в фреймы потока. Например, каждый фрейм потока AC3 представляет собой независимую единицу со своими параметрами (количество каналов, частота дискретизации и т.п.). При добавлении тишины delaycut добавляет фреймы со своими характеристиками (Center mix = -4.5 dB, Surround mix = -6 dB). Почти все программы при считывании характеристик потока ориентируются на первый фрейм, считая, что дальше все фреймы имеют аналогичные характеристики. В итоге после обработки файла при помощи delaycut характеристики файла выводимые разными программами могут измениться. В этом нет ничего страшного. Метаданные фреймов исходного потока остаются не тронутыми.

Склеить

Склеить две и более дорожек можно при помощи командной строки ("Пуск->Выполнить", ввести "cmd", нажать "enter"):
copy /b "c:\file1.ac3" + "c:\file2.ac3" "c:\result.ac3"
Склеивать желательно только звук с идентичными параметрами. Иначе можно получить файл, который будет не корректно воспроизводиться. Например, если склеить 2.0 (стерео) с 5.1 звуком, то большинство программ и проигрывателей будут видеть всю дорожку как стерео.
Если очень нужно такое сделать, то можно 2.0 преобразовать в 5.1 заменив отсутствующие каналы пустотой. В итоге получим идентичный по заголовку фремов файл для склеивания с полноценной дорожкой 5.1

Распаковка звука в формат WAV

Надо учитывать, что для дальнейшей обработки аудио редактор может не корректно открывать файлы больше 2 гигабайт. Выражаться это может в том, что продолжительность дорожки будет раза в два длиннее, чем она есть на самом деле. Так же на графике звуковой волны это будет хорошо видно: нормальная первая половина звука, а вторая половина трека как периодическое повторение какой-то звуковой последовательности.

BeHappy (AC3, DTS, MP2, MP3, WAV, AVS)

Сайт программы.
Удобная и функциональная утилита. Может делать сразу несколько полезных операций вроде распаковки звука на моно каналы вместе с изменением битности и громкости.
Для возможности загрузки форматов AC3/DTS/MPEG/LPCM нужно скачать декодер NicAudio и распаковать файл библиотеки NicAudio.dll в папку plugins фреймсервера AviSynth.

Иллюстрация


После запуска программы появится окно программы с открытой вкладкой "New Job".
1. Выбираем формат загружаемой дорожки.
  • NicAc3Source - для распаковки дорожек формата AC3
  • NicDtsSource - для распаковки дорожек формата DTS
  • NicMPG123Source - для распаковки дорожек формата MPEG Layer 1, 2, 3
2. Указываем исходный файл звуковой дорожки.
3. Выбираем формат получаемой дорожки.
  • Wav Writer - для сохранения многоканальной wav
  • WavSplit @ Mono wav's - для сохранения набора моно-каналов
4. Задаем путь и имя файла для сохранения результата.
5. При желании можно указать битность дорожки. Для этого нужно установить курсор в списке фильтров на "Convert Sample To..." и поставить напротив него галочку. Далее осталось указать нужную битность. Оптимально 24 - 32 bit.
6. Кнопка "Configure" позволяет настроить опции фильтра, на котором стоит курсор в списке фильтров.
7. Ставим задачу в очередь нажатием кнопки "Enqueue", переходим на вкладку "Queue" (если вкладка не активировалась автоматически) и жмем кнопку "Start". Ждем окончания процесса.
Дополнение №1: При необходимости использовать несколько фильтров их порядок можно менять кнопками "Move Up" / "Move Down".

BeSweet (AC3, VORBIS, MP2, MP3, WAV)

Для работы нужно скачать связку по отдельности BeSweet и BeLight с сайта (Doom9 со странички "Downloads". BeLight является графической оболочкой для BeSweet и их надо распаковать в одну папку.

AC3

Запускаем и по шагам выполняем указанные на скрине операции.
Все остальные галочки должны быть сняты (включая опции раздела "Advanced Settings"), чтобы звук не искажался.

Иллюстрация

1. Открываем исходный файл.
2. Указываем куда сохранять результат.
3. Выбираем вкладку с нужным форматом назначения.
4. Указываем формат назначения - wav.
5. Выбираем сколько каналов хотим получить на выходе.
  • 16 Bits 5.1. Wave - единый 16 битный многоканальный файл
  • 16 Bits Stereo Wave - единый 16 битный стерео файл
  • 16 Bits (Six) Mono Waves - шесть 16 битных моно-дорожек, по одной на каждый канал
  • 32 Bits (Six) Mono Waves - шесть 32 битных моно-дорожек, по одной на каждый канал
6. Запускаем.

Tranzcode (AC3, WAV, DTS)

(ссылка на официальном сайте умерла)
Встроенный декодер DTS искажает спектр сигнала. По этой причине при подготовке раздач лучше использовать декодирование DTS другими программами.
Программа Tranzcode является консольной, т.е. запускать её нужно через командную строку. Внутри есть описание как пользоваться и какие ключи использовать в командной строке. Для ленивых есть вариант Tranzcode 0.40 с графическим интерфейсом.

Иллюстрация

Картинку не надо воспринимать буквально, на ней лишь отражены возможности.
Разумеется, чтобы вытащить все каналы надо либо не указывать ни одной галки, либо все.
Предыдущая версия Tranzcode 0.30 с графическим интерфейсом также умеет сохранять многоканальный DTS в стерео-WAV.

Eac3to (DTS, DTS-HD, AC3, True-HD)

Официальная страничка.
Утилита является консольной, но для неё существуют графические оболочки. Можно порекомендовать UsEac3to.

Разбираем DTS (DVD)

Для декодирования DTS потребуется дополнительный декодер. Для DTS взятого с DVD рекомендуется использовать декодер ArcSoft 1.1.0.0 (более поздние версии могут приводить к проблемам). Ccылку на данную версию декодера (как и дополнительную информацию по установке и настройке) можно найти тут.

Иллюстрация

1. Для начала убедимся в работоспособности программ - выберем режим test и нажмем справа кнопку RUN.
2. Результаты теста появятся в центральном окне - видим работоспособность нужной версии декодера.
3. Указываем путь к исходной DTS-дорожке.
4. Выбираем выходной формат wavs (6 отдельных wav-файлов) и кнопкой Add добавляем этот параметр.
5. Аналогично добавляем флаг отключения второго прохода.
6. Для надежности можно вручную в соответсвующей строке вбить параметр подключения декодера от Арксофт, но это делать не обязательно - этот декодер используется по умолчанию.
7. Нажимаем кнопку RUN Command Line.

Иллюстрация

После завершения процесса в центральном окне (поз. 1) видим лог успешного завершения операции, который можно сохранить в папке установки UsEac3to при помощи кнопки "Save log" (поз. 2). Папку сохранения лога можно переназначить через меню Settings...

Более подробная инструкция по работе в eac3to с другими форматами звука (и не только) описана в статье уважаемого TDiTP_.

FAAD (AAC)

Для распаковки AAC поможет декодер FAAD. Утилита распространяется в виде исходных кодов, поэтому скомпилированную версию взять можно здесь.
Далее в коммандной строке, либо в файле с расширением *.bat пишем следующую команду:
faad.exe input.aac -o output.wav
Для особо ленивых есть вариант с графическим интерфейсом.

Иллюстрация

Устранение рассинхронизации

В правильном случае для синхронизации должны быть в наличии не только фильм и синхронизируемая с ним дорожка, но синхронизируемый фильм целиком. Вместе с видео. Это значительно упрощает процесс.

Поиск причины

Для того, чтобы корректно устранить рассинхронизацию нужно точно знать причину рассинхрона. Самый простой способ - определить по видео. В качестве инструмента предлагаю использовать опять же VirtualDubMod. Программа открывает конечно не каждый формат, но победить эту проблему нам поможет AviSynth - многофункциональный фрейм-сервер.
1. Сравниваются оба видеопотока на предмет присутствия отличий в разных местах по несколько кадров. Поэтому подгонять чисто дорожку можно только в самом крайнем случае. Если есть видео, то подгон чисто дорожки - ересь.
2. Если различий нет, то все супер. Достаточно определить сдвиг (задержку). Если видео и дорожка принадлежат разным системам строчности , то сначала (перед сдвигом) понадобиться выровнять их скорости воспроизведения, т.е. применить операцию сжатия PAL-NTSC (с коэффициентами либо 25/23.976 либо 23.976/25, других не бывает, 29.970 - это тоже самое что и 23.976). Эти моменты подробно описаны в этой инструкции.
3. Если таки различия есть, то делаем все то же самое, но придется еще и кромсать дорожку при подгоне согласно временным меткам определенным при сравнении видеопотоков. В итоге может понадобиться либо удалить часть дорожки, либо что то вставить (иногда и тишина сойдет, обычно это соответствующий кусок другой - исходной для видео - дорожки). Так же не забываем что преобразование PAL/NTSC можно применять не обязательно сразу, а делать в самом конце. Например, редактировать PAL дорожку удобнее, т.к. продолжительность кадра там ровно 40мс и все расчеты имеют так же четкие цифры. Устранять несовпадения в видеопотоках у аудиодорожки удобно с конца, чтобы не нужно было постоянно пересчитывать время других подобных мест.

Преобразование NTSC <-> PAL (прогрессирующая рассинхронизация)

Если точно известно, что аудиодорожки отличаются лишь скоростью воспроизведения (связанной с различием стандартов PAL и NTSC), то для устранения такого рассинхрона сначала дорожку надо либо растянуть по времени (если эта дорожка от PAL-версии фильма, которую хочется приделать к NTSC), либо ужать (если дорожку от NTSC требуется приделать к изданию PAL).

Adobe Audition

1. Открываем исходную дорожку.
2. Открываем пункт меню "Эффекты -> Время/Тон -> Stretch".

    Иллюстрация

3. Выставляем коэффициент: (fps конечное / fps начальное) * 100

    Иллюстрация


    В большинстве случаев растягивать звук с сохранением тона не следует, т.к.
    1. это может привести к понижению его качества из-за несовершенства используемых для этого алгоритмов;
    2. в случае преобразования PAL -> NTSC для дорожек взятых с DVD зоны R5 скорее всего изначальная конвертация NTSC -> PAL осуществлялась без сохранения тона.
    Т.е. выбираем режим "Resample" (при этом звук немного искажается, но операция не понижает его качество, т.к. применяемые при этом алгоритмы достаточно просты)!
    В этом случае коэффициент: (fps начальное / fps конечное) * 100
    Да, формула отличается (что не логично), но так реализовано в программе.
    Отличие режимов состоит в следующем:
    Resample - это просто пересчет под новый темп (скорость воспроизведения). Аналогия с видео заключается в простом изменении частоты кадров. Т.е. чем больше/меньше кадров в секунду отображается, тем короче/длиннее становится запись. Исходный материал не страдает. Но в результате у нас запись ускоряется или замедляется. На звуковую дорожку это оказывает следующее влияние: при ускорении - голоса становятся выше (писклявее), при замедлении - ниже. Т.е. слышимый звук в итоге искажается.
    Stretch - это пересчет под новый темп с учетом сохранения тона. Здесь можно провести аналогию с обычной картинкой. Имеем изображение 130 пикселей в ширину (исходный темп звучания дорожки), нам надо их запихнуть в 120 (темп звучания под новую продолжительность). В результате придется как то решать проблему "как три пикселя засунуть в два" и не исказить при этом общую картину. Результат зависит от качества применяемого алгоритма. Чем он качественнее, тем меньше искажений мы получим в результате.

4. Нажимаем кнопку "OK".
5. Сохраняем результат.

Sound Forge (не рекомендуется, т.к. точность растяжения недостаточна)

1. Открываем исходную дорожку.
2. Открываем пункт меню "Process -> Time Stretch".

    Иллюстрация

3. Выбираем в выпадающем списке "Input format":
      Time (hr:mn:sc.xxx) - растяжение по конечному времени.
      Percentage - растяжение по коэффициенту (в процентном отношении).
4. Выставляем коэффициент: (fps начальное / fps конечное) * 100

    Иллюстрация

5. Нажимаем кнопку "OK".
6. Сохраняем результат.
Для решения поставленной задачи также отлично подходит Sony Vegas - загляните под спойлер "Произвольная синхронизация", идущий чуть ниже.
      Для NTSC точное значение fps высчитывается как 24 / 1.001.

Произвольная синхронизация (прогрессирующая рассинхронизация)

Если в наличие имеются только сами аудио дорожки и точно известно, что соответствующее им видео не отличается по содержанию, то синхронизировать можно визуально по виду звуковой волны.

Adobe Audition

1. Открываем обе дорожки.

    Иллюстрация

2. С помощью колеса прокрутки мышки увеличиваем масштаб и в начале дорожки-образца ищем фрагмент с выделяющимися пиками.

    Иллюстрация

3. Наводим курсор на этот фрагмент, увеличиваем масштаб так, чтобы видно было форму волны и снова выбираем какой либо выделяющийся фрагмент.

    Иллюстрация

4. Фиксируем курсор на пике этого фрагмента и записываем время.

    Иллюстрация

5. Переключаемся на синхронизируемую аудио дорожку двойным кликом мышки по ней.
6. Находим тот же характерный фрагмент.

    Иллюстрация

7. Фиксируем время характерного пика фрагмента.

    Иллюстрация

8. Находим фрагмент с выделяющимимя пиками ближе к концу дорожки-образца.

    Иллюстрация

9. Фиксируем время характерного пика.

    Иллюстрация

10. Находим тот же фрагмент на синхронизируемой аудио дорожке.

    Иллюстрация

11. Фиксируем время характерного пика.

    Иллюстрация

В результате имеем:
Дорожка образец: 00:00:28.086 -> 01:29:00.298 (продолжительность - 01:28:32.212 или 5312.212 секунд)
Синхронизируемая дорожка: 00:00:22.150 -> 01:25:16.899 (продолжительность - 01:24:54.749 или 5094.749 секунд)
Вычисляем коэффициент сжатия:
(продолжительность синхронизируемой дорожки / продолжительность дорожки-образца) х 100
(5094.749 / 5312.212) х 100 = 95.90635
14. Выставляем коэффициент сжатия и изменяем продолжительность синхронизируемой аудио дорожки.

    Иллюстрация

15. Сохраняем результат.

Sound Forge

1. Открываем обе дорожки и выбираем пункт меню "Window -> Title Horizontally". Оба графика растянутся на всю свободную площадь в равном объеме, что даст возможность удобно с ними работать.

    Иллюстрация

2. Ищем на одной дорожке ближе к началу какой либо резкий всплеск/пик. При необходимости можно увеличивать масштаб при помощи клавиши-стрелки "вверх" или колеса прокрутки мышки вперед. Такой же пик ищем на второй дорожке.

    Иллюстрация

3. Ставим курсор на пик и увеличиваем до масштаба, когда четко видна волна. Аналогично увеличиваем масштаб и на второй дорожке. При необходимости в процессе увеличения масштаба корректируем положение курсора.
4. Выбираем любой четко идентифицируемый пик на обеих дорожках и ставим/фиксируем на них курсор.

    Иллюстрация

5. Аналогично ищем идентичный пик ближе к концу дорожки.

    Иллюстрация

6. Увеличиваем масштаб фрагментов и фиксируем значения.

    Иллюстрация

В результате имеем:
Дорожка образец (NTSC): 00:01:11.925 -> 02:31:46.816 (продолжительность - 02:30:34.109 или 9034.109 секунд)
Синхронизируемая дорожка (PAL): 00:01:12.957 -> 02:31:47.922 (продолжительность - 02:30:34.035 или 9034.035 секунд)
Вычисляем коэффициент сжатия:
(продолжительность дорожки-образца / продолжительность синхронизируемой дорожки) х 100
(9094.109 / 9094.035) х 100 = 100.00081 (примером послужили две дорожки, где pal уже была растянута под ntsc)
7. В меню "Process -> Time Stretch" выставляем коэффициент сжатия и изменяем продолжительность синхронизируемой аудио дорожки. Чтобы перейти в режим сжатия по коэффициенту (в процентном отношении) нужно в выпадающем списке "Input format" выбрать "Percentage".

    Иллюстрация

8. Сохраняем результат.

Vegas (by Mikky72)

1) В настройках отключаем привязку к кадрам видео:

2) Отправляемся в Options-Preferences:

2) Отключаем режим "сохранение тона":

3) Вычисления удобнее проводить в десятичном масштабе. По этой причине советую изменить временную шкалу. Щелкаем правой кнопкой мышки по шкале времени (я щелкаю слева - там, где показана длительность дорожки) и выбираем масштаб "секунды":

4) Правой кнопкой мышки щелкаем на одной дорожке. Появится меню. Нам нужны Properties:

5) Выбираем в середине окна "Classic". Тогда снизу появятся дополнительные поля. Вводим новую длину звука (в секундах, с точностью до тысячных):

Новая длина определяется по формуле:
новая = старая * K, где K = 1001*25/24000 при перегоне из PAL в NTSC и K=24000/(1001*25) при перегоне NTSC->PAL.
В данном примере идет перегон PAL->NTSC, т.е. новая длительность больше старой.
6) Теперь одна дорожка длиннее остальных. Выделяем щелчками мыши при нажатом Ctrl оставшиеся 5 коротких дорожек и нажимаем клавишу "G" на клавиатуре (они привязываются друг к другу):

7) Подводим мышку к правому краю любой из этих 5-ти дорожек. Нажимаем и не отпускаем Сtrl. Курсор примет особый вид (квадратик с волной). И тянем вправо аккуратно. Когда 5 дорожек сравняются с первой произойдет "привязка" - появится вертикальная синяя полоса (смотрите - не проскочите).

Теперь все дорожки приобрели нужную продолжительность.
P.S. Если нужно разрезать все 6 дорожек одновременно (например, для удаления лишнего куска), то надо их выделить (щелкаем с нажатым Ctrl), поместить вертикальную черту в нужную позицию и нажать "S".
P.S.S Цвета интерфейса в Вегасе могут изменяться в настройках - либо "классическая" схема с "серо-голубой" панорамой (активный динамик голубой, как на картинках выше), либо "модная тёмная" с менее наглядной черно-серой панорамой (активный динамик рельефно прорисован, а отключенные - серые без прорисовки). Чтобы быть уверенным, что Вы делаете правильно, и не путаться в цветах при настройке панорамы - делайте так как написано в Хелпе самой программы:
Чтобы данный трек звучал только из конкретного канала, сделайте клик мышкой по этому динамику на схеме ПРИ НАЖАТОЙ КЛАВИШЕ "Ctrl".
Второй вариант застраховаться от ошибок - сделать двойной клик по панораме, чтобы она увеличилась. И тогда, например, для центрального канала должно быть так (сделал для двух вариантов цветовой схемы):

Сдвиг (постоянная рассинхронизация)

Adobe Audition

1. Открываем обе дорожки.

    Иллюстрация

2. С помощью колеса прокрутки мышки увеличиваем масштаб и в начале дорожки-образца ищем фрагмент с выделяющимися пиками.

    Иллюстрация

3. Наводим курсор на этот фрагмент, увеличиваем масштаб так, чтобы видно было форму волны и снова выбираем какой либо выделяющийся фрагмент.

    Иллюстрация

4. Фиксируем курсор на пике этого фрагмента и записываем время.

    Иллюстрация

5. Переключаемся на синхронизируемую аудио дорожку двойным кликом мышки по ней.
6. Находим тот же характериный фрагмент.

    Иллюстрация

7. Фиксируем время характерного пика фрагмента.

    Иллюстрация

В результате имеем синхронизируемые моменты:
Дорожка образец: 00:00:28.086
Синхронизируемая дорожка: 00:00:22.150
Вычисляем сдвиг:
дорожка-образец - синхронизируемая дорожка = 00:00:28.086 - 00:00:22.150 = 00:00:05.936

Sound Forge

1. Открываем обе дорожки и выбираем пункт меню "Window -> Title Horizontally". Оба графика растянутся на всю свободную площадь в равном объеме, что даст возможность удобно с ними работать.

    Иллюстрация

2. Ищем на одной дорожке какой либо резкий всплеск/пик. При необходимости можно увеличивать масштаб при помощи клавиши-стрелки "вверх" или колеса прокрутки мышки вперед. Такой же пик ищем на второй дорожке.

    Иллюстрация

3. Ставим курсор на пик и увеличиваем до масштаба, когда четко видна волна. Аналогично увеличиваем масштаб и на второй дорожке. При необходимости в процессе увеличения масштаба корректируем положение курсора.
4. Выбираем любой четко идентифицируемый пик на обеих дорожках и ставим/фиксируем на них курсор.

    Иллюстрация

В результате имеем синхронизируемые моменты:
Дорожка образец (NTSC): 00:01:11.925
Синхронизируемая дорожка (PAL): 00:01:12.957
Вычисляем сдвиг:
дорожка-образец - синхронизируемая дорожка = 00:01:11.925 - 00:01:12.957 = - 00:00:01.032

Желательно сделать замеры в начале и конце дорожки (примерно), потому как вряд ли дорожки будут совпадать сэмпл в сэмпл. Тогда высчитываем разницу между сдвигом в начальных точках и сдвигом в конечных точках. Допустим в начале получился сдвиг "- 00:00:01.032", а в конце "- 00:00:01.106", тогда разница между сдвигом конечных точек и сдвигом начальных точек получится "- 0.074". Делим пополам и прибавляем к сдвигу в начальных точек, т.е. "- 00:00:01.032 + (- 0.074 / 2)" и получаем "- 00:00:01.069". Это имеет смысл делать для того чтобы сбалансировать отклонение дорожки, т.е. в начале фильма она будет чуть отставать от видео, а в конце опережать на ту же величину относительно середины фильма. Это всяко лучше, чем синхронизировать по точкам в начале дорожки, а потом наблюдать весь рассинхрон в конце вместо половинного рассинхрона. Можно и чуть проще - определять сдвиг по точкам в середине дорожки, если там найдется подходящая.
Возможны следующие варианты сдвига:

отрицательный

  • отрезать лишнее
  • задать сдвиг при конечной сборке видео с аудио

положительный

  • добавить тишины

    Иллюстрация


  • добавить фрагменты соответствующей длины из дорожки-образца (например звук для заставки студии-производителя)
  • задать сдвиг при конечной сборке видео с аудио

Локализация

Наложение перевода

Озвучку можно накладывать либо на центральный канал многоканальной дорожки, либо на оба канала стереодорожки.

Способ попроще

Sound Forge

Открываем моно дорожку и дорожку с озвучкой. Чтобы было удобно в меню выбираем "Window -> Tile Horizontally" и обе дорожки встанут друг под другом.

Иллюстрация


Теперь надо проверить, чтобы частота дискретизации дорожек была одинаковой. Кликаем правой кнопкой мыши по дорожке.

Иллюстрация


В появившемся контекстном меню выбираем "Properties".

Иллюстрация


Если частота дискретизации разная, то надо привести частоту дискретизации озвучки к частоте дискретизации дорожки. Вызываем опцию в меню "Process -> Resample"

Иллюстрация


Выставляем значение к которому нужно привести частоту дискретизации, ставим "Interpolation Accuracy" в максимальное значение, ставим галку "Apply an anti-alias filter during resample" и жмем "OK". После завершения процесса рекомендую дорожку сохранить в другой файл.
Теперь находим на дорожке к фильму первую произнесенную фразу. Её же надо найти и на дорожке с озвучкой. Замеряем положение одинаковых пиков этих мест на обоих дорожках. Точность тут не нужна, поскольку понятие идеала в данном случае отсутствует в принципе. Теперь из зафиксированного времени дорожки к фильму вычитаем зафикисированное время дорожки с озвучкой. Добавляем еще ~200 миллисекунд и получаем смещение, которое надо либо отрезать в начале дорожки с озвучкой (результат со знаком минус), либо добавить тишины в начале её же.
Чтобы отрезать лишнее вызываем опцию из меню "Edit -> Selection -> Set...".

Иллюстрация

Иллюстрация


В поле "Start" ставим ноль, в поле "End" посчитанное значение, жмем "ОК", окно закроется, а нужный кусок выделится. Теперь жмем кнопочку "Delete" на клавиатуре и сохраняем файл.

Иллюстрация


Чтобы вставить фрагменты тишины нужно вызвать опцию в меню "Process -> Insert Silence..."

Иллюстрация

Иллюстрация


Здесь указываем посчитанную величину, выбраем позицию вставки "Start of file" и жмем "OK". Сохраняем дорожку.
А теперь переходим непосредственно к наложению озвучки. Выделяем всю дорожку с озвучкой и вызываем опцию меню "Edit - > Copy". Ставим курсор в начало дорожки от фильма и вызываем опцию меню "Edit -> Paste Special -> Mix...".

Иллюстрация

Иллюстрация


При необходимости можно понизить или повысить громкость озвучки при микшировании. Слева - громкость исходной дорожки, справа - накладываемой. Запускаем процесс. Дальше слушаем что получили и в случае неудовлетворительного результата делаем отмену операции микширования "Edit -> Undo", корректируем сдвиг дорожки с озвучкой (в зависимости от того опережает или запаздывает озвучка относительно дорожки фильма) и уровень громкости, если озвучку плохо слышно или наоборот, слышно слишком горомко.

Замена центрального канала

Это частный случай рассинхрона. Разница лишь в том, что к синхронизации предъявляются очень строгие условия. Для объемного звука (включая стерео) точность синхронизации между каналами должна быть равна обратной верхней частоте слышимого звука, т.е. порядка 1/20кГц = 0.05 мс. При стандартной частоте выборки в 48 Кгц это 1-2 выборки. Так что использовать сей метод не рекомендуется, потому как синхронизировать дорожки с такой точностью просто не реально. Использовать сей способ можно только при условии, что центральный канал надо лишь сдвинуть. Т.е. исходная дорожка и дорожка-донор от видео в одной системе строчности PAL-PAL или NTSC-NTSC. И то рекомендуется проверить совпадение сэмпл в сэмпл, иначе результат будет кошмарным - неприятный эффект эхо как минимум.
Заменять центральный канал в нормальной 5.1 дорожке крайне не рекомендуется т.к.
  • Нужно идеально подогнать центральный канал, т.к. будет эхо.
  • Нарушается пространственная картина звучания, а к этому ведет даже малейшее несовпадение по громкости с оригинальным центральным каналом. К этому же эффекту ведет и вставка вместо центрального канала микса из каналов стереодорожки, только в этом случае все будет еще хуже, т.к. из центрального канала будут идти все звуки со всех направлений.

Использование фильтров

Удаление щелчков

Sound Forge

В меню выбираем "Tools -> Audio Restoration"

Иллюстрация

Click removal amount - уровень чувствительности фильтра. Чем выше значение, тем более тихие щечки будут удаляться.
Reduce noise by - уровень подавления шумов. При максимальном значении будет максимальное шумоподавление.
Affect frequencies above - нижняя граница частот на которые будет действовать шумоподавление, т.е. частоты ниже указанного значения подавляться не будут.
Attack speed - скорость реакции программы на изменение уровня шума.
Release speed - скорость реакции программы на изменение уровня шума.
Noise floor - пороговое значение уровня шума, т.е. все что ниже указанного значения будет восприниматься как шум.
Нажимаем "ОК" и слушаем результат. Если результат не устраивает, то делаем откат изменений "Edit -> Undo Sony ExpressFX Audio Restoration" и пробуем все заново, но уже изменив параметры. В основном нужно регулировать первые два параметра.

Удаление шума по шаблону

Часто при записи звука с аналоговых источников так же записывается и шум.
В аудио редакторах есть возможность чистить звук по шаблону.

Adobe Audition

Открываем дорожку и увеличиваем масштаб так, чтобы четко было видно отрезки с шумом.

Иллюстрация

Выделяем кусок с шумом чтобы зафиксировать шаблон для последующей чистки.
Вызываем диалоговое окно для работы с шумодавом ("Эффекты -> Удаление шума").

Иллюстрация

Иллюстрация

Нажимаем кнопку "Захват профиля" чтобы зафиксировать выделенный фрагмент как шаблон для чистки.

Иллюстрация

Дальше это окно можно закрыть и выделить ту часть дорожки, которую нужно очистить от шума.
Всю дорожку можно выделить не закрывая окно шумодава. Для этого есть кнопка "Выбр. весь файл".
Основной регулятор степени очистки - это шкала "Уровень удаления шума". Подбирать это значение придется исключительно на слух. Главное не перестараться, чтобы не отфильтровать так же и полезный сигнал и избежать появления металлических звуков. Для оценки своих действий есть кнопка "Просмотр" для прослушивания выделенного фрагмента с начала с учетом действия фильтра. Чтобы применить фильтр жмем кнопку "Ok". Теперь нужно более детально оценить результаты работы фильтра прослушав дорожку в разных местах. Если результат не устравивает, то отменяем измения ("Редактирование -> Отменить Удаление шума") и пробуем снова.

Sound Forge

Здесь ничего нет.

Иллюстрация

Сведение моно дорожек в один файл

Нижеописанное требуется в случае, если надо подать на вход кодировщика многоканальный звук из отдельных каналов. Например, для сжатия в AAC через MeGUI. Если же надо сжать звук в AC3 или DTS, то правильно это делается по инструкции в следующем разделе "Конвертация из формата WAV".
Скачиваем последнюю версию фреймсервера AviSynth.
Скачиваем NicAudio и копируем из архива файл NicAudio.dll в папку "C:\Program Files\AviSynth 2.5\plugins".
Создаем текстовый файл с расширением "*.avs" и следующим содержимым:

5.1

LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\NicAudio.dll")
global OPT_AllowFloatAudio=True
fl = RaWavSource("C:\test-FL.wav")
fr = RaWavSource("C:\test-FR.wav")
fc = RaWavSource("C:\test-C.wav")
lfe = RaWavSource("C:\test-LFE.wav")
rl = RaWavSource("C:\test-SL.wav")
rr = RaWavSource("C:\test-SR.wav")
MergeChannels(fl,fr,fc,lfe,rl,rr).ConvertAudioToFloat()

7.1

LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\NicAudio.dll")
global OPT_AllowFloatAudio=True
fl = RaWavSource("C:\test-L.wav")
fr = RaWavSource("C:\test-R.wav")
fc = RaWavSource("C:\test-C.wav")
lfe = RaWavSource("C:\test-LFE.wav")
bl = RaWavSource("C:\test-BL.wav")
br = RaWavSource("C:\test-BR.wav")
sl = RaWavSource("C:\test-SL.wav")
sr = RaWavSource("C:\test-SR.wav")
MergeChannels(fl,fr,fc,lfe,bl,br,sl,sr)

Пояснения


Ls = test-SL
Rs = test-SR
Lsr = test-BL
Rsr = test-BR
Этот файл можно подавать на вход кодировщику, например MeGUI.

Микширование звука 5.1 в стерео (Downmix)

BeHappy

Скачиваем BeHappy.

Иллюстрация

Запускаем BeHappy и выбираем:
1. Источник. Например мультиканальный *.wav или *.avs скрипт, который может быть полезен в случае, если мультиканальный *.wav превышает размер в 4Gb и источником служит набор моно каналов. Этот способ описан разделом выше - "Сведение моно дорожек в один файл". Хотя BeHappy сам понимает WAV размером более 4Gb.
2. Сначала тип получаемого файла - "Wav Writer" или "WavSplit @ Mono wav's" (чтобы получить каждый канал в отдельном файле, что удобно когда суммарный результат может превысить размер 2Gb), затем имя получаемого файла.
3. В списке фильтров выбираем "Downmix".
4. Под списком фильтров появится кнопка "Configure", которая дает возможность выбрать схему микширования в стерео. Через знак дефис будет указан режим работы фильтра.

    Иллюстрация

  • Stereo - микширование в стерео.
  • DPL I - микширование в стерео по схеме Pro Logic (получаем псевдо 3.1, т.к. при воспроизведении из стерео выделяются центральный и тыловой каналы).
  • DPL II - микширование в стерео по схеме Pro Logic II (получаем псевдо 5.0 (3/1), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).
  • DPL II (LFE) - микширование в стерео по схеме Pro Logic II с учетом низкочастотного канала LFE (получаем псевдо 5.1 (3/2), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).
5. Нажимаем кнопку "Enqueue" и добавляем задачу в очередь.
6. Программа автоматически переходит на вкладку "Queue".

Иллюстрация

1. Видим нашу задачу в очереди.
2. Запускаем процесс обработки кнопкой "Start".

Иллюстрация

Начнется процесс микширования в стерео по указанной схеме.
Дополнение №1: Если все же хочется на вход подать сразу AC3, то нужно скачать вот это и положить в папку "plugins" фреймсервера AviSynth.
Дополнение №2: Для уменьшения объема результирующего файла можно понизить разрядность с выдаваемых по умолчанию 32bit float до 24bit int путем активирования в разделе "Digital Signal Procesing" опции "Convert Sample To...". После чего станет доступна настройка фильтра (кнопка "Configure"), где можно выбрать желаемую разрядность. Главное не нарушать порядок использования фильтров. Изменение разрядности должно идти после микширования в стерео. Т.е. так как фильтры стоят по-умолчанию.

Иллюстрация

Конвертация из формата WAV (сжатие в другие форматы)


    Кодировщики имеют свойство добавлять в начале фрагмент тишины.
    • Sonic Foundry Soft Encode - 256 сэмплов (при 48 кГц это ~5.3 мс)
    • Minnetonka Audio SurCode - 636 сэмплов (при 48 кГц это 13.25 мс)
    • Sony (Vegas, Sound Forge,...) - 636 сэмплов (при 48 кГц это 13.25 мс)
    • DTS-HD Master Audio Suite
      • 480 сэмплов при выборе Destination Format "DVD (.cpt)" (10мс)
      • 1024 сэмпла при выборе Destination Format "Blu-ray Disc (.dtshd)" (~21.3мс)
    Метод борьбы - изначально отрезать нужное количество сэмплов.

Dolby AC3


    Для качественного сжатия в AC3 следует использовать только официальные кодировщики от Dolby, которые описаны ниже. Всякие поделки вроде aften, кодировщика ac3 в ffmpeg и прочих - это "вариации на тему". Их авторам никто не давал точные алгоритмы сжатия. Поэтому результат будет заведомо ниже качеством.

Теория

Для получения качественного результата при перекодировке многоканальной AC3 надо выполнить следующие настройки:
1. Снять галки опций: "Input filtering", "90-degree phase shift", "3 db attenuation".

    Пояснения

    Эти опции нужно включать только в случае, если исходник является дорожкой собственного производства. При пересжатии звука AC3 эти опции уже применялись при изначальном сжатии и применять их еще раз не нужно. Исключение составляет случай когда исходником является дорожка любого другого формата (например, DTS, DTS-HD MA или TrueHD). В этом случае можно (т.е. не обязательно) задействовать опцию "90-degree phase shift" для поддержки формата Dolby ProLogic, если для прослушивания планируется использовать стереосистему. Т.е. эту опцию следует использовать в очень редких случаях (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных), в остальных же стоит её отключать.

    Input filtering (предобработка)

    Digital deemphasis: фильтр цифровых предыскажений.
    DC high-pass filter: убирает смещение волны относительно среднего уровня.
    Bandwidth low-pass filter: убирает высокие частоты, выходящие за пределы частотного диапазона закодированного сигнала.
    LFE low-pass filter: удаляет все частоты выше 120 Гц из низкочастотного канала

    Surround channel processing (обработка тыловых каналов)

    90 degree phase shift: 90-градусный сдвиг фазы левого и правого тыловых каналов для качественного даунмикса в формат Dolby ProLogic при прослушивании звука через стерео систему.
    3 db attenuation: ослабление на 3 дБ уровеня тыловых каналов для лучшей совместимости с домашними декодерами Dolby Digital.
2. Снять галку "RF overmodulation protection".

    Пояснения

    Опция определяет, использовать ли цифровой фильтр в алгоритме защиты звукового канала от перегрузки по уровню. Т.е. предназначена для гашения каких либо всплесков.
3. Выставить "Dinamic range compression" в "Film: Standart"

    Пояснения

    Компрессия динамического диапазона, характеристика компрессии звука для оптимального воспроизведения конечного материала. Т.к. эта характеристика является лишь метаданными и на процесс сжатия не влияет, то можно выставить желаемое значение. Чтобы не было вообще никакого влияния при воспроизведении нужно выставить значение в "None".
4. Выставить "Dialog normalization", "Mix level", "Center mix level", "Surround mix level", "Room type" в соответствии с параметрами исходной дорожки.

    Пояснения

    Эти параметры являются по сути метаданными, т.е. никак не влияют на кодировку (пишутся в дополнение к кодированному звуку - как "ц.у." для плеера). Поэтому и на распаковку никак повлиять не могут - если в распаковщике все улучшизмы отключены. Но для нормального звучания на бытовом плеере это важные вещи - самая сердцевина философии Dolby в отношении AC3.
    Dialog normalization: определяет уровень громкости центрального канала.
    Center mix level: определяет уровень центрального канала относительно левого и правого при микшировании этих трех каналов в два в системах, не имеющих центрального канала.
    Surround mix level: определяет уровень громкости тыловых каналов относительно левого и правого при микшировании в системах, не имеющих тыловых динамиков.
    Copyright bit: при желании можно задать защиту от копирования.
    Original bit stream: определяет, является ли закодированный файл оригинальным или копией.
    Mix level: параметр говорит об уровне звукового давления при финальном микшировании.
    Room type: параметр говорит о типе помещения, в котором это микширование происходило.
      Эти данные можно посмотреть в Sonic Foundry Soft Encode: пункт меню "File -> Verify File".

    Иллюстрация

5. Выставить битрейт в поле "Data rate"

    Пояснения

    Стандартом является 448 kbps.
6. Отметка в поле "Save frames in Intel byte order" определяет, в каком формате будут сохранены файлы - Motorola или Intel. Стандартом является формат от Motorola, поэтому ставить галку не надо.

Sonic Foundry Soft Encode (Dolby Digital)

У данного кодировщика (вернее у встроенной в него древней версии Ac3-плугина) имеется неприятная особенность - ставит слишком сильные флаги сжатия динамического диапазона на некоторых участках, в результате чего плеер, отслеживающий эти флаги, начинает безбожно снижать уровень громкости при воспроизведении этих фрагментов фильма. Лично я бы не рекомендовал его использование. Добавлено Mikky72.
1. Открываем все моно-дорожки.
2. Выставляем их положение звучания.

    Иллюстрация (5.1)

3. Выставляем необходимые настройки в пункте меню "Options -> Encode Settings...".

    Иллюстрация (5.1)

    Настройки должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.


    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.
4. Сохраняем результат через пукнт меню "File -> Encode...".
Возможные проблемы: Если начинает "вылетать", то можно попробовать удалить из реестра все записи связанные с программой.

Minnetonka Audio SurCode for Dolby Digital (Dolby Digital)

1. Указываем имя для сохранения результата. В списке форматов нужно выбрать "AC3 Encoded Files (*.ac3)".
2. Выставляем число каналов.
3. Открываем все моно-дорожки согласно их положению.

    Иллюстрация (5.1)

3.1. Выставляем необходимые настройки в пункте меню "Options -> Encoder Options...".

    Иллюстрация (5.1)

    Настройки должны быть такими как указано ниже. Кроме битрейта "Data Rate" (его выставляете таким как нужно), а так же "Dialog Normalization" (значение нужно выставить как у исходного файла AC3, либо оставить по-умолчанию).

    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.
4. Запускаем процесс сжатия кнопкой "Encode".

Sonic Audio Transcoder (Dolby Digital)

Этот конвертер идет вместе с Sonic Scenarist Pro.
У него есть один существенный недостаток - не берет звук с битностью более 16, что не соответствует стандарту AC3. Поэтому его использование запрещено для изготовления раздач на форуме.

    Иллюстрация (5.1)


    Настройки "Advanced" должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.

    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.
1. Выставляем "Audio coding mode" и активируем при необходимости "Low frequency effects".
2. Загружаем дорожки соответственно их положению звучания.
3. Выставляем "Audio bit rate".
4. Указываем имя выходного файла в "Save encoded file to".
5. Жмем "Start".

Sony Vegas, Sony SoundForge (Dolby Digital)

Активация кодировщика AC3 Pro:
Чтобы активировать кодировщик "AC3 Pro" в продуктах от Sony нужно создать файл с расширением "*.reg" и следующим содержимым:
Для Windows XP
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Sony Media Software\AC-3 Encoder\1.0\License]
"CurrentKey"="H3-XXXXXX-XXXXXX-XXXXXX"
"keyRegFile"="H3-XXXXXX-XXXXXX-XXXXXX"
Для Windows 7 64-bit
[HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Sony Media Software\AC-3 Encoder\1.0\License]
"CurrentKey"="H3-xxxxxx-xxxxxx-xxxxxx"
"keyRegFile"="H3-xxxxxx-xxxxxx-xxxxxx"
, где вместо "H3-XXXXXX-XXXXXX-XXXXXX" подставить ключ, который можно сгенерировать любым генератором ключей для продукции Sony. Далее нужно лишь выполнить этот файл, чтобы данные прописались в реестре операционной системы.
Создание многоканального 5.1 звука:
1. Создаем проект с многоканальным звуком. Пункт меню "File -> New".

    Иллюстрация (5.1)

2. Загружаем дорожки и выставляем их положение звучания.

    Иллюстрация (5.1)

Внимание! По умолчанию все динамики в панораме звучания каналов включены (они подсвечены голубым), а надо оставить всего лишь один, т.е надо отлючить все кроме обведенного кружочком. Иначе звук размажется по всем активным (подсвеченным) динамикам. Центральную оранжевую точку в данном случае двигать никуда не надо.
Цвета интерфейса в Вегасе могут изменяться в настройках - либо "классическая" схема с "серо-голубой" панорамой (активный динамик голубой, как на картинках выше), либо "модная тёмная" с менее наглядной черно-серой панорамой (активный динамик рельефно прорисован, а отключенные - серые без прорисовки). Чтобы быть уверенным, что Вы делаете правильно, и не путаться в цветах при настройке панорамы - делайте так как написано в Хелпе самой программы:
Чтобы данный трек звучал только из конкретного канала, сделайте клик мышкой по этому динамику на схеме ПРИ НАЖАТОЙ КЛАВИШЕ "Ctrl".
Второй вариант застраховаться от ошибок - сделать двойной клик по панораме, чтобы она увеличилась. И тогда, например, для центрального канала должно быть так (сделал для двух вариантов цветовой схемы):

3. В меню "File -> Render As" выбираем вариант Ac3 Pro , выставляем необходимые настройки и битрейт, сохраняем результат.

    Иллюстрация (5.1)

    Настройки должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.



    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.

Чтобы сделать стерео есть три варианта:
1. В проекте "5.1" указать только левый и правый моно каналы в панораме.

    Иллюстрация

2. В проекте "стерео" открыть стереодорожку. Бегунок панорамы оставить без изменений - по центру.

    Иллюстрация

3. В проекте "стерео" открыть левый и правый моно каналы. Развести в соответствующие каналам стороны бегунки панорамы и через контекстное меню выставить у каждого канала опцию "Pan Type -> Constant Power". Последнее требуется для того, чтобы сохранить исходный уровень громкости.

    Иллюстрация


Осталось только запустить процесс сжатия.
В свойствах кодировщика нужно указать режим 2.0 и задать битрейт.

    Иллюстрация


Dolby Media Producer Suite (Dolby Digital, Dolby Digital Plus, Dolby TrueHD, MLP Lossless)

Утилита для MacOS.

DTS

Мнение

Немного тестировал. При использовании суркода при кодировании с битрейтом 768 kbps частотный диапазон ограничен, если мне не изменяет память, до 19 kHz, чего не наблюдается при кодировании с таким битрейтом у прог DTS-HD MAS и DTS Pro Series Surround Encoder (доходит до 20 kHz). Кроме того, на мой слух закодированная суркодом дорожка звучит немного более жестко, чем у двух других кодировщиков - у них звучание немного помягче. По указанным причинам я давно отказался от суркода сначала в пользу DTS Pro Series Surround Encoder, а затем и в пользу DTS-HD MAS при появлении последнего.Panas27-Окт-10 14:52

DTS-HD Master Audio Suite

Актуальный официальный многоформатный кодировщик от Digital Theater Systems, Inc.

Иллюстрация


Программа достаточно проста и последовательна. При выборе какого либо из параметров остальные становятся доступны согласно спецификациям. Поэтому накосячить не возможно.

1. Выбираем выходной формат.

  • Blu-ray Disc (.dtshd) - формат для Blu-ray
  • DVD(.cpt) - формат для DVD

2. Выбираем тип потока.

  • DTS-HD Master Audio - формат сжатия без потерь, поддерживает до 7.1 каналов, 48kHz/96kHz/192kHz частоту дискретизации. Для частоты дискретизации 192kHz поддерживается только от 2.0 до 5.1 каналов. Формат используется на дисках Blu-Ray.
  • DTS-HD High Resolution Audio - формат сжатия с потерями, поддерживает до 7.1 каналов, битрейт до 6Мбит. Формат используется на дисках Blu-Ray.
  • DTS-ES - поддерживает до 6.1 Discrete каналов (все каналы представлены отдельно), битрейт до 1.5Мбит.
  • DTS 96/24 - поддерживает до 6.1 Matrix каналов (центральный тыловой канал закодирован в тыловых боковых), битрейт до 1.5Мбит, частота дискретизации 96kHz. Формат используется на дисках Blu-Ray и DVD.
  • DTS - поддерживает до 5.1 каналов, битрейт до 1.5Мбит. Формат используется на дисках Blu-Ray и DVD.

3. Выбираем систему каналов.

4. Выбираем частоту дискретизации.

  • DTS-HD Master Audio - доступно 48, 96 и 192 kHz
  • DTS-HD High Resolution Audio - доступно 48 и 96 kHz
  • DTS-ES - доступно 48 kHz
  • DTS 96/24 - доступно 96 kHz
  • DTS - доступно 48 kHz

5. Подключаем исходные данные.

Перетаскиваем мышкой в окно программы на соответствующие места моно каналы. Дорожки должны быть 16 или 24-битные. Если дорожки подключились, то заполнятся поля продолжительности, частоты дискретизации и разрядности.

6. Указываем уровень нормализации диалогов.

По-умолчанию выставленное значение равно -31, что не оказывает никакого эффекта. Именно так рекомендует DTS.

7. Указываем битрейт.

В зависимости от выбранного формата и типа потока становятся доступны различные значения битрейта. Исключение составляет DTS-HD Master Audio. В этом случае задаваемый битрейт является битрейтом ядра.

8. Указываем директорию куда сохранять результат.

Надо просто указать путь куда будет сохранен результат. Для этого надо нажать кнопку "Save To" и в появившемся диалоге указать папку.

9. Прописываем имя выходного файла.

Надо в поле "File Name" ввести имя выходного файла.

10. Запуск процесса.

Если все указано верно, то после нажатия кнопки "Encode" откроется окно очереди с одним активным заданием и запустится процесс сжатия.

DTS Pro Series Surround Encoder

Здесь ничего нет.

Minnetonka SurCode

Уже устаревший кодировщик сделанный по лицензии Digital Theater Systems, Inc.

Иллюстрация

1. Загружаем моно треки соответственно их положению звучания.
2. Указываем куда сохранять результат.
      По умолчанию при любом выборе битрейта программа кодирует с битрейтом 1536kbps. Если хотим получить результат с битрейтом 768kbps, то при сохранении надо выбрать тип файла "DTS Compact (*.cpt)". Потом достаточно просто переименовать файл и сменить расширение на "*.dts".
3. Переходим в меню "Options -> Encoder Options...".

    Иллюстрация

4. Выставляем битрейт.
5. Выставляем частоту дискретизации
6. Жмем "Encode".

AAC

MeGUI+NeroAAC

NeroAAC - бесплатный и качественный кодировщик от компании Nero.
Устанавливаем MeGUI. Из архива NeroAACCodec\win32" копируем neroAacEnc.exe в папку MeGUI.

Иллюстрация

Запускаем MeGUI и выбираем:
1. Источник. Например мультиканальный *.wav или *.avs скрипт, который может быть полезен в случае, если мультиканальный *.wav превышает размер в 4Гб и источником служит набор моно каналов. Этот способ описан разделом выше - "Сведение моно дорожек в один файл".
2. Имя получаемого файла.
3. Кодировщик и его настройки. Выбираем шаблон "Nero AAC: *scratchpad*".

    Нажимаем кнопку "Config" и переходим в меню настроек кодировщика.

    Иллюстрация

    1. Лучше оставить как показано на скрине. Таким образом будут сохранены исходные параметры аудиодорожки - количество каналов и частота дискретизации. При желании можно поменять значение "Output Channels":
    • Keep Original Channels - сохранение каналов источника.
    • Downmix multichannel to Stereo - микширование в стерео.
    • Downmix multichannel to Dolby Pro Logic - микширование в стерео по схеме Pro Logic (получаем псевдо 4.0 (3/1), т.к. при воспроизведении из стерео выделяются центральный и тыловой каналы).
    • Downmix multichannel to Dolby Pro Logic II - микширование в стерео по схеме Pro Logic II (получаем псевдо 5.0 (3/2), т.к. при воспроизведении из стерео выделяются центральный и тыловой стерео каналы).
    • Convert to mono - микширование в один моно канал.
    2. Снимаем галку с "Normalize Peaks to", если нет необходимости нормализовать громкость звука.
    3. Выбираем профиль сжатия "AAC-LC" как наиболее качественный.
    4. Выбираем пункт "Variable Bitrate" и выставляем желаемое качество (от 0 до 1). Обычно хватает 0.4-0.5. Так же можно задать желаемый битрейт выбрав опции "Adaptive Bitrate" или "Constant Bitrate".
    5. Завершаем установку настроек кнопкой "OK".
4. Контейнер, в который будет упакован звук. Выбираем "MP4-AAC".
5. При необходимости можно сдвинуть дорожку указав нужное значение сдвига в поле "Delay" в миллисекундах. Положительное значение - задержка звука. Отрицательное значение - опережение звука.
6. Нажимаем кнопку "Enqueue" чтобы поставить задачу сжатия в очередь.
7. Переходим на вкладку с очередью заданий.

Иллюстрация

1. Видим нашу задачу в очереди.
2. Запускаем процесс сжатия кнопкой "Start".

Иллюстрация

Должно появиться окно отображения процесса сжатия. По окончании процесса получим звук в формате AAC-LC в контейнере MP4-AAC.
Если ничего не происходит, а в поле "Status" отображается значение "error", то надо перейти на вкладку "Log", развернуть последнюю ветку "Error starting job". Там будет строка "Exсeption message", в которой описывается причина ошибки. В данном случае - отсутствие файла кодировщика в папке MeGUI.

Иллюстрация



Методы работы с аудиоредакторами

Групповой монтаж в Adobe Audition через Multitrack

Чтобы перейти в режим Multitrack нужно выбрать в меню пункт "View -> Multitrack View"

Иллюстрация


Далее открываем нужные аудиоканалы, выделяем их все в списке и добавляем в Multitrack через контекстное меню "Insert Into Multitrack".

Иллюстрация


Через пункт меню "Edit -> Select All" выделяем все составляющие Multitrack.
Блокируем и группируем через пункты меню "Clip -> Lock in Time" и "Clip -> Group Clips".
Соответствующие значки появятся в левом нижнем углу каждой составляющей Multitrack.

Иллюстрация


Теперь можно редактировать все каналы оптом.
[Профиль] [ЛС]
Вернуться к началу
Показать сообщения:    
Тема закрыта

Текущее время: 25-Ноя 10:08

Часовой пояс: UTC + 3



Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы можете скачивать файлы