Технология не столько сложная, сколько малопонятная.
Например, в производстве звука для телевидения из технических параметров следует учитывать громкость, пиковый уровень (чтобы не было искажений), моносовместимость и небольшой динамический диапазон телевизоров. Все это указано в технических требованиях телеканалов.
В большом кино технические вопросы иные, ограничений меньше. Но гораздо шире творческие возможности. Главное, чтобы в референсном зале все звучало, как надо, тогда в залах, построенных правильно, все будет примерно также.
В пространственном звуке — ничего не понятно и все постоянно меняется. Например, в августе рекомендовалось делать мастер с частотой дискретизации 44.1кГц, а в ноябре — уже 48кГц. Громкость измерять практически невозможно, да и к какой стремиться — нигде не сказано. Требуемый пиковый уровень для защиты от искажений может сильно отличаться для каждого проекта.
Нет никаких нормативов, но получить брак очень легко! Рекомендации постоянно меняются!
Кроме того, четкого панорамирования требуют все звуки! Причем, панорамирования не в одном измерении (как в стерео — L/R), не в одной плоскости (как в кино — L/R/Ls/Rs и центр, как главный заэкранный канал), а в 3D! Не только появляются верх (как в Dolby Atmos) и низ, еще и исчезает экран, зритель может смотреть и слушать куда угодно!.
Объем работ сильно зависит от финальной платформы для показа: для ютуба следует сделать один мастер, для facebook — немного иной, для gear VR третий, для создания приложения на Unity — четвертый. И так далее.
Все это заставляет работать очень кропотливо, многократно переслушивать материал, выгонять и перепроверять итоговый мастер несколько раз. При этом большая часть работы проходит в наушниках (мы же работаем для зрителя), что вредно и утомительно.
Стоит заметить еще одну сложность — ресурсоемкость. Для работы с пространственным звуком и видео требуются достаточно мощные компьютеры.