Запись образцов звучания и модуляционные эффекты. Искусственная обработка звуковых сигналов

Среди обывателей существует устойчивое мнение, что устройства обработки звука позволяют улучшить качество работы профессиональной системы звуковоспроизведения. Это правда… Однако, не стоит этот тезис экстраполировать на качество звука, который этой системой воспроизводится.

При применении любых устройств обработки звука, его качество, в принципе, может только ухудшаться. Дело в том, что они вовсе не решают проблему самого звука, а позволяют звукооператорам и звукорежиссерам нивелировать шероховатости исполнения вокалистов и музыкантов, устранить неточности в звучании музыкальных инструментов, скомпенсировать дефекты, вызванные неправильным выбором оборудования и мест его размещения, а также уменьшить влияние на воспроизведение акустических свойств помещений. Но если, например, вокалист хорошо владеет своим голосом и умеет пользоваться микрофоном, то компрессор ему ни к чему.

Изначально, процессы, связанные со специальным искажением воспроизводимого сигнала, использовались только в коммерческих звуковых системах, таких как системы телефонной, радио- или громкоговорящей связи. Сейчас они нашли широкое применение в музыке и используются для придания инструменту или голосу необычности либо ненатуральности звучания. Главным образом, это делается для того, чтобы удивить публику и усилить воздействие от прослушивания произведения.

С научной точки зрения, любое звукотехническое устройство – микрофон, усилитель мощности или акустические системы – это тоже устройства обработки звука. Во-первых, они не идеальны и изменяют амплитуду и фазу сигналов, во-вторых, эти изменения на разных частотах происходят по-разному, а в-третьих, нелинейные искажения в них приводят к появлению в них новых спектральных составляющих. Кстати, первым устройством обработки звука был динамик Leslie, который применялся вместе с электрическим органом Хаммонда в 30-40-е годы XX века и придавал ему «рычащее» звучание.

Параметры и классификация устройств обработки звука

Работа со звуком может осуществляться как в цифровом, так и в аналоговом виде, а то и вовсе без электроакустического преобразования. В связи с этим, необходимо определиться: а что подразумевается под устройством обработки звука?

Итак, мы будем рассматривать программно-аппаратные средства, работающие с электрическими сигналами звуковой частоты (как в аналоговой, так и в цифровой форме) в режиме реального времени. Прежде чем качественно оценить каждый из способов работы с ними, необходимо разобраться, как и с какой целью осуществляется обработка звуковых сигналов.

Все устройства обработки звука можно достаточно условно разделить на 3 группы:

  • устройства, не вносящие в сигнал дополнительных составляющих (аудиопроцессорные блоки);
  • устройства, вносящие в сигнал дополнительные составляющие (звуковые эффекты);
  • устройства, синтезирующие новые сигналы на основе характеристик исходного сигнала (вокодеры).

Аудиопроцессорные блоки

К ним относятся блоки задержки , эквалайзеры , кроссоверы и компрессоры .

Необходимость в блоках задержки появилась в 40-х годах XX века, когда в кино стал использоваться стереозвук. Как известно, человек воспринимает звук как совокупность сигналов, поступающих к каждому из ушей. Анализируя задержку поступающей к каждому уху звуковой волны, наш мозг с легкостью определяет местоположение источника звука.

С помощью блока задержки, используемого, например, в одном из каналов, можно имитировать изменение местоположения источника звука относительно слушателя. Разумеется, что при формировании пространственных эффектов, слушатель охотно вовлекается в звуковую картину. Вообще, задержка звука – естественное природное явление, связанное с тем, что скорость распространения звуковой волны относительно невысокая. Наверняка всем знаком эффект эха, возникающий при отражении волны от препятствия и преодоления ею обратного пути. Отличие эффекта, реализованного с помощью блока задержки, заключается в том, что «отраженный» сигнал ничем не отличается от исходного. В реальных условиях спектр сигнала при отражении существенно изменяется, так как различные его составляющие по-разному отражаются от препятствий.

Рис. 1. Пример распространения звука в помещении

В настоящее время блоки задержки широко используются в составе аудиопроцессоров. Они служат для выравнивания звукового поля в больших и сложных помещениях, в конференц-залах, а также для создания звуковых эффектов, таких как Echo, Delay, Reverberation и др. Время задержки может регулироваться – от единиц микросекунд до десятков секунд. Аналоговые линии задержки довольно сложны и сейчас не используются. Принцип действия цифровых блоков заключается в записи двоичного представления сигнала в память и последующем воспроизведении этой информации, но с задержкой, которая программно регулируется и устанавливается.

Эквалайзеры (от англ. equalize - выравнивать) появились достаточно давно, и их история развития неразрывно связана с развитием электрических фильтров. Они предназначены для выравнивания амплитудно-частотных характеристик электрических сигналов. Фильтрующие свойства электрических цепей к 30-м годам XX века уже широко использовались для компенсации потерь в каналах передачи сигналов. Первым, кто внедрил эквалайзер в звукоусилительную систему, был Джон Волкман. Прибор EQ-251A использовался в кино для коррекции звука и имел всего два ползунка и переключатель выбора частоты для каждого из них. Уже тогда применение эквалайзеров было необходимо, учитывая низкое качество звукозаписывающей и звуковоспроизводящей техники. После Второй мировой войны были разработаны многополосные эквалайзеры, использующие фильтры с высокой добротностью. В настоящее время эти устройства широко используются как в бытовых, так и профессиональных системах. Простейший, всем известный эквалайзер – регулятор тембра, который включает 2 фильтра: НЧ и ВЧ.



Рис 2. Регулировка амплитудно-частотных характеристик при использовании регулятора тембра

Принцип действия эквалайзера заключается в раздельной регулировке уровней составляющих сигнала на различных частотах. Звуковой сигнал имеет богатый спектр, который с помощью полосовых фильтров разделяется на составляющие. Это дает возможность выделить определенные частоты, составляющие основу звучания музыкального инструмента, либо убрать высокочастотные составляющие, такие как звук касания пальцем струны, сделать тембровую окраску мягче или, наоборот, жестче.



Рис. 3. Функциональная схема эквалайзера


Рис. 4. Регулировка амплитудно-частотной характеристики полосового фильтра

Необходимо помнить, что эквалайзер никогда не добавит в звучание то, чего нет в исходном сигнале, а значит, он не решит проблемы самого сигнала. Поэтому профессионалы предпочитают такие устройства не использовать или используют их с очень большой осторожностью. Небрежное обращение с эквалайзером приводит к неестественности звучания. Например, удаление из сигнала, снимаемого с гитары, низких частот, может улучшить качество записи при сведении его с другими партиями (низкие частоты хоть и не присущи гитаре, но присутствуют в спектре ее сигнала и могут маскировать другие инструменты, влияя на их звучание). Однако, даже незначительное приглушение высокочастотных составляющих (от 1 до 5 кГц) в том же сигнале, приведет к потере четкости и яркости игры, исчезнут детали. Визуально это выражается в сглаживании сигнала, а на слух воспринимается как тусклость и излишняя тонкость звучания. Непрофессиональный подход к эквализации вокальной партии может вызвать не только потерю выразительности и энергичности голоса, но даже изменение букв и окончаний.



Рис. 5. Сглаживание сигнала при применении эквалайзера с настройками в соответствии с рисунком 6


Рис. 6. Пример настройки графического эквалайзера



Рис. 7. Принцип действия параметрического эквалайзера

Различают графические и параметрические эквалайзеры. Графические отличаются большей наглядностью, пользователь с помощью многочисленных ползунков (регуляторов), каждый из которых соответствует фиксированной частоте полосового фильтра, определяет уровень усиления или ослабления сигнала в узкой полосе частот. Центральные частоты фильтров в графических эквалайзерах обычно устанавливаются по октавам. Для выбора центральных частот, кстати, имеется стандарт ISO. При достаточно большом количестве полос на панели управления эквалайзера вполне отчетливо вырисовывается график его амлитудно-частотной характеристики. Поэтому такие эквалайзеры и называются графическими. Их недостаток заключается в том, что пользователь не имеет возможности самостоятельно настраивать полосовые фильтры, т.е. устанавливать их центральные частоты и добротность.

Параметрический эквалайзер позволяет регулировать параметры полосовых фильтров: центральную частоту, добротность (полоса пропускания) и собственно усиление (ослабление). Они просто незаменимы, когда надо вырезать узкий участок спектра сигнала, на котором, например, из-за акустической обратной связи, система звуковоспроизведения начинает возбуждаться. Каждый из нас наверняка слышал характерный свист из акустических систем при поднесении к ним микрофона. Параметрические эквалайзеры сложнее в настройке и несколько дороже. Количество полос в них, как правило, намного меньше, чем в графических.

В настоящее время используются графические и параметрические эквалайзеры, причем как цифровые, так аналоговые и гибридные. Эти устройства могут выполняться как в виде отдельных блоков, так и быть встраиваемыми в микшеры, предварительные усилители, программное обеспечение для работы со звуком.

Например, компания Inter-M широко применяет графические эквалайзеры в трансляционном и профессиональном звуковом оборудовании (IMX-416, PP-9213, PP-9214, PAM-510, PCT-620 и многих других), а также производит эквалайзеры в виде отдельных блоков EQ-2215 (графический, 2 канала, 15 полос), EQ-2131 (графический, 1 канал, 31 полоса), EQ-2231 (графический, 2 канала, 31 полоса) и MEQ-2000 (цифровой смешанного типа, 31 полоса + 8 полосовых фильтров).


Рис. 8. Двухканальный эквалайзер EQ-2215 Inter-M


Рис. 9. Эквалайзер смешанного типа MEQ-2000 Inter-M

Кроссовер предназначен для разделения сигнала на несколько спектральных составляющих. Устройство применяется для построения систем звукоусиления, раздельного по полосам частот. При этом для воспроизведения каждого выделенного кроссовером частотного диапазона (”сверхнизкие частоты”, "низкие частоты", "средние частоты", "высокие частоты") применяется отдельный канал усиления. Для построения систем большой мощности, применение принципа раздельного усиления по частотам является практически единственным решением, обеспечивающим высокое качество звука. История кроссоверов неразрывно связана с историей развития акустических систем. Когда стало очевидно, что с помощью одного электродинамического излучателя невозможно воспроизвести весь спектр звукового сигнала, появилась необходимость в фильтрах, разделяющих энергию между НЧ, СЧ и ВЧ излучателями. Первым кроссовером можно считать обычный пассивный разделительный фильтр.

Различают активные и пассивные кроссоверы. Пассивные отличаются тем, что в них все параметры разделения фиксированы и не могут изменяться пользователем. Активные кроссоверы выполняются или в виде отдельных блоков, или являются частью аудиопроцессорного модуля.



Рис. 10. Кроссовер DIV-9123 Inter-M

В линейке профессионального оборудования Inter-M кроссоверы представлены 19” блоком DIV-9123, который может работать в режиме «стерео» (разделение на 2 полосы в каждом канале + бас) и в режиме «моно» (разделение на 3 полосы + бас). К основным параметрам, регулируемым с помощью активного кроссовера относятся:

  • частота разделения (частота среза фильтра) для каждой полосы;
  • крутизна среза фильтров.


Рис. 11. Разделение полос при использовании кроссовера

Частота разделения для подключения сабвуфера обычно устанавливается в диапазоне от 60 до 250 Гц, а для разделения на средние и высокие – в диапазоне от 80 до 8000 Гц. Крутизна среза характеристик фильтров в зависимости от качества кроссовера составляет от 6 до 72 дБ на октаву. Типовое значение составляет 18-24 дБ на октаву, что соответствует третьему-четвертому порядку чувствительности. Например, DIV-9123 имеет крутизну среза не менее 24 дБ на октаву. Нередко кроссоверы оснащаются дополнительным отключаемым фильтром высоких частот с частотой среза 30 Гц, который позволяет защитить акустические системы от воздействия ультранизких частот.

Компрессор предназначен для сжатия (англ. compress) динамического диапазона сигнала. Иными словами, он уменьшает разницу между самыми громкими и самыми тихими звуками. В недавнем прошлом функции компрессора выполнял звукооператор, предугадывая изменения громкости, например, вокалиста и регулируя, соответствующим образом, громкость воспроизведения. История компрессоров началась во время Второй мировой войны. Тогда, из-за резких скачков уровня громкости в передаваемом сигнале, часто выходили из строя радиостанции. С тех пор компрессор используется практически во всех радиостанциях, в том числе и в широковещательных. Кроме того, устройство нашло применение в звуковых системах. Работа компрессоров помогает повысить разборчивость речи при работе с микрофонами, увеличить цифровое разрешение, а значит, и отношения сигнал/шум, придать «плотность» звучания голосу и инструментам. Результат обработки звука компрессором едва различим на слух. Но при правильной работе с ним тусклый звук можно сделать более острым и насыщенным, голос сделать более жестким, придать ему нехарактерные для исполнителя черты, а дешевые музыкальные инструменты выставить в более выгодном свете. Однако, из-за недостатка квалификации, звук можно непоправимо испортить.

Разновидностей компрессоров, как и других блоков обработки звука, великое множество – цифровые и аналоговые, аппаратные и программные, ручные и автоматические, оптико-электронные, ламповые, транзисторные и т.д.

Любой компрессор имеет 5 основных параметров:

В большинстве современных компрессоров предусмотрены дополнительные режимы, настройки и функции:

Компрессоры также могут быть частотно-зависимыми или многополосными. Многополосный компрессор, по сути, объединяет в себе кроссовер и многоканальный компрессор. Обработка сигнала осуществляется отдельно для различных частотных составляющих, что бывает полезно при сведении музыкальной композиции. Частотно-зависимый компрессор подвергает сигнал обработке только в заданном узком диапазоне частот. Частным случаем частотно-зависимого компрессора является de-esser.

В настоящее время в чистом виде компрессор не используется, он дополняется множеством перечисленных функций, связанных с динамической обработкой сигнала. Например, CN-9102 Inter-M, кроме функций 2-х канального компрессора, выполняет функции лимитера (limiter) и шумоподавителя (noise gate).



Рис. 15. Компрессор CN-9102 Inter-M

Лимитер является частным случаем компрессора с установленной степенью компрессии ∞:1.

Шумоподавитель используется для создания комфортных пауз между сигналами. Он также закрывает вход при падении уровня сигнала ниже порогового значения, которое устанавливается вручную или автоматически исходя из отношения сигнал/шум.

При установке слишком высокого порога noise gate threshold сигнал может существенно потерять информативность, что выражается в уменьшении продолжительности, обрывистости звучания.

Среди других устройств динамической обработки звука можно выделить повышающий компрессор и экспандер. Повышающий компрессор, в отличие от рассмотренного выше, усиливает сигнал при падении его уровня ниже установленного порогового уровня. Экспандер – это устройство, расширяющее динамический диапазон сигнала, то есть противоположное компрессору. Экспандер позволяет улучшить макродинамику произведения, придать живости некоторым инструментам, а также в ряде случаев, исправить перекомпрессию сигнала.

Звуковые эффекты

Устройства, реализующие звуковые эффекты, искажают исходный сигнал, привнося в него что-то новое. Прежде чем рассматривать такие устройства, стоит отметить, что оригинальность звучания музыкальных инструментов, появившихся в XX веке, достигалась не только за счёт мастерства, интересных находок со стороны исполнителей, а в большей степени за счет технических ухищрений. Звуковые эффекты подарили нам множество новых направлений в музыке, современная музыка, театр и кино сегодня без них просто немыслимы. С их помощью можно привнести интригу, изменить характер звучания до неузнаваемости, имитировать объем, движение и многое другое…

Поскольку звуковой сигнал можно характеризовать амплитудой, частотой, начальной фазой и временем его возникновения, то и звуковые эффекты можно разделить на процессы, искажающие амплитуду, частоту, фазу, время или несколько этих характеристик одновременно. Амплитудные преобразования реализуют такие эффекты как, например, distortion , over drive , fuzz , амплитудное vibrato и tremolo , panning , ADSR и др. К эффектам задержки относятся reverberation , delay , echo , flanger , chorus . К эффектам, искажающим фазу, например, относится phaser . Частотные преобразования реализует одна из разновидностей эффекта vibrato , а также эффект pitch .

Эффект delay , как уже упоминалось, связан с задержкой сигнала и последующего сложения его с исходным звуковым сигналом. Сам по себе delay используется редко, так как звук при этом получается неестественным. В основном данный эффект характеризуется временем задержки и соотношением амплитуд исходного сигнала и его копии. Если установить время задержки более 60-100 мс, то человеческое ухо будет воспринимать задержанную копию сигнала как отдельный сигнал, то есть, как эхо. Звуки перестанут сливаться, и покажутся отражениями от удаленных преград.

Эффект Echo характеризуется не только увеличенным до 100 мс и более временем задержки, но и изменением спектра сигнала. Это связано с тем, что в природе различные частотные составляющие звукового сигнала, отражаясь от преград, имеют различную степень затухания. Как известно, лучше всего отражаются низкочастотные составляющие.


Рис. 16. Спектр звукового сигнала при реверберации


Рис. 17. Акустическая комната для имитации реверберационных свойств помещений

Reverberation (англ. – повторение, отражение) в настоящее время относится к наиболее популярным звуковым эффектам. Реверберация – природное явление, и, как многие другие природные явления, широко используется человеком в его деятельности. Суть эффекта заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные интервалы времени. Отличие от Delay состоит в том, что, во-первых, при реверберации количество копий сигнала значительно больше; во-вторых, с увеличением времени задержки сигнала, его амплитуда уменьшается; в-третьих, относительное время задержки нельзя установить большим.

Эффект Reverberation позволяет имитировать геометрию помещения, покрытие его стен, пола и потолка. С его помощью можно обеспечить иллюзию, превратив маленькую, заглушенную на сто процентов, комнату звукозаписи в огромный кафедральный собор или туннель. У слушателя возникает ощущение объемного гулкого помещения. Тембр музыкальных инструментов обогащается, голос приобретает напевность, а некоторые его недостатки удачно маскируются.

Для сравнения реверберационных свойств помещений было введен термин – время реверберации. Данное понятие можно сформулировать так: это время, за которое уровень воспроизводимого импульсного сигнала уменьшается на 60 дБ.

История устройств, реализующих эффект reverberation, началась с появлением эхо-камер. Позже использовались стальные листы, колебания в которых вызывались электромагнитным приводом. Реверберация получалась не трехмерная, а плоская, а сам сигнал имел характерный металлический призвук. В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы (преимущественно в гитарных усилителях). С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, возбуждались механические колебания, которые с задержкой достигали другого конца пружины, связанного с датчиком. Эффект повторения звука был обусловлен многократным отражением волн механических колебаний от концов пружины. Качество звука в пружинном ревербераторе было чрезвычайно низким. Пружина воспринимала любые колебания воздуха и пола. Кроме того, звук имел ярко выраженную "металлическую" окраску, а время реверберации не регулировалось. Позже на смену пружинным пришли магнитофонные ревербераторы. Механизм формирования эхо-сигнала в них был довольно прост: исходный сигнал записывался на ленту записывающей магнитной головкой, а затем считывался воспроизводящей магнитной головкой (через время, необходимое для перемещения ленты) и через цепь обратной связи вновь подавался на запись. В цепи обратной связи сигнал уменьшался по амплитуде, что обеспечивало постепенное затухание звука при реверберации. Недостаток магнитофонного ревербератора заключался в том, что при существовавших скоростях протяжки ленты удавалось получить только эффект эха. Для получения собственно реверберации требовалось либо еще сильнее сблизить магнитные головки (чего не позволяла сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем появилась возможность реализовать высококачественные цифровые ревербераторы. В таких устройствах время задержки практически не ограничено, что позволяет на их основе реализовывать все эффекты, связанные с задержкой сигнала. В любом современном цифровом ревербераторе можно выбрать несколько программ, имитирующих как реальные, так и фантастические условия воспроизведения. Они реализуют различные математические модели, имеют различные настройки и параметры. Поэтому, чаще всего, производители создают ряд предустановок, позволяющих воссоздать объемные характеристики неких стандартных помещений. Это помогает звукооператорам быстро освоить новое устройство или программу.

Эффект Flanger можно услышать, например, на остановке общественного транспорта, слушая звук проезжающего мимо автомобиля. Всем известен эффект повышения тона гудка приближающегося поезда, который нам объясняли на уроках физики в школе (эффект Доплера). Естественно, это свойство можно использовать и в музыке. Механизм его реализации был совершенно случайно открыт в 1958 году звукорежиссером Филом Спектором. Он пытался «удвоить» голос, воспроизводя его на двух магнитофонах одновременно, и задел обод катушки с лентой. В результате получился эффект временной модуляции, который Фил назвал flanger (англ. – обод катушки).

Как уже говорилось, эффект delay имитирует неодновременное восприятие человеком звуковых сигналов. В реальности это вызвано различными путями распространения звука от источника к приемнику. При условии неподвижности относительно друг друга источника и приемника звука, а также предметов, от которых он отражается, частота колебания не изменяется, каким бы путем она не достигала наших ушей. Но в реальной жизни это условие редко выполнимо. Если какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это и есть проявление эффекта Доплера. Итак, реальные звуки при распространении претерпевают не только расщепление на несколько звуковых волн и различную для каждой из них задержку, но и неодинаковое изменение частот для разных спектральных составляющих. Flanger имитирует проявление взаимного перемещения трех упомянутых элементов: источника, приемника и отражателя звука. По сути, эффект представляет собой echo c изменяемым по определенному закону временем задержки. Поскольку время задержки при использовании flanger составляет 1 – 25 мс, то мы не воспринимаем исходный и задержанный сигнал раздельно.


Рис. 18. Функциональная схема блока реализующего эффект Flanger

В прошлом, чтобы получить эффект Flanger, вместо одной инженеры использовали несколько акустических систем, размещенных на различных расстояниях от слушателей. В определенные моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалась иллюзия приближения или удаления источника звука.

Эффект Chorus (англ. – хор) превращает звучание одного инструмента или голоса в целый хор. Хоровое пение и одновременное звучание нескольких музыкальных инструментов украшает музыкальное произведение. В электронной музыке создание одинаковых сигналов не представляет сложности. Но, если их сложить вместе, то звучание будет слишком правильным, но безжизненным и тусклым. Дело в том, что хотя исполнители, при работе в оркестре, и стараются играть одинаково, но из-за индивидуальных особенностей источников, звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека, эти немного неодинаковые колебания взаимодействуют, образуя, так называемые, биения. За счет биений спектр звука обогащается. Считается, что предельным случаем chorus является унисон – одновременное звучание, слегка отличающихся по частоте, двух источников. Именно унисон лежит в основе звучания двенадцатиструнной гитары и аккордеона. В аккордеоне, например, звук каждой ноты генерируется узлом, которые содержат два язычка, специально настроенных с небольшой (в единицы герц) разницей в частотах. В двенадцатиструнной гитаре звук извлекается одновременно из пары струн, настроенных в октаву. Разница в частотах образуется естественным путем, из-за невозможности идеально одинаково настроить струны инструмента. Ничтожная разница в частотах голосов певцов или инструментов и служит причиной красивого звучания.

По сути, все алгоритмы реализации эффекта chorus сводятся к тому, что копии сигнала с небольшой задержкой складывается с исходным сигналом. Но, в отличие от механизма реализации эффекта echo, спектр каждой копии сигнала незначительно сдвигается по частоте, т.е. подвергается частотной модуляции. Частотные сдвиги и время задержки для каждой из копий сигнала могут изменяться во времени, что обеспечивает непрерывное изменение спектра. При этом период полного цикла этих изменений обычно настолько велик, что повторяемость свойств сигнала не ощущается. В настоящее время Chorus стал одним из эффектов, имеющихся практически в каждом синтезаторе и многих звуковых картах. Он имеет множество разновидностей. Необходимо отметить, что чрезмерное употребление данного эффекта может привести к ухудшению разборчивости звучания голоса и к "засорению" музыкального произведения.


Рис. 19. Принцип действия эффекта ADSR

К амплитудным преобразованиям, в принципе, относится такой процесс как усиление, при котором амплитуда сигнала увеличивается или уменьшается пропорционально некоторой постоянной величине. Если задаться целью, изменить коэффициент усиления или ослабления сигнала по определенному закону, то мы в итоге получим такие звуковые эффекты как, например, ADSR (A ttack, D ecay, S ustain, R elease). Данный эффект широко используется в синтезаторах и позволяет с помощью 4-х параметров описать функцию, по которой изменяется амплитуда воспроизводимого сигнала.

Это обеспечивает схожесть электронного музыкального инструмента с реальным, например, такого как синтезатор. Если орган звучит ровно, пока нажата клавиша, то звук, издаваемый гитарой, имеет максимальную громкость только в момент удара по струне, после чего он плавно затухает. Необходимо отметить, что ADSR является самым примитивным способом описания огибающей сигнала – современные синтезаторы гораздо сложнее. Эффект может применяться не только в отношении каждой ноты, но и в отношении некоторых участков музыкального произведения. В этом случае его принято называть Envelope . С помощью такого преобразования, сигнал, записанный с равномерной громкостью (интенсивностью) на всей его протяженности, можно сделать медленно нарастающим вначале и медленно спадающим в конце. В стереосистемах, изменением уровня громкости составляющих одного и того же сигнала в разных каналах, можно добиться эффекта перемещения источника звука по стереопанораме. Это реализуется с помощью таких эффектов, как Panning / Ping-pong .


Рис. 20. Амплитудная модуляция лежит в основе эффекта амплитудного Vibrato

Сущность амплитудного vibrato состоит в периодическом изменении уровня громкости звукового сигнала. Частота, с которой происходит изменение амплитуды, выбирается в диапазоне от долей герца до 10 Гц. При выходе за эти рамки необходимый эстетический эффект не достигается. По сравнению с тембром исходного сигнала, тембр сигнала с амплитудным вибрато богаче, и его широко используют, например, при пении. Степень проявления эффекта характеризуется глубиной вибрато: n = Sv/Si, где Sv – максимальное изменение амплитуды сигнала с вибрато, Si – амплитуда исходного сигнала. Глубина вибрато может устанавливаться от 0 до 1.

Особой разновидностью амплитудного вибрато является tremolo , отличительной чертой которого являются относительно высокая частота вибрации (10–12 Гц), глубина вибрато n = 1 и импульсная форма результирующего сигнала. Тремоло, например, является основным приемом игры на мандолине. Амплитудное vibrato и его частный случай tremolo используют достаточно редко, особенно для обработки вокала.

Такие эффекты, как Over drive , Distortion и Fuzz реализуются за счет нелинейных искажений, возникающих при перегрузке усилителя. Их история началась в середине прошлого века, когда тембру электрогитары стали уделять большее внимание. В конце пятидесятых годов, например, широко применяли пружинные ревербераторы, встроенные в комбо-усилители. Для большой громкости гитарные усилители нередко перегружались как по входу, так и по выходу.

При перегрузке по входу, то есть при подаче на вход усилителя сигнала слишком большого уровня, синусоидальная волна обрезается, и результирующей формой волны становится уже не синусоида, а квазитрапеция, имеющая иной характер звучания. Аккорды при этом звучат очень грязно, с хрипом и ревом, так как образующиеся в результате интермодуляции комбинационные частоты затрудняют интонационную разборчивость нот, составляющих аккорд. Отдельные мелодические ноты мало напоминают тембр гитары – но, удивительное дело, этот звук понравился и музыкантам, и публике.



Рис. 21. Нелинейные искажения при перегрузке усилителя по входу

Over Drive, Distortion и Fuzz реализуются с помощью лимитеров и отличаются только степенью вносимого искажения. Например, Over drive (англ. – перегрузка) используется для искажения только самых громких звуков. Когда гитарист начинает играть громче, сигнал попадает в область действия лимитера и верхушка сигнала обрезается. В результате, инструмент приобретает очень интересный характер, такой эффект украшает его звучание, как легкая хрипота украшает голос вокалиста. Distortion (англ. – искажение) и Fuzz искажают сигнал в значительно большей степени, приближая его форму к прямоугольной. Звук зачастую получается слишком грязный, поэтому используются дополнительные фильтры (эквалайзер) для сглаживания «острых углов» в звучании.

Эффект Phaser , как это следует из названия, реализуется за счет изменения мгновенного значения фазы сигнала. В принципе, этот эффект очень похож на Flanger и достигается таким же способом. Иногда его даже относят к группе звуковых эффектов задержки сигнала. Отличие заключается в том, что при времени задержки, сопоставимом с периодом колебания, что характерно для Phaser, принято говорить собственно не о временной задержке, а о фазовых сдвигах. И Flanger и Phaser имитируют проявления перемещения источника, приемника или отражателя звука. Чтобы понять их различия можно представить последствия применения этих эффектов. Образно говоря, если бы певец летел к слушателю в зале со скоростью поезда, то получился бы Flanger, а если бы слушатель часто-часто вертел головой из стороны в сторону, то получился бы Phaser. По своей сути Phaser – это эффект с применением фазового вибрато.

Кроме амплитудного и фазового существует частотное и тембровое vibrato. Суть частотного vibrato заключается в периодическом изменении частоты звукового колебания. Этот эффект использовался в музыке задолго до появления электронных музыкальных инструментов и реализовывался, кстати, более простыми способами. Например, скрипка в умелых руках потому и звучит так прекрасно, что едва заметными движениями пальцев вдоль грифа скрипач создает частотное вибрато. На электрогитаре этот эффект реализуется с помощью специального механизма: подвижной подставки для крепления струн и рычага. Реализация частотного вибрато в электронных инструментах и синтезаторах достаточно проста. В радиотехнике этот процесс называется частотной модуляцией. Если изменение частоты производится по периодическому закону, то в результате получается частотное вибрато. При этом спектр сигнала расширяется, тембр перестает быть постоянным и периодически изменяется во времени. Необходимо отметить, что эффект имеет эстетическую ценность только в том случае, если глубина частотного вибрато (относительное изменение частоты звука) невелика. В противном случае создается впечатление, что инструмент расстроен. Частотное вибрато используется само по себе, а также является составной частью в более сложных звуковых эффектах.


Рис. 22. Частотная модуляция лежит в основе эффекта частотного Vibrato

Сущность эффекта тембрового vibrato состоит в том, что исходный сигнал пропускается через полосовой фильтр, у которого периодически изменяется либо центральная частота, либо полоса пропускания, либо оба параметра вместе. При этом фильтр выделяет из всего спектра исходного сигнала только те частотные составляющие, которые попадают в "мгновенную" полосу его пропускания. Так как полоса пропускания "дышит" по ширине и "гуляет" по частоте, то тембр сигнала периодически изменяется. Тембровое вибрато может быть не только автоматическим, но и ручным. Вариант ручного тембрового вибрато известен под названием Wah-Wah. Тембровое вибрато звучит необычайно красиво, но для этого необходимо синхронизировать период изменения настроек полосового фильтра со скоростью игры.

Преобразования, связанные с перемещением спектра сигнала вверх или вниз по частоте, реализует такой эффект, как Pitch. При этом к исходному сигналу добавляется его копия, сдвинутая по частоте на определенное значение, обычно в пределах двух октав. Частным случаем Pitch является Octaver. При его использовании копия сигнала имеет частоту в два раза большую или меньшую частоты исходного сигнала. Иначе говоря, исходный сигнал и его копия составляют музыкальный интервал, именуемый октавой.

Звуковые эффекты в настоящее время реализуются как с помощью ПК, так и в виде отдельных программно-аппаратных комплексов. Они в огромном количестве присутствуют в каждом приложении для обработки звука, для сведения музыкальных композиций, таких как Cubase, Sound Forge, Vegas, Ableton и др. Из-за сложности алгоритмов реализации некоторые эффекты вызывают задержку сигнала, что затрудняет их использование в режиме реального времени. Процессорами звуковых эффектов оснащаются музыкальные центры, инструментальные усилители (особенно гитарные) и др. Среди производителей кроме именитых вендоров Ibanez, Marshall, Fender, Pioneer ежегодно появляется множество новых компаний. Каждый производитель реализует эффекты по своему, что несколько затрудняет их использование. С другой стороны любой специалист может подобрать устройство на свой вкус.

Вокодеры

Вокодер (англ. voice coder речевой кодер) был разработан для экономии частотных ресурсов в цифровой радиосвязи. При его использовании в канале связи транслируется не сам сигнал, а способ его синтеза. В результате удается очень существенно сжимать поток данных. Принцип его работы схож собственно с физическим принципом формирования речевого сигнала. Первым таким устройством был параметрический вокодер Дадли. При кодировании на каждом интервале времени (фрейм 20-30 мс) анализируется характеристика речи - "звонкая-глухая". В случае звонкой речи, определяется частота основного тона, а также параметры фильтра, образуемого голосовыми связками и ротовой полостью. Эти параметры вместе с общей оценкой громкости передаются в канале связи. Декодер по полученным параметрам восстанавливает речь – фильтры при воспроизведении гласных возбуждаются импульсами соответствующей величины, следующими с интервалами основного тона, а при воспроизведении глухих звуков – шумом. В результате спектр полученного звука похож на спектр исходной речи. Подобное кодирование обеспечивает высокую разборчивость речи и низкую скорость потока данных (до 2,4 кбит/с).

Естественно, о качестве вокодерной речи строго судить не следует. Резкие изменения спектральных параметров на границах интервалов, грубые переходы между глухими и звонкими звуками, неточная передача основного тона, а также неспособность воспроизводить частично приглушенные звуки и другие "свойства" значительно снизили возможности узнавания голоса и придавали речи неестественный характер. Чтобы повысить качество, низкочастотную часть спектра решили передавать обычным путем, без параметрического кодирования. Такие устройства назвали полувокодерами. Благодаря неискаженной передаче основного тона, достигалось более естественное звучание и качество речи.

Вокодер как многие другие способы обработки звука был заимствован из телефонии музыкантами и впоследствии стал полноценным устройством. Благодаря фирмам-изготовителям музыкального оборудования, ему придали форму и удобство музыкального эффекта. Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя – сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком. Здесь так же нет ограничений и для несущего сигнала. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты – говорящая гитара, барабаны со звуком пианино, гитара звучащая как ксилофон и т.д.

Заключение

Научиться правильно использовать блоки обработки звука довольно сложно. Многие согласятся с тем, что, например, для художественной обработки звука, нужен, прежде всего, талант. Звукооператор и звукорежиссер – это профессия, а значит, работа со звуком – дело настоящих профессионалов. Поэтому мы не ставили перед собой цели – научить кого бы то ни было пользоваться перечисленными устройствами. Обработка звука – это творчество. Каждый мастер самостоятельно, основываясь на собственном опыте, решает поставленные задачи. Свой опыт всегда лучше. Поэтому, вместо того, чтобы давать советы по использованию оборудования, мы, прежде всего, решили познакомить читателя с физикой процессов, которые они реализуют, найти их природные естественные аналоги, перечислить их возможности. Это поможет начинающим звукооператорам заранее представлять – как изменится звук, если они повернут какую-либо ручку на устройстве обработки звука.


ВНИМАНИЕ! Данная статья подготовлена специалистами Группы компании «АРСТЕЛ» и является интеллектуальной собственностью «АРСТЕЛ». Любые публикации данной статьи, а равно ссылки на нее возможны только с разрешения правообладателя.

Модуляция - изменение одного из параметров звука при помощи другого, внешнего источника колебаний. Эффектвибрато - яркий пример модуляционной обработки. Суть эффекта вибрато заключается в периодическом изменении одного из параметров звукового колебания: амплитуды, частоты или фазы. Изменение параметра происходит с очень малой частотой - единицы герц. Далее приведены примеры некоторых видов модуляции.

Амплитудное вибрато включает в себя собственно амплитудное вибрато и тремоло. Сущность амплитудного вибрато состоит в периодическом изменении амплитуды звукового сигнала. Частота, с которой это происходит, должна быть очень небольшой (от долей герца до 10 -12 Гц). Если частота вибрато находится вне этих пределов, то необходимый эстетический эффект не достигается.

Частотное вибрато - периодическое изменение частоты звукового колебания (высоты музыкального тона). Красивое звучание получается только в том случае, когда глубина частотного вибрато (относительное изменение частоты звука) невелика. Колебание высоты тона при частотном вибрато не должно превышать нескольких десятков центов - сотых долей полутона. В противном случае создается впечатление нарушения строя инструмента.

Тембровое вибрато предназначено для изменения спектра звуковых колебаний. Физическая сущность этого эффекта состоит в том, что исходное колебание с богатым тембром пропускается через полосовой частотный фильтр, у которого периодически изменяется либо частота настройки, либо полоса пропускания, либо по различным законам изменяются оба параметра. Кроме автоматического тембрового вибрато используют еще и ручное (чаще даже «ножное», с управлением от педали). Такой вариант эффекта известен под названиями «вау-вау» ( wah - wah ).

8.4 Эффекты, онованные на задержке сигнала

Дилэй (delay) применяется и для получения эффекта однократного или многократного повторения каких-либо звуков. Величина задержки сигнала определяется несколькими факторами. Для коротких и резких звуков время задержки, при котором основной сигнал и его копия различимы, меньше, чем для протяженных звуков. Для произведений, исполняемых в медленном темпе, задержка может быть больше, чем для быстрых композиций.

В виртуальных дилэях, как и в их аппаратных прототипах, обязательно имеются регуляторы величины задержанного сигнала, а также регулятор коэффициента обратной связи (feedback) , который определяет количество повторов.

Реверберация (reverb) позволяет имитировать акустическую среду различных помещений. Сущность реверберации состоит в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные интервалы времени. Этим реверберация напоминает дилэй. Отличие заключается в том, что при реверберации число задержанных копий сигнала может быть значительно больше, чем для дилэя. Теоретически число копий может быть бесконечным. Эффект реверберации значительно расширяет и обогащает стерео-характеристику сигнала.

В основу звуковых эффектов флэнжер (flanger) ифэйзер (phaser) также положена задержка сигнала. И флэнжер, и фэйзер представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная. Флэнжер отличается от фейзера тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот сигнала значительно большее, чем для второго.

Эти количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются различными техническими средствами.

Хорус (chorus) проявляется как эффект дублирования одного и того же звука или партии инструмента. Искусственно выполненный эффект является моделью звучания хора. С одной стороны, голоса певцов и звуки инструментов при исполнении одинаковой ноты должны звучать одинаково, а к этому стремятся и музыканты, и дирижер. Но из-за индивидуальных различий источников звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека эти немного неодинаковые колебания взаимодействуют, образуются так называемые биения. Спектр звука обогащается и, самое главное, «течет, переливается».

Алгоритм работы хоруса сводится к следующему:

Исходный сигнал разделяется на два или несколько каналов;

В каждом из каналов спектр сигнала сдвигают по частоте на определенную величину, частотные сдвиги очень малы, они составляют доли Гц и в ряде случаев изменяются во времени;

В каждом из каналов сигнал немного задерживают во времени, причем величина задержки может меняться (поэтому хорус относится к числу эффектов, основанных на задержке сигнала);

Каждый из каналов позиционирует в свою точку на стереопанораме;

Сигналы, полученные таким способом, суммируют.

В итоге получается сигнал, спектр которого непрерывно изменяется, причем период полного цикла этого изменения столь велик, что повторяемость спектральных свойств сигнала не ощущается.

Методы, используемые для обработки звука:

1. Монтаж. Состоит в вырезании из записи одних участков, вставки других, их замены, размножении и т.п. Называется также редактированием. Все современные звуко- и видеозаписи в той или иной мере подвергаются монтажу.

2. Амплитудные преобразования. Выполняются при помощи различных действий над амплитудой сигнала, которые в конечном счете сводятся к умножению значений сэмплов на постоянный коэффициент (усиление/ослабление) или изменяющуюся во времени функцию-модулятор (амплитудная модуляция). Частным случаем амплитудной модуляции является формирование огибающей для придания стационарному звучанию развития во времени.

Амплитудные преобразования выполняются последовательно с отдельными сэмплами, поэтому они просты в реализации и не требуют большого объема вычислений.

3. Частотные (спектральные) преобразования. Выполняются над частотными составляющими звука. Если использовать спектральное разложение - форму представления звука, в которой по горизонтали отсчитываются частоты, а по вертикали - интенсивности составляющих этих частот, то многие частотные преобразования становятся похожими на амплитудные преобразованиям над спектром. Hапример, фильтрация - усиление или ослабление определенных полос частот - сводится к наложению на спектр соответствующей амплитудной огибающей. Однако частотную модуляцию таким образом представить нельзя - она выглядит, как смещение всего спектра или его отдельных участков во времени по определенному закону.

Для реализации частотных преобразований обычно применяется спектральное разложение по методу Фурье, которое требует значительных ресурсов. Однако имеется алгоритм быстрого преобразования Фурье (БПФ, FFT), который делается в целочисленной арифметике и позволяет уже на младших моделях 486 разворачивать в реальном времени спектр сигнала среднего качества. При частотных преобразованиях, кроме этого, требуется обработка и последующая свертка, поэтому фильтрация в реальном времени пока не реализуется на пpоцессоpах общего назначения. Вместо этого существует большое количество цифpовых сигнальных пpоцессоpов (Digital Signal Processor - DSP), котоpые выполняют эти опеpации в pеальном вpемени и по нескольким каналам.

4. Фазовые пpеобpазования. Сводятся в основном к постоянному сдвигу фазы сигнала или ее модуляции некотоpой функцией или дpугим сигналом. Благодаpя тому, что слуховой аппаpат человека использует фазу для опpеделения напpавления на источник звука, фазовые пpеобpазования стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему подобные.

5. Вpеменные пpеобpазования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во вpемени на pазличные величины. Пpи небольших сдвигах (поpядка менее 20 мс) это дает эффект pазмножения источника звука (эффект хоpа), пpи больших - эффект эха.

6. Фоpмантные пpеобpазования. Являются частным случаем частотных и опеpиpуют с фоpмантами - хаpактеpными полосами частот, встpечающимися в звуках, пpоизносимых человеком. Каждому звуку соот- ветствует свое соотношение амплитуд и частот нескольких фоpмант, котоpое опpеделяет тембp и pазбоpчивость голоса. Изменяя паpаметpы фоpмант, можно подчеpкивать или затушевывать отдельные звуки, менять одну гласную на дpугую, сдвигать pегистp голоса и т.п.

На основе этих методов реализовано множество аппаратных и программных средств обработки звука. Ниже приведено описание некоторых из них.

1. Компрессор (от англ. «compress» - сжимать, сдавливать) - это электронное устройство или компьютерная программа, используемая для уменьшения динамического диапазона звукового сигнала. Понижающая компрессия уменьшает амплитуду громких звуков, которые находятся выше определённого порога, а звуки находящиеся ниже этого порога остаются неизменными. Повышающая компрессия наоборот увеличивает громкость звуков находящихся ниже определённого порога, в то время как звуки, превышающие этот порог остаются неизменными. Эти действия уменьшают разницу между тихими и громкими звуками, сужая динамический диапазон.

Параметры компрессора:

Threshold (порог) - это уровень, выше которого сигнал начинает подавляться. Обычно устанавливается в дБ.

Ratio (соотношение) - определяет соотношение входящего/выходящего сигналов, превышающих порог (Threshold). Например, соотношение 4:1 означает, что сигнал превышающий порог на 4 дБ, сожмётся до уровня 1 дБ выше порога. Самое высокое соотношение ∞:1 обычно достигается с помощью соотношения 60:1, и фактически означает, что любой сигнал, превышающий порог будет снижен до порогового уровня (за исключением коротких резких изменений громкости, называемых "атакой").

Attack и Release (атака и восстановление, рис. 1.3). Компрессор может обеспечить определенную степень контроля над тем, как быстро он действует. "Фаза атаки" это период, когда компрессор снижает громкость до уровня, который определяется соотношением. "Фаза восстановления" это период, когда компрессор увеличивает громкость до уровня определённого соотношением, или к нулю дБ, когда уровень падает ниже порогового значения. Продолжительность каждого периода определяется скоростью изменения уровня сигнала.

Рис. 1.3. Атака и восстановление компрессора.

Во многих компрессорах атака и восстановление регулируются пользователем. Однако в некоторых компрессорах они определяются разработанной схемой и не могут быть изменены пользователем. Иногда параметры атаки и восстановления являются "автоматическими" или "программно-зависимыми", это означает, что их время изменяется в зависимости от входящего сигнала.

Колено компрессии (Knee) управляет изгибом компрессии на пороговом значении, оно может быть острым или округлым (рис. 1.4). Мягкое колено медленно увеличивает соотношение сжатия, и в конечном итоге достигает сжатия заданного пользователем. При жёстком колене компрессия начинается и прекращается резко, что делает её более заметной.

Рис. 1.4. Мягкое и жёсткое колено.

2. Экспандер. Если компрессор подавляет звук после того как его уровень превышает определённое значение, - то экспандер подавляет звук после того как его уровень станет меньше определённого значения. Во всём остальном экспандер схож с компрессором (параметры обработки звука).

3. Дисторшн (англ. «distortion» - искажение) - это искусственное грубое сужение динамического диапазона с целью обогащения звука гармониками. При компрессии волны всё больше принимают не синусоидальные, а квадратные формы за счёт искусственного ограничения уровня звука, которые обладают самым большим количеством гармоник.

4. Дилэй (англ. delay) или эхо (англ. echo) - звуковой эффект или соответствующее устройство, имитирующее чёткие затухающие повторы исходного сигнала. Эффект реализуется добавлением к исходному сигналу его копии или нескольких копий, задержанных по времени. Под дилэем обычно подразумевается однократная задержка сигнала, в то время как эффект «эхо» - многократные повторы.

5. Реверберация - это процесс постепенного уменьшения интенсивности звука при его многократных отражениях. В виртуальных ревербераторах существует множество параметров, позволяющих получить нужное звучание, характерное для какого-либо помещения.

6. Эквалайзер (англ. «equalize» - «выравнивать», общее сокращение - «EQ») - устройство или компьютерная программа, позволяющая изменять амплитудно-частотную характеристику звукового сигнала, то есть корректировать его (сигнала) амплитуду избирательно, в зависимости от частоты. Прежде всего эквалайзеры характеризуются количеством регулируемых по уровню частотных фильтров (полос).

Существует два основных типа многополосных эквалайзеров: графический и параметрический. Графический эквалайзер имеет определённое количество регулируемых по уровню частотных полос, каждая из которых характеризуется постоянной рабочей частотой, фиксированной шириной полосы вокруг рабочей частоты, а также диапазоном регулировки уровня (одинаковый для всех полос). Как правило, крайние полосы (самая низкая и высокая) представляют собой фильтры «полочного» типа, а все остальные имеют «колоколообразную» характеристику. Графические эквалайзеры, применяемые в профессиональных областях, обычно имеют 15 или 31 полосу на канал, и нередко оснащаются анализаторами спектра для удобства корректировки.

Параметрический эквалайзер дает гораздо большие возможности корректировки частотной характеристики сигнала. Каждая его полоса имеет три основных регулируемых параметра:

Центральная (или рабочая) частота в герцах (Гц);

Добротность (ширина рабочей полосы вокруг центральной частоты, обозначается буквой «Q») - безразмерная величина;

Уровень усиления или ослабления выбранной полосы в децибелах (дБ).

7. Хорус (англ. chorus) - звуковой эффект, имитирующий хоровое звучание музыкальных инструментов. Эффект реализуется путём добавления к исходному сигналу его собственной копии или копий, сдвинутых по времени на величины порядка 20-30 миллисекунд, причём время сдвига непрерывно изменяется.

Сначала входной сигнал разделяется на два независимых сигнала, один из которых остаётся без изменений, в то время как другой поступает на линию задержки. В линии задержки осуществляется задержка сигнала на 20-30 мс, причём время задержки изменяется в соответствии с сигналом генератора низких частот. На выходе задержанный сигнал смешивается с исходным. Генератор низких частот осуществляет модуляцию времени задержки сигнала. Он вырабатывает колебания определённой формы, лежащие в пределах от 3 Гц и ниже. Изменяя частоту, форму и амплитуду колебаний низкочастотного генератора, можно получать различный выходной сигнал.

Параметры эффекта:

Глубина (depth) - характеризует диапазон изменения времени задержки.

Скорость (speed, rate) - быстрота изменения «плавания» звука, регулируется частотой низкочастотного генератора.

Форма волны генератора низкой частоты (LFO waveform) - бывает синусоидальной (sin), треугольной (triangle) и логарифмической (log).

Баланс (balance, mix, dry/wet) - соотношение необработанного и обработанного сигналов.

8. Фэйзер (англ. phaser), также часто называемый фазовым вибрато - звуковой эффект, который достигается фильтрацией звукового сигнала с созданием серии максимумов и минимумов в его спектре. Положение этих максимумов и минимумов варьируется на протяжении звучания, что создает специфический круговой (англ. sweeping) эффект. Также фэйзером называют соответствующее устройство. По принципу работы схож с хорусом и отличается от него временем задержки (1-5 мс). Помимо этого задержка сигнала у фэйзера на разных частотах неодинакова и меняется по определённому закону.

Электронный эффект фэйзер создается путем разделения звукового сигнала на два потока. Один поток обрабатывается фазовым фильтром, который изменяет фазу звукового сигнала, сохраняя его частоту. Величина изменения фазы зависит от частоты. После микширования обработанного и необработанного сигналов, частоты, находящиеся в противофазе, погашают друг друга, создавая характерные провалы в спектре звука. Изменение отношения оригинального и обработанного сигнала позволяет изменить глубину эффекта, причем максимальная глубина достигается при отношении 50%.

Эффект фэйзера подобен эффектам фланжера и хоруса, которые также используют добавление к звуковому сигналу его копий, подаваемых с определенной задержкой (т. н. линию задержки). Однако в отличие от фланжера и хоруса, где величина задержки может принимать произвольное значение (обычно от 0 до 20 мс), величина задержки в фэйзере зависит от частоты сигнала и лежит в пределах одной фазы колебания. Таким образом, фэйзер можно рассматривать как частный случай фланжера.

9. Фланжер (англ. flange - фланец, гребень) - звуковой эффект, напоминающий «летящее» звучание. По принципу работы схож с хорусом, и отличается от него временем задержки (5-15 мс) и наличием обратной связи (feedback). Часть выходного сигнала подается обратно на вход и в линию задержки. В результате резонанса сигналов получается фланжер-эффект. При этом в спектре сигнала некоторые частоты усиливаются, а некоторые - ослабляются. В результате частотная характеристика представляет ряд максимумов и минимумов, напоминая гребень, откуда и происходит название. Фаза сигнала обратной связи иногда инвертируется, тем самым достигается дополнительная вариация звукового сигнала.

10. Вокодер (англ. «voice coder» - кодировщик голоса) - устройство синтеза речи на основе произвольного сигнала с богатым спектром. Изначально вокодеры были разработаны в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений. Экономия достигается за счёт того, что вместо собственно речевого сигнала передают только значения его определённых параметров, которые на приемной стороне управляют синтезатором речи.

Основу синтезатора речи составляют три элемента: генератор тонального сигнала для формирования гласных звуков, генератор шума для формирования согласных и система формантных фильтров для воссоздания индивидуальных особенностей голоса. После всех преобразований голос человека становится похожим на голос робота, что вполне терпимо для средств связи и интересно для музыкальной сферы. Так было лишь в самых примитивных вокодерах первой половины прошлого столетия. Современные связные вокодеры обеспечивают высочайшее качество голоса при существенно более сильной степени сжатия в сравнении с упомянутыми выше.

Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя - сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» музыкального инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком синтетического и «живого» происхождения. Так же нет ограничений и на несущий сигнал. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты - говорящая гитара, барабаны со звуком фортепиано, гитара, звучащая как ксилофон.

Б. Блессер, Дж. М. Кейтис

2.1. Введение

К задачам звуковой техники относятся запись, хранение, передача и воспроизведение сигналов, воспринимаемых людьми с помощью органов слуха. На практике чаще всего такими сигналами является обычная музыка, хотя к ним следует отнести также пение птиц, электронную музыку, театральные представления, гидроакустические сигналы и т. д. В отличие от задач цифровой обработки речевых сигналов, где основным требованием является разборчивость речи, при цифровой обработке звуков в большинстве случаев должны также учитываться какие-то критерии точности воспроизведения звуков. Подобные критерии неизбежно имеют субъективный характер, так как окончательное заключение о качестве звука составляется на основе восприятия сигналов слушателями. По этой причине в данной главе часто будет идти речь о человеческом восприятии, причем для специалистов по акустике одной из основных проблем является определение технических параметров звуковых сигналов, влияющих на восприятие этих звуков человеком. В силу широкой распространенности и важности устройств для воспроизведения музыки большая часть работ в области цифровых звуковых систем связана с музыкой. Далее в этой главе музыка, преобразованная в цифровой сигнал, будет рассматриваться как представитель широкого класса сигналов, называемых звуковыми сигналами.

С момента своего возникновения звуковая техника находилась на стыке различных отраслей науки и пользовалась достижениями Химии и физики, особенно таких областей, как электроника, магнетизм и акустика. Цифровая обработка сигналов, которая по своей сущности, видимо, более всего тяготеет к математике, является новейшей отраслью науки, вошедшей в «звуковое семейство». Многие специалисты полагают, что это приведет к скачку в качественных характеристиках звуковых систем. Хотя методы цифровой обработки сигналов только начинают применяться в области звуковой техники, уже сейчас видны связанные с этим

потенциальные возможности. К моменту написания книги данная область техники находилась на начальной стадии своего развития; многие из наиболее сложных методов цифровой обработки пока еще не нашли применения в звуковых системах. Можно не сомневаться, что в ближайшем будущем это положение изменится.

Необходимость цифровой обработки звуковых сигналов с первого взгляда не очевидна. Поэтому следует проанализировать хотя бы часть тех трудностей, с которыми связано появление музыки в квартире слушателя. Цепочка технических устройств при прохождении звука от микрофона до акустической колонки оказывается очень длинной. В нее может быть включено до 100 самостоятельных систем, каждая из которых выполняет свою полезную функцию, но вносит при этом искажения. Довольно часто каждый инструмент ансамбля записывается на отдельную дорожку многоканального магнитофона, причем число этих каналов может доходить до 24. Такой процесс дает звукооператору большие возможности: можно, например, при необходимости заново записать партию какого-либо инструмента. Это также помогает исполнителю избавиться от фонового акустического шума. Однако при такой записи звучание становится несколько неестественным и отличается от того, которое слышится при исполнении в концертном зале, поскольку в записи отсутствует реверберация и могут появиться заметные спектральные искажения, зависящие от положения микрофона. Подобные недостатки часто можно устранить путем коррекции сигналов при их смешивании (микшировании). Микшерный пульт дает возможность звукооператору по-разному обрабатывать каждую дорожку первичной записи. К числу наиболее распространенных методов обработки звуковых сигналов относятся введение искусственной реверберации и других специальных эффектов, выравнивание спектров, сжатие динамического диапазона, подавление шумов, ограничение. По своей сложности этот процесс и выполняющие его устройства приближаются к функциям и аппаратуре Центра управления космическими полетами (NASA).

После того как высококвалифицированный звукооператор объединит обработанные первичные сигналы во вторичную стереофоническую или квадрафоническую запись, ее подвергают дополнительной обработке с тем, чтобы сформировать сигнал, пригодный для записи на грампластинку или магнитную ленту. Полученная рабочая лента используется для управления резцом точного рекордера или магнитокопирователем. В последнее время в рекордерах также появились свои собственные сложные системы обработки сигналов, предназначенные для динамического управления резцом и создающие компенсацию и предыскажения в рамках нелинейной обработки, применяемой как при изготовлении, так и при воспроизведении записей. Более того, первичная копия, полученная в рекордере, является лишь результатом первого этапа сложного процесса, в результате которого получается запись,

проигрываемая дома или на студии. Столь же длинный путь звук проходит и на радиовещании. Акустическая система в доме слушателя и громкоговорители образуют важное последнее звено звуковоспроизводящей цепи. Таким образом, процесс звуковоспроизведения можно представить в виде трех основных этапов:

1. Создание и запись первоначальных сигналов.

2. Хранение и передача этих сигналов.

3. Воспроизведение сигналов в форме акустических волн.

Может показаться, что некоторые сложные элементы процесса звуковоспроизведения являются необязательными, однако оказывается, что каждый этап процесса важен, причем часто как средство исправления технических погрешностей, вносимых на другом этапе процесса. Например, сжатие сигнала на этапе первоначальной записи необходимо потому, что запоминающие устройства хранения имеют ограниченный динамический диапазон.

Многие разработки в области цифровой звукотехники имеют целью замену слабых элементов цепи звукозаписи или звукопередачи. Примерами могут служить цифровые магнитофоны и цифровые системы передачи звуковых сигналов. Несложные по идее, эти системы оказываются сложными в реализации. Одйайо их создание привело к резкому улучшению качества воспроизведения звуков. Управление микшерным пультом также было переведено, на цифровую технику, чтобы освободить звукооператора от трудной обязанности фактического регулирования сотен параметров в реальном масштабе времени. На смену механическим реверберационным устройствам пришли цифровые электронный ревербераторы. Созданы синтезаторы, позволяющие из пары стереофонических сигналов в домашних условиях создавать определенные акустические поля, характерные для больших залов.

В лабораториях нашли применение более совершенные методы для восстановления старых звукозаписей. В настоящее время имеются восстановленные записи выступлений Карузо, сделанных в начале века, причем после исправлений записи крайне низкого качества стали звучать гораздо лучше. Цифровая обработка применяется также в исследованиях, направленных на усовершенствование электроакустических преобразователей. В звуковоспроизводящей цепи громкоговоритель является одним из самых слабых и наименее исследованных звеньев. Он влияет на амплитудные, фазовые и пространственные характеристики получаемого звукового сигнала, а также обусловливает различного вида искажения сигналов. Цифровая обработка сигналов применяется для экспериментального определения физических характеристик акустических преобразователей, а также для оценки влияния этих характеристик на восприятие звука.

Во всех подобных системах имеются общие блоки -аналого-цифровой и цифро-аналоговый преобразователи (АЦП и ЦАП). Висилу своего фундаментального характера вопрос об этих

преобразователях будет рассмотрен здесь самостоятельно. Любые искажения, вносимые на данном этапе обработки сигнала, могут существенно обесценить достоинства цифровой обработки. Характеристики преобразователей необходимо согласовывать с особенностями восприятия звуковых сигналов по ряду причин.

1, Чрезмерно большая разрядность при квантовании отсчетов в АЦП достигается за счет больших экономических затрат, а из-за большой скорости поступления информации на последующих этапах может потребоваться слишком большое быстродействие.

2. Искажения, определяемые приборами, не всегда замечаются на слух.

Вопрос усложняется также конструктивными проблемами, которые могут существенно повлиять на качество работы системы. Поэтому существуют различные способы преобразования и выбор определяется назначением всей системы.

Инженер должен знать соотношение между физическими и электрическими характеристиками системы и кажущимся качеством звука. Классическое определение отношения сигнал/шум, например» основано на вычислении отношения максимальной мощности сигнала к мощности шума, измеренной в отсутствие сигнала. Однако восприятие шума зависит от степени его спектрального сходства или различия с сигналом, от вида распределения вероятностей и характера изменения шума во времени. Так, два различных шумовых процесса, отличающиеся по мощности на 20 дБ, могут создавать помехи, на слух воспринимаемые как одинаковые.

Подобные примеры указывают, что теория звуковых систем в большей мере должна опираться на психоакустические исследования, чем на теорию систем. Теория систем рассматривает пути решения задачи, а психоакустика в данном случае описывает характер желаемого результата. Так, в вышеупомянутом примере цель состоит в том, чтобы сделать шум неслышным, хотя полностью подавлять его не обязательно. Экономические последствия неправильного выбора конечной цели могут оказаться очень печальными. Как правило, шумы 16-разрядного АЦП не воспринимаются ухом и не замечаются приборами, однако стоит этот преобразователь раз в 100 больше, чем 12-разрядный АЦП. Поэтому звуковая техника должна строиться с учетом особенностей и аппаратуры, и слуховой системы человека с тем, чтобы в итоге оптимизировать субъективные оценки качества звуковоспроизведения.

Преобразователи динамического диапазона звуковых сигналов на осн о ве модул и рующих функций

Харитонов Владимир Борисович,

кандидат технических наук, профессор

Зирова Юлия Константиновна,

аспирант кафедры з вукотехники

Санкт-Петербургский государственный уни верситет кино и телевидения.

Преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза является безынерционным. Причем речь идет не о нелинейной обработке мгновенных значений сигнала, которая обладает безынерционностью, но вносит в обработанный сигнал нелинейные искажения. Обработка сигналов по их модулирующим функциям теоретически в ряде случаев решает проблему преобразования динамического диапазона сигналов без внесения в них искажений. На практике, как отмечают авторы , выполнившие аналоговую реализацию устройств обработки модулирующих функций, невозможно добиться теоретических результатов из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций. В данной статье изложены результаты исследования цифровой реализация устройства преобразования динамического диапазона на теоретической основе модуляционного анализа-синтеза, позволившей выяснить потенциал метода средствами точной цифровой обработки сигналов.

Изначально преобразователи динамического диапазона (ПДД) звуковых сигналов применялись в радиовещании для защиты звуковых трактов от перегрузок, согласования диапазона уровней сигналов с динамическим диапазоном каналов, по которым они передаются, и ослабления влияния шума носителей записи. По схожим причинам компрессировали звук для кинематографического канала звукопередачи, поскольку динамический диапазон аналоговых фотофонограмм, как правило, составляет 35–45 дБ, а диапазон уровней звуковой программы (воспринимаемый слухом) может достигать почти 110 дБ. Часто прибегают к компрессированию как речи, так и музыки для сглаживания динамики звука и повышения разборчивости речи на «живых» выступлениях, когда, например, выступающий по каким-то причинам значительно удаляется от микрофона или приближается к последнему. Можно привести еще много примеров применения только амплитудных компрессоров. Но преобразование динамического диапазона не ограничивается его сжатием, а включает еще лимитирование, шумоподавление и экспандирование звуковых сигналов. Все эти виды обработки звука сейчас широко применяются и предположительно еще долгое время будут помогать звукорежиссерам воплощать их творческие идеи и решать технические задачи.

Некоторые причины включения ПДД в звуковые тракты с переходом к цифровым способам записи потеряли свою актуальность: динамический диапазон цифровых носителей записи и звуковых трактов сопоставим с динамическим диапазоном человеческого слуха. Но в кинотеатре, если не сжимать динамический диапазон звукового сопровождения кинофильма при его прослушивании, то тихие фрагменты просто потонут в шумах зрительного зала. Также, если не ограничивать верхнюю границу уровня сигнала, можно оглушить зрителей или перегрузить усилители мощности и кинотеатральные громкоговорители. Таким образом, преобразованиединамического диапазона кинематографического звука необходимо для обеспечения комфортного прослушивания в зале кинотеатра. В формате цифрового звука Dolby Digital , применяемом для записи фонограмм большинства современных фильмов, предусмотрено формирование специального сигнала управления динамическим диапазоном. В аппаратуре воспроизведения предусмотрено использование этого сигнала для регулирования динамического диапазона, причем имеется возможность изменения степени компрессирования в зависимости от условий конкретного зрительного зала. В связи с этим сохраняет актуальность разработки преобразователей динамического диапазона, обеспечивающих высокое качество обработки звуковых сигналов при минимальном вмешательстве звукооператора.

По критерию быстродействия ПДД делятся на две группы: инерционные (с динамически изменяющимся коэффициентом передачи) и безынерционные (мгновенного действия).

Инерционные преобразователи используются в звукотехнике уже в течение многих десятилетий, принцип их работы, достоинства и недостатки достаточно подробно описаны в литературе . Их работа основана на выделении из сигнала огибающей, формировании на основе огибающей управляющего сигнала и последующем перемножении этих двух сигналов: входного звукового и управляющего:

где – входной сигнал, – управляющий сигнал, – выходной сигнал.

Перемножению во временной области соответствует свертка спектров названных сигналов в частотной области.

где – частотный спектр входного сигнала, – частотный спектр управляющего сигнала, – частотный спектр выходного сигнала.

Для формирования сигнала управления применяется низкочастотная фильтрация максимальных или среднеквадратичных значений входного сигнала. В результате такой фильтрации сигнал управления изменяется инерционно, по отношению к изменениям амплитудного или среднеквадратичного значения сигнала. Из-за противоречивости требований, предъявляемых к фильтрации функции коэффициента передачи, возникают недостатки инерционных преобразователей:

· плавное нарастание сигнала управления приводит к выбросам выходного сигнала при резком увеличении сигнала на входе. Эти выбросы могут выйти за пределы линейного участка характеристики передачи звукового тракта. При этом появятся нелинейные искажения;

· резкое нарастание сигнала управления избавит от выбросов, но в то же время сигнал управления приобретет крутой фронт – это обогатит его спектр, а значит, после свертки спектров входного сигнала и сигнала управления значительно обогатится спектр выходного сигнала. Это обусловит появление слышимых эффектов работы ПДД;

· замедленный процесс восстановления коэффициента передачи при резком уменьшении сигнала приводит к появлению эффекта «дыхания шума паузы». Этот эффект выражается в заметном на слух снижении громкости тихого фрагмента сигнала с постепенным последующим ее увеличением;

· резкое восстановление коэффициента передачи обусловит появление пульсаций в управляющем сигнале при обработке звукового сигнала с интенсивными низкочастотными составляющими. Эти пульсации вызывают амплитудную модуляцию обрабатываемого сигнала и приводят к появлению нелинейных искажений.

Для того чтобы перечисленные искажения не были заметны на слух, необходимо подбирать оптимальные параметры фильтра для определенного вида звукового материала: речи или музыки.

Известны безынерционные ограничители уровня сигнала, в них ограничению подвергаются мгновенные значения сигнала, превышающие некоторое заданное пороговое значение сигнала. При этом изменяется форма сигнала и появляются большие нелинейные искажения, поэтому такие устройства практически не используются. Их применяют, в основном, как средство защиты от перегрузки тракта передачи сигнала.

Безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза свободно от перечисленных недостатков инерционных устройств и вышеупомянутых безынерционных ограничителей уровня сигнала. В теории модуляционного анализа-синтеза все преобразования, в том числе преобразование динамического диапазона, основываются на выделении из сигнала и последующей обработки модулирующих функций: амплитудной и/или частотной. Кроме преобразования динамического диапазона сигнала, на основе модуляционных преобразований возможно осуществить: безынерционное управление тембром звуковых сигналов , сжатие частотного диапазона звуковых сигналов на основе выделения и нелинейной обработки их мгновенной частоты и другие виды преобразований .

Аналоговый безынерционный компрессор на основе модулирующих функций оказался довольно сложным в реализации. Результаты его работы, представленные в , показывают, что все недостатки инерционных компрессоров в данном случае отсутствуют. Но из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций результаты далеки от теоретически возможных. В связи со сложностью аналоговой реализации, безусловно, огромный интерес представляет создание цифрового безынерционного ПДД на основе модулирующих функций. Во-первых, это позволит улучшить качество обработки звука за счет использования алгоритмов преобразования динамического диапазона, недоступных или труднореализуемых с необходимой точностью в аналоговой форме. Во-вторых, в связи с повсеместным использованием цифровых способов записи, обработки и воспроизведения звука наиболее естественно выполнять преобразование динамического диапазона также в цифровой форме. Точная цифровая реализация ПДД на основе модуляционного анализа-синтеза позволит в полной мере выяснить потенциальные возможности метода, чему до сих пор препятствовали принципиально неустранимые погрешности аналоговой реализации.

Перед изложением результатов работы цифрового безынерционного компрессора имеет смысл рассмотреть подробнее модулирующие функции и основы модуляционных преобразований сигналов.

Согласно теории модуляционного анализа-синтеза, произвольный сигнал можно представить как результат совместного применения амплитудной и частотной модуляции:

,

если удачно выбрать пару модулирующих функций – амплитудную модулирующую функцию и – частотную модулирующую функцию. В теории доказано, что для однозначного выбора этой пары функций необходимо исходный сигнал дополнить опорным с помощью преобразования Гильберта. Понятия о модулирующих функциях сигнала были введены еще в 1945 г. Д. Габором .

Огибающей (амплитудной модулирующей функцией) пары сигналов, сопряженных по Гильберту , называют неотрицательную функцию времени

.(1)

Мгновенной частотой (частотной модулирующей функцией) пары сигналов называют производную от текущей фазы:

Введенные Д. Габором понятия нашли широкое применение при описании преобразований узкополосных сигналов.

Ю. М. Ишуткин в предложил обобщить введенные Д. Габором определения модулирующих функций, не накладывая ограничений на ширину частотного спектра сигналов.

Идея обработки звукового сигнала путем воздействия на его модулирующие функции, предложенная Ю. М. Ишуткиным, состоит в том, чтобы:

1. По известному вещественному сигналу с помощью преобразования Гильберта создать комплексный сигнал

,

где – Гильбертово отображение сигнала .

2. Для этой пары сигналов вычислить модулирующие функции: амплитудную модулирующую функцию и частотную модулирующую функцию сигнала.

3. Преобразовать модулирующие функции в целях обработки с помощью линейных и нелинейных цепей.

4. По измененным модулирующим функциям синтезировать новый звуковой сигнал.

Совокупность первых двух операций, в результате которых становятся известными модулирующие функции сигнала, называют модуляционным анализом. Последняя операция носит название модуляционного синтеза. Структура канала полного модуляционного анализа-синтеза представлена на рис.1 .

.

Для построения цифровой системы необходимо произвести требуемые преобразования цифрового представления звукового сигнала. Цифровой безынерционный ПДД может быть построен по схеме с прямым регулированием. С учетом дискретизации аналоговых сигналов его структурная схема изображена на рис.2.


Рис.2. Структурная схема цифрового безынерционного компрессора с прямым регулированием.

Исходный сигнал представлен как

,

где - дискретная мгновенная амплитудная модулирующая функция, а - дискретная мгновенная фаза сигнала. В демодуляторе огибающей выполняется преобразование Гильберта и вычисление амплитудной модулирующей функции. Частотный спектр исходного сигнала, в соответствии со свойством спектра произведения образов, будет равен

,(2)

где - частотный спектр амплитудной модулирующей функции, - символ прямого преобразование Фурье, его выполнение в данном выражении формирует в качестве второго операнда свертки частотный спектр косинуса мгновенной фазы сигнала, а - частотный спектр сигнала.

В результате нелинейного преобразования мгновенной амплитудной модулирующей функции, выполняемого в блоке возведения в степень, получаем новую дискретную амплитудную модулирующую функцию , где - некоторая нелинейная функция, в данном случае - степенная, реализующая амплитудную характеристику ПДД требуемого вида. Новой амплитудной модулирующей функции будет соответствовать новый частотный спектр . Частотный спектр синтезированного по измененной амплитудной модулирующей функции сигнала будет иметь вид

Введение линии задержки необходимо для синхронизации исходного сигнала с сигналом огибающей, вычисление которой неизбежно сопровождается временной задержкой.

Добавление к новой огибающей постоянного сигнала необходимо для того, чтобы преобразование начиналось со значения огибающей, превышающих пороговый уровень, задаваемый постоянным слагаемым.

Для частного случая реализации амплитудной характеристики компрессора со сжатием динамического диапазона в два раза сигнал на выходе безынерционного ПДД можно представить следующим соотношением:

.

Выполнение большинства требуемых математических операций цифровой системой осуществляется с высокой точностью. Пожалуй, наиболее сложным элементом цифрового ПДД является широкополосный цифровой преобразователь Гильберта (ЦПГ), входящий в состав блока демодуляции огибающей. От него во многом зависит качество ПДД. Для достижения высокого качества преобразования ЦПГ должен в широкой полосе частот, от 32 Гц до 16000 кГц, обеспечивать частотно-независимый фазовый сдвиг сигнала на с погрешностью порядка . Величина фазовой погрешности выбирается такой, чтобы возникающие из-за нее пульсации мгновенной амплитуды тонального сигнала не были заметны на слух. При такой фазовой погрешности их уровень не превысит -80 дБ. Реализация такого преобразователя рассмотрена в [ 10 ].

Компьютерная модель цифрового безынерционного компрессора на основе модулирующих функций, построенная по схеме рис.2, при проверке работоспособности на тестовых однотональных сигналах дала положительные результаты, показав тем самым правильность найденных алгоритмических решений, а также успешное решение проблем, неизбежно возникающих при переходе от аналогового представления сигналов к цифровому. Амплитудная модулирующая функция исходного однотонального сигнала представляет собой постоянную функцию времени. В результате нелинейного преобразования амплитудной модулирующей функции получается новая временная амплитудная модулирующая функция, но в случае с однотональным сигналом это будет снова постоянная функция времени. Спектр исходной амплитудной модулирующей функции и нелинейно преобразованной для однотонального сигнала состоит из одной гармоники на частоте сигнала. Результат свертки синтезированного по измененной амплитудной модулирующей функции однотонального сигнала заведомо будет подобен по форме исходному сигналу.

Проверка работы безынерционного ПДД на реальном звуковом сигнале дала неожиданные результаты, а именно временами очень плохое качество звука прошедшего нелинейную обработку. Для поиска причины, вызывающей заметные на слух артефакты при прослушивании обработанного сложного звукового сигнала, был выполнен анализ форм модулирующих функций (сравнение значений на выходе цифровой модели с расчетными значениями), а также сопоставление форм их частотных спектров. В качестве тестового сигнала для такой проверки был выбран сигнал, состоящий из двух гармонических компонентов с частотами Гц и Гц:

где, - частота дискретизации сигнала, равная 44 100Гц.

Ниже приведена расчетная временная диаграмма тестового сигнала и его частотный спектр (рис. 3а), а также временные диаграммы и частотные спектры его амплитудной модулирующей функции (рис. 3б) и косинуса фазы (рис. 3в). Спектры амплитудной модулирующей функции и косинуса фазы состоят из множества компонент, но в результате свертки таких спектров остаются всего две составляющие.

Рис.3. Временные функции (справа) и частотные спектры (слева): а) сигнала биений с частотами 1000 и 1500Гц; б) амплитудной модулирующей функции сигнала биений; в) косинуса фазы сигнала биений.

Аналитическое выражение для временной амплитудной модулирующей функции имеет вид:


Для вычисления ее спектра удобно воспользоваться табличным косинус-преобразованием Фурье функции при

(3)

Табличные значения гамма-функции для аргументов в диапазоне от 0 до 2, а также формулы для вычисления гамма-функции для больших и отрицательных значений аргументов представлены в . В таблице 1 сведены результаты аналитического расчета спектральных составляющих амплитудной модулирующей функции на угловых частотах от 0 до с периодом равным . В дискретной области частоте соответствует частота , равная отношению частоты дискретизации к количеству отсчетов на периоде сигнала. Практически полное совпадение значений, обозначенных на диаграммах рис. 3, с результатом аналитического расчета подтверждает правильность построений рис. 3.

Таблица 1.

Аналитические значения спектра амплитудной модулирующей функции.

Дискретная частота

–3,93

–13,47

1000

–27,45

1500

–34,82

2000

–39,94

2500

–43,88

3000

–47,1

Сжатию динамического диапазона в два раза соответствует степенная обработка амплитудной модулирующей функции с показателем степени равным 1/2. Для этого случая на рис. 4 показаны различия временных функций и частотных спектров исходного (штриховая линия) и обработанного (сплошная линия) сигналов (рис. 4а), а также их амплитудных модулирующих функций (рис. 4в). Спектры исходных и обработанных сигналов сдвинуты на диаграмме относительно друг друга на 30 отсчетов для более наглядного представления их различий.

В табл. 2 представлены результаты аналитического расчета спектра нелинейно преобразованной огибающей, вычисленные по формуле (3) для . Они практически точно совпадают со значениями, обозначенными на диаграммах рис. 4, что подтверждает точность последних.


Рис.4. Временные функции (справа) и частотные спектры (слева): а) сигналов на входе и выходе безынерционного преобразователя; б) амплитудной модулирующей функции входного сигнала и результата ее степенной обработки.

Таблица 2.

Аналитические значения спектра нелинейно преобразованной амплитудной модулирующей функции (степень 1/2).

Дискретная частота

2,35

16,33

1000

25,87

1500

31,25

2000

35,03

2500

37,95

3000

40,33

Нелинейное преобразование амплитудной модулирующей функции видоизменило ее спектр (рис. 3б). В результате свертки такой нелинейно преобразованной огибающей и входного сигнала выходной сигнал будет иметь существенно обогащенный спектр по сравнению со входным (рис. 3а). В синтезированном по измененной огибающей сигнале биений появятся дополнительные составляющие, которые можно рассматривать как интермодуляционные искажения. Они меняют субъективное восприятие преобразованного сигнала. Очевидно, что в любом другом случае, кроме обработки однотонального сигнала, из-за изменения только одного из операндов в выражении (2) будет получен спектр преобразованного сигнала, отличающийся от исходного. Степень обогащения спектра выходного сигнала зависит от широкополосности огибающей: чем шире спектр нелинейно преобразованной огибающей, тем сильнее обогащается частотный спектр преобразованного сигнала.

Таким образом, в чистом виде безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций непригодно из-за изменений частотного спектра преобразованного сигнала, в ряде случаев, отчетливо заметных на слух. Можно, конечно, отфильтровать спектр нелинейно преобразованной огибающей, примерно до ширины критической полосы слуха в низкочастотной части звукового диапазона. Тогда дополнительные составляющие окажутся впределах одной критической полосы с составляющими спектра исходного сигнала и окажутся замаскированными. Но ПДД при этом потеряет свойство безынерционности из-за ограниченной длительности переходной функции фильтра мгновенной огибающей.

Выводы:

· Цифровая модель ПДД позволила избавиться от неустранимых погрешностей аналоговой реализации и выяснить потенциальные возможности метода ПДД на основе нелинейной обработки модулирующих функций.

· Прослушивание фонограмм после обработки цифровым ПДД на основе модулирующих функций обнаружило возникновение в некоторые моменты слышимых грубых искажений звукового сигнала.

· Анализ временных функций и частотных спектров сигналов, возникающих при ПДД с использованием модулирующих функций, позволил объяснить возникновение слышимых искажений обогащением частотного спектра обработанного сигнала вследствие изменения спектра амплитудной модулирующей функции. Для уменьшения заметности искажений необходимо фильтровать преобразованную амплитудную модулирующую функцию. При этом ее спектр сужается, и при условии, что дополнительные составляющие оказываются в одних критических полосах слуха с основными составляющими, первые эффективно маскируются вторыми. Правда при этом ПДД теряет свойство безынерционности.

· В связи с наличием у безынерционных ПДД на основе модулирующих функций принципиальных недостатков, представляется, что создание более совершенных ПДД должно идти по пути улучшения инерционных преобразователей.

Литература.

1. Основы модуляционных преобразований звуковых сигналов: Монография/ Ишуткин Ю. М., Уваров В. К.; Под ред. В. К. Уварова. – СПб.: СПбГУКиТ, 2004.

2. Радиовещание и электроакустика: Учебник для вузов/ А. В. Выходец, М. В. Гитлиц, Ю. А. Ковалгин и др.; Под ред. М. В. Гитлица. – М.: Радио и связь, 1989.

3. Udo Zoelzer. Digital Audio Signal Processing. John Willey & Sons. Chichester , New York , Weinheim, Brisbane , Singapore , Toronto , 1997.

4. Осташевский Е. Н. Разработка метода и аппаратуры управления нестационарными фазами сигналов для преобразования тембра при создании звуковых эффектов: Автореф. дис. канд. тех. наук. – Л.: ЛИКИ, 1987.

5. Уваров В. К. Точное компандирование частотного и динамического диапазонов звуковых сигналов. – СПб.:СПбГУКиТ, 2002.

6. Плющев В. М. Разработка метода и устройств безынерционного преобразования динамического диапазона звуковых сигналов: Автореф. дис. канд.тех.наук. –Л.: ЛИКИ, 1986.

7. Применение модуляционных преобразований звуковых сигналов: Монография/ В. К. Уваров, В. М. Плющев, М. А. Чесноков; Под ред. В. К. Уварова – СПб.:СПбГУКиТ, 2004.

8. Перспективы обработки звуковых сигналов по их модулирующим функциям. Ишуткин Ю. М. Труды Ленинградского института киноинженеров, 1977 г., вып. . –с. 102-115.

9. D.Gabor, J.IEE 93, (pt3), (1946).

10. Журнал научных публикаций аспирантов и докторантов, ISSN 1991-3087, 2008 г., № 9. – с. 213-218.

11. Интегральные преобразования и операционное исчисление, В. А. Диткин, А. П. Прудников, Главная редакция физико-математической литературы изд-ва «Наука», М., 1974 г.

12. Справочник по математике (для научных работников и инженеров). Г. Корн, Т. Корн. – М., 1977.