Разница между MP3 и WAV. Рисуем волну.wav-файла

WAVE или WAV является короткой формой Wave Audio File Format (реже именуемой как Аудио для Windows). Этот формат является стандартом для хранения аудио потока на ПК. Он является сферой приложения формата RIFF для хранения аудио в «цепочках», это очень напоминает форматы 8SVX и AIFF, используемые компьютерами Amiga и Macintosh соответственно. Это также основной формат на системах Windows для хранения обычного несжатого звука. Как правило, для этого применяется кодирование методом линейной импульсно-кодовой модуляции.

Описание

Как WAV , так и AIFF совместимы с операционными системами Windows, Macintosh или Linux. Формат также учитывает некоторые отличия процессоров Intel, такие как порядок байтов от младшего к старшему. RIFF формат выполняет роль обертки для различных кодеков аудио сжатия.

Несмотря на то, что WAV файл может содержать сжатое аудио, наиболее обычным его применением является хранение как раз несжатого аудио в формате линейной импульсно-кодовой модуляции (LPCM). Стандартным форматом Audio-CD, например, является аудио в формате LPCM, с 2 каналами, частотой дискретизации 44 100 Гц и 16 бит на сэмпл. Так как формат LPCM хранит несжатое аудио, которое абсолютно идентично оригиналу, это позволяет использовать его профессиональным пользователям и аудио экспертам для получения максимального качества звучания. WAV аудио файл также может быть изменен практически в любом аудио редакторе. WAV формат работает со сжатым звуком в системах семейства Windows через Audio Compression Manager (ACM) . Любой ACM кодек может быть использован для сжатия WAV файла. Пользовательский интерфейс для ACM может быть доступен через множество программ, включая и стандартную программу для записи звука в некоторых версиях Windows.

Начиная с Windows 2000, появился заголовок WAVE_FORMAT_EXTENSIBLE, который позволял хранить многоканальные аудио данные, учитывал расположение динамиков, исключал неоднозначности в плане типов сэмпла и размеров контейнера в стандартном WAV формате. Также он поддерживал произвольные расширения формата чанка.

Также существует много несоответствий в формате WAV : например, 8-битные данные являются беззнаковыми, в то время как 16-битные – знаковыми.

WAV файлы могут содержать встроенные IFF «списки», которые могут содержать несколько «подчанков».

Метаданные

Будучи форматом, производным от Resource Interchange File Format (RIFF), WAV -файлы могут быть иметь метаданные (тэги) в чанке INFO. В дополнение к этом, в WAV файлы может быть встроены метаданные стандарта Extensible Metadata Platform (XMP).

Популярность

WAV файлы достаточно большие, что делает этот формат неудобным для обмена по сети Интернет, и это сильно подрывает его популярность. Однако, этот формат – как правило, чаще всего используется для сохранения первозданного вида для файлов высокого качества в таких случаях, где размер свободного дискового пространства не является ограничением. Он также используется в программах для редактирования аудио, где экономят время на сжатии и распаковке данных.

Более часто данные сжимаются с помощью форматов с потерями, такими как Ogg Vorbis , MP3 , ATRAC , AAC , Musepack и WMA , которые используются для хранения и обмена музыки (например, среди пользователей Интернета). Небольшой размер файла и возможность быстро скачивать их также является существенным плюсом наряду с тем, что такие аудио данные занимают намного меньше места. Но форматы с потерями жертвуют качеством ради размера, поэтому их алгоритмы не сохраняют первозданное качество звука во всех деталях. Но существуют и кодеки без потерь, такие как FLAC , Shorten, Monkey’s Audio , ATRAC Advanced Lossless , Apple Lossless , WMA Lossless , TTA, WavPack , но ни один из этих кодеков нельзя назвать общепринятым.

Использование формата WAV является общепринятым, благодаря его простоте и простой структуре, которая в большой степени основана на формате файлов RIFF. Благодаря этому, формат WAV не испытывает притеснения среди различного программного обеспечения или аппаратных плееров, он поддерживает практически везде.

Назло огромному размеру данных несжатого WAV , этот формат иногда используется для радиовещания, особенно для адаптированных безкассетных систем. Радио BBC (BBC Radio) в Соединенном Королевстве использует 44.1 кГц, 16 бит, стерео аудио данные как стандарт в их системе VCS. Система ABC “D-Cart”, которая разработана Австралийским радиовещателем, использует 48 кГц, 16 бит, стерео аудио данные, что идентично цифровым аудио кассетам (DAT).

Недавно я получил следующее письмо:

Привет, сайт, MP3 является самым популярным аудиоформатом, но есть так много других, таких как AAC, FLAC, OGG и WMA, что я не совсем уверен, какой из них я должен использовать. В чем разница между ними, и какой из них мне следует использовать, чтобы хранить мою музыку?

Вопрос достаточно популярный, попробую ответить на него просто, но понятно.

Мы уже говорили о различии между lossless и lossy, но если кратко, есть два типа качества звука:

  • без потерь: FLAC, ALAC, WAV;
  • с потерями: MP3, AAC, OGG, WMA.

Lossless формат сохраняет полное качество звука, в большинстве случаев, это уровень CD, в то время как формат с потерями сжимает файлы для экономии места (конечно, качество звука ухудшается).

Форматы хранения данных без сжатия: FLAC, ALAC, WAV и другие

  • WAV и AIFF : Оба WAV и AIFF хранят звук без сжатия, что означает, что они являются точными копиями исходного аудио. Эти два формата по существу имеют одинаковое качество; Они просто хранят данные немного по-другому. AIFF сделан Apple, поэтому вы можете увидеть его чаще в продуктах Apple, а WAV в значительной степени универсален. Однако, поскольку они несжаты, они занимают много ненужного пространства. Если вы не редактируете аудио, вам не нужно хранить аудио в этих форматах.
  • FLAC : Free Lossless Audio Codec (FLAC) — самый популярный формат хранения звука без потерь, что делает его хорошим выбором. В отличие от WAV и AIFF, он немного сжимает данные, поэтому занимает меньше места. Тем не менее, он считается форматом, который хранит звук без потерь, качество музыки остается таким же, как и у оригинального источника, поэтому эффективнее использовать его, чем WAV и AIFF. Он бесплатный, с открытым исходным кодом.
  • Apple Lossless : Также известный как ALAC, Apple Lossless похож на FLAC. Это формат с лёгкой компрессией, тем не менее, музыка сохраниться без потерь качества. Его сжатие не так эффективно, как FLAC, поэтому ваши файлы могут быть немного больше, но они полностью поддерживаются iTunes и iOS (в то время как FLAC — нет). Таким образом, если вы используете iTunes и iOS в качестве основного программного обеспечения для прослушивания музыки, вам придется использовать именно этот формат.
  • APE : APE — имеет самый агрессивный алгоритм сжатия, для хранения музыки без потерь, то есть вы получите максимальную экономию места. Его качество звука такое же, как у FLAC, ALAC, однако часто возникают проблемы с совместимостью. Кроме того, проигрывание этого формата гораздо сильнее нагружает процессор для его декодирования, так как данные сильно сжаты. Вообще, я бы не рекомендовал использовать этот формат, если только вы не ограничены в свободной памяти и не имеете проблем совместимости с программным обеспечением.

Форматы хранения звука с сжатием: MP3, AAC, OGG и другие


Если вы просто хотите послушать музыку здесь и сейчас, скорее всего, вы будете использовать формат с потерями. Они экономят массу памяти, оставляя вам больше места для песен на вашем портативном плеере, и, если будет достаточно высоким, они будут неотличимы от исходного источника. Вот форматы, с которыми вы, вероятно, столкнетесь:

  • MP3 : MPEG Audio Layer III, или MP3, является наиболее распространенным форматом хранения звука с потерями. Настолько, что он стал синонимом загружаемой музыки. MP3 — не самый эффективный формат из всех, но, безусловно, наиболее хорошо поддерживаемый, что делает его лучшим выбором для хранения аудио с сжатием.
  • AAC : Advanced Audio Coding, также известный как AAC, похож на MP3, хотя он немного эффективнее. Это означает, что вы можете иметь файлы, занимающие меньше места, но с тем же качеством звука, что и MP3. Лучшим евангелистом этого формата сегодня является iTunes от Apple, сделавший AAC настолько популярным, что он стал почти так же широко известен, как MP3. За очень долгое время у меня было только одно устройство, которое не могло играть AAC, и это было несколько лет назад, так что вы можете смело использовать этот формат для хранения своей музыки.
  • Ogg Vorbis : формат Vorbis, известный как Ogg Vorbis из-за использования контейнера Ogg, является бесплатной альтернативой MP3 и AAC. Его главная черта состоит в том, что он не ограничен патентами, но на вас, как на конечного пользователя, это совершенно не влияет. Фактически, несмотря на его открытость и сходное качество, он гораздо менее популярен, чем MP3 и AAC, это значит, что меньшее количество программ его поддерживают. Таким образом, мы не рекомендуем его использовать, чтобы избежать проблем с совместимостью программного обеспечения.
  • WMA : Windows Media Audio — собственный фирменный формат Microsoft, похожий на MP3 или AAC. Он не дает никаких преимуществ перед другими форматами, и также не очень хорошо поддерживается за пределами платформы Windows. Мы не рекомендуем вам копировать компакт-диски в этот формат, если только вы не будете точно знать, что всю музыку будут слушать на платформе Windows, или на совместимых с этим форматом проигрывателях.

Так что вы должны использовать?

Теперь, когда вы понимаете разницу между каждым форматом, что вы должны использовать для копирования или загрузки музыки? В общем, мы рекомендуем использовать MP3 или AAC. Они совместимы почти с каждым проигрывателем, и оба они неотличимы от исходного, если . Если у вас нет особых потребностей, которые предполагают иное, MP3 и AAC — это лучший выбор.

Однако есть кое-что, что можно сказать о том, чтобы хранить свою музыку в формате без потерь, таком как FLAC. В то время как вы, вероятно, не заметите более высокого качества, lossless отлично подходит для хранения музыки, если вы планируете впоследствии ее преобразовывать в другие форматы , поскольку преобразование формата с потерями в другой формат с потерями (например, AAC в MP3) приведет к появлению файлов заметно более низкое качество. Поэтому для архивных целей мы рекомендуем FLAC . Однако вы можете использовать любой формат без потерь, так как вы можете конвертировать между форматами без потерь, не изменяя качество файла.

Некоторое время назад я решил посвятить себя решению экзотической задачи - нарисовать волну wave-файла, как это делают аудио- и видеоредакторы, используя для этого Питон. В результате у меня получился небольшой скрипт, который вполне с этим справляется. Так, картинка выше сгенерирована им из песни «Under Pressure» группы Queen. Для сравнения - вид волны в аудиоредакторе:


Для разбора звука я использовал библиотеку numpy , а для построения графика - . Под катом я изложу основы работы с wav-файлами и алгоритм скрипта.

UPD1: коэффициент прореживания k лучше брать примерно k = nframes/w/32, подобрал эмпирически. Обновил картинки с новым коэффициентом.

WAV - это формат для хранения несжатого аудиопотока, широко используемый в медиаиндустрии. Его особенность в том, что для кодирования амплитуды выделяется фиксированное число бит. Это сказывается на размере выходного файла, но делает его очень удобным для чтения. Типичный wave-файл состоит из заголовочной части, тела с аудиопотоком и хвоста для дополнительной информации, куда аудиоредакторы могут записывать собственные метаданные.

Из заголовочной части извлекаются основные параметры - число каналов, битрейт, число фреймов - на основании которых осуществляется разбор аудиопотока. Wave-файл хранит в себе 1 или 2 канала, каждый из которых кодируется 8, 16, 24 или 32 битами. Последовательность бит, описывающая амплитуду волны в момент времени, называется сэмплом. Последовательность сэмплов для всех каналов в определенный момент называется фреймом.

Например, \xe2\xff\xe3\xfа - это фрейм 16-битного wav-файла. Значит, \xe2\xff - сэмпл первого (левого) канала, а \xe3\xfа - второго (правого). Сэмплы представляют собой целые знаковые числа (исключение - файлы с сэмплами в 8 бит, беззнаковые числа).

В богатой питоновской библиотеке есть модуль wave , предназначенный для парсинга wav-файлов. Он позволяет получить основные характеристики звука и читать его по отдельным фреймам. На этом его возможности кончаются и парсить аудиопоток придется самостоятельно.

Import wave wav = wave.open("music.wav", mode="r") (nchannels, sampwidth, framerate, nframes, comptype, compname) = wav.getparams() content = wav.readframes(nframes)
Этими строками мы создаем объект для чтения wav-файла (если параметр «r» опустить, то будет создан объект для записи, что нам не подходит). Метод getparams() возвращает кортеж основных параметров файла (по порядку): число каналов, число байт на сэмпл, число вреймов в секунду, общее число фреймов, тип сжатия, имя типа сжатия. Я вынес их всё в отдельные переменные, чтобы не обращаться каждый раз к полям объекта.

Метод readframes() считывает указанное число фреймов относительно внутреннего указателя объекта и инкрементирует его. В данном случае, мы за один раз считали все фреймы в одну байтовую строку в переменную content.

Теперь нужно разобрать эту строку. Параметр sampwidth определяет, сколько байт уходит на кодирование одного сэмпла:

  • 1 = 8 бит, беззнаковое целое (0-255),
  • 2 = 16 бит, знаковое целое (-32768-32767)
  • 4 = 32 бит, знаковое длинное целое (-2147483648-2147483647)
Разбор осуществляется следующим образом:

Import numpy as np types = { 1: np.int8, 2: np.int16, 4: np.int32 } samples = np.fromstring(content, dtype=types)
Здесь задействуется библиотека numpy. Ее основное предназначение - математические действия с массивами и матрицами. Numpy оперирует своими собственными типами данных. Функция fromstring() создает одномерный массив из байтовой строки, при этом параметр dtype определяет, как будут интерпретированы элементы массива. В нашем примере, тип данных берется из словаря «types», в котором сопоставлены размеры сэмпла и типы данных numpy.

Теперь у нас есть массив сэмплов аудиопотока. Если в нем один канал, весь массив будет представлять его, если два (или несколько), то нужно «проредить» массив, выбрав для каждого канала каджый n-ый элемент:

For n in range(nchannels): channel = samples
В этом цикле в массив channel выбирается каждый аудиоканал при помощи среза вида , где offset - индекс первого элемента, а n - шаг выборки. Но массив канала содержит огромное количество точек, и вывод графика для 3-минутного файла потребует огромных затрат памяти и времени. Введем в код некоторые дополнительные переменные:
duration = nframes / framerate w, h = 800, 300 DPI = 72 peak = 256 ** sampwidth / 2 k = nframes/w/32

Duration - длительность потока в секундах, w и h - ширина и высота выходного изображения, DPI - произвольное значение, необходимое для перевода пикселей в дюймы, peak - пиковое значение амплитуды сэмпла, k - коэффициент прореживания канала, зависящий от ширины изображения; подобран эмпирически.

Скорректируем отображение графика:
plt.figure(1, figsize=(float(w)/DPI, float(h)/DPI), dpi=DPI) plt.subplots_adjust(wspace=0, hspace=0)
Теперь цикл с выводом каналов будет выглядеть так:
for n in range(nchannels): channel = samples channel = channel if nchannels == 1: channel = channel - peak axes = plt.subplot(2, 1, n+1, axisbg="k") axes.plot(channel, "g") axes.yaxis.set_major_formatter(ticker.FuncFormatter(format_db)) plt.grid(True, color="w") axes.xaxis.set_major_formatter(ticker.NullFormatter())
В цикле делается проверка на число каналов. Как я уже говорил, 8-битный звук хранится в беззнаковых целых, поэтому его необходимо нормализовать, отняв от каждого сэмпла половину амплитуды.

Напоследок, установим формат нижней оси
axes.xaxis.set_major_formatter(ticker.FuncFormatter(format_time))
Сохраним график в картинку и покажем его:
plt.savefig("wave", dpi=DPI) plt.show()

Format_time и format_db - это функции для форматирования значений шкал осей абсцисс и ординат.

Format_time форматирует время по номеру сэмпла:
def format_time(x, pos=None): global duration, nframes, k progress = int(x / float(nframes) * duration * k) mins, secs = divmod(progress, 60) hours, mins = divmod(mins, 60) out = "%d:%02d" % (mins, secs) if hours > 0: out = "%d:" % hours return out
Функция format_db форматирует громкость звука по его амплитуде:
def format_db(x, pos=None): if pos == 0: return "" global peak if x == 0: return "-inf" db = 20 * math.log10(abs(x) / float(peak)) return int(db)
Весь скрипт:
import wave import numpy as np import matplotlib.pyplot as plt import matplotlib.ticker as ticker import math types = { 1: np.int8, 2: np.int16, 4: np.int32 } def format_time(x, pos=None): global duration, nframes, k progress = int(x / float(nframes) * duration * k) mins, secs = divmod(progress, 60) hours, mins = divmod(mins, 60) out = "%d:%02d" % (mins, secs) if hours > 0: out = "%d:" % hours return out def format_db(x, pos=None): if pos == 0: return "" global peak if x == 0: return "-inf" db = 20 * math.log10(abs(x) / float(peak)) return int(db) wav = wave.open("music.wav", mode="r") (nchannels, sampwidth, framerate, nframes, comptype, compname) = wav.getparams() duration = nframes / framerate w, h = 800, 300 k = nframes/w/32 DPI = 72 peak = 256 ** sampwidth / 2 content = wav.readframes(nframes) samples = np.fromstring(content, dtype=types) plt.figure(1, figsize=(float(w)/DPI, float(h)/DPI), dpi=DPI) plt.subplots_adjust(wspace=0, hspace=0) for n in range(nchannels): channel = samples channel = channel if nchannels == 1: channel = channel - peak axes = plt.subplot(2, 1, n+1, axisbg="k") axes.plot(channel, "g") axes.yaxis.set_major_formatter(ticker.FuncFormatter(format_db)) plt.grid(True, color="w") axes.xaxis.set_major_formatter(ticker.NullFormatter()) axes.xaxis.set_major_formatter(ticker.FuncFormatter(format_time)) plt.savefig("wave", dpi=DPI) plt.show()
Еще примеры:



    Ну вообще-то можно конечно использовать IrDA для приема команд с обычных ИК пультов, но с очень большими ограничениями. Работает далеко не со всеми пультами. Стабильность распознавания команд очень низкая. Если использовать IrDA встроенный в материнскую плату, то нужно колдовать с драйверами, если внешний, то нужно удалять драйвера или периодически перетыкать приемник в другой СОМ порт. USB IrDA вообще использовать невозможно, так как к нему нельзя обратиться напрямую как к СОМ порту (не путайте с виртуальным СОМ портом).

    По многочисленным просьбам был написан плагин для СОМ IrDA, подробнее о всех ограничениях и сложностях использования см. на ...

    17.06.2017, 23:04

    Журнал «Электронные компоненты» №2 2002 г.
    Александр Зайцев

    Многие бытовые приборы, системы ограничения доступа, промышленное оборудование и другие устройства имеют в своем составе пульт дистанционного управления, что существенно дополняет сервисные функции выпускаемого изделия. Фирма Holtek разработала семейства микросхем дистанционного управления (ДУ), отличающиеся друг от друга по формату передаваемых данных, количеству бит адреса и данных в посылке, по условию начала генерации посылки; набору сервисных функций. Все выпускаемые микросхемы ДУ выполнены по КМОП технологии с минимальным потребляемым током. Они ориентированы для передачи кодовой посылки по инфракрасному или радиоканалу связи, с минимальным числом внешних компонентов схемы. Широкий диапазон напряжений питания и рабочей температуры позволяют применять микросхемы ДУ Holtek в большинстве приложений.
    Микросхемы ДУ фирмы Holtek можно разделить на три основные группы:

    1. Семейства микросхем кодеров/декодеров.
    2. Микросхемы для пультов ДУ телеаппаратуры.
    3. Микросхемы бесконтактной идентификации.
    В первую группу входят семейства микросхем кодеров/декодеров, основным свойством которых является устанавливаемое с помощью переключателей, внешней схемой или программно значение адреса и данных. Кодер формирует кодовую последовательность после появления активного уровня сигнала на выводе TE или сигнала низкого логического уровня на входах данных (DATA). Генерация кодовой посылки продолжается до тех пор, пока присутствует активный уровень сигнала. Посылка всегда генерируется полностью, даже если активный уровень сигнала был снят. В некоторых микросхемах кодеров предусмотрено управление количеством повторений кодовой последовательности после снятия активного уровня сигнала, что может быть необходимо для достоверного детектирования посылки. Кодовая последовательность может состоять из комбинации следующих полей: преамбула; синхронизирующие биты; адрес; данные; биты антикода.
    Декодер обрабатывает кодовую последовательность, полученную из канала связи, последовательно обрабатывая несколько посылок. Если все посылки имели одинаковое значения полей, и адрес кодера совпал с адресом декодера, будет сформирован сигнал о принятой команде (вывод VT). В декодерах, имеющих выводы данных, информация из поля данных декодированной посылки, передается в соответствующие выходные защелки.
    К наиболее простым семействам микросхем ДУ этой группы можно отнести кодеры/декодеры 2 12 (см. таблицу 1). В состав кодовой последовательности, генерируемой кодерами этого семейства, входит преамбула, синхронизирующий бит и 12-разрядное после адреса/данных (рис. 1). Каждый вывод адреса/данных кодера может быть подсоединен к V ss (логический нуль) или оставлен не подсоединенным (логическая единица). Для микросхемы HT12E кодовая последовательность формируется в виде логических уровней, а для HT12A в виде пачки импульсов с частотой 32 кГц (рис. 2).
    >

    Рис. 1. Кодовая последовательность семейства кодеров/декодеров 2 12

    >

    Рис. 2. Представление битов в кодовой последовательности микросхем HT12E и HT12A

    ...

    17.06.2017, 23:03

    Традиционная схемотехника линейных усилителей на полевых транзисторах с затвором в виде р-п-перехода (в дальнейшем для краткости называемом р-п-затвором) предусматривает в основном режим, когда рабочая точка находится в области обратного (закрывающего) смещения, т. е. при Uотс Проведенные автором исследования показали, что использование режима, в котором рабочая точка может находиться в зоне открывающего смещения, позволяет существенно упростить схемы узлов на полевых транзисторах. Применение таких схем рационально в тех случаях, когда требование минимальности числа элементов оправдывает необходимость подборки некоторых из них, т. е. в радиолюбительской практике и при разработке особо миниатюрных конструкций.
    На рис. 1 представлены обобщенные сток-затворная и входная характеристики полевого транзистора с р-п-затвором. На этих вольт-амперных характеристиках - Iс=f(Uвх) и Iз=f(Uвх) - можно выделить три характерных зоны: 1 - закрывающего смещения Uзи, 2 - открывающего смещения, при котором ток затвора практически отсутствует, и 3 - открывающего смещения, обусловливающего существенный ток затвора.
    Четкой границы между зонами 2 и 3 нет, поэтому для определенности примем в качестве условной границы между ними ординату, соответствующую току затвора 1 мкА - при таком токе сопротивление затвора еще весьма велико, и это значение может быть сравнительно просто измерено. Обозначим также символом Im ток стока на этой границе и прямое напряжение на затворе Um. При напряжении Uзи, большем граничного, ток затвора начинает резко увеличиваться и полевой транзистор теряет свое основное достоинство - высокое входное сопротивление. Поэтому работу в зоне 3 не рассматриваем.
    Из изложенного ясно, что нет необходимости полностью исключать работу полевого транзистора в зоне прямого смещения, вполне достаточно, чтобы рабочая точка не переходила в зону 3, т. е. было выполнено условие Uзи КП302ГМ до 0,55 В для КП303А .
    Несмотря на то, что расширение рабочего интервала напряжения Uзи из-за добавления зоны прямого смещения по абсолютной величине невелико, оно имеет очень важное значение, поскольку позволяет несколько иначе подойти к схемо-технике полевых транзисторов.
    Как видно из рис. 1, сток-затворная характеристика переходит в зону 2 плавно, без излома. Суть физических процессов в транзисторе заключается в том, что при подаче на затвор прямого напряжения смещения происходит расширение канала и проводимость его увеличивается, транзистор начинает работать в режиме обогащения. Легко заметить, что с учетом зоны прямого смещения транзистор с р-п-затвором становится аналогичным по характеристикам транзистору с изолированным затвором и встроенным каналом, который способен работать при прямом и обратном смещении на затворе.
    Отличие носит лишь количественный характер - у первого из них рабочая область зоны прямого смещения короче, так как ограничивается значением Um. Поэтому полевой транзистор с р-п-затвором можно применять в режимах, которые считались возможными только для транзисторов с изолированным затвором и встроенным каналом.
    Наличие у транзисторов с изолированным затвором серьезных недостатков - значительного разброса характеристик, малой стойкости к действию статического электричества и ряда других - резко ограничивает область практического применения этих приборов даже при допустимости их индивидуальной подборки. Номенклатура выпускаемых в настоящее время транзисторов с р-п-затвором значительно шире, чем с изолированным, они более доступны и имеют меньший разброс характеристик. По указанным причинам транзисторы с р-п-затвором следует считать более предпочтительными.
    Рассмотрим некоторые варианты применения этих транзисторов с использованием режима прямого смещения на затворе. На рис. 2, а изображена схема линейного усилителя. Применение режима работы без начального смещения позволило исключить резистор автоматического смещения и блокировочный конденсатор в цепи истока транзистора VT1. Расчет ступени по постоянному току упрощается и сводится к определению сопротивления нагрузочного резистора R2 по формуле:
    R2=(Uпит-Uвых о)/Io
    где Uвых о - напряжение на выходе при отсутствии входного сигнала, a Iо - начальный ток транзистора.
    При выборе Uвых o= 0,5 Uпит формула (1) упрощается и принимает вид: R2=Uпит/2Iо.
    При разработке усилителей по этой схеме следует учитывать, что для транзисторов с начальным током стока в несколько десятков миллиампер возможно превышение их допустимой мощности.
    Если необходимо уменьшить коэффициент усиления, в цепь истока включают резистор R3. Следует подчеркнуть, что в этом случае блокировочный конденсатор включать нельзя. Режим по переменному току рассчитывают по известным формулам; коэффициент усиления находят из выражения Кu= S R2, где S - крутизна характеристики транзистора. Очевидно, что при Кu>10 в большинстве случаев усиление выходного сигнала по амплитуде до Uпит происходит при Uвх КП303А при Io=1,1мА, Uпит=12B, Uвых=6 В и R2=5,1 кОм показали, что Кu=10.
    При необходимости увеличить допустимую амплитуду положительных значении напряжения на входе свыше Um в цепь истока требуется вместо резистора R3 включить диод (катодом к общему проводу). Напряжение прямого смещения для кремниевых диодов может находиться в пределах 0,4...0,8 В (в большинстве случаев 0,5...0,7 В) в зависимости от типа диода и тока истока транзистора. Для германиевых диодов аналогичные значения равны 0,2...0,6 В (0,3...0,5 В). При включении диода ток стока из-за закрывающего смещения уменьшается, поэтому для обеспечения прежнего режима по постоянному току необходимо увеличить сопротивление резистора R2. Это, в свою очередь, приводит к увеличению К„, так как крутизна уменьшается незначительно. Поскольку динамическое сопротивление диода мало, шунтиро-вание его конденсатором малоэффективно. Введение диода вызывает небольшое - не более чем на 10 % - уменьшение усиления.
    Режим такой ступени по постоянному току рассчитывают по формуле (1), в которую вместо Io подставляют Ioд - ток стока при включенном в цепь истока диоде. Уменьшить при необходимости Кu можно включением последовательно с диодом резистора обратной связи.
    Несмотря на наличие дополнительного диода, реализация такой схемы в ряде случаев является оправданной и по той причине, что приводит к уменьшению потребления тока и увеличению коэффициента усиления. Эти свойства особенно ценны для устройств с автономным питанием.
    Как видно из изложенного, по работе ступень с диодом близка к классической с резистором смещения. Основное преимущество - отсутствие блокировочного конденсатора, что приводит также к расширению снизу рабочей частотной полосы вплоть до постоянного тока. Кроме того, упрощается расчет и налаживание устройств.
    При работе этой ступени с трансформатором, катушкой связи, воспроизводящей головкой магнитофона и другими подобными источниками сигнала резистор R1 утечки не требуется и схема принимает предельно простой вид, показанный на рис. 2, б.
    Рассмотренная выше возможность работы полевого транзистора с р-п-затвором при прямом смещении может быть эффективно применена и для построения другого важного класса устройств - истоковых повторителей. На рис. 3, а представлена традиционная схема истокового повторителя на транзисторе VT2. Основной недостаток этого узла - сравнительно узкие пределы выходного напряжения. От этого недостатка свободен традиционный эмит-терный повторитель (VT2, рис.3, б); кроме того, в нем меньше деталей. Но у эмиттерного повторителя сравнительно низкое входное сопротивление: Rвх=h21эRэ (h21э - статический коэффициент передачи тока транзистора; Rэ - сопротивление резистора в цепи эмиттера).
    Все отмеченные противоречия полностью устраняются при прямом включении истокового повторителя, как показано на рис. 3, в. Здесь удачно сочетаются достоинства истокового и эмиттерного повторителей. Практического применения эта схема не находила, видимо, потому, что невозможно избежать прямого напряжения смещения на затворе. Но этого и не требуется, достаточно исключить работу транзистора в области прямого тока затвора (в зоне 3 на рис. 1). Эта задача решается довольно просто, что и позволяет применять такую схему на практике.
    Передаточная характеристика истокового повторителя определяется общим выражением: Uвых=Uo+UвxKп, (2) где Uo - начальное выходное напряжение при Uвх=0; Kп - коэффициент передачи истокового повторителя.
    Для работы повторителя в области закрывающего смещения на затворе необходимо, чтобы условие Uз Фактически же реальные требования менее жестки, так как достаточно выполнения более простого условия: Uси Uпит (Rи -сопротивление резистора в цепи истока). Учитывая ориентировочный характер расчета по этой формуле, отсутствие тока затвора при Uз=Uпит, следует проверить при макетировании узла микроамперметром с током полного отклонения стрелки не более 100 мкА. Выходное напряжение такого истокового повторителя находится в пределах Uo...(Uпит-Uси).

    Экспериментально снятые при Uпит=12B зависимости Uвых=f(Uвх) для транзисторов КП303А и КП303Е при разных значениях сопротивления Rи показаны на рис. 4. Как видно из графиков, возможно обеспечить линейность передаточной характеристики в пределах от Uвыхо (при Uвх=0) до (Uпит- -1) В. Для расширения этого участка следует, в первую очередь, уменьшить Uo, для чего нужно применять транзисторы с минимальным значением Uотc, а затем подобрать оптимальное сопротивление резистора Rи (R2-на схеме рис. 3, в). Звездочкой на графиках отмечены точки, где ток Iз достигает значения 1 мкА.
    В качестве примера практического применения описанного режима линейного усиления на рис. 5 изображена схема двуканального смесителя сигналов 3Ч; вообще же число каналов ничем не лимитировано и может быть любым. Сопротивление резистора R3 определяют по формуле (1), в которую вместо Io подставляют Iод n, где n - число каналов.

    В устройстве желательно применять транзисторы с близкими значениями Uотс и Io (или Iод), однако вполне допустим разброс этих параметров до 50...100 %, так как разницу усиления по каналам легко компенсировать входными регуляторами R1, R5. Следует обязательно проверить, чтобы ни один из каналов не входил в режим амплитудного ограничения в рабочем интервале входного напряжения. При использовании кремниевого диода допустимая амплитуда положительной полуволны на затворе каждого полевого транзистора - не менее 1 В.
    При работе одного канала при напряжении питания Uпит=9 В, выходном напряжении Uвых=0,1 В (действующее значение), частоте сигнала fс=0,1 кГц коэффициент усиления смесителя примерно равен 3, а по уровню нелинейных искажений он не уступает построенному по классической схемотехнике....

Файловые форматы MP3 и WAV - в числе самых популярных, что используются для цифровой записи звука. Насколько они схожи друг с другом?

Факты об MP3

MP3 - это мультимедийный файловый формат записи звука. Характеризуется большой универсальностью: его поддерживают практически все современные операционные системы ПК, мобильных девайсов, многие традиционные устройства для проигрывания музыки - MP3- и CD-плееры, проигрыватели, музыкальные центры.

Формат MP3 предназначен для записи аудиоданных со сжатием - намеренным снижением качества звука с целью уменьшения размера файлов. Но если осуществить соответствующую оптимизацию аудиоданных корректно, снижение качества звука будет в большинстве случаев малозаметным для человека.

Формат MP3, возможно, самый популярный в онлайн-пространстве. Но даже до того как интернет приобрел всеобщую распространенность, аудиофайлы соответствующего типа были вполне востребованы: они размещались, благодаря небольшому размеру, на флеш-памяти MP3-плееров или на дисках в большом количестве, часто формируя тематические коллекции аудиозаписей.

Факты о WAV

Формат WAV также используется для цифровой записи звука. В универсальности не уступает MP3 и поддерживается основными типами современных девайсов.

Данный формат предназначен, в свою очередь, для записи аудиоданных без сжатия. Таким образом, размер WAV-файлов практически всегда намного больше, чем MP3 с аналогичным содержимым. По уровню качества WAV-звук приближен к оригинальному - при условии, что он будет воспроизводиться на высокотехнологичном оборудовании.

Формат WAV востребован главным образом в сфере услуг по профессиональной обработке аудио: для фильмов, студийных альбомов, в игровой индустрии - везде, где предполагается работа с высококачественным звуком. Также файлы WAV популярны в среде меломанов, которые, к слову, в большинстве случаев очень легко определяют на слух разницу между мелодиями, записанными в MP3 и WAV.

Сравнение

Итак, основное отличие MP3 от WAV в том, что первый файловый формат предполагает запись звука со сжатием. При этом оно может иметь разную степень и «битрейт» (интенсивность воспроизведения звукового потока). Которые, в свою очередь, во всех случаях одинаковы для WAV-файлов.

Считается, что несжатый звук в формате WAV имеет битрейт порядка 1400 Кбит/сек. По качеству он примерно соответствует аудио, записанному на CD. В свою очередь, битрейт MP3-файлов может варьироваться: максимальный показатель составляет 320 Кбит/сек, минимальный - около 8-16 Кбит/сек. Те значения, что ниже, как правило, обеспечивают неприемлемый уровень качества звука - человек с трудом способен различать ноты в мелодиях, которые записаны в подобном битрейте.

Насколько могут различаться размеры файлов, записанных в формате MP3 и WAV?

Запись звука в MP3 длительностью в 1 минуту при максимальном качестве - 320 Кбит/сек - имеет объем порядка 2 мегабайт. Соответственно, 1 минута аудиопотока в формате WAV сформирует файл величиной около 9 мегабайт.

Таблица

Итак, теперь мы знаем, в чем разница между MP3 и WAV. Зафиксируем основные критерии, предопределяющие соответствующие различия, в небольшой таблице.