Сегодня MP3 является одним из наиболее распространенных форматов компрессии звуковых файлов. Он чаще всего применяется для хранения музыкальных коллекций и ведения аудиовещания в Сети. Как же научиться самому создавать MP3-файлы? Есть ли конкуренты у MP3? На эти и другие вопросы мы постараемся ответить в этой статье.
Формат MP3, или MPEG Audio Layer-3,
был разработан компаниями Fraunhofer
IIS и Thomson.
По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit,
Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном
CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.
Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плейеров. По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.
Тонкости процесса кодирования
![]() |
AudioGrabber позволяет отслеживать загрузку процессора |
На чем же основана идея компрессии звука
в MP3? Наверняка, обращаясь к приятелю, отгороженному от внешнего мира плейером
с наушниками, вы замечали, как он начинает неестественно громко отвечать на ваши
вопросы, поскольку собственный голос, слышимый им под рев рок-концерта, звучит
для него непривычно тихо — особенность человеческого восприятия. И дело тут не
столько в остроте слуха, сколько в способности нашего мозга "переваривать"
звуковую информацию: не реагировать на импульсы, мощность которых ниже определенного
уровня; после сильного грохота не слышать шепота и т. д. Этим и пользуются при
создании MP3-кодеров, в каждом из которых может быть реализована своя собственная,
варьируемая в зависимости от целей и задач, так называемая психоакустическая модель,
где можно пренебречь сравнительно слабыми сигналами.
Как же работают такие методы? Исходный звуковой сигнал разбивается на отдельные блоки, именуемые фреймами, к каждому из которых применяется специальный алгоритм кодирования, причем параметры сжатия для разных фреймов могут значительно отличаться друг от друга. В процессе кодирования блока исходный сигнал разделяется на несколько составляющих частотных диапазонов. Для каждого из них просчитывается величина так называемого эффекта маскирования слабого сигнала более мощным от соседнего диапазона или от предыдущего фрейма. Затем в зависимости от результатов происходит удаление второстепенных звуков, которые не будут слышимы "среднестатистическим" человеком из-за наличия в данный момент более громкого сигнала. Кроме того, учитывается неспособность большинства людей различать высокочастотные сигналы (выше 16 kHz). Аудиоинфоpмация, сжатая по данной схеме, может передаваться потоком, например через Internet, а может храниться в файлах формата MP3.
Спецификации MP3 задают лишь общую схему процесса кодирования, но ни в коей мере не определяют никаких стандартных математических алгоритмов. За создание последних отвечают непосредственно разработчики кодеров. Между последовательно расположенными закодированными фреймами может содержаться некоторая дополнительная информация, главное, чтобы она не совпадала с заголовками фреймов. Очень часто в конец MP3-файла добавляется информационный тег ID3, где хранятся данные о названии композиции, исполнителе, альбоме и т. д. Иногда в начало последовательности закодированных фреймов помещают заголовок аудиоформата WAV.
Я думаю, многие пользователи, приобретя сборник MP3-музыки либо загрузив композицию через Internet, были удивлены, обнаружив у соответствующих файлов расширение .wav. Все дело в том, что WAV является метаформатом. Его спецификациями предусматривается наличие стандартного заголовка и описания блоков данных, способ же кодирования аудиосигнала может быть каким угодно, в том числе и MP3. Чтобы Windows могла однозначно определить используемый метод сжатия, в заголовке файла указывается информация, согласно которой ОС и определяет, установлен в среде соответствующий кодек или нет. После регистрации последнего WAV-MP3-файлы можно использовать в звуковых схемах Windows.
Битрейт и его значение
Одной из важнейших характеристик MP3-файла является битрейт — скорость потока обрабатываемых данных, или общее количество информации, передаваемой в единицу времени. Эта величина не зависит от того, содержит этот поток моно- или стереозвук.
Битрейт 128 Kbps с легкой руки Fraunhofer IIS был признан оптимальным для использования в Internet, а некоторые производители кодеров распространили мнение о том, что этой скорости вполне достаточно для кодирования музыки с качеством, близким к Audio CD. Однако это не так. На хорошей аппаратуре невосполнимые потери аудиоинформации становятся весьма заметными.
Запомним одно: чем выше битрейт, тем больше места на диске потребуется для сохранения конечного MP3-файла, но и, как правило, тем выше будет качество закодированного сигнала. В целом же каждое значение битрейта имеет свою область применения.
Даже профессиональные эксперты с тонким музыкальным слухом порой не в состоянии отличить на хорошей аппаратуре звучание трека Audio CD и его образа, закодированного в MP3-файл с низким коэффициентом сжатия, например 4:1 (320 Kbps). Для рядового же меломана эта разница становится практически неощутимой при скорости потока 256 Kbps. Другими словами, если вы заботитесь о том, чтобы сохраненные копии по качеству вполне соответствовали оригиналу, то применяйте высокие битрейты, от 256 Kbps. Это особенно важно, если вы собираетесь в дальнейшем проводить дополнительную обработку аудиосигнала. Хотя в этом случае все-таки лучше хранить звук в WAV-PCM-формате.
Ежели вы имеете дело только с компьютерными акустическими системами или недорогой бытовой радиоаппаратурой, то для кодирования и последующего прослушивания композиций вполне достаточно 160—192 Kbps. Для компрессии быстро устаревающей поп-музыки, а также для "выкладывания" музыкального архива в Internet вполне подойдет и 128 Kbps. Значения битрейта ниже 128 Kbps не позволяют добиться должного качества звучания. Скорости 64—96 Kbps чаще всего используют для сжатия аудиоуроков иностранного языка, лекций, интервью и аудиотрансляций.
Долгое время кодеры поддерживали лишь постоянный битрейт (CBR — Constant BitRate), т. е. пользователь задавал определенную скорость потока данных, а программа обеспечивала при этом максимально возможное качество кодирования. Но очевидно, что плотность потока значимой информации от фрейма к фрейму различна. (Зачем, к примеру, кодировать паузы?) Вот разработчики кодеров и решили использовать для компрессии каждого фрейма свой битрейт, т. е. поставили задачу минимизировать скорость потока данных, сохранив тот же уровень качества. Так родилась идея переменного битрейта VBR (Variable BitRate).
Как закодироать стереосигнал?
В технологии MP3 различают три способа сжатия стереосигнала: Dual Channel, Stereo и Joint Stereo (MS или MS/IS Stereo). В Dual Channel для каждого канала выделяется ровно половина потока. Кодирование каналов осуществляется независимо друг от друга, как Mono. Данный метод рекомендуется, когда каналы содержат принципиально разные сигналы, например текст и музыку.
В режиме Stereo каналы также кодируются отдельно, однако кодер в ходе работы может варьировать распределение потока и в зависимости от ситуации увеличивать или уменьшать пропускную способность одного из каналов за счет другого. Это предотвращает, например, кодирование "тишины" в отдельном канале, в то время как в соседнем содержится сигнал.
Алгоритмом Joint Stereo (MS Stereo) предусмотрено разложение стереосигнала на основную составляющую и разностную. При этом для кодирования последней используются меньшие значения битрейта. В общем случае с помощью данного метода удается получить весьма хорошие результаты. Однако качество кодирования заметно ухудшается при сжатии разнофазных сигналов. В модификации Joint Stereo (MS/IS Stereo), в отличие от предыдущей версии, стали кодировать не разностную составляющую, а отношение мощностей сигналов в каналах. Благодаря этому появляется возможность еще более снизить битрейт, сохранив приемлемое качество кодирования при минимальных значениях скорости потока данных. Однако при этом происходит безвозвратная потеря фазовой информации, и пропадают многие оттенки музыки.
Создаем MP3-файл: шаг за шагом
Для проведения этих действий можно использовать программы WinDAC, Если у вас устаревший компьютер, не старайтесь в целях экономии времени Есть еще один путь захвата треков Audio CD, испытанный мной в Windows 98. Если вы хотите записать музыку с линейного входа аудиокарты, то для этого Этап 2. Нормализация записей. Многие аудиограбберы (программы для копирования дорожек Audio CD Если вы создаете MP3-архив c Audio CD, то, как правило, не стоит включать Этап 3. Конвертация WAV-файла в MP3. Говоря о едином законченном решении для копирования c Audio CD, кодирования |
Кодеры
С ростом популярности MP3 и принятием соответствующих спецификаций Международным
институтом стандартов ISO словно грибы после дождя стали появляться бесплатные
кодеры. Среди них особую известность получили оптимизированный по скорости BladeEnc
и медленный, но очень качественный mpegEnc.
Видя, как немалые деньги ускользают из рук, Fraunhofer IIS решила обложить свое
изобретение всевозможными патентами и лицензиями, тем самым загубив на корню ряд
перспективных некоммерческих разработок (кодеров, плейеров и др.). Зато отчетливо
проявились несколько направлений дальнейшего развития MP3-кодеров.
Рекомендуемые плейеры
Apollo 37 NAD 0.94 Хорошее качество воспроизведения при минимальном потреблении системных Winamp Последние версии Winamp позволяют редактировать теги композиций и плей-листы, Меломаны с нетерпением ждут появления релиза Winamp 3.0. Разработчики утверждают, Что касается качества воспроизведения композиций, то особых отличий от прошлых Windows Media Player 7.0 Приятный интерфейс, хорошее качество воспроизведения, поддержка множества |
Скорость от XingTech
Довольно долго о кодерах XingTech
в кругу меломанов можно было слышать не очень лестные отзывы: скорость их работы
впечатляла (этим и по сей день объясняется их популярность), однако качество оставляло
желать лучшего. Но в последнее время ситуация изменилась, хотя и не столько за
счет совершенствования в кодерах алгоритма сохранения исходного сигнала, сколько
в результате применения в плейерах специальных эффектов, улучшающих воспроизведение.
Кодеры XingTech вполне подойдут для компрессии недолговечной поп-музыки, лекций,
уроков английского и т. д. по принципу: быстро закодировал, несколько раз прослушал
и удалил. Как правило, эти утилиты отличаются простым интерфейсом. Множество мастеров
и шаблонов позволят легко справляться с задачами MP3-кодирования даже неподготовленному
пользователю.
Наиболее популярен в этом семействе кодер XingMP3 Encoder. С целью обеспечения приемлемого уровня качества при использовании потока минимальной ширины именно в XingMP3 Encoder была впервые реализована идея переменного битрейта. (Правда, не все плейеры в состоянии корректно воспроизводить такие файлы.) Кодер позволяет также проводить компрессию с сохранением высоких частот; при сжатии предоставляет на выбор различные режимы кодирования стереосигнала; начиная с версии 2.2 способен кодировать видео; поддерживает широкий диапазон битрейтов.
На его основе был создан целый ряд популярных приложений, использующихся для MP3-компрессии,
таких, как Audio
Catalyst, MusicBoss
Grabber, Ultimate
Encoder и др.
Классика от Fraunhofer IIS
Для кодеров от Fraunhofer IIS традиционны хорошее качество, неплохая скорость
и, увы, высокая цена. Наиболее удачная психоакустическая модель используется для
средних (128—192 Kbps) и низких (ниже 96 Kbps) значений битрейтов. На основе
этого кода наибольшее распространение получили приложения mp3
Producer, AudioActive
Production Studio, MusicMatch,
Siren Jukebox и др.
Из кодеров данной группы, управляемых из командной строки, широко известен l3enc.
Качество от LAME
Как уже отмечалось, все продукты Fraunhofer IIS, равно как и XingTech,
— коммерческие, и за их легальное использование и распространение необходимо
платить, причем даже в том случае, если сам кодер создан на их основе сторонними
авторами и принадлежит к классу freeware. Желая обойти все эти неприятности, разработчики
LAME (Lame Ain’t a Mpeg
Encoder — "Лэйм" — это не MPEG-кодер") поступили довольно
стандартным образом — стали распространять продукт в виде патча к исходному коду
ISO, который сам по себе не может быть признан кодером. LAME легко собирается
практически на любой вычислительной платформе, где есть компилятор языка C. В
виде отдельной dll-библиотеки LAME входит в состав ряда аудиограбберов, например
CDeX. На официальном сайте нет готовых приложений, однако скомпилированные кодеры
можно легко найти в Сети, в частности на www.maindex.com/lame,
www.mp3-tech.org/encoders
_win.html, www.mp3-converter.
com/encodersmp3_encoder_downloads.htm и др. Известные оконные оболочки
— RazorLame, vbLamer.
В LAME удачно реализовано использование переменного битрейта (VBR). Самые лучшие результаты компрессии получаются на высоких и средних значениях битрейта во многом благодаря применению самостоятельно разработанной психоакустической модели GPSYCHO. Для кодирования сигнала в зависимости от битрейта можно использовать режимы Mono, Stereo и Joint Stereo (MS Stereo). Последние версии LAME способны осуществлять этот выбор автоматически.
Декодиpование MP3
Стандарт MP3 не только не определяет алгоритм кодирования, но и не дает никаких рекомендаций по поводу декодирования файлов. Главное, чтобы воспроизведение происходило в порядке расположения фреймов в итоговом файле, а в остальном — полная свобода.
Но, как мы выяснили выше, в различных кодерах процесс компрессии может быть организован
по-разному, а это значит, что, закодировав один и тот же файл двумя разными программами,
мы можем получить после декодирования два сигнала, существенно различающихся по
звучанию. При выборе декодера часто придерживаются следующего принципа: по возможности
используют для декомпрессии ПО, произведенное той же самой фирмой, чей кодировщик
применялся для сжатия композиции. Хотя стандартом тегов ID3 и предусматривается
поле, в котором должно быть указано название кодера, но на практике оно, как правило,
пустует, и поэтому однозначно определить, каким кодером был создан тот или иной
файл, довольно трудно. Лишь последние версии Xing и LAME ставят свою "электронную
подпись". Существуют, правда, и утилиты (например, RenaTager),
которые пытаются идентифицировать продукты работы кодеров, однако и они иногда
ошибаются.
Алгоритмы воспроизведения MP3-файлов могут заметно отличаться друг от друга. Считается, что лишь первые декодеры от Fraunhofer IIS старались в точности восстановить амплитудно-частотные характеристики (АЧХ) компрессированного сигнала, все остальные грешат постоянным стремлением "улучшить" звучание файла.
Однако заметим, что от бытовых декодеров, воспроизводящих музыку, закодированную с низким битрейтом, вовсе и не требуется точное восстановление АЧХ, главное — приятный звук и легкое управление.
Кроме того, следует различать MP3-декодеры и плейеры. Почти все декодеры позволяют не только проигрывать файлы, но и сохранять их в WAV-PCM-формате. Плейеры же в большинстве своем не могут это сделать и служат лишь для воспроизведения MP3-музыки.
И еще… Если вы захотите значительно повысить качество проигрывания композиций
за счет улучшения частотных характеристик, увеличения глубины и объемности стереозвука,
то непременно воспользуйтесь модулем
DFX 5.1. На сайте разработчиков доступны плагины для Winamp, Sonique и некоторых
других популярных проигрывателей.
Рекомендуемые кодеры Audioactive Production Studio v.2.0 www.audioactive.com, В кодере используются оптимизированные по скорости алгоритмы от mp3 Producer Хотя интерфейс mp3 Producer дружественным не назовешь, кодер имеет BladeEnc Используется во многих популярных грабберах, например AudioGrabber. |
Альтернативные форматы хранения компрессированного
звука
Ogg Vorbis
Летом прошлого года появился новый, абсолютно открытый и бесплатный метод
компрессии оцифрованного звука под названием Ogg Vorbis. Он изначально задумывался
как альтернатива MP3. Ogg Vorbis был разработан группой Xiphophorus и является
составной частью проекта Ogg Squish, который в будущем позволит кодировать видео.
Психоакустическая модель Ogg Vorbis напоминает MP3, однако математическая реализация
на голову выше. Стандартом предусмотрена поддержка многоканального звука (до
255 каналов), в спецификациях заложен широкий диапазон битрейтов от 8 до 512
Kbps, а также имеется возможность включения практически неограниченного числа
комментариев и иллюстраций в тело композиции. Правда, в существующих кодерах
последние свойства пока не реализованы. Ogg Vorbis может использовать VBR. Исходные
коды формата опубликованы на сайте разработчиков, их можно свободно модифицировать
и распространять.
OGG-файлы гораздо меньше привычных MP3 при одинаковых параметрах оцифровки,
хотя обеспечивают примерно такое же, а иногда и заметно лучшее качество звучания.
Скорость кодирования относительно низкая. Высокие частоты при воспроизведении
слышатся неплохо.
Кодек (довольно бедный по возможностям) и плагины к популярным плейерам (WinAMP,
Sonique и XMMS) можно загрузить
с сайта разработчиков .
WMA 8.0
Нельзя вычеркивать из списка прямых конкурентов MP3, особенно в сфере
Web-вещания, стандарт WMA (Windows Media Audio), разработкой которого занимается
Microsoft. Он также принадлежит к форматам компрессии с потерей данных. Последняя
версия 8.0, похоже, вобрала в себя многие лучшие достижения в этой области и
призвана сменить целый ряд устаревающих потоковых форматов. При сравнении ряда
композиций, закодированных в WMA 8.0 с битрейтом 64 Kbps, с соответствующими
MP3-файлами, сжатыми при скорости потока данных 128 Kbps, я на слух не смог
обнаружить никаких отличий. Зато размер WMA-файлов был примерно в два раза меньшим.
Кроме того, WMA поддерживает защиту от несанкционированного копирования.
Новые версии кодека и проигрывателя можно найти на страничке.
MP3Pro
Итак, как видим, в последнее время конкуренция в области форматов сжатия
аудиоданных достигла своего апогея. Господство MP3 пошатнулось. Авторы MP3 также
не сидели сложа руки и, в конце концов, предложили собственное решение — формат
MP3Pro. Он был разработан компанией Coding Technologies совместно с хорошо знакомыми
нам Fraunhofer IIS и Tomson и, по сути, явился логическим продолжением MP3.
В MP3Pro использована новая технология SBR (Spectral Band Replication), обеспечивающая
более корректное сохранение верхнего частотного диапазона (камень преткновения
психоакустической модели MP3). Для этого применяется второй независимый параллельный
поток данных, несущий минимально необходимую информацию для воссоздания верхних
частот. Файлы, закодированные в рамках технологии MP3Pro, можно воспроизводить
в обычных проигрывателях, однако качество звучания при этом будет заметно хуже,
чем при использовании специального проигрывателя — старые плейеры распознают
в них лишь один, основной, поток. Декодирование MP3Pro гораздо более ресурсоемко,
чем MP3. На слух MP3Pro-композиции воспринимаются несколько сочнее, чем MP3,
в чем вы можете убедиться сами, если загрузите
кодер и соответствующий
плейер.
Ссылки по теме
www.mp3.com www.polderware.com/apps/apps.mv www.mp3-converter.com www.mp3port.km.ru/articles/articles.html www.uic.nnov.ru/~fmm |
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: