Форматы цифрового звука: как подобрать оптимальный

      Чаще всего, на магнитных лентах хранятся записи детских голосов, иногда застольные разговоры, песни под гитару, рассказы бабушек и дедушек об истории семьи. Крайне редко бывает, что на катушках хранят музыкальные записи – всё-таки почти всё можно найти в Интернете. Исключение составляют какие-то самодеятельные песни, выступления, которые называются «квартирниками».

     Прослушав эти записи, мы «перемещаемся» в прошлое, когда мы были молоды. Аналоговые носители хранят для нас информацию о первых шагах ребенка, о первых стишках, о наших родителях, дедушках и бабушках, о памятных событиях в жизни и так далее.

     Большинство пользователей для сохранности этих семейных реликвий, оцифровывают аудиозаписи в цифровой формат. Алгоритмов кодирования цифрового звука существует около сотни, однако все они имеют свои особенности. Какой формат выбрать для хранения домашней аудиоколлекции и почему известный всем MP3 теряет популярность?

     Аналоговый звук — это волна. Практически все процессы в нашем мире можно описать с помощью математики. Цифровой звук — это описание аналоговой волны с помощью последовательности чисел. Например, для оцифровки секунды музыки на компакт-диске используется более 44 тысяч цифровых значений.

     Оцифровывать аналоговый звук начали с помощью кодово-импульсной модуляции, на сегодня данная технология остается наиболее распространенной. Звуковая волна превращается в цифры посредством трех последовательных операций — дискретизации по времени, квантования по амплитуде и финального кодирования.

     Что такое дискретизация? Это выборка значений через постоянные временные интервалы. Алгоритм считывает уровни аналоговой волны с невероятной скоростью — для стандарта CD это 44 100 считываний в секунду. Данный показатель называется частотой дискретизации. Например, аудио в фильмах по стандарту имеет частоту дискретизации 48 000 Герц.

     Чтобы достичь такой скорости все значения чуть-чуть округляются до заранее высчитанных значений. Такой процесс называется квантованием. Чем чаще алгоритм считывает показания, тем качественнее будет звучать цифровая запись. Однако микроскопическая погрешность при квантовании неизбежна.

     Для хранения информации компьютеры используют память — миллиарды крошечных электрических переключателей, которые могут находиться только в двух положениях: включено или выключено. Положение одного такого выключатели — это бит информации. Стандарт CD предусматривает 16 бит для звука, что обеспечивает 65 536 различных значений для кодирования.

     Цифровой звук — очень длинная последовательность цифр. Однако эти цифры можно закодировать по-разному. Например, на компакт-диске музыкальные файлы хранятся в формате с расширением WAV. Его главная проблема — он занимает слишком много места, так как вся информация оцифровывается без применения алгоритмов сжатия.

     Чтобы уменьшить объем занимаемого пространства, были придуманы математические алгоритмы — аудиокодеки, которые сжимают цифровые звуковые данные в соответствии с определенными психоакустическими моделями. При этом есть две основные разновидности компрессии: сжатие без потерь и сжатие с потерями.

     Наиболее известный формат сжатия с потерями — MP3. Его разработчики сделали ставку на то, что человеческое ухо несовершенно и в несжатом звуке передается много избыточной информации. Алгоритм разбивает весь частотный спектр на небольшие части, а затем удаляет звуки, которые практически не воспринимаются человеком.

     Качество MP3-файлы безвозвратно ухудшается по сравнению с оригиналом, однако сам файл может весить в 10 раз «легче» исходника. При этом пользователь может выбирать степень сжатия файла. Для этого существует показатель битрейта — фактически, это пространство, необходимое для хранения секунды музыки.

     Чем выше битрейт, тем выше качество звука. Например, при битрейте 128 килобит в секунду для пяти минут музыки потребуется всего лишь около пяти мегабайт на жестком диске или флешке. Считается, что оптимальным битрейтом для хранения музыкальных файлов в формате MP3 являются показатели 256 или 320 килобит в секунду.

     Другим популярным форматом сжатия с потерями является OGG Vorbis. В отличие от MP3, он был изначально бесплатным с открытым кодом, поэтому быстро снискал популярность среди независимых разработчиков. По качеству он ничем не уступает MP3, хотя использует собственную психоакустическую модель для компрессии файла.

     WMA — формат сжатия звука с потерями, который разработала корпорация Microsoft. Его можно отыскать в любой операционной системе Windows, однако среди пользователей он не особо популярен. Еще одним относительно распространенным аудиокодеком сжатия с потерями является AAC, который отличается от MP3 чуть меньшей потерей качества при равном битрейте.

     Более современные форматы предусматривают сжатие звука без потерь информации. Самым популярным среди пользователей является бесплатный формат FLAC, представленный в 2001 году. FLAC отлично подходит для архивирования аудиоколлекции, а также прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре.

     В так называемых lossless-кодеках закодированные данные всегда могут быть восстановлены с точностью до бита. Кодирование осуществляется при помощи математической схемы — в исходных данных находят какую-либо закономерность и с учетом этой закономерности генерируют вторую последовательность, которая полностью описывает исходную.

     Вторым по популярности форматом сжатия без потерь считается Monkey’s Audio — он распространяется в виде бесплатного программного обеспечения для Microsoft Windows. Формат WavPack отличается поддержкой многоканальных потоков и чуть лучшим коэффициентом сжатия. Apple в 2004 году представила собственный lossless-кодек ALAC, который напоминает FLAC.

     Цифровой звук имеет огромные преимущества перед аналоговыми файлами. Пользователь может бесконечно долго хранить и тиражировать свой материал без потери исходного качества. При этом хранение «цифры» выгоднее — ведь она занимает куда меньше физического пространства в отличие от коллекции пластинок или кассет.

     Так, мощный архиватор ZIP может сжать файл формата WAV всего лишь на 10-20%, тогда как FLAC достигает коэффициентов сжатия 30-50% для большинства аудиофайлов. При этом аудиокодек предусматривает восстановление частично испорченных данных, а сам процесс декодирования весьма нетребователен к ресурсам процессора.

     Для архивации музыкальной коллекции сейчас оптимально использовать форматы сжатия без потери качества — например, FLAC, который поддерживается большинством плееров. Однако для хранения аудиокниг, где высокая достоверность воспроизведения оригинального звука не требуется, можно воспользоваться более «экономичными» MP3 или OGG.