Во-первых, в этом кодеке было впервые достигнуто качество МРЗ 128 при скорости всего 64 кбит/с!
Во-вторых, на этот формат обратили внимание сразу несколько крупных телефонных компаний, так как сжатая этим кодеком голосовая информация обладала, даже при скорости всего 64 кбит/с очень высокой разборчивостью. Экспертами было установлено, что при скорости 64 кбит/с слоговая разборчивость голоса достигала 90%, в то время, как у других форматов аудиосжатия подобный показатель наблюдается при скорости в 2...2,5 раза больше, т. е. при скорости 128 и 160 кбит/с соответственно. Новый формат Voxware, как оказалось идеально адаптирован именно для сжатия оцифрованного человеческого голоса.
На некоторых высокоскоростных цифровых телефонных сетях США и Канады была апробирована система сжатия голосовой информации имеющая в своей основе аппаратную реализацию разработок Voxware. Данная система позволяла вести по одной линии четыре отдельных разговора одновременно без каких-либо искажений.
И, наконец, поддержка этого кодека была включена компанией Microsoft в бесплатный Media Player. Чтобы убедиться в этом, достаточно посмотреть список поддерживаемых форматов - там есть строчка «Voxware Audio CODEC». Если учесть тот факт, что Microsoft до сих пор так и не удосужилась поддержать VQF и все разновидности ААС, то такая поддержка дорогого стоит. Но помимо этих неоспоримых достоинств кодек обладает также массой недостатков, представляя собой недоделанный, сырой продукт. Собственно после выпуска работающей версии кодека пыл Voxware несколько поугас, ведь эта область уже более или менее отработана, а на свете столько всего нового, не открытого. В общем, выпуска следующей версии кодека пользователи ждали бы долго, если бы не произошло одно событие...
А это событие заключается в том, что в один прекрасный день руководство фирмы Microsoft вдруг осознало, что множество компаний в мире производит программные кодеки для сжатия звуковой информации. При этом компания Microsoft, которая бьется за звание крупнейшего мирового монополиста, еще ничего не сделала в этой области, продолжая использовать в качестве основного звукового формата своих операционных систем несжатую аудиоинформацию в виде WAV-файлов. Правда, регулярно выходят новые версии Media Player, в котором постоянно увеличивается список поддерживаемых форматов, но нет ни одного кодека, на котором было бы написано «Сделано компанией Microsoft». Надо что-то срочно делать, но что, если своих разработок нет?
И Microsoft поступила, как она поступала уже не раз, в точности в соответствии своему главному принципу «Зачем изобретать велосипед, если его уже изобрел кто-то другой? Его надо купить!». Да, своей популярностью операционная система Windows во многом обязана именно тем компонентам, которые были в свое время удачно куплены и впоследствии доработаны и разрекламированы.
Достаточно привести всего несколько примеров. В феврале 1995 года компания Microsoft, что называется буквально «на корню» закупила маленькую британскую компанию RenderMorphics и на основе ее революционных разработок в области трехмерной графики под общим названием RealityLabs создала один из своих главнейших программных продуктов, на долгие годы определивший популярность операционной среды Windows. Речь идет о DirectX комплекте программ и библиотек, который является ни много, ни мало, как одним из китов, на котором покоится популярность Windows.
Другой опорный кит был куплен Microsoft у творческой группы National Сenter for Supercomputing Applications (NCSA). Речь идет о некогда знаменном Интернет-браузере Mosaic или вернее NCSA Mosaic. Уже немногие помнят те далекие времена, когда на рынке веббраузеров были всего два представителя Netscape и Mosaic. В ходе маркетинговых баталий Mosaic проиграл битву, но уникальные разработки не пропали, а были куплены Microsoft и после тщательной переработки превращены в продукт, который теперь знают все - Microsoft Internet Explorer. Начиная с 1996 года этот браузер не только бесплатен, но и весьма навязчиво предлагается всем пользователям Windows, являясь неотьемлемой частью этой операционной системы Этот факт послужил причиной вполне законной обиды компании Netscape. Понятно, что конкурировать с бесплатным продуктом невероятно сложно, но дело уже было сделано и никакими судами и дроблениями Microsoft на отдельные компании случившегося уже не поправишь. Стоит отметить, что MSIE честно пишет, что он основан на технологиях NCSA Mosaic.
Итак, есть два кита, две опоры, но, как известно, такая конструкция неустойчива. И Microsoft решила прикупить третью опору в образе перспективного кодека Voxware Audio CODEC v4.0. Разработка была полностью скуплена и программисты компании приступили к дальнейшей доработке и сопряжению ее с другими частями операционной системы Windows.
К чести Microsoft, стоит отметить, что эта компания не сразу кинулась в погоню за конкурентами заполучив новинку, а предварительно хорошо поработала над этим в общем-то сыроватым кодеком доведя его до ума и лишь потом выпустила в широкие массы. Этот кодек хоть и вышел позднее других, зато обладал гораздо более высокими характеристиками и главное он бесплатен! Похоже Microsoft изобрела наиболее эффективный способ уничтожения конкурентов - делать собственные продукты бесплатными, но с поддержкой только Windows и MSIE.
Новорожденный формат без потуг на оригинальность был назван WMA - Windows Media Audio. Этот формат позиционируется своими создателями как преемник целой плеяде устаревающих аудиоформатов, начиная с Real Audio и заканчивая MPEG Layer Ш.
Но, похоже, что WMA может сменить не только устаревающие форматы, но и относительно новые. Вот несколько фактов.
Низкоскоростная версия WMA по качеству ощутимо превосходит Real Audio. Соотношение размер/качество для WMA в 2...3 раза выше, чем аналогичный параметр у Real Audio. Более того, WMA превосходит по качеству относительно новый формат QDesign AIFF. Так, при максимальной для QDesignAIFF скорости 48 кбит/с, аудиофайлы WMA имеют гораздо меньше искажении потерь. Кроме того, формат WMA бесплатен, a QDesign AIFF стоит порядка 20 долларов. Так что, думаю, судьба сетевого радио на ближайшие несколько лет предопределена.
WMA со скоростью 64 кбит/с лучше МРЗ 128 кбит/с или по крайне мере обладает тем же качеством. Кодек позволяет легко перекодировать из МРЗ в WMA с любой скоростью.
И напоследок несколько слов о перспективах WMA. Аналитики довольно известной компании International Data Corp., которая занимается в основном прогнозами состояния рынка компьютерных технологий, позволили себе высказать мнение о том, что WMA на данный момент является единственной серьезной альтернативой сверхпопулярному МРЗ. Кроме того, зная феноменальную способность Microsoft к навязыванию собственных стандартов окружающему миру, думаю, за судьбу этого формата можно не беспокоиться. Кстати о навязывании стандартов, появились уже первые жертвы — компания Liquid Audio, известная своей разработкой Liquid Pro AAC, заключила сделку с Microsoft. Теперь во все программные продукты Liquid будет включаться поддержка WMA, а огромная аудиотека в формате LQT будет продублирована в WMA. «Это позволит исполнителям донести свою музыку до миллионов пользователей плееров Microsoft, база распространения которых огромна» - считает шеф Liquid Audio Джери Кирби (Gerry Kearby). Нельзя не порадоваться оптимизму шефа компании, но на практике подобное соглашение означает смерть формата LQT, так как WMA, не хуже и при этом кодеки от Microsoft бесплатны, a Liquid Pro AAC стоит денег.
В общем WMA вскоре придет на смену МРЗ, тем более что уже появились первые аппаратные плееры с поддержкой этого формата. Правда подобный переход светит только пользователям операционной системы Windows, поклонникам других платформ, например Linux, пока придется искать альтернативы WMA.
Этот формат аудиосжатия был разработан компанией QDesign и впоследствии был замечен и активно поддержан концерном Apple/Macintosh. QDesign AIF является доработкой семейства стандартов AIFF, которое представляет собой разновидность мультимедийных стандартов используемых на платформе Apple/Macintosh. Пара QDesign AIF-AIFF является полным аналогом пары WAV-MP3 используемой на платформе Wintel, за исключением степени сжатия. Впрочем, об этом речь впереди.
Рождение формата сопровождалось многочисленными рекламно-сенсационными заявлениями компании-разработчика о том, что ими достигнуто CD-качество при небывало низкой скорости потока 48 кбит/с, т. е. этот формат должен был обеспечивать степень сжатия исходной композиции примерно в 100 раз без потери качества!
Первая реакция - недоверие. Конечно, научно-технический прогресс творит чудеса, но не так же быстро и не до такой же степени! Правда, с другой сны, хочется иногда и в чудо поверить, тем более, что некоторые новостные интерне-сайты вроде бы подтвердили рекламные заявления QDesign. Haпример довольно таки солидный сайт http://freecenter. опубликовал несколько графиков АЧХ, согласно которым аудиокомпозиции сжатые QDesignAIF со скоростью 48 кбит/с отличаются от исходной CD-композиции не более, чем на 3 дБ. Кроме того, еще свежи в памяти воспоминания о лихом взлете формата МРЗ, а ведь в свое время коэффициент сжатия аудиоинформации 1:12 тоже казался чем-то невероятным.
Так, со странной смесью недоверия и надежды многие пользователи-меломаны ожидали выхода кодека QDesign AIF.
И вот он вышел QDesign Audio Codec vl. l. Вышел, правда, не как самостоятельный кодек, а как составная часть зарегистрированной полной версии QuickTime 3.0 (и в дальнейшем во всех более высоких версиях) от компании Apple. Поддержка кодирования аудиокомпозиций из WAV-файлов в формат QDesign AIF была включена в MoviePlayer, входящий в состав QuickTime.
Однако при прослушивании файла QDesign AIF понимаешь, что никакого чуда не произошло. Какое там CD-качество?! Чтобы получить такое плохое качество на нормальном CD-проигрывателе, его надо засунуть в гулкую металлическую бочку, бочку засмолить и в воде утопить...
Ну а если серьезно, то малый размер файла полностью соответствует его низкому качеству. Так из аудиокомпозиции были удалены многие частоты, как из верхнего, так и из нижнего диапазона звукового спектра, в результате звучание стало не только очень глухим, но при этом утратило и характерные басы. Очень высок шум квантования. Речь звучит неразборчиво. Кроме того, был замечен один очень неприятный дефект - для уменьшения размера композиции некоторые места преобразовывались из стерео в моно. Идея в целом верна, в любой стереофонической аудиокомпозиции встречаются места, где оба канала звучат одинаково, и вместо двух стереоканалов можно пустить удвоенный моноканал, но вот реализация подкачала.
Компания QDesign AIF в ответ на вполне понятное возмущение обманутых пользователей, пообещала в следующей версии формата улучшить качество звучания и увеличить максимальную скорость потока. Среди этих обещаний также фигурировало обещание увеличить скорость кодирования в три раза. Новая версия кодека получила название QDesign Audio Codec Pro Edition 2.0 и была включена в QuickTime 4.0.
Однако, вместо обещанного ускорения в три раза пользователи получили… замедление, правда, не в три раза (это было бы верхом цинизма), но вполне ощутимое. Качество сжатых композиций практически не изменилось, исчезло только преобразование стереофонического звучания в монофоническое, повидимому, разработчики убрали этот модуль, не сумев довести его до ума v следствие, несколько возрос размер файлов. Ни одно из обещаний не было сдержано. Один раз вступив на скользкую дорожку обмана, QDesign продолжает по ней катиться, а между тем, напомню, что регистрация QuickTime легальными средствами, которыми пользуются подавляющее большинство западных пользователей стоит порядка 20 долларов. Можно представить, сколько денег принесла компании Apple фирма QDesign, сколько обманутых рекламой пользователей отдали свои доллары, поверив в несуществующее чудо.
Справедливости ради стоит отметить, что QDesign AIF с максимально возможной скоростью 48 кбит/с все же лучше, чем МРЗ, ААС, РАС и VQF с этой же шириной потока и безусловно лучше Real audio. Да, этот формат годится только для сетевого радио или для ознакомления с композицией чтобы впоследствии закачать ее в виде более громоздких, но зато и более качественных файлов в форматах МРЗ, AAC, VQF...
Зато на один CD-диск можно разместить около 100 часов музыки в этом формате, если только кто-то захочет ее слушать.
Название формата РАС расшифровывается как perceptual audio coding, что на русский язык переводится плохо, так слово perceptual означает восприятие. Поэтому вариантов перевода много, но наиболее благозвучным является «аудиокодирование, основанное на восприятии».
Данный формат был разработан фирмой Lucent Technologies при мощной инвестиционной поддержке компании Bell Labs, которую, так же, как и AT&T интересовали системы сжатия голосовой аудиоинформации передаваемой по цифровым телефонным сетям. К чести инвесторов можно сказать, что в отличие от AT&T, компания Bell Labs не стала претендовать на слишком большой кусок пирога и предоставила доводку и развитие стандарта создателям, ограничившись только той частью, которая непосредственно касалась телефонных сетей. И довела эту часть до ума, опять таки в отличие от AT&T, у которой до сих пор все в стадии разработки. Некоторые высокоскоростные многоканальные цифровые телефонные сети США и Канады используют для сжатия аудиоинформации алгоритмы, основанные на разработках РАС. Сама же Lucent Technologies, закончив черновую разработку формата и трезво оценив свои слабые маркетинговые возможности, решила пойти тем же путем, что и разработчики VQF. Напомню, VQF, как стандарт был разработан творческой группой Human Interface Laboratories, которая является подразделением компании NTT, но доработкой, развитием и продвижением формата на рынке занималась и занимается фирма Yamaha.
Lucent Technologies поступила схожим образом, решившись доверить новорожденный формат компании Celestial Technologies, которая и занялась дальнейшей судьбой РАС.
Была выпущена первая общедоступная версия кодека РАС под несколько
банальным названием Audio Library 1.0. Первая выпущенная версия этого программного продукта была демонстрационной и работала в течение 15 дней.
При этом самим своим существованием данный кодек РАС опровергал все
сложившиеся со времен МРЗ представления о том, как должны выглядеть сжатые аудиокомпозиции. Любому поклоннику МРЗ, VQF, AAC должен был показаться несколько диким тот способ хранения аудиокомпозиций, который был реализован в Audio Library 1.0.
Во-первых, разработчиками было наложено нелепое условие о том, что в одном каталоге могут храниться не более пяти сжатых композиций. Правда этот запрет легко обходится возможностью быстрой смены каталогов, причем сам процесс чем-то напоминает монтаж устройств в UNIX-системах. Но при большом количестве кодируемой информации это не выход. Второе, еще более нелепое нововведение заключается в том, что аудиокомпозиций в формате РАС в привычном виде (т. е. один файл - одна аудиокомпозиция) просто не существует. При кодировании исходной аудиокомпозиции кодер Audio Library 1.0 в качестве выходного продукта создает не один файл, а целых восемь, с расширениями. TPS, причем при сжатии сразу нескольких композиций и сохранении их в один и тот же каталог, количество файлов не увеличивается, но зато растет объем файла songdata. tps.
Несмотря на эти нелепости, формат получился в общем неплохой. Звучание в целом примерно такого же качества, как и у лучших кодеков из семейства ААС - Liquid Pro AAC и Astrid/Quartex AAC. Конечно, есть нюансы в вечном споре, какие частоты объявить лишними и выкинуть, чтобы уменьшить размер композиции, а какие необходимо оставить, чтобы не ухудшилось качество. Но в целом можно констатировать факт, что РАС со скоростью потока 96 кбит/с лучше МРЗ 128 кбит/с, а РАС со скоростью 128 кбит/с приближается к CD-Звучанию, но не достигает его.
При этом поражает невероятно высокая скорость кодирования при использовании Audio Library 1.0. Четырехминутная аудиокомпозиция (песня средней длины) кодируется чуть больше 100 секунд (сравните, на кодирование четырех минут музыки в формат VQF уходит более 20 минут).
Кодек Audio Library 1.0 не содержит каких либо возможностей по кодированию аудиокомпозиций непосредственно с Audio CD, т. е. не содержит в своем составе так называемый CD-extractor, так же нет возможности непосредственного перекодирования из одного формата в другой (например, РАСМРЗ или РАСААС). В качестве исходного материала принимаются только файлы формата WAV 44 кГц 16 бит РСМ, что не всегда удобно, так эти файлы зачастую имеют гигантские размеры.
К числу недостатков этого кодека можно отнести и неприменимость сжатых композиций в качестве сетевого формата. Формат не поддерживает потоковую пересылку данных, т. е. одновременное воспроизведение и получение аудиокомпозиции. Это формат только для домашней аудиотеки и для продаж на CD-дисках. Кроме того, аудиокомпозиции в данном формате имеют мощную защиту от нелегального копирования и очень плохо работают с CD-R при воспроизведении не на «родной» машине, на которой производилось кодирование и запись на CD.
Субъективная оценка качества
Для сжатых аудиоданных существует субъективная оценка качества, оцениваемая как процент людей, почувствовавших разницу с оригиналом.
Соответствие процента заметивших на пробе сжатой MP3 кодеком и битрейтом, режим Stereo.
%% - 320 kb/s
%% - 256 kb/s
-%% - 192 kb/s
-%% - 128 kb/s
Следует учесть тот факт, что качество получившегося материала зависит от характера сжимаемых данных, от жанра, наличия фона, помех. После сжатия, например MP3, на средних битрейтах, слушатели отмечают оловянность перкуссионных. А на голосе сжатие (даже сильное) отражается мало.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 |



