Автор: Локшин Б.А.  

Теги: телевидение   сми  

ISBN: 5-88230-049-5

Год: 2001

Текст
                    Б.А. ЛОКШИН
ИФ
ЩАНИЕ:
ОТ СТУДИИ К ТЕЛЕЗРИТЕЛЮ
jUUUUUUQQUQ
|Г'||| III'™!!! Ill
ill 111 111 111 nil
ATM PAL &ECAM
DIGITAL BROADCASTING


Б. А. Локшин ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю - М.: Компания САЙРУС СИСТЕМС, 2001. Цель предлагаемой вниманию читателя книги - познакомить специалистов, работающих в области ТВ вещания, с современной техникой цифрового вещания, в первую очередь — цифрового сжатия и передачи цифровых сигналов по каналам вещания. В книге излагаются основные принципы цифрового телевидения, подробно освещены вопросы цифрового сжатия, описаны стандарты семейства MPEG, включая еще не завершенные MPEG-4 и MPEG-7 Значительное внимание уделено вопросам передачи цифровых сигналов в различных средах, условному доступу, интерактивным службам, контролю качества обслуживания в цифровых системах. В помощь специалистам телерадиокомпаний, планирующих закупку цифрового передающего оборудования, в книге описаны примеры построения цифровых комплексов и приведены технические данные более чем 600 приборов и систем различных производителей. Книга предназначена в первую очередь для инженерно-технических работников, занимающихся разработкой и эксплуатацией систем цифрового вещания. Она может быть также полезна радиоинженерам других профилей, желающим расширить свой кругозор, студентам радиотехнических факультетов вузов и всем энтузиастам цифрового вещания. Издание выходит при поддержке Европейской организации спутниковой связи Eutelsat и телекомпании НТВ Плюс. Все права защищены. Никакая часть настоящего издания и все издание в целом не могут быть воспроизведены или распространяться в любой материальной форме (включая фотокопирование, запись механическим или электронным способом, хранение в базах данных и любые другие способы хранения информации) без предварительного письменного разрешения обладателя авторских прав. ISBN 5-88230-049-5 © Локшин Б.А. — содержание © Компания САЙРУС СИСТЕМС — содержание отдельных разделов и оформление SYRIIS д^" 107140 Россия. Москва, 3-й Новый переулок, 5. 8 V 8 Т Е N S UP1 Заказывайте Полный Каталог Продукции на Компакт Диске Компания Сайрус Системе представляет в России и странах СНГ более 3000 наименований приборов, предназначенных практически для всего спектра измерений в современных телекоммуникационных сетях, системах наземных станций спутниковой связи и системах цифрового теле- и радио- вещания. А также приборов для построения подобных систем, и систем мониторинга, сетей синхронизации и систем управления. Компания сотрудничает с такими производителями, как AMREL, AnaCom, TREND Communication, Radyne ComStream, Advantech, NUERA, GN Nettest, Consultronics, Tektronix, Scopus, ЛОНИИС, Sunrise Telecom, Agilent Technologies (Hewlett-Packard) и др., осуществляя системную интеграцию измерительных решений, сервисную поддержку поставляемого оборудования, а также информационную поддержку, консультации и обучение пользователей.
ПРЕДИСЛОВИЕ Быстрый переход от аналогового к цифровому телевизионному вещанию, обладающему важными преимуществами, приводит к существенному изменению технической базы телевидения, внедрению принципиально новых, цифровых технологий и методов формирования и передачи сигналов ТВ программ, основанных, в первую очередь, на прогрессе в области цифрового сжатия. Этот переход требует не только замены значительной части парка оборудования, но и переподготовки большого числа специалистов, работающих в области ТВ вещания. Так сложилось, что технический персонал, работавший в области традиционного аналогового телевидения, ранее практически не сталкивался с цифровой техникой, а связисты, освоившие цифровую передачу уже несколько десятилетий назад, не имели дела с передачей телевизионных сигналов. Ознакомление с принципами и методами цифровой техники значительно облегчается, если в распоряжении обучаемого имеются пособия, доступно и в то же время достаточно полно излагающие материал. За рубежом за последние годы изданы десятки книг, посвященных вопросам цифрового вещания, цифрового сжатия и другим аспектам цифрового телевидения. Отечественный читатель до последнего времени практически не имел возможности получить достаточное и систематическое представление о многих разделах цифрового телевидения. Имеющаяся литература не отражает последних достижений техники, связанных с разработкой семейства стандартов MPEG и деятельностью международной организации «Проект DVB» в области технической стандартизации. Предлагаемая вниманию читателя книга Б.А.Локшина отвечает на многие возникающие вопросы и дает достаточно цельное представление о многих аспектах цифрового вещания. В книге подробно и на доступном для технического персонала уровне освещены вопросы цифрового сжатия, описаны стандарты семейства MPEG, включая находящиеся в процессе разработки MPEG-4 и MPEG-7, приведены другие важные сведения. В основу книги положены стандарты и другие материалы, разработанные DVB, а также практический опыт, полученный автором при создании и налаживании работы многопрограммного комплекса цифровой компрессии, установленного на передающей станции «Сколково», работающей в сети непосредственного спутникового вещания «НТВ Плюс». Важно отметить, что автор книги еще в начале
4 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 90-х годов принимал непосредственное участие в разработке первого международного стандарта МСЭ-Р по системе непосредственного спутникового многопрограммного ТВ вещания на базе DVB. Первый вариант этого стандарта с участием Б.А.Лок- шина был подготовлен в октябре 1994 г. Доступность изложения, широкий круг освещаемых вопросов позволяют надеяться, что книга окажется полезной инженерам, работающим в области телевизионного вещания, а также инженерам других профилей, студентам радиотехнических факультетов вузов и читателям, интересующимся новыми технологиями вещания. Проф. М. И. Кривошеее
ВСТУПЛЕНИЕ Рубеж XX и XXI веков ознаменовался ускоренным техническим прогрессом телевизионного (ТВ) вещания — одной из областей человеческой деятельности, затрагивающей людей всех возрастов и профессий либо как телезрителей, либо как специалистов, непосредственно участвующих в создании и распространении телевизионных программ. Начавшись более 60 лет назад с малокадровых монохромных систем с невысокой разрешающей способностью, телевизионное вещание прошло в конце 60-х этап внедрения цветного изображения и сейчас стоит на пороге решающих перемен — предстоит переход от аналоговой к цифровой форме сигнала. Многие страны уже приняли решение о сроках перевода ТВ вещания на цифровые стандарты, другие ведут исследования и эксперименты с целью определения оптимальных для себя условий внедрения новых стандартов. Что же на самом деле сулит этот переход зрителям и что он означает для специалистов? Прежде всего, зритель получает возможность принимать больше ТВ программ в тех же частотных каналах. Благодаря поразительным достижениям техники цифровой компрессии удается «упаковать» 4...6 цифровых ТВ программ в полосу частот, занимаемую одной аналоговой ТВ программой. Учитывая нехватку эфирных каналов в крупных городах и ограниченную способность спутниковых ретрансляторов, это свойство цифрового сигнала оказывается весьма актуальным и уже сегодня позволяет, например, абоненту спутникового вещания принимать десятки и сотни ТВ и радиопрограмм. Второе важное преимущество цифрового метода передачи цифровых сигналов — значительно лучшее субъективное качество изображения, приближающееся к качеству кинопленки. На нем практически отсутствуют свойственные аналоговому телевидению шумы, импульсные помехи в виде ярких «звездочек», муар на изображении, цветовые «факелы» на переходах яркости. Благодаря раздельной передаче сигналов яркости и цветности исключаются перекрестные искажения «яркость-цветность», достигается высокая разрешающая способность. Качество воспроизводимого изображения практически не зависит от среды распространения сигнала и определяется только совершенством аппаратуры. Современные цифровые стандарты поддерживают формат изображения 16:9, что также приближает телевидение к кинематографу. Многие годы в телевидении, в отличие от кинематографа, не уделялось должного внимания звуковому сопровождению. Достаточно сказать, что даже стереосопровожде- ние в системах эфирного вещания скорее является исключением, чем правилом. Новые цифровые стандарты предлагают широкий спектр возможностей выбора вида звукового сопровождения — от монофонического до многоканального панорамного (surround sound). Универсальный характер цифровой передачи позволяет передавать однотипным об-
6 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю разом, в одном цифровом потоке не только сигналы изображения и звукового сопровождения, но и большой объем дополнительных данных сервисную информацию вещателя, электронный путеводитель по программам, телетекст, субтитры, звуковое сопровождение на других языках, прогноз погоды, другую справочную информацию. Легко ввести новые службы, не предусматривавшиеся при создании системы. Как считает большинство специалистов, переход к цифровому ТВ вещанию станет еще одним важным шагом на пути к уже близкому слиянию — конвергенции — мира телевидения и мира компьютеров. Телевизионный приемник недалекого будущего сможет запрашивать и получать информацию из международной компьютерной сети Интернет, обмениваться данными с другими аналогичными устройствами, он станет интерактивным прибором, позволяющим телезрителю взаимодействовать с просматриваемой программой и в определенной степени влиять на ее содержание. Передаваемые сигналы по желанию вещателя могут быть обработаны таким образом, что прием будет возможен только для абонентов, имеющих право доступа к каналу, и невозможен для остальных абонентов. Выполняющие эту задачу системы условного доступа применяются и в аналоговом телевидении, но надежность закрытия аналогового сигнала невелика. Перечисленные усовершенствования далеко не исчерпывают тех преимуществ, которые получат телезрители от перехода к цифровому вещанию. Для технических специалистов, работающих в области ТВ вещания, этот переход означает необходимость осваивать совершенно новые понятия, принципы формирования и обработки сигналов, иную технику. Особенно наглядно это можно продемонстрировать на примере службы контроля качества вещания. Привычные испытательные сигналы, измерительные приборы, методы контроля оказываются полностью непригодными, изменяется сам подход к оценке качества изображения. Не менее радикальные изменения происходят и на других участках телевизионного тракта. Цель настоящей книги — познакомить специалистов, работающих в области ТВ вещания, с современной техникой цифрового вещания, в первую очередь цифрового сжатия и передачи цифровых сигналов по каналам вещания. Вопросы построения студийной цифровой аппаратуры, производства, монтажа и записи телепрограмм представляют самостоятельный раздел техники цифрового вещания и могли бы быть предметом отдельного рассмотрения. В данной книге эти вопросы не затрагиваются. Книга может быть также полезна радиоинженерам других профилей, желающим расширить свой кругозор, студентам радиотехнических факультетов вузов и всем энтузиастам цифрового вещания, захотевшим понять, как цифровой сигнал приходит на экран их телевизионного приемника. Автор старался сделать изложение по возможности популярным и доступным для понимания квалифицированного радиолюбителя. По этой причине использование математического аппарата сведено к минимуму и заменено разъяснениями на интуитивном уровне, возможно, в ущерб строгости изложения. В силу известных обстоятельств основные исследования и особенно разработки в области цифрового телевидения ведутся за рубежом, имеющиеся публикации недоступны основной массе инженеров. Опубликованные на русском языке полтора-два десятка статей в журналах «Телеспутник», «625», «Техника кино и телевидения» дают общее представление о методах цифрового сжатия, но не затрагивают многие существенные аспекты функционирования аппаратуры. Книга содержит 11 глав и несколько приложений. В первой главе дано введение в технику цифрового телевидения, призванное напомнить читателям основные принци-
Вступление 7 пы цифровой техники и сообщить некоторые сведения, полезные для понимания дальнейшего изложения. В главах 2-5 по возможности подробно освещены вопросы цифрового сжатия, описаны стандарты семейства MPEG, включая еще не завершенные MPEG-4 и MPEG-7. Значительное внимание в гл. 6 и 7 уделено деятельности международной организации «Проект DVB» и рассмотрению принятых ею стандартов передачи вещательных сигналов в различных средах. В главе 8 приводятся основные сведения по системам условного доступа, девятая глава посвящена интерактивным службам. Одним из важнейших аспектов перехода к цифровому вещанию становится выбор критериев и создание технических средств контроля качества обслуживания в цифровых каналах. Эти вопросы рассмотрены в десятой главе. В помощь специалистам телерадиокомпаний, планирующих закупку оборудования цифровой компрессии и переход к цифровому вещанию, в книгу введены глава И, описывающая устройство и работу различных элементов аппаратуры, и Приложение А, содержащее технические параметры более 600 приборов и систем более чем 100 фирм- производителей. В основу книги положен опыт создания и двухлетней эксплуатации комплекса цифровой компрессии на принадлежащей ЗАО «Бонум-1» передающей станции «Сколко- во», осуществляющей вещание программ телекомпании «НТВ Плюс». Автор благодарит своих коллег по ЗАО «Бонум-1» за дискуссии и полезные замечания. Считаю своим долгом выразить признательность Европейской организации спутниковой связи Eutelsat и телекомпании «НТВ Плюс» за всестороннюю поддержку издания книги. Особая благодарность моему другу г-ну Паулю Бартману (Paul Barthmann) за его усилия по координации совместной работы с Eutelsat. Быстрым выходом в свет книга обязана компании Syrus Systems, способствующей таким образом распространению технических знаний в инженерном сообществе России. Специалистами компании Syrus Systems непосредственно подготовлена часть материала 11-й главы, касающаяся примеров построения аппаратуры и практической реализации цифровых аппаратурных комплексов. Отдельно хотелось бы отметить вклад в создание книги крупнейшего специалиста в области телевидения проф. М.И.Кривошеева, выступившего инициатором ее написания и давшего ряд ценных советов. Серьезной проблемой при написании книги по материалам зарубежных источников обычно становится поиск в русском языке адекватных технических терминов для вновь появившихся понятий и приборов. Автор благодарен ведущим специалистам в области технической терминологии В.А.Хлебородову и В.Л.Штейнбергу, предоставившим для использования свои неопубликованные материалы в этой области. Улучшению книги немало способствовали замечания и рекомендации научного редактора, известного специалиста в области цифрового телевидения проф. Л.С.Виленчика, взявшего на себя труд внимательно прочитать рукопись. Полезные советы дали Е.Н.Дикарев, А.В.Гаврин и другие. Тем не менее, в книге возможны ошибки и неточности, и автор несет за них полную ответственность. Отзывы и замечания будут с благодарностью приняты по адресу: 107140, Москва, 3-й Новый переулок, 5, Syrus Systems. Б.А.Локшин
1 = ВВЕДЕНИЕ В ЦИФРОВОЕ ТЕЛЕВИДЕНИЕ 1.1.ОБЩИЕ ПРИНЦИПЫ ОБРАБОТКИ И ПЕРЕДАЧИ ЦИФРОВЫХ СИГНАЛОВ 1.1.1. Элементы цифровой техники Общепринятая десятичная система счисления удобна для человека, у которого на руках 10 пальцев, но она не очень удобна для электронных приборов, у которых обычно только два устойчивых состояния: «включено — выключено», «положительное напряжение отрицательное напряжение» и т.д. Как следствие этого факта, в цифровой технике за основу взят двоичный, или бинарный, код с основанием 2, в котором только две цифры: 0 и 1. Двоичная цифра получила название бит (от английского Binary digiT). Многозначное число называется словом, а число битов в нем — длиной слова. Число из 8 битов называется байтом (BY eighT ). В двоичной записи любого числа крайний правый, наименее значимый бит называется LSB (от английского Least Significant Bit ), крайний левый — наиболее значимый и называется MSB ( от Most Significant Bit). Существует и достаточно широко используется (в том числе и в цифровом вещании) система счисления с основанием 16, для недостающих шести цифр в нее введены прописные латинские буквы А (= 10), В (=11), С (= 12), D (= 13), Е (=14), F (=15). Число в шестнадцатиричной записи сопровождается буквой h (hexadecimal — шестнадцатиричный) или начинается со знаков Ох (0x47 = 47h = 71 = 0100 0111). Как известно, в математике используются два способа представления чисел: с фиксированной запятой и с плавающей запятой. При представлении в форме с фиксированной запятой считается, что положение запятой, отделяющей целую часть числа от дробной, фиксировано. Разряды слева от запятой представляют целую часть числа и его знак, а справа — дробную часть числа. Запись с плавающей запятой имеет вид: A = (±fi)>2±v , где ju — правильная дробь и v — целое, — числа без знака, называемые порядком {характеристикой) и мантиссой числа А. Оба представления используются в цифровой технике. Два состояния сигнала в электронной схеме обычно соответствуют двум значениям напряжения, которые условно называют «высокое» и «низкое». Конкретные значения напряжений заключены в некоторых пределах, зависящих от аппаратурной реализации
10 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю схемы, и не имеют большого значения, важны только их логические значения «истинно» и «ложно». В большинстве случаев используется положительная (или прямая) логика, когда высокому напряжению соответствует «истинно», низкому — «ложно», но применяется и отрицательная (инверсная) логика с обратным распределением критериев верности. К основным (базисным) логическим операциям относятся логическое сложение (дизъюнкция), умножение (конъюнкция) и отрицание (инверсия). Табл.1.1 Логические элементы цифровой техники Наименование ЛЭ Инвертор (НЕ) Дизъюнктор (ИЛИ) Конъюнктор (И) Стрелка Пирса (ИЛИ-НЕ) Штрих Шеффера (И-НЕ) Исключающее ИЛИ Функция У=Х У=Х,+Х2 У=Х,Х2 У=Х,4-Х2 У=Х,/Хг У=Х,ФХ2 Обозначение в отечественной литературе X IP Xj_ ■] Т 1 У XJ_ Г~& У Х]_1 1 , У xq Ч """&} У * v х1 ф У Обозначение в зарубежной литературе н>- 3> D- г> =| О ■> )Г> Таблица истинности X У 0 1 1 0 X, X, 0 0 0 0 1 0 1 1 X, X, 0 0 0 1 1 0 1 1 X, X, 0 0 0 1 1 0 1 1 X, X, 0 0 0 1 1 0 1 1 X, X, 0 0 0 1 1 0 1 1 У 0 1 0 1 У 0 0 0 1 У 1 0 0 0 У 1 1 1 0 У 0 1 1 0 Описание Выход противоположен входу У истинно, если хотя бы одно из X истинно У истинно, если оба X истинны У ложно, если хотя бы одно из X истинно У ложно, если оба X истинны У истинно, если Х,и Хг различны * — предлагаемое обозначение.
Глава 1. Введение в цифровое телевидение 11 2 + ...,Хп ИЛИ Логической суммой переменных дс1?х2 ,....*„ (логическое ИЛИ) называется двоичная переменная у, принимающая нулевое значение тогда и только тогда, когда все слагаемые одновременно равны нулю. Логическая сумма обозначается у = х}+х y = x]vx2v...vxn и читается: х15 или х2, или ...или хп. Логическим произведением переменных х19х2,....хп (логическое И) называется двоичная переменная у, принимающая единичное значение тогда и только тогда, когда все множители одновременно равны единице. Логическое произведение обозначается у = х1х2....хп или у = Xj ax2 л....лх„ и читается: х{, и х2, и....и хп. Логическим отрицанием переменной х (логическое НЕ) является двоичная переменная уь принимающая единичное (нулевое) значение тогда и только тогда, когда х равно нулю (единице). Логическое отрицание обозначается у=х, читается: не х. Перечисленные операции образуют так называемую булеву алгебру и могут осуществляться тремя логическими элементами (ЛЭ), показанными в трех первых строках табл. 1.1 [1.1]. В общем случае логическую функцию реализуют, соединяя несколько ЛЭ, каждый из которых выполняет одну из базисных операций. Например, сложение двух чисел выполняется поразрядно, начиная с LSB, в случае двух единиц в текущий разряд записывается 0 и осуществляется перенос 1 в старший разряд. Умножение заменяется комбинацией сложений и поразрядных сдвигов. Число ЛЭ, используемых при построении логической схемы, можно уменьшить, используя дополнительные базисные операции, отличные от булевых. Наиболее удобны следующие функции: «ИЛИ-НЕ» (логическая операция «стрелка Пирса») Запуск у = хх 4< х2 >1 хх +х2 +... + *„; «И-НЕ» (логическая операция «штрих Шеффе- ра») у = х} /х2/..../хп =х}х2....хп [1.2, 1.3]. В некоторых исследованиях удобнее использовать так называемую арифметику по модулю 2, образуемую операциями умножения и сложения по модулю 2. Операция умножения по модулю 2 совпадает с логическим умножением (конъюнкцией). Сложение определяется следующим правилом: сумма двоичных слагаемых ххх2....хп принимает значение 1, если число слагаемых в сумме, имеющих значение 1, нечетно (перенос в старший разряд отсутствует). Сложение по модулю 2 описывается логической функцией, называемой «исключающее ИЛИ»: у = хх(Вх2(В....®хп. Дополнительные функции также включены в табл. 1.1. Кроме ЛЭ, выходное состояние которых зависит только от входных сигналов в данный момент времени, в цифровых схемах широко применяются и устройства с памятью, состояние которых определяется входными сигналами в предшествующие моменты времени. Простейшее устройство такого вида — запоминающий элемент (ЗЭ), который может принимать одно из двух состояний «О» или «1» и хранить его сколь угодно долго, пока не будет переведен в противоположное состояние входным сигналом. Моменты переключения задаются специальным периодическим сигналом — тактовым сигналом, поступающим на управляющий вход и имеющим вид последовательности импульсов. Вообще тактовый сигнал играет очень важную роль в цифровой технике, он задает ритм работы цифрового устройства, синхронизирует работу отдельных Запуск Рис. 1.1. Симметричный триггер с прямым (Q) и инвертирующим (Q) выходами
12 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю элементов и целых комплексов. Нам придется в дальнейшем часто обращаться к этому понятию. Одним из примеров ЗЭ является триггер — устройство с двумя устойчивыми состояниями, применяемое в качестве ячеек памяти, каскадов задержки на такт, пересчетных ячеек (с делением на 2). Существует большое число разновидностей триггеров. Простую схему симметричного триггера с прямым и инверсным выходами можно получить, соединив два ЛЭ, как показано на рис. 1.1 [1.2]. Несимметричный триггер (триггер Шмитта, D-триггер) имеет один информационный вход и может использоваться в качестве устройства задержки на такт. Введем для такого устройства обозначение в виде прямоугольника с буквой D внутри. Для записи слов ЗЭ объединяются в ячейки памяти. Сочетание ЛЭ и ячеек памяти позволяет формировать различные цифровые устройства — сумматоры, умножители, шифраторы и дешифраторы, регистры, счетчики и т.д. 1.1.2. Формирование и обработка цифровых сигналов Рассмотрим теперь, как цифровые устройства обрабатывают цифровой сигнал. Прежде всего: что такое цифровой сигнал и как он соотносится с аналоговым? С математической точки зрения аналоговый сигнал описывается непрерывной функцией времени ха (/), причем и аргумент, и сама функция могут принимать любые значения из некоторых интервалов: tx <t<t2\xx <x <х2 (рис. 1.2а). К аналоговым сигналам относятся, например, речевые сигналы в телефонии и «обычные» телевизионные сигналы. Если теперь рассматривать значения сигнала только в определенные, дискретные моменты времени t = nT9 n =0,1..., получим дискретный сигнал, описываемый решетчатой функцией хд(пТ) Величина Т называется интервалом дискретизации, fd =1/Г- частотой дискретизации. На рис 1.26 изображен график дискретного сигнала. Видно, что решетчатая функция может принимать любые значения из некоторого интервала х{<х<х2. К дискретным относятся, например, сигналы с амплитудно-импульсной модуляцией. Цифровой сигнал описывается квантованной решетчатой функцией хк(пТ) , т.е. решетчатой функцией, принимающей лишь ряд дискретных значений — уровней квантования kx,k2,....km (рис.1.2в). Каждый из уровней квантования кодируется кодом, состоящим из двоичных цифр, так что передача или обработка отсчета цифрового кодированного сигнала сводится к операциям над безразмерным двоичным числом. Нетрудно видеть, что для перехода от аналогового к цифровому сигналу необходимо произвести три преобразования — дискретизацию, квантование, цифровое кодирование. Рис. 1.3 демонстрирует, что первые две операции можно проделать в произвольном порядке [1.1]. Операция дискретизации состоит в том, что по заданному аналоговому сигналу xa(t) строится дискретный сигнал хд (пТ) , причем хд (пТ) = ха (пТ). Операция восстановления состоит в том, что по заданному дискретному сигналу хд{пТ) строится аналоговый сигнал ха(пТ) Операции дискретизации и восстановления взаимно обратны в том случае, когда дискретизируемый аналоговый сигнал удовлетворяет условию теоремы отсчетов (теоремы Котельникова), гласящей: всякая детерминированная функция с ограниченным спектром частот может быть однозначно представлена совокупностью отсчетов, взятых через интервалы времени Т с тактовой частотой fd = 1 / Т, по крайней мере вдвое превышающей наивысшую частоту спектра сигнала F. Для восстановления исходного сиг-
Глава 1. Введение в цифровое телевидение 13 x.(t) / t1 I у А у ^v \ > \ \ \ \ V Ч м? |Ч I fc- ^ Х2 а) т 2Т 31 121 , ^ ^ б) х^пТ) *и* *1 к; 2 к. 1 { 1 i 9 9 < 1 В 1 ( ) 1 1 1 1 , ^- " ^ Рис. 1.2. К определению аналогового (а), дискретного (б) и цифрового (в) сигналов нала по совокупности отсчетов их следует пропустить через идеальный фильтр нижних частот (ФНЧ) с полосой F Как известно, импульсная реакция ФНЧ на единичный импульс имеет вид sinx/jc, в моменты прихода всех других импульсов, отделенные интервалами времени, кратными 7\ она проходит через 0, так что отклики на отдельные импульсы оказываются независимыми и исходный сигнал возникает как суперпозиция парциальных (частичных) откликов (рис. 1.4). Изменение числа отсчетов в единицу времени называется передискретизацией. Если изменение происходит в сторону уменьшения числа отсчетов, говорят о понижающей дискретизации (ее также называют субдискретизацией, или децимацией, или прореживанием). Передискретизация с увеличением числа отсчетов называется повышающей дискретизацией, или интерполяцией. Операция квантования заключается в замене непрерывного интервала значений дискретного сигнала конечным множеством разрешенных для передачи значений. При этом возникает неустранимая ошибка квантования Акв, равная разности между квантованным и истинным значениями сигнала. Квантование может быть равномерным, когда
дискретизация по времени ц. квантование по уровню ЕЛ квантование по уровню 110 101 100 011 0101 001 00№ цифровое кодирование дискретизация по времени -•—•- Рис. 1.3. Дискретизация и квантование могут производиться в произвольном порядке
Глава 1. Введение в цифровое телевидение 15 Рис. 1.4. Восстановление сигнала по совокупности отсчетов на выходе идеального ФНЧ интервал значений делится на равные части, или неравномерным, при котором квантованные значения отстоят на неравные промежутки, например, малые уровни сигнала квантуются с меньшей ошибкой, чем большие. На последнем этапе цифрового кодирования значения сигнала заменяются набором двоичных символов. Описанный процесс аналого-цифрового преобразования (АЦП) называется импуль- сно-кодовой модуляцией (ИКМ) и наиболее часто используется в технике цифровой связи, в том числе и в системах цифрового вещания. Обратная операция декодирования состоит в построении дискретного сигнала по заданному цифровому. Иногда восстановление аналогового сигнала по заданному цифровому рассматривают как единую двухэтапную операцию и называют ее цифро-аналоговым преобразованием (ЦАП). Из-за неустранимой ошибки квантования это обратное преобразование осуществляется не вполне точно, причем погрешность зависит от шага квантования. К простейшим операциям цифровой обработки относятся умножение цифрового сигнала на константу, смещение уровня и сложение двух цифровых сигналов. Умножение на константу означает изменение коэффициента передачи цифрового устройства (регулировку усиления), смещение уровня осуществляется логическим сложением всех отсчетов с постоянной величиной и означает, по сути, изменение постоянной составляющей, а сложение двух цифровых сигналов приводит к их смешению и позволяет реализовать цифровой смеситель (рис. 1.5) [1.4]. Наличие ячеек памяти позволяет осуществить временное сжатие (компрессию) цифрового сигнала. Если записывать данные в память с одной тактовой частотой, а считывать их с другой, большей тактовой частотой, можно преобразовать непрерывный поток в последовательность блоков данных, разделенных промежутками. В этих промежутках блок данных можно успеть дополнительно обработать, например, ввести биты защиты от ошибок, или вставить в промежутки блоки данных из другого цифрового потока (такая операция называется мультиплексированием). Разумеется, можно провести и обратную процедуру расширения сжатого сигнала. Одной из важнейших и часто используемых операций является цифровая фильтрация. Как и обычный аналоговый фильтр по отношению к аналоговому сигналу, цифровой фильтр подавляет некоторые компоненты частотного спектра цифрового сигнала, не оказывая влияния на прохождение других компонентов. Теория цифровых фильтров основана на решении линейных дифференциальных уравнений с помощью Z-преобразо- ваний. Коэффициент передачи фильтра является Z-преобразованием дискретной импульсной характеристики и в общем виде имеет вид дробно-рациональной функции [1.5]: ki к2 1 -> у = kixi + кгхг Рис. 1.5. Цифровой смеситель Я(г) = a0z + axz zm+V +-+6m-i z+K которая реализуется схемой рис. 1.6, содержащей соединение сумматоров, запоминаю-
16 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Вход ат & L Г ьт^ Такты 1 К D J L ьт.,<^ 1 D *и <У L 1 Выход / Рис. 1.6. Обобщенная схема цифрового фильтра щих элементов со сдвигом на один такт и ветвей с умножением на константу. Если bi = О, / 1,2,... т , коэффициент передачи имеет вид рациональной функции и фильтр называется нерекурсивным, или фильтром с конечным импульсным откликом. Если хотя бы один из коэффициентов bt не равен нулю, фильтр называется рекурсивным (с обратной связью) и имеет бесконечный импульсный отклик. Такой фильтр при определенных условиях может быть неустойчивым. Отметим одну очень полезную особенность цифровых фильтров, отличающую их от аналоговых. Одним лишь перепрограммированием цифрового процессора заменой коэффициентов ai и 6, в ветвях фильтра — можно изменять характеристики фильтра в широких пределах. Например, фильтр может быть сделан адаптивным, гибко приспосабливающимся к параметрам сигнала в данный момент. Разновидностью пространственной фильтрации можно считать обработку цифрового сигнала функцией окна [1.6]. Последняя представляет собой некоторую взвешивающую функцию (прямоугольную, треугольную и т.д.), охватывающую несколько соседних отсчетов сигнала. После такой обработки значение каждого отсчета (например, элемента ТВ изображения) зависит от значений соседних элементов в некоторой окрестности. В качестве примеров такой обработки можно указать апертурный и медианный фильтры в телевидении или описанный далее в гл. 3 процесс обработки отсчетов звукоданных на выходе многофазного блока фильтров. При передаче данных по каналу связи из-за воздействия радиопомех, тепловых шумов, взаимного влияния сигналов отдельные биты или группы битов могут быть приняты неверно возникают ошибки. Повреждение группы последовательных битов называется пакетной ошибкой. Для улучшения статистических свойств цифрового сигнала и борьбы с пакетными ошибками применяют еще один вид обработки цифрового сигнала перемешивание, при котором биты передаваемого сообщения определенным образом перемешиваются на передающей стороне, а на приеме восстанавливается первоначальный порядок их следования. Если в канале имела место пакетная ошибка, после обратного перемешивания поврежденные биты рассеются по потоку, и мы получим совокупность независимых ошибок, которые значительно легче исправить, чем групповую. Один из распространенных практических методов перемешивания называется скрем- блированием. В процессе скремблирования цифровой сигнал, подлежащий передаче по каналу связи, суммируют по модулю 2 со специальным скремблирующим сигналом, чьи статистические свойства весьма близки к свойствам случайного процесса. Этот специальный сигнал генерируется в скремблере и называется псевдослучайной последовательностью (ПСП). В результате суммирования внутренние корреляционные связи в сигнале значительно ослабляются, его частотный спектр становится более равномерным. На приемной стороне повторное суммирование с той же ПСП, восстановленной в дескремблере по известному закону ее формирования, позволяет вернуться к первоначальному виду сигнала. Скремблирование называют еще рандомизацией.
Глава 1. Введение в цифровое телевидение 17 К разновидностям перемешивания относится также и перемежение перестановка местами соседних символов в последовательности некоторым детерминированным образом — периодическим или псевдослучайным. Перемежение по псевдослучайному закону сложнее в реализации, но характеризуется большей устойчивостью при изменении характеристик канала во времени. При блоковом перемежении последовательность кодовых символов записывается в столбцы матрицы, состоящей из N строк и М столбцов, а считывается по строкам. После восстановления в декодере любая пакетная ошибка длительностью г <М переходит в независимые ошибки, разделенные не менее чем N символами. При сверточком перемежении символы с помощью коммутатора последовательно записываются в N регистров сдвига разной длины, обеспечивающих задержку данных на величину Мхп, где п = О, \,...N — порядковый номер ветви, М параметр кодера. Декодер строится аналогичным образом, но с обратным порядком расположения ветвей, и синхронизируется с кодером. В результате пакетная ошибка длительностью менее N символов разбивается на ряд одиночных, разделенных интервалом М символов. Свер- точное перемежение требует вдвое меньшего объема памяти, чем блоковое. 1.1.3. Передача цифровых сигналов по линиям связи Возможны два способа передачи битов двоичных чисел, соответствующих отсчетам И КМ сигнала. Если каждый бит отсчета передается по отдельной линии, это параллельная передача. Сигнал тактовой частоты в этом случае также передается по отдельной линии. Потребность в большом числе соединительных линий является серьезным недостатком параллельной передачи, особенно для доставки сигнала на значительные расстояния. Требуются специальные многопарные кабели, сложные соединители. Этот метод практически используется только для соединений внутри аппаратуры и в меньшей степени внутристудийных соединений. Заметим, однако, что все операции обработки цифровых сигналов, аналого-цифрового и цифро-аналогового преобразования производятся над сигналами в параллельной форме. Для передачи сигналов между аппаратными и на более далекие расстояния используется более экономичная последовательная передача, когда все биты отсчета передаются по одной физической линии методом временного уплотнения (мультиплексирования). Разумеется, при этом значительно возрастают тактовая частота и затухание в кабеле, однако современная техника успешно справляется с такими трудностями. Переход от параллельной к последовательной передаче и обратно производится с помощью соответствующих преобразователей, называемых в инженерной практике параллельно- последовательными и последовательно-параллельными преобразователями. В процессе передачи приемник должен точно определить, к какому временному интервалу отнести тот или иной принятый бит, и это задача тактовой синхронизации. Возможны несколько путей решения указанной задачи. При асинхронной передаче сигнал тактовой частоты по каналу не передается, но частоты тактовых генераторов на передаче и приеме поддерживаются близкими, а точное их фазирование осуществляется периодически посредством специальных стартовых битов, передаваемых перед передачей каждого байта. Более надежный метод синхронной передачи предполагает передачу сигнала тактовой частоты передатчика по каналу связи к приемнику совместно с полезными данными (или выделение его из принимаемых данных) и захват частоты местного тактового генератора приемника. Наконец, в сложных многоэлементных цифровых системах, размещенных компактно, применяют метод принудительной синхро-
18 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Рис. 1.7. Возникновение фазового дрожания при наличии постоянной составляющей низации, когда тактовые генераторы всех канальных передатчиков и при-и емников захватываются общим генератором тактовой частоты [1.7]. Полученный в результате ИКМ- преобразования набор 0 и 1 мало пригоден для непосредственной передачи его по каналу связи. Нужно поставить в соответствие каждому биту определенный сигнал таким образом, чтобы восстановление информации на приеме происходило с минимальными ошибками. Техника преобразования цифрового сообщения в сигнал, пригодный для передачи по каналу, называется канальным кодированием. Любой канальный код формирует последовательность прямоугольных импульсов, которые тем или иным способом сопоставляются с передаваемыми кодовыми комбинациями. Выделение сообщения на приеме осуществляется пороговым устройством компаратором, который сравнивает принятый импульс с некоторым пороговым уровнем и принимает решение о переданном символе. Если канальный код содержит заметную постоянную составляющую, она приводит к смещению уровня сигнала, а следовательно, и положения фронтов импульса относительно порогового уровня и возникновению фазового дрожания, называемого также джиттером. Особенно заметно это влияние на длинных кабелях, где прямоугольные импульсы теряют свои крутые фронты и приближаются по форме к синусоидальным, а амплитуда их уменьшается (рис. 1.7) [1.1]. Итак, первое требование к канальному коду — отсутствие постоянной составляющей. Второе важное требование эффективная передача компоненты с тактовой частотой, так как нет уверенности, что при передаче тактового сигнала по отдельному каналу, особенно при последовательной передаче на сравнительно большие расстояния, сохранится требуемая степень синхронизации. Наиболее простой канальный код в виде бинарных импульсов, где «1» соответствует наличию импульса фиксированной амплитуды и длительности, а «О» — его отсутствию, не используется в силу следующих недостатков: 1) в сигнале имеется значительная постоянная составляющая, изменяющаяся в зависимости от соотношения 0 и 1 в сообщении; 2) не исключено появление длинных серий 0 или 1, не содержащих информации о тактовой частоте, что затрудняет тактовую синхронизацию. Предложено большое число разных сигналов, более или менее успешно справляющихся с задачей переноса всех компонентов цифрового сообщения. Символ может быть представлен разными способами — занимать весь или часть тактового интервала, отличаться полярностью, уровнем, фазой и т.д. По форме представления коды разделяются на абсолютные и относительные. В абсолютном коде каждому символу ставится в соответствие электрический сигнал, в относительном состояние сигнала меняется только при передаче символа «1». В зависимости от длительности импульса различают сигнал с возвратом к нулю (ВН) и без возврата к нулю (БВН). В сигнале ВН импульс занима-
Глава 1. Введение в цифровое телевидение 19 \ _м_ ^_ \ t ■■■■ /> 1 ^м 's t Lr б) Рис. 1.8. Сигнал с возвратом к нулю (ВН) (а) и без возврата к нулю (БВН) (б) ет половину или часть тактового интервала и возвращается к нулю при переходе в следующий такт (рис. 1.8а). Сигнал БВН не пересекает нулевую линию в течение тактового интервала (рис. 1.86). Сигналы ВН и БВН обладают несколько различными спектральными характеристиками [1.5, 1.8]. В биполярном сигнале «1» передается импульсом положительной или отрицательной полярности, «О» отсутствием импульса. В бичастотном коде два состояния передаются прямоугольными импульсами двух разных частот. Если период одной частоты равен тактовому интервалу, а период другой частоты — половине тактового интервала, такая разновидность кода называется частотной манипуляцией, или бифаз- ным кодом (bi-phase mark code), и широко используется в цифровом телевидении. Это один из первых самосинхронизирующихся кодов, в которых всегда есть составляющая с тактовой частотой, так как переход состояния обязательно происходит на границе такта, и еще один переход в середине такта имеет место при передаче 1. При передаче по реальной линии с шумами и помехами прямоугольная форма импульсов на приеме искажается, фронты растягиваются и как бы размываются шумом. При прохождении через приемный компаратор точка соответствия пороговому уровню из-за влияния шума может хаотично сдвигаться, возникает дрожание фазы (рис. 1.9), приводящее, как и при наличии постоянной составляющей, к неточному восстановлению тактовой частоты [1.1]. При длинных кабелях и значительном дрожании переход может сдвинуться в область соседнего тактового интервала — возникает межсимвольная интерференция. Если подать на сигнальный вход осциллографа цифровой сигнал, а на вход синхронизации — сигнал тактовой частоты, за счет инерционности зрения можно наблюдать интерференционную картину в виде размытых вершины, основания и переходов импульса с незашумленным «окном» или «глазком» в центре, по которому осциллограмма получила название глаз- ковой диаграммы (рис. 1.10). Помехоустойчивость передачи определяется как вертикальным, так и горизонтальным раскрывом глазка. В вертикальном направлении суммируются флуктуационные шумы, межсимвольные искажения, эхо-сигналы, дрейф порогового уровня компаратора, в горизонтальном — фазовое дрожание. В коротких кабелях эти компоненты малы, и открытие глазка сохраняет прямоугольную форму, за исключением наклона фронтов из-за влияния емкости кабеля. С увеличением длины кабеля шумы и искажения растут и закрывают глазок диаграммы в обоих направлениях. Для достижения наибольшей помехоустойчивости отсчеты должны браться Рис. 1.9. Возникновение фазового дрожания при наличии шумов
20 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Рис. 1.10. Глазковая диаг рамма SDI сигнала в середине импульса, где открытие глазка максимально. Для этого нарастающий фронт тактового импульса, управляющий опознаванием, должен точно совпасть с серединой информационного импульса. Один из надежных способов добиться такой синхронности применить для выделения тактовой частоты узкополосную цепь фазовой автоподстройки частоты (ФАПЧ). В этой цепи источником сигнала тактовой частоты служит высокостабильный генератор, управляемый по частоте напряжением с выхода фазового детектора, сравнивающего частоту и фазу генерируемого колебания и сигнала тактовой частоты, выделенного из пришедшего цифрового потока. Благодаря наличию ФНЧ в цепи управляющего сигнала (рис. 1.11) устраняется фазовое дрожание сигнала тактовой частоты и обеспечивается надежная синхронизация. В описанной схеме с ФАПЧ запись информации в буфер памяти производится с тактовой частотой принятого сигнала, а считывание с частотой местного синхронизированного генератора. Данная схема может служить иллюстрацией более общего метода буферизации данных, применяемого для выравнивания скорости поступления информации и борьбы с фазовым дрожанием. Нестабильность во времени прихода отдельных битов может быть результатом воздействия шумов и помех на передаваемый сигнал. Причиной поступления в приемник данных с различной скоростью может быть и пакетная передача гибкий способ передачи информации, при котором формируются блоки данных пакеты — определенного размера, снабженные заголовком, содержащим все необходимые сведения об адресате, содержании и параметрах кодирования сообщения. Пакеты передаются внутри информационной сети, включающей узлы коммутации и разветвленные тракты, маршруты отдельных пакетов могут не совпадать, и данные в приемник будут поступать с различной скоростью. При достаточной емкости буфера удается сгладить даже большие неравномерности в скорости поступления данных. Этот метод широко используется в цифровой компрессии. \ }\ Выделение тактовой частоты 1 Зап Фазовый детектор \ _> ись { \ sKt-IU \ ) Буфер J4 \ s Считывание Управляемый генератор / \ Рис. 1.11. Устранение фазового дрожания в цепи с ФАПЧ 1.1.4. Некоторые сведения из теории помехоустойчивого кодирования Одним из мощных средств борьбы с ошибками являются корректирующие коды. Процесс помехоустойчивого кодирования состоит в том, что наборы из к информационных символов отображаются в кодовые последовательности, состоящие из п символов, где п > к Наличие избыточных символов (их еще называют проверочными) позволяет отслеживать появление ошибок и по обнаружении исправлять их. Чем меньше доля используемых кодовых комбинаций от общего числа возможных, тем больше избыточность и выше корректирующая способность кода. Отношение R = k/n называется от-
Глава 1. Введение в цифровое телевидение 21 Рис. 1.12. К оценке ЭВК носительной скоростью кода. Конечно, при постоянной информационной скорости введение избыточности при кодировании повышает скорость модуляции и расширяет полосу используемых частот. Для оценки эффективности помехоустойчивого кодирования сравнивают отношение E6/N0 энергии, приходящейся на один бит, к спектральной плотности мощности шума в системе с кодированием и в базовой системе без кодирования и определяют разницу в значениях E6/N0 при заданной вероятности ошибки (рис. 1.12). Эта разница, измеряемая в децибелах и называемая энергетическим выигрышем кода (ЭВК), может быть использована для сравнения разных кодов. Для оценки обнаруживающей и исправляющей способности кода используют понятие кодового расстояния б/мин наименьшего из расстояний между любой парой кодовых последовательностей. Расстоянием между двумя последовательностями (его еще называют расстоянием Хэмминга) называется число позиций, в которых они отличаются друг от друга. Для вычисления расстояния между двоичными последовательностями используют посимвольное сложение по модулю 2. При декодировании ошибка обнаруживается, если ее кратность (количество ошибочных символов на длине блока) не превышает dмин ~1- Ошибка будет исправлена при t ^ [(с/мин-1)/2], где квадратные скобки означают целую часть числа. Декодер, который декодирует каждую принятую последовательность в ближайшее к ней по расстоянию Хэмминга кодовое слово, выбирает то кодовое слово, условная вероятность передачи которого максимальна, и потому называется декодером максимального правдоподобия. Современная теория кодов достаточно развита и содержит детальную классификацию [1.9]. Мы воспользуемся той ее частью, которая будет полезна при дальнейшем рассмотрении. Все применяемые коды можно разбить на две большие группы: блоковые, в которых кодирование и декодирование производятся в пределах определенного участка кодовой последовательности — блока, и древовидные, в которых обработка символов производится непрерывно, без разделения на блоки. Часть кодов относится к разряду линейных, в которых кодовые последовательности представлены как элементы линейного векторного пространства. Наконец, можно применить разбиение на коды, исправляющие независимые случайные ошибки, и коды, исправляющие пакетные ошибки. Несмотря на появление мощных кодов, исправляющих пакетные ошибки, часто оказывается более выгодным использовать коды, исправляющие независимые случайные ошибки, вместе с устройствами перемежения и восстановления. Линейные древовидные коды называются сверточными, поскольку процесс кодирования можно представить как специальную линейную операцию — свертку входной последовательности с импульсным откликом кодера. Сверточные коды при вычислении выходного символа учитывают текущий входной символ и несколько предшествующих. Общее число учитываемых символов К называется кодовым ограничением.
22 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Начнем рассмотрение с блоковых кодов. Сначала дадим определение систематических кодов. Систематическими называются коды, в которых передаваемые информационные символы содержатся в явном виде. Во всех кодовых комбинациях систематического кода проверочные символы занимают одни и те же позиции. Линейные двоичные блоковые коды часто называют групповыми, поскольку в этом случае кодовые слова образуют математическую структуру, называемую группой. Групповые коды составляют малую часть всех блоковых кодов, однако они имеют большое практическое значение. В классе линейных можно выделить большой класс так называемых полиномиальных кодов. Важность полиномиальных кодов обусловлена несколькими причинами. Во-первых, аппаратурная реализация таких кодеров относительно проста и требует лишь регистров сдвига с обратными связями. Во-вторых, это семейство содержит много кодов, кодовое расстояние которых близко к наилучшему. В-третьих, существует несколько алгоритмов декодирования, позволяющих декодировать эти коды с помощью сравнительно несложных устройств. Используемые алгоритмы декодирования полиномиальных кодов можно разделить на два класса: 1) процедуры, основанные на элементарных свойствах кодов — перестановочное декодирование, пороговое декодирование и др. 2) алгебраические процедуры, связанные с решением систем алгебраических уравнений. Многие полиномиальные коды обладают циклическими свойствами. Основное свойство циклических кодов, определяющее их название, состоит в том, что если кодовая комбинация v = (v0,v,,...v/l_1) принадлежит коду V то ее циклический сдвиг на произвольное число символов также является разрешенным кодовым словом. В теории циклических кодов [1.10] принято представлять кодовую комбинацию в виде многочлена по степеням формальной переменной х, коэффициенты которого символы кодового слова v: v(x) = v0 +v1Jt + .... + v„_1JC,,~1 Сложение многочленов производится поэлементно и коэффициенты складываются по модулю 2, а при умножении многочлен хп заменяется на 1. Такое представление удобно хотя бы потому, что упомянутая выше циклическая перестановка есть результат простейшего умножения данного многочлена на х Действительно, x-v(x) = v0x + v,jc2 +... + v„_,jc'7 = v„_, + v0x + .... + vn_2x"~} =v'(x). Многочлен g(x) степени n-k , на который делится без остатка двучлен 1 + хп называется порождающим многочленом. Свойство делимости кодовых слов циклического кода на порождающий многочлен используют для обнаружения ошибок в принимаемых словах. Если z(x) = v(x) + e(x) — принятое слово, содержащее многочлен ошибки е(х) ~ео +е1х + ... + е„_1хл~1, то в результате деления е{х) на g(x) получится остаток s(x), который называется синдромом. Он имеет степень не выше n-k-l ив отсутствие ошибок равен 0. Коррекция ошибок с помощью циклического кода облегчается тем обстоятельством, что синдром легко вычисляется с помощью простой схемы, которую для каждого порождающего многочлена нетрудно составить из регистров сдвига и ЛЭ «исключающее ИЛИ» Вход Такты ^ / ф N ) D / \ -> S. у Ф > J D / к * D / ч Рис. 1.13. Схема вычисления синдрома для порождающего многочлена д(х) = х3 + х + 1
Глава 1. Введение в цифровое телевидение 23 (на рис. 1.13 приведена схема для g(x) = x3 +x +1). Запись акхк означает в этой схеме сдвиг символа ак на к тактов вправо. Можно показать, что после седьмого такта в этой схеме состояние ячеек регистра будет соответствовать коэффициентам при степенях синдрома. Среди большого числа блоковых кодов нас будут интересовать коды Рида-Соломона — подкласс недвоичных кодов размерности q = 2m, m — целое, обеспечивающих наибольшее минимальное расстояние между словами при заданной длине блока, равное теоретическому пределу. Их используют для исправления пакетных ошибок (в сочетании с перемежением), а также в каскадных системах кодирования в качестве внешних кодов. Способность кода Рида-Соломона корректировать несколько ошибок обусловлена тем обстоятельством, что к исходным данным добавляется несколько избыточных символов и принятое кодовое слово делится не на один, а на несколько многочленов, давая соответствующее число синдромов. Пусть, например, добавлены два символа. Тогда одновременное решение двух получившихся уравнений дает значения двух неизвестных, одна из которых определяет положение ошибочного символа в кодовом слове и называется локатором, а другая дает структуру ошибки и именуется корректором. Для восьмибитовых символов полная длина кодового слова должна составлять 28 - 1 = 255 символов, из них 239 информационных и 16 проверочных. Для уменьшения объема расчетов и других целей код можно укоротить, заменив часть кодовых слов нулевыми кодовыми комбинациями на передаче и исключая соответствующие символы на приеме. Далее мы узнаем, как это свойство используется в цифровом вещании. Сверточные коды используются при низком отношении сигнал-шум, когда исправляющей способности блоковых кодов при разумной длине блока оказывается недостаточно. Свер- точный кодер с кодовым ограничением К представляет собой регистр сдвига с К ячейками и сумматоры по модулю 2 для образования кодовых символов. На рис. 1.14 изображен кодер с Л = 1/2, К= 3. Входы сумматоров соединены с определенными разрядами регистра в соответствии с видом порождающих многочленов, в результате формируется выходная цифровая последовательность. Отметим, что исходная последовательность не присутствует на выходе кодера в явном виде, т.е. данный сверточный код — несистематический. Коммутатор на выходе устанавливает очередность посылки кодовых слов в канал. В отличие от блоковых кодов, для многих из которых удается найти эффективные алгебраические методы конструирования и декодирования, большинство используемых сверточных кодов были найдены компьютерным моделированием значительного числа вариантов и выбором из них «хороших» кодов. По характеру использования информации, поступающей на вход декодера, алгоритмы декодирования сверточных кодов можно подразделить на следующие группы: Последовательное декодирование информация, полученная в процессе декодирования, используется для оптимизации поиска наиболее правдоподобных продолжений пути. Алгоритм чувствителен к пакетным искажениям символов в канале и потому широкого распространения не получил. Ф н~ 1— к Вход 3 2| Т Регистр сдвига о. о (0 I- 2 2 О Выход Рис. 1.14. Кодер сверточного кода с R = 1/2, К = 3
24 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Вхо, Вход^ \|/ Синхронизатор 1 sL/ Вычисление метрик путей \ 7 Управление и тактовая синхронизация Обновление и хранение г метрик путей 1 1 1 1- -| ч 7 \1/ Обновление и хранение информационных последовательностей -> N ' Выходное решающее устройство 1 1 1 J Выход У Рис. 1.15. Структурная схема декодера сверточного кода Пороговое декодирование — сравнительно простой алгоритм, применимый для некоторых сверточных кодов. В декодере имеется аналог кодера, в котором по принятым символам формируется копия проверочной последовательности. В формирователе синдрома образуется последовательность синдромов. Анализируя ненулевые синдромы, корректор исправляет ошибку в информационном символе. Табличное декодирование — декодирование на основе таблицы, которая ставит в соответствие каждой недопустимой последовательности ближайшую к ней допустимую. В большинстве перечисленных алгоритмов в демодуляторе производится жесткое решение о принятых сигналах, при котором выбирается кодовое слово, отличающееся от принятого слова в наименьшем числе символов. Алгоритм максимального правдоподобия (алгоритм Витерби). В этом случае в демодуляторе производится мягкое решение, содержащее информацию об апостериорной вероятности принимаемых символов. Оно использует полученную от демодулятора информацию о надежности оценок. Декодирование состоит в прослеживании по решетчатой диаграмме состояния кода пути с максимальной апостериорной (a posteriory после события) вероятностью. В процессе декодирования на каждом шаге вычисляют метрики декодированного пути, пропорциональные расстоянию между принятым сигналом и сигналом, соответствующим данной ветви кодера. В результате сравнения выбирают меньшую метрику и ее считают метрикой данного состояния для последующего шага. Глубина прослеживания в 5...6 раз превышает длину кодового ограничения К. Окончательное решение о принятом символе выносят на основе сравнения метрик «выживших» путей. Структурная схема декодера приведена на рис. 1.15. При реальных отношениях сигнал-шум выигрыш от применения мягкого решения достигает почти 2 дБ при восьмиуровневом квантовании [1.11]. Для повышения эффективности кодирования в последние годы в технике связи широко применяют каскадные коды последовательное кодирование символов двумя различными кодами, как показано на рис. 1.16. Коды называются внутренним и вне- Вхо, Вход^ Кодер внешнего кода Кодер внутреннего кода J Канал Декодер внутреннего кода Декодер внешнего кода Выход > Рис. 1.16. Схема организации каскадного кодирования
Глава 1. Введение в цифровое телевидение 25 Табл. 1.2 ЭВК для разных кодов и комбинаций кодов Вариант кодирования/декодирования 1. Рида-Соломона + Витерби 2. Рида-Соломона + биортогональный 3. Рида-Соломона + короткий блоковый 4. Витерби 5. Блоковый код (жесткое решение) 6. Сверточный код (пороговое декодирование) ЭВК 10s 6.5...7,5 5...7 4,5...5,5 4...5,5 3...4 1.5...3 ю-8 8.5...9,5 7...9 6,5...7,5 5...6.5 4,5...5,5 2.5...4.0 шним в зависимости от того, какое положение по отношению к каналу передачи они занимают. Внешний код обычно код Рида-Соломона; в качестве внутреннего могут использоваться различные коды сверточные, короткие блоковые, биортогональный код и др. В табл. 1.2 приведен результирующий выигрыш кодирования для разных комбинаций внутреннего и внешнего кодов при двух значениях вероятности ошибки — 10"5 и 10"8 [1.9]. В цифровом вещании широко используется сочетание сверточного кода с декодированием по алгоритму Витерби, хорошо работающего при низких отношениях сигнал- шум, и кода Рида-Соломона. При R = \/2 такое сочетание обеспечивает суммарную вероятность ошибки 10~10 при отношении энергии бита к спектральной плотности шума Еб IN0 = 3,0 дБ [1.12]. Интересно оценить, как близко это значение к теоретическому пределу и существуют ли практические коды с лучшими энергетическими характеристиками. Согласно известной теории Шеннона, информация по каналу с ошибками при выборе соответствующего кода может быть передана со сколько угодно высокой достоверностью, если скорость передачи не превышает пропускной способности канала. Еще один важный вывод из теории информации исправляющие свойства кода тем выше, чем ближе кодовые слова к случайной последовательности. Так, для канала с аддитивным белым шумом необходимое для передачи отношение E6/No определяется неравенством [1.13] ^>_L(22*-1) (1.1) Зависимость (1.1) проиллюстрирована графиком рис. 1.17 Нетрудно видеть, что при той же скорости R = (1 /2) х 188/204 = 0,461 предельная оценка на 3 дБ ниже достигнутой для данного каскадного кода. При передаче по каналам с ограниченной полосой (типовой режим для вещательных каналов) метод кодирования для достижения максимальной эффективности должен учитывать также и выбранную схему модуляции. Предложены несколько практических решетчатых кодов, реализующих так называемое сигнально-пространственное кодирование [1.9]. Подробнее о них поговорим в следующем разделе после рассмотрения вопросов модуляции. В середине 90-х годов был предложен новый класс кодов — так называемые тур-
26 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Рис. 1.17. Зависимость порогового значения E6/No от относительной скорости кода R бокоды, которые еще на 1,5-2,5 дБ приблизились к теоретическому порогу и обеспечивают декодирование при расчетных значениях Еб/ No 0,3...0,7 дБ над порогом. Основная идея такого кода, как и каскадного, — кодирование исходной символьной последовательности не одним, а несколькими кодерами, однако соединенными не последовательно (каскадно), а параллельно. При таком соединении устраняется одна из причин более низкой эффективности каскадного кода — кодирование внутренним кодером как информационных, так и проверочных битов внешнего кодера. Параллельное каскадирование исключает передачу «проверочных от проверочных» символов, и исправляющая способность возрастает. Типовая структурная схема турбокодера содержит несколько параллельных ветвей, состоящих из каскадно соединенных перемежите ля и кодера. В качестве последнего могут использоваться блоковые кодеры Хэмминга, Рида-Соломона, сверточные кодеры, построенные по схеме рекурсивного систематического кодера. Мы упоминали в предыдущем разделе, что рекурсивным называется устройство, у которого имеется обратная связь с выхода на вход. Рекурсивный сверточный кодер приобретает важное свойство, необходимое для турбокодирования, он становится систематическим, так как входная последовательность напрямую проходит на один из выходов. Если теперь в распределительном устройстве на входе добавлять к каждой входной последовательности из к битов хвостовую часть из п к битов, переводящую кодер в исходное нулевое состояние, его можно рассматривать как блоковый с длиной блока п. Функция перемежите- ляу работающего по псевдослучайному закону, обеспечивать рандомизацию входной последовательности для каждого кодера, что повышает корректирующую способность. В практических схемах турбокодеров обычно используются два кодера и один пере- межитель, как показано на рис. 1.18 [1.14]. Здесь за основу взят простейший сверточный код cR= 1/2иК = 3, показанный ранее на рис. 1.14, у которого один из выходов соединен со входом. Результирующая скорость кода составляет 1/3 (на каждый информационный бит приходится по одному проверочному от каждого из кодеров) и может быть увеличена (например, до 1/2) путем перфорирования некоторых проверочных битов с выходов обоих кодеров. Разумеется, ценой увеличения скорости передачи будет при этом некоторое снижение корректирующей способности. Декодирование турбокода базируется на оценке вероятности различных кодовых слов или различных путей на решетчатой диаграмме. Используется как априорная, так и апостериорная информация о событии. Кодеру, показанному на схеме рис. 1.18, соответствует декодер, схема которого изображена на рис. 1.19. Исходная информационная последовательность и первая проверочная последовательность с выхода демультиплек- сора поступают на вход первого декодера, на его выходе формируется мягкое решение о принятой последовательности, и оно вместе с проверочными битами второго кодера
Глава 1. Введение в цифровое телевидение 27 Вход Ф № Ф h Ф Переме- житепь Ф е поступает на вход второго декодера. Ключевой особенностью турбокодирова- ния, благодаря которой оно и получило свое название, является итеративное повторение циклов декодирования в замкнутой петле на рис. 1.19, при котором результат каждой итерации совместно с проверочными битами служит исходным сигналом для следующей. Компьютерное моделирование показывает, что при числе итераций до 18 и длине блока 65 536 битов обеспечивается вероятность ошибки 10'5 при E6/No = 0,7 дБ [1.13]. Дальнейшее изучение свойств турбо- кодов показало, что их пороговые характеристики выше, чем у сверточных и каскадных, лишь в области не очень высоких E6/No (до вероятности ошибки не ниже 10~5), поэтому рассматривается возможность использования турбо- кода в качестве внутреннего для каскадного кода. Турбокоды показали высокие результаты в помехоустойчивом кодировании уже после того, как были выбраны методы модуляции и кодирования для основных систем цифрового вещания, поэтому сейчас рассматривается их использование лишь в качестве опционных, дополнительных решений, однако есть все основания полагать, что в недалеком будущем они займут подобающее место в системах цифрового вещания. По своему построению и свойствам к кодам близко примыкают псевдослучайные последовательности (ПСП), о которых мы уже упоминали ранее. ПСП обладают рядом полезных свойств, позволяющих использовать их в технике цифрового вещания при скремблировании, шифровании цифровых сигналов, построении генераторов шумопо- добных сигналов, измерении достоверности передачи по цифровому каналу. Линейными ПСП максимальной длины называются последовательности символов двоичного кода длиной L = 2m -1, где т — степень порождающего многочлена. Двоичные ПСП обладают следующими основными свойствами [1.8]: 1. Любой циклический сдвиг ПСП на целое число тактов есть также ПСП. Это означает, что отсчет длины ПСП можно начать с любого ее члена. 2. Число единиц в ПСП 2шЧ на единицу больше числа нулей 2т'х -1. 3. Каждая комбинация из расположенных подряд т символов ПСП встречается за период ПСП только один раз. 4. Сумма по модулю 2 данной ПСП и ее циклического сдвига также является ПСП. 5. Длина периода ПСП нечетна. Генерирование ПСП наиболее просто осуществляется с помощью регистров сдвига с е Рис. 1.18. Пример построения турбокодера
28 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю "-* Проверочные данные ^| Демульти |—' т>[ плексор Вход Декодер 1 Декодер перемежения чн Переме- житель гН Систематические данные Переме- житель Деко- 4 Дер 2 Выход Рис. 1.19. Турбодекодер логической обратной связью в виде ячеек «исключающее ИЛИ». Число триггеров регистра равно степени порождающего многочлена w, а число ячеек определяется видом многочлена и в общем случае на два меньше числа его членов. Для ПСП заданной длины может быть найдено несколько порождающих многочленов. На рис. 1.20 показан пример построения генератора ПСП для т = 8. е Ф h ЬУ И "^ ^ И И ■ж—' ■—ж* Выход Такты Рис. 1.20. Структурная схема генератора ПСП с порождающим многочленом д(х) = х8 + х6 + х6 + х+1 1.1.5. Модуляция в системах цифрового вещания Хотя модулированный сигнал относится к аналоговым сигналам, рассмотрение процесса модуляции здесь уместно, так как от его удачной реализации зависят многие характеристики цифровой системы.
Глава 1. Введение в цифровое телевидение 29 В общем виде колебание модулированной несущей с частотой со0 s(t) = S(t) cos[o0t - (p{t)] (1.2) В системах цифрового вещания широко применяются амплитудная и фазовая модуляция. При амплитудной модуляции (AM) несущей бинарным сигналом на выходе модулятора получается колебание несущей частоты, амплитуда которого S(t) принимает одйо из двух значений S0 или St> соответствующих 0 и 1. Многоуровневая, или многопозиционная AM с кратностью М формирует сигнал с М возможными значениями амплитуды, при этом фаза сигнала в процессе модуляции не изменяется (cp(t) = const). Спектр AM сигнала содержит несущую и две боковые полосы, повторяющие форму спектра модулирующего сигнала. В некоторых случаях используют сигналы с полным или частичным подавлением несущей, одной из боковых полос или несущей и боковой полосы одновременно. При фазовой модуляции (ФМ) амплитуда сигнала остается постоянной, а фаза при манипуляции скачкообразно изменяется на величину, зависящую от кратности модуляции М. Дискретные значения фазы сигнала q>i =2nai IM , где — ai -M -ичный символ из множества {0,1,2,...,М-1}. Обычно М = 2*,к = 1,2,3,... Тогда каждый символ ai соответствует набору из к = log2 М двоичных информационных символов, а его длина Тс = кТ, где Т длительность двоичного символа. При М = 2 получаем сигналы двухпози- ционной ФМ-2, при М = 4 четырехпозиционной ФМ-4 (в англоязычной литературе ФМ-2 называется BPSK, ФМ-4 - QPSK, ФМ-8 - 8-PSK). Модулированный сигнал (1.2) можно представить в виде двух квадратурных (со сдвигом на 90°) составляющих: s(t) = [S(t) cos <p(t)] cos co0t + [S(t) sin <p(t)] sin co0t (1.3) Если в соответствии с (1.3) промодулировать, например, бинарными сигналами две несущие cos co0t и sin co0t с фазовым сдвигом 90° и полученные сигналы сложить, результирующий сигнал будет уже четырехпозиционным, и такая модуляция называется квадратурной, а две компоненты сигнала синфазной (I in-phase) и квадратурной (Q — quadrature). Обычно полагают, что вектор I совпадает с осью абсцисс, а вектор Q ориентирован вдоль оси ординат. Если сигнальные векторы дискретно модулируются не только по фазе, но и по амплитуде, получается КАМ квадратурная AM (QAM в англоязычной литературе). Представление сигналов в виде суммы квадратурных составляющих подсказывает простой способ их формирования в модуляторе. В частности, сигналы ФМ-4 можно получить как сумму двух сигналов ФМ-2, несущие колебания которых отличаются на 90° Схема такого модулятора показана на рис. 1.21 [1.11]. Модулирующие последовательности в квадратурных каналах получают расщеплением исходной информационной последовательности на четные и нечетные символы. Длительность символа в каждом канале равна Тс 2Т. Сигналы ФМ-2 квадратурных каналов складываются, образуя четырехфазный сигнал ФМ-4. Модулятор ФМ-2 7F Q 71/2 Сумматор Модулятор ФМ-2 COS G)Qt Рис. 1.21. Структурная схема квадратурного модулятора
30 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю При одновременной смене символов в каждом из квадратурных каналов модулятора в сигнале ФМ-4 происходит скачок фазы на я, что вызовет на выходе фильтра провал огибающей до нуля. Исключить скачки фазы на п возможно, если разнести во времени моменты смены фаз в квадратурных каналах. Обычно модулирующие сигналы в одном из каналов смещают на величину Тс /2 (так называемая смещенная ФМ). От формы модулирующих сигналов в каналах зависит наличие или отсутствие межсимвольных помех и общая ширина полосы частот, занимаемая ФМ сигналом. Обычные прямоугольные сигналы в этом смысле далеко не оптимальны. Существенного сужения спектра удается добиться округлением элементарных модулирующих сигналов. Наиболее часто применяют спектры Найквиста с так называемым косинусным скругле- нием, которое задается соотношением [1.11]: 1, 0<П<я(\-а)/Т9 S(Q) = ^cos: 1_ ^у^ 4а Т т т (1.4) О, Q > я(1 + а)/Т Коэффициент а характеризует степень скругления спектра. На рис. 1.22 приведены частные случаи спектра Найквиста. Условием отсутствия межсимвольных помех является передача символов со скоростью \/Т Сравнение свойств различных сигналов удобно производить, используя их геометрическое представление. Многомерные сигналы можно изобразить в виде точек (концов векторов) на плоскости. На рис. 1.23 показаны типичные ансамбли сигналов с ФМ и К AM. Пространство сигналов з(ю) модулированной несущей представляет собой дискретные положения вершин суммарного вектора (I+Q) в системе координат I, Q. В случае ФМ-4 векторы I и Q имеют одинаковые и постоянные амплитуды, дискретно меняются только фазы, которые могут принимать значения 0° или 180° — для вектора I и 90° и 270° для вектора Q. При этом энергия ФМ сигналов в процессе модуляции не меняется, и вершины суммарного вектора I+Q при переходе от одного фазового положения до другого описывают окружность (рис. 1.23). В случае К AM концы сигнальных векторов располагаются в узлах прямоугольной решетки. Нетрудно видеть, что при М КАМ-4 совпадают. В ансамблях многопозиционной КАМ дискретизация по амплитуде возможна с равномерным и неравномерным шагом. В первом случае мы имеем дело с неиерархической модуляцией, обеспечивающей одинаковую помехоустойчивость для всех передаваемых Рис. 1.22. АЧХ канала при различных значениях коэффициента скругления а 4 векторы ФМ-4 и
Глава 1. Введение в цифровое телевидение 31 Q ФМ-4 Q ФМ-16 Q • + 4 + КАМ-4 КАМ-8 КАМ-16 Рис. 1.23. Ансамбли сигналов ФМ и КАМ при различных М комбинаций, во втором случае, при иерархической модуляции, некоторые компоненты потока могут передаваться с повышенной помехоустойчивостью. С точки зрения помехоустойчивости важно сохранять достаточно большим минимальное расстояние между двумя соседними точками в ансамбле. Доказано, что это условие выполняется при размещении точек в узлах квадратной решетки. В многопозиционных ансамблях каждый М-ичный сигнал содержит информацию о к двоичных информационных символах (М = 2*). Для минимизации вероятности ошибки на символ необходимо так сопоставить каждому сигналу набор символов, чтобы последовательности, соответствующие соседним сигналам, отличались наименьшим числом двоичных символов. Этим свойством обладают некоторые манипуляционные коды, в частности, широко применяемый код Грея. На рис. 1.24 показано построение кодовых комбинаций данного кода. Выше мы говорили о построении кода, учитывающего вид модуляции и расстояния между сигналами в сигнальном пространстве. Оказывается, что при многомерных сигналах свойства кода сами по себе не обязательно определяют вероятность ошибки. Важно, какие евклидовы расстояния получаются при сочетании способа кодирования и
32 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю схемы модуляции. Напомним, что евклидовым расстоянием между двумя точками а и b n-мерного пространства называется величина: *=Л>-*')2 10 • V 00 • У 0010 • 0011 • 0001 • 0010 • 0110 • 0111 • 0101 • 0100 • 1110 • 1111 • 1101 • 1100 • 1010 • 1011 • 1001 • 1000 • Рис. 1.24. Примеры построения манипуляционных кодов Основным параметром, характеризующим в случае сверточных кодов комбинацию варианта кодирования и способа модуляции, является свободное евклидово расстояние dce, определяемое как минимальное евклидово расстояние между любыми парами кодовых последовательностей vk и vJm Если необходимо согласовать выбор кода и выбор сигналов, то критерием в этом случае служит не вероятность ошибки двоичного символа, а асимптотический выигрыш от кодирования, который определяется формулой где d6a3 минимальное евклидово расстояние между различными последовательностями в базовой системе без кодирования. В качестве примера рассмотрим кодирование для 8-ичной AM с использованием сверточного кода и декодирования Витерби при двух информационных битах на передаваемый символ. Требуемые для АМ-8 три бита на символ составим следующим образом: первые два бита представляют собой выходную последовательность сверточного кода с R = 1/г, а в качестве третьего бита используется незакоди- рованный второй бит исходных данных. Сигнальная диаграмма такого кода приведена на рис. 1.25, симво- 111 011 001 -5/7 -3/7 -1/7 100 110 010 000 1/7 3/7 5/7 Рис. 1.25. ОБП-8Т Сигнальная диаграмма треллисного кода лы сверточного кода подчеркнуты [1.9]. Максимально разделенными при таком отображении оказываются пары сигнальных точек, в которых закодированные биты совпадают, а незакодированные информационные биты различны. Базовая система с двумя информационными битами на символ, с которой нужно сравнивать данную систему, - АМ-4. Асимптотический выигрыш описанной системы зависит от кодового ограничения К и при К = 7 достигает 4 дБ. Этот код используется в американском стандарте цифрового вещания ATSC под названием треллисный (решетчатый) код (см. главу 6) Сравнение различных методов модуляции проводят по нескольким критериям: помехоустойчивости, скорости передачи на единицу полосы, степени влияния искажений в тракте передачи и т.д. Помехоустойчивость определяется зависимостью вероятности ошибки от отношения энергии бита Е6 к спектральной плотности шума N0 и для сигнала ФМ-2 рассчитывается по формуле:
Глава 1. Введение в цифровое телевидение 33 P=F(J2E6/N0), (15) 1 °° где F(x) = —•== [ехр(-/2/2)Л — дополнение интеграла вероятности. <Пп * Поскольку канал ФМ-4 содержит два независимых канала ФМ-2, для ФМ-4 формула (1.5) также применима. Зависимости P(E6/N0) для некоторых видов модуляции приведены на рис. 1.26 [1.11]. Видно, что сигналы К AM при одинаковой кратности обладают лучшей помехоустойчивостью. Это объясняется более равномерным расположением сигнальных точек по всему сигнальному пространству, что обеспечивает большие значения минимального расстояния. С другой стороны, полная энергия К AM сигнала меняется во времени, поэтому он менее пригоден для работы в режиме насыщения спутникового ретранслятора. Подробнее об этом поговорим в главе 6. 16 EJN ДБ ю-: 10" 10{ ю-( 10"1 Рис. 1.26. Зависимость Рош (E6/N0) для некоторых видов модуляции Удельная скорость передачи на единицу полосы пропорциональна k log2M, где М — кратность модуляции. В частности, при одинаковых энергетических характеристиках скорость передачи ФМ-4 на единицу полосы вдвое выше, чем у ФМ-2, что и обусловило ее широкое применение в системах связи, особенно спутниковых. ФМ-8 обеспечивает скорость передачи втрое выше, чем ФМ-2, но требует более высокого отношения E6/N0 на входе демодулятора. До сих пор мы говорили о фазовой и амплитудной модуляции одной несущей, практикуемой в вещательных системах (например, спутниковых или кабельных), где основным источником ошибок являются тепловые шумы и уровень других мешающих сигна-
34 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю лов относительно невелик. При переходе к эфирному цифровому вещанию выяснилось, что значительное влияние в метровом и дециметровом диапазонах волн оказывают отраженные сигналы, помехи от соседних по частоте цифровых и аналоговых сигналов, селективные замирания. Основным разрушающим фактором для цифрового канала становятся помехи (интерференция) от многолучевого приема, при котором в декодер поступают две (или несколько) одинаковые по характеру чередования символов, но сдвинутые по времени последовательности. Если задержка одного из лучей становится равной или больше половины длительности символа, происходит резкий рост цифровых ошибок, вплоть до полного разрушения канала. В поисках решения вспомнили о многочастотных модулированных сигналах. Специально для борьбы с помехами при многолучевом приеме была разработана модуляция COFDM (Coded Orthogonal Frequency Division Multiplexing — ортогональное частотное разделение каналов с кодированием). Основная идея COFDM разделение последовательного цифрового потока на большое число низкоскоростных потоков, передаваемых на отдельных ортогональных несущих. Набор несущих, переносящих компоненты цифрового потока, называется символом COFDM. Благодаря большому числу несущих длительность символа в каждом из параллельных потоков оказывается в тысячи раз больше, чем в исходном последовательном потоке. Такая большая длина символа обеспечивает хорошую защиту от межсимвольных искажений, обусловленных интерференцией, так как отраженные сигналы чаще поражают не весь, а лишь часть символа. Степень защиты может быть значительно увеличена, если ввести защитный интервал А промежуток времени, в течение которого оценка значения символа в декодере не производится. Обычно защитные интервалы размещаются в конце символов и не превышают 1/4 длительности активной части символа. Благодаря введению защитных интервалов декодер игнорирует часть разрушающих эхо-сигналов. Уникальным свойством COFDM с защитными интервалами, во многом определившим выбор этого вида модуляции в Европе, следует признать возможность организации синхронной сети вещания, когда большое число ТВ передатчиков работают строго на одной частоте и синхронно передают одинаковые символы COFDM. Если расстояние между передатчиками выбрано таким образом, что разница в запаздывании сигналов от соседних передатчиков не превышает длительности защитного интервала, приемники в сети не испытывают помех от наложения сигналов. Ключевой вопрос в построении системы COFDM — выбор основных параметров: числа индивидуальных несущих на символ, их частотного разноса, значений защитного интервала, метода модуляции несущих, метода синхронизации. Все параметры взаимосвязаны и выбираются путем компромисса. Частотный разнос между несущими зависит от способа выделения в демодуляторе отдельных несущих. Если применить традиционное разделение с помощью полосовых фильтров, частотный разнос между модулированными несущими пришлось бы выбирать таким, чтобы их соседние боковые полосы взаимно не перекрывались. Это условие можно выполнить, выбрав величину частотного разноса равной А/>2/Гс, однако при этом эффективность использования радиоспектра будет невысокой. Для COFDM выбран более эффективный метод на основе ортогональных преобразований. Напомним, что две модулированные несущие называются ортогональными, если интеграл от их произведения на периоде длительности символа равен нулю. Для выполнения условий ортогональности нужно, чтобы частотный разнос между несущими был постоянен и равен 1/Т . Тогда на центральной частоте каждой несущей спектральные компоненты
Глава 1. Введение в цифровое телевидение 35 всех остальных несущих проходят через О (рис. 1.27) и не мешают демодуляции на приеме. Взаимные помехи от соседних несущих будут равны нулю, несмотря на то, что их соседние боковые полосы взаимно перекрываются. Это позволяет очень эффективно, близко к теоретическому пределу, использовать рИс. 1.27. Ортогональность отдельных несущих в полосу частот ТВ канала и вдвое повы- спектре COFDM сить удельную скорость передачи по сравнению с фильтровым методом. Выбранный метод разделения объясняет появление определения «ортогональный» в названии схемы модуляции. Не менее важно для существа метода и определение «Coded» (кодированный). Если ограничиться использованием некодированной OFDM, из-за селективных замираний на некоторых частотах соответствующие несущие не будут декодироваться, давая всплески шума и ошибки по битам. Некодированная OFDM так же чувствительна к помехам в совпадающем и соседних каналах, как одночастотная модуляция. Например, узкополосная помеха, поражающая несколько несущих из 1000 в OFDM, приводит к вероятности ошибки 10~3 на уровне мощности помехи на 20 дБ ниже того, который вызвал бы Табл. 1.3 Требуемые отношения сигнал-помеха (сигнал-шум) в канале COFDM при различных видах модуляции и параметрах кодирования Режим ФМ-4, без кодирования ФМ-4, сверточное кодирование с R=1/2 КАМ-16 без кодирования КАМ-16, сверточное кодирование, R=1/2 КАМ-16, сверточное [кодирование, R=3/4 Совпадающий канал 3 -12 5 -6 0 Многолучевость, запаздывание 0,5 мкс 4 0 4,5 0 0 Шумы 12,5 7,5 21 14,5 16,5 аналогичную частоту ошибок в одночастотной системе. Применение помехоустойчивого кодирования повышает устойчивость передачи и делает прием более надежным. COFDM система, защищенная сверточным кодом с R = Уг и К = 7, при поражении 64 несущих из 512 показала ухудшение характеристик всего на 3 дБ. В табл. 1.3 показаны защитные отношения для OFDM и COFDM при разных способах модуляции парциальных несущих и различных мешающих воздействиях [1.15]. Преимущество схем с кодированием очевидно во всех случаях. Для модуляции парциальных несущих может использоваться любой из рассмотренных выше одночастотных методов.
36 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 1.2. ПРЕОБРАЗОВАНИЕ СИГНАЛОВ ИЗОБРАЖЕНИЯ В ЦИФРОВУЮ ФОРМУ Рис. 1.28. Система координат ТВ изображения 1.2.1. Характеристики аналогового видеосигнала Прежде чем рассматривать методы преобразования видеосигнала в цифровую форму, приведем вкратце основные сведения о телевизионном изображении и аналоговом видеосигнале. Телевизионным изображением называют отображение пространственных и временных изменений яркости, цвета и других физических параметров исходного изображения на конечной площади, обычно прямоугольной. В общем случае изображение можно представить в трехмерной системе координат (рис. 1.28), где функции пространственных координат х,у описывают изменения параметров в плоскости экрана в фиксированный момент времени, а временная ось t отображает процесс во времени [1.5]. Точка изображения, характеризующаяся определенным набором координат (jc, у, t), вместе с ее малой окрестностью называется элементом изображения, или отсчетом. Иногда по аналогии с компьютерной техникой ее еще называют пикселом (pixel — picture element). Понятие пиксела относится к дискре- тизированным областям пространства и здесь, строго говоря, неприменимо. Тем не менее с определенными оговорками им пользуются и в телевизионной технике [1.6]. Для преобразования изображения в одномерную функцию времени применяют развертку — быстрое сканирование (обычно по горизонтали слева направо со смещением по вертикали сверху вниз) электронным лучом плоскости изображения за время одного кадра (1/25 - 1/30 с), меньшее периода мерцания, различимого глазом. Развертка может быть прогрессивной, когда строки сканируются подряд, или чересстрочной, когда сканируются сначала нечетные, затем четные строки, образуя два полу кадра, называемые полями. Развертка дискретизирует изображение только в вертикальном направлении, в горизонтальном сигнал остается аналоговым. Получившийся видеосигнал описывает изменение какого-либо параметра, например, яркости изображения в зависимости от времени. Для передачи по вещательным каналам к нему добавляют сигналы цветности, синхронизации, вводят звуковое сопровождение, телетекст и т.д. Чтобы телевизионный приемник смог правильно воспринять эти сигналы и преобразовать их в изображение и звук, все параметры сигналов должны быть унифицированы, стандартизованы. Говоря о ТВ стандартах, стоит сказать несколько слов об органах международной стандартизации в области телевидения. Стандартизацией занимается целый ряд международных организаций, области деятельности которых частично перекрываются. Наиболее общие стандарты, охватывающие широкие области применения, разрабатывает Международная организация стандартизации: МОС (ISO в англоязычном написании), зачастую совместно со своими органами -
Глава 1. Введение в цифровое телевидение 37 Международной электротехнической комиссией МЭК (IEC), Международной светотехнической комиссией MCK (CIE) и другими. В частности, МОС разработала и приняла стандарты цифрового сжатия телевизионных сигналов семейства MPEG. Регламентацию международной деятельности в области электросвязи осуществляет Международный союз электросвязи МСЭ (ITU) через свои подразделения: сектор радиосвязи МСЭ-Р, сектор стандартизации связи МСЭ-Т и др. МСЭ принимает Рекомендации, являющиеся обязательными документами для его членов. Большая работа по стандартизации ведется на региональном уровне. В Европе этим занимается Европейский союз вещания (ЕСВ), который выпускает Технические Рекомендации, обязательные для его членов. В 1993 г ЕСВ слился с Международной организацией по телевидению и радиовещанию восточноевропейских стран ОИРТ, и теперь Россия также является членом союза. ЕСВ тесно сотрудничает с Европейским институтом стандартов электросвязи (ETSI), который принял всеохватывающий набор стандартов по цифровому вещанию, разработанных организацией DVB. Хотя Россия и не входит в Европейский Союз, эти стандарты де-факто признаются в нашей стране. Мы будем говорить об этом подробнее в главе 6. Одной из старейших нормотворческих организаций в области телевидения является Американское общество Кино и ТВ инженеров (SMPTE — Society of Motion Picture and Television Engineers), которое давно уже переросло свои национальные рамки, включает многие организации из разных стран, так что его стандарты по своей авторитетности приравниваются к международным. Формальную легализацию стандартов SMPTE для США осуществляет Американский национальный институт стандартов. В России действуют общенациональные стандарты — ГОСТы, которые в основных положениях соответствуют международным стандартам. Некоторые новые области деятельности, по которым ГОСТы еще не разработаны, могут регулироваться промежуточными документами. Например, в области цифрового вещания действуют «Временные нормы на цифровую передачу ТВ сигналов стандартного качества по спутниковым каналам» [1.16]. Стандартом ТВ сигнала называют совокупность определяющих его основных характеристик, таких как способ разложения изображения, число строк и кадров, формат кадра, длительность и форма синхронизирующих и гасящих импульсов, полярность сигнала, разнос между несущими частотами изображения и звукового сопровождения, метод представления и кодирования цветовой информации (компонентный или композитный) и др. Для черно-белого телевидения существует 10 стандартов, которые принято изображать латинскими буквами В, D, G, Н, I, К, Kl, L, М, N. Важнейшие характеристики перечисленных стандартов приведены в табл. 1.4 [1.17]. По способу передачи сигналов цветности различают три системы цветного телевидения: SEC AM, PAL, NTSC. Каждая из трех систем может применяться с любым из 10 стандартов черно-белого ТВ вещания, давая 30 возможных комбинаций. На практике применяются девять разновидностей PAL, шесть — SEC AM и один стандарт из группы NTSC. По стандарту разложения для ТВ сигнала стандартной четкости (ТСЧ) наиболее распространены сочетания 525/59,94/2:1 (NTSC, PAL-M), и 625/50/2:1 (все остальные разновидности PAL и SECAM). В аналоговом телевидении высокой четкости использовались форматы 1125/60 (Япония) и 1250/50 (Европа), но они не нашли широкого распространения. При международном обмене ТВ программами часто приходится преобразовывать изображение из одного стандарта в другой. Преобразование с различным числом строк, но с той
38 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 1.4 Стандарты сигналов черно-белого телевидения Г~^~^_Стандарты Параметры^-~~^^^ Диапазон волн Число строк |в кадре | Частота полей, Гц Частота строк, Гц Полоса частот | видеосигнала, МГц Полоса частот {радиоканала, Мгц Разнос несущих частот видео- и звукового {сигналов, МГц Вид модуляции несущей {изображения Полярность Вид модуляции несущей звука Постоянная времени предыскажений звука, мкс Девиация частоты несущей звука, кГц Отношение мощностей несущих видео- и звукового сигналов В MB 625 50 15625 5 7 5,5 AM ОБП нег. ЧМ 50 ±50 от 10:1 ДО 20:1 D MB 625 50 15625 6 8 6,5 AM ОБП нег. ЧМ 50 ±50 от 10:1 до 5:1 G ДМВ 625 50 15625 5 8 5,5 AM ОБП нег. ЧМ 50 ±50 от 10:1 до 20:1 Н ДМВ 625 50 15625 5 8 5,5 AM ОБП нег. ЧМ 50 ±50 от 5:1 ДО 20:1 I MB, ДМВ 625 50 15625 5,5 8 6 AM ОБП нег. ЧМ 50 ±50 5:1 К ДМВ 625 50 15625 6 8 6,5 AM ОБП нег. ЧМ 50 ±50 от 10:1 до 5:1 KL MB, ДМВ 625 50 15625 6 8 6,5 AM ОБП нег. ЧМ 50 ±50 10:1 L MB, ДМВ 625 50 15625 6 8 6,5 AM ОБП поз. AM 10:1 М MB, ДМВ 625 60 15750 4,2 6 4,4 AM ОБП нег. ЧМ 75 ±25 от 10:1 до 5:1 N MB, ДМВ 625 50 15625 4,2 6 4,5 AM ОБП нег. ЧМ 75 ±25 от 10:1 ДО 5:1 I же частотой кадров и коэффициентом чересстрочное™ называется повышающим или понижающим преобразованием стандарта. Если изменяется частота кадров, это перекрестное преобразование. Частный случай преобразования системы цветности без изменения стандарта (PAL<->SECAM или NTSC<->PAL-M) принято называть транскодированием. Форматом называется отношение ширины объекта к его высоте. На рис. 1.29 показаны некоторые применяемые форматы кадра. Различные сочетания формата экрана и формата изображения дают форматы отображения, приведенные в табл. 1.5. Практический интерес представляют преобразования формата, используемые при просмотре широкоэкранного изображения 16:9 на обычный ТВ приемник с форматом экрана 4:3: заниженный режим (letterbox) (рис.1.30а), режим окна (zoom) (рис.1.306), панорамный режим (pan&scan) (рис.1.30в).
Глава 1. Введение в цифровое телевидение 39 а) V//////A Х///////А д) УУУУУУУЛ \ууууууул б) в) Рис. 1.29. Форматы кадра ТВ изображения: а) обычный; б) широкоэкранный; в) анаморфотный; г) letterbox-В 14:9; д)1е«егЬох-А16:9 °о° о о ууууууул °о° У//////Л о о о а) б) в) <—> г) <—> Информация о яркости и цвете объекта в телевидении передается сочетанием трех основных цветов — красного (R), зеленого (G), синего (В). Первоначально цветовые видеосигналы формируются в виде компонентных RGB-сигналов, но при дальнейшей обработке для обеспечения совместимости с черно-белым телевидением переходят к другому набору компонентных сигналов — яркостному и двум цветоразностным, получаемым из сигналов RGB путем матрицирования. С учетом пониженной разрешающей способности цветового восприятия человеческого глаза полосу частот 'цветоразностных сигналов выбирают вдвое меньше полосы сигнала яркости. В зависимости от размаха цветоразностных сигналов различают стыки Y, PB, PR; Y, R-Y, B-Y; YUV Для целей наземного вещания используются композитные сигналы NTSC, PAL и SEC AM, в которых сигнал цветности объединяется тем или иным способом с сигналом яркости, совместимым с монохромным телевидением, для передачи в одном частотном канале. В системах NTSC и PAL цветораз- ностные сигналы передаются методом квадратурной модуляции соответствующей поднесу- щей частоты, в системе SECAM используется метод частотной модуляции двух поднесу- Рис. 1.30. Преобразование формата кадра при просмотре широкоэкранного изображения: а) исходное изображение; б) заниженный режим; в) режим окна; г) панорамный режим щих 4,206 и 4,43 МГц. Для передачи в эфир к собственно видеосигналу добавляются сигналы синхронизации, управляющие перемещением электронного луча в приемном кинескопе. Син- хросмесъ содержит кадровые и строчные синхронизирующие и гасящие импульсы. На периоде кадрового гасящего импульса, в течение которого луч перемещается из ниж- Табл. 1.5 Форматы отображения при разных сочетаниях формата экрана и формата изображения Формат отображения Обычный Широкоэкранный Анаморфотный Letter box-В Letter box-A Формат экрана 4:3 16:9 4:3 4:3 4:3 Формат изображения 4:3 16:9 16:9 14:9 16:9 Использование экрана,% 100 100 100 85,7 75
40 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ней в верхнюю часть экрана, умещают- * Д1а* ■—£**2.—н20-0^ ся 25 периодов строки, в течение которых видеосигнал не передается, и эти строки обычно используют для уплотнения ТВ сигнала. В строках 17, 18, 330, 331 передаются сигналы испытательных строк, вертикальный временной код занимает строки с номерами 19, 24, 332 и 334, в строки 20, 21, 333, 334 вводится телетекст. Использование строк различается в национальных стандартах. Осциллограмма полного аналогово- Рис. 1.31. Структура аналогового ТВ сигнала го видеосигнала при передаче испытательного сигнала цветных полос приведена на рис. 1.31. В верхней части рисунка хорошо видна структура кадрового гасящего импульса, ниже показаны активные строки. п.. ^Ы.. ^Ы.. ^Ьг 1.2.2. Аналого-цифровое преобразование сигнала изображения Мы уже знаем, что процесс аналого-цифрового преобразования в И КМ сигнал состоит из трех этапов: дискретизации, квантования и кодирования квантованных отсчетов. В применении к телевизионному изображению дискретизация производится в два этапа: сначала благодаря развертке плоскость изображения дискретизируется в вертикальном направлении, затем полученный одномерный сигнал дискретизируется во времени, давая последовательность отсчетов, соответствующих отдельным элементам изображения. Поскольку элемент изображения, или пиксел, имеет конечные размеры, значение отсчета определяется путем взвешивающего усреднения уровня сигнала в малой окрестности точки (х,у) В качестве взвешивающей функции часто выбирают функцию Гаусса Н(х,у) = к-ехр(-ах2 -ау2), где а и Ъ некоторые коэффициенты [1.6]. Этот процесс эквивалентен предфилыпрации. При восстановлении изображения осуществляется интерполяция значения отсчета на область пиксела, что эквивалентно постфильтрации. Дискретизация представляет собой по сути умножение аналогового сигнала на дискретизи- рующую функцию, т.е. модуляцию, в результате которой возникают многократно повторяющиеся боковые полосы частот. Если частота дискретизации более чем вдвое превышает высшую частоту спектра видеосигнала, между видеосигналом и ближайшей сверху полосой оказывается частотный промежуток, позволяющий разделить эти сигналы (рис. 1.32а). Если соотношение f() >2F не выполняется, возникает наложение спектров, приводящее к искажениям (рис. 1.326). Второе важное соображение, которое необходимо учитывать — частота дискретизации должна быть целым кратным от частоты а) б) строк, чтобы на периоде строки помеща- р"с■ ^32« Наложение спектров при дискретизации: * r r a) f>2F, наложение не происходит; лось целое число отсчетов сигнала. б) f*<2F| наложенИе имеет место
Глава 1. Введение в цифровое телевидение 41 ® X X X X 0 ® ® 0 X X X X а) 4:2:2 0 ® ! У X о X |Х о ® 1 'X X X X X X о X X о X X X X X 6)4:2:0 X о X X о X ® X ® X X X X X в) X 0 X ® 4:1 X X X X :1 ® X я X С учетом этих соображений в Реко- ~ ~ ~ -(а^ мендации МСЭ-Р ВТ.601 [1.18], описывающей студийный стандарт компонентного цифрового видеосигнала, выбраны полоса частот сигнала яркости 5,75 МГц и частота дискретизации для этого сигнала 13,5 МГц. Эта частота равна 858-й рис 1.33. Структура отсчетов компонентного сигна- гармонике строчной частоты 15 625 Гц лаУ, Св> CR (х — отсчёты яркости; о — отсчеты цвет- стандарта 625/50/2:1 и 864-й гармони- ности) ке частоты 15 734 Гц стандарта 525/ 59,94/2:1. Для цветоразностных сигналов выбрана частота дискретизации 6,75 МГц. По аналогии с аналого-цифровым преобразованием композитных сигналов PAL и NTSC, где частота дискретизации выбиралась равной учетверенной частоте цифровой поднесу щей, частоту 13,5 МГц также называют «четверкой», а частоту 6,75 МГц «двойкой». Таким образом, полный цифровой компонентный видеосигнал из Рекомендации ВТ.601 описывается формулой «4:2:2». Компоненты его называются Y, CB, CR и связаны с исходными Y, R-Y, B-Y следующими соотношениями: Y = 0,299 R + 0,587 G + 0,114 В; CR = 0,713 (R-Y); Св = 0,564 (B-Y). Отсчеты размещаются в поле изображения, как показано на рис. 1.33. Здесь отсчеты Св и CR совпадают по горизонтали с нечетными отсчетами сигнала яркости. Общее число отсчетов в цифровой строке составляет 1440, в том числе 720 отсчетов яркости и - каждого из цветоразностных сигналов. Когда к Рекомендации ВТ.601 добавили часть «В», описывающую формат изображения 16:9, частоту дискретизации для этого сигнала пришлось увеличить в 4/3 раз, до 18 МГц. Табл. 1.6 Параметры «Единого формата изображения» Параметры Формат изображения Число точек в строке Число активных строк Форма пикселов Число строк Частота кадров Перемежение Частота дискретизации, МГц Система 1125/60 1080 60(59)/2:1 1080 60(59)/1:1 1080 50/1: 16 9 1920 1080 1:1 (квадратная) 1125 (60/1,001) 2: 1 74,25; 74,25/1,001 1 1 148,5; 148,5/1,001 148,5 1125/50 1 1080 50/2:1 1125 50 2 1 74,25
42 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Благодаря усилиям 11-й Исследовательской Комиссии МСЭ удалось стандартизовать цифровой сигнал не только стандартного, но и высокого качества. Основой части II принятой Рекомендации ВТ.709-3 [1.19] является «Единый формат изображения» (Common Image Format — CIF), устанавливающий некоторые общие значения параметров ТВЧ сигнала для американского и европейского стандартов с частотой полей соответственно 50 и 60 Гц. Несомненным достижением является тот факт, что в стандарте зафиксированы основные параметры разложения (1920x1080 пике, формат 16:9), частоты дискретизации сигналов яркости (74,25 МГц) и цветности (37,125 МГц), скорость цифрового потока 1,485 Гбит/с. Более подробные сведения приведены в табл. 1.6. Выбор числа уровней квантования видеосигнала в значительной степени определяется характеристиками зрительной системы человека. Максимальное воспринимаемое отношение яркостей 100:1 соответствует примерно 230 градациям яркости. Ближайшая степень двойки 256 = 2е, и в первой редакции Рекомендации ВТ.601 было принято 8-битовое квантование. Однако получающееся при этом предельное отношение сигнал-шум 56,8 дБ не удовлетворяет многим высококачественным применениям, и в дополнение к 8-битовому квантованию было введено 10-битовое. Результирующая скорость цифрового потока сигнала «4:2:2» с 10-битовым кодированием и форматом кадра 4:3 составляет 13,5 • 106 • 10 + 2 • 6,75 • 106 • 10 = 270 Мбит/с (для формата 16:9 соответственно 360 Мбит/с). 1.2.3. Форматирование цифрового видеосигнала Гибкость цифрового подхода позволяет в широких пределах изменять основные параметры цифрового видеосигнала. Для некоторых применений приемлема меньшая разрешающая способность по сигналу цветности, отсчеты цветности прореживают и получают сигналы «4:2:0» (рис. 1.336), «4:1:1» (рис.1.33в) и другие. В частности, наиболее распространенный «Основной уровень» стандарта MPEG-2 использует сигнал «4:2:0». Скорость цифрового потока такого сигнала на 25% ниже, чем исходного «4:2:2». Передаче монохромного сигнала соответствует формула «4:0:0», а редко применяемый сигнал «4:4:4» содержит все три компонента с полной полосой 5,75 МГц. Набор сигналов, используемых для вещания, может быть значительно шире, чем для производства программ. Например, в Европе приняты стандарт ТВЧ с разложением 1920x1080 пике, форматом изображения 16:9 и частотой кадров 50 Гц, стандарт улучшенного телевидения с 960x576 пике, и два стандарта ТСЧ 720x576 пике, с форматами кадра 16:9 и 4:3. В США общее число стандартов достигает 18, и еще 8 подвариан- тов, в которых частота кадров понижается в соотношении 1/1,001 для облегчения взаимодействия с программным материалом NTSC. В технической литературе можно найти ссылки на форматы разложения SIF, CIF, QCIF т.д. Эти обозначения были введены на ранних этапах внедрения цифрового телевидения, когда производительности цифровых процессоров хватало только на обработку изображений с низкой разрешающей способностью. SIF означает «Входной формат источника» (Source Input Format) и соответствует изображению с половинной разрешающей способностью по вертикали и горизонтали по сравнению с полным разрешением, принятым в Рекомендации ВТ.601. Отсчеты яркости и цветности в этом формате расположены в шахматном порядке, как показано на рис. 1.34 (далее мы увидим, что этот формат взят за основу в стандарте MPEG-1). Европейский и американский варианты SIF имеют разное число пикселов и разную
Глава 1. Введение в цифровое телевидение 43 частоту кадров, поэтому был введен согласованный единый формат CIF (Common Interchange Format — единый формат обмена, не путать с введенным в Рекомендации ВТ.709 Common Image Format «Единым форматом изображения» для ТВЧ), в котором число пикселов соответствует европейскому разложению 352x288 пике, а частота кадров американскому стандарту (29,97 Гц). QCIF (Quarter CIF) содержит вчетверо меньше элементов (176x144), применяются также обозначения SQCIF (128x96), 4CIF (704x576), или D1, и некоторые другие. Параметры разложения изображения для некоторых применяемых цифровых форматов приведены в табл. 1.7 X X О X X X X О X X X X О X X X X О X X Рис. 1.34. Структура расположения отсчетов в формате SIF Табл. 1.7 Параметры разложения некоторых цифровых форматов Параметр Число элементов сигнала яркости Число элеметов сигналов цветности Дискретизация сигнала цветности Частота полей (кадров) Гц Перемежение Рек.601 525 строк 720x480 360x480 4:2:2 60 да Рек.601 625 строк 720x576 360x576 4:2:2 50 да < SQCIF 128x576 64x48 4:2:0 30 нет Форматы QCIF 176x144 88x72 4:2:0 30 нет CIF 352x288 176x144 4:2:0 30 нет 4CIF 704x576 352x288 4:2:0 30 нет 16CIF 1408x1152 704x576 4:2:0 30 нет 1.2.4. Частотное и временное представление сигналов Описанное выше кодирование дискретных отсчетов видеосигнала — не единственный способ представления информации об изображении набором символов. Иногда более удобным оказывается преобразование из временной в частотную область, в которой энергия сигнала концентрируется в сравнительно узкой частотной области и может быть описана меньшим числом символов. Важно отметить, что термин частота здесь может относиться к периодическому изменению сигнала не только во времени, но и в пространстве. В этом случае говорят о пространственной частоте как о характеристике изменения параметра (например, интенсивности сигнала) вдоль пространственной координаты и о периоде уже не времени, а, например, длины. Математической основой преобразования время-частота является теорема Фурье, гласящая, что любая периодическая функция времени с периодом Т может быть представлена как сумма гармонических составляющих основной частоты F = \/Т: /(0= Хс*ехр(Дй*) (1.6)
44 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю \\ с, =-j АО exp(-jkcot)dt (1.7) Выражение (1.6) представляет собой разложение /(/) в ряд Фурье, а (1.7) формулу для расчета коэффициентов ряда Фурье. В дискретной области обычному преобразованию Фурье соответствует дискретное преобразование Фурье (ДПФ), устанавливающее взаимно-однозначное соответствие между дискретной функцией времени f{nT) = f{ri) на интервале 0 <n<N и набором коэффициентов ск разложения по пространственным частотам Q = 27ik/T [1.20]: n-\ /(и) = £с*ехрС/2я£л/ЛГ), п = 0,1, ЛГ-1 к=0 N-\ ck=^Yf(n)exp(-j27rkn/N), к=0, 1 N-\ (1.8) (1.9) Недостаток ДПФ для практических расчетов в том, что коэффициенты разложения оказываются комплексными числами, требующими двойного объема вычислений. Из математики известно, что разложение в ряд Фурье четной функции содержит только действительные коэффициенты, соответствующие косину соидальным членам ряда. Если мы к области отсчетов добавим слева ее зеркальное отображение, коэффициенты в (1.8), (1.9) будут содержать только компоненты с cosjc. Этот частный случай ДПФ называется дискретно-косинусным преобразованием (ДКП) и широко используется в цифровом телевидении. С учетом новой нормировки интервала Т можно записать [1.5]: лм f(n) = Y,b(k)ck cos к=о 2к + \ 2N пп, п= 0, 1,....,7V-1 с, =—Ь(к)У* f(ri) cos кп к N V ^yV 2N где 6(*) = 1/V2, k=0; 1 для к = 1, 2,...,N-1 к= 0, 1,....,ЛГ-1 (1.10) (1.11) Если применить ДКП последовательно по горизонтали и вертикали, получим двумерное ДКП, которое раскладывает фрагмент изображения по ортогональным двумерным функциям, называемым базисными изображениями ДКП. На рис. 1.35 показано семейство базисных изображений для N = 8. Среди многих других преобразований (Уолша-Адамара, Хаара, дискретно-синусное) ДКП отличается минимальной среднеквадратичной ошибкой при приемлемой сложности расчетов. Рис. 1.35. Базовые функции дискретно-косинусного преобразования
Глава 1. Введение в цифровое телевидение 45 1.3. ЦИФРОВЫЕ ИНТЕРФЕЙСЫ В ТЕЛЕВИДЕНИИ 1.3.1. Параллельный цифровой интерфейс Цифровым интерфейсом, или стыком, называется точка соединения двух приборов, в которой данные передаются от одного прибора к другому. Чтобы обеспечить быстрое и надежное соединение без подстройки параметров, оба прибора должны соответствовать единым требованиям к точке стыка. В интерфейсах как ни в какой другой области цифровой техники важна стандартизация. Соединение может быть однонаправленным, или симплексным, когда данные передаются только в одном направлении, и двунаправленным, или дуплексным, когда передача данных происходит в обоих направлениях. Возможна еще полудуплексная работа, когда данные передаются в обоих направлениях, но не одновременно, а с разделением по времени. Понятно, что сигналы реального времени (телевидение, звуковое вещание) могут передаваться только в симплексном режиме. Для описания любого цифрового интерфейса необходимо указать: а) протокол обмена данными; 6) электрические сигналы — напряжения, токи, входные и выходные сопротивления; в) физическое соединение вид соединителя (штыревой или гнезд- ный), крепление, тип кабеля. Поток цифровых данных, сформированный канальным передатчиком, не содержит каких-либо сведений об адресате, содержании и характеристиках кодирования сообщения. Принять его можно, только зная заранее указанные характеристики и настроив на них приемник. Если часть передачи по каким-либо причинам не принята, нужно предусмотреть возможность сообщить об этом отправителю и запросить повторение поврежденного сообщения. Эти проблемы разрешает протокол — стандартизованная процедура установления, поддержания и прекращения цифрового соединения, определяющая процедуру передачи управляющей информации и данных, механизм выбора указанной процедуры из списка возможных, структуру и способ кодирования блоков данных. Рассмотрим некоторые цифровые интерфейсы, наиболее часто используемые в цифровом вещании. Обсуждая в разд. 1.1.3 параллельную и последовательную передачу данных, мы уже говорили о недостатках метода параллельной передачи. Тем не менее он еще применяется в студийном оборудовании для коротких соединений, поэтому стоит остановиться несколько подробнее на основных свойствах параллельного компонентного стыка, стандартизованного в Рекомендации ВТ.656 [1.21] и в аналогичном ей стандарте SMPTE-125M [1.22]. При выбранной частоте дискретизации 13,5 МГц и стандарте разложения 625 строк на периоде строки укладываются 864 периода, из которых для передачи полезных данных используются только 720, называемые активной частью строки. Начало цифровой строки совпадает с серединой переднего фронта строчного синхроимпульса. Чтобы передать 720 отсчетов сигнала яркости и по 360 отсчетов сигналов Св и CR, тактовая частота выбирается равной 27 МГц (для формата сигнала 16:9 частота дискретизации 18 МГц и тактовая частота 36 МГц). Отсчеты передаются в коде БВН в следующем порядке: CB,Y,CR,Y... В старой версии стандарта разрядность квантования составляла 8 бит, и была предусмотрена возможность добавления двух младших разрядов после запятой. В ныне действующей 10-битовой версии по каналу всегда передаются 10 битов, и в случае 8-битового сигнала последние два бита обнуляются. Из общего числа 1024 у ров-
46 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ня для передачи непосредственно отсчетов видеосигнала яркости используются 877 (с 64-го по 940-й), запас сохраняется как допуск на отклонения размаха исходного сигнала и выбросы фильтров. Сигналы цветности передаются в пределах 897 уровней, центрированных относительно среднего уровня 512. Момент начала передачи данных отмечается специальным сигналом «Начало активной строки» (SAV — Start of Active Video), в конце блока данных передается сигнал «Конец активной строки» (EAV End of Active Video). Каждый из сигналов содержит 4 символа, в том числе 1 символ единиц, два символа нулей (уровни квантования соответственно 1024 и 0, не используемые для видеоданных) и информационный символ, указывающий на тип сигнала и перемежение. Распознавание синхросигналов производится по 8 старшим битам. Структура цифровой строки показана на рис. 1.36. В стандарте 525 строк число циклов несколько меньше, но активная часть строки содержит те же 720 периодов, и формат передачи данных одинаков. Компонентный цифровой сигнал «4:2:2» содержит 10 отдельных битовых потоков, которые передаются по отдельным парам многожильного кабеля специальной конструкции. По отдельной паре передаются сигналы тактовой синхронизации, еще несколько проводов используются для экранирования и заземления. Максимальная длина кабеля без коррекции амплитудно-частотной характеристики (АЧХ) 50 м, с коррекцией — не более 300 м, номинальный импеданс нагрузки составляет НО Ом. Синхронизация осуществляется нарастающим фронтом тактового импульса, который должен соответство- Аналоговая строка 720 отсчетов сигнала яр 360 отсчетов Св 360 отсчетов CR кости bAvl / |k Данные не передаются 280 ТИ SAV Мультиплексированные данные Y.CB.Y.CR,Y.CB,Y.CR... 1440 тактовых интервалов / s 1728 тактовых интервалов ЕАУ[ ч ^ Рис. 1.36. Структура цифровой строки стандарта 625/50/2:1
Глава 1. Введение в цифровое телевидение 47 вать середине бита данных. Стандартом предусмотрено использование субминиатюрного 25-контактного соединителя D-типа, штыревого со стороны кабеля и гнездного со стороны прибора. Распределение контактов соединителя приведено в табл. 1.8. Параметры цифрового интерфейса DVB-SPI (Synchronous Parallel Interface — синхронный параллельный интерфейс), разработанного на основе компонентного параллельного стыка специально для передачи транспортного потока MPEG-2, будут рассмотрены в шестой главе. Из популярных параллельных интерфейсов следует упомянуть еще RS422 и М2Р RS422 имеет статус «рекомендованного стандарта» (RS Recommended Standard), т.е. он не принят ни одним уполномоченным органом, поэтому разные производители оборудования по-разному трактуют некоторые его параметры. Обычно в стандартах группы RS нормированы электрические и электромеханические параметры, но не регламентированы жестко форматы передачи данных и протоколы стыка. В RS422 передача осуществляется по балансным линиям, дифференциальное напряжение составляет от 2 до 7 В, используются такие же миниатюрные соединители с 25 контактами, как в базовом интерфейсе, но распределение контактов отличается от указанного в табл. 1.8. Область Табл. 1.8 Распределение контактов 25-контактного соединителя в параллельном цифровом интерфейсе Контакт 1 2 3 4 5 6 7 8 9 Линия такты корпус А данные 9 данные 8 данные 7 данные 6 данные 5 данные 4 данные 3 Контакт 10 11 12 13 14 15 16 17 18 Линия данные 2 данные 1 данные 0 экран такты обратно корпус В данные 9 обратно данные 8 обратно данные 7 обратно Контакт 19 20 21 22 23 24 25 Линия данные 6 обратно | данные 5 обратно | данные 4 обратно | данные 3 обратно | данные 2 обратно данные 1 обратно данные 0 обратно его использования заметно сокращается в пользу SPI. Схожие с RS422 характеристики имеет нестандартизованный параллельный интерфейс компании NDS под названием «NDS422 параллельный», у него также оригинальное распределение контактов и отсутствует сигнал подтверждения действительности данных. Интерфейс М2Р разработан и применяется компанией Harmonic (бывш. DiviCom), он использует тактовые, информационные и вспомогательные сигналы, аналогичные SPI, но уровни сигналов соответствуют RS422, а считывание данных производится по заднему фронту тактовых импульсов.
48 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 1.3.2. Последовательный цифровой интерфейс При последовательной передаче, как мы знаем, тактовая частота отдельно не передается, а выделяется на приеме из полезных данных. В наиболее распространенном последовательном интерфейсе SDI (Serial Digital Interface — последовательный цифровой интерфейс), описанном в Рекомендации ВТ.656 и стандарте SMPTE-259M [1.23], для повышения надежности выделения тактовой частоты используется инвертированный код БВН и сверточное скремблирование. В качестве исходного используется цифровой компонентный сигнал «4:2:2» в параллельном формате, рассмотренный в предыдущем разделе. Хотя в этих же документах описаны параметры и для композитных цифровых сигналов PAL и NTSC, в Европе и тем более в России они практически не применяются и потому здесь не рассматриваются. Входной 10-битовый сигнал записывается в параллельной форме в регистр сдвига с тактовой частотой 27 МГц, считывается последовательно с тактовой частотой 270 МГц и поступает на скремблер. Генерация синхронной частоты 270 МГц осуществляется путем подстройки в схеме ФАПЧ частоты управляемого генератора по входной тактовой частоте 27 МГц. Специальный детектор синхрослов обнаруживает комбинации SAV и EAV и следит, чтобы они кодировались правильно независимо от разрядности передаваемого сигнала. Скремблирование осуществляется путем подачи на ЛЭ «исключающее ИЛИ» текущего бита и двух предшествующих, отстоящих от него на 5 и 9 тактовых интервалов. Соответствующий порождающий многочлен 0 1 0 0 1 1 0 1 I 1 0 БВН БВНИ Рис. 1.37. Инвертирование кода БВН имеет вид: g(x) = GlG2, где Gx =х9+х4+1, G2 =x + l. Второй сомножитель G2(x) описывает логическое инвертирование полученного сигнала, которое изменяет состояние сигнала при каждом появлении 1 (рис. 1.37). Информация в таком сигнале содержится в переходах, а не в самих импульсах, и потому не зависит от полярности сигнала. Это важное свойство SDI-сигнала, позволяющее использовать в канале как неинвертирую- щие, так и инвертирующие устройства. На приемной стороне все операции производятся в обратном порядке. В приемном регистре сдвига обнаруживаются сигналы SAV и EAV, которые управляют процессом синхронизации и перезапускают последовательно-параллельный преобразователь. Выделенный сигнал тактовой частоты делится на 10 и получившийся сигнал 27 МГц используется как сигнал цикловой синхронизации для считывания данных на выходе приемника. Как и в параллельном интерфейсе, интервал между SAV и EAV не используется для передачи видеоданных и может быть загружен другими видами информации, например, звукоданными (подробнее об этом см. раздел 1.4.3). Предшественником SDI был последовательный компонентный интерфейс с длиной кодового слова 8 бит, описанный в ранней версии Рекомендации ВТ.656. В этом интерфейсе 8-битовые слова кодировались в 9-битовые комбинации, которые затем передавались с тактовой частотой 243 МГц. Однако с постепенным переходом профессиональ-
Глава 1. Введение в цифровое телевидение 49 ТИФ 0.2-4- а) ти 0,2 б) ->f Рис. 1.38. Пределы допустимого фазового дрожания в сигнале SDI: а) общее дрожание; б) высокочастотное дрожание ной цифровой видеотехники на 10-битовое кодирование он был вытеснен более удобным 10-битовым интерфейсом. Интерфейс SDI широко используется для соединения различных устройств в пределах здания и между близко расположенными зданиями. Такой сигнал легко коммутировать, корректировать, контролировать. Соединение осуществляется по 75-омному коаксиальному кабелю с помощью простых и очень надежных соединителей BNC, обеспечивающих хорошее согласование в полосе частот до 600 МГц. С 75-омным кабелем можно использовать как 75-омные с тонким центральным проводником, так и 50-омные соединители BNC, обладающие большей механической прочностью, необходимо только следить, чтобы затухание несогласованности не падало ниже 15 дБ. К недостаткам SDI можно отнести чувствительность к фазовому дрожанию. Оно измеряется в долях тактового интервала (ТИ), который для компонентного SDI сигнала составляет 1/270 МГц = 3,7 не. Низкочастотные (ниже 10 Гц) отклонения фронтов импульсов от номинальных временных позиций иногда называют качанием (wander) или дрейфом (drift), они в меньшей степени влияют на процесс синхронизации, так как стробирующий (тактовый) сигнал претерпевает те же смещения, что и стробируе- мая сигнальная последовательность. В области частот выше 10 Гц различают фазовое дрожание двух типов — общее дрожание (timing jitter) как абсолютное смещение фронтов относительно номинала, и высокочастотное дрожание, или дрожание синхронизации (alignment jitter) — смещение фронтов импульсов относительно выделенного из сигнальной последовательности сигнала тактовой частоты. Нижняя частотная граница высокочастотного дрожания определяется полосой пропускания фильтра в цепи АПЧ. Рекомендация МСЭ-Р ВТ. 1363 [1.24] устанавливает для общего дрожания допустимое значение 0,2 ТИ (рассматривается возможность увеличения нормы до 1 ТИ) и для высокочастотного дрожания не более 0,2 ТИ (740 пс). Увеличение высокочастотного дрожания свыше допустимого приводит к нарушению синхронизации и при приближении к 1500 пс к ее полному срыву. На рис. 1.38 показаны пределы допустимого фазового дрожания на выходе SDI приемника. Заслуживают упоминания еще несколько последовательных цифровых интерфейсов, используемых для передачи дополнительных данных, вводимых в цифровой телевизионный сигнал. Асинхронный последовательный интерфейс RS232, как следует из его названия, имеет статус «рекомендованного стандарта» и может претерпевать небольшие отклонения в разных реализациях. Общепринятыми являются небалансное соединение, асинхронная дуплексная передача данных между одним передатчиком и одним приемником, предельная скорость передачи данных 115,2 кбит/с. Практически используются скорости 19,2 и 38,4 кбит/с, максимальное расстояние 15 м. Логическая «1» передается напря-
50 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю такты N ) данныеч ) SDI кодер N / Канал 7 SDI декодер такты / данные ? 9 бит Форматирование SDI интерфейс Форматирование 10 бит 10 бит 9 бит (а) > < о с; ы о о Йш со > < со Данные пользователя (б) Рис. 1.39. Последовательный интерфейс SDTI: а) структурная схема; б) формат цифровой строки жением отрицательной полярности амплитудой от 5 до 15 В, логический «О» — таким же напряжением положительной полярности, соединитель 9-контактный типа DB-9, широко используемый в персональных компьютерах. Синхронный последовательный интерфейс RS422 также является «рекомендованным стандартом», но, в отличие от RS232, опирается на стандартизованный МСЭ электрический стык V.11. Передача осуществляется по балансной линии в дуплексном или полудуплексном режиме, разностное напряжение амплитудой от 2 до 6 В одной полярности соответствует логической «1», противоположной полярности логическому «О». Максимальная скорость передачи данных 10 Мбит/с может поддерживаться на расстоянии до 15 м, со скоростью 100 кбит/с можно работать при длине кабеля до 1200 м. Предельная чувствительность приемника 200 мВ. В качестве соединителя может использоваться 9-контактный или 25-контактный разъем D-типа. Последовательный интерфейс M2S, предложенный в свое время компанией DiviCom (ныне Harmonic), применялся только в аппаратуре этой компании и сейчас практически вышел из употребления. Используя коаксиальную линию и тактовую частоту 270 Мбит/с, он допускает скорость передачи полезных данных до 108 Мбит/с. Весьма перспективным специалисты считают предложенный компанией Sony и стандартизованный в SMPTE-305M интерфейс SDTI (Serial Data Transport Interface последовательный интерфейс передачи данных) [1.25]. Он использует структуру сигнала SDI (рис. 1.39), однако укладывает в область полезной нагрузки не только 10-битные слова видеоданных, но и любые блоки данных, состоящие из 8-битных или 9- битных слов, в том числе пакетированные блоки компрессированных данных фиксированной или переменной длины. Каждый блок имеет заголовок, в котором указаны размер, тип блока, кроме того, в области дополнительных данных между EAV и SAV размещается заголовок строки, полностью описывающий ее структуру и состав размещаемых данных. Скорость передачи полезных данных достигает 200 Мбит/с в потоке 270 Мбит/с и 270 Мбит/с в потоке 360 Мбит/с. В 2000 году разработан новый стандарт SMPTE-305M.2 [1.26], уточняющий и дополняющий базовый документ. Синхронный последовательный интерфейс SSI, разработанный для передачи транспортного потока MPEG-2, будет рассмотрен в главе 6.
Глава 1. Введение в цифровое телевидение 51 1.3.3. Электрическая часть интерфейса N (а) 1 X (в) Схемное исполнение соединения существенно влияет на его характеристики. В простом небалансном интерфейсе (рис. 1.40а) в качестве одного из проводов используется земля, к которой подсоединяется и экранирующая оболочка кабеля. Из-за разности потенциалов земли у источника и потребителя и недостаточной экранировки на полезный сигнал накладываются помехи, наводки от сети переменного тока и другие нежелательные сигналы. Небалансное соединение используется только в бытовых устройствах для передачи на расстояния в несколько метров. Балансное соединение содержит два параллельных провода, по которым сигнал полезных данных передается в противофазе, а мешающие сигналы наводятся в фазе и на приемном конце компенсируют один другого. Для балансировки могут использоваться трансформаторные и электронные схемы (рис. 1.406, в). Первые имеют дополнительное преимущество развязки по постоянному току, но несколько сложнее в реализации г Рис. 1.40. Электрические схемы небалансного и балансного интерфейсов: а) небалансный; б) балансный трансформаторный; в) балансный электронный Преобразовать небалансное соединение в балансное можно с помощью балансирующих трансформаторов. Уровни электрических сигналов в разных интерфейсах различны и должны поддерживаться в определенных пределах. Параллельный интерфейс по Рекомендации ВТ.656 использует балансное соединение и уровни сигнализации ЭСЛ (эмиттерно-связанной логики). Для ЭСЛ максимальная разность уровней на передаче составляет 2,0 В (логический «0»), минимальная 0,8 В (логическая «1»), на приеме соответственно 2,0 В и 185 мВ на нагрузке НО Ом, порог различения линейного приемника минус 1,29 В ± 15%. Время нарастания и спада импульса данных на передающей стороне должно быть в пределах от 2 до 5 не, дифференциальная задержка между информационным и тактовым импульсами на приеме не должна превышать ±11 не. В последнее время в параллельных интерфейсах широкое применение находит формат сигнализации LVDS (Low Voltage Differential Signaling — низкоуровневый дифференциальный интерфейс). Для LVDS номинальный уровень выходного напряжения в режиме общей моды составляет 1,125... 1,375 В, разностное напряжение должно быть в пределах 247...454 мВ. Время нарастания и спада импульса от 20% до 80% номинального значения не должно превышать 30% тактового периода с несимметрией не более 10%. Приемник должен устойчиво принимать сигнал размахом от 2 до 0,1 В при расхождении середины сигнального импульса и фронта тактового импульса до Т/6. Размах сигнала на выходе передатчика в интерфейсе SDI составляет 800 ± 80 мВ,
52 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Число ошибок в секунду 32 -I 24 Ч 16 Н 8 Ч 1 ошибка на кадр 1 ошибка в день 1 ошибка в минуту длительность фронта и спада импульсов между 80% и 20% полного размаха должна быть в пределах 0,4... 1,5 не и различаться не более чем на 0,5 не. В качестве соединительных линий на расстояниях до нескольких сотен метров в стандарте SDI используются высококачественные коаксиальные кабели с затуханием не более 9 дБ/100 м на частоте 100 МГц (например, марок Belden 8281, 1505А,1694А, США или PSF2/3, Великобритания). Максимальное допустимое затухание кабеля составляет 12 дБ без коррекции и до 40 дБ с коррекцией наклона частотной характеристики. Ключевым параметром можно считать затухание на частоте 135 МГц, оно не должно превышать 30 дБ. При погонном затухании 9 дБ/100 м на частоте 100 МГц это соответствует длине кабеля до 280 м. Если затухание превышает указанную величину, коэффициент ошибок начинает быстро нарастать (рис. 1.41). Увеличение длины сверх критической всего на 5% приводит к возрастанию скорости ошибок в 100 раз. Рекомендуется сохранять запас б дБ по отношению к точке перегиба на рис. 1.41. Важно также, чтобы частотная характеристика затухания имела вид, близкий к 1/^// что облегчает коррекцию. 260 ""Г 270 1 ошибка секунду Длина кабеля 280 1^ 290 М Рис. 1.41. Число ошибок в сигнале SDI в зависимости от длины кабеля (кабель Belden 8281) 1.3.4. Оптический последовательный цифровой интерфейс Широкое распространение последовательного цифрового интерфейса в немалой степени связано с прогрессом волоконно-оптической техники. Серьезные преимущества оптической передачи — высокая пропускная способность, очень малые потери на единицу длины, конфиденциальность передачи, нечувствительность к помехам и наводкам, отсутствие электромагнитного излучения в окружающую среду, неподверженность коррозии и гниению, отсутствие искрения, способность оптического кабеля к изгибанию и небольшой диаметр даже при числе волокон в несколько десятков [1.27]. Отсутствие проводящих материалов снимает проблемы разности потенциалов земли и коротких замыканий. В качестве среды распространения используется оптическое волокно из специального высококачественного стекла. Свет распространяется в таком волокне за счет многократных отражений от стенок, испытывая при этом полное внутреннее отражение, так что потери на излучение отсутствуют. В зависимости от структуры светового потока различают многомодовые волокна, где одновременно распространяются несколько типов волн (мод), и одномодовые, с одним типом волны. В многомодовом волокне из-за разности длин путей для разных мод наблюдается частотная дисперсия, сужающая полосу пропускания. Дальность одного переприема не превышает 10... 15 км. Для подавления нежелательных мод диаметр волокна должен быть сопоставим с
Глава 1. Введение в цифровое телевидение 53 длиной волны (5... 10 микрометров), и такое волокно крайне непрочно. Для повышения механической прочности волокно делают многослойным, заключая тончайшую центральную нить — стержень — в оболочку из стекла с таким показателем преломления, чтобы свет испытывал полное внутреннее отражение на границе двух материалов. Затухание такого кабеля предельно мало. Часто используемое одномодовое волокно наружным диаметром 62,5 мкм по стандарту IEC 793-2 имеет на номинальной длине волны 1310 нм погонное затухание не более 1 дБ/км, практически удается достичь 0,35 дБ/км. В качестве передатчиков в высокоскоростных интерфейсах (например, в оптическом интерфейсе SDI) используются полупроводниковые лазеры. Благодаря когерентности излучения ширина оптической линии в диапазоне 800... 1350 нм не превышает 1...3 нм, дисперсионные потери невелики, и удается передавать по одному волокну без регенерации сигналы со скоростями до нескольких гигабит в секунду на расстояние в десятки километров. Параметры систем с последовательной передачей цифрового сигнала по оптическому волокну регламентируются Рекомендацией МСЭ-Р ВТ. 1367 [1.28]. Типовые значения оптической мощности составляют минус 12 дБм (децибел к милливатту), хотя есть лазеры и повышенной мощности, до минус 7,5 дБм, перекрывающие расстояние до 40...50 км, и даже еще более мощные, с выходной мощностью 0 дБм (1 мВт). Модуляция светового потока осуществляется по интенсивности, причем символу «1» обычно соответствует максимум интенсивности, «0» минимум. Отметим, что полупроводниковые лазеры обладают нестабильной передаточной характеристикой, зависящей от температуры, склонны к паразитным колебаниям и требуют сложных схем стабилизации и термокомпенсации. В многомодовых оптических кабелях в качестве источников света наряду с лазерами используются и более дешевые некогерентные источники — светодиоды. Оптические приемники на фотодиодах используют различные физические эффекты для преобразования оптического сигнала в электрический. Широко используются структуры типа «интегрированный детектор /предусилите ль». Чувствительность типового приемника не хуже минус 20 дБм, время нарастания/спада оптического импульса не превышает 3 не, фазовое дрожание — не более 0,135 тактового интервала. Основные требования к оптическим соединителям — малые потери, минимальное рассогласование и высокая механическая прочность. Широко применяемые оптические соединители типа SC обеспечивают затухание на каждом стыке порядка 0,25...0,3 дБ и затухание несогласованности более 40 дБ. 1.3.5. Цифровые интерфейсы ТВЧ Типовая для цифрового ТВЧ скорость передачи по последовательному стыку ~1,5Г6ит/с предъявляет еще более жесткие требования к качеству кабелей, соединителей, их заделке в кабели. Передача по электрическим кабелям возможна на расстояние, на котором затухание в кабеле на частоте 750 МГц не превысит 20 дБ (практически не более 50-70 м). Для передачи на более длинные дистанции нужно использовать оптоволокно. В стандарте SMPTE-292M [1.29] специфицирована разновидность формата SDI для ТВЧ со скоростью передачи 1,485 Гбит/с и частотами кадров 24, 25, 30 Гц (с прогрессивной разверткой) и 50, 60 Гц (с чересстрочной разверткой). Для совместимости программного материала с аналоговым стандартом NTSC в стандарт введена опция скорости 1,4835 Гбит/с с частотами полей/кадров 59,94, 29,97 и 23,976 Гц.
54 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Входным сигналом интерфейса служат два параллельных цифровых потока: один сигнал яркости Y, другой — два сигнала цветности CR и Св, со скоростью 74,25 Мслов/с каждый, объединяемые путем посимвольного перемежения. Параметры канального кодирования для коаксиального кабеля аналогичны обычному SDI: код БВН инвертированный, сверточное скремблирование порождающим многочленом g(x) = х9 4-х4 +1, размах выходного сигнала передатчика 800 + 80 мВ. Время нарастания и спада импульса от 80% до 20% амплитуды не должно превышать 270 пс с различием не более 100 пс, фазовое дрожание не более 1 ТИ (670 пс) суммарно и 0,2 ТИ (135 пс) в области верхних частот. Соединитель BNC по стандарту IEC 169-8 с волновым сопротивлением 50 или 75 Ом должен обеспечивать согласование не хуже 15 дБ в полосе частот до 1,5 ГГц. Приемник должен принимать сигнал уровнем не менее 80 мВ и не воспринимать помехи величиной менее 2,5 В в полосе частот ниже 5 кГц, менее 100 мВ в полосе от 5 кГц до 27 МГц и менее 40 мВ на частотах выше 27 МГц. Основные принципы стандарта SDTI перенесены и в область ТВЧ разработан проект стандарта SMPTE-348M [1.30] передачи высокоскоростных данных в рамках SDI ТВЧ формата, специфицированного в стандарте SMPTE-292M. В каждой строке передаются отсчеты четырех 10-битовых слов, это могут быть видеоданные Св, Yv CR, Y2 или любые блоки данных, состоящие из 8- или 9-битовых слов, упакованных в 10- битовые «контейнеры». Слова группируются по два, образуя два параллельных канала со скоростью передачи до 1 Гбит/с в каждом — канал с Y-данными (Yt и Y2) и канал с С-данными (Св и CR). Описание размера и типа блока содержится в его заголовке, вид передаваемых данных кодируется в заголовке строки, передаваемом в промежутке между EAV и SAV Оптический интерфейс должен работать в одномодовом режиме на длине волны 1310 + 40 нм с шириной спектральной линии не более 10 нм, выходная мощность передатчика может составлять от минус 7,5 до минус 12 дБм, чувствительность приемника не хуже минус 20 дБм. Параметры нарастания и спада импульса допускаются такие же, как в электрическом интерфейсе. 1.4. ПРЕОБРАЗОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ В ЦИФРОВУЮ ФОРМУ 1.4.1. Двухканальный и многоканальный звуковой сигнал Способность человеческого слуха воспринимать пространственное положение звуковых объектов бинауральный эффект долгое время не использовалась в телевизионном вещании, да и сейчас скорее является исключением, чем правилом. Лишь немногие страны ведут эфирное ТВ вещание со стереозвуковым сопровождением. Пионерами здесь оказались звуковое вещание и кинематограф. С появлением в УКВ диапазоне стереовещания с частотной модуляцией (ЧМ) и шумоподавлением звуковое вещание ощутимо приблизилось к пределу качества аналоговых систем. В кинематографе внедрение системы шумоподавления Dolby позволило сократить ширину оптической дорожки для записи звука на киноленте и разместить вместо одной дорожки две — появилась возможность
Глава 1. Введение в цифровое телевидение 55 записи двухканального стереозвука. Однако при наличии двух динамиков правого и левого — стереоэффект ощущался только в небольшой центральной части зала, зрители же, сидящие ближе к одному из динамиков, слышали звук преимущественно из этого динамика. Такой перекос затруднял восприятие диалогов, и было решено установить за экраном центральный динамик, на который подавался смикшированный сигнал, обеспечивавший «центральное» восприятие диалогов для всей аудитории. Дальнейшие исследования показали, что два микрофона с кардиоидной диаграммой направленности, размещенные под углом 90° дают значительно больше информации, чем необходимо для двухканального звука, и эта информация может быть использована путем Рис 1 42 Рекомендуемое расположение динами- размещения одного или двух динами- ков в многоканальной системе surround sound ков позади слушателей. Еще один динамик размещался впереди и использовался для воспроизведения сверхнизких частот в полосе до 120 Гц (так называемый сабвуфер). Результирующий многоканальный сигнал обозначили 5.1 (5 полных каналов центральный С, правый R и левый L передние, правый Rs и левый Ls задние, низкочастотный LFE с информационной емкостью примерно 0,1 полного). Иногда еще используется форма записи 3/2. На рис. 1.42 показано рекомендуемое расположение динамиков. Такой пятиканальный звук (низкочастотный канал в качестве опции) был стандартизован в принятой МСЭ Рекомендации BS.775 [1.31]. Так родился панорамный, или окружающий, звук (surround sound), который поражает великолепными акустическими эффектами в американских фильмах последних 20 лет. Для записи на две звуковые дорожки киноленты исходные сигналы подвергают матрицированию, surround сигнал примешивают к правому и левому каналам с уровнем - 3 дБ и фазовым сдвигом соответственно -90° и +90° что позволяет после воспроизведения выделить его специальным декодером. Для улучшения разделения каналов была разработана система Dolby Pro Logic, использовавшая для этой цели некоторые тонкие эффекты. В частности, учитывались особенности человеческого слуха, связанные с ухудшенным различением направления на два источника примерно равной интенсивности и с преобладанием направления на более мощный источник при неравной интенсивности. Удалось добиться разделения между каналами до 35 дБ. При переходе к цифровому звуку все достижения в области многоканального звука сохраняются и получают дальнейшее развитие. Благодаря гибкости цифрового форматирования легко обеспечить иерархическую передачу, когда из одного и того же цифрового сигнала, содержащего все компоненты многоканального звука, декодеры разной сложности выделяют либо двухканальный стереосигнал, либо двухканальный сигнал Dolby Pro Logic с последующим разделением на матрице, либо полный многоканальный сигнал.
56 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю В применении к телевизионному вещанию, в отличие от кинематографа с его большим экраном, существует противоречие объемного звукового образа с небольшим ТВ изображением. Надо полагать, с появлением ТВ приемников с большим размером экрана и распространением «домашних кинотеатров» это противоречие будет постепенно сглаживаться. 1.4.2. Цифровой сигнал AES/EBU Отличия в аналого-цифровом преобразовании звуковых сигналов и видеосигналов связаны с особенностями человеческого слуха. Если видеосигнал занимает полосу частот до 4...6 МГц, то ухо воспринимает звуки в диапазоне 20 Гц...20 кГц, и частота дискретизации может быть значительно ниже, чем для видеосигнала. Практически применяются три номинала частоты: 32 кГц для бытовой аппаратуры с полосой воспроизводимых частот 30 Гц 15 кГц, 44,1 кГц для компакт-дисков (CD) и 48 кГц для профессиональной звуковой аппаратуры высокого качества с полосой 20 кГц и более. Значение 44,1 кГц сложилось исторически, когда для записи CD мастер-копий использовались видеомагнитофоны и требовалось, чтобы на строке укладывалось целое число отсчетов. Оказалось, что и для стандарта разложения 525 строк, и для стандарта 625 строк частота 44,1 кГц обеспечивает размещение ровно трех звуковых отсчетов на строке. Особенностями слуха являются также огромный динамический диапазон слухового восприятия — более 100 дБ и чувствительность к самым ничтожным нелинейным искажениям. Для обеспечения высококачественного (качества CD) воспроизведения разрядность квантования должна быть не менее 16 бит/отсчет, для профессиональной аппаратуры общепринятыми являются значения 18, 20 и даже 24 бита. В 1992 г. Американское общество звукоинженеров (AES) стандартизовало двухка- нальный звуковой цифровой интерфейс, построенный на основе этих предпосылок (версия AES3). Позднее этот стандарт был принят Европейским союзом радиовещания ЕСР (англоязычная аббревиатура EBU) и под названием AES/EBU получил статус международного [1.32]. Он предполагает передачу с мультиплексированием по времени двух потоков звукоданных, соответствующих правому и левому каналам одного стереосигнала или двум независимым моноканалам. Один кадр данных содержит 2 субкадра, в каждом из которых передаются звукоданные одного канала: 20 битов одного отсчета, 4 бита данных для увеличения разрядности квантования, 4 бита вспомогательных незвуковых данных и 4-битовая преамбула для синхронизации. Скорость потока составляет 2-32-48103 =3,072 Мбит/с при частоте дискретизации 48 кГц и 2,048 Мбит/с при частоте 32 кГц. Кадры группируются в блоки по 192 кадра. Выделение блоков необходимо для организации сравнительно медленных потоков вспомогательных данных (по 1 биту в субкадре). Устойчивое выделение тактовой частоты на приеме обеспечивается благодаря использованию бифазного канального кода, в котором каждая граница такта отмечается переходом и, кроме того, логическая «1» отмечается дополнительным переходом. Такая схема практически исключает постоянную составляющую и допускает инверсию сигнала данных. После кодирования скорость данных в канале удваивается и достигает 6,144 Мбит/с. Синхронизация осуществляется посредством трех кодовых комбинаций X, Y, Z, передаваемых соответственно в начале отсчета левого канала, в начале отсчета правого канала и в начале блока. Эти преамбулы нарушают правила бифазного кода и потому легко обнаруживаются на приеме (рис. 1.43).
Глава 1. Введение в цифровое телевидение 57 JU- zf UU LTL Канал] В Канал А Канал В Рис. 1.43. Синхронизация в интерфейсе AES/EBU Электрические характеристики интерфейса частично совместимы с RS422. Дифференциальное напряжение на передаче должно быть в пределах 2...7 В, фронты импульсов от 5 до 30 не, фазовое дрожание не должно превышать 4 не (0,025 тактового интервала). В профессиональных применениях всегда используется балансная линия в виде витой пары с трехконтактными соединителями XLR, использовавшимися еще в технике аналогового звука. Передача по специальному 110-омному кабелю возможна на 500 м без коррекции и до 1000 м с коррекцией, по обычному кабелю на 70 м без коррекции и до 250 м с коррекцией. Раскрытие глазковой диаграммы на приеме должно быть не менее 0,25 тактового периода по ширине и 0,2 В по высоте. Недопустима эксплуатация интерфейса без оконечной нагрузки 100 Ом из-за значительного влияния отраженной волны. Не очень высокая экранирующая способность витой пары ставит под сомнение возможность передачи сигнала AES/EBU на большие расстояния как из-за влияния других сигналов, так и из-за помех от сигнала AES/EBU чувствительным радиоустройствам в диапазоне нескольких мегагерц. Недавно стандартизован коаксиальный вариант интерфейса AES/EBU. Он допускает передачу данных по высококачественному коаксиальному кабелю на расстояние до 1 км, при этом выходное напряжение передатчика должно составлять 1 ±0,1 В на нагрузке 75 Ом. Характеристики, схожие с аналоговым видеосигналом (размах 1 В, полоса частот около б МГц), позволяют пропускать этот сигнал по имеющимся аналоговым студийным видеотрактам с их корректирующими усилителями и коммутаторами. Некоторыми фирмами-производителями оборудования предложены собственные форматы цифрового звука, но они не приобрели статус международного стандарта и используются в основном в бытовой аппаратуре самих разработчиков. Наиболее известен формат SPDIF (Sony/Philips Digital Interface), разработанный для CD-плееров и использующий те же форматы звукоданных, но несколько иные электрические характеристики и другой формат незвуковых данных. В документе IEC958 описано использование для бытовой аппаратуры небалансного звукового интерфейса с RCA соединителями, подключенными к обычному коаксиальному звуковому кабелю. Указывается, что можно перекрыть расстояние в десятки метров. Серьезной и не до конца решенной проблемой цифрового звука является установка и поддержание диаграммы уровней при аналого-цифровом преобразовании. Поддерживать стабильный и одинаковый по всем каналам уровень звука необходимо, чтобы слушателю не приходилось постоянно регулировать громкость своего ТВ приемника при просмотре передачи или переключении с канала на канал. В аналоговом вещании это делается подачей тонального измерительного сигнала определенного уровня (чаще всего + 4 дБи = 1,23 В.. в профессиональном оборудовании и минус 10 дБи в бытовых устройствах, где дБи — децибелы относительно калибровочного напряжения 0,775 В, обеспечивающего мощность 1 мВт на номинальном сопротивлении 600 Ом) и последующей регулировкой уровня реального звукового сигнала таким образом, чтобы его «квазипиковое» значение равнялось значению напряжения измерительного сигнала на том же измерителе уровня. Под «квазипиковым» понимают пиковое значение с постоянной
58 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю времени усреднения 5 мс, которое превышается «весьма редко». Если учесть, что «квазипиковое» значение сложного звукового сигнала на 10... 14 дБ выше пикового значения синусоидального сигнала, это означает, что реальная субъективная громкость, которая определяется не пиковым, а средним уровнем сигнала, измеренным с постоянной времени 200 мс, на те же 10... 14 дБ ниже громкости измерительного тона. В цифровом вещании оператор лишен возможности подать звуковой сигнал на измеритель. Затруднены и оперативные регулировки его уровня, особенно для сигнала, встроенного в SDI. Единственной гарантией одинаковой громкости звука во всех каналах могла бы быть тождественность характеристик квантования (она определяется разрядностью квантования) и одинаковый запас по перегрузке, т.е. разница в децибелах между полным размером шкалы квантования и напряжением, соответствующим среднему уровню громкости (так называемым уровнем выравнивания). Запас нельзя делать слишком малым, иначе в моменты перегрузки наступит клипирование обрезание пиков звукового сигнала, сопровождающееся нелинейными искажениями. Не следует и завышать запас, это связано с уменьшением динамического диапазона и ухудшением отношения сигнал-шум квантования. К сожалению, относительно запаса по перегрузке у вещателей нет единого мнения, отсутствуют и общепризнанные стандарты на этот параметр. ЕСР в Рекомендации R.64- 1992 установил запас равным 12 дБ для 16-битового квантования, позднее для 20- битового была рекомендована величина 18 дБ (R.68-1995). Однако в Германии пользуются значением 15 дБ, во Франции — 22 дБ. SMPTE в Рекомендации RP155 рекомендует запас в 20 дБ даже не над средним, а над квазипиковым уровнем звукового сигнала [1.4]! Компания NTL предлагает вернуться к значению 12 дБ и установить для уровня выравнивания определенные значения кодов, напрямую связанные с кодами максимального уровня кодирования [1.33]. Пока же вещателям при ретрансляции программ от разных источников приходится вводить в каждом звуковом канале цифровые или даже аналоговые (с ЦАП и АЦП) устройства для начальной установки уровня сигнала. 1.4.3. Ввод звукоданных AES/EBU в сигнал последовательного стыка SDI При описании интерфейса SDI уже упоминалось, что в промежутке между сигналами EAV и SAV могут передаваться дополнительные данные. Стандарт SMPTE-272M [1.34] описывает формат размещения звукоданных, расширенных данных и командной информации для встраивания (внедрения, имбеддирования) в цифровой поток до 8 стерео- или 16 моносигналов цифрового звука, предварительно преобразованного в формат AES/EBU. Видеосигнал с внедренным звуком очень удобен в больших аппаратных при значительном общем числе каналов, когда велика опасность при коммутациях «потерять» звук или нарушить его синхронность с видеосигналом. Стандарт поддерживает 10 режимов (уровней) функционирования, обозначаемых буквенными суффиксами от А до J и различающихся частотой дискретизации, точностью квантования, способом синхронизации. При внедрении в видеосигнал пары сигналов AES/EBU (четверки моносигналов) объединяют в группы. Сигналы каналов одной группы передают в одном пакете, снабженном идентификатором для определения его принадлежности к группе. Каждый субкадр звукового сигнала (кроме битов дополнительных данных) передается тремя 9- битовыми символами (10-й бит символа инверсный к 9-му). При необходимости квантования на 24 бита дополнительные биты данных собираются в специальные паке-
Глава 1. Введение в цифровое телевидение 59 ты расширенных данных, при этом в одно кодовое слово упаковываются дополнительные биты двух соседних каналов. Еще один вид пакетов принят для передачи команд управления потоком. В результате формируются два вида пакетов: из 55 слов (48 полезные данные) и из 43 слов (36 полезные данные). В цифровой строке между EAV и SAV размещаются два пакета первого вида или три пакета второго вида. Упрощенные структурные схемы устройств ввода и вывода внедренного звука показаны на рис. 1.44а, б. SDI ? Посл./паралл. преобразователь Каналы 1,2 / Каналы 3,4 / N ' Обнаружение синхрослов Приемник AES/EBU i . г * Приемник AES/ Е BL J Ь -э s ) Синхронизация т Посл./паралл. преобразователь Посл./паралл. пр< зобразо ватег ь —> —ь Буфер -> -> 1 Мульти- плексор Т 44 Ф ормати- о в а н и е в cl преобразователь SDI+AES/EBU а) SDI+ \ES/EB N —? и Посл./паралл. преобразователь —Ь Обнаружение синхрослов и выделение звука > ) \ ) -у Буфер Буфер > ) \ ) Выходные такты Форматирование 1 ' Т Форматирование 2 j \ \ ) \ ) Передатчик AES/EBU Т Передатчик AES/EBU / ч Выход видео Каналы1,2 Каналы 3,4 7 -\ 7 б) Рис. 1.44. Структурная схема устройств ввода (а) и вывода (б) встроенного звука
2 СЖАТИЕ ЦИФРОВЫХ СИГНАЛОВ 2.1. ПРИНЦИПЫ ЦИФРОВОГО СЖАТИЯ ВИДЕОДАННЫХ 2.1.1. Обзор методов цифрового сжатия Целью цифрового сжатия (называемого также цифровой компрессией) является сокращение объема информации, описывающей телевизионное изображение, без заметного для глаза ухудшения его качества. Обработка сообщения перед подачей в канал связи называется кодированием источника. Сокращение возможно благодаря значительной информационной избыточности, заключенной в видеосигнале, и свойствам человеческого зрения, не воспринимающего отдельные детали изображения. Если условно разделить плоскость сообщений (рис. 2.1) вертикальной линией на левую часть, статистически избыточную, и правую, статистически неизбыточную, а горизонтальной линией на верхнюю полуплоскость, содержащую информацию, несущественную для получателя (это так называемая психофизиологическая, или перцептуальная, избыточность, обусловленная свойствами зрения), и нижнюю полуплоскость с существенной информацией, то интерес для передачи по каналу представляет информация, заключенная в правой нижней части плоскости сообщений [2.1]. Устранение несущественной части является необратимым процессом, который характеризует- Статистически \ со £ избыточная О4 х £ ч\ И N Б§ N з 2 \ II N \ \\\\\\\\ //////// к 5 / SS / |£ / о& / / Статистически ' / неизбыточная / / / / / //////// \\\\\\\\ \ \ \ \ * \ Часть сообщения, представляющая интерес для передачи Рис. 2.1. Разделение плоскости сообщений на сегменты с учетом их избыточности
62 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ся потерей информации, в отличие от исключения статистической избыточности, не связанного с потерей информации. В цифровом вещании используются обе группы методов. Начнем наш обзор с методов сокращения статистической избыточности. Они, как показывает опыт, не дают сжатие более 3:1. Здесь нам понадобится знакомство с особой группой кодов, применяемых не для коррекции ошибок, а для сокращения избыточности сообщения. В компьютерной технике для архивации данных давно используется кодирование LZW (Lempel-Ziv-Welch — Лемпеля-Зива-У элша), не приводящее к потере информации и пригодное для сжатия данных любого рода. Кодирование начинается с построения кодового дерева из коротких блоков входного потока данных. Затем проверяется, содержат ли последующие блоки данных кодовые слова из дерева. Если да, то строятся новые кодовые слова как комбинация существующих и посылаются только их адреса. Такое построение кодовых слов от кодовых слов приводит к сжатию длинных последовательностей до коротких адресов. Метод требует громоздких расчетов и не применяется в цифровом телевидении. К этой же группе кодов, сжимающих без потери информации, относятся коды с переменной длиной кодового слова (VLC Variable Length Coding) и самый известный из них код Хаффмана. Он присваивает словам с наибольшей вероятностью появления короткие кодовые комбинации, а более редким символам более длинные (по этому же принципу построена азбука Морзе). Покажем принцип построения кода на простом примере. Пусть алфавит источника насчитывает четыре символа а, Ь, с, d с вероятностями появления соответственно 0,5, 0,25, 0,125, 0,125. Если каждому из символов присвоить двухбитовые значения 00, 01, 10, 11, средняя длина кодового слова составит, очевидно, 2 бита на символ. Присвоим теперь символу а значение 0, символу Ъ значение 10, символам end значения соответственно 110 и 111. Нетрудно рассчитать, что в среднем для передачи одного символа расходуется 1 х 0,5 + 2 х 0,25 4- 2 х 3 х 0,125 = 1,75 бит. Хотя максимальная длина символа возросла, число битов, требуемых для передачи сообщения, сократилось. По своей эффективности код приближается к теоретическому пределу расхода битов и потому называется энтропийным. Адаптивная версия кода Хаффмана применяется в том случае, когда вероятность появления кодовых слов изменяется в процессе передачи. К группе энтропийных относится и так называемый арифметический код. Процедура кодирования состоит в том, что всей совокупности символов сообщения ставится в соответствие интервал [0, 1], который разбивается на участки, соответствующие исходным вероятностям символов, и это разбиение сообщается декодеру. После поступления очередного символа интервал пересчитывается на новые пределы, соответствующие вероятности появления этого символа, и вновь разбивается пропорционально исходным вероятностям. С поступлением каждого нового символа размер интервала уменьшается, причем в строгом соответствии с вероятностями символов. Более часто встречающиеся символы меньше сужают интервал, чем редкие, и добавляют меньше битов в код интервала. По окончании цикла кодирования формируется некоторый, весьма узкий интервал, однозначно характеризующий передаваемую последовательность символов, и она легко может быть восстановлена в декодере по любому числу из этого интервала. Кодированием длин серий (RLC Run Length Coding) называется присвоение длинным непрерывным последовательностям одинаковых битов отдельных кодовых слов. Этот метод эффективен, как будет показано далее, при дискретно-косинусном преобразовании, когда значительная часть коэффициентов принимает нулевые значения.
Глава 2. Сжатие цифровых сигналов 63 Техника сжатия телевизионных изображений традиционно развивалась по пути дифференциальных методов, базирующихся на структуре телевизионного сигнала. Первый шаг в сокращении избыточности был сделан, когда заметили, что можно передавать по каналу не сами элементы изображения цифровые отсчеты видеосигнала, а разность между соседними элементами в строке, в соседних строках и в смежных кадрах (метод дифференциальной ИКМ ДИКМ). При вычислении разности происходит процесс декорреляции, так что разностные элементы содержат меньше информации и могут передаваться с меньшей разрядностью. Разновидностью ДИКМ является кодирование с межкадровым предсказанием, при котором по каналу передается разница между текущим кадром и кадром, предсказанным в кодере по одному или нескольким предшествующим кадрам. При хорошем предсказании эта разница значительно меньше, чем различие между двумя последовательными кадрами. Мощным средством сокращения избыточности является кодирование с преобразованием, при котором набор статистически зависимых отсчетов изображения во временной области преобразуется в набор независимых коэффициентов в спектральной области. Разложение производится по ортогональным базисным функциям, различным для разных преобразований. При удачном выборе вида преобразования энергия в спектральной области сосредоточивается вблизи низкочастотных компонент спектра, а коэффициенты в высокочастотной области оказываются малыми или вообще нулевыми. К наиболее широко распространенным и глубоко исследованным относятся дискретное преобразование Фурье (ДПФ), преобразования Уолша-Адамара, Хаара, косинусное, синусное и наклонное. Для этих видов преобразования существуют алгоритмы быстрых вычислений, позволяющие заметно сократить объем вычислительной работы. Например, для ДПФ изображения с числом элементов NxN алгоритм быстрого преобразования Фурье позволяет вместо № умножений и № сложений обойтись 2N2 log2 N сложениями. Серьезный недостаток ДПФ — большая среднеквадратическая ошибка. Как отмечено в первой главе, по совокупности показателей наилучшим преобразованием оказывается дискретно-косинусное преобразование (ДКП). Дальнейшее сокращение избыточности получается благодаря переходу от поэлементного к групповому преобразованию, когда ТВ изображение разбивается на большие или меньшие участки и производится кодирование сразу группы элементов, составляющих участок. Все используемые сегодня преобразования работают по принципу группового кодирования. К гибридным методам относят кодирование одновременно с предсказанием и преобразованием, именно к этой группе относятся алгоритмы, используемые в столь популярном сегодня стандарте MPEG-2, который мы детально рассмотрим в следующих главах. Все перечисленные методы не приводят к необратимой потере информации. Такая потеря наступает при квантовании, сопровождающемся, как мы знаем, неустранимой ошибкой. Эффективность квантования зависит от того, как подготовлена информация и насколько грубое квантование можно применить, не ухудшив субъективного восприятия изображения. Квантование является составной частью многих алгоритмов с потерей информации, применяемых в технике цифрового сжатия изображений и обеспечивающих коэффициент сжатия от 3:1 до 100:1. Один из таких алгоритмов — полосное кодирование. Входной сигнал разделяется набором т цифровых полосовых фильтров и прореживается в т раз, так что точность отображения сохраняется. Каждый полосный сигнал кодирует часть частотного спектра. Если применить квантование с адаптивным распределением битов, учитывающим долю энергии сигнала в данной полосе, можно добиться существенного сжатия видеоданных.
64 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю г-(-Кодер \-\ -а Кодер И Теоретически исследованы и другие методы сжатия, некоторые считаются весьма перспективными для цифрового вещания, но для их реализации не хватает производительности современных процессоров. Коротко коснемся векторного, фрактального и волнового кодирования. При векторном кодировании блок изображения из пхп пикселей сравнивается с кодовой книгой у содержащей небольшое число тщательно выбранных «эталонных» блоков пхп Такая же кодовая книга имеется в декодере. По каналу посылается адрес блока в кодовой книге, наиболее близкого к текущему блоку изображения, и корректирующая информация, позволяющая восстановить разницу между блоками. Основная проблема в векторном кодировании как составить хорошую кодовую книгу. Отметим, что этот метод был основным соперником ДКП при выборе алгоритма для стандарта MPEG и продолжает применяться, например, для кодирования звука. Фрактальное кодирование — это модификация векторного кодирования, где в качестве кодовой книги используются блоки, вырезанные из исходного изображения. Эти блоки должны обладать некоторыми свойствами, в частности, переходить в себя при определенных преобразованиях. Волновое (wavelet) кодирование является разновидностью пирамидального кодирования [2.2] и представляет собой итерационный процесс, на каждом этапе которого благодаря двукратной фильтрации и децимации (рис. 2.2а) образуются четыре изображения: НН — содержащее информацию о низкочастотных деталях изображения по вертикали и горизонтали; ВН и НВ — контуры соответственно в горизонтальном и вертикальном направлениях; В В — информация о высокочастотных деталях в диагональном направлении. Число отсчетов в изображениях на каждом этапе уменьшается вдвое, так что после к -той итерации последовательность будет содержать одно базовое НН изображение, уменьшенное в2* раз, и Ък разностных изображений разного масштаба (рис. 2.26). Ясно, что суммарное количество битов для их отображения меньше, чем для отображения исходного изображения. Для декодирования необходимо осуществить все операции в обратном порядке — применить экспандеры и интерполирующие фильтры с суммированием восстановленных компонент. Еще одно перспективное направление цифрового сжатия, нашедшее воплощение в стандарте MPEG-4, оперирует с такими понятиями, как контур и текстура. Контурами называются резкие перепады яркости изображения. Текстура определяется как «все то в изображении, что не является контуром» [2.3]. Применяя эффективные методы кодирования отдельно для контуров и текстуры, можно получить очень высокую степень сжатия. Подробнее об этом рассказано в главе 5. На рис. 2.3 показана возможная классификация методов сжатия по принципу наличия или отсутствия потерь [2.4]. нн нв Кодер Н ■—Н<одер Н ГПКодерН Б Ф ВН вв а) Кодер о. о о ф НН2 НВ2 ВН2 ВВ2 НВ1 ВН1 ВВ1 б) Рис. 2.2. Волновое кодирование а) упрощенная структура кодера б) структура кодированного изображения
Глава 2. Сжатие цифровых сигналов 65 LZW Код Хоффмана (VLC) без потерь Кодирование длин серий (RLC) Статистическое кодирование Цифровое сжатие ДКП z дикм кодирование с преобразованием J-—I ДПФ Уолша- Адамара Наклонное кодирование Арифметическое кодирование Хаара Субдискретизация Полосное кодирование Векторное кодирование Кодирование контура и текстуры Волновое кодирование Фрактальное кодирование Рис. 2.3. Классификация методов цифрового сжатия 2.1.2. Устранение пространственной и временной избыточности видеосигнала Пространственная избыточность изображения обусловлена наличием в видеокадре значительных по размеру однотонных одинаково окрашенных участков. Отсчеты видеосигнала в соседних точках на таких участках практически одинаковы или слабо изменяются в плоскости изображения, следовательно, присутствуют только низкочастотные составляющие двумерного пространственного спектра, и преобразование в спектральную область позволит заметно сократить число битов, необходимое для отображения кадра изображения. Ранее уже отмечалось, что наиболее эффективным преобразованием является ДКП. Изображение разбивается на небольшие блоки пикселов и ДКП последовательно прилагается к каждому такому блоку. Проводились исследования по разбиению на блоки размером 4x4, 8x8, 16x16 пикселов, которые показали, что разбиение 8x8 является наи- ^лм vrpw 7Т\/ лучшим компромиссе точностью преобразования (минимальной среднеквадратичной ошибкой) и необходимым объемом вычислений. Преобразование, описанное нами выше в разд. 1.2.4, ставит в соответствие 64 отсчетам цифрового сигнала 64 коэффициента при гармониках пространственной частоты, являющихся базисными функциями ДКП. В левом верхнем [77 15 6 11 11 14 13 11 17 8 1 12 14 7 18 6 15 12 10 15 11 11 15 8 8 11 5 5 2 13 11 10 3 6 8 4 8 2 6 4 11 4 12 10 9 6 1 10 1 10 4 6 3 9 6 5 То] 1 8 7 6 6 6 9 I ГТо 12 4 1 0,1 0,2 0,4 0,2 12 4,5 1,2 0,3 0,1 0,1 0,1 0,3 8 1,1 1.1 0,4 1 0.2 0,5 0,1 1 1,4 0,5 1,1 0,3 0,3 0,4 0,3 1 0,2 0,1 0,4 0,2 0,2 0,3 0,2 0,3 0,2 0.4 0,2 0.4 0,3 0,3 0,4 0,2 0,3 0,1 0,4 0,2 0,1 0,2 0,2 l] 0,4 0,2 0,1 0,2 0,1 0,1 0,2[ Рис. 2.4. Дискретно-косинусное преобразование: а) исходный блок отсчетов; б) блок коэффициентов
66 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю углу оказывается коэффициент при нулевой гармонике, иначе говоря, постоянная составляющая или средняя яркость блока, соседние позиции занимают коэффициенты при гармониках невысокого порядка, а с перемещением к правому нижнему углу порядок гармоник растет и их интенсивность уменьшается (рис. 2.4а, б). Зачастую оказывается, что большая часть коэффициентов после квантования может быть отброшена. Временная избыточность изображения проявляется в относительно малом отличии двух последодательнь12с_кадвов ТВ изображения, как правило, изображение представляет собой неподвижный задний план и относительно медленно перемещающиеся на переднем плане объекты. Можно сократить передаваемый массив информации, если содержание одного кадра, называемого опорным, передавать целиком, а вместо следующего кадра передавать только информацию о переместившихся объектах в их новых положениях. Этот способ был значительно усовершенствован, когда применили предсказание кадра на основе одного или нескольких предыдущих и последующих и по каналу стали передавать разницу между текущим и предсказанным кадрами. Отметим, что для повышения точности предсказания в качестве опорного берут не оригинальный предыдущий кадр, а восстановленный в декодере, т.е. в кодере для этой цели эмулируется (воссоздается) декодер. Для улучшения результатов предсказания применяют процесс, называемый компенсацией движения. Изображение в текущем кадре разбивают на небольшие участки (блоки) и для каждого такого блока ищут его наиболее вероятное положение в предыдущем кадре, сопоставляя его со всеми блоками такого же размера в заданной области поиска. Поиск ведется по критерию минимальной абсолютной ошибки, или минимальной среднеквадратичной ошибки. Этот процесс называется сопряжением блоков (рис. 2.5). Существуют и более эффективные алгоритмы расчета сопряжения, например, метод фазового сопряжения [2.5]. В этом методе блоки отсчетов из соседних полей с помощью ДПФ переводятся в частотную область, значения одноименных коэффициентов вычитаются и над разностями производится обратное преобразование Фурье. Если сюжет |е— б4 содержит движение, в получившейся корреляционной поверхности по- Рис- 2-5- Сопряжение блоков при компенсации движения являются всплески, положение которых дает точную информацию о направлении и величине перемещения, но теряется информация о пространственном положении перемещающейся области. Для восстановления информации приходится провести большой объем вычислений. Ожидается, что новые алгоритмы найдут применение в кодерах следующего поколения. В большинстве применяемых сегодня форматов цифрового сжатия блок отсчетов называется макроблоком и его размер составляет 16 х 16 пикселов. Чем больше размер блока, тем эффективнее сжатие, но труднее найти подходящее сопряжение. Для маленьких блоков более вероятно найти блоки со схожими параметрами, но степень сокращения объема данных окажется невысокой. Размеры области поиска определяют максимальную скорость перемещения объекта в кадре, которая может быть скомпенсирована. Например, для объекта, пересекающего экран за 0,5 с, область поиска должна составлять не менее 60 х 60 пикселов. Лучшие современные кодеры обеспечивают точность сопряжения 0,5 пике. ц / ш элок в ДРв п-1 $—V ^. < \ 0 /
Глава 2. Сжатие цифровых сигналов 67 Найденный в опорном кадре подходящий блок совмещают с анализируемым блоком в текущем кадре и передают по каналу разность между отсчетами. Благодаря компенсации движения эта разность имеет теперь минимальное значение. Кроме того, вычисляют величину и направление перемещения — так называемый вектор перемещения, и также передают его в декодер, который на основе полученных данных легко восстанавливает параметры текущего блока. Описанный алгоритм компенсирует только движе- ние переноса и неэффективен при поворотах, изменении масштаба и других более слож- ных движениях, но тем не менее дает хорошие практические результаты. В реальных кодерах цифрового сжатия процесс устранения избыточности происходит в несколько ином порядке, чем описано выше. Поступившие в кодер отсчеты сигнала, соответствующие одному видеокадру, сначала группируются в блоки 16 х 16 пикселей, производится компенсация движения, далее макроблоки разбиваются на блоки отсчетов яркости и цветности размером 8x8 пикселов, для них вычисляются межкадровые разности и уже эти межкадровые разности (а не исходные отсчеты кадра) подвергаются ДКП для устранения пространственной избыточности. Последовательное применение предсказания с компенсацией движения и преобразования в спектральную область позволяет достичь максимально возможного на сегодня коэффициента сжатия — 100:1 и более. 2.1.3. Предфильтрация и шумоподавление Описанный процесс устранения избыточности показывает, что для последующего эффективного сжатия необходимо устранить из исходного сигнала все факторы, препятствующие сокращению избыточности телевизионного изображения. Сюда относятся в первую очередь шумы видеотракта и шумы кинопленки, проявляющиеся на всем изображении. Источником шумов в видеотракте могут быть тепловой «белый» шум электронных устройств, пороговые шумы спутниковых ЧМ приемников, помехи декодирования аналоговых композитных сигналов, шумы видеозаписи (шумы и выпадения ленты). Один из крайне неприятных для цифровой компрессии дефектов исходного изображения неподавленный остаток несущей цветности после аналого-цифрового преобразования, он проявляется как раз в высокочастотной области, которая обычно слабо заполнена в компонентном сигнале. Отрицательно сказываются дефекты кинопленки — царапины, загрязнения, шумы зернистости, проявляющиеся при увеличении кинокадров. Необходимо избегать нежелательных движений, добавляющих в сигнал помехи, например, дрожания плохо закрепленной видеокамеры или неравномерного движения кинопленки в телекинопроекторе из-за поврежденной перфорации. Влияние этих составляющих дает себя знать в появлении после ДКП большого числа ненулевых коэффициентов в области высоких пространственных частот, которые кодер не может отличить от элементов изображения. Шумы также снижают сходство между последовательными кадрами, увеличивая расход битов на кодирование межкадровых разностей. В результате кодеру не хватает ресурсов на кодирование изображения, и качество декодированного изображения у зрителя оказывается ниже, чем исходного материала. В этих условиях необходимо подвергать входные сигналы кодеров сжатия специальной предобработке. Она называется предфильтрацией и включает шумоподавление и различные виды пространственной фильтрации. В некоторых случаях при высокой степени сжатия оказывается выгоднее осуществить двумерную низкочастотную фильтрацию (прореживание отсчетов), несколько потерять в четкости изображения, но существенно снизить количество артефактов (дефектов изображения) из-за влияния нежелательных высокочастотных компонентов на входе. В общем случае хорошие результаты
68 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю дает сочетание рекурсивной адаптивной фильтрации и трехмерной медианной фильтрации. Первая эффективно подавляет «белый» шум путем усреднения близких значений видеосигнала в последовательных кадрах, вторая усредняет отсчеты, расположенные выше, ниже, слева, справа, до и после текущего отсчета видеосигнала, и таким образом хорошо справляется с импульсными и другими помехами. 2.1.4. Квантование и кодирование коэффициентов ДКП Сами по себе операции предсказания и ДКП не приводят к какому-либо сокращению числа битов и полностью обратимы, так как мы по-прежнему имеем дело с тем же числом отсчетов на кадр и той же разрядностью квантования. Более того, разрядность коэффициентов даже возрастает с 8 до 11... 14 битов из-за умножения на дробь в процессе вычислений. Единственное, но очень важное свойство сигнала, которого мы добились на данном этапе, — разности отсчетов очень слабо коррелированы между собой и поэтому несут небольшой объем информации, а получившиеся после преобразования коэффициенты при гармониках пространственной частоты большей частью малы и не требуют много битов для передачи по каналу. Квантование (а точнее переквантование) коэффициентов является первой по-настоящему компрессирующей операцией, где проявляются достоинства подготовительных этапов. Квантование заключается в делении значения коэффициента на некоторое число N >1 и округлении результата до ближайшего целого числа, в результате чего уменьшается число битов, необходимое для их кодирования. Те из коэффициентов, которые после деления окажутся по величине менее 0,5, будут заменены нулями. Одновременно с отсечением каждого младшего бита вдвое возрастают шумы квантования. В обычной ИКМ уменьшение разрядности приводит к возрастанию шумов квантования на всех частотах. Коэффициенты ДКП определяют энергию сигнала на различных частотах и появляется возможность изменять параметры квантования дифференцированно на разных частотах, учитывая различную чувствительность зрения к разным пространственным частотам (см. рис. 2.6). Заметность искажений зависит также от яркости данного участка изображения, степени его однородности, длительности сюжета. Использование при квантовании взвешивающих множителей, учитывающих степень заметности искажений, называется перцептуальным взвешиванием и широко практикуется в цифровом сжатии. Постоянная составляющая обычно квантуется отдельно и с более высокой точностью, более высокочастотные коэффициенты делятся на все более возрастающие числа. Совокупность делителей для всех коэффициентов блока называется матрицей квантования и передается декодеру вместе с компрессированным сигналом. В декодере каждый коэффициент умножается на соответствующий делитель из матрицы, восстанавливая свое (округленное) значение. Для типичного ТВ изображения с прогрессивной разверткой ненулевые коэффициенты сосредоточе- Чувствительность зрения -> Пространственная частота Рис. 2.6. Зависимость чувствительности зрения от пространственной частоты
Глава 2, Сжатие цифровых сигналов 69 ны в левом верхнем углу матрицы. Наиболее эффективный метод считывания значений коэффициентов — зигзагообразное сканирование из верхнего левого в правый нижний угол (рис. 2.7), при котором сначала прочитываются все ненулевые, а затем нулевые коэффициенты. Для кодирования последних применяется описанный выше метод кодирования длин серий, при котором каждой непрерывной последовательности одинаковых символов (в данном случае нулей) приписываются отдельные кодовые слова. Статистическая вероятность появления различных значений коэффициентов неодинакова: Рис. 2.7. Зигзагообразное сканирование ко- некоторые появляются очень часто, другие ред- эффициентов ДКП ко. Эта особенность может быть использована для дальнейшего сокращения числа битов, если более часто встречающимся значениям присвоить более короткие последовательности символов, а более редким — более длинные. Эту задачу решают коды с переменной длиной, о которых мы упоминали выше. В зависимости от сюжета изображения и скорости движения объектов доля устраняемой избыточности изменяется и среднее число битов, приходящееся на один отсчет, может варьироваться в широких пределах. В таких же пределах будет изменяться и скорость цифрового потока на выходе кодера сжатия. В то же время большинство каналов связи рассчитаны на передачу сигналов с постоянными скоростями. Как всегда в таких случаях, выручает буферная память. Буфер накапливает избыточные биты в критические для кодера моменты (смена сюжета, быстрое движение) и отдает их в канал в периоды относительного спокойствия, когда канал оказывается недогруженным текущими данными. Предусмотрен и механизм обратной связи на случай переполнения или, наоборот, опустошения буфера: изменяя адаптивно коэффициенты матрицы квантования, буфер может в определенных пределах управлять количеством поступающих битов и скоростью потока, разумеется, ценой соответствующего увеличения или уменьшения шага квантования и связанных с ним шумов квантования. 2.1.5. Некоторые действующие стандарты цифрового сжатия Разработанные в конце 80-х годов эффективные методы цифрового сжатия изображений, описанные выше, вызвали к жизни большое число схем обработки, сочетающих различные методы и направленных на решение разных задач. Часть этих схем была принята стандартизирующими органами и получила статус международных стандартов. Рассмотрим наиболее эффективные из них, послужившие базой для стандартов семейства MPEG. В 1982-1990 годах группой экспертов по кодированию неподвижных изображений (Joint Photographic Expert Group), образованной совместно МОС, МЭК и МСЭ, был разработан и затем принят одноименный стандарт кодирования неподвижных изображений [2.6]. Основной задачей было поставлено сокращение необходимого объема данных для передачи высококачественного изображения (до 0,25 бит/пике, для «различимого» изображения, 1 бит/пике, для «отличного» качества и 4 бит/пике, для «неотличимого» от оригинала, при исходной точности квантования 8 бит/пике). В ходе длительных исследований были опробованы многие алгоритмы цифрового
70 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю сжатия и выбрано ДКП как обеспечивающее наилучшее качество при минимальной скорости цифрового потока. В стандарте JPEG впервые были введены технические решения, вошедшие затем в последующие стандарты: обработка не исходных цветовых, а матрицированных сигналов яркости и цветоразностных сигналов, прореживание последних вдвое до формата «4:2:0», выбор размера блоков ДКП 8x8 пике, зигзагообразное сканирование коэффициентов, раздельное квантование постоянной составляющей и остальных коэффициентов ДКП, энтропийное кодирование. По понятным причинам отсутствовала только компенсация движения. Следующий представляющий интерес стандарт под названием Н.261 был разработан в 1988-90 гг. предшественником нынешнего МСЭ-Т Международным консультативным комитетом по телеграфии и телефонии. Стандарт предназначался для передачи видеоизображений (видеотелефония, видеоконференции) со скоростями п х 64 кбит/с, где п = 1...30, ффмат изображения не мог превышать CIF. В этом стандарте уже использовалось кодирование с предсказанием и два типа кадров: I- и Р-кадры. Предсказание движения осуществлялось сравнением с предшествующим кадром, в качестве критерия сопряжения был принят минимум абсолютной ошибки. Начальное окно поиска составляло прямоугольный участок размером 64 х 48 пике, поиск мог осуществляться одним из трех способов: 1) полным перебором всей области поиска (медленный способ); 2) путем последовательного сужения окна, пока не достигалась требуемая точность сопряжения; 3) иерархической оценкой движения, при которой формируются несколько последовательных версий опорного и текущего кадров со все более низким разрешением, ищется наилучшее согласование в версии с самым низким разрешением и пересчитывается к исходному уровню путем последовательной модификации векторов перемещения. Как и в современных стандартах, макроблок размером 16 х 16 пике, содержал 4 блока отсчетов сигнала яркости и по одному блоку цветоразностных сигналов. Стандарты Н.261 и JPEG легли в основу разработки MPEG-1. Работа в этом направлении была продолжена, и в 1996 г. МСЭ-Т принял для тех же применений стандарт Н.263, более приспособленный для низкоскоростного кодирования. В этом стандарте поддерживаются форматы от SQCIF до 16CIF (1408 х 1152 пике), присутствуют все три вида кадров I, P и В, область поиска сопряжения не ограничена, точность сопряжения 0,5 пике. К основным улучшениям по сравнению с Н.261 относятся: неограниченный диапазон изменения векторов перемещения (на границе они могут Табл. 2.1. Некоторые форматы разложения, поддерживаемые стандартами Н.261 и Н.263 Формат SQCIF QCIF CIF 4CIF 16CIF Число отсчетов сигаала яркости 128x96 176x144 352x288 704x576 1408x1152 Число отсчетов сигнала цветности 64x48 88x72 176x144 352x288 704x576 Стандарт Н.261 по заказу поддерживается по заказу не поддерживается не поддерживается Стандарт Н.263 поддерживается поддерживается по заказу по заказу по заказу
Глава 2. Сжатие цифровых сигналов 71 указывать за пределы области изображения), арифметическое кодирование квантованных коэффициентов ДКП, улучшенное предсказание (предсказываются 4 блока векторов 8x8 вместо одного размерностью 16 х 16 пикселов), кодирование РВ-кадров (последовательные Р- и В-кадр могут кодироваться вместе как один РВ-кадр). Кодек Н.263 вышел за границы скорости 64 кбит/с и стал кодеком широкого применения для низкоскоростного кодирования В табл. 2.1 приведены некоторые параметры стандартов Н.261 и Н.263 для различных форматов изображения. Появившаяся недавно вторая версия стандарта Н.263, названная Н.263+, содержит много дополнительных функций, делающих этот стандарт вполне современным и эффективным: усовершенствован режим внутрикадровой компрессии (деблокирование фильтра); предсказание делается на основе передискретизированного опорного изображения; введен режим обновления с пониженным разрешением; использованы реверсивные коды переменной длины; формат изображения и тактовые частоты могут устанавливаться по выбору пользователя; введен режим временной, пространственной масштабируемости и масштабируемости отношения сигнал-шум; повышена устойчивость к ошибкам благодаря структурированию слайсов. Отметим, что стандарт Н.263+ использовался при разработке визуальной части стандарта MPEG-4. 2.2. СЖАТИЕ ЗВУКОДАННЫХ 2.2.1. Эффект маскирования и психоакустическая модель слуха Из-за повышенной чувствительности уха к искажениям сжатие звуковых сигналов оказывается более сложной задачей, чем видеокомпрессия. В то же время некоторые психофизиологические особенности слухового восприятия позволяют даже при существенной компрессии (6:1 и более) обеспечить «прозрачный» канал, т.е. канал, звучание выходного сигнала которого субъективно неотличимо от звучания сигнала источника. Для понимания этих особенностей познакомимся вкратце с механизмом слухового восприятия. Известные нам из школьного курса анатомии барабанная перепонка и стремечко преобразуют звуки в механические вибрации и передают их на находящийся в улитке внутреннего уха кортиев орган — протяженную мембрану между двумя камерами, заполненными жидкостью. Звуки разной высоты возмущают различные участки мембраны, имеющие разные резонансные частоты, и через нервные окончания эти возбуждения передаются в мозг. Частотный диапазон восприятия простирается от 20 Гц до примерно 20 кГц, область наибольшей чувствительности лежит между 1 кГц и 5 кГц. Кривая чувствительности слуха в отсутствие громких звуков показана на рис. 2.8а. Как и во всякой системе с преобразованием из временной в частотную область, в слуховой системе имеется некоторая неопределенность в разделении двух событий: чем точнее известны характеристики сигнала во временной области, тем менее точно можно описать его спектральный состав, и наоборот. Несовершенное разделение по частоте приводит к тому, что ухо не в состоянии различить звуки с близкими частотами, этот эффект
72 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Рис. 2.8. Кривая слышимости человеческого слуха а) в отсутствие громких звуков; б) в присутствии тонального звука называется частотным маскированием. В присутствии тонального звука кривая слышимости принимает вид, показанный на рис. 2.86. Граница восприятия вблизи маскирующего тона называется порогом маскирования. Заметим, что кривая поднимается выше со стороны высоких частот, чем со стороны низких частот. В результате длительных исследований удалось измерить ширину и расположение частотных полос, в пределах которых действует маскирование. Эти полосы получили название критических и в полосе слухового восприятия их насчитывается 25. В области низких сльппимых частот ширина критической полосы менее 100 Гц, в районе 2 кГц она равна 300 Гц и возрастает до 4 кГц в области высших воспринимаемых частот (рис. 2.9). 25 БаРк Рис. 2.9. Критические полосы человеческого слуха
Глава 2. Сжатие цифровых сигналов 73 Измеряется ширина критической полосы в Барках и рассчитывается по формуле: '100, для /<500 Гц; L9 + 41og2(//1000), для />500 Гц. Кроме частотного (статического), имеет место и временное (динамическое) маскирование. Дело в том, что слабый сигнал, возникающий сразу после окончания сильного сигнала, остается в течение некоторого времени незамеченным. С другой стороны, даже предшествующий слабый сигнал становится незаметным за несколько миллисекунд до появления сильного сигнала. Эти явления называются «маскированием вперед» и «маскированием назад» (рис. 2.10). Несовершенство временного разделения связано с резонансным характером восприятия. Добротность резонансной системы уха такова, что нарастание колебаний происходит за время порядка 1...2 мс. Использование эффекта маскирования позволяет существенно сократить объем звуко- данных, сохраняя приемлемое качество звучания. Принцип здесь очень простой: «Если какая-то составляющая не слышна, то и передавать ее не надо». На практике это означает, что в области маскирования можно снизить число битов на отсчет до такой степени, чтобы шум квантования все еще оставался ниже порога маскирования. Таким образом, для работы звукового кодера необходимо знать пороги маскирования при различных комбинациях воздействующих сигналов. Вычислением этих порогов занимается важный узел в кодере — психоакустическая модель слуха (ПАМ). Она анализирует входной сигнал в последовательные отрезки времени и определяет для каждого блока отсчетов спектральные компоненты и соответствующие им области маскирования. Входной сигнал анализируется в частотной области, для этого блок отсчетов, взятых во времени, с помощью дискретного преобразования Фурье преобразуется в набор коэффициентов при компонентах частотного спектра сигнала. Разработчики кодеров компрессии имеют значительную свободу в построении модели, точность ее функционирования зависит от требуемой степени сжатия. При невысоком сжатии можно обойтись и без ПАМ, однако на высоких уровнях компрессии она играет важную роль. дБ- длительность маскирующего тона (маскирование "назад маскирование "вперед" 5...50 мс 50...200 мс Рис. 2.10. Эффект временного маскирования 2.2.2. Полосное кодирование и блок фильтров Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров (БФ), который содержит, как правило, 32 полосовых фильтра. Учитывая сказанное ранее о критических полосах и маскировании, хорошо бы иметь в блоке фильтров полосы пропускания, по возможности совпадающие с критическими. Однако практическая реали-
74 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю зация цифрового блока фильтров с неравными полосами сложна и оправданна только в устройствах самого высокого класса. Обычно используется блок фильтров на основе квадратурно-зеркальных фильтров (КЗФ) с равными полосами пропускания, охватывающих с небольшим взаимным перекрытием всю полосу слышимых частот (рис. 2.11). Полоса пропускания фильтра равна я/32Т и центральные частоты полос равны (2к + 1)я 164Г, где Т — период дискретизации, к = 0, 1, 31. При частоте дискретизации 48 кГц полоса пропускания секции фильтра составляет 750 Гц. Каждая секция фильтра позволяет проводить расщепление полосы пропускания на две равные части, не увеличивая при этом объем данных в каждой половине полосы, т.е. с одновремен- 0,05- ДБ^ ] -1 J p^t^\ 1 ' /WWl тт ЛЛГ*П /vvv\ 1 1 -тсгто- /VVV\ 1 /VW\ /vw\ 1 1 /VVVA /vyv\ —pr\—► Рис. 2.11. Нормированная АЧХ блока фильтров 0.1/4 f 0...1/2f 0...f X Я КЗФ * КЗФ Т 1/4f...1/2f X КЗФ Я КЗФ 1Z 1/2f...3/4f 1/2f...f X Я КЗФ Я КЗФ 3/4f....f Я КЗФ ->0...1/8 f -> 1/8f...1/4f -> 1/4f...3/8f ной понижающей дискретизацией. Расщепление на N = 2т полос производится каскадным включением m секций, содержащих соответственно 1, 2, 4...2m~l фильтров (рис. 2.12) [2.5]. На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее в каждой полосе с помощью ПАМ анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть переквантована на меньшее число битов. Поскольку в реальных звуковых сигналах максимальная энергия обычно сосредоточена в нескольких частотных полосах, может оказаться, что сигналы в других полосах не содержат различимых звуков и могут вообще не передаваться. Наличие, например, сильного сигнала в одной полосе означает, что несколько вышележащих полос будут маскироваться и могут кодироваться меньшим числом битов. Для сохранения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. Эта операция сродни аналоговому компандирова- -> 3/8f...1/2f "> 1/2f...5/8f -> 5/8f...3/4f -> 3/4f...7/8f -> 7/8f...f Рис. 2.12. Трехсекционный квадратурно-зеркальный фильтр
Глава 2. Сжатие цифровых сигналов 75 нию. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами. 2.2.3. Квантование и распределение битов Все вышеописанные операции не сокращали заметно объем данных, они были как бы подготовительным этапом к собственно сжатию звукоданных. Как и при компрессии цифровых видеосигналов, основное сжатие происходит в квантователе. Исходя из принятых ПАМ решений о переквантовании отсчетов в отдельных частотных полосах, квантователь изменяет шаг квантования таким образом, чтобы приблизить шум квантования в данной полосе к вычисленному порогу маскирования. При этом на отсчет может понадобиться вместо 16...20 всего 4 или 5 битов! Принятие решения о передаваемых компонентах сигнала в каждой частотной полосе происходит независимо от других, и требуется некий «диспетчер», который вьщелил бы каждому из 32 полосных сигналов часть из общего ресурса битов, соответствующую значимости этого сигнала в общем ансамбле. Роль такого диспетчера выполняет устройство динамического распределения битов. Возможны три стратегии распределения битов. В системе с прямой адаптацией кодер производит все расчеты и посылает результаты декодеру. Преимущество данного способа в том, что алгоритм распределения битов может обновляться и изменяться, не затрагивая работы декодера. Однако для пересылки дополнительных данных декодеру расходуется заметная часть общего запаса битов. Система с обратной адаптацией осуществляет одинаковые расчеты и в кодере, и в декодере, поэтому нет необходимости пересылать декодеру дополнительные данные. Анализирующий БФ —э Распределение битов Квантователь } \ —> Мультиплексор j \ распределение битов канал а) распределение битов Демульти- плексор Восстановление сигнала Tf. квантованные Синтезирующий БФ Анализирующий БФ Распределение битов ZE Кодирование огибающей Квантователь —*1*— Мультиплексор Ъ— канал И (б) J Демульти "А плексор N / Декодирование [ огибающей _ —ь —) Восстановление сигнала j < Распределение битов н Синтезирующий БФ Рис. 2.13. Обобщенная структурная схема звукового кодера и декодера: а) с прямой адаптацией; б) с обратной адаптацией
76 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Однако сложность и стоимость декодера значительно выше, чем в предыдущем варианте, и любое изменение алгоритма требует обновления или переделки декодера. Компромиссная система с прямой и обратной адаптацией разделяет функции расчета распределения битов между кодером и декодером таким образом, что кодер производит наиболее сложные вычисления и посылает декодеру только ключевые параметры, затрачивая на это относительно немного битов, декодер проводит лишь несложные вычисления. В такой системе кодер не может быть существенно изменен, но настройка некоторых параметров допустима. Обобщенная схема звукового кодера и декодера, выполняющих цифровое сжатие согласно описанному алгоритму с прямой адаптацией, приведена на рис. 2.13а. Сигналы на выходе частотных полос объединяются в единый цифровой поток с помощью мультиплексора. В декодере процессы происходят в обратном порядке. Сигнал демультиплексируется, делением на масштабирующий множитель восстанавливаются исходные значения цифровых отсчетов в частотных полосах и поступают на объединяющий блок фильтров, который формирует на выходе поток звукоданных, адекватный входному с точки зрения психофизиологического восприятия звукового сигнала человеческим ухом. Вариант схемы с обратной адаптацией показан на рис. 2.136. 2.2.4. Усовершенствованные алгоритмы полосного кодирования В предыдущих разделах описан базовый алгоритм цифрового сжатия звука с использованием многофазного блока фильтров. Он обеспечивает «прозрачный» звуковой канал при скорости потока не менее 384 кбит/с. Стремление к дальнейшему снижению скорости потока вызвало к жизни более сложные, но и более эффективные алгоритмы сжатия цифрового звука. Серьезным недостатком базовой модели принято считать недостаточную разрешающую способность в частотной области. В области низших слышимых частот полоса анализа значительно превышает критическую полосу и точность расчета порога маскирования оказывается недостаточной. Предложено модифицировать БФ таким образом, чтобы наряду с разделением сигнала на частотные полосы и передискретизацией он осуществлял также ДКП групп отсчетов в каждой полосе. Например, при обработке блока из 18 отсчетов эквивалентная полоса анализа оказывается равной примерно 40 Гц. К недостаткам данной схемы относится низкое временное разрешение (как следствие высокого частотного разрешения), не позволяющее использовать алгоритм в кадрах, где имеются быстрые переходы уровня. Кодеры с гибридным БФ снабжаются обычно детектором переходов, который отключает ДКП в моменты быстрых изменений уровня звукового сигнала. Еще один эффективный алгоритм цифрового сжатия звука использует представление сигнала в форме с плавающей запятой, о котором мы упоминали в разд. 1.1.1. Полученный после ДКП набор коэффициентов переводится в экспоненциальную форму и представляется в виде двух наборов - - характеристик и мантисс. Набор характеристик называется спектральной огибающей, он служит входным сигналом для ПАМ и передается по каналу с использованием эффективных методов кодирования. Мантиссы переквантовываются в квантователе с учетом результатов спектрального анализа в ПАМ и также передаются к декодеру в общем цифровом потоке. Более подробно оба алгоритма будут описаны в последующих главах при обсуждении стандартов MPEG-1 (Уровень III) и ATSC.
— 3 СТАНДАРТ ЦИФРОВОГО СЖАТИЯ MPEG-1 3.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Аббревиатура MPEG (произносится «Эм-пег») означает Motion Pictures Experts Group (Группа экспертов по движущимся изображениям). Полное название группы, под которым она выпускает все документы, — ISO/IEC JTCI/SC29/WG11. Эта группа была сформирована в 1988 г. под эгидой Объединенного технического комитета по информационным технологиям Международной организации стандартизации и Международной электротехнической комиссии для выработки международного стандарта цифрового сжатия движущихся изображений и звуковых сигналов до скорости порядка 1,5 Мбит/с с целью записи на CD-ROM с качеством бытового формата VHS. Стандарт MPEG-1 был завершен в 1992 г., принят в 1993 г. и получил в международной классификации индекс ISO/IEC 11172 [3.1]. Как и последующие стандарты этого семейства, MPEG-1 не определяет схему и конструкцию кодера и декодера, он лишь описывает средства, используемые для обработки сигнала, определяет синтаксис (правила построения последовательности символов) совместимого цифрового потока и дает примеры реализации декодера. Состав и построение кодера оставлены на усмотрение разработчика. Это может быть аппаратное или программное устройство любой сложности, дающее на выходе синтаксически правильный цифровой поток и позволяющее получить на выходе эталонного декодера желаемый эффект. Таким образом, не накладывается никаких ограничений на технологию, алгоритмы работы, сложность построения кодера и его будущие усовершенствования. В отношении декодера существует одно жесткое ограничение: он должен декодировать любой цифровой поток, совместимый со стандартом MPEG-1. Стандарт называется «Информационные технологии — Кодирование движущихся изображений и сопровождающего звука для цифровой записи со скоростями до 1,5 Мбит/с» и состоит из 5 частей: 11172-1 «Системы» описывает объединение одного или более потоков видео и звука и синхронизирующих сигналов в единый сигнал, пригодный для цифровой записи или передачи; 11172-2 «Видео» специфицирует кодированное представление сжатых видеопоследовательностей как с 625-, так и с 525-строчным разложением, до скоростей порядка 1,5 Мбит/с;
78 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 11172-3 «Звук» определяет кодированное представление, которое может быть использовано для сжатия последовательностей звукоданных — моно и стерео; 11172-4 «Проверка соответствия» описывает процедуры тестирования цифрового потока и декодера на соответствие требованиям, изложенным в частях 1, 2, 3 стандарта; 11172-5 «Моделирование программного обеспечения» представляет собой не стандарт, а технический отчет и дает примеры реализации программного обеспечения для трех первых частей стандарта. 3.2. АЛГОРИТМ ОБРАБОТКИ ВИДЕОДАННЫХ При разработке стандарта были приняты следующие ограничения, определившие его область применения: - размер изображения по горизонтали < 768 пике; - размер изображения по вертикали < 576 строк; - число макроблоков < 396; - частота кадров < 30 Гц; - развертка прогрессивная; - скорость цифрового потока < 1,856 Мбит/с. На первый взгляд может показаться, что нет особых препятствий к использованию MPEG-1 для кодирования сигналов вещательного телевидения — число строк и элементов в строке даже выше, чем требуется для изображения стандартной четкости (напомним, что это 720 х 576 или 720 х 480 пикселов, в зависимости от стандарта разложения). Ограничивающим параметром оказывается, как ни странно, число макроблоков в видеокадре. Для обработки ТСЧ изображения надо иметь (720:16) х (576:16) 1620 макроблоков/кадр, а стандарт предусматривает только 396, что соответствует формату разложения не выше CIF (352 х 288 пике). Второе препятствие — отсутствие чересстрочной развертки, принятой сегодня во всех телевизионных системах стандартного качества. В стандарте MPEG-1 используется большая часть современных инструментов цифровой компрессии, рассмотренных в предыдущей главе: предсказание, внутрикадровое и межкадровое кодирование, ДКП, компенсация движения, адаптивное квантование, энтропийное кодирование. Определены три типа видеокадров: l-видеокадры (от intra — внутри) кодируются без какой-либо связи с другими видеокадрами (внутрикадровое кодирование); Р-видеокадры (от predicted — предсказанные) формируются методом предсказания вперед по предыдущим видеокадрам. Первый Р-кадр предсказывается по I-кадру, второй и последующие — по предыдущему Р-кадру; В-видеокадры формируются методом предсказания «вперед» или предсказания «назад» (отсюда bidirectional, т.е. двунаправленный). Польза В-кадров проясняется при рассмотрении задней границы движущегося объекта. При его движении фон открывается все больше, и для передачи этого участка фонового изображения выгоднее воспользоваться данными более позднего кадра (рис. 3.1). Кодер рассчитывает как прямое, так и обратное предсказание и посылает декодеру данные, имеющие наименьший объем. На вход кодера поступает компонентный сигнал «4:2:2» согласно Рекомендации МСЭ-
Глава 3. Стандарт цифрового сжатия MPEG-1 79 доступно из более позднего кадра Рис. 3.1. Предсказание участка изображения из более позднего кадра pfJh Р ВТ.601. Стандартное разрешение 720 х 576(480) пикселов должно быть приведено в соответствие с возможностями MPEG-1, требуется понижающая дискретизация отсчетов яркости и цветности. Так как при разработке стандарта была принята пониженная по сравнению с исходным компонентным сигналом «4:2:2» цветовая четкость, цвето- 81 _8 8_ 8 V 8 \ 8 Y 8 8 Y Рис. 3.3. Состав макроблока сигнала «4:2:0» х х х х О О X X X X X X X X О О X X X X Рис. 3.2. Структура пространственного расположения отсчетов сигнала яркости (X) и цветоразно- стных сигналов (О) в стандарте MPEG-1 разностные сигналы Св и CR должны подвергаться на входе кодера дополнительной субдискретизации по вертикали с коэффициентом 2, приводя к структуре «4:2:0» (рис. 3.2). Разрядность квантования входного сигнала должна быть 8 бит, это еще одно несоответствие с Рекомендацией ВТ.601, которая допускает 8-битовые и 10-битовые слова. При поступлении на вход кодера MPEG-1 10-битового потока он игнорирует два LSB бита, огрубляя отсчеты. Алгоритм работает следующим образом. Видеокадр разбивается на макроблоки размером 16 х 16 отсчетов, каждый из которых содержит по 4 блока отсчетов яркости размером 8x8 пикселов и по одному блоку отсчетов сигналов Св и CR (с учетом понижающей дискретизации) (рис. 3.3). При кодировании макроблока в составе 1-кад- ра вычисляются коэффициенты ДКП, затем они квантуются с использованием таблицы квантования, имеющейся в памяти и кодера, и декодера и применяемой «по умолча- [в 16 19 22 22 26 26 27 16 16 22 22 26 27 27 29 19 22 26 26 27 29 29 35 22 24 27 27 29 32 34 38 26 27 29 29 32 35 38 46 27 29 34 34 35 40 46 56 29 34 34 37 40 48 56 69 34] 37 38 40 48 58 69 83 | Рис. 3.4. Таблица квантования 1-кадров
80 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю нию» (рис. 3.4). Кодер может изменить элементы таблицы, тогда он сообщает об этом декодеру и посылает новые делители. Если кодируется макроблок из состава предсказанного кадра, ищется сопряженный блок из опорного кадра, его значения поэлементно вычитаются из элементов кодируемого блока, и уже для этих разностей вычисляются коэффициенты ДКП и производится их квантование. Таблица квантования для макроблоков из Р- и В-кадров, применяемая по умолчанию, содержит число 16 во всех позициях, но также может быть изменена кодером. Отметим, что при поиске сопряженных блоков используются только отсчеты яркости. Полученные при этом векторы перемещения применяются и при кодировании блоков отсчетов цветоразностных сигналов. Важным звеном алгоритма кодирования остается обеспечение постоянства выходной скорости цифрового потока. Отсчеты сигнала от источника поступают с постоянной скоростью, однако на выходе квантователя скорость поступления битов может варьироваться в широких пределах. Она зависит от типа видеокадра (понятно, что I-кадр требует значительно больше битов, чем Р- и В-кадры), от его содержания («спокойный» кадр с однородными участками требует меньше битов, чем кадр с выраженной мелкозернистой структурой). Попытка кодировать все кадры одинаковым числом битов приведет к изменению качества изображения от кадра к кадру, а это крайне неприятно для телезрителя. Мы уже отмечали в предыдущей главе, что единственным средством выравнивания скорости потока является применение буферной памяти в кодере и декодере. Буфер может заполняться со стороны квантователя неравными порциями, а опустошаться в сторону канала равномерно, обеспечивая постоянную скорость цифрового потока. Но и здесь не все так просто. Быстрая смена сюжетов и связанное с этим увеличение доли I- кадров вскоре приведет к переполнению буфера, а длинный сюжет без движения — к его опустошению. Простое увеличение размера буфера вызовет возрастание задержки сигнала в кодере, что в некоторых случаях мешает телезрителям (беседа двух телеведущих в разных студиях). Для сохранения приемлемого качества изображения при постоянной скорости потока необходимо, во-первых, регулировать шкалу квантования и, во-вторых, адаптивно распределять имеющийся ресурс битов между разными типами кадров с учетом их сложности. Эти задачи решаются в кодере специальным устройством — контроллером битов. Адаптивное управление процессом квантования осуществляется умножением всех элементов матрицы на масштабирующий множитель величиной от 8 до 1/4, общий для всех отсчетов макроблока, который также сообщается декодеру. Величина множителя больше 1 означает увеличение доли битов, выделяемой данному макроблоку или кадру, меньше 1 — соответствующее уменьшение. Перераспределение ресурса между I-, Р- и В-кадрами производится кодером на основе оценки соотношения битов в предыдущих кадрах. Некоторые кодеры осуществляют кодирование «в два прохода», оценивая на первом проходе сложность видеокадра, выделяя ему на основе этой оценки определенный ресурс битов и уже на втором проходе кодируя отсчеты с учетом выделенного ресурса. Упрощенная структурная схема кодера MPEG-1, реализующего описанный алгоритм, приведена на рис. 3.5 [3.2]. Незатененными на рисунке оставлены элементы структурной схемы, участвующие в обработке I-кадров, слабым затенением отмечены участки схемы, обрабатывающие Р-кадры, густым затенением — устройства, ответственные за обработку В-кадров. Кодер работает следующим образом. В режиме I-кадров осуще-
Глава 3., Стандарт цифрового сжатия MPEG-1 81 1 Буфер J Мультипле- 2 ксор Кодирование длин серий (RLC) Кодер с переменной длиной кода (VLC) 1 • а. ■§. ф ■ф- g О. Ф >* -9- 5. •жж 2 о ф Ш а. * ф >х ■е- 5 с£ со I О ш Q. 5 а 1 (О § S z а к (О X X I С > ю со о S QL Переупорядочивание кадров
82 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю —Н Демульти -плексор Декодер с 3| переменной длиной кода Восстановление коэффициентов Обратное ДКП Коэффициенты постоянной —Я Сумматор составляющей Векторы перемещения м Предсказание движения Переупорядочение кадров Ь> Хранение опорного кадра Рис. 3,6. Обобщенная схема декодера MPEG-1 ствляется только пространственное кодирование. Коэффициенты ДКП квантуются с переменной длиной шага, зависящей от состояния буфера, кодируются кодом Хаффмана и направляются в буфер, откуда считываются с постоянной скоростью. В режиме с предсказанием вперед дискретно-косинусному преобразованию подвергается не весь текущий кадр, а только разность между ним и предыдущим, опорным кадром, для чего в кодере восстанавливается опорный кадр путем выполнения операций, обратных кодированию восстановления отсчетов, обратного ДКП и восстановления движения по векторам перемещения, т.е. тех же операций, которые осуществляются для этой цели в декодере. В режиме двунаправленного предсказания формируются одновременно два опорных кадра предыдущий и будущий, для чего используются две независимые схемы формирования. Кодер сравнивает предсказанные кадры с текущим, кодирует разности и решает, какое из предсказаний требует меньше битов и будет послано декодеру. Алгоритм декодирования понятен из обобщенной схемы декодера, показанной на рис. 3.6. 3.3. СТРУКТУРА ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ Видеопоследовательностью в стандарте MPEG-1 называется любая последовательность видеокадров произвольной длины. В заголовке видеопоследовательности передается информация о скорости цифрового потока, разрешающей способности изображения, формате цветности, формате кадра, частоте кадров и т.п. Видеопоследовательность подразделяется на группы видеокадров (ГВК), содержащие один I-кадр и, возможно, несколько Р- и В- кадров. Расстояние между ближайшими Р-кадрами обычно обозначается через М, общее число кадров в группе — N, группа записывается как (М, N). Типичная длина ГВК от 6 до 20 видеокадров, для вещания обычно используется М = 3, N = 12. ГВК всегда начинается с I-кадра, и все предсказанные видеокадры внутри группы опираются, как правило, на кадры внутри этой же группы. Последовательность передачи кадров ГВК должна отличаться от последовательности кадров в самой ГВК, как показано на рис. 3.7, чтобы декодер на приеме мог восстановить предсказанные кадры. Начало ГВК явля- рис. з.7. Переупорядочение видеокадров ется удобной точкой входа в видеопоследова- в ГВК при передаче 1 ч В 1^ 1 Р В Щ в р \ в в 1^ р в к* в р \ в
Глава 3. Стандарт цифрового сжатия MPEG-1 83 Матрица квантования Формат кадра JL Видеопоследовательность т Размер изображения Я ГВК Глобальные векторы Синхро- I.P.B перемещения иизация L JL [TH1HIHEI Э| Видеокадр Привязка по времени Векторы перемещения 1 * Слайс i Макроблок Блок коэффициентов □ Рис. 3.8. Структура видеопоследовательности MPEG-1 тельность для ее записи, разрезания или «бесшовного» соединения с другой последовательностью. Удобно начинать новую ГВК в момент смены сцены, когда имеющаяся в кодере информация о предыдущих видеокадрах утрачивает ценность и нужно формировать новый 1-кадр. Следующей по рангу структурной единицей видеопоследовательности является видеокадр. Мы уже достаточно подробно обсуждали типы кадров, отметим лишь, что заголовок видеокадра содержит информацию о его типе и структуре, «глобальных» векторах перемещения. Видеокадры делятся на слайсы (дословно — дольки, ломтики), так называется группа последовательных макроблоков в видеокадре, объединяемых общей шкалой квантования. Слайс представляет собой минимальную единицу видеопоследовательности в борьбе с ошибками. Если декодер обнаруживает ошибку, он игнорирует данный слайс и сдвигается к началу следующего. Чем больше слайсов в видеокадре, тем эффективнее борьба с ошибками (но ниже степень компрессии). Наконец, макроблок и блок — низовые структуры иерархии, отвечающие за кодирование и компенсацию движения. Эти процессы мы уже подробно рассмотрели выше. На рис. 3.8 показана структура видеопоследовательности MPEG-1. Еще более наглядное представление о потоке видеоданных можно получить из рассмотрения рис. 3.9, где показана иерархия элементов потока и последовательность их вложения в поток. Передаваемые в заголовках данные имеют следующий смысл: видеопоследовательность параметры видео — ширина, высота кадра в пикселах, формат кадра, частота кадров; параметры потока — скорость, размер буфера, флаг ограничения параметров; группа видеокадров временной код — временная метка по стандарту SMPTE (часы, минуты, секунды); параметры ГВК — структура ГВК, открытая или закрытая ГВК; видеокадр тип I-, Р- или В-видеокадр: параметры буфера — требуемое заполнение буфера перед началом декодирования; параметры кодирования — используются ли векторы перемещения с точностью 0,5 пиксела;
84 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю слайс вертикальное положение — с какой строки начинается данный слайс; шкала квантования — какая шкала используется в данном слайсе; макроблок адрес — число макроблоков, которое следует пропустить; тип — используется ли вектор перемещения, какого типа; шкала квантования — какая шкала используется в данном макроблоке; шаблон кодируемого блока — битовая карта, показывающая местоположение кодируемого блока. Видеопоследовательность | Видеопоследовательность Видеопоследовательность Адрес Тип Вектор перемещения Шкала квантования Характеристика кодирования блока Во В1 В5 Рис. 3.9. Иерархия структуры потока видеоданных
Глава 3. Стандарт цифрового сжатия MPEG-1 85 3.4. УРОВНИ ОБРАБОТКИ ЗВУКОДАННЫХ Сжатие звукоданных в стандарте MPEG-1 базируется на принципах полосного кодирования, рассмотренных нами во второй главе, и отличается от сжатия видеоданных: отсутствуют аналоги I-, Р- и В-кадров, не используется двунаправленное кодирование, звуковые кадры всегда передаются в своей естественной последовательности, кадр содержит одинаковое количество данных. В зависимости от используемого алгоритма определены три Уровня (Layer) обработки, обозначаемых латинскими цифрами I, II, III и различающихся сложностью декодера и особенно кодера и степенью сжатия. Важнейшим свойством MPEG-1 является полная обратная совместимость всех трех уровней. Это означает, что каждый декодер может декодировать сигналы не только своего, но и нижележащих уровней. В основу алгоритма Уровня I положен разработанный компанией Philips для записи на компакт-кассеты формат DCC (Digital Compact Cassette). Кодирование первого уровня применяется там, где не очень важна степень компрессии и решающими факторами являются сложность и стоимость кодера и декодера. Кодер Уровня I обеспечивает высококачественный звук при скорости цифрового потока 384 кбит/с на стереопрограмму. Уровень II требует более сложного кодера и несколько более сложного декодера, но обеспечивает лучшее сжатие — «прозрачность» канала достигается уже при скорости 256 кбит/с. Он допускает до 8 кодирований/ декодирований без заметного ухудшения качества звука. В основу алгоритма положен популярный в Европе формат Musicam, разработанный компаниями Philips, CCETT и Мюнхенским институтом радиотехники для звукового вещания. Самый сложный Уровень III включает все основные инструменты сжатия: полосное кодирование, дополнительное ДКП, энтропийное кодирование, усовершенствованную ПАМ и т.п. Ценой усложнения кодера и декодера он обеспечивает высокую степень компрессии — считается, что «прозрачный» канал формируется на скорости 128 кбит/с, хотя высококачественная передача возможна и на более низких скоростях. В стандарте рекомендованы две психоакустические модели: более простая Модель 1 и более сложная, но и более высококачественная Модель 2. Они отличаются размерами оконных функций и алгоритмом обработки отсчетов. Обе модели могут использоваться для всех трех уровней, но Модель 2 имеет специальную модификацию для Уровня III. MPEG-1 оказался первым международным стандартом цифрового сжатия звуковых сигналов и это обусловило его широкое применение во многих областях: вещании, звукозаписи, связи и мультимедийных приложениях. Принятые ранее МСЭ Рекомендации G.721, G.722, G.723, G.728, G.729 касаются обработки речевых сигналов на низких скоростях (от 6 до 64 кбит/с) и не могут эффективно применяться для кодирования других источников звука. Наиболее широко используется Уровень II, он вошел составной частью в европейские стандарты спутникового, кабельного и эфирного цифрового ТВ вещания (об этом мы расскажем в главе 6), в стандарты звукового вещания, записи на DVD, Рекомендации МСЭ BS.1115 [3.3] и J.52. Уровень III (его еще называют МР-3) нашел широкое применение в цифровых сетях с интегральным обслуживанием (ISDN) и в сети Интернет, подавляющее большинство музыкальных файлов в сети записаны именно в этом стандарте. MPEG-1 нормирует для всех трех уровней следующие номиналы скоростей цифрового потока: 32, 48, 56, 64, 96, 112, 192, 256, 384 и 448 кбит/с. Частота дискретизации может составлять 32, 44,1 или 48 кГц, число уровней квантования входного сигнала — от 16 до 24. Стандартным входным сигналом для
86 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю кодера MPEG-1 принят цифровой сигнал AES/EBU. Предусматриваются следующие режимы работы звукового кодера: 1) одиночный канал (моно); 2) двойной канал (стерео или два моноканала); 3) joint stereo (сигнал с частичным разделением правого и левого каналов). Табл. 3.1. Относительная сложность MPEG кодера и декодера звука разных уровней Уровень I II III Сложность кодер 1.5...3 2...4 >7,5 декодер 1 1,25 2,5 Сжатие 4:1 6:1 12:1 Задержка, мс 19 35 59 Оценка относительной сложности кодера и декодера, коэффициента компрессии и минимальной временной задержки для различных уровней приведена в табл. 3.1. Заметим, что реальная задержка сигнала в кодере примерно втрое выше указанной. 3.5. АЛГОРИТМЫ СЖАТИЯ ЗВУКОДАННЫХ КОДЕРАМИ ПЕРВОГО И ВТОРОГО УРОВНЕЙ Рассмотрим более подробно работу кодера первого уровня (рис. 3.10). БФ обрабатывает одновременно 384 отсчета звукоданных и распределяет их с соответствующей субдискретизацией в 32 полосы, по 12 отсчетов в каждой полосе с частотой дискретизации 48/32 = 1,5 кГц. Длительность кадра при частоте дискретизации 48 кГц составляет 8 мс. Упрощенная ПАМ оценивает только частотное маскирование по наличию и «мгновенному» уровню компонентов сигнала в каждой полосе. По результатам оценки для каждой полосы назначается как можно более грубое квантование, но так, чтобы шум квантования не превышал порога маскирования. Масштабирующие множители имеют разрядность 6 бит и перекрывают динамический диапазон 120 дБ с шагом 2 дБ (26= 64 « 120/2). В цифровом потоке передаются также 32 кода распределения битов. Они имеют разрядность 4 бита и указывают на длину кодового слова отсчета в данной полосе после переквантования. В декодере (рис. 3.11) отсчеты каждой частотной полосы выделяются демультиплек- сором и поступают на перемножитель, который восстанавливает их первоначальный динамический диапазон. Перед этим восстанавливается исходная разрядность отсчетов — отброшенные в квантователе младшие разряды заменяются нулями. Коды распределения битов помогают демультиплексору разделить в последовательном потоке кодовые слова, принадлежащие разным отсчетам и передаваемые кодом с переменной длиной слова. Затем отсчеты всех 32 каналов подаются на синтезирующий БФ, который проводит повышающую дискретизацию и расставляет отсчеты должным образом во времени, восстанавливая исходную форму сигнала.
Глава 3. Стандарт цифрового сжатия MPEG-1 87 32-полосный БФ БПФ j_ 512 точек j I 31 Масштабирующее устройство и квантователь ПАМ Распределение битов и масштабирующих коэффициентов Ч Кодирование дополнительной информации О. О О Ь£ ф с; с s I- л с; >» 2 Рис. 3.10. Структурная схема звукового кодера MPEG-1 первого и второго уровней (пунктиром показан модуль быстрого преобразования Фурье (БПФ), добавляемый на втором уровне) В кодере второго уровня устранены основные недостатки базовой модели полосного кодирования, связанные с несоответствием критических полос слуха и реальных полос БФ, из-за чего в низкочастотных участках диапазона эффект маскирования практически не использовался. Величина кадра увеличена втрое, до 24 мс при дискретизации 48 кГц, одновременно обрабатываются уже 1152 отсчета (3 субкадра по 384 отсчета). В качестве входного сигнала для ПАМ используются не полосные сигналы с выхода БФ, а спектральные коэффициенты, полученные в результате 512-точечного преобразования Фурье входного сигнала кодера. Благодаря увеличению и временной длительности кадра и точности спектрального анализа эффективность работы ПАМ возрастает. На втором уровне применен более сложный алгоритм распределения битов. Полосы с номерами от 0 до 10 обрабатываются с 4-разрядным кодом распределения (выбор любой из 15 шкал квантования), для полос с номерами от И до 22 выбор сокращается до 3 разрядов (выбор одной из 7 шкал), полосы с номерами от 23 до 26 предоставляют выбор одной из 3 шкал (2-битовый код), а полосы с номерами от 27 до 31 (выше 20 кГц) не передаются. Если шкалы квантования, выбранные для всех блоков кадра, оказываются одинаковыми, то номер шкалы передается ■ ■ ■ ■ 31 только один раз. Еще одно существенное _ отличие алгоритма второго уровня в том, что не все масштабирующие множители передаются по каналу связи. Если различие множителей трех последовательных субкадров превышает 2 дБ не более чем в течение 10% времени, рис> з.11. Структурная схема звукового декодера MPEG-1 передается только один первого и второго уровней Демульти- плексор Восстанов- ленив отсчетов Инверсный 32-полосный БФ Декодер дополнительной информации
88 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю набор множителей и это дает экономию расходуемых битов. Если в данной полосе происходят быстрые изменения уровня звука, передаются два или все три набора масштабирующих множителей. Соответственно декодер должен запоминать номера выбранных шкал квантования и масштабирующие множители и применять их при необходимости к последующему субкадру. 3.6. АЛГОРИТМ СЖАТИЯ ЗВУКОДАННЫХ КОДЕРАМИ ТРЕТЬЕГО УРОВНЯ Кодер Уровня III использует усовершенствованный алгоритм кодирования с дополнительным ДКП, упомянутый в разд. 2.2.4. Структурная схема кодера показана на рис. 3.12. Основной недостаток кодеров второго уровня — неэффективная обработка быстро изменяющихся переходов и скачков уровня звука — устраняется благодаря введению двух видов блоков ДКП — «длинного» с 18 отсчетами и «короткого» с 6 отсчетами. Рис. 3.12. Структурная схема звукового кодера третьего уровня Выбор режима осуществляется адаптивно путем переключения оконных функций в каждой из 32 частотных полос. Длинные блоки обеспечивают лучшее частотное разрешение сигнала со стандартными характеристиками, в то время как короткие блоки улучшают обработку быстрых переходов. В одном кадре могут быть как длинные, так и короткие блоки, однако общее число коэффициентов ДКП не изменяется, так как вместо одного длинного передаются три коротких блока. Для улучшения кодирования применяются также следующие усовершенствования: 1. Неравномерное квантование (квантователь возводит отсчеты в степень 3/4 перед квантованием для улучшения отношения сигнал-шум; соответственно, декодер возводит их в степень 4/3 для обратной линеаризации). 2. В отличие от кодеров первого и второго уровней, на третьем уровне масштабирующие множители присваиваются не каждой из 32 частотных полос БФ, а полосам масштабирования — участкам спектра, не связанным с этими полосами и примерно соответствующим критическим полосам.
Глава 3. Стандарт цифрового сжатия MPEG-1 89 3. Энтропийное кодирование квантованных коэффициентов кодом Хаффмана. 4. Наличие «резервуара битов» — запаса, который кодер создает в периоды стационарного входного сигнала. Улучшение частотного разрешения при введении дополнительного ДКП влечет за собой значительное ухудшение временного разрешения, проявляющееся в виде пред- эхо. В кодере имеются средства для борьбы с этим явлением. Во-первых, ПАМ модифицирована для обнаружения условий возникновения пред-эхо, во-вторых, имеется резервуар неиспользованных битов, из которого кодер может занять на короткое время необходимые ему биты для снижения шумов квантования, в-третьих, кодер может переключаться в режим коротких блоков. Существенное отличие кодера третьего уровня от кодеров нижних уровней — сложный адаптивный алгоритм распределения битов. Он включает две вложенные одна в другую итерационные петли: внутреннюю — петлю скорости потока, и внешнюю — петлю управления шумами квантования. Расчет параметров кодирования начинается со значения масштабирующего множителя, равного 1. Если в первый момент скорость потока на выходе кодера Хаффмана превышает заданную, увеличивается шаг квантования до тех пор, пока скорость не войдет в заданные пределы. Далее рассчитывается шум квантования в данной частотной полосе и сравнивается с порогом маскирования, сообщенным психоакустической моделью. Масштабирующий множитель изменяется таким образом, чтобы сблизить эти значения. Однако новое значение масштабирующего множителя означает изменение шага квантования и, следовательно, скорости потока, а потому внутренняя петля должна каждый раз отрабатывать и вычислять новое значение коэффициента усиления и шага квантования. Если итерационный процесс во внутренней петле всегда сходится, то во внешней петле он может расходиться. Итерационный процесс заканчивается в одном из трех случаев: 1. Шумы квантования во всех полосах масштабирования не превышают допустимых. 2. Следующая итерация приведет к возрастанию усиления в одной из полос выше допустимого. 3. Следующая итерация требует увеличения усиления во всех полосах масштабирования. В реальных кодерах накладывается еще и временное ограничение. Кодер третьего уровня более полно обрабатывает стереосигнал в формате joint stereo. Если кодеры нижележащих уровней работают только в режиме кодирования по интенсивности, когда левый и правый каналы в полосах выше 2 кГц кодируются как один сигнал (но с независимыми масштабирующими множителями), кодер третьего уровня может работать и в режиме «сумма-разность», обеспечивая более высокую степень сжатия разностного канала. Структура элементарных потоков звукоданных несколько различается для разных уровней. На рис. 3.13 показана последовательность звукоданных Уровня I. Пакет начинается с заголовка длиной 32 бита, имеющего одинаковую структуру для всех уровней, который включает синхрослово из 12 единиц и более десятка указателей и флагов. Флаг ID указывает принадлежность потока («1» — MPEG-1, «О» — MPEG-2), флаг уровня идентифицирует уровень кодирования («01» 1, «10» = 2, «11» = 3), четырехбитовый указатель скорости потока ссылается на стандартизованную таблицу, где перечислены возможные скорости потока, табулированы также значения частоты дискретизации, которые сообщает соответствующий указатель (для MPEG-1 только 48, 44,1 и 32 кГц), флаг режима определяет число каналов звука (не более двух для MPEG-1).
90 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Заголовок CRC Распределение битов Масштабирующие множители Дополнительные данные Синхрослово Флаг ID Уровень Ск°Р°сть Режим \ / потока N /I / 1 2 3 ~32~] 12 битов 12 14 2\ 2 Частота дискретизации Рис. 3.13. Структура потока звукового кодера I и II уровней Резервные биты для кадра 2 Резервные Резервные биты для адра4 Резервные биты для I 5 Рис. 3.14. Структура потока звукового кодера III уровня Следующее поле после заголовка занимают коды распределения битов, затем в потоке передаются 32 масштабирующих множителя и 384 отсчета звукового кадра, группами по 32 отсчета (по одному отсчету из каждого поддиапазона). Замыкает пакет поле дополнительных данных переменной длины, используемое в стандарте MPEG-2 для передачи многоканальных сигналов, отсчетов с пониженной частотой дискретизации и других данных, не совместимых с синтаксисом MPEG-1 (см. главу 4). Отличие формата Уровня II от Уровня I незначительно и заключается в передаче дополнительной информации о выборе шкалы квантования для каждой из 32 полос, так как не все масштабирующие множители могут передаваться в потоке. Более сложная структура пакета у кодера третьего уровня. Здесь для каждого звукового кадра передаются заголовок, дополнительная информация и основные данные, причем неиспользованная часть области основных данных предшествующих кадров (резервуар битов) может быть заимствована последующим кадром, испытывающим нехватку битов (рис. 3.14).
Глава 3. Стандарт цифрового сжатия MPEG-1 91 3.7. ФОРМИРОВАНИЕ ЦИФРОВЫХ ПОТОКОВ ВИДЕО И ЗВУКА Цифровой сигнал непосредственно с выхода кодера MPEG-1 называется «сырым» (необработанным) элементарным потоком (ЭП) и представляет собой бесконечную последовательность видео- или звукоданных в том порядке, как они появляются на выходе в процессе кодирования. Он не содержит необходимой информации для идентификации потока, для его синхронизации с другими потоками и не может непосредственно использоваться для организации вещания или других служб. Для дальнейшего использования элементарные потоки переформировывают в пакетированные элементарные потоки (ПЭП), в которых данные разделены на пакеты удобного размера с заголовками, содержащими необходимую информацию о потоках и синхронизации. В зависимости от приложений длина пакета ПЭП может составлять от единиц до 64 килобайт. Обычно пакет содержит одну единицу воспроизведения данных определенного типа. Единица воспроизведения видеопотока один видеокадр, звукопотока один звуковой кадр AES/EBU. Заголовок (рис. 3.15) начинается со стартового кода длиной 3 байта и однобайтового идентификатора потока, показывающего вид информации (видео, аудио, вспомогательные данные) и параметры кодирования. Следующие 2 байта — это указатель длины пакета, он показывает число байтов в пакете. Далее следуют 12 флагов, несущих сведения о свойствах цифрового потока. Они сообщают информацию о скремблировании, о приоритете пакета, условия авторского права, тип временной метки (присутствует ли только PTS или PTS и DTS), наличие или отсутствие определенных полей (поля скорости потока, режима DSM, информации о дополнительных копиях, полей расширения и др.). Опционные поля входят в состав заголовка, если соответствующие флаги установлены на «1». Поле режима DSM (цифровой видеозаписи) содержит биты, управляющие движением ленты (перемотка, стоп-кадр, замедленное воспроизведение) и другими видеоэффектами; информация о дополнительных копиях необходима для решения вопросов авторского права. Поле длины заголовка указывает размер заголовка в байтах. 2 байта Флаги заголовка 14 битов PTS DTS Скорость потока Режим DSM Информация о дополнительных копиях CRC Поля расширения 33 бита 33 бита 22 бита 1 байт 2 байта Рис. 3.15. Структура пакета ПЭП Переменная длина
92 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 90 кГц Счетчик SCR Видео- кодер ЭП J Мультиплек L. сор ЭП Системный поток Демульти- плексор Компаратор К декодеру MPEG Временные метки 27 МГц ФНЧ Счетчик г АПЧ иФ 27 МГц И Рис. 3.17. Восстановление тактовой частоты в приемнике MPEG-1 по меткам SCR При двунаправленном кодировании, как отмечалось, порядок следования и порядок передачи Р- и В-кадров не совпадают, и для синхронизации используются два вида временных меток. Временная метка декодирования (DTS Decoding Time Stamps) указывает время, когда видеокадр должен быть декодирован, а временная метка воспроизведения (PTS — Presentation Time Stamps) момент времени, когда он должен появиться на выходе декодера. Если, например, принимается последовательность IPBB, декодер декодирует I-кадр и запоминает его, в следующий момент он декодирует Р-кадр и выдает на выход I-кадр, затем вычисляет и выдает кадр В,, затем В2 и только после этого Pt (рис. 3.16). Временные метки PTS и DTS формируются по тому же принципу, что и описанная далее ссылка на системные часы (SCR). Для формирования ТВ программы полученные ПЭП видео, звука и вспомогательных данных необходимо объединить в единый цифровой поток. В системной части стандарта MPEG-1 для этого предусмотрена одна возможность — системный поток. Он представляет собой сборку ПЭП, относящихся к одной программе и объединенных общей тактовой синхронизацией. Это могут быть видеопрограмма с несколькими звуковыми каналами или пакет звуковых программ. Такой поток состоит из пакетов переменной длины, имеет изменяющуюся во времени скорость, не содержит средств защиты от ошибок и предназначен для использования в средах с малой вероятностью ошибки, например, для записи на DVD и CD-ROM диски, где переменная скорость не вызывает технических трудностей. Привязка сборки ПЭП к определенному моменту времени осуществляется периодическим помещением в заголовок ссылок на системные часы (SCR — System Clock Reference) — 33-битового числа, отсчитывающего периоды опорной частоты 90 кГц. Число периодов частоты 90 кГц подсчи- тывается многоразрядным счетчиком И ВВОДИТСЯ В заголовок ПО- Воспроизведение тока. Нетрудно подсчитать, что ^ л ^ „ J Рис. 3.16. Восстановление порядка следования видеокад- полный цикл счетчика заверит- ров п0 меткам DTS И pTS Декодирование I N Pi , У I Bi Bi "> В2 В2 \> Pi р2 / Вз Вз *> В4 В4 ^ р2 1
Глава 3. Стандарт цифрового сжатия MPEG-1 93 ется за 26 с небольшим часов. Основная задача, решаемая системными часами, — обеспечение синхронизации тактовых частот кодера и декодера. Она решается с помощью схемы дискретной автоподстройки частоты в декодере (рис. 3.17). Частота местного генератора подсчитывается с помощью многоразрядного счетчика и периодически сравнивается с приходящими от кодера значениями SCR. Выходной сигнал компаратора, пропорциональный разности двух чисел, управляет через ФНЧ частотой генератора и корректирует ее в соответствии со знаком разности. На передающей стороне точность поддержания частоты должна быть не хуже 3 х 10~5. Привязка к временным меткам позволяет обеспечить одинаковую задержку кодера и декодера для всех составляющих программы при их независимой передаче с разбивкой на пакеты, синхронизировать таким образом элементарные потоки видео и аудио и образовать из них ТВ программу. Декодер может интерполировать временные промежутки между двумя появлениями временной метки, поэтому нет необходимости размещать метку в каждой единице воспроизведения.
= 4 = ФОРМИРОВАНИЕ ЦИФРОВОГО ПОТОКА ПО СТАНДАРТУ MPEG-2 4.1. СОСТАВНЫЕ ЧАСТИ СТАНДАРТА MPEG-2 К 1991 г. основные задачи по разработке стандарта MPEG-1 были решены, однако предлагались все новые и новые технические решения, позволяющие расширить возможности стандарта. В связи с этим было решено «заморозить» работу над MPEG-1 и одновременно начать разработку нового стандарта, MPEG-2, охватывающего более широкий круг применений, включая вещательное телевидение. С самого начала была поставлена задача обеспечить совместимость с MPEG-1, т.е. дать возможность декодеру MPEG-2 принимать цифровой поток MPEG-1. Когда говорят о совместимости двух систем, под совместимостью «вперед» (forward compatibility) понимают способность старой системы воспринимать сигналы новой системы, совместимость «назад», или обратная совместимость (backward compatibility), означает способность новой системы воспринимать сигналы старой. На подготовительном этапе в качестве основы для MPEG- 2 тестировались 39 алгоритмов цифрового сжатия, в том числе и существенно отличные от MPEG-1, но предпочтение было отдано последнему, не в последнюю очередь благодаря удобству достижения совместимости. MPEG-2 был принят как международный стандарт под номером ISO/IEC 13818 в 1996 г. и дополнен в 1997 г. [4.1]. Коротко его можно охарактеризовать как MPEG-1 со значительными улучшениями, включающими обработку чересстрочных изображений, набор уровней и профилей, масштабируемый синтаксис, системный уровень с программным и транспортным потоками, новые средства кодирования звука и ряд других. На самом деле MPEG-2 значительно сложнее своего предшественника. Достаточно сказать, что при равной скорости потока кодер MPEG-2 примерно на 50% сложнее кодера MPEG-1. Успех MPEG-2 в значительной мере определил и прекращение работ над стандартом MPEG-3, предназначавшимся для систем ТВЧ. Оказалось, что синтаксис MPEG-2 пригоден для высоких разрешений, больших скоростей и полных компонентных сигналов без прореживания, а потому может использоваться и для ТВЧ. Стандарт MPEG-2 называется «Информационные технологии — Обобщенное кодирование движущихся изображений и сопровождающей звуковой информации» и содержит 9 частей, описывающих различные компоненты цифрового потока и средства поддержки.
96 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 13818-1 «Системы» описывает объединение одного или нескольких ЭП видео, звука и других данных в одно- или многопрограммный поток, пригодный для записи или передачи. 13818-2 «Видео» специфицирует средства компрессии видеоданных и процесс декодирования, необходимый для восстановления изображения. 13818-3 «Звук» представляет обратно совместимое расширение звукового стандарта MPEG-1. 13818-4 «Соответствие» и 13818-5 «Моделирование программного обеспечения» описывают процедуры испытаний на соответствие требованиям частей 1, 2, 3 и дают примеры реализации программного обеспечения. 13818-6 «DSM-CC» стандартизует набор протоколов по управлению цифровыми потоками MPEG-1 и MPEG-2. 13818-7 «ААС» специфицирует алгоритм кодирования многоканального звука ААС, не совместимый с MPEG-1. 13818-9 «Интерфейс реального времени для декодеров» описывает интерфейс реального времени для декодеров транспортного потока. 13818-10 «Соответствие для DSM-CC» рассматривает вопросы соответствия в применении к протоколу DSM-CC. Часть 8 предназначалась для кодирования видео с разрешением 10 бит, но не вызвала практического интереса и была исключена. 4.2. СЖАТИЕ ВИДЕОДАННЫХ 4.2.1. Особенности алгоритма обработки видеоданных Наиболее существенное отличие алгоритма обработки видео в MPEG-2 от соответствующего алгоритма MPEG-1 — возможность обработки чересстрочных изображений. В MPEG-1 для кодирования таких изображений приходилось предварительно объединять два поля в один кадр и только после этого подавать сигнал на вход кодера. Однако при наличии движения эта процедура приводила к заметным искажениям. В MPEG-2 введена концепция полевого и кадрового кодирования. При полевом кодировании два поля одного кадра называются верхним и нижним и могут кодироваться раздельно как самостоятельные изображения, в этом случае каждое поле разбивается на непересекающиеся макроблоки 16 х 16 пике, и к ним применяется ДКП. На изображении эти макроблоки занимают область высотой 32 строки. Кадровое кодирование предполагает построчное объединение двух полей в один кадр и обработку его как обычного изображения с прогрессивным разложением. MPEG-2 определяет два типа ДКП для макроблоков: кадровое и полевое. Кадровое ДКП действует аналогично MPEG-1: блок отсчетов яркости 16 х 16 пике, разбивается на 4 блока 8x8 пике, в соответствии с их расположением. Полевое ДКП берет 8 строк из верхнего поля для верхних двух блоков и 8 строк из нижнего поля для нижних блоков, образуя верхнее и нижнее поля макроблока, как показано на рис. 4.1; цветораз- ностные блоки предполагаются принадлежащими всегда к верхнему полю. Полевое
Глава 4. Формирование цифрового потока по стандарту MPEG-2 97 X о X о X о X [о X о X о X о X о X о X о X о X Oj X о X о X о X о X о X о X о X о X о X о X о X О X о X о X о X о X о X о X о X о N ) \ \ \1 / Л \ \ X / / X р< X X ,х X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X х| X X X X X X х ю X о X о X о [х о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X о X / А X X \> / / X \ \> / / /\ \ V / / \ V о 'О о 'О о 'О о 'О о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о] о о о о О о о Рис. 4.1. Формирование полей макроблока при полевом ДКП ДКП более эффективно при существенном различии между полями, например, при наличии движения по вертикали. Кадровое ДКП позволяет лучше передать мелкие детали изображения. Заметим, что оба вида преобразования могут использоваться в одной видеопоследовательности. Кадры, кодируемые как два поля, всегда используют полевое ДКП, кадровое кодирование может использовать оба вида ДКП, переходя от одного к другому на уровне макроблока. Обработка чересстрочных изображений вносит существенные отличия и в процесс предсказания. Кадровое предсказание, как и в MPEG-1, оценивает наилучшее сопряжение макроблоков 16 х 16 пике, в текущем и опорном кадрах. Полевое предсказание ищет сопряжение для блока 16 х 16 пике, взятого из текущего поля, в двух предыдущих полях и выбирает лучший результат. Как и при ДКП, полевое кодирование может использовать только полевое предсказание, у кадрового кодирования возможности шире — допускается применение кадрового предсказания или полевого, в последнем случае ищется сопряжение отдельно верхнего и нижнего полей макроблока в каждом из двух полей опорного кадра и выбирается лучший результат. Более высокую точность компенсации движения обеспечивает разбиение макроблока на два поля. При этом определяются два вектора перемещения для верхнего и нижнего полей макроблока размерностью 16 х 8 пике, и передаются декодеру, который использует их для более точного восстановления изображения. MPEG-2 ввел новый режим компенсации движения для эффективного устранения временной избыточности между полями, названный «Двухступенчатая компенсация с уточнением векторов» (Dual prime motion compensation). В данном режиме ищутся вектор перемещения для области изображения 16 х 8 пике, из одного поля и дополнительный вектор приращения (принимающий значения минус 1, 0, 1 по осям х и у) для той же области, но в поле другой четности. В декодере вектор приращения используется для уточнения отсчетов предсказанного блока. MPEG-2 допускает значительную гибкость и в i Рис. 4.2. Альтернативное сканирование коэффициентов ДКП при чересстрочном разложении
98 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю X О X X О X X X X X X О X X О X X X X X X О X X О X формировании I-, Р-, В-кадров. Кодированный 1-ви- деокадр может состоять из I-кадра с прогрессивным разложением, или пары I-полей, или I-поля и предсказанного из него Р-поля. Аналогично Р-видеокадр может содержать Р-кадр, или два Р-поля, В-видео- кадр — В-кадр или пару В-полей. Для обработки чересстрочных изображений MPEG- 2 предлагает альтернативный вариант сканирования коэффициентов ДКП, оптимизированный с точки зрения кодирования длин серий (рис. 4.2). Отметим еще несколько отличий в кодировании Рис. 4.3. Расположение отсчетов видеоданных. компонентного сигнала в поле кад- 1. MPEG-2 в большинстве случаев использует в ра в стандарте MPEG-2 (х - сиг- J нал яркости; о — сигнал цветнос- качестве сигнала источника компонентный сигнал «4:2:0», но расположение отсчетов в поле изображения несколько отличается от MPEG-1 (рис. 4.3, ср. с рис. 1.22). 2. В MPEG-2 длина слайса не может быть более одной строки (напомним, что в MPEG-1 длина слайса не ограничивалась). 3. MPEG-1 допускает квантование постоянной составляющей ДКП только с разрядностью 8 бит, в MPEG-2 в некоторых случаях допускается 9- или 10-битовое квантование. 4. Для предотвращения потери макроблоков, кодированных с внутрикадровым предсказанием, применяется маскирование — подстановка вместо утерянного макроблока ближайшего, схожего по параметрам. Для этого в потоке передается управляющий код «пропущенного макроблока». 5. Предусмотрена передача информации режима панорамирования (pan&scan), указывающей декодеру, какую часть изображения форматом 16:9 отображать на экране с форматом 4:3. Информация посылается каждый кадр и позволяет смещать изображение с точностью до 1/16 пике. 4.2.2. Уровни и профили стандарта MPEG-2 MPEG-2 охватывает весьма широкий диапазон сложности кодирования и качества изображения — от простых I-кадров до сложных ГВК, от низкого разрешения до ТВЧ. В процессе разработки стало ясно, что построить декодер, удовлетворяющий одновременно всем требованиям стандарта, возможно, но неэкономично, так как он окажется весьма сложным и дорогим и в то же время будет обладать большой избыточностью по отношению к более простым приложениям. Разработчики стандарта разделили все средства и инструменты обработки видеосигналов на несколько Профилей (Profile), поддерживающих обратную совместимость и различающихся использованием тех или иных элементов синтаксиса. Как правило, каждый Профиль добавляет один или несколько инструментов к имеющимся у нижележащего Профиля. На сегодняшний день в стандарте приняты пять основных и один дополнительный, профессиональный Профиль «4:2:2», введенный позднее. Внутри каждого Профиля выделены Уровни (Level), определяющие допустимые пределы изменения основных параметров цифрового потока. Таких Уровней четыре, и в табл. 4.1 приведены установленные для них пределы скорости потока и разрешающей способности. Уровень «Высокий-1440» был введен для планировавшейся европейской системы с разложением 1440 х 1152 пике, и
Глава 4. Формирование цифрового потока по стандарту MPEG-2 99 Табл. 4.1 Пределы изменения параметров цифрового потока для различных уровней Основного профиля MPEG-2 Уровень Высокий MP@HL Высокий МР@Н1440 Основной MP@ML Низкий MP@LL Параметр Число отсчетов на строку Число строк на кадр Частота кадров, Гц Частота отсчетов сигнала яркости, отсч/с Скорость потока, Мбит/с Размер буфера, бит Число отсчетов на строку Число строк на кадр Частота кадров, Гц Частота отсчетов сигнала яркости, отсч/с Скорость потока, Мбит/с Размер буфера, бит Число отсчетов на строку Число строк на кадр Частота кадров, Гц Частота отсчетов сигнала яркости, отсч/с Скорость потока, Мбит/с Размер буфера, бит Число отсчетов на строку Число строк на кадр Частота кадров, Гц Частота отсчетов сигнала яркости, отсч/с Скорость потока, Мбит/с Размер буфера, бит Ограничение 1920 1152 60 | 62668800 80 9781248 1440 1152 60 47001600 60 7340032 720 576 30 10368000 15 1835008 352 288 30 3041280 4 475136 форматом кадра 4:3. Отметим, что в принятой Рекомендации ВТ.709 по ТВЧ форматам такой формат не предусмотрен. Не все Профили определены при всех Уровнях, допустимые сочетания указаны в табл. 4.2. Затенением в таблице выделен режим «4:2:2P@HL», отсутствующий в стандарте MPEG-2 и предложенный позднее проектом стандарта SMPTE- 308М [4.2] по инициативе вещательных компаний. Этот режим удобно использовать при производстве программ. Он допускает максимальную скорость потока 300 Мбит/с со следующими ограничениями: на скорости от 230 до 300 Мбит/с допускаются только 1-кадры, на скорости от 175 до 230 Мбит/с I-, IP-, IB-кадры, на меньших скоростях ГВК любой конфигурации, не противоречащей стандарту MPEG-2. Декодеры, поддерживающие
100 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 4.2 Уровни и профили стандарта MPEG-2 Уровни Высокий (High) Высокий 1440 (High-1440) Основной (Main) Низкий (low) Профили Типы кадров Дискретизация сигнала цветности Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с Простой (Simple) l,P 4:2:0 720 576 30 15 Основной (Main) I.P.B 4:2:0 1920 1152 60 80 1440 1152 60 60 720 576 30 15 352 288 30 4 Масштабируемый по отношению сигнал-шум (SNR) I, Р. В 4:2:0 720 576 30 15 352 288 30 4 Пространственно масштабируемый (Spatial) I.P.B 4:2:0 1440 1152 60 60 Высокий (High) I, Р,В 4:2:0 или 4:2:2 1920 1152 60 100 1440 1152 60 80 720 576 30 20 Профессиональный 4:2:2 (Professional 4:2:2) I, Р, В 4:2:0 или 4:2:2 1920 1152 60 300 720 576 30 50 Примечание: режим 4:2:2 P@HL введен предлагаемым стандартом SMPTE-308M
Глава 4. Формирование цифрового потока по стандарту MPEG-2 101 Масштабирование вниз Кодер улучшающего слоя а) Масштабирование вверх HI Поток улучшающего слоя Декодер Э| улучшающего слоя Видео —> Масштабирование вверх Кодер базового слоя Поток базового слоя б) з: Декодер базового слоя высокого разрешения Видео > стандартного разрешения Рис. 4.4. Принцип работы масштабирующего кодера: а) кодер; б) декодер определенный Уровень определенного Профиля, должны работать также и при всех более низких Уровнях и Профилях. В англоязычной литературе принято обозначать сочетания профиля и уровня первыми буквами, разделенными знаком @. Например, сочетание «Основной профиль — Основной уровень» записывается как MP@ML (Main Profile@Main Level). Режим MP@ML стал наиболее распространенным и широко употребительным, он обеспечивает полную разрешающую способность 720 х 576 пике, предусмотренную Рекомендацией ВТ.601, и это сочетание признано наиболее подходящим для цифрового вещания. Максимальная скорость потока видеоданных 15 Мбит/с заведомо достаточна для достижения качества изображения, превышающего возможности аналоговых стандартов PAL, SECAM и NTSC. Масштабирование в Основном профиле не применяется. Простой профиль (SP — Simple Profile), не поддерживающий двунаправленное предсказание и В-кадры, предназначался первоначально для массовых применений при обработке компьютерных изображений и в других приложениях, не требующих высокого качества изображения, однако стоимость микросхем, разработанных для Основного профиля, оказалась так низка, что разработка специальных изделий для Простого профиля была признана нецелесообразной. Он применяется лишь в простейших программных MPEG-кодерах. Масштабируемые профили пока широко не используются, хотя в некоторых приложениях для них просматриваются возможные области применения (например, в наземном цифровом вещании; мы будем говорить об этом в главе 6). Масштабируемостью называют способность кодека (кодера и декодера) формировать и обрабатывать упорядоченный набор из нескольких цифровых потоков. Минимально необходимый набор потоков называется базовым слоем, каждый из остальных — улучшающим слоем. Базовый слой передает сигнал пониженного качества с более высоким отношением сигнал- шум, или сигнал с пониженным пространственным разрешением, который может приниматься декодером низкого профиля, а в улучшающих слоях передается дополнительная информация, используя которую, кодеры более высокого профиля восстанавливают улучшенное изображение. Синтаксис MPEG-2 поддерживает до двух слоев масштабирования. Принцип работы масштабирующего кодека показан на рис. 4.4. В ходе разработки было признано нецелесообразным объединять все виды масштабирования в один Профиль, и разработали две схемы — с масштабированием отношения сигнал-шум и с пространственным масштабированием. В схеме, масштабирующей отношение сигнал-шум (SNR (Signal-to-Noise Ratio) Profile), в базовом слое передаются грубо квантованные коэффициенты ДКП. Они передаются с низкой скоростью, что несколько повышает шумы квантования, но улучшает помехоустойчивость. Улучшающий слой кодирует и передает разницу между не- квантованными и грубо квантованными значениями коэффициентов, которую декодер
102 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю SNR профиля использует для уточнения значений коэффициентов. Можно использовать этот подход и для изменения пространственного разложения, если в базовом слое передавать самые нижние М х N (М<8, N< 8) коэффициентов ДКП, а в улучшающем слое - остальные (64 - М х N).- & 4Э4ЫА >** flffftufot Профиль с пространственным масштабированием (Spatial Scalable Profile) был введен в стандарт для обеспечения доступа декодерам стандартной четкости к программам ТВЧ. Привязкой к ТВЧ объясняется довольно большая скорость цифрового потока, предусмотренная в этом Профиле. В базовом слое такой системы передается после прореживания информация, соответствующая стандартному разрешению, а в улучшающем слое дополнительные отсчеты, отфильтрованные в базовом слое. Профиль «Высокий», предусматривающий все инструменты нижних профилей, в настоящее время пока не используется по нескольким причинам, в том числе, по-видимому, из-за отсутствия интегральных микросхем с достаточными ресурсами производительности. Несколько особняком, вне иерархии, стоит профиль «Профессиональный 4:2:2», предназначенный для обеспечения совместимости с цифровым студийным оборудованием видеопроизводства. В этом формате работают, например, перевозимые комплекты цифровых систем сбора новостей, передающие сигнал через спутники для последующей записи и монтажа. Профиль «4:2:2» должен обеспечивать качество изображения, сравнимое с цифровой видеозаписью формата D1, и возможность многократного MPEG кодирования-декодирования сигнала. Его основными свойствами являются структура дискретизации «4:2:2» (в отличие от обычной в MPEG-2 «4:2:0»), увеличенное число строк — 608 в отличие от 576, и возможность работы с повышенными скоростями — до 50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным профилем. Последнее требование связано с более короткими группами видеокадров, используемыми при видеомонтаже. Предложенный недавно Высокий уровень этого профиля позволит расширить область использования MPEG-2 при подготовке ТВЧ программ. Для профессиональных применений очень важна способность оборудования разных производителей работать совместно (по-английски это свойство называется interoperability, в русском языке наиболее близка «совместная работоспособность»). Хотя MPEG-2 должен обеспечивать полную совместимость во всех режимах работы, организация Pro-MPEG Forum, занимающаяся внедрением стандартов MPEG, предложила [4.3] использовать в профессиональных системах для стыков аппаратуры ограниченное число режимов, в которых заведомо должны выполняться все требования к цифровому потоку. В качестве таких режимов выбраны: 1. 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, любая разрешенная структура ГВК. 2. 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, только 1-кадры. За. 4:2:2P@HL, ТВЧ, скорость до 80 Мбит/с, любая разрешенная структура ГВК. 36. 4:2:2P@HL, ТВЧ, скорость до 175 Мбит/с, любая разрешенная структура ГВК. 4. 4:2:2P@HL, ТВЧ, скорость до 300 Мбит/с, только 1-кадры. 4.2.3. Передача киноматериала в каналах с компрессией Еще на заре кинематографии для демонстрации кинофильмов была выбрана частота кадров 24 Гц, и все современные кинофильмы снимаются для демонстрации именно с такой частотой (на самом деле в кинотеатре для уменьшения мерцания каждый кадр проецируется дважды, но это не меняет сути проблемы передачи кинофильма по теле-
Глава 4. Формирование цифрового потока по стандарту MPEG-2 103 видению). Частота кадров в существующих телевизионных системах не равна 24 Гц, и это вызывает определенные технические трудности. В системе 625/50 просто увеличивают скорость движения киноленты, синхронизируя ее с половиной частоты кадровой развертки. Каждый кинокадр при этом передается двумя полями изображения, как и при работе с другими источниками. Так как между полями нет движения, кодер тратит на передачу второго поля очень мало битов. Платой за относительную простоту решения становится сокращение на 4% времени просмотра и изменение на такую же величину высоты воспроизводимых звуков. Сложнее обстоит дело в телевизионной системе 525/59,94, где соотношение между частотой полей и частотой кинокадров не удается представить целым числом. Издавна в этом случае в телевидении применялось так называемое понижение 3:2 (3:2 pulldown), при котором один кинокадр демонстрируется на протяжении трех, а следующий — двух полей ТВ изображения. Ясно, что одно из пяти полей — третье поле в кадре — избыточно, и его можно вообще не передавать. Многие кодеры и декодеры MPEG-2 поддерживают специальный режим передачи киноматериала, при котором кодер передает вместо 30 только 24 кадра в секунду. Декодеру передается сигнал о режиме телекино, он объединяет каждую пару полей в кадр, рассчитывает компенсацию движения между кадрами и записывает кадры в память. Далее декодер восстанавливает поля чересстрочного изображения путем считывания кадров через строку и выдает их на экран, одно — дважды, следующее — трижды, и так далее с интервалом 1/60 с. Этот режим позволяет заметно снизить скорость цифрового потока при передаче киноматериалов. 4.3. РЕАЛИЗАЦИЯ ЦИФРОВОГО МНОГОПРОГРАММНОГО ЗВУКА 4.3.1. MPEG-2 — расширение MPEG-1 в сторону многоканального звука Следствием совместимости MPEG-2 с MPEG-1 в части кодирования звука стало полное использование трехуровневой системы, разработанной в MPEG-1 и подробно рассмотренной нами в главе 3, для обработки звукоданных кодерами стандарта MPEG-2. Различия между стандартами начинаются при переходе от двухканального звука, принятого за основу в MPEG-1, к многоканальному звуку, поддерживаемому в MPEG-2. ^^^ ^^^ ^^^ MPEG-2 специфицирует различные режимы пе- (г*2\ ^з/Л /з/oj редачи многоканального звука, в том числе пятика- ^^ нальный формат, семиканальный звук с двумя дополнительными фронтальными динамиками, применяемыми в кинотеатрах с очень широким экраном, расширения этих форматов с низкочастотным каналом. На рис. 4.5 показаны варианты компоновки многоканального звукового сигнала, принятые в Рис. 4.5. Варианты компоновки много- Рекомендации МСЭ-Р BS.775-1. В числителе дроби канального звукового сигнала по Ре- 1 комендации BS.775 указывается число фронтальных каналов, в знаме- ^^^
104 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю * е- га 2 V-o LFE а) VRo СМ 6 ш QL Б MPEG-2 > R. > LFE Рис. 4.6. Обработка многоканального звукового сигнала в кодере и декодере MPEG-2: а) кодер; б) декодер нателе число каналов, излучаемых сзади. Соответствующее расположение динамиков показано в табл. 4.3. Одной из разновидностей многоканального звука является многоязычное звуковое сопровождение. Оно может осуществляться либо передачей отдельного цифрового потока для каждого языка, либо добавлением нескольких (до 7) языковых каналов 64 кбит/с к многоканальному потоку 384 кбит/с. Возможна передача дополнительных звуковых каналов для людей с ухудшением зрения и слуха (с описанием сцены в первом случае и отдельным каналом диалогов во втором). Как же обеспечивается совместимость этих сложных многокомпонентных сигналов с относительно простым декодером MPEG-1? В кодере MPEG-2 сначала с помощью матрицы формируются комбинированный двухканальный сигнал, совместимый со стереосигналом MPEG-1, и набор вспомогательных сигналов, не совместимых с ним и служащих для восстановления многоканального сигнала в декодере MPEG-2 (рис. 4.6а). При кодировании двухканальный сигнал укладывается в структуру ПЭП звука, совместимого с MPEG-1, и может прочитываться соответствующим декодером. Остальные компоненты после кодирования размещаются в других структурных единицах цифрового потока и доступны только декодеру MPEG-2. Учитывая широкое распространение в мире системы Dolby Pro Logic (продано более 40 млн декодеров) и совместимость ее с обычным стереоканалом, разработчики звукового стандарта MPEG-2 заложили в алгоритм формирование стереосигнала в таком виде, как его формирует указанная система. Владельцы декодера Dolby Pro Logic могут теперь получить многоканальный сигнал двумя способами: либо непосредственно с выхода декодера MPEG-2, либо подав комбинированный стереосигнал (stereo downmix) с выхода более простого декодера MPEG-1 на вход декодера Pro Logic, который выделит из него многоканальный сигнал (рис. 4.66). Соответствующий интерфейс определен в стандарте IEC61937, он основан на линейной передаче звукоданных с ИКМ и скоростью до 1536 кбит/с.
Глава 4. Формирование цифрового потока по стандарту MPEG-2 105 Табл. 4.3 Иерархия многоканальных звуковых систем со гласно Рекомендации BS.775 Система Моно Моно + моно Двухканальная стерео Двухканальная стерео + 1 окружающий Двухканальная стерео + 2 окружающих Трехканальная стерео Трехканальная стерео + 1 окружающий Трехканальная стерео + 2 окружающих Каналы М М L/R L/R/Ms L/R/Ls/Rs L/C/R L/C/R/Ms L/C/R/Ls/Rs Обозначение 1/0 1/1 2/0 2/1 2/2 3/0 3/1 3/2 Расположение динамиков I I w z \M m/v^A, Lp ^ R A/^A A ® A Ls Л. P Rs (Ms) X—^ (MSs) L^^ R A ® A Ls A, A Rt\ (mss) —-^ (Ms) 4.3.2. Кодирование с пониженными частотами дискретизации В дополнение к основному режиму с частотами дискретизации 32, 44,1 и 48 кГц в MPEG-2 введен низкоскоростной режим, так называемый LSR (Low Sampling Rate) с пониженными вдвое частотами дискретизации: 16, 22,05 и 24 кГц. Этот режим применяется для передачи сигналов пониженного качества на очень низких скоростях, например, при вещании по сети Интернет. Оказывается, что на скоростях порядка 64 кбит/с применение половинных частот дискретизации повышает субъективное качество звучания речевого сигнала. Дело в том, что связанное с этим отбрасывание высоких частот почти не влияет на качество речи, а высвобождающиеся ресурсы битов используются кодером для более точной передачи нижней части звукового спектра. Поскольку число частотных полос в любом случае сохраняется равным 32, спектральное разрешение оказывается более высоким. Например, при частоте дискретизации 24 кГц ширина каждой из полос составляет 375 Гц вместо 750 Гц при 48 кГц. Институтом Фраунгофера в Германии предложено дальнейшее понижение частот дискретизации до 8, 11,05, 12 кГц, позволяющее, по утверждению разработчиков, улучшить качество воспроизведения при сверхнизких скоростях цифрового потока. Это расширение пока не вошло в стандарт, но некоторые звуковые кодеры высоких уровней его поддерживают.
Вход ^-? J ч Регулировка усиления » ч / \ БФ < / к \ L 1 1ЛПЛ т4 TNS < У \ Мультиплексор цифрового потока ч4 Связывание /7ч лч Предсказание ? 'г Режим стерео /]ч Квантованный спектр предыдущего кадра Масштабирующие множители * i4 » > , Кванто- I_^ ватель 1 1 * /Тч \1/ т ^ Кодирование без потерь \1/ Управление скоростью и ш /мами квантования Рис. 4.7. Структурная схема звукового кодера ААС (тонкой линией показаны управляющие сигналы, утолщенной — потоки данных)
Глава 4. Формирование цифрового потока по стандарту MPEG-2 107 4.3.3. Система улучшенного кодирования звука ААС Одной из лучших современных систем сжатия звука признана система ААС (Advanced Audio Coding усовершенствованная система кодирования звука), специфицированная в седьмой части стандарта ISO/IEC 13818. В отличие от других методов сжатия звукоданных, принятых в MPEG-2, она не обладает свойством обратной совместимости декодеры MPEG-1 не могут декодировать сигнал ААС. По своей эффективности ААС вдвое превосходит Уровень II и в 1,4 раза Уровень III стандарта MPEG-1. Высококачественное воспроизведение звука достигается уже при скорости цифрового потока 96 кбит/с. В стандарте поддерживается широкий набор параметров и возможностей: частоты дискретизации от 8 до 96 кГц, моно- и стереосигналы, три профиля — Основной (Main), Упрощенный (LC Low complexity), Масштабируемый (SSR — Scalable Sampling Rate). Одновременно может быть описано до 16 звуковых программ, состоящих из большого числа сигналов звука и данных (до 48 основных, 15 низкочастотных, 15 многоязычных каналов, 15 потоков данных) Как и самый сложный из предшествующих, Уровень III из MPEG-1/2, ААС использует все средства цифрового сжатия полосное кодирование, неравномерное квантование, кодирование кодом Хаффмана, итерационные алгоритмы распределения битов, но улучшает алгоритм Уровня III во многих деталях и использует новые эффективные средства кодирования для улучшения качества звучания при очень низких скоростях. Основные улучшения можно свести к следующим моментам [4.4, 4.5]: 1. Улучшено разрешение по частоте благодаря использованию 1024 частотных полос по сравнению с 576 в алгоритме Уровня III. При этом короткие блоки имеют длину всего 256 отсчетов, что обеспечивает эффективную обработку быстрых изменений звукового сигнала. Переключение производится по результатам анализа поведения входного сигнала во времени. 2. В Основном профиле применена оптимальная схема предсказания назад, обеспечивающая более высокую эффективность отработки изменений основного тона. 3. Применен более гибкий алгоритм кодирования в режиме joint stereo, как в режиме кодирования по интенсивности, так и в режиме «сумма-разность». 4. Применен улучшенный код Хаффмана, кодирование четверками частотных линий применяется очень часто, что дополнительно сокращает расход битов. Структурная схема звукового кодера формата ААС Основного профиля приведена на рис. 4.7 Новым элементом по сравнению с Уровнем III можно считать функцию управления шумами во временной области (TNS — Temporal Noise Shaping), позволяющую формировать огибающую шума во временной области по предсказанию в частотной области. Устройство осуществляет фильтрацию сигнала с выхода ДКП набором из нескольких переключаемых фильтров и квантование полученных групп отсчетов. Коэффициенты квантования передаются в общем цифровом потоке декодеру, который перераспределяет огибающую шума в реконструируемом сигнале с учетом спектрального распределения энергии сигнала. Это полезно при быстрых изменениях уровня звукового сигнала, когда кодер не успевает переключить блок фильтров на обработку коротких блоков и возникают искажения в виде пред-эхо. Еще один новый механизм повышения эффективности кодирования звука адаптивное предсказание текущего кадра по предшествующему, широко используемое в кодировании изображения. Оно чаще используется в технике кодирования речи и более эффективно при низких скоростях потока.
108 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю В кодере Простого профиля отсутствует предсказание, режим TNS ограничен 12 коэффициентами. Более сложный Масштабируемый профиль использует для анализа 4- полосный КЗФ, за которым следует модифицированное ДКП с высокой разрешающей способностью по частоте. Модуль управления коэффициентом усиления на выходе фильтра позволяет независимо регулировать сигналы в каждой полосе для предотвращения пред-эхо. 4.4. СИСТЕМНЫЙ УРОВЕНЬ, ПОТОКИ ДАННЫХ И ИНФОРМАЦИОННЫЕ ТАБЛИЦЫ 4.4.1. Элементарные потоки сжатых данных и их объединение в единый поток Как мы видели в предыдущей главе, MPEG-1 решает задачу мультиплексирования довольно простым образом. Он может объединить в одну программу несколько компонентов видео и звука, имеющих общую тактовую синхронизацию. Однако для организации полноценного многопрограммного вещания нужно объединить в общий поток программы, сформированные в разных местах и в разное время и не имеющие общей временной базы. Требуется новый инструмент объединения и транспортирования данных, обеспечивающий в то же время обратную совместимость с MPEG-1. Стандарт MPEG-2 предлагает две конструкции многокомпонентного цифрового потока. Более простой программный поток (ПП) почти точно совпадает с системным потоком MPEG-1 (в последнем несколько отличается формат и отсутствует сигнализация) и используется для распространения программного материала с переменной скоростью цифрового потока в среде без ошибок (запись на магнитные и оптические носители, передача по линиям на расстояние в единицы метров и т.д.). Структура ПП включает пачки (pack), содержащие один или несколько PES пакетов и заголовок со ссылкой на системные часы (SCR — System Clock Reference) (рис. 4.8). В потоке может быть до 16 видео и до 32 звуковых потоков, но все они считаются компонентами одной программы, так как имеют общую временную базу (единый генератор тактовой частоты). Транспортный поток (ТП) представляет собой более высокий уровень организации данных. В ТП пакетированные элементарные потоки, принадлежащие разным программам, переносятся в различных транспортных пакетах небольшой длины, снабженных кодозащитой для передачи в каналах с ошибками, в частности, для вещания. Один транспортный поток может переносить несколько программ, не связанных единой временной базой, каждая из нескольких компонентов. Передача оказывается, по сути дела, асинхронной и потому не может управляться единым синхронизирующим сигналом. Рассмотрим, как решены вопросы синхронизации в транспортном потоке MPEG-2. Пачка пакетов ПЭП Заголовок пачки Заголовок пакета видео Заголовок пакета аудио Рис. 4.8. Структура программного потока MPEG-2
Глава 4. Формирование цифрового потока по стандарту MPEG-2 109 4.4.2. Принципы обеспечения синхронизации цифровых потоков в стандарте MPEG-2 Мы уже проследили ранее, как происходит синхронизация всех компонентов цифрового потока MPEG-1. Общий отсчет времени задается ссылками на системные часы (SCR), вводимыми в заголовок системного потока, по ним декодер подстраивает свои внутренние часы и «привязывает» потоки видео и звука к абсолютным отсчетам времени. Для выравнивания задержки во времени отдельных пакетов в заголовок пакета ПЭП вводятся временные метки воспроизведения (PTS) и временные метки декодирования (DTS), которые указывают, в какие моменты этого абсолютного времени декодер должен обработать и вывести на экран соответствующие изображения или звуковые последовательности. Эти же средства используются и в программном потоке MPEG-2, где все компоненты потока также имеют общую временную базу. Транспортный поток содержит программные компоненты с разной предысторией, в том числе и с несколько различающимися тактовыми частотами, поэтому невозможно или весьма трудоемко привести все сигналы к единой временной базе. Для управления такими потоками вводится еще один механизм синхронизации, называемый ссылкой на программные часы (PCR — Program Clock Reference). PCR, как и другие временные метки, также представляет собой 33-битовое число, отсчитываемое в периодах частоты 90 кГц, получаемой делением на 300 частоты тактового генератора 27 МГц. Оно показывает ожидаемое время завершения считывания в декодере поля PCR из транспортного потока, после чего декодер может приступить к сравнению пришедшеш и местного отсчетов и выработке корректирующего сигнала, как показано на рис. 3.1&ГОтличие от% SCR в том, что PCR вводится в поток на программном, а не системном урбвне, в одном потоке могут передаваться несколько различных PCR, по числу программ, и декодер при переключении на каждую новую программу заново синхронизирует свой внутренний генератор частоты 27 МГц. Стандарт предписывает повторение метки PCR не реже чем 1 раз в 0,7 с. В промежутках декодер вычисляет значения меток путем интерполяции. 4.4.3. Структура транспортного потока Пакеты ТП имеют фиксированную длину 188 байт, из которых 4 байта выделяются на заголовок и 184 байта — на полезные данные. Это могут быть видео- или звукоданные, данные пользователя или пустые байты (1111 1111), называемые стаффингом. Каждый пакет переносит данные только одного вида. Размер пакета выбран для совместимости с широко применяемым на сетях связи стандартом асинхронной передачи данных ATM. Ячейка ATM имеет длину 53 байта, из которых полезных — 47 байт (с учетом 1 байта на уровень адаптации). Один пакет MPEG-2 длиной 188 байт упаковывается в 4 пакета ATM. Подробнее об этом мы поговорим в главе 6. Структура заголовка показана на рис. 4.9. Первый байт — байт синхронизации — 32 бита 8 битов Синхро- байт 0x47 -kL Указатель скремблирования PID 13 битов /ка1з Указателе / Указатель ошибки указатель "Ри°Ритета . пакета начала Указатель наличия полей адаптации Поле адаптации или данные начала структурной единицы Счетчик непрерывности Рис. 4.9. Структура заголовка пакета транспортного потока MPEG-2
110 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю содержит зарезервированное кодовое число 0x47, легко опознаваемое демультиплексором. Далее идут три однобитовых флага (ошибки передачи, начала пакета ПЭП и приоритетной передачи) и 13-битовый идентификатор типа пакета PID (Packet IDentifier), указывающий на принадлежность пакета тому или иному потоку данных. PID служит основным признаком, по которому демультиплексор сортирует приходящие пакеты на приемной стороне. Из общего числа 8192 возможных значений PID 16 выделены на общесистемные цели, номер 8191 (0 х 1FFF) закреплен за стаффинговыми байтами, остальные могут назначаться пользователями произвольно для отдельных компонент своих программ. Передача информации пакетами фиксированной длины и система идентификаторов имеют свои преимущества. Пропускная способность в этом случае используется в максимальной степени и может динамически перераспределяться между программами. Можно добавлять новые ПЭП или удалять ненужные, не меняя в целом структуру потока. Для извлечения необходимой информации декодеру не нужно знать детальную структуру всего потока, достаточно указать только PID, который всегда находится в заголовке на одном и том же месте. Вернемся к рис. 4.9. Еще один байт в заголовке содержит три необходимых указателя: 2-битовый указатель скремблирования ТП — свидетельствует о наличии или отсутствии скремблирования ТП; 2-битовый индикатор наличия полей адаптации в нагрузке пакета. Поле адаптации занимает часть области полезных данных и служит для ввода управляющих и вспомогательных сигналов, передаваемых не в каждом пакете. В частности, в полях адаптации передаются таблицы программно-зависимой информации (PSI — Program Specific Information) и сигналы синхронизации. Поле адаптации может также использоваться для передачи данных пользователя, в этом случае оно разбивается на секции. Подробнее об этом рассказано в седьмой главе. Значение указателя наличия полей адаптации 0x1 означает, что поле адаптации отсутствует и в пакете передаются данные видео или звука; 0x2 присваивается пакету, в котором часть области полезных данных занимает поле адаптации, остальное занято стаффингом; индикатор, установленный на 0x3, свидетельствует об одновременном наличии и поля адаптации, и полезных данных. Отметим, что заголовок пакета и поле адаптации не скремблируются. 4-битный счетчик непрерывности пакетов увеличивает свое значение на единицу при поступлении каждого следующего пакета с данным PID и обнуляется после каждого 15-го пакета. Он позволяет декодеру обнаруживать потерю пакета и принимать меры по его замене. Область полезных данных транспортного пакета значительно меньше, чем обычная длина пакета ПЭП, поэтому последний для укладки в пакеты ТП должен разрезаться. Стандарт определяет, что первый байт пакета ПЭП должен обязательно совпадать с первым байтом области полезных данных, а конец пакета ПЭП — с концом одного из последующих транспортных пакетов. Незаполненные начальные байты этого последнего пакета дополняются пустыми байтами. Если в пакете присутствует поле адаптации, оно имеет структуру, показанную на рис. 4.10. Первый байт указывает длину поля, затем следуют три однобитовых указателя - непрерывности, случайного доступа и приоритета элементарного потока. Первый указатель свидетельствует о непрерывности счета времени во временных метках и необходим на приеме для мониторинга ТП. Он устанавливается в «1», если на передающей стороне изменена база отсчета времени, например, гладко введена другая программа с иным PCR. Если в данном поле адаптации передается PCR, об этом свидетельствует однобитовый
Глава 4. Формирование цифрового потока по стандарту MPEG-2 111 Приоритет ЭП Длина поля адаптации^ Флаг расширения поля адаптации ^ Поле OPCR Поле данных пользователя Стаффинг Указатель Указатель Фла/^"Ч \ Флаг непрерывности случайного^ -^PbR данных доступа' точки пользователя Длина поля данных X PCR Резерв Поле расширения PCR OPCR Резерв Поле расширения OPCR ^г Поле дан-1 ных пользователя | 33 6 9 33 6 9 8 Рис. 4.10. Структура поля адаптации транспортного потока флаг PCR. Метка PCR занимает 48 битов, в том числе 33 бита собственно PCR, 6 битов зарезервировано для будущих применений и 9 битов занимает поле расширения PCR. В поле расширения ведется счет импульсов тактовой частоты 27 МГц. Как только их число достигает 300, поле обнуляется и значение PCR увеличивается на единицу. Так обеспечивается совместимость с MPEG-1, где отсчет времени ведется в периодах тактового генератора 90 кГц. Такой же формат имеет метка Исходной PCR (OPCR — Original PCR), передаваемой вместе с программой, заимствованной из другого транспортного потока. В отличие от PCR, значение OPCR не изменяется в процессе передачи. Оно может использоваться, например, при записи и воспроизведении программы. Еще один флаг, splice_countdown, указывает число пакетов с тем же PID в транспортном потоке, оставшихся до точки гладкого входа в поток (например, для ввода рекламы или местных программ). Оставшуюся часть поля адаптации могут занимать либо служебные данные, либо данные пользователя, либо расширения поля адаптации, на что указывают соответствующие флаги. Формат данных пользователя включает однобайтовый указатель длины поля и собственно поле данных, которые в этом случае вводятся в так называемые секции транспортного потока. Подробно об этом рассказано ниже в этой главе и в главе 6. 4.4.4. Мультиплексирование, ремультиплексирование и статистическое мультиплексирование Принятая в стандарте MPEG-2 схема построения ТП может быть описана как двухступенчатая. На первом этапе формируется программный поток (ПП) путем мультиплексирования одного или нескольких ПЭП с общей временной базой и индивидуальными PID (рис. 4.11а). На втором шаге ПП нескольких программ и управляющие потоки объединяются методом асинхронного пакетного мультиплексирования в единый транспортный поток (рис. 4.116). Отметим, что транспортный поток может быть построен и непосредственно из ПЭП или других ТП, если при этом сохраняются общие правила синтаксиса MPEG. Такая иерархическая структура обеспечивает большую гибкость в построении систем вещания. Можно, например, объявить один ПЭП принадлежащим более чем одной программе и организовать так называемые виртуальные каналы, можно использовать несколько потоков одного вида
112 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю видео звук 1 звук 2 PID1 PID2 P1D3 4 PID(n-1)J данныв 1 -pi5(Sr" данные 2 ,. РМТ ™Ш*Щ Программа 1 Программа 2 Программа 3 Программный поток ПрограммдЩЛ Программа (п) Программа (п+1) Транспортный поток > а) Рис. 4.11. Объединение ПЭП в программный поток (а) и программных потоков в транспортный поток (б) для масштабирования, возможна организация межрегионального вещания с выбором отдельного языка для каждого региона и т.д. Гибкость мультиплексирования ТП представляет одну интересную возможность построения многопрограммной системы вещания, связанную с вводом в ТП, формируемый мультиплексором из программ, кодированных локальными кодерами, «постороннего» транспортного потока, поступившего по линии связи и имеющего другую временную базу (режим ремультиплексирования). Современные мультиплексоры легко справляются с такой задачей, позволяя при этом выбрать из компонентов пришедшего ТП желаемые, при необходимости изменить PID этих компонент, режим скремблиро- вания и другие параметры. Еще одна возможность гибкого изменения параметров сжатого сигнала — статистическое мультиплексирование, заключающееся в динамическом перераспределении ресурса битов между кодерами в многопрограммном цифровом потоке с учетом конкретных особенностей изображения в каждой программе таким образом, чтобы качество всех программ оставалось возможно более высоким. Более сложный контроллер может использовать технологию «заглядывания вперед» для оценки сложности представленных кадров и эта информация может служить для подстройки управления скоростью. Система работает следующим образом. Управляющий контроллер статистического мультиплексора получает от всех кодеров информацию о сложности обрабатываемого в данный момент изображения, оценивает ее и выделяет каждому кодеру ресурс битов, пропорциональный потребности. Дело в том, что при суммировании скоростей нескольких каналов среднее значение скорости растет пропорционально сумме средних значений составляющих, а среднеквадратичное отклонение изменяется пропорционально квадратному корню из числа каналов. Если в пакете программ присутствуют, например, фильмовые, детские, спортивные, развлекательные программы, в разные моменты времени в зависимости от наличия движения, детальности изображения, цветовой насыщенности они требуют разной скорости выходного потока для сохранения примерно одинакового субъективного качества изображения и, что еще важнее, пики скорости наступают в разные моменты времени, так что суммарная скорость может быть заметно снижена. Исследования показали, что без ухудшения качества можно выиграть примерно 30% пропускной способности канала. Это означает, что вместо 6 программ в спутниковом стволе можно передать 8, вместо 8 — 10... 11. Проводившиеся на некоторых выставках демонстрации передачи 18 и даже 24 программ — на сегодняшний день не более чем рекламный трюк и не имеют ничего общего с реальными задачами цифрового вещания.
Глава 4. Формирование цифрового потока по стандарту MPEG-2 113 4.4.5. Таблицы программно-зависимой информации Вся информация, необходимая декодеру для обработки принятого цифрового потока и выделения нужных компонент программы, сосредоточена в управляющей информации (ее еще называют метаданными), передаваемой в составе транспортного потока. Она организована в виде нескольких таблиц, содержащих сведения о составе программ и идентификаторах их компонентов и называемых таблицами программно-зависимой информации PSI (Program Specific Information). Алгоритм действий декодера при прочтении таблиц поясняется рис. 4.12. Первая таблица, пакеты которой находит кодер в потоке Таблица объединения программ Транспортный поток Прием РЮ=0 Прием PID=N Прием РЮ=1 г- Прием РЮ=РХ Прием РЮ=РС NIT PAT Программа 1 PID = N Программа X PID = PX CAT PMT Выбор программы X ._J Программа X видео PID = PV аудио PID = РА тактов. PID = PC sy t п"! Прием PID=PV PCR Регенерация тактовой частоты НЭП видео, Декодирование видео I Прием РЮ=РА ПЭП аудио> Декодирование аудио 3 Воспроизведение 3 видео ^ Воспроизведение Я аудио Рис. 4.12. Алгоритм действий декодера при прочтении таблиц PSI
114 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 0x00 Рис. 4.13. Структура таблиц программно-зависимой информации PSI (PAT — Program Association Table). Таблица PAT имеет по умолчанию PID = 0 и включает информацию о программах, передаваемых в данном потоке, и идентификаторы, относящиеся к этим программам. Каждый такой PID, в свою очередь, определяет для выбранной программы Таблицу состава программы (РМТ — Program Map Table), в которой перечислены все компоненты, входящие в данную программу, с их идентификаторами. Теперь декодеру остается отобрать из общего потока пакеты с нужными идентификаторами и декодировать их, восстановив изображение и звуковое сопровождение. Если программа платная, декодеру придется анализировать еще и содержание Таблицы условного доступа (CAT Conditional Access Table) с PID = 1, в которой указаны идентификаторы пакетов с сообщениями системы условного доступа. Иногда в набор таблиц PSI включают еще необязательную Таблицу сетевой информации (NIT — Network Information Table), которая определяет все транспортные потоки, относящиеся к данной сети. Содержимое таблиц вводится в секции области поля адаптации определенной длины, снабжаемые указателями. Размер секции для передачи служебной информации не должен превышать 1024 байта. Возможна передача нескольких коротких секций в поле адаптации одного пакета транспортного потока или одной длинной секции в нескольких пакетах. На рис. 4.13 показана иерархия PSI таблиц и взаимосвязи между ними. Рассмотрим теперь структуру таблиц подробнее. Общий формат таблицы PAT показан на рис. 4.14а. Она содержит заголовок длиной 8 байт и поле данных. Структура заголовка более детально развернута на рис. 4.146. Первым идет идентификатор таблицы table__id. Это однобайтовое число обязательно входит в состав любой таблицы и определяет ее тип. Может возникнуть вопрос: разве PID не определяет таблицу полностью, и зачем нужен еще один идентификатор? Дело в том, что PID является более общим указателем, чем table_id. Например, две таблицы TDT и ТОТ (о них мы узнаем в шестой главе) имеют одинаковый PID, но разные table_id. Следующий существенный указатель — длина секции в байтах. Два старших бита из 12 установлены на «0», так что длина секции не может превышать 1024 байта. Идентификатор транспортного потока transport_stream_id размером 2 байта указывает условный номер в данной сети транспортного потока, в котором передается анализируемая таблица. Указатель номер версии изменяется на _ _ ^ Рис. 4.14. Формат таблицы PAT: единицу каждый раз, когда а) общая стру^ра; б) струк7ура заголовка | Заголовок | Данные PAT | CRC | 8 байтов а) Переменная длина 4 байта "Ю" table id \ Резерв Длина секции transport, stream id Указатель Резерв твКущИ£/Следующий Л I Номер версии ийЛ Номер секции Номер последней секции б) 2 2 12 16 8
Глава 4. Формирование цифрового потока по стандарту MPEG-2 115 г-tableJd-0(0x00) ksection_syntaxjrKJcator «1b L-гего-ОЬ [-reserved «11 b U sedionjength - 37 (0x0025) MransporLstreanUd - Б1 (0x0030) [-reserved «11 b I- versk)n_number« 5 (0x05) hcmenLnexUndcatof ■ 1 b U section_number - 0 (0x00) k to$l_section_iiumber - 0 (0x00) (£}-programs Eogram_number - 0 (0x0000) reserved -111 b PID-16 (0x0010) EogramjTumber - 7105 (0x1 BC1) reserved «111 b PID-1028 (0x0404) EogramjTumber » 7106 (0x1 BC2) reserved "111 b PID-1029(0x0405) Eogramjxmber - 7101 (0x1 BBD) reserved-111 b PID-1024 (0x0400) Eogram.number - 7102 (0x1 BBE) reserved-111 b PID-1025 (0x0401) Eogram_number - 7103 (0x1 BBF) reserved-111 b RD-1026 (0x0402) program_numbe( = 7104 (0x1 В CO) [-reserved-111 b L PID -1027(0x0403) L-CRC_32-0xE449DDCF -tablejd-2(0x02) ■ section_syntaxjndicator -1b - zero -0b ■ reserved -11b - sectionjength - 46 (0x002E) ■progranunumbei - 7101 (0x1 BBD) ■ reserved «11b ■ version.number - 0 (0x00) ■ current_next_indk*tor ■ 1 b - section.number - 0 (0x00) ■ la$L$ecfon_number - 0 (0x00) ■reserved-111 b ■PCR_RD-160(0x0QA0) ■ reserved -1111b ■ program descriptors Eh CA descriptor (0x09) •components ф- streamjype - 2 (0x02) w I- reserved -111b h dementary_PID -160 (OxOCAO) I- reserved -1111 b Б-ES descriptors B- stream identifier descriptor (0x52) Й- streamjype - 3 (0x03) ^ [-reserved-111 b k etementary.PID - 80 (0x0050) k reserved -1111 b B-ES descriptors B- stream identifier descriptor (0x52) Lrj2 ■CRC 32«0x94A853BB r-tablejd-1(0x01) k s*ctk>r\_syrtf axjndcator -1b I- zero -0b I- reserved ■ 11 b k sectionjength -18 (0x0012) kreserved-111111111111111111 b k version_number -12 (OxX) V- current_next_indicator -1b k section.number - 0 (0x00) k last.section.num^er - 0 (0x00) ф- descriptors Й-СА descriptor (0x09) L 05 00 E6 0413 01 20 L-CRC 32-0x289AC89D 2 i* P'''C* ^ '?// fe> i> Рис. 4.15. Таблицы PSI системы спутникового вещания: а) таблица PAT; б) таблица РМТ; в) таблица CAT Заголовок Данные РМТ CRC | 12 байтов а) Переменная длина 4 байта 10" Резерв \ ~Л Резерв Указатель Резерв текущий/следующий у v б) table id 2 2 Длина секции 12 Номер программы 16 Номер версии А 0x0000 16 А N PID-PCR 13 Длина дескриптора 12 Рис. 4.16. Формат таблицы РМТ: а) общая структура; б) структура заголовка
116 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю в таблицу вносятся изменения. Если таблица разбита на несколько секций, однобайтовый указатель номер секции сообщает номер передаваемой секции. Номер последней секции необходим для подтверждения того, что вся таблица принята декодером. В поле данных таблицы PAT содержатся сведения о программах, передаваемых в транспортном потоке, с их номерами PID. Номер программы занимает 2 байта, затем следует 3-битовый промежуток и 13-битовое значение PID. На рис. 4.15 в качестве примера приведен сегмент таблицы PAT одной из вещательных сетей, полученный с помощью анализатора транспортного потока. Нетрудно убедиться, что все компоненты таблицы занимают положенные им места. Таблица РМТ создается отдельно для каждой программы, передаваемой в потоке. Общая структура таблицы показана на рис. 4.16а, детальная структура заголовка — на рис. 4.166. Заголовок длиной 12 байтов содержит идентификатор таблицы table_id, всегда равный 0x02, номер программы, сведения о версии таблицы, номере секции и номере последней секции, а также PID того ПЭП в потоке, который переносит значения PCR. В поле данных описывается одна из передаваемых программ со всеми ее компонентами, а завершается секция контрольной суммой. Описание программы содержит подробный перечень всех элементарных потоков, составляющих программу, с их основными параметрами. Тип потока (stream_id) указывает на содержимое данного потока (0x01 MPEG-1 видео, 0x02 - MPEG-2 видео, 0x03 - MPEG-1 звук, 0x04 MPEG-2 звук, 0x05 нестандартные секции, и т.д.), elementaryJPID сообщает значение PID пакетированного потока, несущего данный элементарный поток, ES_info_length указывает длину дескриптора элементарного потока. По этим значениям декодер выделяет нужные элементарные потоки из общей цифровой последовательности. На рис. 4.14 показана одна из таблиц РМТ того же цифрового потока, иллюстрирующая общие принципы. Основными компонентами таблицы CAT (рис. 4.15) являются уже знакомый нам table_id и дескриптор системы условного доступа указатель, сообщающий декодеру условное обозначение используемой в потоке системы условного доступа и номер PID потока управляющих сообщений о правах доступа. Дескриптор условного доступа может присутствовать и в РМТ таблице, в этом случае он указывает на PID потока сообщений, необходимого для дешифровки скремблированной программы. Частота повторения пакетов PAT и РМТ таблиц должна быть не менее 10 Гц, периодичность сообщений условного доступа определяется конкретной системой условного доступа. Рассмотренные три таблицы составляют необходимый минимум, без которого декодер MPEG-2 не сможет декодировать цифровой поток. Для многопрограммного вещания нужны дополнительные данные, описывающие организацию букетов программ, состав вещательной сети, содержание программ и т.д. Мы познакомимся со способами передачи этой информации в шестой главе, когда будем рассматривать стандарты DVB. Там же мы поговорим подробнее о содержании таблицы NIT.
= 5 = ПЕРСПЕКТИВНЫЕ СТАНДАРТЫ СЕМЕЙСТВА MPEG 5.1. СТАНДАРТ ПРЕДСТАВЛЕНИЯ МЕДИА-ОБЪЕКТОВ MPEG-4 5.1.1. Предпосылки создания стандарта Стандарт MPEG-4 базируется на трех китах: 1) цифровое телевидение; 2) интерактивные графические приложения; 3) интерактивные мультимедийные приложения. Тенденция последних лет сближение, слияние этих источников аудиовизуальной информации, появление новых источников как натурального, так и синтезированного контента (содержания). До недавнего времени в вещании преобладала концепция «телевидения» программа готовилась в студии и передавалась как периодическая последовательность строк изображения и сопутствующих звуков. Все усовершенствования, включая появление цифрового вещания и стандарта MPEG-2, не изменили эту концепцию в корне, хотя добавили к ней некоторые новые аспекты — многопрограммное^, подписку, дополнительные услуги, зачатки интерактивности. Однако похоже на то, что сейчас традиционная концепция телевидения не удовлетворяет уже пользователей аудиовизуальных услуг. Зрители хотят иметь доступ к видео- и аудиопрограммам, как они уже имеют доступ к мультимедийному контенту через Интернет и World Wide Web — «Всемирную паутину». В последние 3-4 года мультимедийные и графические средства все чаще вторгаются в область классического ТВ вещания, которое, в свою очередь, проникает в сферу мультимедиа (значительная часть ТВ и звуковых программ транслируется в Интернете, иногда в специальных Интернет-версиях). Аудиовизуальное содержание все чаще используется в интерактивных приложениях, таких, например, как игры или дистанционное обучение. Заметно размывается граница между компьютерными изображениями, виртуальной реальностью и телевидением. Все чаще возникает необходимость перемещать один и тот же контент из одной сети в другую, из одной сферы в другую, и требуются унифицированные форматы представления и передачи информации. Все эти факторы сформировали потребность в едином стандарте, который бы определял формат представления аудиовизуальной информации, совместимый с любой средой
118 I''' ~ ' ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю распространения, и механизмы интерактивного взаимодействия с мультимедийным контентом. В стандарте должны быть предусмотрены возможности передачи различных видов видео- и аудиоданных — текста, графики, двумерных (2D) и трехмерных (3D) изображений, натурального и синтезированного видео и аудио, в потоковой форме или в виде загружаемых файлов. Необходимо обеспечить высокое качество при очень низких скоростях передачи, гибкий доступ к контенту (с любого места, в ускоренном и замедленном режима ), средства интерактивного взаимодействия с объектами, вплоть до возможности абонента влиять на развитие сюжета, совместимость с любой транспортной средой. Важно иметь такой стандарт именно сейчас, на начальных этапах процесса, чтобы воспрепятствовать проникновению на рынок частных форматов отдельных компаний. Именно эти задачи решает недавно появившийся стандарт MPEG-4 «Информационные технологии — Обобщенное кодирование аудиовизуальных объектов». Первая версия стандарта была принята в начале 1999 г. и получила индекс ISO/IEC 14496, вторая, дополняющая и расширяющая первую и обратно совместимая с ней — годом позже [5.1]. Сейчас идет работа над дополнениями, в частности, расширением раздела «Видео» в область студийных применений. В создании стандарта участвовали сотни экспертов из десятков стран, он во многих отношениях представляет собой высшее достижение инженерной мысли. Стандарт содержит 6 частей: 14496-1 «Системы» определяет описание сцены, мультиплексирование, синхронизацию, управление буфером; 14496-2 «Визуальные средства» специфицирует кодированное представление натуральных и синтетических визуальных объектов; 14496-3 «Звук» описывает кодированное представление натуральных и синтетических звуковых объектов; 14496-4 «Проверка соответствия», как и в предыдущих стандартах, определяет условия соответствия для потоков и устройств; 14496-5 «Рекомендуемое программное обеспечение» содержит программные модули для большинства компонентов MPEG-4, которые могут быть использованы для построения совместимых устройств; 14496-6 «DMIF» определяет сеансовый протокол для управления мультимедийными потоками в обобщенной среде. Основное отличие MPEG-4 от ранее принятых стандартов — объектно ориентированное представление медиа-информации. В стандарте вводится ключевое понятие медиа-объекта единицы звукового, визуального или аудиовизуального контента. Любая сцена разделяется на объекты, которые соотносятся в пространстве и времени и описываются отдельными элементарными потоками (ЭП). Объекты могут быть натуральными — записанными с видеокамеры или микрофона, и синтетическими — синтезированными в компьютере. Такой подход имеет ряд преимуществ: более экономно расходуются биты для описания сцены, отдельные объекты легко использовать в других сценах, упрощается построение масштабируемых объектов и взаимодействие с объектами, появляются широкие возможности взаимодействия пользователя с выбранным объектом, например, вывод дополнительной информации об объекте, изменение его параметров (цвета, текстуры, громкости звучания или языка), исключение объекта из сцены, создание пользователем новых сцен из объектов, полученных от разных источников или хранящихся в памяти терминала. Все эти операции требуют лишь изменить описание сцены, а это вполне под силу процессору абонентского терминала.
Глава 5. Перспективные стандарты семейства MPEG 119 5.1.2. Описание сцены Для описания сцены и ее динамического изменения в MPEG-4 используется специально разработанный двоичный язык BIFS (Binary Format for Scenes двоичный формат описания сцен). Описание сцены указывает декодеру, где и когда воспроизводить объекты, входящие в сцену, и как реагировать на воздействие пользователя. Чтобы увязать ЭП с медиа-объектами в сцене, используются дескрипторы объекта. Они переносят информацию о числе и свойствах ЭП, связанных с конкретными медиа-объектами. Сами дескрипторы также переносятся в одном или нескольких ЭП, поэтому нетрудно добавить или удалить объект во время сеанса. Потоки дескрипторов могут рассматриваться как описания потоковых ресурсов для представления, а описание сцены служит для изменения пространственно-временного размещения объектов в сцене. MPEG-4 определил специальный язык синтаксических* описаний для точного описания синтаксиса потоков, переносящих информацию о медиа-объектах и описания сцен. Он представляет собой расширение языка C++ и позволяет дать точное описание синтаксиса и в то же время упростить проверку на соответствие. BIFS оперирует двумя протоколами модификации сцены во времени командным (BIFS-Command) и анимационным (BIFS-Anim) [5.2]. Командные потоки BIFS позволяют загружать новую сцену, изменять свойства объектов, вводить и уничтожать объекты. Потоки BIFS-Anim управляют процессами анимации сцены, например, изменением точки взгляда, перемещением, трансформацией размера, плавным изменением цвета, освещенности и т.д. Синхронизация потоков осуществляется путем временной привязки. Как и в предыдущих стандартах MPEG, один вид временной метки обеспечивает синхронизацию тактовых частот кодера и декодера, метки другого вида, привязанные к функциональным единицам аудиовизуальных данных, содержат желаемое время декодирования (для единиц доступа) или время завершения компоновки (для компоновочных единиц). Основные принципы BIFS заимствованы из языка VRML (Virtual Reality Modelling Language — язык моделирования виртуальной реальности), разработанного для создания 3D графики. Это широко распространенный и в значительной степени бесплатный язык программирования, точнее, эффективный 3D формат обмена, как бы объемный аналог HTML. Дело в том, что некоторые виды информации лучше воспринимаются в объемном виде - игры, результаты научных исследований, архитектурные решения. VRML обеспечивает интеграцию трехмерных, двумерных, текстовых и мультимедийных объектов в связную модель. Он оперирует объектами, каждый из которых имеет различные аттрибуты. Объект называется узлом, а аттрибуты — полями. Число полей зависит от типа узла. Полный перечень узлов и полей известен как граф (разветвленная древообразная структура). VRML включает большинство используемых в 3D приложениях средств: иерархические трансформации, источники света, выбор точки взгляда, анимацию, свойства материала, отображение текстуры и т.д. Язык BIFS позаимствовал у VRML структуру описания сцены в виде графа, модели поведения, графические примитивы для построения ЗО-изображений: конусы, сферы, сетки, текстовые примитивы, текстурирование и подсветку (всего их 36). В то же время BIFS имеет существенные отличия от VRML, в него внесены новые решения: 1) VRML — язык высокого уровня, BIFS — двоичный, благодаря этому объем сообщений в нем в 10-15 раз меньше, чем в VRML; хотя объем описаний сцены обычно меньше, чем аудиовизуальной информации, эги описания передаются непрерывно и могут в результате составить заметную часть передаваемых данных, поэтому сжатие потоков BIFS достаточно актуально;
120 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 2) VRML работает с файлами, предварительно загружаемыми в процессор, a BIFS предназначен в первую очередь для потоковой передачи в реальном времени; 3) BIFS позволяет работать как с 2D, так и с 3D объектами, осуществлять масштабирование, перемещение, вращение, более того, впервые решена задача представления в одной сцене и 2D, и 3D объектов. Во второй версии стандарта в нем расширен BIFS, введены спецификации языков HTML 4.0 и MPEG-J, спецификация файла .тр4 для хранения и транспортировки данных MPEG-4 [5.3]. Новая версия BIFS предусматривает анимацию фигуры, улучшенную модель направленности источника звука, модель окружающей звуковой среды в интерактивной виртуальной сцене, учитывающую отражение звука от стен помещения (реверберацию, эффект Допплера, наличие препятствия между источником звука и пользователем), введение иерархических 3D сеток. 5.1.3. Доставка потоков данных Полученные в результате кодирования элементарные потоки необходимо доставить к декодеру. Для этого MPEG-4 предлагает двухуровневый механизм мультиплексирования, показанный на рис. 5.1. Элементарные потоки поступают на мультиплексирование, пройдя уровень синхронизации SL (Sync Layer), где в заголовки пакетированных элементарных потоков (ПЭП) вводятся временные метки. Первый уровень, названный FlexMux, играет вспомогательную роль в мультиплексировании, он объединяет низкоскоростные потоки с одинаковыми требованиями к качеству передачи, чтобы уменьшить их число в сложных сценах и сократить время передачи. Использование FlexMux не является обязательным, и он может быть пус- Элементарные потоки (Э П) Интерфейс ЭП SL SL SL SL Передача файлов SL SL Уровень синхронизации А I \ Пакетированные элементарны* потоки (ПЭП] Интерфейс DMIF приложении Flex Mux Flex Mux Т~ Потоки Flex Mux | DMIF Уровень DMIF Ш Какал rTransMux кал n^ ran Ж aJ u. J, Сетевой интерфейс DMIF Передача файлов Вещание Интерактивный канал • MPEG-2 ТП Потоки TransMux UDP/IP AAL2/ ATM УровеньТГгапэМих (не входиТчЬв MPEG Цифровое радиовещание +) I Транспортная среда Рис. 5.1. Двухуровневый механизм мультиплексирования цифрового потока в стандарте MPEG-4
Глава 5. Перспективные стандарты семейства MPEG 121 тым, если следующий уровень обеспечивает все необходимые функции. FlexMux не имеет собственных средств защиты от ошибок. Второй уровень, TransMux (Transport Multiplexing), предлагает транспортные услуги по передаче потоков с заданным качеством обслуживания. Условия передачи предполагают необходимую пропускную способность, допустимый уровень ошибок, максимальное время задержки, приоритет и т.д. TransMux не является транспортным протоколом как таковым, он представляет собой скорее интерфейс между кодером MPEG- 4 и стандартным транспортным протоколом. В качестве такового могут использоваться протокольные стеки RTP/UDP/IP, AAL5/ATM, транспортный поток MPEG-2. Взаимодействие с транспортной средой управляется протоколом DMIF (Delivery Multimedia Integration Framework — мультимедийная интегрированная система доставки). DMIF, как его определяет стандарт, — сеансовый протокол для управления потоковой передачей в произвольных средах. После запуска он устанавливает соединение с удаленным абонентом, выбирает подлежащие передаче потоки и посылает запрос на их передачу. Порт DMIF посылает отметки к тем точкам, откуда будут передаваться потоки, и устанавливает соединение. Функции DMIF по связи с транспортными протоколами реализуются через интерфейс DAI (DMIF Application Interface), который получает ПЭП от уровня синхронизации и переводит запросы DMIF в команды, воспринимаемые конкретным протоколом. Команды для разных протоколов могут быть различными. На приемном конце индивидуальные ЭП выделяются из пришедшего транспортного потока путем демультиплексирования (рис. 5.2). На этом этапе DMIF не отвечает за работу транспортного протокола, он подключается только при наличии потоков FlexMux. Выделенные после демультиплексирования пакеты ПЭП обрабатываются с целью извлечения из них информации о синхронизации. Эта информация переносится в заголовках пакетов, генерируемых на уровне синхронизации. Во второй версии стандарта введены два дополнительных механизма, облегчающие транспортировку и опознавание элементарных потоков. Первый предназначен для организации передачи файлов и имеет вид специального файлового формата представления контента с расширением .тр4. Он содержит большой объем описательной информации, позволяющей передавать файлы с помощью любых протоколов, редактировать их Сетевой уровень Trans Mux Потоки Trans Mux 3 П. Уровень Trans Mux Trans Mux Потоки Flex Mux -Ж- Flex Mux -Ж ж ж Описание сцены FlexMux | [ FlexM Эламенггарные потоки Дескрипторы объектов г* Ы ж ж Уровень DMIF Аудиовизуальные объекты и К Восходящий Декомпрессия Рис. 5.2. Структура терминала MPEG-4
122 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю содержимое и воспроизводить его на разных терминалах. В основу положен популярный формат Quick Time. Второй механизм — интерфейс программных приложений MPEG-4 с кодами известного языка программирования Java — призван облегчить интеграцию Java-приложений в структуру MPEG-4. Он будет принимать ЭП Java-приложений, обрабатывать их и направлять к соответствующим компонентам MPEG-4 плейера. Усовершенствование протокола DMIF во второй версии стандарта касается введения возможности работы с мобильными средствами связи, обеспечения более широкого класса параметров качества обслуживания (Q0S), поддержания сеансовой работы одновременно с несколькими сетевыми провайдерами, имеющими собственные порты, и т.д. 5.1.4. Кодирование визуальных объектов Первоначально предполагалось ограничить пределы скорости цифрового потока MPEG- 4 видео значениями 4,8 кбит/с снизу и 64 кбит/с сверху. Однако в ходе разработки стало ясно, что заложенные принципы кодирования значительно мощнее, чем только кодирование на сверхнизких скоростях. Предел сверху был расширен до 10 Мбит/с в первой версии, до 38 Мбит/с во второй версии и ведется работа по его дальнейшему расширению. Тем не менее визуальная часть стандарта не предназначена для вещательного телевидения, хотя и может обеспечить очень высокое качество изображения. Основные требования, заложенные в разработку второй части стандарта, сводились к трем условиям: эффективное кодирование натуральных и синтетических изображений; высокая функциональность в интерактивном окружении; устойчивость в среде распространения с ошибками. редства представления натурального видео в MPEG-4 обеспечивают стандартизованную технологию обработки, хранения и передачи текстуры, изображений и видео для мультимедийных применений. В отличие от MPEG-2, где вся сцена раскладывалась до пиксела и затем осуществлялось однородное кодирование всего изображения, в MPEG-4 сцена разбивается на видеообъекты, для каждого объекта описываются его форма, текстура, местоположение, оптические характеристики (яркость, цвет, положение светотени), параметры движения — перемещение, вращение, изменение масштаба, данные кодируются со сжатием, упаковываются в отдельные ЭП (по несколько потоков на каждый объект), мультиплексируются и передаются декодеру. Эизуальная сцена может состоять из одного или нескольких объектов. Каждый объект характеризуется пространственной и временной информацией в виде формы, текстуры и движения. Для некоторых приложений введение понятия"визуального объекта оказывается неоправданно сложным, для них MPEG-4 допускает кодирование прямоугольными кадрами, которые представляют собои^ырожденный случай объекта произвольной формы. Пользователь может восстановить сцену в ее исходном виде, а может произвести определенные манипуляции — исключить часть объектов или ввести новые, изменить точку взгляда, масштаб, цвет и т.д. Разумеется, пользователь может внести только те изменения, которые предусмотрел автор. Стандарт обработки визуальных объектов поддерживает широкий диапазон изменения входных параметров видеопоследовательности. Развертка может быть прогрессивной и чересстрочной, пространственное разрешение по яркости — от 8 х 8 до 2048 х 2048 пике. (SQCIF, QCIF, CIF, 4CIF, Рек. ВТ.601); в цветовом пространстве допускаются сигналы монохромный и Y,CB,CR; пространственное разрешение по цветности
Глава 5. Перспективные стандарты семейства MPEG 123 VSi VS2 VS2...VSn VOi VO2 V02...V0n if- ^A/L f/ 4? V0L1 V0L2 / V0L2...V0Ln VOP1 VOPk VOPk+i VOP1 VOP2 VOPi...VOPk VOPk+i...VOPn Уровень 1 VOPl...VOPn Уровень 2 Рис. 5.3. Структура визуального цифрового потока «4:0:0», «4:2:0» и «4:2:2» (только в студийном профиле); частота кадров может изменяться от 0 до 30 Гц и более, причем может меняться от кадра к кадру; разрядность квантования — 8 бит с возможностью изменения от 4 до 12 бит. Нетрудно убедиться, что возможности выбора параметров значительно шире, чем даже в MPEG-2. В зависимости от скорости цифрового потока могут использоваться алгоритмы, относящиеся к одной из трех групп: 1) Низкоскоростное видео (VLBV Very Low Bit-rate Video) — скорость 5...64 кбит/с, разрешение не выше CIF, частота кадров до 15 Гц; основное назначение — кодирование обычных прямоугольных изображений с высокой эффективностью для мультимедийных приложений реального времени, а также системы случайного доступа к мультимедийным базам данных с быстрым поиском «вйеред» и «назад»;
124 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю X 7 2 00 Я ДКП ч Квантователь Кодирование движения и текстуры Восстановление отсчетов Предсказатель 1 Предсказатель 2 Предсказатель 3 Оценка движения 1 5 П о. * Обратное ДКП т— плексирование Сумматор Кодирование формы 2) Высокоскоростное видео скорость 64 кбит /с... 10 Мбит/с; те же применения, но с более высоким пространственным и временным разрешением, вплоть до Рек. ВТ.601, также мультимедийное вещание или обратный канал в интерактивных системах с качеством, сравнимым с цифровым вещанием; системы с чересстрочной разверткой; 3) Кодирование, основанное на контенте, поддерживает отдельное кодирование и декодирование натуральных объектов в сценах с гибридным кодированием; эта группа допускает смешение некоторого числа видеообъектов с синтетическими объектами (виртуальные задники). Визуальный цифровой поток MPEG-4 можно изобразить иерархической последовательностью уровней, как показано на рис. 5.3. Последовательность визуальных объектов (VS Visual Object Sequence) в этой иерархии соответствует видеопоследовательности в MPEG-2 и отображает сцену с произвольным числом 2D и 3D натуральных и синтетических объектов и их улучшающих слоев. Видеообъект (VO) соответствует обычному двумерному объекту в сцене. В самом простом случае он может быть прямоугольным кадром, в общем случае объектом произвольной формы. Слой видеообъекта (VOL) соответствует каждому ЭП, описывающему видеообъект. VOL может быть полнофункциональным или с укороченным заголовком, в этом случае он совместим с потоком стандарта Н.263. Каждый видеообъект дискретизируется во времени и такой временной срез (отсчет) видеообъекта называется плоскостью видеообъекта (VOP). Несколько плоскостей могут объединяться в группу плоскостей видеообъекта (GOV). He правда ли, эта иерархия очень напоминает структуру видеопоследовательности MPEG-2? Плоскости видеообъекта могут кодироваться независимо (1-кодирование), или совместно, с применением компенсации движения (Р- и В-кодирование). Обобщенная схема кодера MPEG-4 показана на рис. 5.4. Она включает кодирование формы и компенсацию движения, а также кодирование текстуры, базирующееся на ДКП (стандартное или адаптивное к форме объекта). Каждый видеообъект кодируется отдельно, затем цифровые потоки объединяются. Рис. 5.4. Обобщенная структурная схема видеокодера MPEG-4
Глава 5. Перспективные стандарты семейства MPEG 125 —Я Пред- процессор Кодер Э| улучшающего слоя Промежуточный процессор Кодер базового слоя о. о о I- с; № Демультиплексор • N ) \ ) Декодер улучшающего слоя /i\ Промежуточный процессор 1 ^ Декодер базового слоя Постпроцессор jk Рис. 5.5. Масштабируемое кодирование/декодирование в стандарте MPEG-4 В стандарте MPEG-4 применяются два метода кодирования ин4юрмации оформеобъекта бинарное и градационное. При бинарном кодировании оперируют матрицей того же размера, что и плоскость видеообъекта, элементы которой могут принимать значения только 1 или 0 в зависимости от того, находятся ли они внутри объекта или вне его. Градационное кодирование более гибкое, оно описывает элементы матрицы 8-битовыми словами и позволяет кодировать «полупрозрачные» и «затуманенные» изображения. Для цифрового сжатия плоскости видеообъектов, содержащие информацию о перемещении и текстуре, разбиваются на макроблоки размером 8x8 или 16 х 16 пике, содержащие блоки отсчетов яркости и цветности, к этим последним применяется ДКП с последующим квантованием и кодированием квантованных разностей. Процесс схож с обычным цифровым сжатием из предыдущих стандартов MPEG. При кодировании текстуры поступают следующим образом. На плоскость видеообъекта накладывают решетку с ячейками 8x8 элементов. Те ячейки, которые полностью разместились внутри объекта, кодируются обычным ДКП, за исключением того, что после квантования производится дополнительное предсказание коэффициентов блока на основе соседних блоков. Блоки, которые оказались на границе видеообъекта, дополняются до размера 8 х 8 по определенным правилам и только после этого кодируются (так называемое Shape-Adaptive DCT ДКП, адаптивное к форме). Более эффективный метод кодирования текстуры и неподвижных изображений поддерживается специальным режимом кодирования в MPEG-4, основанным на волновом преобразовании с нулевым деревом. Наряду с высокой эффективностью сжатия этот метод обеспечивает пространственную масштабируемость (до 11 уровней) и непрерывную масштабируемость по качеству Масштабируемость в MPEG-4 обеспечивается передачей для видеообъекта нескольких цифровых потоков VOL, один из которых базовый, остальные — улучшающие. При пространственном масштабировании может быть достигнуто улучшенное пространственное разрешение, временное масштабирование сглаживает движение. На рис. 5.5 показано, как в этом случае кодер и декодер обрабатывают поступающие потоки. Пред- процессор субдискретизирует поступающие VOP и разделяет их на базовый и улучшающий слои. Поток базового слоя передается обычным путем, а в канале улучшающего слоя передается только разность между сигналом, поступившим от процессора, и сигна-
126 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю лом, восстановленным промежуточным процессором путем повышающей дискретизации. На приеме процессы происходят в обратном порядке. Дальнейшему сокращению цифрового потока способствует глобальная компенсация движения, основанная на передаче статических спраитов. Спрайтом называется часть видеообъекта, которая устойчиво присутствует в нем практически без изменений на протяжении довольно длительного времени. Это могут быть, например, панорамный задний план или группа неподвижных предметов, закрывающая значительную часть кадра. Такое почти статическое изображение может быть передано полностью один раз, в начале трансляции, а затем корректироваться декодером по мере необходимости. Информация о форме и текстуре спрайта кодируется как I-VOP Для каждого следующего изображения в последовательности кодируются только 8 параметров глобального движения, описывающих движения телекамеры. Чтобы снизить задержку, сначала передают часть информации спрайта с грубым квантованием, а затем добавляют более тонкие структурные особенности. Можно также передать часть изображения, необходимую для Декодирование формы Декодирование | движения I Декодирование | текстуры у ^ Компенса ция движения / у ^ Память i IP - 1 / К rib ^ _± Рис. 5.6. Декодирование видеокадра MPEG-4 реконструкции первых VOP, а затем дослать по частям остальные участки спрайта. На практике применяется сочетание обоих методов. На рис. 5.6 схема декодера показана более детально. Здесь видно, как обрабатываются и затем объединяются данные о форме и текстуре изображения. В цифровом потоке визуальной информации применяются дополнительные меры для повышения устойчивости к ошибкам: Ресинхронизация: после определенного количества битов в поток вводятся маркеры, отмечающие точки, к которым декодер переходит при потере части битов в потоке. Разделение данных: данные о перемещении и о текстуре разделяются на более мелкие порции для облегчения маскирования. Код расширения заголовка: вводится дополнительная кодозащита в заголовок пакета, повышающая его устойчивость к ошибкам. Реверсивное кодирование с переменной длиной: кодовые слова реверсивного кода могут декодироваться как с начала, так и с конца. Если декодер встречает поврежден-
Глава 5. Перспективные стандарты семейства MPEG 127 ные биты, он не отбрасывает всю оставшуюся часть слова, а декодирует его с противоположного конца до поврежденного участка, минимизируя потери. Синтетические объекты представляют значительный раздел компьютерной графики. В стандарт MPEG-4 включены следующие операции с объектами такого рода: параметрические описания синтезированного лица и фигуры; кодирование статических и динамических сеток с отображением текстуры; кодирование текстуры для проективных приложений. Метод анимации предполагает однократную передачу базового статического образа и последующую досылку сообщений, описывающих динамические изменения объекта. В первой версии стандарта этот метод используется для передачи синтезированного человеческого лица. За основу берется обобщенный шаблон лица с нейтральным выражением один из хранимых в базе или специально загружаемый на передающей стороне. Он дополняется индивидуальными чертами, текстурой, выражением с помощью управляющих параметров (Facial Definition Parameters — параметры, определяющие лицо), другая группа,параметров (Facial Animation Parameters — параметры анимации лица) изменяет выражение лица, вводит мимику, артикуляцию. Параметры передаются в отдельных потоках, для сжатия используется кадровое кодирование с ДКП. Двумерная сетка представляет собой часть плоскости, поделенную на полигональные (многоугольные) участки. Точки пересечения линий называются узлами. MPEG-4 рассматривает только треугольные сетки. Сетка может быть заполнена текстурой, тогда ее называют контентно-наполненной (content-based). Для описания сетки в динамике достаточно передать геометрию сетки и описать движение всех ее узлов. При этом треугольные участки текущего кадра получаются путем деформации треугольных участков опорного кадра, текстура также деформируется путем параметрического отображения векторов перемещения узлов сетки. Двумерное моделирование может быть использовано для эффективного сжатия, если передавать опорные ключевые кадры и посылать векторы перемещения и информацию о текстуре для восстановления промежуточных кадров. Во второй версии стандарта добавлены новые технологии и алгоритмы, позволившие повысить эффективность кодирования, устойчивость к ошибкам, улучшить временное разрешение при малой задержке в буфере. В частности, введен режим глобальной компенсации движения, точность компенсации повысилась до 1/4 пиксела, внедрены три новых инструмента кодирования текстуры и неподвижных изображений: волновое кодирование с разделением на небольшие самостоятельно кодируемые участки, масштабируемое кодирование формы, сегментация и пакетирование для повышения устойчивости к ошибкам. Интересным новшеством второй версии является возможность кодирования кратных изображений (стереоскопических или полученных с близких точек) с устранением избыточности между ними. Этот режим основан на методе градационного кодирования формы объекта и использует дополнительные возможности данного метода. В области синтетических изображений основными нововведениями второй версии можно считать средства анимации человеческой фигуры (теми же методами, что и лица в первой версии) и кодирование трехмерных полигональных сеток.
128 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 5.1.5. Кодирование звуковых объектов Широкие возможности представляет стандарт MPEG-4 для кодирования звука. Впервые используются раздельные алгоритмы для кодирования звуков музыкального происхождения и речи, введены мощные средства создания и обработки синтезированного звука. Наиболее широкий круг звуковых объектов, от низкоскоростных моно до многоканального звука вещательного качества, относится к категории Универсального звука (GA — General Audio). В качестве основного алгоритма кодирования звуков различного происхождения принят известный нам из MPEG-2 алгоритм ААС с незначительны- ^~1 J 1 N * ) ПАМ Анализиру- 1 ющий БФ [ -? т* N / Квантование и кодирование Обнаружение Э U jyMa —Э Мультиплексор /ТЧ а) —3 1—> Демульти- плексор ч Л Синтезирующий БФ —) -» Восстановление отсчетов Генератор шума 6) Рис. 5.7. Схема реализации режима PNS: а) кодер; б) декодер 1. Синтезирующий БФ LT Анализирующий БФ Анализирующий TNS AriMfcw'py- юЩий БФ Анализирующий TNS Я ПАМ Синтезирующий TNS тк Обратный FSS ~?F Восстановление отсчетов Квантование и кодирование Мультиплексирование Рис. 5.8. Схема универсального кодера с LTP
Глава 5. Перспективные стандарты семейства MPEG 129 ми усовершенствованиями. Одно из них касается введения режима PNS (Perceptual Noise Substitution — перцептуальное замещение шумом). Суть данного метода заключается в обнаружении в приходящем сигнале шумоподобных составляющих и исключении их из общего процесса кодирования. Декодеру передается информация о мощности шумовых компонентов в отдельных участках спектра и он подменяет соответствующие спектральные коэффициенты псевдослучайными сигналами с требуемой мощностью. Режим PNS иллюстрируется структурной схемой рис. 5.7 Еще одно усовершенствование связано с введением алгоритма BSAC (Bit-Sliced Arithmetic Coding — арифметическое кодирование с побитовым расщеплением). Чтобы получить масштабируемый поток, BSAC использует альтернативный по отношению к ААС модуль кодирования квантованных коэффициентов с точным управлением скоростью потока в пределах от 16 до 64 кбит/с с шагом 1 кбит/с. Существенный выигрыш в скорости потока для стационарных гармонических и квазигармонических сигналов позволяет получить метод долговременного предсказания LTP (Long Term Prediction). В технике кодирования речи этот метод широко используется во временной области. В стандарте MPEG-4 он интегрирован в схему универсального кодера (рис. 5.8), где операции квантования и кодирования осуществляются над спектральными представлениями входного сигнала. Для работы схемы LTP кодированный сигнал предыдущего кадра переводится обратно во временную область с помощью инверсного преобразования TNS и синтезирующего БФ, в блоке LTP он сравнивается с приходящим сигналом, а полученная разность опять переводится в спектральную область. Специальный переключатель FSS (Frequency Selective Switch — переключатель с частотной избирательностью) выбирает исходный или разностный сигнал в зависимости от того, какая альтернатива в данный момент предпочтительнее. По сравнению с предсказанием из MPEG-2 ААС данный метод предсказания требует вдвое меньших ресурсов памяти и производительности процессора. Для увеличения эффективности кодирования музыкальных сигналов на низких скоростях разработан новый алгоритм TwinVQ (Transform-domain Weighted Interleave VQ — взвешивающее векторное квантование с перемежением и преобразованием областей). Основная идея — заменить обычное кодирование спектральных компонентов в ААС перемежающим векторным квантованием, приложенным к нормализованному спектру. Квантование спектральных коэффициентов осуществляется в два шага: на первом они нормализуются к некоторому пределу, на втором — квантуются с использованием векторного квантования. Процесс нормализации включает оценку спектра по шкале Барка, извлечение периодических компонентов и оценку мощности спектральных составляющих. В результате нормализации спектральные коэф- Вектор исходного сигнала 1 N >^> • 1У^1^^ 1 - ' 1 ^ 1 1 Векторное квантование со взвешиванием ^\ Г4^ ^ <^< , и/ 1 >1 г Векторное квантование со взвешиванием N И нд< / эксы ^^■««^ч^Л \ Пе / 1* > чЬ— Векторное квантование со взвешиванием N / фемежение Субвекторы Рис. 5.9. Алгоритм TwinVQ векторного квантования спектральных компонентов
130 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Речь Кодер базовый поток 6 кбит/сек z_ Ш г 2 улучшающие слои по 2 кбит/сек широкополосный улучшающий слой 10 кбит/сек Декодер А Декодер В Декодер С Декодер D 6 кбит/сек базовый сигнал 8 кбит/сек улучшенный сигнал 12 кбит/сек высококачественный сигнал 22 кбит/сек широкополосный высококачественный сигнал Рис. 5.10. Масштабируемость речевого кодека CELP фициенты выравниваются и нормализуются вдоль частотной оси. Затем нормализованные коэффициенты описываются как многомерный вектор, чередуются в субвекторы, как показано на рис. 5.9, и квантуются с использованием векторного квантования. Остальная часть алгоритма ААС остается неизменной. TwinVQ дает хорошие результаты в области скоростей от 6 до 24 кбит/с и используется в основном в универсальных кодеках MPEG-4 с масштабированием для формирования базового слоя. Для кодирования речи применяются два основных алгоритма: параметрический HVXC (Harmonic Vector eXcitation Coding кодирование с помощью гармонических векторов) и CELP (Code Excited Linear Prediction coding — кодирование с линейным предсказанием). Первый алгоритм обеспечивает более высокое сжатие, он применяется в интервале скоростей потока 2-4 кбит/с (при переменной скорости — даже до 1,2 кбит/с), работает с частотой дискретизации 8 кГц в полосе стандартного телефонного канала 300-3400 Гц. Второй алгоритм имеет несколько разновидностей, работает в двух режимах — полосы частот 300-3400 Гц с дискретизацией 8 кГц и 50-7000 Гц с дискретизацией 16 кГц, и обеспечивает скорость потока от 4 до 24 кбит/с. Оба алгоритма базируются на моделировании речи с линейным предсказанием. Поступающий речевой сигнал сравнивается с сигналом, предсказанным моделью речевого тракта, параметры модели изменяются таким образом, чтобы минимизировать разность двух сигналов, и передаются декодеру. В декодере имеется такая же модель, которая по полученным значениям параметров синтезирует речевой сигнал. В HVXC более высокая степень сжатия объясняется более грубым анализом по огибающей спектра и изменениям высоты тона. CELP использует более точный спектральный анализ с долговременным предсказанием, обеспечивая более высокое качество передачи речи. Основное преимущество обоих алгоритмов перед речевыми кодеками, стандартизованными МСЭ — масштабируемость по скорости (у CELP с шагом 200 бит/с), по полосе частот, что обеспечивает возможность работы с декодерами разной сложности. Эта возможность проиллюстрирована на рис. 5.10, где показано, что кодер выдает базовый поток и улучшающие слои, а декодеры принимают эти потоки в соответствии со своими возможностями. На рис. 5.11 наглядно показаны области применения различных алгоритмов кодирования звука, применяемых в MPEG-4. Если при кодировании натуральных звуков используется перцептуальное сжатие исходного звукового сигнала, то кодирование синтезированного звука производится путем создания его описания. Это описание передается декодеру и по нему синтезируется звук, аналогичный исходному. В стандарте MPEG-4 этот процесс реализуется в рамках формата «Структурированное аудио», допускающего передачу по каналу синте-
Глава 5. Перспективные стандарты семейства MPEG 131 секретная сотовая Интернет ISDN связь связь ^ 4 f р 10 12 14 16 2{4 3{2 4{8 6{4 кбит/с | Масштабируемый кодер | I Параметрический I | кодер | | CELP кодер | Универсальный кодер 4 кГц 8 кГц 20 кГц (полоса звука) Рис. 5.11. Области применения различных алгоритмов кодирования звука зированных звуков и музыки со* скоростями 0,01-10 кбит/с. Для описания музыкальных звуков различных инструментов разработан специальный структурированный оркестровый язык (SAOL — Structured Audio Orchestra Language), он оперирует загружаемыми в поток «инструментами». Инструмент представляет собой небольшой программный или аппаратный модуль генерации и обработки простейших сигналов, который может воспроизводить определенные звуки, в том числе и схожие со звуками музыкальных инструментов MPEG-4 не стандартизует метод синтеза, скорее он дает способ описания методов синтеза, пригодный для всех существующих и перспективных алгоритмов. Второй язык — структурированный партитурный язык (Structured Audio Score Language) предназначен для описания партитуры всех инструментов, составляющих звуковой объект. Для воссоздания звуковой сцены в декодер загружаются параметры всех инструментов, а затем в потоке передается партитура. Стандартом поддерживается механизм привязки звука к расположению объекта в пространстве сцены и его изменения при перемещении объекта, введены механизмы изменения звука в зависимости от акустических свойств пространства сцены. Одно из новшеств стандарта MPEG-4 — алгоритм преобразования текста в речь TTSI (Text-to-Speech Interface). По каналу передается текст со скоростью от 200 бит/с до 1,2 кбит/с, а декодер преобразует его в речь. В отличие от обычных синтезаторов речи, извлекающих из базы данных фонемы (единицы речи) и соединяющих эти фонемы в связную, но совершенно лишенную эмоций речь, TTSI дополняет речь характеристиками живого голоса — тембром, интонацией, акцентом, просодией (так называется система произношения ударных и неударных, долгих и кратких звуков). Поддерживаются и другие функции: синхронизация речи с синтезированным лицом говорящего, включая выражение лица и движения губ; возможность для пользователя изменить ритм, тон, громкость, пол, возраст говорящего; сменить язык; изменение характеристик речи при перемещении говорящего в пространстве сцены; возможность остановки, ускоренного воспроизведения вперед и назад без нарушения просодии и т.д. Возможные области применения TTSI — искусственный рассказчик (по запросу); синтез речи, синхронной с анимацией; синтез речи для виртуальной реальности; говорящая газета; средство дублирования для анимационных картинок; голосовой Интернет и многие другие. Во второй версии стандарта приняты дополнения и усовершенствования к существующим алгоритмам, введены новые алгоритмы. В частности, повышена устойчивость к
132 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Понижающая передискретиэация Кодер 1 Декодер 1 Ъа Кодер 2 Декодер 2 & Кодер 3 Ql О О ь» Рис. 5.12. Масштабирующий универсальный кодер MPEG-4 ошибкам в ААС, введена опция звукового кодера ААС с малой алгоритмической задержкой (Low-Delay Audio Coder — задержка 20 мс вместо нескольких сотен миллисекунд). Снижение задержки достигается уменьшением длины кадра до 512 отсчетов вместо 1024, уменьшением вдвое размера окна оконной функции, минимальным использованием резервуара битов. Ценой снижения задержки стало увеличение скорости потока для «прозрачного» канала примерно на 8 кбит/с, но такой кодер все еще лучше кодера МР-3 на скорости 64 кбит/с. Во второй версии масштабируемость кодера Универсального звука сделана более детальной (шаги 2 кбит/с вместо 16 кбит/с). Масштабируемость достигает благодаря кодированию потока звукоданных несколькими кодерами, первый из которых обрабатывает прореженный исходный поток, а каждый из последующих компрессирует разность между входным и декодированным сигналами предыдущей ступени (рис. 5.12). Для работы на очень низких скоростях введен алгоритм параметрического кодирования HILN (Harmonic and Individual Lines plus Noise — гармоники и одиночные линии плюс шум), базирующийся на представлении звукового сигнала как набора синусоид, гармоник и шумов и передаче по каналу параметров этих первичных сигналов. Частоты и амплитуды первичных сигналов квантуются с разрешением, соответствующим градации «различие едва заметно». Спектральная огибающая шума и гармонические компоненты описываются на основе техники линейного предсказания, при этом используется корреляция между параметрами в кадре и между последовательными кадрами. Этим методом можно кодировать звуковые сигналы начиная со скорости 4 кбит/с. Упомянем также специальный формат транспортного потока для звуковых применений с малой избыточностью LOAS (Low Overhead Audio Stream), возможность организации обратного канала от пользователя к источнику контента для поддержки интерактивных приложений, более устойчивую к ошибкам версию HVXC. 5.1.6. Профили и уровни стандарта MPEG-4 MPEG-4 представляет собой обширный набор средств и алгоритмов кодирования аудиовизуальных объектов. Чтобы сделать реализацию декодера экономически оправданной и облегчить проверку на соответствие стандарту, в некоторых разделах определены ограниченные наборы инструментов, называемые Профилями. Для каждого из профилей установлены один или несколько уровней, ограничивающих требования к вычислительным способностям декодера. Понятие Профиля введено для визуальных объектов, аудио, системы и описаний сцены. Однако специфика MPEG-4 потребовала некоторых дополнений по сравнению с предшествующими стандартами. В MPEG-2 видеокадр можно пред-
Глава 5. Перспективные стандарты семейства MPEG 133 ставить себе как один прямоугольный объект, занимающий всю сцену, и для него достаточно определить один профиль. В MPEG-4 объектов может быть несколько, для каждого оптимальным будет свой профиль, поэтому введена дополнительная градация, как промежуточная между уровнем и профилем — тип объекта. Этот параметр определяет синтаксис (структуру) цифрового потока для одиночного объекта. Профиль же определяет набор типов объектов, которые могут присутствовать в сцене. Для натуральных объектов определены пять типов объектов: 1) Простой — прямоугольный объект с произвольным форматом, использует простые средства кодирования, основанные на I- и P-VOP 2) Простой масштабируемый — прямоугольный объект с пространственным и временным масштабированием. 3) Базовый — производный от Простого, с добавлением B-VOP Чересстрочная развертка не поддерживается. 4) Основной — обеспечивает высшее качество, по сравнению с Базовым дополнительно поддерживает градационное кодирование формы, спрайты, чересстрочное разложение. 5) N-битовый — аналогичен Базовому, но допускает квантование плоскостей яркости и цветности с разрядностью от 4 до 12 бит. Для кодирования неподвижных натуральных визуальных объектов существует специальный тип объекта: 6) Неподвижная масштабируемая текстура неподвижное изображение произвольной формы, использует волновое кодирование и пошаговую загрузку и восстановление. Для синтетических объектов определены следующие три типа объектов: 7) Анимированная двумерная сетка — объединяет синтетическую сетку (прямоугольную или топологии Делоне) с натуральным видео, кодируемым по Базовому типу. Видео может отображаться на сетку и деформироваться путем перемещения ее узлов — это дает интересные анимационные возможности. Визуальный объект может быть любой формы. 8) Базовая анимированная текстура — анимация неподвижных изображений (таких, как в типе 6). 9) Примитивное лицо средство анимации человеческого лица. Этот тип объекта не определяет конкретное лицо, анимация может быть применена к любой выбранной модели. Профили, как уже сказано, определяют, какие типы визуальных объектов могут присутствовать в сцене. В первой версии стандарта 9 профилей, допустимые сочетания профилей и типов объектов приведены в табл.5.1. Простой профиль допускает присутствие только объектов Простого типа и предназначен в первую очередь для мобильных служб и Интернета. Он поддерживает до 4-х объектов в сцене с максимальным разрешением QCIF, три уровня ограничивают скорость потока в пределах от 64 до 384 кбит/ с, максимальную площадь, занимаемую объектом, и число макроблоков в секунду, которое декодер должен обработать. Простой масштабируемый профиль может осуществлять кодирование с масштабированием при тех же предпосылках, имеет два уровня. Базовый профиль воспринимает типы объектов Простой и Базовый, полезен для интерактивных приложений. Основной профиль создавался с учетом вещательных служб. Самый высший уровень Основного профиля поддерживает до 32 объектов Простого, Базового или Основного типа и максимальную суммарную скорость потока до 38 Мбит/с. N-битовый профиль работает с объектами Простого, Базового и N-битового типа и поле-
134 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 5.1 Профили и типы объектов MPEG-4 видео зен в специальных системах наблюдения и медицинского контроля, где требуется широкий динамический диапазон яркости и насыщенности. Из остальных профилей наибольший интерес представляет Гибридный, объединяющий натуральные (Базовый) и синтетические (все три) типы объектов. Он полезен при помещении «реального» объекта в синтетический мир и, наоборот, синтетического объекта в реальное окружение. В нижней строке табл. 5.1 указано число уровней, определенных в стандарте для каждого профиля. В табл. 5.2. показаны параметры потока для некоторых уровней. В стандарте установлены следующие точки соответствия: Простой профиль и Базовый профиль с размерами сцены QCIF и CIF, скоростями потока 64, 128, 384 кбит/с и 2 Мбит/с. Для Основного профиля нормируются форматы CIF, Рек. ВТ.601, ТВЧ со скоростями 2, 15 и 38,4 Мбит/с. Вторая версия стандарта добавила три профиля к натуральному видео: 1) Простой усовершенствованный профиль реального времени обеспечивает эффективное кодирование с использованием обратного канала (видеотелефония, телеконференции, дистанционное наблюдение).
Глава 5. Перспективные стандарты семейства MPEG 135 2) Базовый масштабируемый профиль — Табл. 5.2 поддерживает пространственное и времен- Параметры потока для некоторых профилей ное масштабирование в Базовом профиле. " видво 3) Профиль с улучшенной эффективностью кодирования — подходит для мобильного приема вещательных передач и других применений, где требуется высокая эффективность кодирования. Три новых профиля введены в синтетическое видео, в том числе Простой профиль анимации лица и фигуры. Общее число визуальных профилей достигло 15. Уже после принятия второй версии продолжается работа над дополнениями к стандарту. В частности, предполагается ввести Студийный профиль, в котором VOP с кодированием формы могли бы передаваться со скоростью несколько сот мегабит в секунду. В табл. 5.3 показаны основные параметры предлагаемого профиля. Низкий уровень этого профиля мог бы соответствовать высокому уровню профиля «4:2:2» из стандарта MPEG-2 (ср. табл. 5.3 и табл. 4.2), в двух других уровнях предлагается ввести два подуровня — с дискретизацией «4:2:2» и «4:4:4». Группа MPEG изучает кодирование 2D и 3D анимаций, цифровой кинематограф и другие вопросы. Как и для видеообъектов, в стандарте введена классификация типов объектов для звука. В общей сложности первая версия определила 15 типов объектов, часть из них базируется на алгоритме ААС, один на алгоритме Twin VQ, три типа объектов связаны с алгоритмами кодирования речи, еще четыре определяют типы объектов для синтезированных звуков. Определены 4 профиля кодирования звука: Профили г и уровни Простой профиль Базовый профиль Основной профиль L1 L2 L3 L1 L2 L2 L3 L4 Типовой размер сцены QCIF CIF CIF QCIF CIF CIF Рек. 601 1920x1088 Скорость потока, бит/с 64 к 128 к 384 к 384 к 2М 2М 15М 38,4 М Максимальное число объектов 4 4 4 4 16 16 32 32 Общая емкость памяти, макроблоков 198 792 792 594 2376 2376 9720 48960 Табл. 5.3 Параметры предлагаемого студийного профиля стандарта MPEG-4 Уровень Низкий (совместим Основной Высокий с 4:2:2 P@HL) 4:2:2 4:4.4 4:2:2 4:4:4 Максимальный размер изображения и частота кадров 1920x1088 30Гц 2048x2048 60Гц 4096x4096 120 Гц Максимальная скорость отсчетов 125337600 250675200 376012800 805306368 1207959552 Скорость цифрового потока, Мбит/с 300 600 800 1200 2500 Квантование, дискретизация 10 битов 4:2:2 10 битов 4:2:2 10 битов 4:2:2 4:4:4 10/12 битов 4:2:2 10/12 битов 4:2:2 4:4:4
136 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 5.4 Табл. 5.5 Требования к декодеру звука Профили и типы объектов MPEG аудио масштабируемого профиля ^ч Профили Типы объектов N. ААС Основной ААС с масштабируемой тактовой частотой ААС Простой ААС с долговременным предсказанием ААС Масштабируемый Twin VQ CELP HVXC TTSI Основной С интетический Wavetable Синтезир Общий MIDI Алгоритмический синтез Число уровней Речевой • • • 2 Масштабируемый 4 Основной 4 Синтетический • • • • 3 Тип объекта ААС Основной ААС Простой ААС с масштабируемой тактовой частотой ААС с долговременным предсказанием ААС Масштабируемый TwinVQ CELP CELP CELP HVXC Тактовая частота,кГц 48 48 48 48 48 24 8 16 8/16 8 Быстродействие процессора, млн. операций/с 5 3 4 4 5 2 1 2 3 2 Емкость памяти, тыс. слов 5 3 3 4 4 3 1 1 1 1 1) Речевой профиль — совместим с тремя «речевыми» типами объектов, имеет два уровня, допускает до 20 объектов в сцене одновременно. 2) Масштабируемый профиль — обеспечивает высококачественное кодирование при низкой скорости цифрового потока и гибкое приспособление к изменениям скорости в канале, наилучшим образом приспособлен для передачи звука в Интернете. Число объектов в сцене, число потоков и частоты дискретизации определяются четырьмя уровнями, определенными в условных «единицах сложности» — производительности процессора в миллионах операций в секунду (PCU) и объеме памяти в тысячах слов (RCU): Уровень 1: один моно объект любого типа, частота дискретизации до 24 кГц. Уровень 2: один стерео или два моно объекта, частота до 24 кГц; Уровень 3: один стерео или два моно объекта, частота до 48 кГц; Уровень 4: один объект 5.1 или группа объектов, частота до 48 кГц, сложность до 30 PCU и 19 RCU.
Глава 5. Перспективные стандарты семейства MPEG 137 В качестве примера в табл. 5.4 приведены требова- Табл. 5.6 ния к декодеру, работающему в одном из уровней дан- Профили графических средств ного профиля. и описаний с*ены в MPEG-4 3) Синтетический профиль группирует типы объектов синтезированного звука, может использоваться в тех случаях, когда источником звука служит не микрофон и требуется обеспечить передачу при очень низких скоростях. 4) Основной профиль — наиболее сложный профиль, объединяющий возможности всех остальных; пригоден для звуков всех видов, обеспечивает высочайшее качество звучания. Примеры применения — запись на DVD и мультимедийное вещание. Профиль имеет 4 уровня. Соответствие звуковых профилей и типов объектов показано в табл. 5.5. Во второй версии стандарта введены 4 новых профиля: Высококачественный (High Quality), LD (Low Е)е1ау)-профиль (с малой задержкой), Натуральный (Natural) и Межсетевой мобильный (Mobile Audio Internetworking). Большое число возможных алгоритмов заставило ввести также три графических профиля, четыре профиля описаний сцены и один профиль дескрипторов объектов. Эти профили перечислены в табл. 5.6. 5.1.7. Идентификация и защита интеллектуальной собственности Происходящие в последние годы процессы развития новых, обезличенных средств обмена мультимедийной информацией, таких как международная компьютерная сеть Интернет, изменение самой концепции создания контента, в которой могут теперь участвовать не только автор, но и пользователи, остро поставили вопросы идентификации и защиты прав интеллектуальной собственности. В условиях, когда обладатели авторских прав не могут проследить за использованием своих произведений и получить причитающееся им вознаграждение, они не заинтересованы в предоставлении своих произведений для размещения в Сети или мультимедийных базах данных. Классическим примером стала недавняя история с музыкальными файлами формата .трЗ, когда появление довольно простой специализированной программы по поиску и копированию таких файлов, доступной всем в Сети, автоматически лишило источника доходов многих и многих композиторов и исполнителей музыкальных произведений. MPEG-4 предоставляет тщательно проработанный механизм защиты прав интеллектуальной собственности, достигаемой благодаря добавлению к кодируемым медиа-объектам специального идентификатора интеллектуальной собственности (ИИС), несущего сведения о контенте и указания на правообладателя. Эти данные являются частью дескриптора ЭП, описывающего поток и связанного с ним. Число ИИС, связанных с одним потоком, не ограничено, в то же время один ИИС может описывать несколько медиа-объектов. Наличие ИИС позволяет осуществлять защиту прав, контроль за использованием и расчеты авторского вознаграждения. В стандарте разработан интерфейс с системой управления и защиты интеллектуальной собственности, включающий спе- Средство Графика Описание сцены Дескриптор [объекта Профиль Простой 2D Полный 2D Полный Звуковой | Простой 2D Полный 2D Полный | Базовый
138 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю циальные дескрипторы и определенный формат элементарных потоков. Эти элементы цифрового потока осуществляют взаимодействие системы управления с абонентским терминалом, передавая ему необходимую информацию и предписывая действия по защите интеллектуальной собственности. 5.1.8. Перспективы применения MPEG-4 в вещании Как мы уже отмечали, стандарт MPEG-4 не предназначен на замену MPEG-2 в ТВ вещании в его нынешнем виде, но в наш век быстрых изменений можно представить себе, что и традиционная концепция ТВ вещания будет заметно изменяться. Начало этим изменениям положено постепенным переходом на цифровое вещание, предоставляющее новые возможности по количеству программ, качеству изображения и звукового сопровождения, передаче дополнительных данных и предоставлению новых услуг. Можно с определенной степенью уверенности прогнозировать слияние ТВ приемника, телефона, спутникового и кабельного терминалов (в дальнейшем к ним присоединится и персональный компьютер) в единое информационное устройство, получающее информацию из общей информационной сети по высокоскоростному цифровому каналу (проводному, оптическому или спутниковому). Большая часть ТВ программ может передаваться по такому каналу в свободное от нагрузки (ночное) время, загружаясь в емкую память информационного блока, в реальном времени будут передаваться только новости и программы, рассчитанные на интерактивное взаимодействие со зрителем [5.4, 5.5]. Теперь представим себе, как расширит возможности восприятия добавление к традиционной программе дополнительной информации в форме наложенного текста, неподвижных изображений (возможно, полупрозрачных), двумерной и трехмерной графики, дополнительных зрительных и звуковых образов. Часть этих улучшений используется и сегодня, но это происходит по воле вещателя, и зритель не в состоянии что-либо изменить. В MPEG-4 дополнительная информация передается вместе с объектом и ею легко управлять нажатием кнопки. Вы, например, можете вызвать на экран ответ на вопрос викторины, а можете убрать его и самостоятельно поломать голову над загадкой. Возможно изменить точку взгляда на сцену, как бы сменить положение камеры. Это дает возможность лучше воспринять спортивное соревнование или музыкальное шоу. В многоканальной звуковой системе можно выбрать число каналов, язык звукового сопровождения и даже самому включиться в оркестр, исполнив партию на любом понравившемся вам инструменте. Широкие возможности открывает MPEG-4 в интерактивной среде. Возможности MPEG-4 позволят вам установить связь с несколькими людьми и организовать совместный просмотр программы, изменяя по договоренности ход сюжета, или поиграть в сетевые игры с трехмерными изображениями. А телемагазин?! Насколько расширятся здесь возможности покупателя по всесторонней оценке будущей покупки. Вы можете получить дополнительную информацию о заинтересовавшем вас объекте, например, новой марке автомобиля, подведя к нему курсор и нажав кнопку на пульте, можете рассмотреть автомобиль со всех сторон, пригласить консультанта (виртуального, разумеется) и выслушать его разъяснения, узнать цену и наличие модели на складе. Вы можете послать приятелю изображение автомобиля и всю информацию о нем по электронной почте и тут же получить его совет. Ваша фантазия, уверен, подскажет еще немало способов использования необыкновенных возможностей нового стандарта.
Глава 5. Перспективные стандарты семейства MPEG 139 5.2. СТАНДАРТ ОПИСАНИЯ МЕТАДАННЫХ MPEG-7 Глобальный информационный взрыв остро поставил вопрос: как получить доступ к нужной информации на планете, если вы не знаете, где она находится? Хороший ответ на это дают Интернет и WWW — Всемирная паутина. Благодаря поисковым серверам, таким как АльтаВиста или Йеху, можно в считанные секунды по ключевым словам найти в сети любой текстовой документ. Переход телевидения к цифровым технологиям и быстрое развитие техники цифрового сжатия вызвали в последние годы столь же быстрый рост объема аудиовизуальной информации. Информация может быть представлена в различных формах (неподвижные изображения, видео, графика, 3D модель, звук, речь), может быть записана на носитель или быть живой, аналоговой или цифровой, может восприниматься человеком, а может циркулировать в компьютерной системе (видеонаблюдение, «умные» видеомагнитофоны). Материал может включать информацию о том, как эти элементы объединяются в мультимедийном представлении («сценарии»). Специальные типы данных могут включать выражение лица и персональные характеристики. Одновременно с ростом объема мультимедийного контента в мире растет и сложность доступа, идентификации и управления этими ресурсами из-за отсутствия адекватной схемы индексации. В отличие от текста, для поиска изображений, звуков и их сочетаний нет пока общепринятых методик их описания и обобщения до такой степени, чтобы, введя в поисковую машину несколько нот, получить Первый фортепьянный концерт Чайковского или по нескольким кадрам найти нужный кинофильм. Нужно разработать формы представления аудиовизуальной информации, отличные от формы сигнала, отсчетов, кадров или даже объектно-ориентированного контента. Именно такую задачу — дать набор стандартизованных средств описания мультимедийного контента, обладающий гибкостью, простотой, наглядностью и в то же время высокой степенью универсальности — поставили перед собой эксперты MPEG. В 1996 г. группа MPEG, только что успешно завершившая создание стандарта MPEG-2, приступила к разработке нового стандарта, для которого было выбрано «счастливое» число 7 В отличие от MPEG-1, 2, 4, которые нацелены на кодированное представление аудиовизуальных объектов, MPEG-7 должен стандартизовать набор дескрипторов, пригодный для описания различной мультимедийной информации. Завершение работы над стандартом ожидается к сентябрю 2001 года, но на сегодняшний день уже проделана большая работа, показывающая основные пути к достижению цели. Стандарт MPEG-7 называется «Интерфейс описания мультимедийного контента» [5.6] и нацелен на стандартизацию следующих основных элементов: - базового набора Дескрипторов (D — Descriptor), используемых для описания различных признаков мультимедийного контента; - предопределенных структур Дескрипторов и соотношений между ними, называемых Схемами Описания (СО) (DS — Description Schemes); языка определения Дескрипторов и Схем Описания, названного Язык Определения Описания (DDL — Description Definition Language); - путей кодирования Описаний. Описания MPEG-7 (набор подтвержденных СО) необходимо связать с контентом для обеспечения последующего быстрого и эффективного поиска его пользователем. Описание может быть физически размещено совместно с описываемым аудиовизуаль-
140 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ным материалом, или передаваться в том же потоке, в той же системе хранения, или описания могут храниться отдельно. Следовательно, требуется механизм, который бы связывал материал с описанием независимо от места хранения. Разработчики стандарта начали с терминологии. Были определены основные понятия [5.7]: Данные - - аудиовизуальная информация, которая может быть описана MPEG-7; Признак — отличительная особенность Данных, которая означает что-то для кого-то; Дескриптор — представление Признака; он определяет синтаксис и семантику представления Признака; Значение Дескриптора — подтверждение Дескриптора для заданного набора Данных; Схема Описания — определяет структуру и семантику отношений между компонентами, которыми могут быть как Дескрипторы, так и СО; Описание — состоит из СО и набора значений Дескрипторов, описывающих Данные; Кодированное Описание — Описание, которое закодировано для выполнения некоторых требований (эффективность сжатия, устойчивость к ошибкам, случайный доступ и т.д.); Язык Определения Описания — язык, позволяющий создать новые Схемы Описания и, возможно, Дескрипторы, а также расширить и модифицировать существующие СО. Стандарт состоит из следующих частей: 1. MPEG-7 «Системы» средства, необходимые для подготовки Описаний; средства для защиты интеллектуальной собственности. 2. MPEG-7 «Язык Определения Описания» - язык определения новых СО и, возможно, новых Дескрипторов. 3..MPEG-7 «Аудио» — Дескрипторы и СО, имеющие дело только с аудиоконтентом. 4. MPEG-7 «Визуальные средства» Дескрипторы и СО, имеющие дело только с визуальным контентом. 5. MPEG-7 «Обобщенные объекты и Схемы Описания мультимедиа» — Дескрипторы и СО, имеющие дело с универсальным контентом. 6. MPEG-7 «Рекомендованное программное обеспечение» • программные реализации частей стандарта. 7. MPEG-7 «Соответствие» — процедуры тестирования на соответствие MPEG-7. В стандарте предполагается разработка дескрипторов четырех типов [5.7, 5.8]. Дескрипторы первого типа передают непосредственно содержание материала (content description — описание контента) и могут быть низкого и высокого уровня. Дескрипторы низкого уровня передают структуру материала — цвет, текстуру, форму; параметры движения для видео; высоту тона, тембр, темп, интенсивность — для звука, и т.п. Многие признаки низкого уровня могут извлекаться из контента автоматически, с помощью компьютеров. Дескрипторы высокого уровня описывают смысловое содержание контента и будут делаться вручную. Второй тип дескрипторов (content management — управление контентом) будет содержать информацию о времени и цели создания материала, об авторстве и правах собственности, третий тип (content organization — организация контента) позволит классифицировать материал по различным признакам и может использоваться для его анализа и исследований, а четвертый тип (navigation and access — навигация и доступ) — для быстрого поиска контента по краткому описанию аудиовидеосодержания. В табл. 5.7 даны примеры некоторых дескрипторов, введенных в тестовую модель стандарта. Каждый дескриптор описывает один из группы однородных признаков. Цветовое пространство, например, включает известные форматы RGB, YUV, Monochromic video и
Глава 5. Перспективные стандарты семейства MPEG 141 Табл. 5.7 Некоторые дескрипторы стандарта MPEG-7 Тип Визуальный Звуковой Признак Базовая структура Цвет Текстура Форма Движение Характеристики речи Тембр Мелодия Дескрипторы Гистограмма Цветовое пространство. Преобладающий цвет. Гистограмма цвета. Квантование цвета | Пространственное распределение интенсивности по изображению. Однородная текстура | Рамка, ограничивающая объект. Форма, ограничивающая область пространства. Контурная форма. 3D дескриптор формы Движение камеры. Траектория движения объекта. Параметрическое движение объекта. Двигательная активность. Особенности траектории движения (скорость, направление, ускорение) | Структура слов и фонем Соотношение четных и нечетных гармоник | Когерентность гармонических пиков Мелодическая огибающая и ритм др., движение камеры описьгоается восемью отдельными параметрами, и т.д. В таблице часто встречается слово «гистограмма». Оказалось, что это одно из наиболее мощных и устойчивых средств обобщения и анализа свойств контента. Из этих примеров можно понять, какими категориями и понятиями оперирует стандарт. Каждый дескриптор определяется нормативной и ненормативной (необязательной) частями. Нормативная часть содержит синтаксис, семантику и двоичное представление этих описаний; необязательная часть — рекомендуемые методы извлечения и согласования схожести признаков. Более высокий уровень обобщения представляют собой Схемы Описаний (СО). При их разработке MPEG использует следующие концепции для описания аудиовизуального контента: - синтаксическая структура физическая и логическая структура аудиовизуального контента, т.е. структура, базирующаяся на временных сегментах и/или пространственных областях;
142 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Схема описания (СО) аудиовизуального контента Синтаксическая СО Сегмент СО X СО синтаксически- семантических связей Область СО СО событий Гриф связей сегмент/область Гриф связей событие/объект Medialnfo СО Metalnfo СО Суммарная СО СО модели Рис. 5.13. Обобщенная структурная схема описания аудиовизуального объектааудиовизуального объекта - семантическая структура — классификация, основанная на семантическом смысле, т.е. структура, базирующаяся на временных событиях и /или пространственных объектах; - синтаксически-семантические связи ассоциации между синтаксическими и семантическими элементами. СО так же, как и Дескрипторы, могут быть разного типа. Структурные или синтаксические схемы имеют дело со структурой аудиовизуальной информации, ее отдельными сегментами и их пространственно-временными взаимоотношениями, семантические схемы описывают смысловое содержание материала — объекты, действия, события. Схемы, описывающие модель содержания, базируются на дескрипторах-классификаторах и будут полезны при обработке и анализе материала. Находящаяся в стадии разработки Обобщенная СО аудиовизуального контента представляет собой объединение всех предложений и вкладов, поступивших от экспертов. На рис. 5.13 показаны структура и состав СО. Одна из основных проблем в ее разработке — ее размер и сложность. Предстоит исключить избыточность и взаимное наложение функций, чтобы получить работоспособную схему. Активно ведется разработка языка DDL, который должен быть в состоянии выразить пространственные, временные, структурные и концептуальные соотношения между элементами СО. Он также должен устанавливать связи между Описаниями и данными, которые они описывают, утверждать дескрипторы для различных типов данных как простых (целые числа, текст, дата, время), так и составных (гистограммы, сочетание перечисленных типов). Достигнуто согласие, что язык DDL должен базироваться на синтаксисе языка XML (Extended Markup Language), используемого в Интернете для описания представления текстовых документов. Потенциальная область применения стандарта MPEG-7 очень широка и включает образование, журналистику, культуру (музеи, картинные галереи), архивы кино, телевидения и радио, службы криминальных расследований (наблюдение, опознание, судебные архивы), дистанционное зондирование (картография, управление естественными ресурсами, экология), телемедицину и многие другие области.
= 6 = ПЕРЕДАЧА КОМПРЕССИРОВАННЫХ СИГНАЛОВ ПО КАНАЛАМ СВЯЗИ 6.1. ПРОЕКТ DVB И ОСНОВНЫЕ СТАНДАРТЫ ГРУППЫ DVB К началу 90-х годов стало ясно, что мир стоит на пороге решающих перемен в области телевизионного вещания. Разработка и принятие стандарта MPEG-1, а затем и MPEG-2 показали, что в короткие сроки можно достичь значительного увеличения пропускной способности вещательных каналов, беспрецедентного улучшения качества изображения и звукового сопровождения, развития новых служб. В то же время сложность алгоритмов цифрового сжатия требовала интегральных микросхем высокой степени интеграции, разработка которых экономически оправданна только при очень больших объемах производства. Не вызывало сомнений, что нужны единые стандарты обработки и передачи сигналов, и первыми это поняли европейцы. В 1993 г. группа ведущих европейских компаний-производителей вещательного оборудования образовала некоммерческую организацию по разработке таких стандартов, получившую название DVB Project (Digital Video Broadcasting Project — проект цифрового ТВ вещания). К настоящему моменту членами DVB Project являются около 300 организаций и компаний-производителей оборудования, вещателей, операторов связи из более чем 30 стран не только Европы (включая Россию), но и других континентов. Для вступления в DVB достаточно подписать Меморандум о взаимопонимании, в котором абитуриент подтверждает согласие с принципами DVB и обязуется придерживаться их в своей деятельности. Этих принципов всего три: оперативная реакция на требования рынка; обеспечение взаимной совместимости устройств; открытые спецификации (согласованные, принятые стандартизирующими органами и опубликованные для общего пользования). Организация-член проекта имеет право участвовать в работе секций, рабочих групп, Генеральной ассамблеи и пользоваться общими результатами исследований. Структура организации показана на рис. 6.1. Она включает четыре секции, высший орган — Генеральная ассамблея из полномочных представителей участников, в промежутках между сессиями работой организации руководит Совет управляющих. Штаб-квартира DVB Project находится в Женеве. Разработка стандарта начинается с того, что Коммерческая секция составляет Требования пользователя, исходя из реальных запросов рынка. Техническая секция, наиболее многочисленная, в своих рабочих группах (а их более 10) разрабатывает техничес-
144 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Совет Управляющих (СВ) х .. \ ^ч^ Генеральная ассамблея (GA) \ Коммерческая секция (СМ) 1 Права интелектуальной собственности (IPRM) ^ С 1 Реклама и коммуникации Техническая секция (ТМ) ■■ / "~>ч Рис. 6.1. Структура организации DVB Project кие спецификации нового стандарта. Основной принцип работы этой организации, как и всех других международных организаций, — достижение полного консенсуса. После принятия Советом управляющих проект стандарта передается на утверждение в одну из европейских организаций по стандартизации — ETSI, CENELEC (Comite European de Normalisation Electronique — Европейский комитет по стандартизации в области электроники), DAVIC (Digital Audio-Video Council — Совет по цифровым аудиовизуальным средствам) и другие. Сам DVB Project полномочиями по стандартизации не обладает. Он выпускает рекомендательные документы — «Голубые книги», содержащие разъяснительную и справочную информацию к стандартам и руководства по их применению. За прошедшие годы ETSI принял более 40 стандартов, подготовленных DVB Project в самых разных областях цифрового вещания. Одним из первых решений организации было решение принять за основу всех разработок стандарт цифрового сжатия MPEG-2. Однако, как мы знаем, MPEG-2 не охватывает передачу цифрового сигнала по каналам связи и его необходимо было дополнить документами, регламентирующими обработку сигнала перед подачей в канал. Второе важное решение, которое принял DVB Project, - использование общего MPEG-2 мультиплекса во всех средах распространения и максимальная унификация методов помехоустойчивого кодирования и модуляции. Во всех случаях используется код Рида-Соломона с единым размером блока, и в тех случаях, где это необходимо, — сверточный код с единым набором относительных скоростей. Очень важна для широкого круга применений концепция «контейнера данных» — создание универсального цифрового канала, переносящего видео, аудио, данные пользователя в любых пропорциях и с высокими показателями качества обслуживания. Для каждой транспортной среды разработан стандарт обработки и передачи транспортного потока, учитывающий ее специфику и в то же время максимально унифицированный со смежными стандартами. Для упрощения взаимного обмена программами выбраны такие параметры обработки, чтобы пропускная способность и число передаваемых ТВ программ во всех случаях оставались бы примерно одинаковыми. Документ для спутникового вещания получил сокращенное наименование DVB-S (Satellite спутниковый), для сетей кабельного телевидения — DVB-C (Cable — кабельный), для
Глава 6. Передача компрессированных сигналов по каналам связи 145 наземного (эфирного) телевидения — DVB-T (Terrestrial наземный). Отдельные стандарты выпущены для распределительных СВЧ сетей (MMDS), сотовых сетей миллиметрового диапазона (LMDS), коллективных установок спутникового телевидения (SMATV) и других транспортных сред. Разработаны стандарты передачи телетекста, субтитров, графики, данных пользователя. Наконец, для обеспечения полной совместимости цифровых потоков, передаваемых в разных средах, разработаны и внедрены единые таблицы информации о службах SI (Service Information), описывающие структуру размещения служебных данных в транспортном потоке. 6.2. ТАБЛИЦЫ ИНФОРМАЦИИ О СЛУЖБАХ SI В дополнение к трем обязательным PSI таблицам MPEG-2, описанным в четвертой главе, DVB Project ввел еще семь таблиц информации о службах NIT, BAT, SDT, EIT, RST, TOT/TDT, ST (четыре из них — обязательные), которые должны передаваться в транспортных потоках, предназначенных для вещания, и описывать состав и параметры сети, букеты программу сервисы и события при создании многопрограммной вещательной среды [6.1]. В DVB приняты следующие определения этих терминов: сеть -- совокупность транспортных потоков, передаваемых в единой системе доставки; сервис — набор элементарных потоков (видео, аудио, данные), принадлежащих одной программе и имеющих общую временную базу; букет программ — совокупность сервисов, предлагаемых абоненту как единый программный продукт; событие — группа элементарных потоков, принадлежащих одному сервису и имеющих определенное время начала и окончания. DVB ввел также группу идентификаторов, названных кодами 57 и используемых для описания положения DVB системы среди других аналогичных систем. Основные коды SI приведены ниже [6.2]: network_id — определяет сеть среди DVB систем; original_network_id — идентификатор первичной сети, из которой ТП передается в данную сеть; transport_stream_id — определяет ТП внутри сети; service__id — определяет сервис (программу) в составе ТП (аналогично program_number в PSI); bouquet__id — определяет букет в рамках DVB системы; event_id — определяет событие в составе сервиса. Таблицы информации о службах передаются в отдельных пакетах с зарезервированными значениями PID (табл. 6.1). Как и таблицы PSI, они перед вводом в Табл. 6.1 Зарезервированные значения идентификаторов таблиц PSI/SI Таблица PAT CAT РМТ ВТ SDT NIT ВАТ TDT ТОТ RST table_ id 0x00 0x01 0x02 0х4Е 0x42 0x40 0х4А 0x70 0x73 - РЮ 0x0000 0x0001 указано в PAT 0x0012 0x0011 0x0010 0x0011 0x0014 0x0014 0x0013
146 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю MPEG-2 PID 0x0000 PAT PID 0x0001 CAT РМТ NIT DVB (обязательные) PID 0x0010 NIT данного потока PID 0x0011 SDT данного потока PID 0x0012 EIT данного потока (текущее/ следующее PID 0x0014 DVB (по выбору) PID 0x0010 NIT других PID 0x0011 PID 0x0011 пакеты ТП сегментируются в одну или более секций. Размер секций не должен превышать 1024 байтов. Если конец секции при вводе в ТП не соответствует концу пакета ТП, оставшаяся часть пакета заполняется стаффинговыми байтами OxFF. Каждая секция однозначно интерпретируется набором следующих параметров: table_id: определяет, какой таблице принадлежит секция; table_id_extension: используется для идентификации подтаблицы (подтаблицами называются части таблицы, описывающие определенную сеть, ТП или сервис); section_number_id: позволяет декодеру собирать секции конкретной подтаблицы в исходном порядке; если секция фрагментирована, идентификатор используется для проверки того, все ли части приняты; version_number: возрастает на единицу каждый раз, когда содержание таблицы изменяется; current_next__indicator: каждая секция может быть определена как действительная «сейчас» или «в будущем», что дает возможность приемнику-декодеру подготовиться к изменению SI. Полная совокупность таблиц транспортного потока MPEG- 2/DVB показана на рис. 6.2 [6.3]. Таблица сетевой информации NIT (Network Information Table) содержит зарегистрированное в ETSI имя сети (network_id) и сведения о всех передаваемых транспортных потоках, по которым приемник сможет настроиться на прием, — спутник, орбитальная позиция, ствол, поляризация, метод модуляции (для спутниковой сети), номер частотного канала (для кабельной сети и эфирного ТВ), частота, символьная скорость, относительная скорость кодирования. Таблица NIT содержит два подраздела — Таблицу данной сети (table-id = 0x40) и Таблицы других сетей (table-id - 0x41). Передача последней не обязательна. Таблица информации о событиях EIT (Event Information Table) содержит сведения о начале и окончании текущего, еле- рис< вд Совокупность таблиц PS|/S, SDT других PID 0x0012 EIT данного потока (планируемое) PID 0x0012 EIT других потоков (текущее/следу ющ ее,планируемое) I PID 0x0013 RST PID 0x0014 ТОТ PID от 0x0010 до 0x0014 ST
Глава 6. Передача компрессированных сигналов по каналам связи 147 дующего и будущих событий, необходимые для работы электронного путеводителя по программам (EPG). Описание события включает следующие данные: идентификатор события event_id; время начала; длительность события; код языка; индикатор скремб- лирования; название события; краткое описание. Прочитывая эту таблицу, декодер автоматически вносит данные в соответствующие графы путеводителя. Таблица EIT существует в двух вариантах: укороченном (только текущее и следующее события) и полном (планируемые события на срок обычно от 1 до 7 и более суток). Краткая таблица для данного потока является обязательной, она передается в двух секциях с номерами 0x00 (текущие события) и 0x01 (следующие события). Для передачи таблицы планируемых событий выделяется 16 подтаблиц с table-id 0x50...0x5F для данного потока и 0x60...0x6F для других потоков. В каждой подтаблице 256 секций делятся на 32 сегмента по 8 секций, и каждый сегмент содержит информацию о событиях, которые начинаются в пределах трехчасового временного отрезка. Секция таблицы EIT, в отличие от других, содержит до 4096 байтов, и данные таблицы планируемых событий могут скремблироваться [6.2]. Полная таблица данного потока и таблицы EIT других потоков необязательны для передачи в системе вещания. Таблица объединения букета программ ВАТ (Bouquet Association Table) описывает все службы, принадлежащие определяемому букету, и позволяет пользователю работать с меню программ данной сети и выбирать интересующую его службу, не используя сведений о частоте настройки и других параметрах потоков. Как и другие таблицы, ВАТ включает идентификатор таблицы 0х4А и в качестве его расширения — идентификатор данного букета программ. Таблица описания служб SDT (Service Description Table) описывает службы, передаваемые в определенном ТП, и содержит их названия и некоторые необязательные параметры: код языка, состояние службы и др. Наличие подтаблиц с информацией о данном ТП — обязательно, о других ТП данного букета или данной сети — по выбору. В качестве расширения table_id таблица SDT содержит важный параметр — идентификатор транспортного потока transport_stream_id. Таблица времени и даты TDT (Time and Data Table) содержит всемирное координированное время (UTC Universal Time Co-ordinated), которое может быть использовано для обновления текущего времени в приемнике-декодере. Таблица укладывается в одну секцию длиной 66 байтов. К таблице TDT тесно примыкает таблица смещения времени ТОТ (Time Offset Table), сообщающая приемнику-декодеру временной сдвиг относительно UTC для разных регионов страны. Этот сдвиг может быть использован для расчета и индикации местного времени на табло приемника или в электронном путеводителе по программам. Значение сдвига уточняется при переходе от зимнего времени к летнему и обратно. Таблица состояния событий RST (Running Status Table) служит для быстрого обновления данных при изменении одного или нескольких событий и передается только при изменении событий. Посылаемые после нее таблицы EIT должны содержать уже уточненные данные. Пустая таблица ST (Stuffing Table) подставляется при отключении таблиц NIT, ВАТ, EIT, SDT, RST и потому может передаваться с PID от 0x0010 до 0x0014. На рис. 6.3 состав таблиц проиллюстрирован на примере таблиц NIT (а) и SDT (б), передаваемых в одной из вещательных сетей и отображаемых на экране анализатора транспортного потока. Здесь же для наглядности показана секция таблицы EIT в шест-
148 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю О'/ |-table„id-64(0x40) У- sectioi\.$yntax_indicator «1b у reserved J uture_u$e - 1 b [-reserved "11 b у sectionjength - 51 (0x0033) [•netwofkjd- 318 (0x013E) preserved-11 b У vweonjiumber ■ 0 (0x00) У currenLnext_indcator -1b У sectiorunumber - 0 (0x00) У lasL$ection_number - 0 (0x00) У reservedj uhjre_ute -1111b network descriptors B- network name descriptor (0x40) I-4E54 56 20 49 6E7465 726E6174 reservedJuture.use -1111b transport streams 6-transport_stream_id « 61 (0x0030) У original.network.id - 318 (0x013E) HreserveoLfuture_use-1111 b B- transport stream descriptors Э- satellite delivery system descriptor (0: L-011938 00 01 30 81 02 75 00 0- L-CRC32-0x95F6ABB8 a) ^ ^j/f r-tablejd*bbiux44 У section_syntaxJndicator -1b У re$erved_future_u$e -1 b I- reserved -11b У sectionjength - 253 (OxOOFD) [-transporLstreamJd«61 (0x0030) t-reserved = 11 b У version_number «18 (0x12) У current_next_indicator -1b У section.number - 0 (0x00) У lasLsection.number - 0 (0x00) У original_netwock_id - 318 (0x013E) У reserved_future_u$e -11111111b 0-services ф-service.id-7101 (0x1 BBD) У re$erved_future_u$e = 111111 b r-EIT_schedule.flag-0b bEITjxesentJotowingJIag «1b У ruminflLstatus -100 b У free_CA_mode «1 b B- service descriptors Eh service descriptor (0x48) If 0111 4E 54 56 20 49 6E 74 65 7; U-servicelid-n02(0x1BBE) EJ- service.id « 7103 (0x1 BBF) Ш- servicejd - 7104 (0x1 ВС0) ГО- servicejd - 7105 (0x1 BC1) B- serviced - 7106 (0x1 BC2) У reserved J uturejjse «111111 b UEIT_schedulej7ag-0b f-EIT^presentJoUowingLflag -1b У rumingLStatus -100 b У \ ree_CA_mode -1b B- service descriptors B- service descriptor (0x48) L-01114E54 56 20 49 6E74657. L-CRC 32-0xCD8FEC11 6) 00 01 02 03 04 05 06 07 08 09 0a 0b 0 12 3 456789abcdef 47 •• 12 13 01 20 If 43 ca 8c 20 45 00 00 30 00 00 Id 4d lb 72 75 73 15 01 ЬС Ь8 с9 bO 20 b4bb cf 20 CO ЬО Ь7 be cb c8 bb b5 bd Ь8 Ь9 01 20 84 42 29 65 f i tt tt tt ti f f f £ tt ti tt tt tt ti tt tt tt ti tt tt tt ti tt tt tt ti tt tt tt ti tt tt tt ti E ff f f f f f f f f f f f f f f tt tt tt tt С f f f f tt tt tt tt tt tt tt tt tt tt I tt tt tt tt tt tt tt tt tt tt tt tt I tt tt tt tt tt tt tt tt tt tt tt tt I tt tt tt tt tt tt tt tt tt tt tt tt I tt tt tt tt tt tt tt tt tt tt tt tt I tt tt tt tt tt tt tt tt tt tt tt tt С tt tt tt tt tt tt tt tt tt tt tt tt £ tt tt tt tt tt tt tt tt В СЁ. Е..0. ..H.IU3..c*^" '» I Jf-w£fc»u4>». . B)eVmmmTO mmrnmvm ОДДОДОЮТЮТДО? ififtrtnttttrtHHrtflfiHOT IttttfiHhrtrtHflrtHHflOT 1HHHHttHOTW1№W IHHrtnrtrtflrtrtHtfJYYtf mnmmnm тояниннмда в) 01 4? II 12 13 01 20 1С 43 ca 8c 20 45 00 00 30 00 00 Id 4d lb 72 75 73 15 Olbf Ь8с9 bO 20b4bb c£ 20 cObO b7 be cb c8 bbb5bdb8 b9 01 20 84 42 29 65 tt tt tt tt tt tt tt tt tt tt tt tt tt tt tt tt tt 01000111 00000001 11001010 00000000 00000000 01110010 00000001 10110000 11001111 10110111 10111011 10111001 01000010 11111111 11111111 11111111 11111111 11111111 00000000 00100000 10001100 00000000 00011101 01110101 10111111 00100000 00100000 10111100 10110101 00000001 00101001 11111111 11111111 11111111 11111111 11111111 00010010 00011111 00100000 00110000 01001101 01110011 10111000 10110100 11000000 11001011 10111101 00100000 01100101 11111111 11111111 11111111 11111111 11111111 oooiooii 01000011 01000101 00000000 00011011 00010101 11001001 10111011 10110000 11001000 10111000 10000100 11111111 11111111 11111111 11111111 11111111 11111111 Рис. 6.З. Элементы транспортного потока на экране анализатора: а) таблица NIT; б) таблица SDT; в) пакет таблицы EIT в шестнадцатиричном формате; г) пакет EIT в смешанном шестнадцатиричном/двоичном формате г) . .С I, Е ..0. ..И. г us. ■i.t ' '» I A' •Wtt B)ef дат mi «WWW*
Глаза 6. Передача компрессированных сигналов по каналам связи 149 надцатиричной форме (в) и в исходной двоичной (г), как она передается в транспортном потоке. На рис. б.Зв хорошо видна структура пакета из 188 байтов, первый байт пакета — синхробайт 0x47, часть пакета занята пустыми байтами OxFF. Отметим, что таблицы TDT и ТОТ имеют одинаковый PID, так же как SDT и ВАТ. Правилами DVB установлена следующая периодичность передачи SI таблиц: — SDT для данного потока, EIT краткая для данного потока — не реже 1 раза в 2 с; — NIT, BAT, SDT для других потоков, EIT краткая для других потоков, EIT полная на ближайшие 8 дней должны передаваться не реже 1 раза в 10 с; EIT полная на последующие дни, TDT/TOT — 1 раз в 30 с. 6.3. СТАНДАРТ DVB-S 6.3.1. Элементы спутникового вещания Спутниковое ТВ вещание было и остается самым быстрым, надежным и экономичным способом подачи ТВ сигнала высокого качества в любую точку обширной территории. Такие преимущества спутникового вещания, как ничтожные затраты энергии на поддержание искусственного спутника Земли (ИСЗ) в заданной точке орбиты, даровой источник энергии для энергоснабжения бортового ретранслятора Солнце, незначительное влияние атмосферы и географических особенностей окружающей местности на устойчивость прохождения сигнала, обусловили широкое развитие спутникового вещания во всем мире. Достаточно сказать, что в Европе более 60% домовладений получают ТВ программы со спутников, непосредственно или через кабельную сеть. Все вещательные спутники размещаются на так называемой геостационарной орбите (ГО) круговой орбите высотой 35 786 км в плоскости экватора. Находясь на ГО, спутник неподвижен относительно поверхности Земли, так как вращается с той же угловой скоростью, что и Земля. Зона видимости геостационарного ИСЗ около одной трети земной поверхности. В то же время современные технические средства позволяют сформировать достаточно узкий луч электромагнитной энергии, «освещающий» сравнительно небольшую часть земной поверхности. Линии пересечения земной поверхности и конического луча передающей антенны ИСЗ определяют границы зоны покрытия при различных диаметрах приемной антенны земной станции. Очевидно, что чем дальше находится антенна от центра зоны, тем больше должен быть ее диаметр. Для спутникового вещания выделены специальные участки радиочастотного спектра в сантиметровом диапазоне волн, где допускается повышенная плотность потока мощности со спутника (радиовещательная спутниковая служба по терминологии МСЭ). Наиболее освоен участок в так называемом Ки-диапазоне с частотами на линии «Земля- спутник» 17,3... 18,1 ГГц и «спутник-Земля» 11,7... 12,5 ГГц. Для этой полосы частот на Международной радиоконференции 2000 г в Стамбуле принят план распределения частот и орбитальных позиций, по которому России выделено по 16 частотных каналов шириной 33 МГц на позициях 36°, 56* 86° 140° восточной долготы и 10 каналов на позиции 110° восточной долготы. Типовое значение ЭИИМ эквивалентной изотропно излучаемой мощности (произведение выходной мощности передатчика ИСЗ на
150 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю коэффициент усиления передающей антенны) составляет 50...55 дБВт (децибел к ватту, т.е. 100...300 кВт), диаметр приемной антенны при этом должен быть в пределах 45...60 см. Спутники так называемой фиксированной спутниковой службы, работающие в соседних диапазонах частот 10,7...И,7 и 12,5...12,75 ГГц, имеют близкие значения ЭИИМ (47...52 дБВт) и могут приниматься на антенны диаметром 60...90 см. Одной из особенностей применения ИСЗ является ограниченность энергетического потенциала спутникового ретранслятора, поэтому в спутниковом вещании традиционно используют методы обработки, требующие минимального отношения сигнал-шум на входе демодулятора в обмен, например, на полосу частот сигнала. В аналоговом вещании это был выбор частотной модуляции, а не амплитудной, в цифровом вещании приходится применять мощное каскадное помехоустойчивое кодирование и модуляцию с невысокими кратностями (скорее ФМ-4, чем ФМ-8 и более высокие кратности). Еще одна специфическая особенность спутникового вещательного ретранслятора работа в нелинейном режиме вблизи точки насыщения выходного усилительного прибора (лампы бегущей волны или транзисторного усилителя), так как именно в этом режиме удается получить максимальную выходную мощность и до предела снизить диаметр приемных антенн. Из-за существенной нелинейности работа в точке насыщения возможна только на одной несущей в стволе — это так называемый режим МСРС (Multiple Channels per Carrier — несколько каналов на одной несущей), когда цифровые потоки нескольких ТВ программ объединяются (мультиплексируются) в общий поток и модулируют единственную несущую частоту, передаваемую с одной передающей станции. Нелинейный режим заставляет использовать виды модуляции с постоянной огибающей - - смещенную ФМ и другие разновидности фазовой модуляции. Альтернативный вариант — SCPC (Single Channel per Carrier — один канал на одной несущей) требует перехода в линейный (точнее, квазилинейный) режим со снижением выходной мощности на 2,5...4 дБ и неэффективен в спутниковом вещании. Он применяется в спутниковых распределительные сетях, когда в одном стволе нужно передать на сеть профессиональных приемных станций несколько ТВ программ, источники которых территориально разнесены и не могут собрать сигналы в одной точке, а потому вынуждены строить свои собственные передающие станции. Второй случай использования режима SCPC в спутниковом телевидении — передача телевизионного репортажа с небольшой перевозимой передающей станции. Ее энергетических возможностей обычно недостаточно для вывода ретранслятора в точку насыщения, и передача часто происходит далеко от насыщения, в линейном режиме. Этот вид передачи называется DSNG (Digital Satellite News Gathering — цифровая спутниковая видеожурналистика). DVB Project разработал специальный стандарт для перевозимых станций [6.4], учитывающий особенности энергетики радиолинии. В этом стандарте предусматривается возможность использовать наряду с ФМ-4 и другие виды модуляции, не обязательно с постоянной огибающей. Практически применяются ФМ-8 и КАМ-16. В последнее время появились линеаризаторы спутникового канала, позволяющие работать с ФМ-8 и КАМ-16 вблизи насыщения [6.5]. 6.3.2. Передача цифровых сигналов MPEG-2/DVB-S по спутниковым каналам Обработка цифрового потока MPEG-2 для использования в спутниковом вещании детально специфицирована в стандарте EN 300 421, принятом ETSI в 1998 г. [6.6, 6.7]. Последовательность этапов обработки приведена на рис. 6.4.
Глава 6. Передача компрессированных сигналов по каналам связи 151 Транспорты поток S и й> о й> х к J<d-&o s s I = JL ^ : О S] 00 C a* |CQ 2 <N 1 s Ы£ Ф Q. ■ m Q) О с ■1 В !• X cQ Ф О е- о. >ч в) X ее СО О Ф о 3" S О. О I- О 5 в радиоканал Тактовый генератор Рис. 6.4. Структурная схема обработки транспортного потока в стандарте DVB-S Пришедшие на вход модулятора транспортные пакеты длиной 188 байтов содержат, как мы знаем, синхробайт 0x47 и 187 байтов данных. Для устранения неопределенности фазы формируется внутренний цикл модулятора, включающий 8 пакетов: первый с инвертированной стартовой синхрогруппой 0хВ8, остальные — с неинвертированной. Транспортный поток поступает на скремблер, где происходит его суммирование с псевдослучайной последовательностью (ПСП). Структурная схема принятого в стандарте DVB-S скремблера/дескремблера приведена на рис. 6.5 и состоит из регистра сдвига на 15 триггерах и ЛЭ «исключающее ИЛИ», суммирующего по модулю 2 сигналы с выходов ячеек 14 и 15 и подающего суммарный сигнал на вход ячейки 1. Символьная синхронизация ячеек производится тактовой частотой транспортных пакетов, цикловая синхронизация — инвертированными стартовыми синхрогруппами, с помощью которых триггеры регистра сдвига устанавливаются в начальное состояние 1001 0101 0000 0000. Порождающий многочлен g{x) = х15 4- jc14 +1 генерирует i 00101010000000 ПСП длиной 2,5-1 = 32767 битов « 4096 байтов, из которых используется участок длиной 1503 байта. Скремблирование и деск- ремблирование транспортного потока происходит во втором ЛЭ «исключающее ИЛИ», на один вход*которого подаются транспортные пакеты, а на другой вход через ЛЭ «И» поступает ПСП. Схема «И» используется для прерывания ПСП на момент передачи синхробайта (иначе на приеме его не удастся обнаружить). После скремблирования данные транспортного пакета подвергаются помехоустойчивому кодированию каскадным кодом, в котором в качестве внешнего используется укороченный код Рида-Соломона (PC) (204,188,8), в качестве внутреннего — сверточный код. Укороченный код PC формируется в кодере полного кода (255,239,8) путем добавления перед началом транспортного пакета группы из 51 байта, состоящей из одних нулей. Получившийся пакет из 239 байтов проходит кодирование, после которого символы на добавленных позициях отбрасываются и остается пакет длиной 204 байта. Работа кодера описывается порождающим многочленом g(x) = x* +x4+jc3+x2+1. Код 1 I 2 3 4 5 6 I 7 I 8 9 10 Y К Ц г—Э Уг & фавл \ Вход эние данных е Выход ч данных 11 I 12 П\ ЧУ 13 14 / к 15 I / \ Рис. 6.5. Скремблирование данных в стандарте DVB-S
152 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Вход Перемежитель s 17x1 17x2 17x11 Канал Декодер перемежения Я / •— 17x11 17x10 17x9 V V S —• Выход Рис. 6.6. Структурная схема сверточного перемежителя и декодера перемежения с глубиной перемежения 1 = 12 PC устойчиво работает при вероятности ошибок на входе декодера не выше 210~4, устраняя ошибки, с которыми не справился декодер сверточного кода, и обеспечивая выходную вероятность ошибок в пределах от 10~10...10~11 (квазисвободный от ошибок канал). Такое высокое требование к коэффициенту ошибок связано с принятой DVB концепцией «контейнера данных», согласно которой цифровой канал должен быть универсальным и пригодным для передачи не только телевидения (для которого достаточно иметь вероятность ошибки ЗЮ~6...10~8), но и любых других цифровых сигналов, в том числе и с повышенными требованиями к достоверности. Для защиты от пакетных ошибок большой длительности в стандарте осуществляется сверточное перемежение данных с глубиной перемежения 12 байтов. Структурные схема кодера и декодера перемежения показаны на рис. 6.6. В каждом положении переключателя в регистры записывается 1 байт информации, так что транспортный пакет длиной 204 байта будет полностью обработан за 204/12 = 17 циклов. Задержка данных в каждой ветви должна быть кратна 17 байт — отОдо 11 х 17 = 187 байт. В декодере перемежения восстанавливается первоначальный порядок следования данных. В стандарте DVB-S используется сверточный кодер с длиной кодового ограничения К = 7 и относительными скоростями кодирования R = 1/2, 2/3, 3/4, 5/6, 7/8 (FEC (Forward Error Correction) — прямая коррекция ошибок в англоязычной терминологии). Переключение с базовой скорости 1/2 на другие значения осуществляется выборочным вычеркиванием перфорированием некоторых символов.*Это несколько снижает, корректирующую способность кода, но одновременно уменьшает и его избыточность, позволяя высвободить больше емкости для полезных данных. Декодер сверточного кода осуществляет первый уровень кодозащиты и должен работать при коэффициенте ошибок входного сигнала 10_1...10~2, снижая коэффициент ошибок в выходном сигнале до значения 2-Ю-4, необходимого для работы кода PC. Суммарная энергетическая эффективность каскадного кода, определяемая как выигрыш в необходимом отношении E6/N0, достигает 7,5 дБ при R = 1/2, снижаясь до 5,5 дБ при R = 7/8. 6.3.3. Модуляция в DVB-S Основным видом модуляции в стандарте DVB-S принята ФМ-4 (QPSK), хотя в отдельных случаях при ограниченном частотном ресурсе могут использоваться ФМ-8 и даже КАМ-16 (перевозимые репортажные станции). Применение помехоустойчивого
Глава 6. Передача компрессированных сигналов по каналам связи 153 10 "2 ю-4 ю-6 10 "8 -ю 10 ю-12 \\ \ V \ ч Немодулированная ФМ-4 \ ч V ч Сверточное ч ч ч i v к ч ч V чкСверточное ; . v 4V \ ч ч кодирование \ \ \ \ N ч \ \ \ \ Каскадное кодирование \ \ \ \ 3/4* 5/6 \ 2/3 ' \ 1/2 \ i W/8\ \ i ч \ \\ \\\\ 4 - \^<*\ ч \ \ 3/4* \2/3 1/2 Л ч ч ч \ ч ч \ \ N \\ ■ Г- Г ДБ 6 8 10 Рис. 6.7. Зависимость вероятности ошибки от E6/No для ФМ-4 при разных относительных скоростях кодирования кодирования позволяет значительно снизить требуемое для работы демодулятора с ФМ- 4 отношение E6/N0 (рис. 6.7) [6.8], для модуляции большей кратности пороговое значение E6/N0 оказывается несколько выше (табл. 6.2) [6.4]. Пропускная способность радиоканала, работающего по стандарту DVB-S, зависит от Табл. 6.2 Пороговые значения E6/No для разных видов модуляции при каскадном кодировании Модуляция ФМ-4 ФМ-8 АМ-16 Скорость внутреннего кода 1/2 2/3 3/4 5/6 7/8 2/3 5/6 8/9 3/4 7/8 Спектральная эффективность, бит/Гц 0,92 1,23 1,38 1,53 1,61 1,84 2,30 2,46 2,76 3,22 Запас на реализацию модема, дБ 0,8 0,8 0,8 0,8 0,8 1,0 1,4 1,5 1,5 2,1 Еб/No | (2x10"4) 4,5 5,0 | 5,5 6,0 6,4 6,9 8,9 9,4 9,0 10,7
154 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 6.3 Пропускная способность спутникового ствола при разных значениях полосы пропускания Полоса, МГц 54 46 40 36 33 27 Символьная скорость, Мсимв/с 45 38,3 33,3 30 27,5 22,5 Информационная скорость, Мбит/с 1/2 41,47 35,33 30,72 27,65 25,34 20,74 2/3 55,29 47,10 40,96 36,86 33,79 27,65 3/4 62,20 52,99 46,08 41,47 38,01 31,10 5/6 69,12 58,88 51,20 46,08 42,24 34,56 7/8 72,57 61,82 53,76 48,38 44,35 36,29 Табл. 6.4 Координаты точек шаблона для огибающей выходного спектра DVB моду лятора Точка Частота f/fN Относительная мощность Точка Частота f/fN Относительная мощность А 0 +0,25 J 1,0 -2 В 0 -0,25 К 1,0 -4 С 0,2 +0.25 L 1,2 -8 D 0,2 -0,4 М 1,2 -11 Е 0,4 +0,25 N 1,8 -35 F 0,4 -0,4 Р 1,4 -16 G 0,8 +0,15 Q 1,6 -24 Н 0,8 1,1 S 2,12 -40 I 0,9 -0,5 t полосы пропускания ствола, вида модуляции и относительной скорости кодирования. В табл. 6.3 приведены значения символьной и информационной скоростей цифрового потока при различных значениях параметров системы [6.6]. Данные таблицы рассчитаны при коэффициенте запаса по полосе (отношение полосы ствола к символьной скорости) 1,2. При снижении запаса энергетические соотношения заметно ухудшаются, требуется более высокое отношение E6/No (рис. 6.8) [6.6]. Отображение битовой последовательности в пространство сигналов ФМ-4 осуществляется с помощью манипуляционного кода Грея, который ставит в соответствие каждой паре битов точку в пространстве векторов (I, Q), как показано на рис. 1.24. Перед подачей на модулятор последовательности I и Q должны быть отфильтрованы в соответствии с (1.4), чтобы получить форму «скругленного косинуса». Эту функцию выполняет фильтр с характеристикой Найквиста. На рис. 6.9 показан шаблон для огибающей выходного спектра модулятора, рекомендованный DVB, координаты точек этого шаблона приведены в табл. 6.4 [6.6].
Глава 6. Передача компрессированных сигналов по каналам связи 155 ДСЕ^.дБ 2,5 2,0 1,5 1.0 0.5 О 1 1,05 1,1 1,15 1,2 1,25 1,3 1,35 Рис. 6.8. Ухудшение приема ФМ-4 при ограничении полосы пропускания спутникового ствола (режим насыщения, вероятность ошибки 2x10-4) ТА С t {В D F 1 1 1 1 1 1 1 1 1 1 1 1 Т » »—1 * G | Н 1 К —Н 1 1 1 J ^L м > \ 1 \ ♦ ■ \ Y_ > 1 1 1 S —till— »—1 »—Н О 0,5 1.5 2 2.5 3 f/fN Рис. 6.9. Шаблон огибающей выходного спектра модулятора
156 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 6.4. СТАНДАРТ DVB-C 6.4.1. Структура типовой кабельной сети Системы кабельного телевидения (СКТВ) являются широко распространенным средством доставки телевизионных программ до абонента. В условиях многоэтажной городской застройки они обеспечивают значительно лучшее качество ТВ сигнала, чем эфирное вещание. Для подачи сигнала к абоненту используется диапазон метровых и дециметровых волн от 47 до 862 МГц. В разных странах приняты разные стандарты разделения полосы частот на каналы и различные полосы частотных каналов — 6, 7 или 8 МГц. Полоса частот канала зависит от видеостандарта, используемого в данной стране. Например, для стандарта 525 строк (NTSC-M) и в метровом, и в дециметровом диапазонах принята полоса 6 МГц, для стандартов с полосой видеосигнала 5 МГц (В, G, Н) обычно выделяется 7 МГц в метровом и 8 МГц в дециметровом диапазоне, стандарты D, К, L с полосой видеосигнала 6 МГц занимают полосу 8 МГц в обоих диапазонах. Статистика такова: в метровом диапазоне 13% стран используют полосу б МГц, 36% стран — 7 МГц и 51% стран 8 МГц, в дециметровом диапазоне соответственно 11%, 6% и 83% [6.9]. Обычно полоса частот канала и частотная сетка эфирного вещания отображаются в частотный план сети кабельного телевидения. Как известно, диапазон эфирного вещания разбит условно на пять поддиапазонов с номерами с I по V, между которыми имеются частотные промежутки, выделяемые другим службам. В кабельных сетях используются и промежуточные участки диапазона, в которых эфирное вещание не ведется. Здесь организуются так называемые спецканалы (участки между 104 и 174 МГц и между 230 и 300 МГц) и гиперканалы (участок между 300 и 470 МГц), которые кабельные операторы занимают по мере освоения основных поддиапазонов. Структура типовой сети кабельного телевидения показана на рис. 6.10 [6.10]. Основа сети — головная станция, которая принимает ТВ программы от разных источников (эфирных передатчиков, кабельных, спутниковых и радиорелейных распределительных систем, местных студий), приводит сигналы к единому формату, принятому в данной сети, расставляет их по частотным каналам, скремблирует, если сеть работает в режиме условного доступа, усиливает до уровня 100... 120 дБмкВ (децибел к микровольту) и отдает в линейный распределительный тракт. В традиционных сетях коллективного приема основой тракта служит коаксиальный кабель, в который включаются усилители и делители мощности сигнала. Для увеличения протяженности линейного тракта используют кабели с малым затуханием и высокой экранировкой, усилители с повышенной линейностью передаточной характеристики и ответвители с хорошим согласованием и высокой направленностью. Постоянство уровней сигналов в тракте в условиях эксплуатации поддерживается с помощью автоматической регулировки усиления. Нормы на параметры кабельных сетей и абонентских вводов регулируются европейским стандартом CENELEC EN 50083 (в России действует ГОСТ 28324-89). Широкое развитие оптоволоконных технологий позволило использовать в качестве магистрального оптический кабель и объединить достаточно удаленные районы в крупные единые сети, охватывающие десятки и сотни тысяч абонентов. Второе важное новшество современного поколения СКТВ наличие обратного, или «восходящего» канала относительно низкоскоростного канала от абонента к головной станции, используемого кабельным оператором для диагностирования и мониторинга состояния
от ВОЛС от местной студии Формирователь радиосигнала Формирователь радиосигнала Конвертор ЧМ демодулятор/ AM модулятор Формирователь радиосигнала -ik_ К домовой распределительной сети С уб м агистр ал ьн ая Магистральный усилитель <$ м <ЯЖЖк^=н Магистральная линия 0> ГО 09 о> Z3 ф "О ф ё X О) О ZD "О ф о о S I "О о го 0) I X с X о S о го и о О) X О) ь О) о го О) S £-НЖК>а Рис. 6.10. Структурная схема типовой сети кабельного телевидения ел
158 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю сети, а также для предоставления широкого спектра дополнительных услуг телефонии, передачи данных, доступа в Интернет и других интерактивных приложений. Обратный канал организуется в низкочастотной части спектра, на частотах ниже 45 МГц. Подробнее об этом рассказано в главе 9. 6.4.2. Особенности передачи цифровых сигналов по сетям кабельного телевидения Ожидаемое внедрение цифрового телевидения в системы СКТВ ставит вопрос об их пригодности для этой цели и об оценке необходимых усовершенствований и доработок. Предварительный анализ применимости цифровых методов кодирования и модуляции показывает, что в правильно спроектированной сети отношение сигнал-шум должно быть достаточно высоким, выше, чем в спутниковой системе (по стандарту оно должно быть не ниже 43 дБ), и в то же время полоса частот канала кабельной сети значительно уже, чем полоса частот ствола спутникового ретранслятора, поэтому целесообразно применение многопозиционной модуляции, например, К AM. Более высокое отношение сигнал-шум снижает вероятность ошибок и позволяет обойтись одной ступенью помехоустойчивого кодирования. Однако пакетные ошибки не исключены, поэтому пе- ремежение остается составной частью процесса канального кодирования. Анализ помех и искажений, типичных для линейного тракта, позволяет предположить, что цифровые сигналы окажутся менее чувствительными к интермодуляционным искажениям, чем аналоговые, благодаря значительно меньшему требуемому защитному отношению «цифровой сигнал-цифровая помеха» в совпадающем и соседних каналах и более гладкому спектру. В то же время цифровые К AM сигналы более чувствительны к амплитудным и особенно фазовым искажениям в тракте, поэтому вопросы согласования, коррекции характеристик остаются достаточно острыми. В литературе еще недостаточно данных о взаимном влиянии большого числа цифровых потоков в кабельной сети, так как благодаря эффективному сжатию в одном частотном канале удается передать до 3-5 ТВ программ, и после перевода на цифровой формат даже очень загруженная сеть с 25-30 активными каналами переходит в категорию сетей с 5-7 занятыми каналами, в которых проблемы взаимных помех не столь актуальны. В построении головных станций переход на цифровой формат предъявляет новые требования к аппаратуре обработки и формирования сигналов. Появляется возможность формировать многопрограммные цифровые потоки, не декодируя принятые MPEG сигналы, а выделяя из них нужные компоненты на уровне транспортного потока и ремультиплексируя эти компоненты в новый транспортный поток. Также на уровне транспортного потока при этом могут решаться вопросы скремблирования, смены системы условного доступа, работы одновременно в нескольких системах условного доступа. Принятый в стандартах DVB единый подход к канальному кодированию существенно облегчает обработку и преобразование сигналов DVB, так как число дополнительных операций при преобразованиях оказывается минимальным. В этом смысле разработанный DVB стандарт вещания цифровых ТВ сигналов по кабельным сетям [6.11] достаточно близок к спутниковому стандарту.
Глава 6. Передача компрессированных сигналов по каналам связи 159 6.4.3. Методы модуляции и помехоустойчивого кодирования, используемые в стандарте DVB-C Структурная схема кодера стандарта DVB-C показана на рис. 6.11. Источником входного сигнала, как и в других кодерах семейства DVB, служит транспортный поток MPEG- 2 с пакетами размером 188 байтов. В скремблере пакеты организуются в группы по 8, синхробайт каждого первого пакета из группы инвертируется и служит в дальнейшем для цикловой синхронизации. Скремблирование, как и в стандарте DVB-S, осуществляется сложением по модулю 2 с ПСП, порождаемой многочленом g(x) = jc15 + хи +1. На период следования каждого синхробайта скремблирование прерывается. Внешний кодер Рида-Соломона и сверточный перемежите ль также не имеют отличий от устройств, описанных ранее. Учитывая относительно высокое отношение сигнал-шум, внутреннее кодирование не используется, а в качестве метода модуляции предлагается квадратурная AM различной кратности, от КАМ-16 до КАМ-256 (КАМ-128 и КАМ-256 не обязательны для прием- данные Тактовый сигнал * ф ё -а- * 5 ф м s S * о а> 2 Sou СО S О со °- со Q. 00 ^ см 8 -А- т т т t Тактовый генератор Q. Ф ф Q. m Ф О с ф ф CVJ 2 8 СО Ш s« si О. Я Ю Ю О Л Ф с; о. ф m -а- 2 ф s ii m о о. S S GL О 0 о. о 2 £ < с * 5 О 2 Выход радиосигнала Рис. 6.11. Структурная схема кодера стандарта DVB-C • S ю g $ 5 3 S 8 | СО 2 °- s- Ю 7 ф с o. m q битов MSB x Ф ф °- о 2 * f S X CO 0) о Q. s о = 2 дляКАМ-16 3 для КАМ-32 4 для КАМ-64 5 для КАМ-128 6 для КАМ-256 со g " i S 5 2. s -Рис. 6.12. Относительное кодирование двух старших битов каждого байта
160 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю БайтЫ N+1 N+2 Ь7 Ь6 Ь5 Ь7 Ь6 Ь5 Ь7 Ь6 Ь5 MSB г Ь5 Ь4 ЬЗ Сип 1ВОЛ Z Ь5 Ь4 ЬЗ Z+1 Ь5 Ь4 ЬЗ Z+2 Ь5 Ь4 ЬЗ Z+3 Рис. 6.13. Отображение трех байтов в 4 шестибитовых символа КАМ-64 ников). Дополнительное повышение помехоустойчивости достигается относительным кодированием двух старших битов каждого байта с выхода перемежителя, как показано на рис. 6.12. С выхода дифференциального кодера байты цифровой последовательности поступают на раскладчик, который должен отобразить их в символы К AM сигнала. Если кратность модуляции т и процесс должен отображать k байтов в п символов, должно выполняться соотношение 8к = п-т. На рис. 6.13 в качестве примера показано отображение трех байтов в 4 символа КАМ-64. Как и в стандарте DVB-S, перед подачей на модулятор импульсы подвергаются скруглению, но коэффициент скругле- ния выбран равным 0,15. Выходной фильтр Найквиста должен обеспечивать неравномерность АЧХ в полосе пропускания не хуже 0,4 дБ и подавление внеполосных излучений в полосе частот вне 1,15 Fciimb не менее 43 дБ. В табл. 6.5 приведены в качестве примера рассчитанные значения символьной и информационной скорости при разных кратностях модуляции в канале 8 МГц [6.11]. Максимальная скорость достигает 38 Мбит/с, что соответствует пропускной способности ствола спутникового ретранслятора с полосой 33 МГц в типовом режиме Fciimb= 27,5 Мсимв/с, R = 3/4. Табл.6.5 Пропускная способность канала сети кабельного телевидения в зависимости от вида модуляции и полосы частот 1 Полоса частот, МГц 7,92 7,96 7,86 3,93 4,00 4,00 2,00 2,00 2,00 Вид модуляции КАМ-64 КАМ-32 КАМ-16 КАМ-64 КАМ-32 КАМ-16 КАМ-64 КАМ-32 КАМ-16 Символьная скорость Мсимв/с 6,89 6,92 6,84 3,42 3,48 3,48 1,74 1,74 1,74 Информационная скорость, Мбит/с 38,9 31,9 25,2 18,9 16,0 12,8 9,6 8,0 6,4
Глава 6. Передача компрессированных сигналов по каналам связи 151 6.5. СТАНДАРТ DVB-T 6.5.1. Требования, положенные в основу разработки стандарта DVB-T Приступая к разработке стандарта эфирного цифрового вещания, DVB, как обычно, определил коммерческие требования к стандарту [6.12]: 1) стандарт должен поддерживать концепцию контейнера данных и переносить любые типы данных — ТСЧ, ТВЧ, звук, любую их комбинацию, пока это позволяет емкость контейнера; 2) стандарт должен обеспечивать высокую помехозащищенность, максимальную гибкость использования спектра с возможным обменом емкости канала на размеры зоны обслуживания, возможность передачи служебных таблиц, телетекста, ввод системы условного доступа; 3) стандарт должен быть максимально унифицирован со стандартами на спутниковую и кабельную системы передачи для удешевления производства многостандартных декодеров; 4) система должна допускать обслуживание с существующих передающих центров и прием на существующие антенны; 5) должен поддерживаться прием на комнатные антенны и переносимые приемники (не в движении); 6) стандарт должен поддерживать работу в одночастотной сети; 7) приемник должен иметь выход цифровых данных для выделения сигналов дополнительных служб, желательно наличие модема для организации канала взаимодействия; 8) уровень выбранной технологии должен соответствовать достигнутым возможностям промышленности для быстрого развертывания производства; 9) иерархическая модуляция должна допускаться как возможный вариант на втором этапе внедрения. Ключевым вопросом в разработке DVB-T был выбор вида модуляции — одночастот- ная или многочастотная. К этому моменту американцы уже выбрали для своего стандарта ATSC одночастотную модуляцию (см. ниже), а в Европе в рамках нескольких исследовательских проектов (DAB, RACE, HD-DIVINE и др.) изучали свойства многочастотной OFDM. Техническая секция создала специальную исследовательскую группу по сравнению систем, которая должна была дать рекомендации по выбору между DVB-C и системами, основанными на OFDM. Рассматривался также вариант одночастотной сети, основанной на объединении стандартов DVB-C и DVB-S. Предлагалось использовать гибкое внутреннее кодирование DVB-S и разнообразные модуляционные возможности DVB-C (ФМ-4, КАМ-16, КАМ-64). Разработанные к тому времени интегральные микросхемы обеспечивали работу в таком комбинированном варианте. Для компенсации многолучевости было предложено использовать компенсаторы, аналогичные примененным в американской системе. Однако компенсация оказалась сложным и дорогим решением, не полностью совместимым с DVB-C и DVB-S и поэтому сводящим на «нет» выгоды унификации. Моделированием на компьютерах и натурными экспериментами было доказано, что восприимчивость к помехам от сигналов PAL и SEC AM у OFDM примерно на 10 дБ ниже, чем у одночастотной системы типа DVB-C. Группа пришла к выводу, что предъявленным требованиям, особенно условию работы в одночастотной сети, удовлетворяет только OFDM.
162 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 6.5.2. Выбор параметров COFDM В ходе разработки стандарта DVB-T необходимо было выбрать основные параметры системы — число индивидуальных несущих на символ, величину защитного интервала, вид модуляции несущих, метод синхронизации. Выбор числа несущих вызвал наибольшие затруднения, так как часть компаний — членов DVB — рассчитывала начать в своих странах одночастотное вещание с разносом передатчиков не менее 60 км, что возможно при числе несущих порядка 6000. Практические микросхемы, осуществляющие COFDM, работают при числе несущих, равном степени двойки, поэтому было выбрано ближайшее число 8192 213 этот режим условно назвали «8к». Однако достигнутый к 1995 г. уровень электронной техники не позволял оперировать таким числом несущих, и многие специалисты считали, что ради ускорения принятия стандарта можно снизить требования к одночастотной сети и ограничиться меньшим числом несущих, например, 1500 (2048 = 211, режим «2к>). В результате обсуждения была принята и вошла в стандарт единая спецификация «2к/8к». Отметим, что к настоящему времени процессоры «8к» уже появились и их стоимость приемлема для индивидуального приема. В стандарте [6.13, 6.14, 6.15] используются два значения длительности активной части символов: Tt = 224 мкс для режима «2к» и Т2= 896 мкс для «8к», соответственно частотный разнос несущих в двух режимах А/, =1/Г, = 4464Гц и Д/2 = 1/Г2 = 1116 Гц, число несущих Nt = 1705 и N2 = 6817 Общая ширина спектра сигнала в обоих случаях равна 7,61 МГц, что позволяет разместить его в полосе канала 8 МГц с достаточными частотными интервалами. Стандартом DVB-T для каждого режима модуляции предусмотрены четыре относительных значения защитных интервалов, равные 1/4, 1/8, 1/16 и 1/32 длительности активной части символа Т. Соответствующие им абсолютные значения приведены в табл. 6.6 [6.13]. В этой же таблице указан максимальный территориальный разнос между ТВ-передатчиками в синхронной одночастотной сети [6.14]. Табл. 6.6 Основные параметры COFDM модуляции в стандарте DVB-T Параметр Число несущих в спектре, N Длительность активной части символа Т, мкс Частотный разнос несущих Л, Гц Ширина спектра группового сигнала, МГц Относительная длительность [защитного интервала, АД Длительность защитного | интервала, мкс Максимальный разнос между передатчиками в одночастотной сети, км Значение параметра 8к 6817 896 1116 7,61 1/4 1/8 1/16 1/32 224 112 56 28 67,2 33,6 16,8 8,4 2к 1705 224 4464 7,61 1/4 1/8 1/16 1/32 56 28 14 7 16,8 8,4 4,2 2,1
Глава 6. Передача компрессированных сигналов по каналам связи 163 1 и • о о о о о о X О О • О О О X О О О О О • X О О О О О О • о о о о о о X О О • О О О X О О О О О • X О О О О О О • о о о о о о X О О • О О О о о ■ о о о о о о ■ о о о о о • ■ о о о о о о ■ о • о о о о ■ о о о о о о ■ о о о о ■ о • ■ о о о о ■ о о ■ о • о о ■ о о ■ о о о о ■ о о ■ о о о о ^+7,61 МГц |_ г --• --• --• — • символ 67 • символ 0 — • символ 1 • символ 2 --• --• --• Рис. 6.14. Структура кадра COFDM О —данные; • — распределенные пилотные несущие; ■ —TPS пилотные несущие; х — непрерывные несущие На рис. 6.14 показана структура сигнала COFDM. Она одинакова для режимов «2к» и «8к», различается только число несущих в символе. В обоих случаях 68 последовательных символов объединяются в кадр, четыре кадра составляют суперкадр. Часть несущих, так называемые пилотные несущие, или маркеры синхронизации (они обозначены на рисунке черными кружками) служат для синхронизации тактовых частот модулятора и демодулятора, синхронизации несущих частот спектра, кадровой синхронизации, оценки состояния канала и уровня фазовых шумов. Различают непрерывные (continual) пилот-сигналы, передаваемые на одной и той же несущей, и распределенные (scattered), передаваемые на нескольких несущих, равномерно распределенных в спектре сигнала и меняющихся от символа к символу. Пилотные несущие модулируются специально формируемой ПСП. Для повышения помехоустойчивости они передаются с уровнем в 16/9 раза (примерно на 2,5 дБ) выше, чем остальные несущие. Еще один пилот-сигнал TPS (Transmission Parameter Signaling передача канальных параметров) передается на нескольких несущих частотах (квадратики на рис. 6.14) и несет декодеру информацию о параметрах сигнала — режиме передачи «2к» или «8к», длине защитного интервала, относительной скорости сверточного кода, виде модуляции несущих. В общей сложности в кадре «2к» 142 несущих используются для распределенных пилот-сигналов, 45 для непрерывных, 17 — для TPS, 1512 несут полезную информацию. В режиме «8к» соответствующие значения — 568, 177, 68 и 6048. Все TPS несущие в символе несут один и тот же бит. Из 68 TPS битов, передаваемых в каждом кадре, 16 содержат информацию о синхронизации, 37 — информационные, 14 — избыточные для кодозащиты, 1 — бит инициализации. TPS несущие передаются с той же мощностью что и информационные, но модулируются значительно более помехоустойчивой дифференциальной ФМ-2, что обеспечивает их уверенное выделение на приеме. Каждая несущая в символе COFDM модулируется своим собственным цифровым потоком. В стандарте предусмотрена возможность использования одного из трех видов модуляции: ФМ-4, КАМ-16, КАМ-64. Ансамбли сигналов для ФМ-4 и КАМ-16 приведены на рис. 1.23. Выбор того или иного вида зависит от требуемой скорости передачи данных и определяет, в свою очередь, необходимые энергетические соотношения в системе. Следует иметь в виду, что помехоустойчивое кодирование и защитные интервалы снижают информационную скорость передачи, и это следует учитывать при выборе параметров системы. В табл. 6.7 [6.16] приведены значения скорости передачи и требуемого отношения сигнал-шум в радиоканале при различных сочетаниях параметров. Отношение сигнал-шум дано для трех моделей канала: Гауссовой модели (канал без
164 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 6.7 Скорость передачи данных и отношение сигнал-шум для DVB-T Вид модуляции ФМ-4 КАМ-16 КАМ-64 Относит. Скорость кода 1/2 2/3 3/4 5/6 7/8 1/2 2/3 3/4 5/6 7/8 . V2 2/3 3/4 5/6 7/8 Отношение сигнал-шум в канале по модели ... Гаусса 3,1 4,9 5,9 6,9 7,7 8,8 11,1 12,5 13,5 13,9 14,4 16,5 18,0 19,3 20,1 Релея 3,6 5,7 6,8 8,0 8,7 9,6 11,6 13,0 14,4 15,0 14,7 17,1 18,6 20,0 21,0 Раиса 5,4 8.4 10,7 13,1 16,3 11,2 14,2 16,7 19,3 22,8 16,0 19,3 21,7 25,3 27,9 Скорость передачи, Мбит/с при Л/Т = ... 1/4 4,98 6,64 7,46 8,29 8,71 9,95 13,27 14,93 16,59 17,42 14,93 19,91 22,39 24,88 26,13 1/8 5,53 7,37 8,29 9,22 9,68 11,06 14,75 16,59 18,43 19,35 16,59 22,12 24,88 27,65 29,03 1/16 5,85 7,81 8,78 9,76 10,25 11,71 15,61 17,56 19,52 20,49 17,56 23,42 26,35 29,27 30,74 1/32 6,03 8,04 9,05 10,05 10,56 12,06 16,09 18,10 20,11 21,11 18,10 24,13 27,14 30,16 31,67 отражений с равномерным «белым» шумом), модели Раиса (канал с отражениями, но с преобладанием прямого сигнала) и модели Рэлея (канал без прямого сигнала, только с отраженными). Данные этой таблицы не зависят от числа несущих, так как при переходе от режима «8к» к режиму «2к» с уменьшением числа несущих в 4 раза одновременно во столько же раз увеличивается скорость передачи данных на каждой несущей. 6.5.3. Построение передающего тракта эфирного цифрового вещания Мы уже отмечали, что одним из основных требований к стандарту эфирного вещания была максимальная унификация с предшествующими стандартами спутникового и кабельного вещания. Эта преемственность хорошо видна на структурной схеме кодера DVB-T, приведенной на рис. 6.15 [6.13]. Начальные этапы обработки цифрового сигнала, связанные с кодированием, включая внешнее кодирование кодом Рида-Соломона, сверточное перемежение и сверточное кодирование, тождественны DVB-S. Остальные элементы специфичны для OFDM и на них следует остановиться подробнее. Включенный после сверточного кодера внутренний перемежитель предназначен для компенсации последствий селективных замираний в канале с многолучевостью, от которых не спасает введение защитных интервалов. При отражении от близлежащих объектов эхо-сигнал в некоторой узкой полосе частот может быть достаточно мощным, сравнимым с полезным сигналом, и приходить к приемнику в противофазе с последним. нейтрализуя несколько соседних несущих. Чтобы избежать выпадения сразу несколь-
Глава 6. Передача компрессированных сигналов по каналам связи 165 Данныеч ) Тактовый N сигнал ' Входной интерфейс N ) —> Скрембли- рование Раскладка символов —Э —Э Внешний код PC (204.188.8) Формирование кадра Генерация пилот- сигнала и TPS —э —э Внешний перемеж и- тель COFDM модуляция —Э —> Внутре и- ний свер- точный код Ввод защитного интервала -Э Внутренний пере- межитель —) ЦАП Рис. 6.15. Структурная схема кодера DVB-T ких битов, данные по несущим распределяют с частотным перемежением, так что соседние биты оказываются разнесенными по частоте и не попадают в полосу селективного замирания. Перемежение осуществляется в два этапа, как показано на рис. 6.16. На первом этапе цифровой поток с выхода сверточного кодера разделяется на m парциальных потоков, где m = 2 для ФМ-2, m = 4 для КАМ-16 и m = 6 для КАМ-64. Каждый из потоков делится на блоки из 126 битов и поступает на отдельный блоковый перемежи- тель битов с поразрядным перемежением. Функция перемежения определяется уравнениями: H0(w) = w; H/w) = (w + 63)modl26; H2(w) = (w + 105)modl26; H3(w) = (w + 42)modl26; H4(w) = (w + 21)modl26; H5(w) = (w + 84)modl26. Выходные потоки перемежите лей группируются по одному биту с каждого выхода, образуя m-битовые кодовые слова, поступающие на вход символьного перемежителя. В последнем перемежение символов происходит по определенному закону внутри блока из 12 х 126 = 1512 символов для «2к» модуляции и 48 х 126 = 6048 символов для «8к» модуляции. Следующий по порядку модуль в схеме осуществляет раскладку битов на символ COFDM, т. е. направляет к каждой несущей соответствующий кодовый символ с выхода перемежителя. На этом же этапе вводятся маркеры синхронизации и данные TPS. Модуляция OFDM несущих кодированными сигналами в модуляторе происходит в соответствии с выбранным видом модуляции и манипуляционным кодом. Здесь следу- о о Ф Ц с с; >ч 2 Ф "S ) \ ) N ) Перемежитель битов 1 Перемежитель битов 2 Перемежитель битов п >J А \ Л Раскладка символов Re lm Рис. 6.16. Внутренний перемежитель DVB-T кодера (КАМ-64, неиерархическая модуляция)
166 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Re ЦАП lm ЦАП *Я)е-0 cos Ж Выход >&-о SIN Рис. 6.17. Структура схемы COFDM модулятора ет ответить на вопрос, который часто возникает даже у специалистов, не знакомых с OFDM техникой [6.17]: неужели в схеме физически присутствуют эти 8000 модуляторов? На самом деле используется известная нам из первой главы пара преобразований Фурье, устанавливающая связь между временным и частотным представлением сигнала. При рассмотрении кодирования с преобразованием прямое преобразование Фурье (или ДКП, что в данном случае непринципиально) позволяло перейти от временного представления к набору коэффициентов при спектральных составляющих. В данном случае мы как бы переходим от спектральных коэффициентов (парциальные потоки битов для каждой несущей) к временному представлению — соответствующему числу отсчетов цифрового сигнала во временной области. Роль многочастотного модулятора выполняет интегральная микросхема обратного преобразования Фурье (рис. 6.17). Полученные комплексные значения коэффициентов разделяются на вещественную и мнимую части и поступают на цифро-аналоговые преобразователи. Вещественная часть умножается на косинусоидальную компоненту несущей частоты, мнимая часть на синусоидальную компоненту, и оба спектра складываются. 6.5.4. Работа COFDM передатчиков в одночастотной сети Для одночастотной сети типичным видом эхо-сигналов являются сигналы от соседних передатчиков, работающих на одной и той же частоте и передающих одинаковые символы COFDM. Эти эхо-сигналы не создадут помех, если будут поступать в приемник в период защитного интервала. Чем больше защитный интервал, тем больше допустимое расстояние между передатчиками. С другой стороны, длительность защитного интервала не следует выбирать большой, так как это приведет к уменьшению объема передаваемой информации. В ряде случаев оказывается выгодным использовать несколько близко расположенных маломощных передатчиков вместо одного мощного, при котором не удается избежать зон неуверенного приема в общей зоне обслуживания. Эффективное использование защитного интервала возможно только при жесткой временной синхронизации всех передатчиков сети. Как и в случае сетей с обычным частотным планом, рабочая частота каждого передатчика должна контролироваться и поддерживаться с высокой точностью. Но в случае одночастотной сети требования к точности и стабильности рабочей частоты возрастают. Важно также строго синхронное излучение всеми передатчиками одного и того же символа. Нетрудно заметить, что при недостаточной синхронизации символ, передаваемый одним передатчиком, сместится во времени относительно остальных, а это эквивалентно уменьшению на такую же величину защитного интервала. Защитный интервал должен быть временным резервом для борьбы с эхо-сигналами, а не средством компенсации погрешностей синхронизации передатчиков. На практике для синхронизации работы одночастотных сетей использу-
Глава 6. Передача компрессированных сигналов по каналам связи 167 ется всемирная сеть определения местоположения объектов GPS. Высокоточный опорный импульс, генерируемый раз в секунду приемником GPS, вводит в каждом передатчике COFDM сети временную метку, от которой ведется отсчет всех временных интервалов. Одночастотные сети широко используются в Европе для цифрового радиовещания, начинается также их использование для ТВ вещания по стандарту DVB-T. Первые сети введены в действие в Великобритании, Швеции, планируется развертывание в других странах. 6.5.5. Иерархическая модуляция в системах с COFDM Хотя в требованиях к стандарту иерархическая модуляция и не относилась к числу обязательных, она поддерживается стандартом и может найти широкое применение. Сущность иерархической модуляции заключается в таком выборе параметров сигнальных векторов, который приводит к образованию в цифровом потоке двух или более виртуальных каналов с разной скоростью передачи, помехозащищенностью и, соответственно, зоной обслуживания. Характеристики виртуальных каналов определяются различными комбинациями точек в сигнальном пространстве и различными скоростями кодирования. Один из возможных способов иерархической модуляции — применение неравномерного квантования сигнальных векторов. Например, вместо четырех равных шагов (-3, -1, +1, +3) для КАМ-16 выбираются неравные шаги (-4, -2, +2, +4) или даже (-6, -4, +4, +6). Нетрудно видеть, что первый шаг при этом вдвое или, соответственно, вчетверо больше второго, а значит, и помехоустойчивость приема кодовых комбинаций в этих позициях существенно выше. В потоке с более высокой помехоустойчивостью [он называется потоком высшего приоритета — High Priority (HP)] может передаваться информация с более высоким приоритетом, например, старшие разряды видео- и звукоданных илц базовый слой масштабируемого профиля. В потоке низшего приоритета (LP — Low Priority) передается менее значимая часть информации (младшие биты кодовых слов или улучшающие слои). Разница в пороговом отношении сигнал-шум для двух потоков может достигать 10-15 дБ. Второй, более распространенный способ осуществления иерархической модуляции — смешение двух схем модуляции одинаковой или разной кратности — ФМ-4 для HP потока и, например, ФМ-4 для LP потока, как показано на рис. 6.18 [6.18]. Результирующий ансамбль будет уже Q Q КАМ-16. Каждая пара битов первого потока (а в нем всегда используется ФМ-4) определяет квадрант, занимаемый вектором при передаче данного символа. Второй поток определяет сигнальную точку внутри данного квадранта, т.е. оперирует значительно меньшими кодовыми расстояниями. Приемником высшего приоритета этот поток воспринимается как Q \ • КАМ- > • ■4 HP О У КАМ- О 1 О 4 LP О О О О • о о 1Ш О О о о о о • о о У1-16 Рис. 6.18. Векторное представление иерархической модуляции пКАМ-4 поверх КАМ-4"
168 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю дополнительный шум в квадранте, несколько ухудшающий отношение сигнал-шум по сравнению со стандартной ФМ-4. Это ухудшение можно скомпенсировать частичным снижением скорости передачи HP потока. Отношение сигнал-шум, необходимое для потока низшего приоритета, определяется общей размерностью получившегося ансамбля сигналов. В результате при неблагоприятных условиях распространения, когда не удается демодулировать цифровой поток с низшим приоритетом, изображение на экране ТВ приемника сохраняется, хотя и воспроизводится с пониженным качеством. В зависимости от намерений вещателя возможны различные варианты реализации преимуществ иерархической модуляции. Одна из возможностей связана с обеспечением приема на комнатные антенны и переносные приемники. Для стационарных приемников с наружными антеннами используется поток низшего приоритета, и зона обслуживания при этом сокращается незначительно. Переносные приемники смогут принимать приоритетный поток данных, содержащий «основные» программы или программы с несколько ухудшенным качеством, в значительно более широкой зоне обслуживания, чем в неиерархической системе. В другом варианте применение иерархической модуляции позволяет ценой незначительного сокращения зоны обслуживания для потоков низшего приоритета и увеличения зоны для высшего приоритета заметно увеличить суммарную пропускную способность радиоканала. Возможны и рассматриваются другие способы использования преимуществ иерархической модуляции: прием на мобильные приемники, одновременное вещание сигналов высокой и стандартной четкости и т.д. Нет сомнения, что гибкость стандарта DVB-T позволит и в этой области выработать оптимальные решения. 6.6. СТАНДАРТЫ ISDB Япония предложила свой проект стандарта цифрового вещания, основанный на давней идее интеграции цифровых вещательных служб (ISDB Integrated Services Digital Broadcast). Как и в связном аналоге — уже реализованной ISDN, в ISDB предлагается объединить общими интерфейсами и протоколами вещательную передачу самого разного контента видео, звука, графики, других мультимедийных компонентов. Версия стандарта для цифрового эфирного вещания — ISDB-T проработана в большей степени и предложена для международной стандартизации, поэтому мы рассмотрим ее более детально. Основные характеристики стандарта: использование интерфейса MPEG-2 для видеосигнала; гибкое использование различных схем модуляции — разный контент может одновременно передаваться в одном канале с оптимальными для каждой службы параметрами модуляции и кодирования; использование управляющих сигналов, чтобы сообщить приемнику о конфигурации потока и его параметрах; частичный прием — некоторые из сервисов в потоке могут быть приняты легким мобильным приемником. Технология ISDB-T достаточно проста и близка к DVB-T, поскольку также основана на COFDM. Она названа BST-OFDM (Band-Segmented OFDM OFDM с сегментацией полосы). Основное отличие от DVB-T транспортный поток после канального кодирования и перед раскладкой в COFDM символы разделяется на сегменты, соответ-
Глава 6. Передача компрессированных сигналов по каналам связи 169 Звук/данные ТВЧ Звук/данные ТСЧ под- ТСЧ стаци- вижное онарное Звук/ Звук/ данные данные / 1 / \ ^ / • ч!у чЬ- щи II шт IKS3 \1/ 1 ^н \ III III Широкополосный приемник \ 1 \ \ чЬ \U -ф \1у Узкополосный приемник Рис. 6.19. Сегментация участков спектра в ISDB-T ствующие различным службам, каждый сегмент формирует свои собственные COFDM символы, занимающие один или несколько единичных частотных участков с полосой Af = В0/14 МГц (В0= 6, 7 или 8 МГц). Параметры передачи OFDM несущих, относительная скорость внутреннего кода и длина интервала временного перемежения могут быть выбраны независимо для каждого сегмента данных, что дает дополнительную гибкость в использовании спектра. В одном канале одновременно могут передаваться до трех различных групп сегментов. Еще одно различие между DVB-T и ISDB-T — в последнем стандарте поддерживаются три режима модуляции — «2к», «4к» и «8к», а не два, как в DVB-T. Ограничивая диапазон частотного перемежения внутри сегмента, можно выделить специальный сегмент для частичного приема узкополосным приемником (с полосой одного единичного участка). Этот сегмент должен быть центральным по отношению к другим сегментам OFDM, как показано на рис. 6.19. На рис. 6.20 показана структурная схема кодера ISDB-T. Нетрудно видеть, что задержка сигнала в перемежителе отличается в потоках разных уровней. Для компенсации этой разницы в приемнике включается декодер перемежения, восстанавливающий первоначальное положение символов потока. Частотный перемежитель включает межсегментный и внутрисегментный перемежите ли. Внутрисегментное перемежение осуществляется по квазислучайному закону. В табл. 6.8-6.10 приведены основные параметры сегментации, кодирования и передачи для ISDB-T в полосе канала 6 МГц. Значения для других полос могут быть получены простым пересчетом. Регулярное вещание в стандарте ISDB-T предполагается начать в 2003 году в трех крупных урбанизированных районах Токио, Осака, Нагойя. Пока ведутся экспериментальные передачи и отрабатываются технические решения. Вариант стандарта ISDB для спутникового вещания ISDB-S известен в меньшей степени и рассчитан, по-видимому, на использование внутри Японии [6.19]. Он ориентирован на передачу в полосе 34,5 МГц цифрового потока со скоростью 28,86 Мсимв/с, в котором предполагается передавать до восьми ТВ программ. Техника передачи основывается на Рекомендации МСЭ-Р ВО. 1408 и включает сверточное кодирование и модуляцию ФМ-2, ФМ-4 или ФМ-8. В качестве метода цифрового сжатия видео выбран стандарт MPEG-2, для звука — схема ААС, мультиплексирование цифрового
170 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 1 Внешний кодер PC 1 Разделение цифрового потока 1 1 Скрембли- рование i Регулировка задержки Скрембли- рование i Регулировка задержки 1 1 Порязрядное перемежение Порязрядное перемежение i i Сверточное кодирование Сверточное кодирование 1 Переме- житель | 1 битов i II Раскладка || битов 2 J *< 50 1 X 30 1 Переме- житель | битов 1 Раскладка битов 2 о За 53 Л1 л S 20 1 Скрембли- рование i Регулировка задержки 1 Порязрядное перемежение 1 Сверточное кодирование | Переме- 1 житель | битов за 1 1 W» 1 а | Раскладка | -§ | битов | * Сборка иерархического цифрового потока Управляющий сигнал 1 Временной 1 перемежитель Частотный 1 перемежитель | 4L г 1 Адаптация кадра 1 OFDM Обратное преобразование Фурье i Введение защитного интервала Рис. 6.20. Структурная схема кодера и модулятора стандарта ISDB-T
Глава 6. Передача компрессированных сигналов по каналам связи 171 Табл. 6.8 Параметры сегмента в ISDB-T Режим Полоса частот единичного сегмента Число несущих | сегменте Разнос частот несущих, кГц Вид модуляции Число символов на кадр Эффективная длительность символа, мкс Защитный интервал Длительность кадра, мс Тактовая частота преобразования Фурье, МГц Внутренний код Внешний код Перемежение 1 2 3 | 6000/14 = 428.57 кГц 108 3,968 ФМ-4. КАМ-16, КАМ-64 216 1,984 ФМ-4, КАМ-16. КАМ-64 432 0,992 ФМ-4, КАМ-16, КАМ-64 | 204 | 252 63 мкс (1/4); 31,5 мкс (1/8) 15.75 мкс (1/16); 7.875 мкс (1/32) 64,26 (1/4) 57,83 (1/8) 54,62(1/16) 53,01 (1/32) 504 126 мкс (1/4); 63 мкс (1/8) 31,5 мкс (1/16); 15,75 мкс (1/32) 128.52(1/4) 115,67(1/8) 109,24(1/16) 106.03 (1/32) 1008 252 мкс (1/4); 126 мкс (1/8) 63 мкс (1/16); 31,5 мкс (1/32) 257,04 (1/4) 231,3(1/8) 218,46(1/16) 212,06(1/32) 512/63=8,127 МГц Сверточный (1/2, 2/3. 3/4, 5/6, 7/8) Рида-Соломона (204,188,8) По времени и по частоте
172 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Режим Число сегментов Ns Полоса сегмента, кГц Разнос частот несущих, кГц Вид модуляции Число символов на кадр Эффективная длительность символа, мкс Защитный интервал Длительность кадра, мс | Внутренний код | Внешний код 1 2 3 £13 6000/14xNs+3,968 3,968 6000/14xNs+1,984 1,984 6000/14xNs+0,992 0,992 ФМ-4, КАМ-16, КАМ-64, относит. ФМ-4 204 252 63 мкс (1/4); 31,5 мкс (1/8) 15,75 мкс (1/16); 7,875 мкс (1/32) 64,26 (1/4) 57,83 ( 1/8) 54,62(1/16) 53,01 (1/32) 504 1 126 мкс (1/4); 63 мкс (1/8) 31,5 мкс (1/16); 15,75 мкс (1/32) 128,52(1/4) 115,67(1/8) 109,24(1/16) 106,03(1/32) 1008 252 мкс (1/4); 126 мкс (1/8) 63 мкс (1/16); 31,5 мкс (1/32) 257,04 (1/4) 231,3(1/8) 218,46(1/16) 212,06(1/32) Сверточный (1/2, 2/3, 3/4, 5/6, 7/8) Рида-Соломона (204,188,8) Вид моду- ляции ФМ-4, относительная ФМ-4 КАМ-16 КАМ-64 Относит. скорость кода 1/2 2/3 3/4 5/6 7/8 1/2 2/3 3/4 5/6 7/8 1/2 2/3 3/4 5/6 7/8 Число TSP на кадр 1/2/3 12/24/48 16/32/64 18/36/72 20/40/80 21/42/84 24/48/96 32/64/128 36/72/144 40/80/160 42/84/168 36/72/144 48/96/192 54/108/216 60/120/240 63/126/252 Информационная скорость, кбит/с при Д /Т = 1/4 280,85 374,47 421,28 468,09 491,50 561,71 748,95 842,57 936,19 983,00 842,57 1123.43 1263.86 1404,29 1474,50 1/8 312,06 416,08 468,09 520,10 546,11 624,13 832,17 936,19 1040,21 1092,22 936,19 1248,26 1404,29 1560,32 1638,34 1/16 330,42 440,56 495,63 550,70 578,23 660,84 881,12 991,26 1101,40 1156,47 991,26 1321,68 1486,90 1652,11 1734,71 1/32 340,43 453,91 510,65 567,39 595,76 680,87 907,82 1021,30 1134,78 1191,52 1021.30 1361,74 1531,95 1702,17 1787,28 |
Глава 6. Передача компрессированных сигналов по каналам связи 173 потока осуществляется также согласно стандарту MPEG-2. Для сохранения непрерывности вещания в условиях сильных осадков предполагается переходить на иерархический режим передачи и транслировать в базовом слое изображение низкого уровня (MP@LL) с возможным снижением частоты кадров до 10 и даже до 2 Гц. В декабре 2000 года в Японии предполагалось начать спутниковое вещание в новом стандарте. Вещание пойдет в четырех стволах спутника BSAT-2a, который планировалось запустить в октябре того же года. 12 вещательных компаний Японии собираются передавать семь программ ТВЧ, три стандартных, большое число радиопрограмм и мультимедийную информацию. Распределение емкости между вещателями будет производиться единичными порциями слотами — размером приблизительно в 1 Мбит/с. 6.7. СТАНДАРТ ATSC 6.7.1. Обработка видеоданных ТВЧ Телевидением высокой четкости (HDTV High Definition TV в англоязычной литературе) традиционно принято считать систему передачи изображения с увеличенным форматом и числом строк и элементов в строке, примерно вдвое превышающими нынешние значения. Полагают, что качество изображения на ТВЧ экране сопоставимо с качеством изображения 35-мм кинопленки. Первые рекомендации в области ТВЧ были приняты МСЭ в середине 80-х годов. ТВЧ описывалось как система формата 16:9, допускающая просмотр с расстояния ЗН — трех высот экрана (для телевидения стандартного качества это расстояние составляет 6Н) с сохранением «прозрачного» (т.е. неотличимого от оригинала) изображения, улучшенным воспроизведением глубины, с многоканальным звуковым сопровождением. Соединенные Штаты Америки раньше других заявили о своих планах перевода всего эфирного вещания на формат высокой четкости. Еще в середине 80-х годов был создан Комитет по системам перспективного телевидения (ATSC — Advanced Television Systems Commitee) и началась разработка систем высокой четкости, совместимых с аналоговым сигналом NTSC, в том числе и по занимаемой в эфире полосе частот. Исследования в области ТВЧ велись и в Европе, и в Японии, но только США вели разработку совместимых систем для эфирного вещания. К 1991 г. разными компаниями было предложено шесть совместимых систем, из них четыре полностью цифровые. ATSC предложил компаниям-разработчикам объединить свои усилия и создать единый стандарт, который включал бы наилучшие решения из всех проектов. Консорциум, названный Большой Альянс, представил в 1995 г. проект полностью цифрового стандарта, позволяющего передать в полосе 6 МГц, выделенной в США под единичный ТВ канал, одну программу высокой четкости с многоканальным звуковым сопровождением, субтитрами и служебной информацией. Разработчики стандарта не смогли согласовать единый формат разложения, и в стандарт вошли два формата ТВЧ (HDTV-A с разложением 1280 х 720 пике, и HDTV-B с разложением 1920 х 1080 пике), один формат SDTV 704 х 480 пике, и компьютерный формат VGA 640 х 480 пике, (с прогрессивным разложением) [6.20, 6.21]. В отноше-
174 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 6.11 Форматы разложения, принятые в стандарте ATSC Число элем*, нтов в строке 1920 1280 704 704 640 Число строк в кадре 1080 720 480 480 480 Формат изображения 16:9 16:9 16:9 4:3 4:3 Стандарт SMPTE-274M SMPTE-292M SMPTE-296M SMPTE-293M SMPTE-294M - - Разложение прогрессивное чересстрочное прогрессивное прогрессивное чересстрочное прогрессивное чересстрочное прогрессивное чересстрочное Частота кадров 30,24 30 60, 30, 24 60, 30, 24 30 60,30,24,60/1,001 30/1,001,24/1,001 30,30/1,001 60,30,24,60/1,001 30/1,001,24/1,001 30,30/1,001 нии частоты кадров также не удалось достигнуть единого мнения, и в стандарте появились значения 60 Гц, 30 Гц, 24 Гц. Имеются варианты и в формате изображения (4:3 и 16:9), и в коэффициенте чересстрочное™. Итоговая таблица стандарта включает 18 вариантов (табл. 6.11), которые совместимый ТВ приемник обязан принимать. Если учесть еще подварианты с форматом 4:3 и частотой кадров fK/1,001, вводимые для совместимости с программным материалом NTSC, число вариантов возрастает до 26. В ATSC полагают, что, с точки зрения цифрового стандарта, нет принципиальной разницы между частотой кадров 30 Гц и частотой 30/1,001 = 29,97 Гц, однако это не совсем верно. В Рекомендации ВТ. 601, в ее 525-строчной части (ив американском стандарте SMPTE-259M), целое число отсчетов на строку — 858 — получается именно при частоте кадров 29,97 Гц. При 30 Гц будет уже 857,14 отсчета на строку — вся концепция интерфейса не работает. Из всех вариантов стандарта ATSC только четыре могут использовать существующий цифровой последовательный интерфейс SDI, и еще два могут быть сведены к нему путем перераскладки. Специальный цифровой интерфейс ТВЧ SMPTE-292M совместим с шестью из оставшихся комбинаций. Таким образом, общепринятые стандарты на интерфейсы совместимы только с частью всех возможных вариантов стандарта ATSC и необходима разработка новых интерфейсов для оставшихся вариантов. 6.7.2. Выбор вида модуляции для стандарта ATSC В отличие от DVB Project, разрабатывавшего широкий набор гибких стандартов для различных применений, ATSC вел целенаправленную работу по созданию системы эфирного цифрового вещания ТВЧ. Уже к 1994 г. стало ясно, что стандарт сжатия MPEG-2 в состоянии обеспечить коэффициент сжатия 60:1 с сохранением высокого субъективного качества изображения, и было принято решение взять его за основу при выборе алгоритма компрессии и формата транспортного потока. Проведенные испытания пока-
Глава 6. Передача компрессированных сигналов по каналам связи 175 a) AM б) AM с подавленной несущей в) AM ОБП Рис. 6.21. Формирование AM ОБП сигнала зали, что скорость выходного транспортного потока 18 Мбит/с и выше достаточна для достижения желаемого качества изображения. Следующим этапом выбора, вызвавшим много споров, стал выбор вида модуляции. С самого начала было ясно, что для передачи цифрового потока со скоростью более 18 Мбит/с в полосе частот менее б МГц необходима многопозиционная модуляция с удельной скоростью передачи не ниже 4 бит/с на герц полосы. Теоретически такую удельную скорость могут обеспечить ФМ-16, КАМ-16 и ОБП-4. О фазовой и квадратурной амплитудной модуляции мы уже говорили в первой главе, о существовании амплитудной модуляции с подавленной боковой полосой (а именно так расшифровывается аббревиатура ОБП, или VSB — Vestigial Side-Band по-английски) только упомянули и потому расскажем о ней несколько подробнее. При обычной AM спектр выходного сигнала содержит несущую частоту и две боковые полосы, зеркально повторяющие одна другую, причем основная часть энергии сигнала сосредоточена в несущей (рис. 6.21а). Несложное устройство — балансный модулятор, содержащий два обычных модулятора, питаемых противофазными сигналами несущей, позволяет подавить компонент несущей частоты и сохранить только боковые полосы (рис. 6.216). Если теперь подать полученный сигнал на полосовой фильтр, пропускающий только верхнюю или только нижнюю боковую полосу, получим на выходе фильтра ОБП сигнал (рис. 6.21в). Он содержит ту же информацию, что и AM сигнал, но в полосе вдвое меньшей и без расходования энергии на бесполезную несущую (обычно в сигнале оставляют незначительный остаток неподавленной несущей для синхронизации демодулятора на приеме). При подаче на вход т -уровневого цифрового сигнала обеспечивается передача с удельной скоростью т бит/с на герц. При выборе вида модуляции американские исследователи принимали во внимание следующие факторы: 1) пороговое отношение C/N для демодуляции; 2) защитное отношение в совпадающем и соседних каналах от цифровых и аналоговых ТВ сигналов; 3) способность работы в одночастотной и двухчастотной сети. Исследовалась возможность применения как одночастотных, так и многочастотных методов, аналогичных COFDM. Модуляция ФМ была забракована как имеющая худшие характеристики отношения C/N. KAM и ОБП рассматривались как примерно равноценные по помехозащищенности, но К AM оценивалась как более восприимчивая к помехам со стороны аналоговых NTSC сигналов. В результате многочисленных экспериментов для стандарта ATSC был выбран разработанный фирмой Zenith метод многоуровневой одночастотной ОБП. Однако четырехуровневое кодирование не обеспечивает передачу информации с требуемой скоростью, так как до 40% битов расходуется на помехоустойчивое кодирование, поэтому для наземного вещания была выбрана 8-уровневая ОБП-8Т с треллисным кодированием. Для кабельных сетей предложено применять ОБП-16 без треллисного кодирования. В табл. 6.12 приведены взятые из Рекомендации МСЭ-Т J.83 результаты расчетов основных параметров системы при различных видах однополосной модуляции [6.22]. В модели ОБП с идеальным фильтром с полосой F максимальная скорость следова-
176 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 6.12 Основные параметры передачи сигналов с однополосной AM Параметр Полоса частот, МГц Символьная скорость, Мсимв/с Спектральная эффективность, бит/Гц Треллисное [кодирование Код PC (207,187) | Длина сегмента Длительность {синхросигнала, симв. Полезная скорость [данных, Мбит/с Пороговое отношение |сигнал-шум, дБ Порог импульсного | шума, мкс Порог помех от NTSC | в совпадающем канале Вид модуляции ОБП-2 6 10.762 1 нет да 832 4 9,6 9,8 386 нет ОБП-4 6 10,762 2 нет да 832 4 19,3 16,1 193 нет ОБП-8 6 10,762 3 нет да 832 4 28,9 22,3 144 нет ОБП-16 6 10,762 4 нет да 832 4 38,6 28,5 96 нет ОБП-8Т 6 10,762 3 2/3 да 832 4 19,3 15,0 193 2дБ 1,0 0,5_ Г Пилот-сигнал 5,38 МГц 6 МГц ч I ния импульсов, как вытекает из теоремы Котельникова, составляет 2F. В силу физической нереализуемости идеального фильтра применяют реальные фильтры Найквиста, обладающие тем же свойством отсутствия межсимвольной интерференции, но ценой конечной крутизны скатов АЧХ и связанного с этим некоторого снижения максимальной скорости символов. В стандарте ATSC применяют фильтры с косинусным скруглением в переходных областях вида cos2 x. АЧХ канала передачи с такими фильтрами имеет вид, показанный на рис. 6.22. Для такого фильтра максимальная скорость передачи символов Rciimb = 2F/(l+a), где а — параметр скругления, он выбран равным 0,1152. Для упрощения технических решений частота следования импульсов жестко привязана к частоте строк и равна ее 684-й гармонике. R = 68415750/1,001 « 10,762 Мсимв/с. Рис. 6.22. АЧХ канала передачи для сигнала ATSC
Глава 6. Передача компрессированных сигналов по каналам связи 177 6.7.3. Формирование сигнала стандарта ATSC Описанный метод модуляции обеспечивает максимальную пропускную способность в случае, когда канал передачи имеет гладкую АЧХ и линейную фазовую характеристику. В реальном канале из-за наличия помех и отражений характеристики могут меняться во времени и эти изменения нужно адаптивно отслеживать, чтобы избежать возникновения межсимвольных искажений. Устройство, выполняющее эту задачу, называется гармоническим корректором (в дословном переводе с английского эквалайзером) и играет решающую роль в приемнике ATSC. Вход Скрем- блер И Кодер PC Переме- житель Предкодер и треллисный кодер Синхросигнал сегмента (ССП) Синхросигнал поля (ССП) Ввод пилот- сигнала К модулятору > Рис. 6.23. Структурная схема кодера ATSC Структура кодера стандарта ATSC приведена на рис. 6.23 [6.23, 6.24]. Как и стандарты DVB, ATSC имеет дело с транспортными пакетами MPEG-2 длиной 188 байтов. Синхро- байт пакета 0x47 удаляется, так как в системе используется собственная синхронизация внутри потока данных. Оставшиеся 187 байтов пакета скремблируются и подвергаются помехоустойчивому кодированию в кодере Рида-Соломона, где к ним добавляются 20 байтов проверочных символов. Последующее глубокое перемежение способствует борьбе с пакетными ошибками. Для передачи в канале данные организуются в кадр, состоящий из двух полей, каждое из них содержит по 313 сегментов (рис. 6.24). Сегмент, в свою очередь, содержит 832 символа, из них первые 4 передаются в бинарной форме и образуют синхросигнал сегмента (ССС), а остальные 828 символов несут полезную информацию. Так как каждый символ треллисного кода при ОБП-8Т переносит 2 бита полезной информации, каждый сегмент несет 828 х 2 = 1656 битов, или 207 байтов, т.е. ровно столько, сколько содержит пакет MPEG-2 после исключения синхробайта и добавления проверочных байтов. Треллисный кодер осуществляет функции внутреннего кодирования, он обеспечивает энергетический выигрыш порядка 3,3 дБ. После кодирования производится ввод синхросигналов и пилот-сигнала. В начало каждого поля вводится синхросигнал поля (ССП) — уникальный сигнал, выполняющий функции кадровой синхронизации и одновременно служащий тренировочным сигналом для компенсатора. Выходной 8-уров- невый сигнал используется для модуляции несущей с подавленной боковой полосой. Рассмотрим работу кодера более подробно. Транспортные пакеты поступают на вход скремблера, содержащего регистр сдвига с 16 ячейками. Здесь биты каждого байта индивидуально суммируются по модулю 2 с восемью битами D0, Dt,...D7, образующимися на выходах генератора 16-разрядной ПСП (рис. 6.25). Инициализация генератора кодовым словом 0xF180 производится в начале каждого поля. Тактовой частотой скремблера служит частота поступления байтов. Байт, полученный в результате суммирования, поступает в кодер Рида-Соломона как скремб- лированное представление исходного байта. Корректирующая способность кодера выб-
178 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю X ф s со ш о X ф 8 со со о 828 символов ССП1 Данные и проверочные символы ССП2 Данные и проверочные символы 77,3 мкс (1 сегмент) 24,2 мс 24,2 мс Рис. 6.24. Структура кадра данных стандарта ATSC рана равной 10, поэтому пакеты на выходе содержат 207 байтов, и формулу кода можно записать как (207,187,10). Следующее устройство — перемежитель — действует по тому же принципу, что и аналогичный каскад в схеме DVB, но параметры его значительно отличаются. Он содержит 52 регистра сдвига с числом ячеек пхМ > где М = 4 байтам и п = 0, 1, 51, и осуществляет перемежение на глубину 52 сегмента, т.е. на 1/6 поля. После перемеже- ния внутри каждого сегмента соседними оказываются байты, разделенные первоначально расстоянием в 52 байта. Во столько же раз возрастает допустимая длительность пакета ошибок. Внутренний кодер построен по схеме с треллисным кодированием. Он вычисляет по двум информационным битам Bt и В2 три кодовых бита Ct, C2, С3, каждой из восьми возможных комбинаций которых раскладчик (mapper) ставит в соответствие один из уровней (-7, -5, -3, -1, +1, +3, +5, +7). Сверточному кодированию с R = 1/2 подвергается только младший бит пары, старший бит в треллисном кодере не изменяется, но претерпевает дополнительную обработку в предкодере, связанную с устранением влияния режекторного фильтра в приемнике. В результате на каждые входные два бита на выходе появляются три бита, т.е. относительная скорость кодирования составляет 2/3.
Глава 6. Передача компрессированных сигналов по каналам связи 179 «В Ю аи.<Ф + X + со X + (О X + X + *х + № [ф W W \¥ zm [Ф~ ZT^E X + со *Х + to *Х II JT [ф~ [ф~ IW тт zr * ъ_ [©" тт: [Ф~ Г®" [^ zm IT^E О СО аз а о с[ О Q. а) vo а) а О ю CNJ СО О S Q. mi-(ДО
180 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю /- \ 1Л \ £ Кодер №1 Кодер №2 — Кодер №12 -4--# а) б) г* е га га с; о га а. Рис. 6.26. Схема внутрисегментного перемежителя (а) и треллисного кодера (б) ссп Рис. 6.27. Структура синхросигналов стандарта ATSC Для дальнейшего уменьшения влияния импульсных помех в треллисном кодере применяется дополнительное внутрисегментное перемежение. Оно реализуется с помощью 12 одинаковых треллисных кодеров, каждый из которых работает с уменьшенной в 12 раз скоростью потока данных. Первый кодер обрабатывает символы (0, 12, 24,...), второй — (1, 13, 25,...) и т.д., что эквивалентно перемежению с шагом 12. Схема внутрисегментного перемежителя показана на рис. 6.26а, один из кодеров изображен на рис. 6.266. Окончательное формирование сигнала для модулятора происходит в мультиплексоре путем вставки синхросигнала и добавления пилот-сигнала. На место стандартного для MPEG-2 синхробайта 0x47 вставляются четыре элемента синхросигнала сегмента (+5, -5, -5, +5). В начале каждого поля производится вставка синхросигнала поля (ССП), элементы которого также представлены двумя уровнями: +5 и -5. В структуру ССП входит одна ПСП с 511 элементами и три одинаковых коротких ПСП с 63 элементами. Эти ПСП помимо кадровой синхронизации в приемнике выполняют также функцию "обучающих" сигналов для настройки компенсатора. Обнаружение обоих синхросигналов в приемнике производится корреляционным методом и оказывается надежным даже при отношении сигнал-шум 0 дБ. На рис. 6.27 приведена структура синхросигналов стандарта ATSC. Формирование пилот-сигнала также производится цифровым методом. Добавка не-
Глава 6. Передача компрессированных сигналов по каналам связи 181 большой постоянной составляющей +1,25 к каждому элементу многоуровнего сигнала обеспечивает наличие пилот-сигнала с уровнем на 11,3 дБ ниже средней мощности. Скорость передачи информации в стандарте ATSC жестко фиксирована выбором параметров канального кодирования и символьной скорости и составляет: R„„* nR (188/187).(187/207)(828/832).(312/313) * 19,39... Мбит/с, инср симв где п = 2 — число информационных бит на символ, а остальные сомножители учитывают удаление синхробайта 0x47, кодирование Рида-Соломона и ввод синхросигналов ATSC. Помехоустойчивость выбранного в стандарте вида модуляции ОБП-8Т определяется по отношению сигнал-шум на входе, при котором достигается так называемый «порог прозрачности» (TOV Treshold of Visibility) — заметные на глаз импульсы шума на экране ТВ приемника. ОБП с треллисным кодированием требует входного отношения 15 дБ, без кодирования 22,3 дБ. Стандартом ATSC предусмотрен высокоскоростной режим ОБП-16 без треллисного кодирования для кабельных сетей. В таком канале значительно легче обеспечить более высокое отношение сигнал-шум, поэтому требуемое для ОБП-16 значение 28,5 дБ не представляет особых проблем. Удельная скорость передачи достигает 8 бит/с на герц полосы, а полная информационная скорость в канале 38,78 Мбит/с. По нормам ATSC этого достаточно для передачи двух ТВЧ программ. В отличие от ОБП-8, переме- жение осуществляется на глубину 1/12 поля (В = 26), раскладка идет на 16 уровней от -15 до +15, синхросигналы формируются уровнями +9 и -9. 6.7.4. Передача звуковых сигналов в стандарте ATSC — система АС-3 (Dolby Digital) Дальнейшим развитием форматов Dolby Surround и Dolby Pro Logic стал цифровой формат АС-3, получивший коммерческое название Dolby Digital — первый многоканальный формат цифрового сжатия звука. Этот формат широко применяется в кинотеатрах, он выбран как основной для стандарта ATSC [6.25] и включен в качестве опции в звуковую часть стандарта MPEG-2, чтобы удовлетворить Рекомендации BS.775, предусматривающей вещание ТВЧ с многоканальным звуком 5.1. АС-3 применен также в стандарте записи на видеодиски DVD. Входной поток звукоданных в стандарте АС-3 — ИКМ отсчеты с частотой дискретизации 48 кГц и разрядностью до 20 бит/отсчет, например, сигнал AES/EBU. Скорость цифрового потока полного сигнала 5.1 может выбираться в пределах 32...640 кбит/с, для вещания и DVD используется скорость 384 кбит/с. При такой скорости звучание неотличимо от оригинального. Хотя скорость на канал в среднем оказывается при этом невысокой, используется свойство многоканального сигнала, заключающееся в росте потребности в битах пропорционально не числу каналов, а квадратному корню из этого числа. Если, например, один канал требует скорости 128 кбит/с, то для сигнала 5.1 при том же качестве требуется всего 289 кбит/с. Здесь используется свойство слуха реагировать в высокочастотной области не на отдельные пространственно разнесенные сигналы, а на их огибающую. В области выше 7 кГц сигнал делится на огибающую и несущие, кодируемые раздельно. Совместимость с Dolby Surround и Dolby Pro Logic, как и в многоканальном MPEG-2, обеспечивается благодаря дополнительному формированию комбинированного стереосигнала, в котором переносится вся информация, необходимая для работы этих систем. В стандарте ATSC приняты 8 типов звуковых служб (service) — 2 основных и 6 сопутствующих, различающихся назначением, числом каналов и их параметрами. Служба
oo го Входной буфер Обнаружение переходов ФВЧ 3 Гц Обработка оконной функцией Прямое TDAC преобразование мантиссы \ Преобразование [1 |—| в режиме с плавающей точкой Флаги переходов мантиссы Квантователь характеристики Разделение огибающей и ВЧ компонентов Глобальное распределение битов helper характеристики Коэффициенты связывания о. о J0 2 Рис. 6.28. Упрощенная схема кодера АС-3 характеристики характеристики Вход Входной буфер Распаковка потока с фиксированной скоростью Глобальное распределение битов Распаковка потока с переменной скоростью А Ввод ВЧ И мантиссы JL компонентов helper Преобразование в формат с фиксированной запятой И КМ отсчеты И Обратное TDAC преобразование ж Обработка функцией окна Сумматор Рис. 6.29. Упрощенная схема декодера АС-3 LP s ■о о ш о m го m х m I CD 0) ГО s 5
Глава 6. Передача компрессированных сигналов по каналам связи 183 «Полная Основная» (СМ — Complete Main) наиболее широко применяемая, предусматривает передачу любых звуковых программ (диалоги, музыка, звуковые эффекты), число каналов от 1 до 5.1, может сопровождаться любой из сопутствующих служб, описанных ниже. Для организации многоязычного вещания можно организовать несколько служб СМ. Основная служба «Музыка и эффекты» (ME — Music and Effects) используется преимущественно для трансляции музыкальных программ, число каналов здесь также любое от 1 до 5.1, при необходимости добавить диалоги можно дополнительно организовать Диалоговую службу (D — Dialogue) и передать оба сигнала в одном потоке. Задача сопутствующих служб VI (Visually Impaired — для плохо видящих) и HI (Hearing Impaired — для плохо слышащих) ясна из их названия. Комментаторская служба (С — Commentary) сходна с Диалоговой и отличается передачей не всего объема диалогов, а отдельных комментариев. Службы Экстренная (Е Emergency) и Голосовая (VO Voice-Over) предназначены для оповещения при аварийных ситуациях. Первая имеет высший приоритет и блокирует любой сигнал, с которым передается, вторая позволяет снижать громкость основного сигнала на величину до 24 дБ. В стандарте определены максимальные скорости передачи для отдельных служб и их комбинаций. Основные службы могут передаваться со скоростью до 384 кбит/с (канал 5.1), сопутствующие одноканальные — до 128 кбит/с, двухканальные — до 192 кбит/с, совместная передача основной и сопутствующей служб может занимать ресурс до 512 кбит/с. Структурная схема кодера АС-3 показана на рис. 6.28. Входной поток звукоданных в виде И КМ отсчетов всех шести каналов через фильтр верхних частот с частотой среза 3 Гц поступает на блок фильтров (БФ) для полосного кодирования и одновременно на дополнительный фильтр, обнаруживающий быстрые переходы. В стационарном режиме анализируется блок из 512 отсчетов длительностью 10,66 мс, при обнаружении активной динамики кодер переходит в режим анализа двух блоков по 256 отсчетов. До преобразования в частотную область блок отсчетов обрабатывается функцией окна. Эта операция представляет собой векторное умножение 512 отсчетов на 512-точечную функцию окна, которая имеет значение 1 в центральной точке и постепенный спад к краям. В блоке фильтров набор отсчетов преобразуется в набор частотных коэффициентов, при этом за счет специального выбора функции окна исключается перекрытие отсчетов во временной области (TDAC — Time Domain Alias Cancellation). Частотное разрешение блока фильтров составляет 93,75 Гц. Во избежание нарушений непрерывности сигнала на границе блоков БФ обрабатывает отсчеты с 50%-ным наложением — каждый блок содержит 256 новых и 256 отсчетов из предыдущего блока, на выходе получается набор из 256 частотных коэффициентов. Временная синхронизация работы кодера осуществляется объединением шести последовательных блоков отсчетов в кадр, содержащий 1536 отсчетов (по числу неперекрывающихся частей блоков) и заголовок с необходимой информацией о синхронизации — число каналов, уровень диалога, код языка и др. После БФ частотные коэффициенты преобразуются в формат с плавающей точкой, при котором, как мы помним, число представляется двумя элементами — характеристикой и мантиссой. Масштаб преобразования выбран таким образом, что все коэффициенты оказываются меньше 1. Число нулей после запятой дает характеристику, следующие значащие цифры — мантиссу. Кодирование этих элементов происходит раздельно. Характеристики кодируются дифференциально, каждая может занимать одну из пяти позиций по отношению к предыдущей: -2, -1, 0, +1, +2. (Ступень соответствует 6 дБ, предполагается, что два соседних коэффициента отличаются не более чем на 12 дБ.) Набор кодированных характеристик формирует представление о всем спектре сигнала и
184 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю называется спектральной огибающей. Группа из трех соседних коэффициентов кодируется как одно 7-битовое число и посылается либо каждые шесть блоков (установившийся сигнал), либо каждые два блока (изменение сигнала происходит за два-три блока), либо каждые четыре блока (переходный участок между двумя режимами). Мантиссы квантуются достаточно грубо и передаются в отдельном потоке. Оба потока объединяются мультиплексором. Если работа идет на очень низких скоростях и кодеру не хватает битов, он может перейти в режим связывания (coupling). В этом режиме каналы в высокочастотной области связываются (объединяются) в единый канал. Огибающая суммарного сигнала в высокочастотной области кодируется с высокой точностью и передается отдельным цифровым потоком. Эффективность работы кодера в значительной степени зависит от выбора стратегии распределения битов, которую мы обсуждали в главе 2. В АС-3 выбрана гибридная прямая/обратная адаптация, вследствие этого декодер оказывается достаточно сложным, сложнее, чем декодер Уровня II в MPEG-1/2. Процесс восстановления звукодан- ных понятен из структурной схемы декодера, показанной на рис. 6.29. 6.8. СРАВНЕНИЕ 0БП-8Т С COFDM Выбор двумя ведущими экономическими группировками — Европейским Союзом, с одной стороны, и США, с другой стороны — практически в одно и то же время различных стандартов цифрового телевизионного вещания вызвал жаркие дебаты и споры, чей стандарт лучше. Вопрос заключается, конечно, не в техническом совершенстве того или иного метода модуляции, остроту ему придают миллиарды долларов, которые потекут к ведущим компаниям-производителям оборудования соответственно в Европе или США из десятков стран по всему миру, которым предстоит выбрать тот или иной стандарт вещания. Во многих странах проводились и еще продолжаются сравнительные испытания обоих стандартов, результаты испытаний пересматриваются вновь пришедшими к власти правительствами (как происходит, например, в Бразилии и Аргентине, первоначально выбравших ATSC). Дискуссия особенно обострилась после того, как в самих США раздались голоса в пользу COFDM. Влиятельная ассоциация вещателей восточного побережья Sinclair Group обратилась с петицией в Федеральную комиссию связи (ФКС) США, предлагая пересмотреть решение, допускающее использование в США только ОБП-8Т. К Sinclair присоединились две наиболее мощные сети эфирного вещания NBC и ABC/Disney. ФКС отвергла петицию, опасаясь задержки развертывания цифровой сети при появлении альтернативного стандарта, но вынуждена была назначить дополнительные испытания. Массачусетский университет провел независимое исследование, вывод которого гласит: «Ясно, что в динамическом канале с многолучевыми замираниями DVB-T имеет существенные преимущества перед ATSC. Неизвестно, существует ли технология для приемников с приемлемой стоимостью, которая позволила бы системе ATSC работать в канале с динамическими многолучевыми замираниями. Трудно ожидать создания приемника со схожими с DVB-T характеристиками». ATSC сейчас вынужден оправдываться и обещать провести доработку стандарта с целью устранения наиболее серьезных недостатков. Проблема оказалась для комитета
Глава 6, Передача компрессированных сигналов по каналам связи 185 достаточно неожиданной, так как при выборе метода модуляции американцы основное внимание уделили достижению минимальной мощности вновь устанавливаемых цифровых передатчиков, чтобы снизить помехи существующей аналоговой сети, и поэтому считали приоритетными такие свойства выбранного способа обработки, как более низкое пороговое отношение сигнал-шум, меньшее превышение пиковой над средней мощностью, более глубокое перемежение, лучшую исправляющую способность кода Рида- Соломона и др. По-видимому, вопросы приема многолучевого сигнала и приема в движении не относились к приоритетным в период принятия решения. Основные аргументы в пользу сохранения ОБП-8Т таковы: 1) следующее поколение приемников будет лучше справляться с проблемами многолучевости; 2) слишком дорого заменять уже установленное оборудование; 3) смена стандарта вызовет неприемлемую задержку перехода на новый стандарт. Однако противники ОБП-8Т не считают эти аргументы убедительными. Для решения проблемы в ATSC была образована специальная исследовательская группа, которая провела исследования по многим направлениям: бытовые антенны, условия распространения, характеристики приемников и пути возможного их улучшения, характеристики передатчиков. В отчете группы [6.26] предлагается идти путем «постепенных улучшений», возлагая надежды на разработку более совершенных интегральных микросхем. Испытания последних изделий компаний Motorola, Zenith показали, что они могут компенсировать одиночные отраженные сигналы статического характера, опережающие основной до 6 мкс и запаздывающие до 40 мкс, с уровнем до 0 дБ относительно основного сигнала. Однако при динамическом изменении отраженного сигнала степень компенсации снижается, и тем сильнее, чем выше частота изменений. Компенсация полностью отсутствует в канале Рэлеевского типа: без основного сигнала и при наличии нескольких мощных динамически меняющихся отраженных сигналов. Характерная фраза из отчета: «Неясно, могут ли любые улучшения компенсатора решить проблему Рэлеевского канала». Для объективного рассмотрения вопроса МСЭ назначил «специального докладчика» (одна из форм работы МСЭ) по анализу сравнительных характеристик обоих цифровых стандартов. Анализ был основан на теоретических результатах и лабораторных исследованиях, однако учитывались и экспериментальные результаты, и ожидаемые улучшения. Сравнения проводились по следующим основным показателям: отношение пиковой к средней мощности модулированного сигнала; порог чувствительности по отношению сигнал-шум; искажения при многолучевом распространении; возможность приема в движении и внутри помещения; эффективность использования спектра; возможность передачи ТВЧ сигналов; помехи существующим службам аналогового вещания; восприимчивость к импульсным и гармоническим помехам; восприимчивость к помехам со стороны аналоговых и цифровых ТВ сигналов в совпадающем канале; возможность масштабирования на полосы 6, 7, 8 МГц. Не включались в рассмотрение такие аспекты, как гибкость COFDM в отношении выбора скоростей передачи и параметров кодирования, ее же совместимость с иерархической модуляцией, возможность передачи дополнительных потоков данных с произвольным распределением емкости между телевидением и данными (в ATSC передача данных крайне ограничена). Результаты рассмотрения были изложены в отчете, представленном в 11-ю Исследовательскую комиссию МСЭ [6.27]. Одновременно свою версию отчета подготовила Техническая секция DVB Project [6.28]. По мнению DVB, эксперты МСЭ подошли к анализу предвзято, необъективно и преувеличили некоторые преимущества ОБП-8Т (спектраль-
186 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ную эффективность, более низкое отношение сигнал-шум, устойчивость к импульсным шумам), умолкав о ее недостатках (например, о невозможности приема в помещении). Оба документы сопоставляли только стандарты ATSC и DVB-T. В работе [6.29] на основе доклада МСЭ проведено сопоставление всех трех стандартов наземного вещания, претендующих на ведущую роль в мире: ATSC, DVB-T и ISDB-T. Хотя DVB-T и ISDB-T используют COFDM с очень незначительными различиями и по большинству параметров результаты анализа совпадают, некоторые отличия в [6.29] все же отмечены. Ниже на основе [6.29, 6.30] изложены основные результаты проведенного рассмотрения с той степенью объективности, которая вообще возможна при сопоставлении данных, полученных для различных систем разными методами при зачастую несовпадающих критериях. Основные показатели для ОБП-8Т и COFDM приведены в табл. 6.13, преимущество одной из систем в таблице отмечается кратным повторением значка ©. Общее сравнение систем. Отмечается, что каждая система имеет свои преимущества и недостатки. Сигнал ATSC более устойчив в Гауссовом канале, менее чувствителен к импульсным шумам, имеет меньшее отношение пиковой к средней мощности в канале, более подходит для реализации многочастотных сетей вещания (MFN). Обе системы примерно равноценны по влиянию помех от аналогового телевидения и по воздействию отраженных сигналов низкого уровня. Система DVB-T имеет преимущества в условиях сильных отражений (до 0 дБ мощности отраженного сигнала по сравнению с основным), при значительном запаздывании и опережении отраженного сигнала, при динамической многолучевости (изменяющейся во времени), она более пригодна для одночастотных сетей (SFN) и приема в движении. Отношение пиковой к средней мощности сигнала. При прочих равных условиях ОБП-8Т имеет на 2,5 дБ более низкое отношение в 99,99% времени, это означает, что передатчик COFDM должен иметь больший запас по мощности. Пороговое отношение сигнал-шум (C/N) в Гауссовом канале. Трактовка этого результата вызвала наибольшие затруднения и споры, в основном из-за различия критериев оценки порога. В стандарте DVB-T он определяется как отношение сигнал- шум, при котором достоверность на входе кодера Рида-Соломона достигает 210"4, на выходе канала в этом случае коэффициент ошибок менее 10"11 — это практически среда, свободная от ошибок (QEF). В качестве критерия порога в стандарте ATSC принят так называемый «порог видимости» (Threshold of Visibility) — уровень ошибок, при котором они практически незаметны на экране (соответствует коэффициенту ошибок 3-Ю"6, или 60 ошибкам в секунду). Оценка по соотношению сигнал-шум не учитывает также различия в скорости передачи в стандарте DVB-T при изменении защитного интервала. Для «честного» сравнения эксперты МСЭ предложили пересчитать результаты к единому порогу и к отношению Eb/N0. Принято, что переход от QEF к TOV эквивалентен снижению C/N на 1,3 дБ для COFDM и на 0,8 дБ для ОБП-8Т. Для полноты информации в табл. 6.13 приведены значения C/N, предложенные DVB, и значения Eb/N0 из [6.29]. Как видно из таблицы, при одинаковой относительной скорости кода R = 2/3 ОБП-8Т требует примерно на 3 дБ меньшего отношения Eb/N0. Эта разница складывается из следующих составляющих: ~ код Рида-Соломона с t = 10 и более глубоким перемежением имеет примерно на 0,3...0,5 дБ лучшую корректирующую способность, чем код с t = 8; - треллисный код стандарта ATSC имеет примерно на 0,5...1 дБ лучшие характеристики, чем перфорированный сверточный код стандарта DVB-T, не вполне оптимальный для данного канала и выбранный из соображений унификации со стандартами DVB-S и DVB-C;
Глава 6. Передача компрессированных сигналов по каналам связи 187 Табл. 6.13 Сравнение методов модуляции COFDM и ОБП-8Т Параметр 1. Отношение пиковой к средней мощности сигнала 2. Характеристика системы в Гауссовом канале, дБ сигнал-шум теоретически экспериментально в радиоканале теоретически экспериментально в радиоканале 3. Многолучевое распространение статическая многолучевость антенна на крыше переносные приемники динамическая многолучевость 4. Прием внутри помещения 5. Прием в движении 6. Коэффициент шума приемника 7. Минимальный уровень сигнала 8. Эффективность использования спектра MFN | SFN ОБП-8Т(АТ8С) е 14,8 15,1 9,7/10,5 10,1/10,9 е одинаков е COFDM(DVB-Tm ISDB-T) 15,2 17,4 10,4/11,7 11,4/12,7 12,7/14,0 13,6/14,9 13,1/14,4 14,1/15,4 13,2/14,4 14,0/15,3 ее еее еее еее одинаков е еее Примечание DVB-T, R=2/3,3M=1/32 DVB-T, R=3/4,3M =1/32 ISDB-T, R=2/3,3M =1/32 ISDB-T, R=3/4,3M= 1/32 DVB-T, R=2/3, ЗИ =1/32 DVB-T, R=3/4,3M =1/32 ISDB-T, R=2/3, ЗИ =1/32 ISDB-T, R=3/4,3M =1/32
188 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 6.13 (продолжение) Параметр 9. Передача ТВЧ и многопрограммного ТСЧ 10. Помехи аналоговым системам 11. Одночастотные сети большие SFN сети одноканальНые ретрансляторы 12. Импульсные шумы 13. Гармоническая помеха 14. Помехи от аналоговых ТВ систем в совпадающем канале 15. Помехи от цифрового телевидения в совпадающем канале 16. Чувствительность к фазовым шумам 17. Масштабируемость к различным полосам частот 18. Иерархическая модуляция 19. Гибкость системы OBn-8T(ATSC) да низкие нет да ее одинаково ее ее одинаково нет COFDM (DVB-T и ISDB-T) да* средние да да ее одинаково одинаково да ее Примечание *DVB-T в полосе 6 МГц может иметь затруднения За счет более низкого C/N - ряд ухудшений в приемнике COFDM, связанных с подавлением многолучевости, приводит к проигрышу еще 1,5...2 дБ. Отмечается, что со временем часть этих ухудшений может быть устранена и различие между системами уменьшится. Обращает на себя внимание значительное расхождение данных моделирования и экспериментальных данных для DVB-T — до 2,5 дБ, в то время как у ATSC и ISDB-T это различие составляет 0,4...0,5 дБ. Дело в том, что при компьютерном моделировании канала для DVB-T в расчет не были заложены потери на оценку состояния канала. В свое время, после испытаний в Австралии, эта разница в З...3,5 дБ казалась некоторым специалистам бесспорным доказательством преимущества ATSC. Сейчас уже ясно, что пороговое отношение сигнал-шум — лишь один из опорных параметров, и далеко не самый важный. Как уже отмечалось, этот параметр определяется для Гауссовой модели канала, а реальный канал эфирного вещания практически никогда не бывает Гауссовым из-за наличия отражений. Различие позиций американских и европейских специалистов сказывается и в подходе к частотному планированию. В США при планировании используется модель Гаусса, поэтому такое внимание уделяется снижению C/N. В Европе за основу взята модель Раиса, в которой отношение C/N на 0,5... 1 дБ выше, поэтому в расчеты закладывается запас 2 дБ по этому параметру.
Глава 6. Передача компрессированных сигналов по каналам связи 189 Многолучевое распространение. В таблице показано, что ATSC имеет некоторое преимущество при приеме на направленную антенну, установленную высоко на крыше (уровень отраженной волны на 4...6 децибел ниже прямой), но совершенно теряет это преимущество при приеме на переносимые приемники и особенно в условиях динамической многолучевости. Особую трудность для ATSC представляют эхо-сигналы с большим опережением, типичные для SFN сети. Хотя для компенсации эхо- сигналов требуется повышенное отношение C/N, часть необходимой энергии сигнала может быть заимствована от самих эхо-сигналов. Прием внутри помещения. Этот вопрос требует дальнейших исследований, но уже сейчас ясно, что только COFDM может обеспечить устойчивый прием на комнатную антенну. Прием в движении. Как и для приема в помещении, только COFDM пригодна для приема на движущихся транспортных средствах. Это свойство подтверждено неоднократными испытаниями в трамваях, автомобилях и поездах на скоростях до 150 км/час. Для верхней части дециметрового диапазона подходит режим «2к» с R =1/2 или 2/3, в метровом диапазоне можно использовать режим «8к» (возможен прием в транспортном средстве сигналов больших SFN сетей). Хорошим решением проблемы нехватки радиоканалов может служить иерархическая модуляция, позволяющая принимать в движении с пониженным качеством сигнал, передаваемый для стационарных приемников с высоким качеством. Коэффициент шума приемника. При планировании служб в рамках МСЭ для цифрового эфирного телевидения был принят одинаковый коэффициент шума 5 дБ для ATSC и DVB-T в метровом диапазоне и различные значения — 10 дБ и 7 дБ соответственно — в дециметровом диапазоне. Этот запас позволяет частично компенсировать повышенное отношение C/N в канале COFDM. Эффективность использования спектра. В режиме MFN некоторое преимущество имеет ATSC, так как из-за наличия защитного интервала скорость передачи в канале снижается на 24% (А= 1/4), 19% (Д= 1/8), 10% (А = 1/16) или 7% (Д= 1/32). Однако в режиме SFN преимущество DVB-T бесспорно. Передача ТВЧ и многопрограммного ТСЧ. Обе системы допускают передачу ТВЧ программы в канале 6/7/8 МГц, хотя в полосе 6 МГц скорость передачи у DVB- Т несколько ниже, чем требует американский стандарт. Помехи аналоговым системам. Благодаря меньшей мощности передатчика помехи от системы ATSC несколько ниже, чем от DVB-T. Одночастотные сети. ATSC допускает использование маломощного ретранслятора для обслуживания теневых участков, работающего на той же частоте, но совершенно исключает построение больших одночастотных сетей. Импульсные шумы. Теоретически COFDM должна бы иметь большую устойчивость к импульсным помехам вследствие усреднения коротких импульсов в процессоре быстрого преобразования Фурье на приеме, однако канальное кодирование и перемеже- ние тоже играют важную роль. Благодаря более глубокому перемежению ATSC лучше справляется с импульсными шумами и вызываемыми ими пакетными ошибками. Гармоническая помеха. Благодаря многочастотному характеру COFDM наличие гармонической или узкополосной помехи разрушит лишь небольшое число несущих и потеря данных будет незначительна. Для одночастотной ОБП-8Т влияние может оказаться более существенным и привести к закрытию глазковой диаграммы. Преимущество COFDM достигает 10 дБ. Помехи от аналоговых ТВ систем в совпадающем канале. Хотя COFDM
190 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю и ОБП-8Т используют разные механизмы для устранения влияния помехи, в целом обе системы успешно справляются с этой задачей. Помехи от цифрового телевидения в совпадающем канале. Обе системы ведут себя как Гауссов белый шум, и помеха определяется отношением C/N. Преимущество имеет ОБП-8Т. Чувствительность к фазовым шумам. Теоретически COFDM более чувствительна к фазовым шумам гетеродинов приемника, которые вызывают дополнительное вращение фазы парциальных несущих и размывают ансамбль сигналов. Масштабируемость к различным полосам частот. COFDM создавалась для работы в любом из каналов 6, 7 или 8 МГц и легко может быть переведена в другой канал заменой канального фильтра, блока ПЧ и тактового генератора. Некоторой проблемой может быть повышенная чувствительность к фазовым шумам режима «8к» в канале 6 МГц из-за близкого положения несущих. Сигнал ОБП-8Т также может быть трансформирован в полосы 7 и 8 МГц путем смены тактовой частоты. Проблему может представить замена гребенчатого фильтра — потребуется новая разработка на другие частоты заграждения, но гребенчатый фильтр может и не понадобиться, если отсутствуют помехи от аналоговых ТВ систем в совпадающем канале. Иерархическая модуляция. Способность к иерархической модуляции, бесспорно, очень важное свойство COFDM, которым не обладает ОБП-8Т. Потоки разного приоритета могут использоваться для вещания разных программ или одной и той же программы на разные части зоны обслуживания, или для разных категорий абонентов. Разница в значении C/N между потоками разных приоритетов должна быть не менее 10 дБ. Гибкость системы. Спецификация DVB-T предлагает вещателю широкий выбор режимов работы, включая режим «2к» или «8к», вид модуляции, относительную скорость кода, защитный интервал, что дает в результате 120 комбинаций для неиерархической и 1200 для иерархической передачи. Вещатель может выбрать скорость передачи и другие параметры таким образом, чтобы оптимизировать распределение программ в желаемой зоне покрытия с учетом рельефа местности, имеющегося абонентского оборудования и других особенностей конкретной вещательной системы. ОБП-8Т такой гибкостью не обладает. Тем временем начавшееся наземное цифровое вещание в США, Великобритании, Швеции подтверждает, что из-за влияния многолучевости покрытие территорий городской застройки сигналами ATSC менее устойчиво и требует большей мощности передатчика, чем в сопоставимых условиях для DVB-T [6.31]. Обширные сравнительные испытания ОБП-8Т и COFDM были проведены в Бразилии в конце 1999 — начале 2000 гг. Этим испытаниям специалисты ATSC придавали большое значение, так как в них участвовали приемники ATSC второго поколения с доработанными микросхемами демодулятора и декодера. Однако испытания не показали заметного улучшения эксплуатационных характеристик приемников. Проводившие испытания специалисты пришли к безоговорочному выводу о преимуществе COFDM над ОБП-8Т по всем аспектам испытаний. На рис. 6.30 в качестве иллюстрации показаны полученные на испытаниях в Бразилии результаты по охвату вещанием городской территории при разных видах модуляции. Заключение по результатам испытаний представляется нам очень важным и приводится дословно [6.32]: «Учитывая, • что модуляция COFDM обеспечивает лучшие характеристики в сложных ситуациях многолучевого распространения, подтвержденные в районах с высокой плотностью населения;
Глава 6. Передача компрессированных сигналов по каналам связи 191 охвата 100- 90- 80- 70- 60- ISDB 3/4 1/16 4к 0,1 с DVB2/3 1/32 8к _ DVB3/4 1/16 2к ATSC Расстояние ► 3 6 9 12 15 18 21 24 27 30 км Рис. 6.30. Охват городской территории при разных видах модуляции что модуляция COFDM позволяет осуществлять передачу программ высокой четкости с достаточным запасом устойчивости; что в модуляции COFDM есть решения, превосходящие по устойчивости к импульсным шумам модуляцию 8-VSB; что только модуляция COFDM обеспечивает возможность 100-процентного приема в радиусе 10 км. Этот радиус зависит от используемой эквивалентной излучаемой мощности ERP: большие значения ERP соответствуют бблыним радиусам 100-процентного приема; что результаты лабораторных испытаний свидетельствуют о том, что только модуляция COFDM позволяет осуществлять прием в областях, недоступных для других систем, благодаря использованию одночастотных сетей; что присущее модуляции 8-VSB преимущество в 4 дБ в отношении сигнал-шум не приводит к улучшению охвата; что неблагоприятные последствия отношения между пиковой и средней мощностью не имеют большого значения, так как они дорого обходятся только вещательным компаниям, но не населению; что отмеченный недостаток, наблюдаемый в модуляции COFDM в отношении защитного интервала между несущими соседних каналов, может быть устранен путем введения в приемники фильтров с улучшенными характеристиками подавления; что для планирования при любой из проверяемых схем модуляции воздействие помех в совпадающем канале несущественно; что при перемещении точки отражения модуляция COFDM показывает более высокие характеристики, обеспечивая даже прием в движении; что приемники 8-VSB, разработанные во второй половине 1999 г. и ставшие доступными для испытаний, не показали до сих пор, несмотря на использование сложных методов коррекции, реального улучшения в практических ситуациях;
192 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю • что модуляция COFDM обеспечивает гибкость в решении проблем охвата; • что необходимо использовать модуляцию, обеспечивающую максимально свободный эфирный прием,. мы заключаем, что модуляция COFDM, кроме превосходства в техническом отношении, лучше подходит к условиям Бразилии, чем модуляция 8-VSB, и поэтому мы предлагаем Anatel установить, что в системе цифрового телевидения, которая будет принята в Бразилии, должна использоваться модуляция COFDM». Вопрос выбора цифрового стандарта, особенно для эфирного вещания, важен и для России. Здесь следует дополнительно учитывать следующие моменты [6.31]: 1. Основную защиту от помех со стороны аналоговых сигналов в стандарте ATSC выполняет компенсатор, подавляющий компоненты спектра сигнала NTSC в полосе радиоканала. Однако сигнал SECAM в силу применения для модуляции поднесущих цветности частотной модуляции вместо квадратурной AM не имеет такой дискретной структуры и компенсатор окажется полностью бесполезным 2. В отличие от США с их мягким климатом и домами из дерева или кирпича, городской жилой фонд России дома из железобетона или с железобетонными перекрытиями, обладающие сильным экранирующим действием и дающие значительные отражения. 3. Коллективные приемные антенны, особенно метрового диапазона, не обладают высокой пространственной избирательностью, требуемой для приема ОБП-8Т сигналов, поэтому потребуется полная замена всего парка приемных антенн. 4. В стандарте ATSC только продекларирована возможность работы в каналах 7 и 8 МГц, реальные разработки не проведены и аппаратура на полосу 8 МГц не выпускается. Переход на полосу 6 МГц вызвал бы потерю 25% пропускной способности эфирного вещания. Несмотря на очевидное тяготение России к Европе во многих областях, на максимальную адаптированность стандарта DVB-T к российским условиям и полную неприспособленность для этих условий стандарта ATSC, на тот факт, наконец, что стандарт DVB-S фактически уже принят в России и для спутниковых вещательных каналов введены «Временные нормы», базирующиеся на этом стандарте [6.33], так вот, несмотря на все это, раздаются голоса, в том числе и авторитетных в прошлом технических специалистов, в пользу безусловного и безоговорочного принятия для России американского стандарта эфирного вещания [6.34, 6.35, 6.36]. Нам представляется, что вопрос о выборе стандарта для России уже решен в пользу DVB-T. Другой вопрос, как внедрять эфирное цифровое вещание в России и какие сроки для этого устанавливать. Трудно не согласиться с мнением [6.37], что «для наземного эфирного вещания не следует пока устанавливать никаких сроков завершения перехода на цифровой метод... ограниченные возможности Российского государства... сегодня следует направить прежде всего на развитие спутникового вещания». 6.9. ИНТЕРФЕЙСЫ ТРАНСПОРТНОГО ПОТОКА MPEG-2 Рассматривая в первой главе цифровые интерфейсы, мы не касались интерфейсов, разработанных специально для передачи транспортного потока MPEG-2. Сейчас, после знакомства со структурой транспортного потока, можно это сделать без дополнительных детальных пояснений.
Глава 6. Передача компрессированных сигналов по каналам связи 193 В стандарте CENELEC [6.38] и документе DVB А010 [6.39] специфицированы три вида интерфейсов: синхронный параллельный (SPI — Synchronous Parallel Interface), синхронный последовательный (SSI Synchronous Serial Interface) и асинхронный последовательный (ASI — Asynchronous Serial Interface), причем второй и третий существуют в разновидностях для коаксиального (С) и оптического (О) кабеля. Интерфейс SPI рекомендуется для коротких и средних расстояний. Он в значительной степени базируется на параллельном компонентном интерфейсе из Рекомендации ВТ.656 и отличается тем, что собственно данные передаются с разрядностью 8 битов (поток MPEG-2 имеет байтовую структуру), а еще две шины интерфейса используются для подтверждения действительных данных (DVALID) и сигнализации о начале транспортного пакета (PSYNC) (рис. 6.31а). В передатчике происходит преобразование последовательной структуры транспортных пакетов в параллельную форму и формирование тактового сигнала байтовой синхронизации. Шины данных пронумерованы от 0 до 7, MSB передается по шине 7 Как и в базовом параллельном интерфейсе, используется канальный код БВН. В интерфейсе SPI, как и в остальных двух, поддерживаются три режима передачи данных: 1) транспортные пакеты длиной 188 байтов; 2) транспортные пакеты длиной 204 байта без кодозащиты (с 16 пустыми байтами); 3) транспортные пакеты длиной 204 байтаов с кодозащитой кодом Рида-Соломона. В первом режиме на шине DVALID устанавливается «1», на шине PSYNC состояние «0», состояние «1» появляется здесь в момент передачи синхробайта (рис. 6.316). Тактовый сигнал представляет собой последовательность прямоугольных импульсов, момент перехода «0->1» которых соответствует моменту отсчета сигнала. Во втором режиме сигнал DVALID устанавливается на «1» при прохождении байтов данных и на «0» при прохождении пустых байтов, PSYNC по-прежнему отмечает единицей синхробайт (рис. 6.31в). В третьем режиме DVALID устанавливается на «1» в течение всего пакета данных (рис. 6.31г). Тактовая частота интерфейса fTaKT зависит от скорости передачи данных и равна f /8 при 188 байтах и (204/188)f /8 при 204 байтах в пакете, при этом fTaKT не должна превышать 13,5 МГц. Ширина тактового импульса может изменяться в пределах Т/2±Т/10» где Т l/fTaKT период тактовой частоты. Для передачи логических уровней выбрана технология LVDS, о которой мы упоминали в первой главе. Напряжение относительно земли на проводах пары должно быть в пределах от 1,125 до 1,375 В, разность потенциалов между проводами от 247 до 454 мВ, выходное сопротивление источника 100 Ом. Минимальное допустимое раскрытие глазка диаграммы показано на рис. 6.32. Синхронный последовательный интерфейс предъявляет повышенные требования к стабильности генераторов тактовых частот и потому применяется редко, только для однонаправленной передачи транспортного потока из одной точки в другую. Битовая синхронизация в интерфейсе SSI достигается применением бифазного кода, для цикловой синхронизации в поток вводятся синхробайты 0x47 или инвертированный 0хВ8, совпадающие с синхросигналами потока MPEG-2. По сигналам DVALID и PSYNC кодер выбирает формат передачи (188 или 204 байта) и формирует сигнал байтовой синхронизации. В режимах 1 и 2 передается прямой, в режиме 3 — инвертированный сигнал. По этим сигналам декодер восстанавливает сигналы DVALID и PSYNC. Скорость передачи данных определяется тактовой частотой следования битов в транспортном потоке, которая, в свою очередь, зависит от частоты байтовой синхронизации в исходном параллельном потоке: f = 8fTaiCT для пакетов длительностью 188 байтов и fд = 8(204/188)fTaKT для пакетов 204 байта.™ Электрический сигнал SSI может передаваться по радиочастотному коаксиальному
194 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Передатчик такты данные 0...7 DVALID PSYNC Приемник LTLTLTl TLTLTl ™- ^йнТХЗ^СХ^ QM^XgwjxXZlS) данные DVALID PSYNC б) 188 байтов а) Рис. 6.31. Режимы передачи данных в интерфейсе DVB-SPI LTLTLTLrLTl _П ™™ СТб^ХсинхХГО. .Cl87XrCXlIZX31I> Данные DVALID PSYNC в) 204 байта с пустыми байтами LTUTLTl П_П_П ™~ <^03>^инхХТ^ <ЗрХсинхХГО данные DVALID PSYNC г) 204 байта с кодом PC кабелю такой длины, чтобы его затухание на частоте 70 МГц не превысило 12 дБ. Это соответствует расстоянию от 200 до 600 м, в зависимости от погонного затухания кабеля. Частотная коррекция позволяет увеличить максимальную дальность. Номинальное выходное напряжение передатчика установлено в пределах 1±0,1В, затухание несогласованности не менее 15 дБ в полосе 3,5... 105 МГц, соединитель BNC. Время нарастания и спада импульса от 10 до 90% не должно превышать 4 не, фазовое дрожание в пределах 2 не. Для фазового дрожания на входе приемника установлена норма 4 не. В оптическом диапазоне для передачи может использоваться одномодовое или мно- гомодовое волокно на волне 1310 нм, перекрываемое расстояние в одномодовом волокне при мощности передатчика минус 7,5 дБм и чувствительности приемника минус 20 дБм до 40 км. Интерфейс с похожим названием, но несколько отличными характеристиками выбран в стандарте ATSC для передачи транспортного потока со строго определенной скоростью (не более 40 Мбит/с) между выходом транспортного мультиплексора и входом передатчика [6.40]. Среда транспортирования предполагается нешумящей, с потерей не более 1 пакета в сутки при номинальной скорости. Как и в интерфейсе DVB-SSI, канальное кодирование осуществляется бифазным кодом, но размах выходного напряжения 800 мВ ±10%, а затухание несогласованности должно быть не менее 30 дБ в полосе от 100 кГц до тактовой частоты. Последняя составляет 19,39 МГц при пере- Umhh = 100 тВ Тмин = Т/3 Рис. 6.32. Минимально допустимое раскрытие глазка диаграммы в интерфейсе DVB-SPI
Глава 6. Передача компрессированных сигналов по каналам связи 195 даче сигнала ОБП-8Т и 38,78 МГц для сигнала ОБП-16. Серьезное внимание в стандарте уделяется нормированию стабильности частоты и фазового дрожания. В отличие от других аналогичных документов, стандарт SMPTE-310M устанавливает верхнюю границу дрейфа не 10, а 1 Гц. Относительная нестабильность частоты в области ниже 1 Гц должна быть не более 2,8 х 10~6, а скорость изменения частоты не должна превышать 2,8 х 10"8/с. Фазовое дрожание в интервале частот от 1 Гц до 1/100 тактовой частоты не должно превышать 2 не. Наиболее распространенным интерфейсом для транспортного потока на сегодняшний день следует признать асинхронный последовательный интерфейс ASI, в котором скорость передачи данных постоянна ине^зависш^от [6.41]. Поддержание постоянства скорости обеспечивается введением при необходимости стаф- внешние такты Канал заполнение Рис. 6.33. Структурная схема кодера и декодера интерфейса DVB-ASI данные такты Напряжение 0,7 0,3 0,15 < 0,35 0,65 > Время 0,85 финговых байтов. Скорость 270 Мбит/с должна поддерживаться постоянной в довольно жестких пределах: ± 1-Ю"4. Канальный кодер использует сбалансированный по постоянному току табличный 8В/10В код, который размещает каждые 8 бит полезных данных в 10-битовое кодовое слово, подобранное таким образом, чтобы минимизировать постоянную составляющую. Число нулей и единиц в слове должно быть одинаковым или отличаться незначительно, для каждого входного слова подбираются два 10В слова с разным соотношением 0 и 1, одно с превышением нулей, другое — единиц. В процессе кодирования кодер ведет подсчет 0 и 1 и при необходимости заменяет кодовое слово другим, с более подходящим соотношением символов. Кодовые слова 10В содержат повышенное число переходов, что облегчает битовую синхронизацию в приемнике. Время захвата битовой синхронизации должно быть не более 1 мс. Код не инвариантен к логическому инвертированию передаваемых битов, поэтому изменение полярности сигналов недопустимо. Этим сигнал ASI отличает- Рис. 6.34. Допустимый раскрыв глазко- вой диаграммы в интерфейсе DVB-ASI
196 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ся от передаваемого через те же физические интерфейсы с той же тактовой частотой сигнала SDI. Цикловая синхронизация обеспечивается передачей специального 10-битового кода из кодовой таблицы, появление которого исключено при кодировании данных. Признаком начала пакета служит появление по крайней мере двух таких кодов в пределах окна в 5 байтов. Специальный код посылается в канал на передающей стороне при получении от источника синхробайта 0x47. Он используется так же, как стаффинговый символ. Структурная схема кодера и декодера интерфейса ASI приведена на рис. 6.33. Коаксиальный вариант интерфейса работает по коаксиальному 75-омному кабелю с соединителями BNC, затухание несогласованности 15 дБ в полосе 5...270 МГц, максимальное время нарастания /спада импульса от 20 до 80% не более 1,2 не, допустимое фазовое дрожание не должно составлять более 10% от длительности импульса, или 0,37 не. Номинальное выходное напряжение передатчика составляет 800 мВ ± 10%, на входе приемника амплитуда сигнала должна поддерживаться в пределах 200...880 мВ, а раскрыв глазковой диаграммы — в пределах, показанных на рис. 6.34. В оптическом интерфейсе ASI рекомендовано использование волокна диаметром 62,5/ 125 мкм по стандарту IEC 793-2 с соединителями типа SC, работающего в диапазоне длин волн 1280... 1380 нм, время нарастания/спада импульса не должно превышать соответственно 2 и 2,2 не, фазовое дрожание не более 16% (примерно 600 пс). На приеме время нарастания/спада может возрасти до 3 не, максимальное перекрываемое расстояние определяется мощностью оптического передатчика, чувствительностью приемника и погонным затуханием кабеля. Как и для SDI, вполне реально без регенерации перекрыть расстояние 45-50 км. 6.10. ПЕРЕДАЧА КОМПРЕССИРОВАННЫХ СИГНАЛОВ ПО МАГИСТРАЛЬНЫМ ЛИНИЯМ СВЯЗИ СОВМЕСТНО С ДРУГИМИ СИГНАЛАМИ 6.10.1. Ввод сжатых данных в сети ATM Описанные выше стандарты передачи компрессированных сигналов используются в специализированных вещательных каналах систем телевизионного вещания. Часто возникает необходимость передать цифровой телевизионный сигнал на большое расстояние одному или нескольким пользователям для целей дальнейшей обработки, записи интервью, преобразования в другие форматы, получения видеоинформации из удаленных архивов. Вещательная компания, например, может иметь студии, технические подразделения, спутниковые передающие станции на значительном удалении, так что строительство собственной выделенной сети связи оказывается экономически неоправданным. Наиболее эффективный путь в этом случае — использование существующих сетей связи и стандартных интерфейсов для ввода сигналов. Передача неком- прессированных ТВ сигналов требует значительного расхода сетевых ресурсов (270 Мбит/с для SDI), повторного декодирования/кодирования, ухудшающего качество сигнала, и предпочтительнее оказывается передача сжатых сигналов, например, по
Глава 6. Передача компрессированных сигналов по каналам связи 197 стандарту MPEG-2. У вещателей возникает вопрос: какие же из существующих цифровых сетей наилучшим образом подходят для такой передачи и обеспечивают наиболее высокое качество обслуживания при приемлемой стоимости? В последние несколько лет бесспорным лидером в оказании широкого спектра услуг по передаче самых разных цифровых сигналов, в том числе и с MPEG сжатием, оказались ATM сети (Asynchronous Transfer Mode — асинхронный режим передачи). Возникшие на базе волоконно-оптических линий передачи как дальнейшее развитие широкополосных сетей с интеграцией услуг (B-ISDN), ATM сети благодаря своей исключительной гибкости и многообразию представляемых услуг получили широкое развитие в ведущих промышленных странах. Чтобы понять, как построена сеть ATM и как она передает транспортный поток MPEG, нам следует познакомиться хотя бы в общих чертах с организацией информационных сетей. Теория информационных сетей [6.42] построена на взаимодействии так называемых абонентских систем — моделей реальной действительности, построенных для выполнения неких прикладных процессов. Для информационных сетей Международной организацией стандартизации (МОС) принята семиуровневая базовая эталонная модель взаимодействия, в которой каждый уровень отвечает за определенные процедуры и обеспечивает сервис для вышележащего уровня (рис. 6.35): Уровень 7 «Прикладной» — интерфейс с прикладными процессами; Уровень б «Представительский» — согласование формы представления информации, формирование данных (графическая форма, цифровая, двоичные данные); Уровень 5 «Сеансовый» — поддержка диалога прикладных процессов, соединение и разъединение, обмен данными между прикладными процессами; Уровень 4 «Транспортный» — обеспечение сквозного обмена информацией; Уровень 3 «Сетевой» — выбор вида сервиса сетевой маршрутизации; сегментация и объединение блоков данных; обнаружение ошибок; Уровень 2 «Канальный» — управление каналами передачи данных; передача данных по каналам; Уровень 1 «Физический» — обеспечение физического интерфейса с каналом передачи данных. В сети возможна передача с установлением соединения и без установления соединения. Напомним, что вопросы установления, поддержания и прекращения цифрового соединения регулирует протокол. Переадресация информации в сети осуществляется путем коммутации - каналов, пакетов, смешанной, интегральной (последняя отличается от смешанной тем, что коммутация каналов и коммутация пакетов осуществляются одновременно в каждом физическом канале.) Определены 4 типа взаимодействий в сети: шлюз (gateway) — соединяет сети с различными стандартами; маршрутизатор (router) — сетевой процес- ^ис- б.35. Базовая эталонная модель вза- • имодействия МОС
198 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю сор, соединяет каналы передачи данных без обработки; мост (bridge) — канальный процессор; коммутатор (switch) — соединение на физическом уровне. ATM является одним из способов интегральной коммутации. В каждом физическом канале время делится на повторяющиеся циклы, в каждом цикле выделяется п интервалов времени, служащих для создания п виртуальных каналов. Передача информации от многих абонентов обеспечивается благодаря мультиплексированию квантованных во времени потоков. На рис. 6.36 показана базовая модель протокола B-ISDN [6.43]. Здесь детально определены три первых уровня взаимодействия: физический, уровень ATM (ATM Level) и уровень адаптации ATM (AAL-ATM Adaptation Level), введено вертикальное деление модели на три плоскости — плоскость пользователя, плоскости регулирования и управления. Уровень ATM отвечает за прохождение вызова, мультиплексирование и демультиплексирование, формирование заголовков; уровень адаптации ATM обеспечивает сегментацию и сборку потоков, а также сервисные функции для вышележащих уровней. ATM — это технология высокоскоростной пакетной передачи, базирующаяся на мультиплексировании и коммутации коротких пакетов фиксированной длины (ячеек). Типовые скорости передачи составляют 2; 25,6; 100; 155; 622 Мбит/с. Соединение пользователей осуществляется по виртуальным каналам, которые могут быть постоянными или коммутируемыми, устанавливаемыми посредством стандартизованных процедур сигнализации. В отличие от обычных схем пакетной коммутации, ATM сети допускают поддержание в канале заданного качества обслуживания (QoS — Quality of Service). К параметрам, определяющим трафик, относятся: максимальная скорость ячеек (PCR — Peak Cell Rate), непрерывная (долговременная) скорость ячеек (SCR Sustainable Cell Rate ) и максимальный размер пакета (MBS -Maximum Burst Size). Из параметров качества обслуживания используются коэффициент потери ячеек (CLR — Cell Loss Ratio), максимальная задержка передачи ячеек (CTD — Cell Transfer Delay) и пиковые колебания задержки (CDV Cell Delay Variation). Сеть принимает новый вызов, только если она может выделить для него ресурсы с запрошенным QoS и если качество обслуживания текущих вызовов Плоскость управления Плоскость регулирования X \ Плоскость пользователя 2^ "7^ Протоколы высоких уровней Протоколы высоких уровней Уровень адаптации ATM Уровень ATM Физический уровень Рис. 6.36. Базовая модель B-ISDN протокола (ATM) не ухудшится. В ATM приняты пять категорий обслуживания, из которых для служб реального времени (к ним относится и передача телевидения) пригодны две: обслуживание с постоянной скоростью передачи CBR (Constant Bit Rate) и с переменной скоростью в реальном времени (rt-VBR — real-time Variable Bit Rate). Режим CBR эмулирует канал с фиксированной пропускной способностью, равной максимальной скорости ячеек (PCR), часть ресурса при этом не используется. Обслуживание по категории rt-VBR более экономично и применяется для служб, допускающих некоторую степень статистического мультиплексирования (при выполнении требуемого QoS в статическом смысле). От-
Глава 6. Передача компрессированных сигналов по каналам связи 199 метим, что, хотя ATM и предлагает гарантированные уровни качества обслуживания, некоторые параметры этого обслуживания не очень высоки. В частности, различие времени прихода пакетов может достигать 3 мс и более, что требует больших объемов буферной памяти. В системах CBR с этим явлением борются применением очень узкополосной ФАПЧ, в VBR приходится применять более сложные методы компенсации. Каждая ячейка ATM имеет длину 53 байта, из которых 48 используются непосредственно для передачи информации и 5 заняты заголовком, несущим информацию о типе полезной нагрузки, приоритете и параметрах виртуального канала. Ввод информации в информационное поле ячеек осуществляется на Уровне адаптации ATM. Стандартизовано несколько типов AAL: AAL1 — службы CBR (ИКМ звуковой трафик, видео с постоянной скоростью, связные потоки 2,048 Мбит/с); AAL2 — службы VBR с жесткой временной привязкой источника и получателя, в том числе и компрессированное MPEG видео; AAL3/ 4 — VBR передача с установлением и без установления соединения, наиболее сложный уровень, используется для передачи больших файлов и резервирования баз данных; AAL5 — упрощенная версия предыдущего для локальных вычислительных сетей. Для передачи MPEG транспортного потока в Рекомендации МСЭ-Т J.82 предложены два способа. Первый, более простой, предполагает ввод одного пакета MPEG в 4 ячейки ATM на уровне AAL1, полезная нагрузка ячейки равна 47 октетам (байтам). Во втором способе используется уровень адаптации AAL5, на котором два пакета MPEG-2 и так называемый трейлер AAS (переносчик) размером 8 байтов раскладываются на 8 ячеек ATM. Компания Tandberg Television предложила для AAL5 новую раскладку, в которой 8 пакетов MPEG-2, трейлер и 8 трехбайтных указателей (всего 1536 байт) раскладываются на 32 ячейки ATM (также 1536 байтов). Эта последняя раскладка пока не принята МСЭ. 6.10.2. Передача MPEG сигналов по каналам SDH, PDH и IP Наряду с асинхронной передачей потока MPEG-2 через ATM сети практикуются и другие методы, например, привязка к сетям синхронной цифровой иерархии SDH (Synchronous Digital Hierarchy) [6.44]. Иерархическая структура SDH рассчитана на передачу цифровых сигналов по оптической линии со скоростью 622 Мбит/с (STM-4), 155 Мбит/с (STM-1), 51 Мбит/с (суб-STM-l) и более низкими. Функции согласования источника транспортного потока и сети выполняет сетевой адаптер, в котором происходят все необходимые преобразования сигналов. Эти преобразования достаточно сложны, и нам нет необходимости углубляться в тонкости процесса. Достаточно сказать, что на входе адаптера поддерживаются все три цифровых DVB интерфейса транспортного потока, а в качестве промежуточного носителя выступает все тот же режим ATM. Пакеты MPEG-2 сначала упаковываются в ATM ячейки на уровне адаптации AAL1, а затем эти последние вводятся в синхронную сеть. Аналогичным образом осуществляется и ввод транспортного потока в плезиохрон- ные сети PDH (Plesiochronous Digital Hierarchy) [6.45]. Рекомендацией G.702 МСЭ-Т определены семь номиналов скорости передачи данных для PDH: 1544 кбит/с; 2048 кбит/с, 6312 кбит/с, 8448 кбит/с, 34 368 кбит/с, 44 736 кбит/с, 139 264 кбит/с. С учетом помехоустойчивого кодирования в канале и избыточной информации в заголовках полезная скорость передачи составит соттветственно 1320, 1649, 5279, 7038, 29 140, 37 980 и 118 759 кбит/с. Популярным и очень недорогим средством доставки цифровых сообщений стали в последнее время сети, работающие на основе межсетевого IP протокола (IP — Internetwork
200 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Protocol). Наряду с международной сетью Интернет можно назвать IP-телефонию, территориальные (WAN) и локальные (LAN) вычислительные сети. IP-протокол определяет структуру дейтаграммы — пакета данных, содержащего полезную информацию и заголовок с адресами источника и получателя информации. Особенностью IP-сетей является наличие у каждого адресата уникального для всей мировой сети 12-значного адреса, по которому дейтаграмма может быть доставлена в любую точку земного шара. Прочитывая заголовок пакета, маршрутизаторы и коммутаторы сети выбирают для каждого пакета оптимальный маршрут доставки. Протокол IP не гарантирует, что дейтаграмма будет доставлена без искажений, или что последовательность дейтаграмм будет доставлена в том же порядке, как они были посланы. За это отвечают протоколы более высокого уровня, транспортные протоколы TCP (Transmission Control Protocol) и UDP (User Datagram Protocol ). UDP добавляет совсем немного возможностей к IP, в частности, не обеспечивает отправителю возможности выяснить, дошла ли дейтаграмма по назначению. Применяется этот протокол большей частью при потоковой передаче в реальном времени, когда возможность доставки пакета в указанное время важнее, чем вероятная утеря части информации. TCP — более надежный протокол, он вместе с IP гарантирует доставку дейтаграмм в исходной последовательности и в неискаженном виде, но требует полного дуплексного канала для подтверждения прихода пакетов и потому не пригоден для систем реального времени. При доставке пакетов MPEG-2 через IP-сети важно учитывать следующее. Строгая синхронность видео и звуковых пакетов должна быть сохранена, а это возможно только в высокоскоростных сетях, где задержка прихода пакетов незначительна. В этом случае можно упаковывать MPEG-пакеты непосредственно в дейтаграммы. Если мы собираемся посылать сжатые данные, например, по сети Интернет с большой задержкой прихода пакетов, лучше воспользоваться вспомогательными протоколами RTP (Real Time Protocol — протокол реального времени) и RTCP (Real Time Control Protocol), которые разработаны специально для передачи мультимедийных потоков по IP, могут отслеживать одновременно несколько потоков и обеспечивать их одновременное поступление к абоненту. Второй момент, на который следует обратить внимание, — адресация. TCP/IP разрабатывался как протокол одноадресный (unicast) и может адресовать сообщения одному адресату, в то время как потоки MPEG-2 могут быть адресованы многим пользователям. Необходимо применять многоадресную поддержку (режим multicast), при которой сервер посылает дейтаграмму одновременно по многим адресам. Для этой цели разработаны специальные протоколы под общим названием IGMP-протоколы. Если необходимо, например, приходящий в стандарте MPEG-2 пакет ТВ программ развести на несколько компьютеров локальной сети, шлюз должен преобразовать MPEG-2 в IP, присвоить каждой программе multicast адрес и послать дейтаграммы местному коммутатору, который также должен поддерживать IGMP-протокол.
ПЕРЕДАЧА ДАННЫХ ПОЛЬЗОВАТЕЛЯ И ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ В ТРАНСПОРТНОМ ПОТОКЕ MPEG-2 7.1. ПЕРЕДАЧА ДАННЫХ ПОЛЬЗОВАТЕЛЯ 7.1.1. Методы передачи Провозглашенная DVB концепция транспортного потока как «контейнера данных» позволяет наряду с потоками видео и аудио передавать и любые другие цифровые данные, причем применяемый механизм кодозащиты обеспечивает коэффициент ошибок порядка 10~п. Разработанная в 1999 г. спецификация стандарта передачи данных [7.1] предусматривает возможность использования ТВ каналов в спутниковых, кабельных и наземных вещательных сетях для циркулярной передачи данных, загрузки программного обеспечения «по эфиру», обновления баз данных, организации высокоскоростных потоков для пользователей сети Интернет и многих других применений. В стандартных эфирных и кабельных каналах с полосой 6, 7, 8 МГц возможна передача со скоростью от 6 до 38 Мбит/с, в спутниковых каналах диапазон скоростей также зависит от полосы ствола и составляет 25...45 Мбит/с. Транспортный поток MPEG-2 имеет несколько возможностей для переноса данных, различающихся уровнем ввода данных, защищенностью от ошибок, уровнем предоставляемого сервиса, режимом передачи данных. Наиболее простым и наименее защищенным методом можно считать конвейеризацию данных (data piping), которая заключается в размещении данных непосредственно в области полезных данных пакета транспортного потока. Никакой дополнительной защиты, кроме обычного в MPEG каскадного помехоустойчивого кодирования, данные не имеют. В заголовке пакета отсутствует какая-либо информация о времени, поэтому передача может идти только в асинхронном режиме. Более совершенным методом представляется потоковая передача данных (data streaming), она может осуществляться в асинхронном, синхронном или синхронизированном режиме. Данные в этом случае размещаются в полезной части пакета ПЭП и могут быть дополнительно описаны в заголовке пакета.
202 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю МЗ-2 М8-0 М8-1 ^ М8-2 Наиболее универсальным и защищенным методом следует признать многопротокольную инкапсуляцию (МПЙ) (multiprotokol encapsulation). Слово «инкапсуляция», как и многие другие технические термины, пришло из английского языка и означает «помещение в оболочку, в капсулу». При реализации этого метода пакеты данных, сформированные другими протоколами (например, IP-дейтаграммы), действительно помещают в оболочки, которыми в данном случае служат секции транспортного потока, организуемые в полях адаптации транспортных пакетов (см. главу 4). Управляет этим размещением специальный транспортный протокол DSM-CC, который мы рассмотрим ниже в этой главе. Еще один метод передачи данных в DVB-совместимом потоке используется для передачи модулей данных, нуждающихся в периодическом повторении, он называется каруселью данных и действительно напоминает карусель (рис. 7.1). Данные размещаются в модулях определенного размера, которые могут обновляться, добавляться, удаляться, объединяться в группы модулей, а группы, в свою очередь, в Супергруппы. Организацией каруселей также занимается протокол DSM-CC. MX-Y X - modulejd Y - номер блока Управляющее сообщение Рис. 7.1. Периодическая передача информации в карусели данных А. \ \ [ [^р^События^^|==р 'Ш Сервис Б Рис. 7.2. Пример реализации карусели объектов ТВ программа ТВ программа
Глава 7. Передача данных пользователя и дополнительной информации ... 203 Приложения Потоковая передача Ковейери- зация 0x0001 Потоковая передача 0x0002 Дейтаграммы МПИ Карусель данных DVB Карусель данных DSM-CC Секции Транспортный поток MPEG-2 МПИ Карусель 0x0005 данных 0x0006 Интерфейс прикладного уровня Определено службой Определено DVB Определено стандартами Определено DSM-CC Карусель данных DVB Карусель объектов DSM-CC Карусель данных DSM-CC Карусель объектов 0x0007 Зарегистрированная служба данных Рис. 7.3. Связь методов передачи данных в транспортном потоке с существующими стандартами Разновидностью карусели данных является карусель объектов, специфицированная в описании протокола DSM-CC. Здесь в Скорость кглестве пассажиров карусели выступают уже не модули данных, а некоторые обобщенные объекты — файлы, директории, потоки, связанные с передаваемыми программами (рис. 7.2). На рис. 7.3 проиллюстрированы методы передачи дополнительных данных в транспортном потоке MPEG-2 и показана их связь с теми или иными стандартами. Несколько слов следует сказать о возможностях передачи дополнительных данных в стандарте ATSC. Жесткая синхронизация не позволяет варьировать скоростью потока, поэтому до недавнего времени передача данных не рассматрива- время Рис. 7.4. Передача альтернативных данных в транспортном потоке стандарта ATSC: 0 — ТВ программа □ — данные
204 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю лась. Кодеры и мультиплексоры нового поколения дают возможность передачи некоторого объема дополнительной информации (так называемых opportunistic data альтернативных данных) в те моменты времени, когда кодеру, работающему в режиме VBR, для обеспечения заданного качества изображения требуется меньше битов, чем предоставляет стандарт (статические или медленно меняющиеся сюжеты, однотонные изображения) (рис. 7.4.). Соответствующий стандарт принят в 2000 году [7.2]. 7.1.2. Особенности применения различных методов Конвейеризация данных, как уже отмечалось, в наименьшей степени регламентирована стандартом. Полезная нагрузка пакета используется произвольным образом, не накладывается ограничений на синтаксис загружаемых данных, расщепление потока на блоки и последующее сшивание в декодере также не описывается стандартом. Единственное требование — использование поля адаптации не должно противоречить стандарту MPEG-2. Индикация режима в таблицах служебной информации осуществляется вводом в таблицу SDT или EIT одного или нескольких дескрипторов dataJbroadcast_descriptor, каждый из которых должен быть увязан с соответствующим потоком данных [7.3]. Методу конвейеризации соответствует значение data_broadcast_id 0x0001. Потоковая передача осуществляется раскладкой потока данных в ПЭП пакеты, а ПЭП пакетов — в пакеты транспортного потока MPEG-2. Для асинхронной передачи в поле stream_id заголовка ПЭП пакета должно быть записано значение OxBF, a data_broadcast_id устанавливается равным 0x0002. Этот режим может использоваться для асинхронной передачи, если по каким-либо причинам предпочтительно использовать ПЭП. Синхронная и синхронизированная передача задается установкой stream__id в положение OxBD, data_broadcast_id принимает значения соответственно 0x0003 и 0x0004. Синхронизация, как и при передаче телевидения, достигается вводом в заголовок ПЭП пакета временной метки PTS. Синхронный режим может использоваться в случаях, когда на приемной стороне требуется точная синхронизация с передающей стороной или, например, требуется поддерживать синхронизацию во время кратковременных пропаданий сигнала. Синхронизированный режим полезен, если требуется обеспечить синхронизацию с другим ПЭП. f я^-^Ч При использовании метода МПИ идентификатор streamed должен иметь значение ОхЗЕ, другие индикаторы и флаги устанавливаются в соответствии со стандартами ISO 13818-1 и EN 301.192. 48-битовый МАС-адрес получателя разбивается на шесть блоков по 8 битов, которые определенным образом расставляются в заголовке секции (два блока с младшими битами) и в области полезных данных (остальные блоки) (рис. 7.5). Упаковка в секции позволяет использовать имеющийся меха- msb lsb низм фрагментации потока на I I I I I I I 48-битовый секции. Если размер дейтаграм- I _[ I I ^ I ^ 1_ 1 mac адрес мы не превышает 4080 байтов, она может быть передана в одной секции. Для IP, где размер пакета не превышает 1500 байтов, ЭТО уСЛОВИе ВЫПОЛНЯеТСЯ. Секция К тП^^М7^е^аМ комбина" Рис. 7.5. Раскладка байтов MAC адреса в заголовок и область ции IP/MPEG-2 относятся полезных данных секции ТП
Глава 7. Передача данных пользователя и дополнительной информации ... 205 также наличие готовых программных приложений, большой опыт в эксплуатации IP сетей, значительные усилия, вложенные в развитие IP-протокола, обеспечение гарантированного качества обслуживания, поддержка скремблирования на IP-уровне. Хотя метод МПИ оптимизирован для передачи IP-дейтаграмм, но может применяться с любым другим сетевым протоколом при использовании инкапсуляции LLC /SNAP (Logical Link Control/ Sub-Network Attachment Point). Спецификация карусели данных предусматривает использование четырех видов сообщений: DownloadDataBlock (DDB), переносящих данные, Downloadlnfolndication (DII), описьшающих модули в группах, DownloadServerlnitiate (DSI), описывающих группы в Супергруппах, и DownloadCancel (DC). Карусель может иметь один или два уровня информации управления, как показано на рис. 7.6. Если описывается только одна группа модулей, применяется более простая одноуровневая модель. Здесь SDT/EIT таблица содержит data_ broadcast_descriptor, который указывает на DII сообщение, описывающее модули в карусели с помощью поля mi (ModulelnfoByte). Это поле включает несколько указателей на DDB сообщения. Если в карусели более одной группы, используется двухуровневая модель управления, в которой добавляется DSI сообщение, описывающее группы с помощью поля GroupInfoByte (gi). Оператор сети должен выбрать подходящую модель карусели данных. Использование любого из описанных методов передачи данных отдано на усмотрение SDT/EIT data_broadcast_desc \ DII ' ! transactionjd j mi mi DDB DDB DDB Г РУ 1Ш DDB | DDB i mi ] DDB j I DDB j | j DDB j! | | Блок j; Модуль ) SDT/EIT data_broadcast_desc \l/ | DSI transactionjd 9> gi [dii transactionjd mi mi mi DDB DDB DDB DDB DDB DDB DDB DDB DDB Супергруппа D II transactionjd mi mi DDB DDB i Kyu DDB DDB DDB DDB mi ii ii ii • • it • • Si 1 ll DDB DDB DDB 1 Блок Модуль •- Рис. 7.6. Структура каруселей данных с одним и двумя уровнями управления
206 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю пользователя. Целесообразность выбора того или иного метода зависит от поставленной задачи и имеющихся ограничений. При наличии ремультиплексера, собирающего все потоки в один транспортный поток, ПЭП и потоковая передача могут дать экономию в использовании ресурса. В IP поддерживаются функции multicast и broadcast. Нетрудно видеть, что режимы МПИ и каруселей подробно регламентированы стандартом, в то время как потоковый метод и конвейеризация оставляют пользователю больше свободы в выборе структуры и параметров системы. Возможно использование комбинаций методов, например, карусель поверх конвейеризации или IP-вещание поверх потоковой передачи. Определенная степень свободы представляется пользователю в выборе метода фрагментации и последующего сшивания данных. Возможны три подхода:^использование собственных Л/йестандартизованных методов фрагментации ^Дтакетированиые элементарные потоки ПЭП;/)МРЕО-2 секции. ПЭП дают возможность передавать дейтаграммы размером до 64 кБ{ синхронизировать различные потоки между собой с высокой точностью. В секциях допускается передача дейтаграмм переменного размера, но не более 4 кБ, режим передачи асинхронный. Многие демультиплексеры из имеющихся на рынке умеют выделять одиночные секции аппаратным путем, не требуя повышения вычислительной мощности процессора и усложнения программного обеспечения, и это одна из причин, почему секции выбраны в качестве механизма транспортировки инкапсулированных дейтаграмм и каруселей данных. IJ "~ е б ■ бь&*>*£?НЫ•< 4) - Р ЕЯ $) /Ь?£>аб - Секуч 7.1.3. Протокол высокоскоростной передачи информации DSM-CC Протокол DSM-CC (Digital Storage Media — Command and Control) специфицирован в части 6 стандарта ISO/IEC 13818 и служит для поддержки широкополосных мультимедийных услуг. Очень важно иметь в этой области открытые, т.е. стандартизированные и общедоступные протоколы, которые позволяли бы пользователю иметь доступ к услугам, представляемым разными провайдерами. Базовая функциональная модель протокола приведена на рис. 7.7 и включает два объекта — Клиент и Сервер (называемые Пользователями), которые используют Сеть для установления соединения между собой. Клиент это обычно терминал, принимающий мультимедийный контент. Сервер — поставщик такого контента, он может быть распределенной системой из нескольких вычислительных платформ. Сеть — любая связка элементов, обеспечивающая соединение Пользователей. DSM-CC допускает неоднородную сеть: Сервер, например, может быть подключен к магистральной линии, а Клиент — к сети доступа. Пользователи обмениваются информацией между собой (П-П соединения), а также с Сетью (П-С соединения), для этих после- Пользователь Пользователь Рис. 7.7. Базовая функциональная модель протокола DSM-CC
Глава 7. Передача данных пользователя и дополнительной информации ... 207 дних в Сети имеется специальный объект — Менеджер Сеансов и Ресурса (SRM — Session and Resource Manager), на которого замыкаются П-С соединения. Протокол не стандартизует транспортные протоколы на участке П-С, но предъявляет к ним определенные минимальные требования. Например, транспортный протокол не должен гарантированно доставлять сообщения или доставлять их в том же порядке, но он должен обнаруживать и удалять поврежденные сегменты и доставлять полное сообщение П-С, т.е. нижние уровни обязаны сегментировать и восстанавливать сообщение при необходимости. Этим требованиям удовлетворяют многие протоколы, в том числе UDP/IP и AAL5/ATM. На участке П-П также допускается произвольный выбор протокола, но выбранный протокол должен обеспечивать определенные услуги, оказываемые Сервером Клиенту и вызываемые протоколом RPC (Remote Procedure Call). Ключевая концепция DSM-CC сеанс. Для получения доступа к услуге Клиент устанавливает сеансовое соединение с Сервером, а по получении услуги прекращает его. Все ресурсы, участвующие в сеансе, помечаются специальным сеансовым идентификатором и не могут быть использованы в другом соединении. Специальный сеансовый протокол проводит аутоинтефикацию Клиента и извещает его об организации сеанса. Особенностью DSM-CC является возможность для Клиента в течение сеанса устанавливать более чем одно соединение и получать информацию одновременно более чем из одного источника. Еще одно важное свойство протокола — не ограничиваться ресурсами сети и устанавливать многоресурсные соединения, когда информация проходит через одну или несколько концевых точек разных сетей (рис. 7.8). При установке соединения по типовому сценарию DSM-CC Клиент конфигурирует себя для Сети путем обмена сообщениями с нею, это обязательная часть процедуры. Затем может производиться загрузка информации от Сервера к Клиенту. Уникальной особенностью DSM-CC можно считать возможность загрузки как в традиционном интерактивном режиме (с подтверждением), так и в вещательном режиме. Часть протокола П-П предоставляет широкий набор мультимедийных интерфейсов для предоставления различных услуг, таких, как телемагазин, видео по запросу, игры, дистанционное обучение. Определения интерфейсов написаны на специальном языке IDL (Interface Definition Language — язык определения интерфейса) и дают на самом деле два различных интерфейса — API для программистов, пишущих приложения для Клиента, и SII для взаимодоступности Клиентов и Серверов от различ- Рис. 7.8. Соединение по сети ATM через гибридную волоконно-оптичес- ных производителей, кую сеть доступа П-П и П-С части интерфейса могут работать независимо одна от другой, но DSM-CC определяет также, каким образом они должны взаимодействовать для создания полной DSM-CC системы. Выше мы отмечали, что перекачка информации от Сервера к Клиенту может идти в вещательном режиме. DSM-CC определил для этого два механизма — карусель данных и карусель объектов, которых мы уже касались в предыдущих разделах. Протокол ка- Сет
208 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю русели данных позволяет осуществлять периодическую загрузку данных Клиентам и каждый может выбрать из рассылаемого списка модули, которые он желал бы загрузить. Так как обратный канал отсутствует, предполагается, что все параметры передачи согласованы заранее и что Клиент знает, в каком канале ему ожидать заказанную передачу. Более рационально включать в карусель не сами мультимедийные данные (визуальную, звуковую, графическую информацию), а ключевую информацию о том, в какой части идущего потока заключена та или иная интересующая Клиента информация. Это может быть название программы, имя файла, идентификатор потока и другие признаки, связанные непосредственно с передаваемыми данными. В терминологии DSM-CC такие признаки называются объектами Пользователь-Пользователь, а циклическая передача объектов получила название карусели объектов. В рамках DSM-CC специфицированы также протоколы управления видео по требованию, управления доставкой вещательных программ и с промежуточных серверов. Желающие ознакомиться с протоколом более детально могут обратиться к тексту стандарта [4.1]. 7.2. ВВЕДЕНИЕ В ТРАНСПОРТНЫЙ ПОТОК К0НТЕНТН0- ЗАВИСИМОЙ ИНФОРМАЦИИ Некоторые виды дополнительной информации, которую нужно передать в составе транспортного потока, связаны с ТВ программами, хотя и не являются их неотъемлемой частью, поэтому способы их передачи мы рассмотрим отдельно. В первую очередь речь идет о телетексте, который получил определенное распространение в аналоговом ТВ вещании как источник дополнительной текстовой и примитивной графической информации и по инерции внедряется и в цифровое вещание, хотя последнее могло бы предложить значительно более гибкие и качественные услуги. Большое число ТВ стандартов породило и широкое разнообразие стандартов телетекста. Совместимость с DVB гарантирована только для телетекста системы В, специфицированного в Рекомендации МСЭ-Р ВТ.653 [7.4]. Сигнал телетекста представляет собой последовательность цифровых блоков длиной 40 байтов (одна строка телетекста) с мгновенной скоростью передачи 6,9375 Мбит/с (444-я гармоника строчной частоты), вводимых в интервалы строчных гасящих импульсов в строках с 6 по 22 и с 319 по 335. Этот сигнал вводится в цифровой поток MPEG-2/DVB на уровне ПЭП блоками по 40 байтов, при этом идентификатор данных data_identifier в заголовке ПЭП должен быть установлен на любое значение в пределах от 0x10 до Ox IF [7.6]. Российский стандарт на систему телетекста ГОСТ Р 50861-96 [7.5] базируется на системе В Рекомендации 653, но содержит некоторые отличия от базовой системы. В частности, для передачи телетекста в стандарте предусмотрены строки 19, 20, 21 1-го поля и 332, 333, 334 2-го поля. При необходимости допускается занимать дополнительно строки 16, 22, 318, 319. Большинство видеокодеров основных производителей предусматривают выделение и передачу сигналов телетекста. Если кодер имеет композитный аналоговый вход, он, как правило, выделяет сигналы телетекста из приходящего видеосигнала. Сложнее обстоит дело с цифровыми входными сигналами в формате SDI, так как этот формат не
Глава 7. Передача данных пользователя и дополнительной информации ... 209 поддерживает передачу сигналов, размещенных в интервале кадрового гашения. Для сохранения информации телетекста приходится параллельно с цифровым подводить к кодеру исходный аналоговый сигнал.^ Второй вид «околотелевизионной» информации, о котором стоит поговорить, — электронный путеводитель по программам (ЭПП), который больше известен под англоязычной аббревиатурой EPG, означающей, кстати, то же самое. Следует признать, что в современном многопрограммном вещании, где число каналов, транслируемых одним вещателем, достигает нескольких сот, обойтись без такого вспомогательного средства просто невозможно. Обратившись к ЭПП, телезритель узнает программу передач на ближайшие дни и недели, точное время начала и окончания каждой передачи, получит информацию о возрастной категории, для которой передача предназначена, прочитает ее краткое содержание. В некоторых моделях приемников благодаря внутренним связям можно войти в просмотр желаемой программы, нажав на пульте дистанционного управления нужную кнопку. Более того, если программа еще не началась, приемник запомнит это желание и в нужный момент спросит, желает ли владелец смотреть ранее выбранную программу, и при получении согласия выведет ее на экран. Как же работает этот электронный гид и от чего зависит степень подробности получаемой информации и ее графическое представление? Прежде всего надо иметь в виду, что существуют и используются два различных подхода к построению ЭПП. В более простых системах вся необходимая информация передается в весьма краткой форме в таблицах служебной информации, большей частью в Таблице информации о событиях (EIT). Сюда ее помещает специальная программа — Редактор ЭПП, которая извлекает необходимые сведения из центральной базы данных компании-вещателя. Для экономии емкости канала в таблицу вводятся название канала, название передачи, ее краткое содержание, время начала и окончания, условные коды возрастной категории и некоторые другие сведения. Всю остальную работу выполняет абонентский приемник. По заложенному в программное обеспечение шаблону он создает трафарет таблицы, выбирает цвет полей, размеры шрифтов, организует размещение информации в клетках таблицы. Таким образом, в одной и той же вещательной сети два приемника разных моделей выведут на экран совершенно различные по виду и алгоритму пользования программы передач, общим в которых будет только фактическое содержание. Обычно информация на экране представляется в двух режимах — ТВ и ЭПП. В режиме ТВ на небольшой части экрана, не мешая просмотру, отображается только название программы, иногда ее краткое содержание. Этот вспомогательный экран появляется на короткое время при переключении программ и исчезает через заданный интервал времени. Режим ЭПП вызывается специальной кнопкой на пульте ПДУ, информация занимает весь экран и содержит подробные сведения о текущей и будущих программах по данному и другим каналам. Второй подход к созданию ЭПП связан с формированием самостоятельного цифрового потока, несущего приемнику не только фактическую информацию, но и детальные указания о ее отображении на экране, зачастую сюда добавляются анимация, звуковые эффекты, 2D или 3D графика. ЭПП превращается как бы в видеоклип, привлекающий внимание телезрителя и повышающий его заинтересованность в просмотре программ. Этот подход требует заметно большего расхода ресурса сети (иногда такого же, как дополнительная ТВ программа) и предъявляет повышенные требования к объему памяти и производительности процессора абонентского приемника. Обычно специальный ЭПП формируется в сетях, где приемники оснащены специальной операционной систе-
210 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Кадр 1 I Отсчет + VUCF / I Отсчет + VUCF J Кадр п Отсчет + I VUCF AES/EBV №1 / I Отсчет + / | VUCF / / / * 1 Отсчет + / VUCF / / 1 1 Отсчет + 1 VUCF | 1 Отсчет t/ VUCF// if I I // Jl Отсчет t/ VUCF// v / *-я группа отсчетов 2-я группа отсчетов г Отсчет + VUCF AES/EBV №2 AES/EBV №3 n-я группа отсчетов Рис. 7.9. Формирование ЭП в стандарте SMPTE-302M мой, позволяющей выполнять различные приложения (а ЭПП — это одно из приложений) на унифицированной программной базе. Подробнее об операционных системах приемников будет рассказано в девятой главе. В заключение упомянем коротко еще об одной возможности использования транспортного потока MPEG-2 как транспортного средства. Речь идет о специфицированной в стандарте SMPTE-302M [7.9] передаче ^компрессированных ИКМ звукоданных (например, сигналов цифрового звука AES/EBU). Метод, использованный для такой транспортировки, наиболее близок к потоковой передаче, хотя и отличается от нее в способах формирования сигнала. Для введения звукоданных одного или нескольких (до 4-х) двухканальных AES/ EBU сигналов в транспортный поток они сначала объединяются в элементарный поток. Последний конструируется из кодовых слов и управляющих битов исходных последовательностей звукоданных, как показано на рис. 7.9, и содержит группы отсчетов. В каждой группе отсчеты из 16, 20 или 24 битов и управляющие биты V, U, С, F каждого из каналов располагаются последовательно, в порядке нумерации каналов. Так как число каналов четное, общее число битов всегда кратно восьми и укладывается в байтовую структуру потока. Сконструированный таким образом ЭП пакетируется в ПЭП, который, в свою очередь, укладывается в пакеты транспортного потока по общим правилам стандарта MPEG-2.
= 8 = УСЛОВНЫЙ ДОСТУП (УД) В СИСТЕМАХ ЦИФРОВОГО ТВ ВЕЩАНИЯ 8.1. ОГРАНИЧЕНИЕ ДОСТУПА КАК ОСНОВА ПЛАТНОГО ТЕЛЕВИДЕНИЯ Представление о телевидении как о чем-то даровом и доступном сформировалось в нашей стране за десятилетия, когда оно было средством идеологической обработки и потому оплачивалось государством. В рыночной экономике это такой же товар, как и любой другой, и он должен быть оплачен потребителем. В мире сложилось несколько систем оплаты за просмотр ТВ программ. В некоторых странах государство поддерживает создание и распространение одной-двух общенациональных программ, считая это политической задачей сплочения нации и беря на себя все или часть расходов на эти программы. Недостающие средства могут привлекаться за счет абонентской платы за пользование ТВ приемником, которая существовала и в СССР, но была отменена в конце 60-х годов. Значительное число национальных и региональных программ общего содержания (в том числе и большинство отечественных) существует за счет рекламы. Фактически это не бесплатное вещание, а скрытый налог на телезрителей, так как всем понятно, что расходы на рекламу производитель включает в стоимость продаваемой продукции. С ростом благосостояния населения, расширением круга интересов и повышением уровня культуры появляется потребность в специализированных ТВ каналах, ориентированных на определенные социальные, возрастные, профессиональные группы населения, объединения по интересам и увлечениям. Число зрителей таких программ недостаточно, чтобы привлечь рекламодателей, и единственным способом их финансирования становится принцип платного телевидения. Обычно, чтобы удовлетворить запросы всей семьи, вещатели предлагают набор нескольких программ различного содержания — букет (это слово вошло в международный телевизионный словарь из французского языка и не вполне привилось пока в русском). В букет могут входить фильмовые, спортивные, детские программы, познавательные, приключенческие, информационные и т.д. И здесь возникает проблема ограничения доступа к каналам. Понятно, что абонент, даже самый сознательный, едва ли будет платить за просмотр, если доступ к каналам останется свободным. Вещатели применяют различные технические приемы, чтобы пре-
212 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю доставить возможность просмотра программ только своим абонентам, внесшим установленную абонентскую плату, и ограничить доступ к каналу всем остальным потенциальным телезрителям. Совокупность таких технических средств и приемов называется системой условного доступа (УД) (в английском языке принят термин СА — Conditional Access). Абоненту системы платного телевидения обычно предлагаются несколько алгоритмов оплаты. Самый простой — подписка (subscription), когда абонент оплачивает заранее просмотр выбранных им каналов в определенном временном промежутке вне зависимости от того, будет ли он их на самом деле смотреть. Более гибкий режим — оплата непосредственно за просмотр PPV (Pay per View плати и смотри), здесь различают варианты выбранных и заранее оплаченных событий (Prebooked PPV) и оплату текущего или предстоящего события в режиме реального времени (IPPV — Impulse PPV). В режиме PPV обычно предлагают просмотр наиболее интересных и интригующих событий — нового голливудского блокбастера, боксерского поединка с участием чемпиона мира и т.п. Большинство применяемых систем УД обеспечивает работу во всех указанных режимах. 8.2. ПОСТРОЕНИЕ СИСТЕМ УД Общепринятый способ ограничения доступа так изменить параметры передаваемого сигнала, чтобы обычный терминал (спутниковый приемник, кабельный абонентский блок) не мог принять его без специального декодера. Укажем здесь на существенное отличие системы условного доступа от систем засекречивания связи. Основная задача секретной связи — сделать сообщение недоступным для всех, кроме адресата, и получить ключ к сообщению может только адресат. В платном телевидении получить ключ может любой, оплативший право приема, это не система засекречивания, а только средство сделать вещание коммерчески окупаемым. Во всем мире системы условного доступа не относят к криптографическим системам, хотя в основе их функционирования лежат некоторые криптографические методы. Основные требования к системе закрытия она должна быть недорогой, устойчивой к вскрытию и «прозрачной». Первое требование очевидно и означает, что стоимость декодера не должна существенно влиять на стоимость всей приемной установки. Высокая устойчивость предполагает, что сигнал невозможно расшифровать простой переделкой приемника, декодер не может быть изготовлен в домашних условиях, а ключ или абонентская карта защищены от копирования. Прозрачность системы означает, что качество сигнала после кодирования/декодирования не должно ухудшаться. Условный доступ применялся и в аналоговом телевидении, существовало пять-шесть основных систем (Discret, VideoCrypt, NagraVision/Syster, Irdeto, VideoCipher, EuroCrypt), использовавших искажение синхросигнала, перемешивание строк или перестановку частей строк изображения, однако эти методы не отличались высокой надежностью. Цифровые технологии полностью изменили подход к обработке ТВ сигнала. Достаточно просто перемешать биты цифрового потока, и понадобятся годы работы суперкомпьютеров, чтобы восстановить их исходный порядок. Работа всех цифровых
Глава 8. Условный доступ (УД) в системах цифрового ТВ вещания 213 систем условного доступа (а их известно более десяти) основана на перемешивании скремблирование— цифрового потока по определенному закону, информация о котором передается декодеру в засекреченном виде в том же цифровом потоке. В рамках DVB Project долго дискутировался вопрос, возможно ли стандартизовать единую для всех вещателей систему условного доступа. Это очень сложный вопрос, затрагивающий основы платного телевидения, так как надежная система условного доступа служит единственной гарантией получения дохода для операторов платного телевидения. В ходе дискуссий был найден разумный компромисс, заключающийся в разделении процесса ограничения доступа на два уровня: скремблирование сигнала и доставка ключей дескремблеру. Первый процесс был стандартизован в рамках DVB в форме Единого алгоритма скремблирования (Common Scrambling Algorithm), второй оставлен на усмотрение вещательных компаний. Таким образом, все различия между системами условного доступа последнего поколения заключаются именно в способах засекречивания кодирующих ключей, доставки этой информации к дескремблеру и ее расшифровки. Для повышения устойчивости всей системы Единый алгоритм скремблирования не опубликован, он имеется у четырех компаний-разработчиков, которым DVB Project поручил функции Хранителей. Параметры алгоритма передаются только по необходимости компаниям, заявивши о намерении производить DVB-совместимое оборудование и подписавшим Соглашение о нераспространении [8.1]. Алгоритм по криптографическим меркам считается весьма устойчивым и рассчитан на долгие годы работы без вскрытия. Надо отметить, что за годы существования DVB Project не зафиксировано утечки в открытую прессу сведений об этом алгоритме. Известно только, что обработка данных ведется блоками по 8 байтов. Можно предположить, что скремблирование, как и обычно, осуществляется суммированием цифрового потока с отрезком ПСП, задаваемым ключом (ключом называют комбинацию символов, содержащую в себе информацию, необходимую для зашифровки или расшифровки сообщения). По правилам DVB скремблирование с целью ограничения доступа можно осуществлять на уровне ПЭП или на уровне транспортного потока, но никогда на обоих уровнях одновременно. Как уже отмечалось, во всех случаях заголовки пакетов не скремблируются [8.2]. Информация о скремблировании передается двумя однобитовыми флагами в заголовке ПЭП или транспортного потока. Один определяет, скрем- блирован ли поток, а второй — каким контрольным словом он скремблирован — действующим или следующим. Чтобы дать читателям некоторое представление о технологии скремблирования, приведем краткие сведения об алгоритме, используемом в американском стандарте ATSC [8.3]. За основу взят официальный стандарт шифрования DES (Data Encryption Standard) с 56-битным ключом, но применяемый трижды (TDES Triple DES) в цепочечной конфигурации (рис. 8.1)[8.4]. В зависимости от используемых ключей можно работать на базовом уровне секретности с ключом 56 битов (три ключа одинаковы), высоком уровне -- с ключом 112 битов (два ключа одинаковы) и максимальном уровне (все три ключа разные, суммарная длина ключа 168 битов). На каждом этапе скремблирования из 64 битов данных и 64 битов ключа (56 битов собственно ключа и 8 битов проверки на четность) по достаточно сложному алгоритму вычисляются новые 64 бита, которые и представляют собой часть скремблированного потока. Отметим попутно, что длина ключа 56 битов для современных компьютеров, по-видимому, уже недостаточна. Хотя и возможно 7-Ю16 комбинаций из 56 битов, недавно сообщалось о вскрытии DES алгоритма за 3 часа работы специализированного компьютера.
214 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 4 Ключ 56 байтов' Открытые блоки ^| TDES шифрация т 4 Ключ 56 байтов TDES шифрация т Ключ 56 байто! TDES шифрация т Ключ 56 байтов' р Зашифрованные блоки ^> Зашифрованные блоки ^ J" ^ w TDES дешифрация 4 Ключ TDES 56 байто*] дешифрация 4 Ключ Р-н TDES 156байтов| Двшифра- ция 4 Открытые блоки Рис. 8.1. Алгоритм скремблирования TDES, применяемый в стандарте ATSC После разделения процесса ограничения доступа на два уровня обобщенная схема системы условного доступа может быть представлена так, как показано на рис. 8.2. Процессом скремблирования и дескремблирования управляет операционный ключ низкого уровня, так называемое контрольное слово (КС). Периодичность смены КС от 0,5 до 10 с. Этот ключ в свою очередь зашифровывается с помощью ключа более высокого уровня — сеансового ключа, который сменяется один раз в несколько недель или месяцев и также передается в цифровом потоке. Для его закрытия используется управляющий Вещатель Абонент Открытый сигнал КС Э Скремблер • ч КС Управление УД Разрешг ;пис 7л Скремблированж сигнал (по воздуху) ЕСМ (по воздуху) EMM (по воздуху) ) —} Дескремблер • ч КС Авторизация • V Открыты сигнал 1 S- Ф * К а .5 * о *о х о. 2 со > ф Ш о. - £ S. | г б s 2 5 = « > о. 5 О С ct Q. >» (О Рис. 8.2. Обобщенная схема системы условного доступа
Глава 8. Условный доступ (УД) в системах цифрового ТВ вещания 215 l^ Открыто ^ ^ ^ Критерии доступа Зашифровано ^ — ^ Криптограммы Подпись Адрес ^Открыто или зашифровано лфров Сведения об авторизации сеансовый ключ Зашифровано , Криптограммы ключей а) б) Подпись ключ. Информация о ключах, о режиме закрытия тех или других каналов или групп каналов передается абонентскому приемнику-декодеру в составе специальных Сообщений Управления Доступом (ЕСМ Entitlement Control Message) (рис. 8.3а). Информация о критериях доступа к каналам и букетам передается в открытом виде, контрольное слово для дескремблера — в зашифрованном виде. Третья часть ЕСМ сообщения, цифровая подпись (аналог контрольной суммы) набор символов, применяемый для проверки правильности приема двух предшествующих частей. Учитывая частую смену КС и довольно большую задержку дешифровки (до 1 с), ЕСМ переносит не одно, а'дваТССГ"— действующее ислед^ющее^ Декодер как бы «запасается» контрольным словом, которое ему понадобится в следующую секунду. Сообщения ЕСМ передаются отдельными пакетами транспортного потока с присвоенными им номерами PID, в среднем один пакет в 100 мс, занимая примерно 15 кбит/с в расчете на программу. Сведения об абонентах, об оплате подписки на определенные каналы или букеты на определенный срок поступают в систему управления подпиской. Здесь операторы вносят сведения в базу данных, ведут учет платежей за подписку, PPV и другие услуги. Абоненту, оплатившему право просмотра, высылаются специальные Сообщения Разрешения Доступа (EMM Entitlement Management Message), разрешающие данному дескремблеру открыть для просмотра выбранную программу на оговоренный срок. Структура EMM показана на рис. 8.36. В первой части сообщения передается адрес — одного абонента, группы абонентов или всех декодеров в сети, затем сведения об авторизации адресата предоставление или прекращение права доступа, сроки, программы и букеты, далее в зашифрованном виде могут передаваться новые сеансовые ключи, и в конце — цифровая подпись, как в ЕСМ. Сообщения EMM также передаются в отдельных транспортных пакетах со своими значениями PID, но число их зависит от числа абонентов сети и в больших сетях может требовать ресурса в сотни килобит и даже единицы мегабит в секунду на связной канал. Информация об используемой системе условного доступа передается в таблице CAT в виде дескриптора, содержащего условный номер применяемой системы, под которым она зарегистрирована в ETSI. В этой же таблице передается номер PID Сообщений Разрешения Доступа (EMM). Значение PID Сообщений Управления Доступом (ЕСМ) находится в таблице РМТ. Рассмотрим теперь, как приемник обрабатывает пришедшие сообщения и как извлекает из них необходимую для дескремблера информацию. Основным узлом, обеспечивающим обработку всей информации условного доступа и сохранение защиты от несанкционированного доступа, служит абонентская карточка — небольшой прямоугольник из пластмассы с вмонтированным в него кристаллом микросхемы. Часть информации заносится в память микросхемы при ее изготовлении и управляющий ключ Рис. 8.3. Структура сообщений ЕСМ (а) и EMM (б)
216 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю не может быть считана никаким способом. Перемычки с внешними цепями пережигаются, поверхность кристалла делается волнистой, чтобы невозможно было воспроизвести структуру соединений методом шлифования, принимаются и другие защитные меры. В этой части памяти хранится секретный алгоритм дешифровки ключей. В памяти процессора также хранятся сеансовые ключи, принятые «по эфиру» от вещателя, и сведения о правах доступа, предоставленных данному абоненту. Демультиплексор приемника выделяет из приходящего цифрового потока ЕСМ и EMM сообщения и направляет содержащуюся в них информацию абонентской карточке. Здесь происходит сверка запрошенной абонентом программы с имеющимися правами доступа. Если текущая дата, содержащаяся в ЕСМ, укладывается в период оплаченной подписки, а номер программы или группы программ (класса), для которых прием разрешен, совпадает с номером запрошенной программы или включает его в свой перечень, процессор дает команду дешифровать контрольное слово и вернуть его дескремб- леру, который и дескремблирует нужный поток. Мы не упомянули еще о дополнительных признаках, по которым карточка проверяет право доступа: возрастную категорию, родительский ключ, соответствие географической зоне и т.д. В некоторых системах приемник имеет обратный канал к системе управления подпиской и может посылать запросы на события PPV и подтверждать согласие на оплату. Обратный канал может быть реализован с помощью модема по телефонной линии, по сети кабельного телевидения и другими способами. Этот вопрос более подробно обсуждается в следующей главе. Вернемся к передающей стороне и рассмотрим более детально происходящие здесь процессы (рис. 8.4). DVB скремблер устанавливается обьшно на выходе мультиплексора и скремблирует каждыйкомпонент цифрового потока в соответствии с указаниями управляющего компьютера. Текущее контрольное слово для скремблера и всей системы задает генератор КС. Документы DVB предъявляют жесткие требования к схеме генерации КС, так как оно непосредственно используется для скремблирования цифрового потока. Должна применяться техника, гарантирующая чисто случайный характер цифровой последовательности с минимальной детерминированностью. Предложены [8.5] три критерия проверки случайной последовательности на криптографическую надежность: 1) она должна производить на наблюдателя впечатление совершенно случайной; 2) наблюдатель не должен быть в состоянии предсказать следующий бит, даже зная полностью алгоритм и устройство генерирующего прибора; 3) данная последовательность не должна воспроизводиться при повторном запуске генератора от того же входного сигнала. Обычные ПСП удовлетворяют критериям (1)и(2)ине удов- л л /о\ г\ Рис. 8.4. Структурная схема передающей части системы летворяют критерию (3). Это не цифрового в^ия с уд Кодер Кодер Кодер Мультиплексор Т" EMM инжектор SMS Скремблированный сигнал + ЕСМ+ЕММ Скремблер ?F Генератор КС Генератор ЕСМ в SAS Материнская карта Материнская карта
Глава 8. Условный доступ (УД) в системах цифрового ТВ вещания 217 значит, что ПСП вообще непригодны для генерации КС, но любой ПСП алгоритм в первую очередь становится предметом атаки, и надо следить, чтобы последовательность не только казалась, но и была случайной. Это непросто, но существуют несложные тесты проверки соответствия критериям (1) и (2). Например, последовательность не должна сжиматься существующими программами-архиваторами более чем на 1-2%. Наилучший метод генерации случайных последовательностей — использование физических процессов (теплового шума, шумового диода) для воспроизведения Гауссова белого шума с плоским амплитудным спектром (например, ±1дБ в полосе 100 Гц... 120 кГц). Подавая шумовой сигнал на быстродействующий компаратор, получим истинно случайную цифровую последовательность, удовлетворяющую всем трем критериям. Еще одно устройство, называемое генератором ЕСМ, формирует Сообщения Управления Доступом и передает их мультиплексору. В генераторе ЕСМ происходит зашифровка контрольного слова. Чтобы повысить общий уровень защищенности всей системы, эту функцию передали пластиковой карте с микросхемой, похожей по внешнему виду на абонентскую и имеющей те же степени защиты. Эта карта называется материнской. Ввод сообщений EMM в мультиплексер осуществляет EMM инжектор. Это устройство получает информацию от системы авторизации абонентов (SAS — Subscrieber Authorization System), которая, в свою очередь, связана с системой управления подпиской (SMS — Subscrieber Management System). Первая система отвечает за авторизацию приемника абонента для приема выбранных программ, она хранит в базе данных системные адреса абонентов и ставит им в соответствие права доступа. Во второй системе накапливаются сведения об абонентах (имя, адрес, тип подписки, оплаченное время) и устанавливается связь этих сведений с системным адресом абонента (номером приемника, карточки или абонентского договора). Приведенное здесь описание функционирования системы УД содержит только общие сведения и описывает процессы, примерно одинаковые для различных систем. Детальное описание алгоритмов и устройств компании-провайдеры услуг УД считают конфиденциальной информацией и не публикуют эти данные в открытой печати. В таблице А10 Приложения А приведены некоторые доступные данные о существующих системах условного доступа. 8.3. ПРИЕМ СИГНАЛОВ В НЕСКОЛЬКИХ СИСТЕМАХ УД Отсутствие унификации систем УД приводит к тому, что абонент, желающий принимать программы в нескольких вещательных сетях (например, программы со спутников Hot Bird в точке 13° восточной долготы), должен приобрести для каждой сети отдельный приемник или в лучшем случае отдельную абонентскую карточку (если сети по совпадению используют одну и ту же систему УД). В DVB с самого начала стандартизации была поставлена задача: дать возможность абоненту принимать программы в разных сетях на один приемник. Одно из первых решений было найдено путем организации вещания программ одновременно в нескольких системах УД, оно получило название Simulcrypt [8.6]. Для этого на передающей стороне устанавливают оборудование генерации и ввода ЕСМ и EMM для каждой из систем и вводят в транспортный поток соответствующее количество управляющих сообщений. При этом каждая программа
218 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю SAS 1 SAS2 Управление | УД1 Управление УД2 / \ к ) / \ \ ) EMM инжектор 1 EMM инжектор 2 Генератор КС 1 Синхронизатор Simulcrypt N } ) Мультиплексор 1 .. > )\ UKpOMVJICp 'Г Рис. 8.5. Структурная схема передающего оборудования для режима Simulcrypt вещается на несколько популяций приемников с различными системами УД, а каждый приемник-декодер выбирает из цифрового потока ЕСМ и EMM сообщения, соответствующие встроенной в него системе УД, игнорируя все остальные сообщения. Система позволяет легко перевести вещание на другую систему УД в случае, например, вскрытия пиратами. Структурная схема передающего оборудования для этого случая приведена на рис. 8.5. Режим Simulcrypt удобен для абонента, но не очень удобен для вещателя. Неэффективно расходуется ресурс пропускной способности канала, непросто договориться с другими вещателями о разделении рынка, снижается надежность системы условного доступа (одновременное вещание означает для каждой системы такую устойчивость, которую имеет самая слабая из систем). Второй путь, предложенный для приема в нескольких системах УД, заключается в том, чтобы выделить в приемнике-декодере все узлы, так или иначе имеющие отношение к УД, в отдельный модуль и сделать этот модуль сменным, легко вставляемым и удаляемым. За приемником остаются функции приема, демодуляции и декодирования MPEG-сигнала, а также возможность приема нескремблированных программ. Этот метод получил название «Единый интерфейс» (CI — Common Interface). Абонент, желающий принимать программы в разных системах УД, каждый раз при переходе в другую сеть заменяет модуль одной системы на модуль другой. Модули выполнены конструктивно в хорошо зарекомендовавших себя миниатюрных корпусах PCMCIA, разработанных для использования в переносных компьютерах. Модуль соединяется с устройством-«хозяином» 68-контактным соединителем, по которому происходит весь обмен информацией УД. Абонентская карточка вставляется в модуль и заменяется вместе с ним. Структурная схема подключения модуля к приемнику приведена на рис. 8.6. Логически интерфейс состоит из двух частей. Первая переносит весь демоду- лированный сигнал к дескремблеру, находящемуся в модуле, и возвращает часть потока декодеру с дескремблиро- ванными компонентами, соответствующими выбранному сервису. Интерфейс допускает цепочечное соединение нескольких модулей CI, каждый из которых обрабатывает в цифровом потоке л л л л компоненты скоемблипованные «сво- Рис* 8'6* СТРУКТУР"" схема приемника-декодера с компоненты, скремолированные «сво модулем «общего интерфейса" Абонетская карточка
Глава 8. Условный доступ (УД) в системах цифрового ТВ вещания 219 ей» системой УД. Вторая часть более сложная и выполняет функции командного интерфейса между модулем и терминалом-«хозяином». Модуль может обращаться к ресурсам хозяина (модему, дисплею), не информируя его о своих намерениях. Через общий интерфейс также идет взаимодействие высокого уровня «человек-машина» между модулем и абонентом. Например, при запросе IPPV человек может реагировать с помощью пульта дистанционного управления на вопросы, задаваемые модулем, а модуль через модем может связываться с операционным центром сети, и терминал в этих диалогах не участвует. На более низком уровне диалога модуль может посылать на дисплей простые текстовые и графические сообщения. Гибкость CI позволяет расширять его функции для выполнения других задач. 8.4. УПРАВЛЕНИЕ УД ПРИ СМЕНЕ СРЕДЫ ВЕЩАНИЯ Одним из нерешенных вопросов условного доступа остается управление доступом при смене среды вещания («трансконтроль» по терминологии DVB). Выше упоминалось, что более 60% абонентов в Европе получают ТВ программы со спутников не непосредственно, а через сети кабельного телевидения. При этом оператор кабельной сети, естественно, стремится ввести свою систему условного доступа, которая позволила бы ему сохранять контроль над базой данных абонентов, управлять подключением к сети абонентских блоков и таким образом возмещать свои затраты. Передача управления доступом из одних рук в другие может происходить двумя путями: 1) полное дескремблирование сигнала и повторное скремблирование в той же или иной системе УД — крайне неэкономичное решение, требующее установки на всех головных станциях сети дорогостоящего оборудования условного доступа; 2) вместо того, чтобы размещать ЕСМ генераторы на всех головных станциях кабельной сети, их можно разместить на нескольких передающих станциях спутникового вещания, чьи программы транслирует кабельная сеть, и дать в спутниковом транспортном потоке дополнительные ЕСМ сообщения, которые затем ретранслируются в цифровой поток кабельной сети. EMM сообщения едины для всей кабельной сети, их можно генерировать в одном месте и рассылать по головным станциям по низкоскоростным каналам связи. Подсчеты показывают, что это решение более экономичное. Вопросы трансконтроля пока не стандартизованы в DVB, хотя предложения на этот счет поступают. 8.5. БОРЬБА С ПИРАТСТВОМ Серьезные финансовые потоки, циркулирующие на рынке услуг платного телевидения, породили теневой бизнес по незаконному изготовлению и распространению декодеров и абонентских карточек. Несанкционированный прием программ, как и всякое нарушение авторских прав, принято называть пиратством. Ведущие компании-операторы платного телевидения теряют из-за пиратства ежегодно сотни миллионов долларов, поэтому понятна та борьба, которую они ведут с пиратскими декодерами и карточками.
220 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Деятельность пиратов началась еще в эпоху аналогового телевидения и довольно быстро привела к тому, что большинство аналоговых систем УД оказались вскрытыми. В некоторых странах было организовано почти промышленное производство пиратских декодеров, которые свободно перевозились через границы и распространялись на территории соседних государств. В 1991 г. Совет Европы принял Рекомендацию «О правовой защите закодированных телевизионных служб», в которой призвал европейские страны ввести в национальные законодательства нормы, ограничивающие возможности пиратского производства и распространения. Предлагалось считать незаконным все производство декодеров сверх количеств, определенных кодирующей организацией (вещателем), импорт, распространение, рекламу пиратских изделий. Нарушения должны были караться адекватными санкциями [8.7]. Многие страны последовали Рекомендации и усовершенствовали свое законодательство, но далеко не все, и пиратство продолжает процветать. Юридически проблема заключается в том, что производство пиратских изделий приравнено к нарушению авторских прав, а согласно законодательству об авторских правах для возбуждения уголовного дела нужно, чтобы имелось в наличии лицо, чьи авторские права на данной территории нарушены и это повлекло убытки. Если декодер изготовлен в стране, на которую не распространяются авторские права компании-вещателя, изготовителя невозможно привлечь к ответу. С 1991 г. ситуация изменилась, и не в лучшую сторону для компаний-вещателей. Переход к цифровому вещанию привел к заметному возрастанию числа сетей, каналов, сервисов, проведенная стандартизация и унификация облегчила задачу пиратов. Совет управляющих DVB обратился к Совету Европы с предложением вслед за Рекомендациями принять Директиву, учитывающую новые факторы в платном ТВ вещании. Предлагается отразить следующие аспекты: - расширить понятие «закодированных служб» для защиты прав новых средств мультимедиа; - распространить ранее принятые меры против контрафактной продукции на пиратские декодеры; - добиться, чтобы не было стран с низким уровнем правовой защиты; - повысить эффективность вводимых санкций. Цифровые технологии УД на первых порах представляли трудности для пиратов, и первые два-три года не появлялось сведений о вскрытии какой-либо цифровой системы. Сейчас такие сведения время от времени появляются в сети Интернет, но ручаться за их достоверность нельзя при попытке проверки цепочка сразу обрывается. По данным из [8.8], взломана система MediaGuard в продаже появились пиратские декодеры и карточки. Такая же судьба постигла одну из ранних версий Irdeto.
= 9 = ИНТЕРАКТИВНЫЕ ВЕЩАТЕЛЬНЫЕ СЛУЖБЫ 9.1. ВИДЫ ИНТЕРАКТИВНОГО ВЗАИМОДЕЙСТВИЯ АБОНЕНТА С ПРОГРАММОЙ С ростом числа программ в системе цифрового вещания у телезрителя возникает проблема выбора того или иного телеканала, а у вещателя — задача сохранения и привлечения аудитории. Многие вещательные компании работают над проектами улучшенного (enhanced) телевидения, способного предоставлять абоненту целый ряд дополнительных услуг. Значительная часть этих услуг так или иначе связана с активным взаимодействием абонента с программой и потому может быть отнесена к сфере интерактивного телевидения. Если еще два-три года назад необходимость внедрения интерактивного телевидения была предметом оживленных дискуссий, сейчас вопрос о его актуальности считается решенным и обсуждаются уже конкретные пути и технические решения реализации новых возможностей телевидения. До сих пор не существует единого и общепринятого определения понятия «интерактивное телевидение». МСЭ определяет интерактивные службы как службы, где пользователь влияет в реальном (или квазиреальном) времени на содержание службы, посылая сообщение к точке ее организации. Это определение, как мы видим, не охватывает ситуации, когда пользователь взаимодействует с уже загруженными данными, хотя общепринятая трактовка относит такие услуги к интерактивным. В определении Комитета по аудиовизуальным проектам (DAVIC), напротив, к интерактивному телевидению относятся все информационные и другие услуги, отображаемые на ТВ экране: телевещание, видео по заказу, доступ в Интернет, ЭПП, телеигры, телемагазин, банковские операции на дому, телеобучение и т.д. Нам представляется наиболее разумной классификация DVB Project [9.1], согласно которой определяются три уровня интерактивности: 1) местная — на уровне возможностей терминала, без обратного канала (переключение программ, телетекст, ЭПП, некоторые телеигры); 2) однонаправленная интерактивность вещание с откликом абонента, не влияющим на контент (непосредственный отклик на рекламу, участие в интерактивных опросах); 3) двунаправленная интерактивность — вещание с откликом абонента и контентом, адресованным персонально абоненту или группе абонентов (элек-
222 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ТрОННая ПОЧТа, телемагазин, банковские Вещательный услуги на дому, азартные игры и т.д.). Для достижения полной интерактивности между провайдером услуг и абонентом устанавливается двунаправленная связь — широкополосный однонаправленный вещательный канал и узкополосный (до 150 кбит/с) двунаправленный канал взаимодействия, как показано на рис. 9.1. В зависимости от вида услуги возможна передача различных наборов Рис. 9.1. Структура интерактивного взаимодействия сигналов с разной скоростью. В табл.9.1 в сети цифрового вещания показаны в качестве примера параметры передачи для наиболее распространенных видов дополнительных услуг. По способу передачи исходного материала существующие сегодня системы интерактивного телевидения можно разделить на две большие группы: «телевизионные» системы, основан- Табл. 9.1 Виды интерактивных приложений и требуемые скорости передачи по прямому и обратному трактам Служба эпп |Телетекст | Субтитры Резюме [программы Описание программы Телемагазин Опросы | населения Аукционы, | телеигры Выбор одной из (многих программ Компьютерные игры Хранение баз | данных Загрузка программного (обеспечения Описание Для плохо слышащих и видящих Заказ на покупку Компоненты ВАТИГД Д тиг ВАТИГД АТД ВАТИ ВАД ВАТИГД ВАТИГД Д Д Д Обратный тракт нет нет нет нет нет да да да да да да да Скорость | Прямой тракт к к к к к к б к м М б-М к Обратный тракт к б к б б б б Вещатель канал Провайдер интерактивных услуг Канал взаимодействия с> Прямой тракт 3 Обпатный тпакт Терминал пользователя
Глава 9. Интерактивные вещательные службы 223 ные на традиционном широковещательном телевидении с добавлением элементов интерактивности, и системы, предоставляющие услуги Интернета на экране телевизионного приемника [9.2]. В системах первого вида дополнительные услуги формируются в рамках телевизионного содержания, используя резервы пропускной способности, имеющиеся в цифровых каналах. Это передача телетекста и ЭПП, прогноза погоды, мозаики каналов. Возрастающим спросом пользуются услуги, связанные с наличием обратного канала, платное телевидение, видео по требованию и его разновидность — «почти» видео по требованию, не требующее обратного канала, банковские услуги, телеигры, телемагазин и т.д. Интерактивные услуги такого вида базируются на специальных прикладных программах API (Application Program Interface — прикладной программный интерфейс), загружаемых в память абонентских терминалов. В системах второго вида используется все разнообразие и богатство содержания сети Интернет и присущий ей интерактивный алгоритм работы. С помощью несложной приставки к ТВ приемнику и компьютерной клавиатуры некоторые виды информации из Интернета становятся доступными абонентам, не имеющим персонального компьютера. Подробнее о предоставлении услуг Интернета мы поговорим в разделе 9.4. 9.2. МОДЕЛЬ СИСТЕМЫ, УРОВНИ ВЗАИМОДЕЙСТВИЯ С ИСТОЧНИКОМ Коммерческая секция DVB разработала требования к интерактивной системе, которые включают [9.1]: 1) выбор подходящего модема для абонентского терминала; 2) протокол доставки текста, неподвижных изображений, графики, звука, видео, данных (включая электронную почту); протокол должен обеспечивать автоматическое установление связи с терминалом и включать средства доставки информации по адресам; 3) гибкость в доступе к различным серверам по различным сетям; 4) стандартизованные средства поведения с вызовами к терминалу; 5) надежные механизмы загрузки новых приложений. С учетом этих требований разработана модель интерактивной системы, показанная на рис. 9.2 [9.3]. В этой модели вещательная среда доставки включает спутниковые, кабельные и наземные эфирные ТВ сети, а среда взаимодействия базируется на узкополосных каналах: телефонной сети, узкополосной интегральной цифровой сети (N-ISDN), обратных каналах в сетях кабельного телевидения, обратных спутниковых каналах через станции VSAT, эфирных и DECT каналах. Прямой тракт канала взаимодействия, служащий для передачи специализированной информации от провайдера услуг к абоненту, может включаться (встраиваться) в широкополосный вещательный канал или функционировать самостоятельно. Обратный тракт канала взаимодействия используется для ответов на вопросы или посылки запросов провайдеру услуг. Обычно его называют обратным каналом, но для большей точности DVB предлагает использовать термин «канал взаимодействия». В более детальной версии базовой модели уточняется структура коммуникационной сети между провайдером и абонентом. Она может содержать участок сети подачи программ, по которому несколько провайдеров выходят на центральный узел, откуда по распределительным сетям (спутниковым, кабельным, эфирным) программы попадают на головные станции кабельных или коллективные антенны спутниковых сетей и далее по местным кабельным сетям и сетям первой ПЧ спутникового телевидения к абоненту.
224 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю с; со i О. ф I ф I о ю < Абонентский модуль -сг Интерфейс вещательной сети Интерфейс сети взаимодействия ^ Интерфейс вещательной сети с. со 3" ф СО Интерфейс сети взаимодействия Т ____±___ Q. Ф со m о Q. d X ктивнь ел Q. Ф ИНТ L. с, ° >s 2 5 i S О >s о X ш со а X S л 1 к СО ш о 8 \о к со X X I \о о \о о CVJ о S Q. I ■——_
Глава 9. Интерактивные вещательные службы 225 В отличие от полной семиуровневой системы МОС, описанной нами в главе 6, при анализе интерактивной системы Техническая секция DVB использует упрощенную трехуровневую модель, включающую физический, транспортный и прикладной уровни. На физическом уровне определяются электрические параметры передачи, транспортный уровень описывает структуру данных и связные протоколы, прикладной уровень специфицирует программные приложения и запускающие программы. 9.3. РЕАЛИЗАЦИЯ КАНАЛОВ ВЗАИМОДЕЙСТВИЯ В РАЗЛИЧНЫХ ТРАНСПОРТНЫХ СРВДАХ 9.3.1. Коммутируемые сети общего пользования Канал взаимодействия в интерактивной системе может быть реализован в любой транспортной среде, допускающей низкоскоростную передачу. Организация DVB Project провела большую работу по выработке технических спецификаций на такие каналы для стандартизации их в ETSI. К настоящему моменту приняты стандарты для каналов в коммутируемых сетях общего пользования [9.4], GSM сетях [9.5], цифровых беспроводных сетях DECT [9.6] и сетях кабельного телевидения [9.7], завершается разработка стандартов для спутниковых [9.8] и наземных эфирных сетей [9.9]. В табл. 9.2 для сравнения приведены характеристики канала взаимодействия, организованного в некоторых из перечисленных транспортных сред. В телефонной сети общего пользования передача информации от абонента к провайдеру услуг может осуществляться с помощью модема, работающего по одному из протоколов, предусмотренных европейским стандартом EN 50201. Модем может быть внешним или встроенным в терминал. Если канал взаимодействия организуется в цифровой сети Табл. 9.2 Сравнение каналов взаимодействия в некоторых транспортных средах "^--^^^ Сеть Свойства^^^^--^^^^ Использование переносных приборов внутри дома Мобильное использование Задержка ответа Стоимость связи Стоимость сети Стоимость терминала Коммутируемая сеть/ADSL нет нет высокая низкая низкая очень низкая DECT да нет средняя средняя высокая низкая GSM/ GPRS да да средняя высокая средняя низкая Эфирный да возможно низкая низкая низкая низкая
226 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю интегрального обслуживания (ISDN), используется базовый уровень доступа. Преимуществом такого решения можно считать повсеместную доступность телефонных сетей, хотя и не всегда высокого качества, недостатком ограниченную пропускную способность (не более 56 кбит/с в лучших телефонных сетях и 128 кбит/с в ISDN). В настоящее время телефонные компании возлагают большие надежды на технологию ADSL (Asymmetrical Digital Subscriber Line — асимметричная цифровая абонентская линия), использующую абонентские отводы в виде витой пары, допускающей передачу со скоростями в единицы мегабит в секунду. Однако все проводные технологии достаточно дороги и рассчитаны на организацию связи в режиме «точка-точка», в то время как природа мультимедийных служб требует транспортировки контента из одной во множество точек. Широкое распространение мобильной телефонной связи подсказало идею использования цифрового канала в сети мобильной связи для организации обратного канала взаимодействия. Соответствующий стандарт был принят ETSI в 1999 году. Цифровая система GSM (Global System for Mobile Communications — глобальная система мобильной связи) работает на нескольких несущих в диапазонах 900 или 1800 МГц, покрывая всю обслуживаемую территорию ячейками (сотами), в центре которых расположены базовые приемо-передающие станции, соединенные с узлами коммутируемой сети общего пользования. Передача на каждой несущей производится методом временного разделения со скоростью 270 кбит/с, позволяя организовывать до 8 стандартных каналов или до 16 каналов с половинной скоростью. В системе могут передаваться речь, сигналы телефакса и данные. В завершающей стадии стандартизация в GSM режима передачи пакетных сообщений со скоростью до 100 кбит/с. 9.3.2. Сети кабельного телевидения В сетях кабельного телевидения [9.7, 9.10] прямой тракт канала взаимодействия, называемый также нисходящим потоком (downstream), может организовываться как вне вещательного канала (Out-of-band — внеполосный канал), так и внутри него (In-band — внутриполосный канал). В первом случае частота его может выбираться в свободном участке метрового или дециметрового диапазонов, конкретные значения частоты задаются кабельным оператором с учетом частотного плана сети. Полоса частот канала может составлять 1 или 2 МГц, скорость передачи информации по нему — соответственно 1,544 или 3,088 Мбит/с, модуляция — дифференциальная ФМ-4. По прямому тракту передается только информация интерактивного взаимодействия и команды управления. Рекомендованный уровень сигнала у абонента — в пределах 42...75 дБ(мкВ). Информация, передаваемая в нисходящих потоках, доступна всем абонентам, для персонификации используются два типа адресов: MAC адрес — 48-битовый уникальный адрес, присваиваемый сетевому интерфейсу абонента при инсталляции, и NSAP адрес — 160-битовый текущий сетевой адрес, присваиваемый интерфейсу протоколами вышележащих уровней. Благодаря временному уплотнению каждый нисходящий поток может обслуживать до нескольких тысяч абонентов. И в прямом, и в обратном трактах канала взаимодействия принят обмен информацией в форме ATM пакетов. Для повышения достоверности передачи на нисходящем участке применяется помехоустойчивое кодирование кодом Рида-Соломона (55,53,1), исправляющим один ошибочный байт. Кодер построен на основе того же порождающего многочлена, что и кодеры (204,188,8) в стандартах DVB-S и DVB-C, только вместо 51 нулевого байта к исходной ATM ячейке добавляются 200 нулевых байтов, которые затем на при-
Глава 9. Интерактивные вещательные службы 227 еме игнорируются. Сверточный перемежите ль, подобный описанному в главе 6, содержит 5 линеек регистров сдвига с задержкой 11 х к байт, где к = 0, 1, 2, 3, 4. После перемежителя символы объединяются в кадры и суперкадры. Один суперкадр длиной 4632 бита включает 24 кадра по 193 бита, каждый из которых в свою очередь содержит бит заголовка и 24 байта данных. В 24 заголовочных битах суперкадра передается управляющая и проверочная информация. Для передачи интерактивной информации в прямом направлении от головной станции к абоненту в системах с внутриполосным каналом используются транспортные пакеты в составе вещательного потока, передаваемые со специальным идентификатором PID, выделенным в данной сети для канала интерактивного взаимодействия. Эти пакеты содержат MAC адреса и поле данных для полезной информации, а также синхросигналы для управления обратным трактом. Скорость нисходящего потока может составлять любую часть общей скорости, рекомендованный шаг 8 кбит/с. Обратный тракт канала взаимодействия, называемый также восходящим (upstream), организуется на частотах ниже 50 МГц, где в современных сетях кабельного телевидения выделяются полосы частот для восходящих потоков. Полоса частот каждого канала может составлять 200 кГц (класс А), 1 МГц (класс В) или 2 МГц (класс С), скорость передачи — соответственно 256 кбит/с, 1,544 и 3,088 Мбит/с, модуляция — дифференциальная ФМ-4. Доступ к восходящему потоку организуется на основе временного разделения, для чего временная ось делится на слоты — отрезки времени, в течение которых можно передать пакет данных длиной 512 битов (256 символов). В зависимости от битовой скорости передачи скорость слотов составляет 500 слотов/с для канала класса А, 3000 слотов/с для канала класса В и 6000 слотов/с для класса С. Терминал абонента получает доступ к каналу в одном из трех режимов: Fixed Rate (с фиксированной скоростью — за абонентом зарезервировано определенное количество слотов); Reservation access (динамическое резервирование — терминал посылает запрос и получает необходимые слоты); Contention based (на основе конкуренции — терминал посылает информацию в произвольных слотах, а за возникающими коллизиями следят специальные протоколы). Общая синхронизация сети и привязка начала слотов осуществляются путем посылки в нисходящих потоках соответствующих синхросооб- щений. Во внеполосном канале передаются сигналы синхронизации для работы нескольких (до 8) восходящих потоков, во внутриполосном канале синхроинформация передается в отдельных пакетах, которые должны поступать не реже, чем 1 раз в 3 мс. Поскольку время пробега нисходящих сигналов до разных абонентов различно, сигналы синхронизации приходят к ним в разные моменты времени, что могло бы вызывать сдвиги начала слотов. Время прихода корректируется благодаря организации специальных слотов для измерения расстояния (ranging slots). Рекомендованный уровень сигнала на передачу с абонентского терминала 85...113 дБ(мкВ). 9.3.3. Сети спутникового вещания Во многих случаях обратный тракт через телефонную сеть не обеспечивает достаточной скорости взаимодействия и устойчивой связи, а современные сети кабельного телевидения развиты далеко не во всех странах (в России, по нашим оценкам, охват домовладений такими сетями едва ли превышает доли процента). Удачным решением в таких случаях, особенно если речь идет о системах спутникового вещания, могло бы оказать-
228 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю исз 1 ИС3 2 ся использование спутникового обратного канала, стоимость реализации которого не зависит от географического местоположения абонента и состояния существующих сетей связи, а надежность и качество связи весьма высоки. В общем случае для организации обратного канала необходимо использовать другой, связной, спутник и вторую антенну у абонента, направленную на этот спутник, так как вещательные спутники в силу ряда технических особенностей не очень эффективны в режиме передачи большого числа низкоскоростных сигналов. В некоторых случаях удается подобрать два близко расположенных спутника, один вещательный, другой связной, так что и прием, и передача оказываются возможны с одной антенны с двумя смещенными облучателями (рис. 9.3). Ведущий спутниковый оператор консорциум SES из Люксембурга планирует запустить в начале 2001 года многофункциональный спутник ASTRA-1K с несколькими полезными нагрузками, одна из которых предназначена для вещания, другая для организации обратных каналов от индивидуальных абонентов. Подробнее об этом рассказано в [9.11]. Коммерческая секция DVB Project разработала требования к каналу интерактивного взаимодействия в спутниковых системах, которые вкратце сводятся к следующему [9.12]: спецификации канала не должны зависеть от диапазона частот и содержания передаваемых сообщений; - должны быть даны рекомендации по расширению таблиц SI для приспособления их к нуждам новой службы; спецификации должны допускать одновременную работу в сети терминалов разных типов, в том числе индивидуальных и коллективных терминалов, подключаемых к домашним цифровым сетям (см. далее в этой главе); транспортные протоколы должны обеспечивать гибкость в обеспечении соединений с различными видами сетей, в том числе Ethernet и ATM, интерфейсы должны быть стандартными и общедоступными; - оборудование должно быть простым в установке и обслуживании; должна обеспечиваться совместимость со стандартами передачи данных в прямом канале хотя бы для следующих служб приложений реального времени (интерактивное цифровое вещание, потоковая передача), служб квазиреального времени (доступ в Интернет, просмотр Web-страниц), систем вне реального времени (передача файлов, е- mail, распределение баз данных), живых интерактивных трансляций (интерактивное телевидение, дистанционное обучение, телемедицина). В требованиях предлагается рассматривать три категории (профиля) потенциальных пользователей с разными показателями качества обслуживания, но максимальной общностью технических решений: «Частный абонент» (Consumer Profile) — потребитель интерактивных услуг на бы- Операционный центр О" Рис. 9.3. Схема доступа в Интернет с близкорасположенными спутниками
Глава 9. Интерактивные вещательные службы 229 товом уровне, например, услуг телемагазина, платного телевидения, электронной почты, загрузки программного обеспечения и т.п. Для каждой из этих услуг прогнозируется размер рынка в несколько миллионов частных пользователей, и вполне вероятно, что часть из них захотят воспользоваться услугами спутниковой связи. На начальном этапе, пока цена спутниковых интерактивных терминалов (СИТ) будет высока, возможно использование одного терминала несколькими близко расположенными абонентами. Считается, что загрузка обратного канала абонентами данной категории не превысит 64 кбит/с, коэффициент готовности канала может составлять 95%, а стоимость оборудования в расчете на одного абонента не должна превышать 1000 долл. США. «Полупрофессиональный пользователь» (Prosumer Profile производное от Professional + Consumer) — к этой категории относят значительную группу специалистов, постоянно или по большей части работающих дома. По оценке [9.9], в мире их более 20 миллионов. Для обозначения такого вида деятельности в английском языке даже появилась специальная аббревиатура SOHO (Small Office Home Office малый/домашний офис). Для осуществления своей профессиональной деятельности эти люди нуждаются в разнообразных и качественных услугах связи. Например, для работы с настольным издательским комплексом необходимо отправлять и принимать полноцветные цифровые изображения и другие большие файлы; специалисту в области банковского дела и коммерции нужно обмениваться с основным офисом документами, загружать и просматривать базы данных, рекламные брошюры; медицинские приложения требуют пересылки фотографий, рентгеновских снимков, томограмм и других компьютерных файлов. Загрузка обратного канала для данной категории пользователей может составить до 384 кбит/с, коэффициент готовности должен быть не менее 99,5%, а стоимость терминала от 1000 до 3000 долл. США. «Корпоративный пользователь» (Corporate Profile) — офис с несколькими сотрудниками, использующими локальную вычислительную сеть и нуждающимися в спутниковых соединениях с другими офисами с симметричным трафиком (по схеме «каждый с каждым»). Требуется высокое качество обслуживания, высокая надежность и повышенная защищенность связи. Скорость передачи в обратном канале может составлять до 2 Мбит/с, стоимость спутниковой станции от 20 до 50 тыс. долл. США. Вероятность ошибки для всех профилей должна быть не хуже 10~8. Результаты проведенной работы обобщены в стандарте [9.8], который должен быть утвержден ETSI в ближайшее время. Принятая в стандарте базовая модель интерактивной спутниковой сети показана на рис. 9.4. Она включает два спутника — ИСЗ-1 для прямого тракта канала взаимодействия (совмещенного, как правило, с вещательным каналом) и ИСЗ-2 для обратного тракта. Передающая земная станция (ПЗС) передает на спутник вещательный сигнал, в который путем мультиплексирования вводятся сигналы управления и синхронизации, необходимые для работы сети СИТ. Сигналы, переданные СИТ, принимает с ИСЗ-2 специальная приемная станция (ПС), выполняющая функции шлюза при соединении с другими сетями (Интернет, ISDN, коммутируемая сеть общего пользования) и провайдерами услуг (платное телевидение, базы данных, загрузка программного обеспечения, финансовые услуги и т.д.). Центр управления сетью (ЦУС) формирует управляющие сигналы для абонентских станций и совмещен с ПЗС (или соединен с ней каналами связи). Сеть СИТ работает на передачу в многочастотном режиме с временным разделением — каждой станции динамически выделяется группа частот и набор временных ин-
230 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю исз прямого канала UC3 обратного канала Приемная ЗС 2-шлюз ^ Адаптер интерактивной сети Провайдер интерактивных услуг Провайдер вещательной службы ж ЦУС Рис. 9.4. Базовая модель интерактивной спутниковой системы тервалов (так называемых слотов) для передачи своих сообщений. Сообщения передаются в виде пакетов данных длиной 53 байта (режим ATM, основной в системе) или 188 байтов (режим MPEG-2, дополнительный). Точная синхронизация пакетов по времени и частоте осуществляется по принимаемому от ЦУС сигналу NCR (Network Clock Reference ссылка на сетевые часы), полному аналогу знакомых нам SCR и PCR, передаваемому в общем цифровом потоке с определенным PID. Благодаря точной синхронизации пакет каждого СИТ занимает свой слот и не создает помех сигналам других станций. Перед подачей в канал данные подвергаются скремблированию (параметры скремб- лирования взяты из стандарта DVB-S) и помехоустойчивому кодированию. Предусмотрены два режима кодирования — турбокодирование и каскадное соединение кодера Рида-Соломона и кодера сверточного кода с К = 7 При передаче MPEG пакетов блок данных на входе кодера PC составляет 188 байтов, при работе в ATM режиме длина блока может составлять В = (53NATM + N ) байтов, где число ячеек NATM = 1,2 или 4, а AIM p' длина префикса Np может быть равна 0, 2 или 4. Метод модуляции — ФМ-4, формирование импульсов производится с коэффициентом скругления а = 0,35. Выделяемые каждому терминалу слоты могут быть неодинаковыми по полосе частот и длительности, их конфигурацию и положение станция получает от ЦУС по прямому каналу взаимодействия. Весь ресурс сети делится на суперкадры, суперкадры — на
Глава 9. Интерактивные вещательные службы 231 18 15 > ^лг 7 1 8 2 19 16 \ 13 3 9 4 20 17 V14 10 5 11 6 -► Время Рис. 9.5. Разделение кадра на слоты кадры, которые, в свою очередь, подразделяются частота на слоты. На рис. 9.5 в качестве примера показа- Д на последовательность слотов, выделенная одному из терминалов. Информация о выделенных ресурсах поступает в составе служебной информации, которая, как и в других стандартах DVB, оформлена в виде таблиц. Таких таблиц шесть и каждая выполняет свою задачу. Таблица состава суперкадра (SCT Superframe Composition Table) описывает деление ресурса на суперкадры и кадры. Таблица состава кадра (FCT — Frame Composition Table) включает информацию о длительности кадра, общем числе слотов в кадре, времени начала кадра и смещении частоты. Таблица структуры слотов (TSCT Time-Slot Composition Table) содержит параметры каждого слота — символьную скорость, относительную скорость кодирования, преамбулу, содержание полезной нагрузки. Таблица положения спутника (SPT — Satellite Position Table) сообщает данные эфемерид спутников, используемых в сети, что необходимо для регулярного расчета и коррекции Допплеровского сдвига. Таблица сообщений о коррекции (СМТ — Correction Message Table) посылается Центром управления группам станций, входящим в связь, для корректировки времени, частоты и амплитуды посылаемых ими сигналов. Временной план предоставления пакетов терминалу (ТВТР — Terminal Burst Time Plan) адресуется группам станций и отдельным станциям и указывает им выделенные слоты — однократно в момент установления связи или непрерывно в процессе передачи. Все таблицы передаются в секциях транспортного потока MPEG-2. Стандарт не регламентирует конкретные диапазоны частот, скорости передачи и диаметр антенны спутникового терминала. Однако в проекте Технического отчета [9.13], составленного как руководство по использованию данного стандарта, предлагаются в качестве примера четыре номинала скоростей передачи Прием для каналов «абонент — провайдер интерактивных услуг»: 128 кбит/с, 384 кбит/с, 1024 кбит/с и 2048 кбит/с. При минимальном диаметре антенны 0,8 м мощность передатчика для первых двух номиналов при работе с типовыми спутниками диапазона 14/11 ГГц должна составлять соответственно 0,5 и 1 Вт. Для скоростей 1024 и 2048 кбит/с диаметр антенны желательно выбрать не менее 1,2 м, тогда необходимая мощность передатчика составит 1 и 2 Вт соответственно. На рис. 9.6 показана структурная схема спутникового приемо-передающего термина- Передач дача^ 1 Антенная подсистема Трансивер Наружный блок Соединительна^ Блок питания Сетевой интерфейс Интерфейс пользователя Корпус Внутренний блок Рис. 9.6. Структурная схема приемо-передающего терминала
232 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Провайдер интеракти- вных услуг Главная станция ._ Передатчик МШУ 1_ W Мультиплексор Делитель й, Пассивные ответвители Внутренний блок Рис. 9.7. Использование одного СИТ несколькими абонентами через домовую кабельную сеть ла. Соединение между внутренним и наружным блоками осуществляется по высокой промежуточной частоте в диапазоне 1,5 ГГц, при этом функции управления частотой выполняет внутренний блок, а трансивер наружного блока только переносит спектр частот ПЧ в заданный участок СВЧ диапазона. Использование малых спутниковых станций для организации обратных трактов интерактивного телевидения имеет очень хорошие перспективы в регионах России восточнее Урала, где из-за географической удаленности и недостаточно развитой инфраструктуры связи многие населенные пункты не имеют альтернативных возможностей для внедрения интерактивного телевидения. Помешать такому использованию может излишняя усложненность процедуры получения разрешений и регистрации станции в Госсвязьнадзоре. Действующая процедура многоступенчата (более 20 этапов), требует значительных затрат и занимает длительное время. Затраты на регистрацию могут превысить стоимость самой станции в 5-10 раз. Определенным выходом из положения для России могло бы стать совместное использование несколькими абонентами одной спутниковой станции, с которой они соединяются местными соединительными линиями или через домовую кабельную сеть (рис. 9.7). Такие решения также предусмотрены принятым стандартом.
Глава 9. Интерактивные вещательные службы 233 9.3.4. Сети эфирного вещания Для сетей эфирного вещания канал взаимодействия должен быть, разумеется, наземным и связанным с технологией DVB-T. Разработанные Коммерческой секцией DVB Project требования пользователя [9.14] подразумевают, среди прочего, постоянную готовность канала, независимость его от конкурирующих сетей и средств вещания, совместимость со стандартом DVB-T, возможность использования существующих ТВ антенн и т.д. Рассмотренные выше каналы в наземных коммутируемых сетях не удовлетворяют этим требованиям, вследствие чего было решено использовать технологию DVB-T для создания эфирного канала взаимодействия в диапазоне эфирного ТВ вещания. Ввиду сложности технологии, эта разработка началась только в 1999 году и должна была быть завершена к концу 2000 года. Многие детали еще уточняются, поэтому ниже описаны только основные решения, заложенные в проекте стандарта DVB-RCT [9.9, 9.15]. Как и в спутниковой системе, прямой тракт канала взаимодействия интегрирован в вещательный канал, в нем передается информация интерактивного взаимодействия и управляющие сигналы для обратного тракта, который организован на отдельных несущих в полосе частот эфирного вещания. Существующие правила допускают деление неиспользуемых частотных каналов эфирного вещания на полосы по 1 МГц, и эти участки выделяются для организации обратных каналов. Терминал абонента излучает сигнал в сторону передающей ТВ станции через ту же антенну, которая служит для приема ТВ программ. Сигнал может приниматься на станции непосредственно или по сотовой сети вспомогательных ретрансляторов. Обратный тракт описан в проекте стандарта в двух уровнях — физическом и МАС- уровне, или уровне доступа. На физическом уровне для передачи информации используется, как и в спутниковом стандарте, метод комбинированного частотно-временного разделения, при котором каждому абоненту для передачи его информации выделяется частотно-временной слот — группы несущих частот в определенные временные интервалы, задаваемые управляющей программой на базовой станции сети. Для передачи используется тот же метод многочастотной модуляции COFDM, который принят в стандарте DVB-T, но с несколько иными параметрами. По числу несущих различают режимы «Ik» (1024 несущих) и «2к» (2048 несущих), по частотному разносу — три ступени CS1, CS2, CS3 с разносом соответственно ~1 кГц, ~ 2 кГц, « 4 кГц. Формирование несущих осуществляется с помощью фильтрации либо фильтрами Найквиста (при этом спектры несущих не перекрываются и интерференция отсутствует), либо фильтрами с прямоугольной АЧХ (устранение межсимвольных искажений достигается ортого- нализацией несущих и введением защитных интервалов А = 1/4Т). В табл. 9.3 приведены значения параметров сигналов при различных режимах для трех значений полосы канала б, 7 и 8 МГц. Для модуляции отдельных несущих в стандарте могут использоваться ФМ-4, КАМ-16 или КАМ-64. Скремблирование осуществляется по тому же закону, что и в спутниковых стандартах DVB — порождающий многочлен g(x) = 1 + х14 -fx15. Предусматривается помехоустойчивое кодирование двух видов: с использованием турбокодера или каскадного включения кодера Рида-Соломона и кодера сверточного кода, в последнем случае используется код Рида-Соломона (63,55,4) и сверточный код с кодовым ограничением К = 9, относительная скорость кодирования R = 1/2 или 3/4. После кодера, как в традиционной схеме, следует перемежитель битов, в данном случае он работает по псевдослучайному закону на базе генерируемой ПСП.
234 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 9.3 Параметры обратного эфирного канала в разных режимах Число несущих Используемое число несущих CS1 CS2 CS3 Полоса частот канала, МГц Тактовый период, мкс Полезная длительность символа, мкс Защитный интервал, мкс Длительность символа, мкс Разнос несущих, Гц Используемая полоса, МГц Физическая полоса, МГц Полоса частот канала, МГц Тактовый период, мкс Полезная длительность символа, мкс Защитный интервал, мкс Длительность символа, мкс Разнос несущих, Гц Используемая полоса, МГц Физическая полоса, МГц Полоса частот канала, МГц Тактовый период, мкс Полезная длительность символа, мкс Защитный интервал, мкс Длительность символа, мкс Разнос несущих, Гц Используемая полоса, МГц Физическая полоса, МГц 8 N 2048 1712 2.00 0.438 896 224 1,120 1,116 1.911 2.286 4.00 0.219 448 112 560 2,232 3.821 4.571 8.00 0.109 224 56 280 4,464 7.643 9.143 !Гц 1024 856 1.00 0.875 896 224 1,120 1,116 0.955 1.143 2.00 0.438 448 112 560 2,232 1.911 2.286 4.00 0.219 224 56 280 4,464 3.821 4.571 7 МГц 6 МГц I 2048 1712 1.75 0.500 1,024 256 1,280 997 1.672 2.000 3.50 0.250 512 128 640 1,953 3.344 4.000 7.00 0.125 256 64 320 3,906 6.688 8.000 1024 856 0.88 1.000 1,024 256 1,280 997 0.836 1.000 1.75 0.500 512 128 640 1,953 1.672 2.000 3.50 0.250 256 64 320 3,906 3.344 4.000 2048 1712 1.50 0.538 1,195 299 1,493 837 1.433 1.714 3.00 0.292 597 149 747 1,674 2.866 3.429 6.00 0.146 299 75 373 3,348 5.732 6.857 1024 I 856 0.75 | 1.167 1,195 299 1,493 837 0.717 0.857 | 1.50 0.583 | 597 149 747 1,674 1.433 | 1.714 3.00 0.292 299 75 373 3,348 | 2.866 3.429 Передача сигналов каждым терминалом осуществляется в пакетной форме, пакет включает 144 информационных и некоторое число пилотных символов. Предусмотрены три вида структуры пакета BS (Burst Structure). В режиме BS1 каждый пользователь передает информацию на одной несущей ансамбля COFDM, в режиме BS2 — на четырех (этот блок несущих называется подканалом) и в режиме BS3 — на 29 несущих. В последнем режиме формируется либо 29 (для «Ik»), либо 59 (для «2к») подканалов. В зависимости от вида модуляции и параметра R в каждом пакете может передаваться от 18 до 81 байта данных (табл. 9.4). Существенным моментом в концепции стандарта является тот факт, что несущие,
Глава 9. Интерактивные вещательные службы 235 Табл. 9.4 Полезная нагрузка пакетов обратного эфирного канала при разных видах модуляции Вид модуляции Относительная скорость кода Полезная нагрузка в 144 символах, байтов ФМ-2 1/2 18 3/4 27 КАМ-16 1/2 36 3/4 54 КАМ-64 | 1/2 54 3/4 81 используемые разными абонентами, строго синхронизированы по времени и частоте благодаря привязке к управляющим сигналам и, следовательно, могут обрабатываться на приеме методом быстрого преобразования Фурье как один символ COFDM (вместо сложного и дорогого многофазного блока фильтров). Уровень управления в проекте стандарта пока не специфицирован с достаточной степенью завершенности и в этой книге не рассматривается. 9.4. ПРЕДОСТАВЛЕНИЕ ИНТЕРНЕТ-УСЛУГ В ВЕЩАТЕЛЬНЫХ СИСТЕМАХ Появление и быстрое развитие компьютерной сети Интернет в значительной степени стало катализатором внедрения интерактивных услуг в телевидение, в первую очередь, благодаря появлению технологий отображения визуальной информации из Интернета на ТВ экране. Одной из первых такую услугу предложила компания Web TV, в последнее время в Европе определенное распространение получила система DTV Navigator американской компании Liberate Technologies [9.2]. Суть этой системы в следующем. У абонента устанавливается небольшая приставка, преобразующая RGB-изображение в телевизионный формат, и клавиатура с «мышкой», позволяющие осуществлять навигацию в сети. При этом, разумеется, приставка не заменяет компьютер, так как не имеет мощного процессора и средств хранения информации в виде жесткого диска. Емкости оперативной памяти хватает на запоминание лишь нескольких неподвижных изображений. Имеются и другие сложности в отображении мультимедийного контента на телеэкране. Разрешающая способность телевизионного изображения ниже, чем у изображения на экране компьютерного монитора, различна форма пикселей (у монитора они имеют квадратную форму), отличается способ развертки (прогрессивная у монитора и чересстрочная у ТВ приемника), вследствие чего ТВ изображение трудно рассматривать с близкого расстояния и читать на нем надписи мелким шрифтом. Для достижения качественного отображения на телеэкране необходимо было бы изменять структуру сайтов, убирая мелкоструктурные детали и укрупняя надписи, что связано со значительными затратами и не окупается возможными доходами. Свой вклад вносит и быстрое снижение стоимости компьютеров. Этим объясняются сравнительно небольшие масштабы развития услуг «Интернет-ТВ». В более широком плане интеграция цифрового вещания и Интернет-технологий тре-
236 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю бует преодоления существенных различий в трех основных направлениях в транспортных протоколах, в формате самого контента и в отображении его на дисплее. Существующее сегодня положение дел отражено на рис. 9.8. Сближение требует возрастающего перекрытия областей, включающих транспортные протоколы и форматы контента, и установления связей между ними. Например, претендентами на универсальный протокол можно считать HTTP и DSM-CC П-П, удовлетворяющие многим требованиям и цифрового телевидения, и Интернета. Необходим еще большой объем исследований для разработки единых решений. Значительно быстрее развивается другое направление интеграции Интернета и вещательных средств — высокоскоростная передача информации из Интернета по широкополосным цифровым вещательным каналам для последующей загрузки в компьютеры. Особенно интенсивно используются для этой цели каналы в спутниковых вещательных системах, позволяющие организовать быструю доставку информации на большие расстояния с минимальными капитальными затратами. Первоначальная идея спутникового Интернета базировалась на несимметричности трафика — по статистике, для индивидуального абонента трафик запросного канала «Абонент-Сеть» составляет лишь 10-15% от трафика информационного канала «Сеть- Абонент», поэтому посылка запроса по обычным низкоскоростным наземным каналам (телефонная сеть общего пользования, сети передачи данных, ISDN) не занимает много времени, в то время как пересылка больших массивов данных абоненту осуществляется по спутниковой радиолинии со скоростями значительно большими, чем удается достичь в наземных каналах. С учетом статистики присутствия абонента в сети пропускной способности спутникового ствола (38 Мбит/с) достаточно для обслуживания от 5000 до 20 000 индивидуальных абонентов. В настоящее время в крупнейших спутниковых сетях ASTRA и Eutelsat уже более десятка стволов заняты Интернет-трансляцией и их число быстро растет. Успешность функционирования системы спутникового доступа к Интернету в значительной степени определяется пропускной способностью магистральных каналов, которыми провайдер связан с сетями высокого уровня (желательно первого). Уникальные свойства спутниковой связи позволяют «обойти» многоуровневую структуру Интернета и непосредственно соединить сеть местного провайдера с магистралью транснационального провайдера первого уровня. Из действующих в России такие соединения имеют системы Thaicom Protrunk через спутник Thaicom (две магистрали по 45 Мбит/с), Netsat Access Plus через спутник Telstar 12 (две магистрали по 45 Мбит/с) и Loral CyberStar через сеть спутников Telstar 5, 11, 12, Intelsat К, ApStar IIR и др. (магистраль 155 Мбит/с с многократным резервированием) [9.16]. В последнее время в России разворачивается проект «НТВ-Интернет» по предоставлению аналогичных услуг в стволах спутника Eutelsat W4. Сеть имеет выход в Европе Цифровое ТВ MPEG-2/TS, DVB-SI, DSM-CC MPEG-2 видео и звук, субтитры ТВ экран с низким разрешением Транспортный протокол Форматы контента Дисплей WWW-Интернет IP.TCP/UDP, FTP, HTTP Графика (GIF.JPEG.HNG) XML.HTML.CSS.DOM ЕСМА Scrypt.JAVA Дисплей с высоким разрешением Рис. 9.8. Основные различия между миром цифрового телевидения и миром Интернета
Глава 9. Интерактивные вещательные службы 237 на магистраль первого уровня (международный провайдер Cable &Wireless) с пропускной способностью 34 Мбит/с и на российский Интернет со скоростью 100 Мбит/с. Большую пропускную способность до 2 Мбит/с в запросном канале и десятки мегабит в секунду в информационном канале — обещают своим будущим клиентам создатели высокоскоростной системы передачи данных Teledesic, базирующейся на 288 низкоорбитальных спутниках и специально предназначенной для предоставления доступа в Интернет. Однако ряд технических и финансовых трудностей, возникающих при реализации проектов с низколетящими спутниками, заставляет относиться с осторожностью к этим обещаниям. Вторая возможность использования систем цифрового вещания для подключения к Интернету так называемое Интернет-вещание, когда компания-оператор накапливает на своем сервере наиболее ходовую и запрашиваемую информацию с наиболее популярных сайтов и циркулярно передает ее своим абонентам, которые могут просматривать изображения на экранах мониторов или на экранах ТВ приемников, оборудованных Web-приставками. Технически ввод сигналов из IP-сети Интернет в транспортный поток MPEG-2 осуществляется методом многопротокольной инкапсуляции, описанным в главе 7 9.5. ОПЕРАЦИОННЫЕ ИНТЕРАКТИВНЫЕ СИСТЕМЫ ДЛЯ ЦИФРОВЫХ ТЕРМИНАЛОВ Темпы внедрения интерактивных ТВ услуг в значительной степени определяются развитием парка абонентских терминалов, способных воспринимать и интерпретировать соответствующие сообщения и посылать ответные сообщения. На начальных этапах развития каждая новая услуга требовала установки в терминале нового программного обеспечения, не связанного с предыдущим и, следовательно, распоряжавшегося ресурсами терминала не самым экономичным образом. Ситуация напоминала первые годы развития персональных компьютеров, когда в связи с отсутствием эффективных программ-оболочек каждая прикладная программа содержала в себе подпрограммы управления ресурсами компьютера и периферийными устройствами, отображения на экране, интерпретации команд пользователя. И так же, как в компьютерах с появлением оболочек Norton, Unix, Windows, шаг к оптимизации интерактивных терминалов был сделан с появлением интерактивных операционных систем, содержащих некое унифицированное программное ядро, выполняющее общие для всех приложений функции интерпретации команд, и большое число относительно простых приложений. Среди наиболее известных универсальных операционных систем, или платформ, назовем французские Open TV и Media Highway, немецкую Betanova, алгоритмический язык MHEG-5 и его модификацию MHEG-6, продвигавшиеся первоначально голландской компанией Philips. Менее известны специализированные системы SnapTV, HyperTV, ориентированные на предоставление услуг определенного типа — торговли, спортивных трансляций и т.д. Язык MHEG-5 разрабатывался специально для телевизионных интерактивных приложений. С его помощью можно выводить на экран наложенные тексты и графику, он позволяет организовать управление функциями приложения через пользовательский
238 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю интерфейс. MHEG-5 был стандартизован МСЭ и в этом качестве не требовал оплаты авторских прав и патентов, одно время он даже рассматривался DVB как основа европейского стандарта интерактивной платформы, но был отвергнут в силу ряда серьезных недостатков. Он оказался слишком сложным для использования, с тяжелочитаемыми и трудновоспроизводимыми кодами, медленной интерпретацией, ограниченным объемом библиотек, в его арсенале отсутствовали надежные средства отладки и компиляции, не допускалось повторное использование ранее написанных кодов в других приложениях. В настоящее время MHEG-5 принят в качестве рекомендованного стандарта в цифровом эфирном вещании Великобритании и используется небольшими вещательными компаниями в упрощенной системе интерактивного телевидения. Появившийся несколько позднее MHEG-6 отражал общую тенденцию использования универсального и эффективного языка Java и представлял собой гибрид MHEG-5 и Java. Как и большинство гибридов, MHEG-6 соединил в себе не лучшие свойства исходных языков к сложности MHEG-5 добавилась необходимость освоения еще и Java, и было неизвестно, смогут ли отладчики Java работать на смешанном языке, требовалось увеличение объема памяти терминала для хранения библиотек программ обоих языков, к тому же для использования Java требовалось приобретение лицензии от компании Sun Microsystems, разработавшей этот язык. MHEG-6 не нашел пока широкого применения. Интерактивная платформа Open TV одноименной компании использует собственный нестандартизованный алгоритмический язык, написанный на базе широко известного языка С, и, при необходимости, интерпретаторы других языков — HTML, Java. Она предлагает пользователю широкий набор программных приложений — OpenTV Web для входа в Интернет, OpenTV E-mail, ЭПП разных видов, прогноз погоды, телеигры, банковские приложения, телемагазин и т.д. и набор инструментов (вспомогательных программ) для написания собственных приложений. На передающей стороне формирование сигнала и ввод его в транспортный поток осуществляет программа Flowcaster, выполняемая на сервере Sun Solaris. Передающее оборудование OpenTV полностью интегрировано с аппаратурой цифровой компрессии ведущих производителей Thomson, Philips, Tandberg/NDS и др. Поддержание некоторых услуг (PPV, видео по требованию) осуществляется совместно с системой условного доступа. Open TV может интегрироваться с Irdeto, Viaccess и некоторыми другими системами УД. В этой системе в значительной мере устранены недостатки MHEG-5: язык прост в использовании, разработка новых приложений обходится дешевле, чем для MHEG-5, имеется достаточный набор библиотек, лучше используется память в терминале. К основным сложностям использования Open TV можно отнести частный статус компании и, как следствие, коммерческую основу использования ее интерактивной платформы. Необходимо оплачивать лицензию на использование программного обеспечения передающей станции и небольшую дополнительную плату за каждый абонентский терминал, установленный на сети и содержащий оригинальное программное обеспечение Open TV Примерно 25 производителей спутниковых и кабельных терминалов имеют лицензию Open TV и поставляют на рынок изделия с соответствующим программным обеспечением. Несомненным преимуществом рассматриваемой платформы является возможность загрузки «по эфиру» как базового программного обеспечения, так и последующих версий, если при изготовлении терминала в него была установлена специальная программа-загрузчик. Такого рода встроенное программное обеспечение, жестко связанное с аппаратной частью изделия, в английском языке называется middleware.
Глава 9. Интерактивные вещательные службы 239 Система Open TV используется полутора десятками крупных спутниковых и кабельных вещательных сетей в Европе и Азии. Вторая французская интерактивная платформа, Media Highway, была разработана ведущим оператором платного телевидения, разработавшим также систему УД MediaGuard, с которой Media Highway тесно интегрирована. Все сказанное выше о преимуществах и недостатках Open TV в значительной мере применимо и к Media Highway. Обе платформы предлагают примерно одинаковый набор услуг, наиболее широкий в этом классе. Выше мы упоминали о трудностях отображения Интернет-сайтов на телеэкране. Media Highway одной из первых предложила программное обеспечение для Web-сервера, на котором поддерживаются дополнительно - для телевидения, мобильного телефона и пейджера. Из крупных вещателей Media Highway используют сам Canal Plus и первый английский цифровой эфирный канал On Digital. Операционная система Betanova (иногда называемая d-вох по названию применяемого спутникового приемника) разработана немецкой компанией Beta Research и используется в Германии, Австрии и Швейцарии крупными немецкими операторами платного телевидения Premiere World и Deutsche Telecom совместно с системой УД BetaCrypt (разновидностью системы Irdeto). Набор приложений, разработанных для этой платформы, не так широк, как у двух французских компаний. К новинкам можно отнести Java-версию программного обеспечения, облегчающую переход к единой платформе МНР. В самое последнее время появились еще две операционные системы — PowerTV компании Scientific Atlanta и Value@TV компании NDS [9.17]. Scientific Atlanta является одним из пионеров освоения DVB стандарта передачи данных, и PowerTV следующий логичный шаг в том же направлении. Value@TV используется в британском цифровом проекте Sky Digital, она позволяет создавать приложения на языке XML и одновременно конвертировать приложения из Open TV и других платформ. Сюрпризом для многих специалистов стало появление на российском рынке оригинальной разработки компании «Рикор Холдинг» — интерактивной приставки к ТВ приемнику «Телеком Рикор». Приставка выполняет функции домашнего информационного центра, интегрирующего в себе функции управления телевизором, телефоном, аудиови- деоаппаратурой, доступом в Интернет, системой видеонаблюдения, и позволяет: - просмотреть на экране телевизора одновременно до 12 каналов телевизионных передач и выбрать один из каналов для продолжения полноэкранного просмотра; - загрузить из Интернета в электронном виде программу передач по всем каналам на неделю, просмотреть ее, осуществить тематический поиск и поиск по ключевым словам; - используя электронную программу передач, формировать персональные каналы для отдельных членов семьи, напоминать о запланированных программах во время просмотра текущей передачи; - осуществлять запись различных фрагментов телевизионных передач во время их просмотра; - просматривать на экране специально подготовленные интерактивные ТВ передачи, с помощью пульта дистанционного управления (ПДУ), участвовать в передаче, отвечать на вопросы к зрителю, получать дополнительную информацию по ходу сюжета, связываться со студией во время передачи без набора телефонного номера; - оперативно и в удобном виде получать на экране телевизора информацию от «Семейного советника»;
240 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю - неподготовленному зрителю войти в Интернет и просматривать WWW-серверы на экране телевизора с увеличением шрифтов или самого изображения для улучшения качества просмотра, принимать и отправлять электронные сообщения, обмениваться голосовыми сообщениями и фотографиями; - реализовать режим автодозвона и автоответчика для телефона с неограниченной длиной записей, их количества и срока хранения; вести электронную телефонную записную книжку, с помощью которой быстро осуществлять звонок требуемому абоненту; Рис. 9.9. Вид меню интерактивной приставки "Те- - просматривать видео и прослушивать леком" компании "Рикор Холдинг" звукозаписи на CD с помощью встроенного проигрывателя CD-дисков; - прослушивать УКВ радиостанции, настраивая радиоприемник с помощью ТВ экрана и ПДУ; - поручать ему функции секретаря, обычно выполняемые персональным компьютером: планировщик, калькулятор, текстовый редактор; - играть в компьютерные игры; - проводить денежные расчеты по системе электронных платежей; - оплачивать покупки во время участия в интерактивных телепередачах; - отображать на телеэкране обстановку в контролируемой зоне жилого дома (входная дверь, детская, автомобиль под окном); - автоматизировать регулировку климатических параметров жилья, освещения в доме и т.д. На рис. 9.9 показан вид основного меню на экране ТВ приемника. Управление приставкой предельно упрощено и доступно любому телезрителю. По схеме «Телеком Рикор» представляет собой компьютер среднего класса, оснащенный дополнительно беспроводной клавиатурой, ТВ тюнером, видеокартой с ТВ выходом, телефонным модемом. Определенным недостатком устройства можно считать его совместимость только с аналоговым телевидением. Вся необходимая интерактивная информация передается в свободных строках кадрового гасящего импульса и записывается на жесткий диск вне реального времени. Специалисты «Рикор Холдинг» ведут разработку цифрового варианта устройства, способного извлекать необходимую информацию (в том числе и контент Интернета) из транспортного потока MPEG-2.
Глава 9. Интерактивные вещательные службы 241 9.6. СТАНДАРТ МНР. ПЕРСПЕКТИВЫ РАЗВИТИЯ ИНТЕРАКТИВНЫХ СИСТЕМ Рынок интерактивного телевидения сегодня имеет вертикальную структуру каждый провайдер услуг работает со своей интерактивной платформой, системой УД, типами терминалов (рис. 9.10а). Приложения разрабатываются по заказу владельцев определенной платформы и не воспринимаются «чужими» терминалами. Задача скорейшего развития интерактивных услуг требует перехода к горизонтальному рынку (рис. 9.106), где каждая из этих функций имеет хорошо определенные интерфейсы, позволяющие каждому провайдеру контента адресоваться к любому типу терминального оборудования любого производителя мультимедийному компьютеру, интегрированному ТВ приемнику, спутниковому или кабельному терминалу любого класса. Ключевыми элементами такого перехода являются: способность к совместному функционированию отдельных устройств, масштабируемость, способность к модернизации и обновлению программного обеспечения, поддержка различных систем условного доступа, открытость. DVB Project приступил к решению этой задачи в 1997 году и провозгласил ее целью создание МНР — MultiMedia Home Platform (мультимедийной домашней платформы). По замыслу специалистов DVB, МНР должна определять обобщенный интерфейс между интерактивными приложениями и терминалом, на котором они выполняются. Такой универсальный интерфейс даст возможность контенту всех провайдеров адресоваться ко всем типам терминалов цифровым ТВ приемникам, компьютерам, Гп: п: -- 1 .. |Т""Г | | 1 Приложения Программы Условный доступ Сеть и транспортные протоколы а) б) Рис. 9.10. Вертикальная (а) и горизонтальная (б) модели рынка интерактивных услуг цифровым приставкам (digital set top box), «развяжет» приложения разных провайдеров от специфического аппаратного и программного обеспечения терминалов разных производителей, распространит открытые DVB стандарты вещания и интерактивности на все сети передачи спутниковые, кабельные, эфирные, распределительные сети СВЧ (MMDS, LMDS и др.). Более чем 4-летние усилия нескольких рабочих групп завершились принятием в феврале 2000 года 900-страничной спецификации МНР, описывающей первый и второй профили МНР «Улучшенное телевидение» и «Интерактивное телевидение» [9.18]. ETSI одобрил спецификацию в июле 2000 года. Третий профиль «Доступ в Интернет» будет специфицирован несколько позднее. В основу разработки положен уже упоминавшийся выше универсальный язык Java, широко применяющийся в создании мультимедийного контента. Для Java разработаны байткоды — набор команд машинного языка, используемого при компиляции команд высокого уровня. Машина, для которой разработан этот язык, виртуальна, она не существует в явном виде. На разных платформах байткоды преобразуются в реальные операторы. В первую версию МНР входят также спецификации форматов контента (PNG, JPEG, MPEG-2 Audio /Video, субтитры, шрифты), определение платформы DVB-Java
242 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Транспортные >- г* -л~ « протоколы «u"a. 9*. Виртуаг Приложение 1 Приложение 2 Приложение п льная машина Прикладные программные интерфейсы Менеджер приложений Память Процессор Устройство ввода/ вывода трафика MPEG обработка Вещательный Рис. 9.11. Трехуровневая базовая информационная модель МНР с прикладными программными интерфейсами (API), базовая модель графики, транспортные протоколы и т.д. На рис. 9.11 показана трехуровневая структура информационной модели МНР Нижний уровень «Ресурсы» — включает аппаратные средства: память, процессор, устройства ввода/вывода, средства формирования графики и текста. На втором уровне «Системное программное обеспечение» — сосредоточены транспортные протоколы и API, обеспечивающие их взаимодействие с прикладными программами верхнего, третьего уровня, а также виртуальная машина, «развязывающая» стандартизованные программные интерфейсы от специфических особенностей аппаратного и программного обеспечения, свойственных конкретному оборудованию. Иерархия используемых транспортных протоколов показана на рис. 9.12. Это знакомые нам из седьмой главы транспортный поток MPEG-2 и протокол DSM-CC с их компонентами. DVB МНР использует концепцию виртуальной машины, которая обеспечивает общий интерфейс к разным аппаратным и программным реализациям. Она основана на спецификациях языка Java, авторские права на который имеет Sun Microsystems. Специальное соглашение между DVB и Sun Microsystems предусматривает предоставление всем членам DVB лицензии на использование авторских прав на Java «на приемлемой и недискриминационной основе». Структура программного обеспечения DVB-Java показана на рис. 9.13. Оно состоит из нескольких частей (операционная система реального времени, драйверы, встроенное программное обеспечение). Программа- навигатор обеспечивает доступ ко всем службам. Используемые программные интерфейсы могут быть сгруппированы по категориям: 1) API, определяемые Sun (базовые API языка Java, презентационные API); 2) API, опреде- Приложения DVB карусель объектов DSM-CC карусель объектов DSM-CC карусель данных MPEG-2 секции MPEG-2 транспортный поток Приложения TCP UDP IP Конкретные сетевые протоколы Протоколы сети интерактивного взаимодействия Протоколы вещательной сети Рис. 9.12. Обязательные транспортные и сетевые протоколы платформы МНР
Глава 9. Интерактивные вещательные службы 243 Ф X о ц, ^ S О. а. о с I- О. i_ © s * в * а ф 3 х Ф 5 Приложения DVB-J и библиотеки Транспортные протоколы Java API Другие API Виртуальная машина Java Операционная система, драйверы, встроенное программное обеспечение Рис. 9.13. Структура программного обеспечения платформы DVB- Java интерфейс вставок Выход Выход звука видео Л* 1 + Декодер £ ?Г— Демульти- плексор Дескремб- лер Тюнер Т Сеть Графика ^ AAA Взаимодействие с пользователем Управление записью API Управление Приложения Управление УД Управление тюнером ^ Фильтр секций MPEG-2 Служебная информация! А А DSM- СС | Другие ррограм I мы К~ I TCP/IP I I "И Прочие l(noUDP I /IP) .--I Канал взаимодействия Рис. 9.14. Встраивание программного обеспечения МНР в цифровой терминал
244 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Расширения DVB-API |для интерактивности Интерактивный протокол IP Рис. 9.15. Сферы применения и профили МНР ляемые и контролируемые HAVi; 3) API, определяемые DAVIC (УД, настроечные, общая инфраструктура); 4) API, задаваемые DVB (ограничения к Java API, доступ к данным, служебная информация, устройства ввода/вывода, безопасность и т.д.). На рис. 9.14 показано, как программное обеспечение МНР встраивается в цифровой терминал [9.19]. Наглядно видно, что приложения взаимодействуют с элементами функциональной схемы терминала через API. Для поддержки существующих интерактивных систем в программное обеспечение МНР будут вводиться дополнительные сменные программные модули — вставки (pluq- ins), обеспечивающие плавный переход к будущим универсальным API. Такие вставки могут вводиться в программное обеспечение DVB-J (тип А на рис. 9.17) или внедряться непосредственно в системное программное обеспечение терминала (тип В на рис. 9.17), в последнем случае они должны быть привязаны к конкретной платформе. Система вставок позволяет действующим платформам Open TV, Media Highway, Betanova достаточно быстро реализовать базовые принципы МНР в своих системах. Все три компании объявили о своей готовности выпустить первые терминалы, полностью соответствующие уже принятым спецификациям МНР, к лету 2001 года. Оживленно обсуждаются пути перехода на МНР существующих сетей [9.17]. Первый способ, требующий минимальных затрат, предполагает эксплуатацию всех имеющихся абонентских терминалов в прежней системе с постепенным добавлением интерфейсов, преобразующих новые программные приложения МНР в форму, совместимую с действующей платформой. Однако аппаратные ресурсы имеющихся терминалов в большинстве случаев недостаточны для выполнения МНР приложений, что ограничивает возможности их использования. Это, по сути дела, тупиковый путь. Второй, радикальный способ предполагает разовую замену всех терминалов на новые, поддерживающие приложения МНР и содержащие конверторы для приложений частных систем. Наиболее вероятным представляется компромиссный сценарий, в котором предлагается внедрять новые терминалы постепенно и в течение переходного периода обслуживать оба типа приемников-декодеров, транслируя обе версии существующих программных приложений и новые приложения, не поддерживаемые старыми терминалами. Это создаст абонентам стимулы для замены приемного оборудования. Широкий спектр приложений нецелесообразно реализовывать в одной конфигурации МНР, поэтому рассматриваются различные профили в прикладных областях улучшенного телевидения (УТ), интерактивного телевидения (ИТ) и доступа в Интернет (ДИ). В первой версии спецификаций определены профили для двух первых сфер применения. На рис. 9.15 показана зависимость между профилями. В качестве базово-
Глава 9. Интерактивные вещательные службы 245 го принят профиль I в «Улучшенном телевидении» (УТ1), который поддерживает только однонаправленное вещание и местную интерактивность. Профиль 1 в «Интерактивном телевидении» (ИТ1) поддерживает также интерактивность с обратным каналом. Это подразумевает, что имеется необходимое аппаратное и программное обеспечение (например, модем обратного канала). Как показано на рис. 9.15, область ИТ1 включает УТ1. 9.7. IHDN -ДОМАШНИЕ ЦИФРОВЫЕ СЕТИ Разработка спецификации МНР послужила стимулом к созданию документов, регламентирующих построение домашней цифровой сети (IHDN In-Home Digital Network) проводной или беспроводной сети, объединяющей все устройства бытовой электроники в обычном доме и обеспечивающей управление этими устройствами и информационную связь с внешним миром. Цифровая приставка с установленным на ней программным обеспечением МНР могла бы выполнять функции управляющего центра домашней сети. Коммерческая секция DVB сформулировала требования пользователя к домашней сети [9.20]. Они предполагают возможность доступа к любому прибору в любом помещении дома с установлением двунаправленного широкополосного соединения с ним; наращивание сети без перерыва в работе и создания помех; в сети должны поддерживаться стандартные протоколы MPEG-2 ТП, ATM, IP, цифровые потоки со скоростями не менее 50 Мбит/с в дуплексном и 200 Мбит/с в полудуплексном режиме работы и различные интерфейсы, в том числе беспроводные; число приборов в сети может составлять от 2 до 16; установка и обслуживание сети должны быть доступны непрофессиональному пользователю. На рис. 9.16 показана базовая модель домашней цифровой сети [9.21]. Предполагается, что она должна состоять из двух отдельных сетей — домашней сети доступа (HAN Home Access Network) и домашней локальной сети (НШ — Home Local Network), связанных через шлюз. Необходимость разделения сетей связана с тем, что работающие в НШ аудиовизуальные устройства (ТВ приемник, цифровой видеомагнитофон, цифровая видеокамера) склонны требовать максимальных ресурсов пропускной способности и могут занять весь поток внешней сети доступа, препятствуя работе других систем. сел ная л с; (0 о с; няя гпв 2 о Принтер <*** *М Цифровой видеомагнитофон Проигрыватель DVD Цифровая видеокамера >ч I- О О е* Л Н 0) о к к X 3 я 2 о Терминал сетевой интерфейс Приставка Компьютер Сетевой шлюз Рис. 9.16. Базовая модель домашней цифровой сети
246 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Спутниковая Спутниковый "^ приемник/VSAT о. —■ то Л св »- о- О S ^ Ш D к—я ASDL модем £ РЕСТтрансивер Н * Кабельный модем к J* ТВ приемник ерминал Мультимедийный компьютер Домашняя сеть I Домашняя доступа локальная сеть Рис. 9.17. Пример построения домашней цифровой сети Цифровая видео камера Принтер Цифровой видео магнитофон DVD проигрыватель Новым элементом в схеме рис. 9.16 по сравнению с базовой моделью интерактивной системы (рис. 9.2) можно считать широкополосную сеть доступа к коммуникационным сетям, позволяющую абоненту получать в доме широкий спектр услуг связи. В проводном варианте сеть доступа может базироваться на протоколе АТМ25 или Ethernet 100BaseT. Последний в силу доступности интерфейсов и коммутаторов стал де-факто стандартом в недорогих сетях. Дальнейшее увеличение скорости возможно в сети доступа на базе ADSL (Asymmetrical Digital Subscriber Line — асимметричная абонентская цифровая линия) со скоростью передачи до 6 Мбит/с или VDSL (Very high bit rate Digital Subscriber Line — высокоскоростная цифровая абонентская линия) с максимальной скоростью передачи до 52 Мбит/с. Сеть доступа может строиться на основе коаксиальной линии, витой пары и других линий передачи.
Глава 9. Интерактивные вещательные службы 247 Домашняя локальная сеть использует высокоскоростной интерфейс IEEE 1394. Базовая версия этого интерфейса IEEE1394-1995 обеспечивает соединение электронных приборов в группы в пределах комнаты на расстоянии до 4,5 м со скоростью потока до 400 Мбит/с. Для соединения групп в разных комнатах планируется использовать новую разработку IEEE1394 с увеличенным радиусом действия (версии Р1394а и Р1394Ь), когда разработка последнего будет полностью завершена. Новый интерфейс допускает передачу по кабелю группы UTP5 (Unshielded Twisted Pair — неэкранированная витая пара 5-й категории с пропускной способностью 100 Мбит/с) на расстояние до 100 м. Из-за несовместимости базовой и новой версий стандарта в точках стыка сигналов необходимо устанавливать дополнительные трансляторы. Для демонстрации общих принципов на рис. 9.17 показан пример построения сети IHDN с избыточным числом внешних соединений. Каждая внешняя сеть доступа соединяется с одной из трех секций домашней сети доступа — коаксиальной, на обычной витой паре или высокоскоростной, на витой паре 5-й категории. Проводной вариант домашней сети не очень эстетичен и неудобен в использовании, он не обеспечивает подключения переносных приборов, поэтому DVB изучает возможность перехода к беспроводной сети. Предполагается, что переход будет постепенным и промежуточным звеном станут гибридные сети. Для беспроводной сети доступа уже сейчас можно использовать систему DECT (Digital Enhanced Cordless Telecommunications — цифровая улучшенная беспроводная связь), она привлекательна прежде всего для ввода в дом второй телефонной линии (в России аналогичные устройства называют радиоудлинителями). В Европе система DECT работает в диапазоне 1880 — 1900 МГц, в котором организованы 10 несущих с разносом 1,728 МГц, доступ с разделением по времени, скорости доступа от 8 до 64 кбит/с. Для более высоких скоростей доступа предлагается использовать интерфейс IEEE802.11(b) с суммарной скоростью передачи до И Мбит/с, этого достаточно даже для передачи канала вещательного телевидения. При наличии помех в диапазоне 2,4 ГГц, где работает данное соединение, можно перейти в диапазон 5 ГГц и применить версию IEEE802.il(а) со скоростью передачи до 2 Мбит/с. Вопросы построения беспроводной локальной сети находятся в DVB в начальной стадии изучения — сформулированы требования [9.22], идет поиск возможных технических решений Предполагается, что сеть должна быть полностью двунаправленной, совместимой с проводными средствами, недорогой (до 50 долл. США на интерфейс), легко устанавливаемой, должна обеспечивать передачу двух потоков MPEG-2 со средней скоростью 5 Мбит/с (пиковой до 9 Мбит/с), а также скоростного Интернета, интерактивных услуг, телефонии и домовых служб (в совокупности эквивалентно еще одному потоку MPEG- 2), либо цифрового видео со сжатием и пиковой скоростью до 25 Мбит/с. Дальнейшие исследования позволят дать конкретные рекомендации по построению домашней цифровой сети.
=10 — ОЦЕНКА КАЧЕСТВА, ИЗМЕРЕНИЯ И КОНТРОЛЬ ЦИФРОВЫХ ВЕЩАТЕЛЬНЫХ ТВ КАНАЛОВ 10.1. МЕТОДЫ КОНТРОЛЯ И ИЗМЕРЕНИЙ ПАРАМЕТРОВ ЦИФРОВЫХ ТВ КАНАЛОВ 10.1.1. Постановка задачи тестирования цифрового канала Важным аспектом внедрения цифрового ТВ вещания является возможность оценки качества ТВ изображения и измерений параметров цифрового ТВ канала. Оценка качества ТВ изображения может производиться прямыми методами непосредственно оценкой изображения на экране, или косвенными, по качеству ТВ сигнала на выходе испытуемого канала. В зависимости от режима испытаний может использоваться тот или иной тестовый материал. Оценка может производиться как результат наблюдения человека или группы людей или с помощью приборов, фиксирующих ухудшение качества изображения или искажения ТВ сигнала. Испытания могут проводиться как в ходе эксплуатации, на реальном программном материале, так и вне эксплуатации, с помо- Табл. 10.1 Методы и режимы испытаний ТВ систем Метод испытаний Метод субъективных экспертиз (качество изображения) Метод приборной оценки качества изображения (качество изображения) Объективные измерения параметров сигнала (качество сигнала) Вид тестового материала в процессе эксплуатации Программный материал Программный материал Тестовый сигнал в интервале кадрового гашения вне эксплуатации Тестовые кадры или сцены Тестовые кадры или сцены Полномерный тестовый сигнал
250 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю щью специально подобранных тестовых сигналов и сцен. Возможные сочетания различных методов и режимов испытаний показаны в табл. 10.1. В аналоговом телевидении основной источник деградации первичного видеоизображения, полученного от телекамеры или другого источника, — искажения сигнала, вызванные неидеальностью характеристик передающих трактов. За многие десятилетия существования аналоговых стандартов и систем цветного телевидения PAL, SECAM, NTSC сформировались и утвердились простые и наглядные методы объективной оценки качества ТВ канала, основанные на измерении искажений, которые претерпевают при прохождении по каналу специально подобранные испытательные сигналы. Разработаны и утверждены нормативные документы, регулирующие допустимые уровни искажений на различных участках вещательного тракта. Существует строгая связь между искажениями испытательных сигналов и теми или иными искажениями передаваемого изображения. Можно составить представление о параметрах канала по очень^ короткому испыта- тельномусигналу, например, одной испытательной строке в кадровом гасящем импульсе. При переходе к цифровому сигналу оказывается, однако, что стандартные испытательные сигналы малоэффективны при оценке качества работы кодеров сжатия. При оценке по статическим сигналам при ряде методов кодирования качество изображения оказывается высоким практически вне зависимости от скорости цифрового потока эти сигналы слишком просты для кодера сжатия по сравнению с реальным программным материалом, а потому легко компрессируются с малыми искажениями и потерями, не характеризующими работу кодера в целом. В то же время общеизвестно, что разные кодеры отличаются по качественным характеристикам, так что два кодера могут обеспечивать, например, различное качество изображения при одинаковой выходной скорости цифрового потока. Для оценки качества работы кодера требуются прямые измерения с реальными изображениями или тестовыми изображениями более высокой степени сложности, переводящими кодер в «стрессовый», форсированный режим, близкий к пределу его возможностей, где проявляются нелинейные эффекты сжатия. Характер искажений в цифровых системах со сжатием отличается от привычных искажений типа «дифференциального усиления» или «перекоса плоской части импульса частоты строк» и требует новых определений и новых подходов. Системы цифрового сжатия существуют всего несколько лет, и этот срок, конечно, недостаточен для разработки и внедрения в инженерную практику общепринятых и бесспорных методов объективного контроля. Опытный глаз и хорошее ухо остаются пока главным инструментом оценки качества изображения и звука. И все же, как показано далее в этой главе, сделано уже многое в направлении разработки эффективных методов тестирования цифрового канала с компрессией. 10.1.2. Концепция качества обслуживания и ее применение к цифровому вещанию Ввиду отсутствия стандартизованных методов контроля в основу большинства методов и критериев оценки качества компрессированного цифрового ТВ изображения и звукового сопровождения положен непривычный для большинства практических ТВ инженеров принцип: «если система хороша для пользователя, то она хорошая». Этот принцип нашел свое отражение в концепции «качества обслуживания QoS» (Quality of Service) [10.1]. МСЭ определяет качество обслуживания как «совокупный эффект характеристик обслуживания, которые определяют степень удовлетворения пользователя услуг». Пользователь — ключевой элемент этой концепции. ^
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 251 I Линия | передачи [Пользователи Пр пр Ш ювайдер ограммы Ш Другие источники Пользователи Линия передачи Пользователи Обработка программы Ш Ш Другие источники Пользователи Линия передачи Пользователи Рис. 10.1. Компоненты типовой системы цифрового телевидения Цифровая ТВ система может быть описана в терминах четырех главных компонентов: источник программы; средства обработки программы; линии передачи; зритель. Компоненты связаны соответствующими интерфейсами через шлюзы (рис. 10.1). Сквозное QoS будет определено требованиями всех пользователей на разных участках системы. Итоговый перечень технических требований может быть достаточно внушительным. Например, для телефонии он достигает 350 наименований. Для цифрового телевидения полный перечень параметров пока не утвержден. Все параметры можно разделить на две группы — требующие измерений или связанные с мониторингом (наблюдением) изображения и звука. Измерение дает наиболее точную и адекватную оценку параметра, но может потребовать более сложного оборудования. Точные измерения важны на таких этапах, как разработка, изготовление, выбор Сигнал PAL, SECAM, SDI, SDTI MPEG-2/DVB, ASI, SPI, SSI, SDTI, SDI От источника Программа Цифровое сжатие и форматирование цифрового потока Внутри комплекса Высокоскоростной сигнал данных ATM, PDH.SDH или радиочастотный сигнал ФМ-4.0БП-8, КАМ-16/64 Цифровой поток Канальное кодирование и модуляция На выходе Связной сигнал Функция тестирования Качество видео (качество сигнала и качество изображения) Протокол (некомпрессированное видео,компрессированные данные, ошибки) Анализ канала связи Рис. 10.2. Уровни тестирования в комплексе производства программ
252 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю оборудования, приемочные испытания, ввод системы в действие. Мониторинг используется для поддержания QoS в процессе эксплуатации. Он требует непрерывной оценки в реальном времени ограниченного набора параметров, часто с меньшей точностью. В качестве параметров QoS для мониторинга могут использоваться качество сигнала (косвенный параметр), качество изображения, наличие дефектов на изображении и др. В комплексе производства программ можно выделить три уровня тестирования, как показано на рис. 10.2: 1) уровень видеосигнала; 2) уровень протокольного стыка компрессированного сигнала; 3) физический интерфейс с системой передачи. На первом уровне по прямым или косвенным признакам оценивается качество изображения, здесь имеют дело с композитным или компонентным сигналом стандартного качества или сигналом ТВЧ. На втором уровне рассматриваются форматирование транспортного потока и преобразование его для подачи в канал связи, на третьем — физическое соединение с каналом передачи. Передача аналоговых и несжатых цифровых видеоизображений может оцениваться традиционными методами оценки испытательных сигналов. В нелинейных системах, к которым относится и система цифрового сжатия, должно оцениваться непосредственно качество изображения. Понятно, что под «качеством изображения» понимается его ухудшение по сравнению с исходным, а не присущее изображению как результату творческого процесса некоторое содержание. Для каждого пользователя наивысшим приоритетом будут обладать те параметры QoS, которые соответствуют его части системы. Поставщик программы наиболее заинтересован в качестве видео на уровне видеочастоты, оператор связи будет заботиться об уменьшении числа ошибок в канале связи, однако качество изображения является конечным продуктом всей цепочки и важно для всех пользователей. 10.2. ИЗМЕРЕНИЕ КАЧЕСТВА ИЗОБРАЖЕНИЯ В ТВ КАНАЛАХ С КОМПРЕССИЕЙ 10.2.1. Искажения и дефекты изображения после компрессии-декомпрессии Говоря о достоинствах цифрового телевидения, мы отмечали отсутствие ряда неприятных дефектов на изображении, свойственных аналоговому телевидению. В то же время специфика обработки видеоданных в кодерах цифрового сжатия приводит к появлению других дефектов, отсутствовавших в исходном изображении. Для MPEG трудны сюжеты с мелкими статическими деталями и сложным движением в других частях изображения, с участками шума, с вращением и изменением масштаба, наплывами, полупрозрачными объектами. Ниже перечислены некоторые наиболее известные дефекты [10.2, 10.3]. Заметность шумов квантования. Эти шумы, присутствующие и в системах полноскоростного цифрового телевидения, становятся особенно заметными в системах со сжатием. Потеря разрешающей способности — обусловлена устранением избыточности в первую очередь в высокочастотной части спектра пространственных частот. Кодер работает на пределе средней остроты зрения человека и может иногда заходить за этот предел при нехватке битов. Мелкие детали либо размываются, либо полностью пропадают в изображении.
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 253 Блочность (blockiness) структура типа шахматной доски. Если кодеру недостает битов, становится видимой структура блоков ДКП. Особенно заметно это явление на одноцветных гладких или мозаичных поверхностях. Причина его в неидентичности отработки яркости пикселов по обе стороны границы блоков, что воспринимается глазом как перепад яркости от одного блока к другому. Блочность особенно заметна, если глаз следит за движущимся объектом. Эффект мозаики — выглядит подобно блочности, но воспринимается как различие яркости в поле соседних блоков, а не на границе. Возникает при слишком грубом квантовании коэффициентов ДКП, когда постоянные составляющие пространственных частот в соседних блоках заметно отличаются. Шумы типа «москито» характерны для всех систем с ДКП и квантованием и проявляются на резких границах (например, надписях). При преобразовании из временной в частотную область влияние перепада отсчетов на границе распространяется на весь макроблок, при этом ВЧ коэффициенты квантуются более грубо, чем НЧ коэффициенты. При обратном преобразовании в отсчеты и далее в аналоговый сигнал вдоль первоначальной границы образуется характерный узор. Окантовка на границах проявляется как возникновение окантовок на резких перепадах яркости изображения. При нехватке битов в первую очередь обрезаются ВЧ коэффициенты, и это может повлиять на форму сигнала яркости вблизи ступеньки — вызвать колебательный процесс на вершине импульса. Размытие цветов — имеет такую же причину, что и эффект окантовки на границах, но проявляется на участках изображения с резкими скачками в сигнале цветности. Артефакты, связанные с движением, такие, как подергивание (jerkiness) или неправильное расположение блока пикселов, могут появляться в системе, использующей усложненный алгоритм компенсации движения или просто пропускающей кадры из-за нехватки битов. Ложные границы — если при компенсации движения в опорном кадре заметна блочность, она может переноситься в новый кадр со смещением относительно границ блока (из-за неточности компенсации), появятся ложные границы. Эффект «грязного окна» появляется как полоски или шумы, которые остаются неподвижными, в то время как объект движется за ними (как будто рассматриваешь сцену через грязное окно). Обычно является следствием недостатка битов для кодирования межкадровых разностей. Неправильный цвет макроблока отличающийся от исходного и от соседних макроблоков. Причиной может быть тот факт, что сопряжение блоков ведется только по сигналу яркости. Опорный блок при высокой корреляции по сигналу яркости может иметь совсем другой цвет, и это отражается на цвете предсказанного блока. Волнообразные шумы видны при медленном панорамировании по очень детализированной сцене, например, по пятну толпы на спортивном событии. Как и москито, это результат грубого квантования ВЧ коэффициентов, но движение вызывает рассеяние, и они появляются периодически как детали, движущиеся по блоку ДКП. Эффект «привидения» в зависимости от скорости объектов, участвующих в движении, и алгоритма поиска пропущенных макроблоков за движущимися объектами возможно образование следов («привидений»), которые могут сохраняться достаточно долго.
254 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 10.2.2. Оценка качества изображения методом субъективных экспертиз, ее преимущества и недостатки Конечной целью ТВ вещания является удовлетворение запросов телезрителей, поэтому приоритет в оценке качества отдается субъективной оценке. Даже в хорошо отлаженном мире аналогового телевидения субъективные испытания обязательно проводятся для оценки новых или усовершенствованных систем. В цифровом телевидении с компрессией роль субъективных методов возрастает. Разумеется, для адекватной оценки качества недостаточно мнения одного человека о просмотренном материале. Разные люди имеют разное представление о качестве, оно зависит также от сюжета. Разные виды ухудшений воспринимаются тоже по-разному — «рассыпание» цифрового изображения игнорировать труднее, чем шумы на аналоговом изображении. Субъективная оценка должна принять во внимание тип программного материала, степень заметности ухудшений. Для изображения с цифровой компрессией, в отличие от обычного аналогового, недостаточно понаблюдать короткий отрезок сюжета и сделать вывод о всей программе, необходимо просмотреть сюжет полностью. Субъективные экспертизы качества ТВ изображения уже много лет проводятся по методикам Рекомендации МСЭ-Р ВТ.500 [10.4]. В ходе испытаний некоторые эталонные изображения оцениваются в баллах группой экспертов, принимающих решение о степени пригодности для данного применения. Методики нормируют виды тестовых изображений, условия тестирования, шкалу оценок и т.п. В группе должно быть не менее 15 экспертов, сеанс показа должен продолжаться не более 30 мин. Если тестирование проводится для оценки качества системы при оптимальных условиях, используется 5-балльная шкала оценки качества, для оценки ухудшений при неоптимальных условиях применяется шкала ухудшений. Обе шкалы приведены в табл. 10.2. В Рекомендации ВТ.500 детально описаны несколько методов субъективных испытаний, некоторые перечислены ниже: 1) двухстимульный метод с использованием шкалы ухудшений наблюдателю показывают пары кадров, эталонный и ухудшенный, и просят оценить ухудшение по шкале табл. 10.2; 2) двухстимульный метод с непрерывной шкалой качества — предъявляют пары кадров и просят оценить каждый по абсолютной шкале, от «отлично» до «очень плохо»; во внимание принимается разница в оценке пар; 3) одностимульный метод прямого сравнения предъявляется большое число кадров без эталона и сравнивается их качество с использованием шкалы отношений; 4) одностимульная непрерывная оценка качества — демонстрируются не кадры, а программа, которую наблюдатели оценивают каждые несколько секунд. Этот метод подходит для оценки систем компрессии, где важно длительное наблюдение испытательного изображения. Табл. 10.2 Шкалы Рекомендации ВТ.500 для оценки субъективного качества ТВ изображения Баллы 5 4 3 2 1 Оценка качества отлично хорошо удовлетворительно плохо очень плохо ухудшения незаметно заметно, но не мешает слегка мешает мешает сильно мешает
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 255 По результатам испытаний проводится статистическая обработка полученных измерений, причем используются оптимальные стандартизованные алгоритмы. Масштабы экспертизы, в зависимости от поставленной задачи, могут варьироваться от единичных испытаний, проводимых группой из нескольких человек, до широкомасштабных полевых испытаний, проводимых многими сотнями экспертов в течение многих месяцев (например, испытания систем ТВЧ в США в 1994-1996 годах). С появлением цифровой компрессии возникли и новые виды искажений, изменились требования к условиям проведения испытаний: условия просмотра, источники сигнала, выбор сцен, время представления сцен, методы анализа оценок. В частности, появилась возможность использовать в качестве базового изображения для сравнения с испытуемым так называемое D-изображение — блочную структуру изображения после компрессии-декомпрессии, в которой значения всех отсчетов внутри блока заменены постоянной составляющей. Оказалось, что D-изображение практически независимо от сюжета и условий наблюдения занимает довольно стабильное положение на шкале качества МСЭ-Р (в области «очень плохо»). Если теперь определить шаг изменения качества изображения, можно получить хорошую шкалу с устойчивым нулем. В [10.5] предложено считать единичным шагом шкалы изменение качества, которое отмечают 75% наблюдателей. К преимуществам оценки методом субъективных экспертиз можно отнести следующие факторы: удается получить сравнимые результаты для обычных систем и систем с компрессией; получаемая средняя оценка мнений хорошо работает в широком диапазоне неподвижных и движущихся изображений. Слабым местом этих методов следует признать необходимость рассматривать широкий набор методов и тестовых элементов, значительные затраты средств и времени на подготовку наблюдателей и оборудования, трудоемкость организации и проведения тестирования. Субъективные испытания в их нынешнем виде применимы только для целей разработки и едва ли могут быть рекомендованы для текущего мониторинга, тестирования производственных линий, поиска неисправностей, повторяющихся измерений для оценки качества изготовленной продукции. 10.2.3. Оценка качества изображения после декомпрессии методом объективных измерений Для приборной оценки качества изображения на выходе цифрового ТВ канала с компрессией необходимо оценить качество обработки сигнала на передающей и приемной стороне (фильтрация, аналого-цифровое преобразование, алгоритмы устранения избыточности, обратные операции на приеме). Канал передачи может вносить искажения типа импульсной помехи, но чаще сигнал или передается, или не передается. Единственным критерием качества его работы можно считать достоверность передачи. Поиски объективных методов сосредоточились на двух направлениях: 1) поиск цифровых испытательных сигналов, по результатам прохождения которых через цифровой ТВ тракт можно было бы достоверно судить о качественных показателях тракта на любом реальном изображении; 2) разработка методов непосредственной оценки качества изображения с учетом природы зрительного восприятия человека. Первое направление развивает группа британских компаний во главе с Snell&Wilcox в проекте ТСМ (Test card 'NT — испытательная таблица «М»). Таблица содержит набор
256 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю специально разработанных цифровых потоков изменяющейся сложности со строго определенными параметрами. Каждый поток включает один или несколько потоков сжатого видео, звука, дополнительных данных. С их помощью можно протестировать устройства обработки компрессированных сигналов (например, ремультиплексор) и приемники-декодеры. Качество работы компрессирующих устройств ТСМ не проверяет. Все виды тестовых потоков разбиты на 4 категории: видео (VID), аудио (AUD), данные (DAT), мультиплексирование (MUX). В каждой категории есть разделы по видам испытаний. В зависимости от степени сложности потока для обработки используются 4 уровня стресса: а — низкий; b — средний; с — высокий; х — недопустимый. Набор тестовых потоков в категории VID охватывает основные группы характеристик ТВ изображения, такие, как передача цветности, линейность, перемежение, двумерная частотная характеристика и другие. Основное отличие предлагаемых испытательных сигналов от традиционных, статических это подвижные изображения, они содержат плавно движущиеся элементы, не прерывающиеся на границах цикла, что позволяет выявить такие дефекты декодирования, как рассыпание кадра, «замораживание», повтор кадров и т.д. Потоки VID в разделе (а) записаны в формате ML@MP, они имеют длительность 3 с и содержат подвижное изображение с различными скоростями передачи и разрешающей способностью — от 14 Мбит/с с I-кадрами и полным разрешением до 2 Мбит/с с разрешением 360 х 576 пике. Каждый поток видео сопровождается тремя звуковыми потоками, позволяющими определить положение левого и правого каналов и синхронизацию видео-аудио. На рис. 10.3 в качестве примера показано одно из изображений ТСМ категории VIDa. Оно содержит как бы несколько уровней, по которым оценивается функционирование испытуемого устройства. Общая конфигурация и размеры изображения, как и в аналоговой испытательной таблице, позволяют оценить правильность воспроизведения формата, а отдельные сегменты содержат специальные подвижные изображения для проверки тех или иных функций декодера. Подробное описание методик пользования программой содержится в сопроводительной документации к ней. Раздел (с) категории VID содержит потоки с разными форматами кадра и изображения, позволяющие проверить отображение на выходе декодера всех возможных сочетаний форматов. В категории MUX предлагаются многопрограммные потоки со скоростью 38 и 24 Мбит/с для проверки функционирования демультиплексера соответственно спутниковых и эфирных цифровых терминалов. Характеристики звуковых декодеров проверяются в категории AUD, здесь есть потоки с различными частотами дискретизации и разной техникой кодирования. Категория DAT охватывает все аспекты передачи данных, включая таблицы PSI/SI и субтитры, проверяются также все режимы передачи данных в DVB, описанные в седьмой главе. Испытательные потоки ТСМ могут использоваться как в процессе эксплуатации, Рис. 10.3. Изображение ТСМ категории VID
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 257 когда нужные потоки передаются в составе вещательного мультиплекса, так и вне эксплуатации, для отладочного тестирования, в этом случае ТСМ генератор формирует полный цифровой поток. Физическим носителем записи испытательных потоков тест- таблицы «М» является диск CD-ROM. Его можно загружать и проигрывать на аппаратуре многих ведущих фирм: Adherent, Tektronix, Snell&Wilcox и др. Иной подход при разработке испытательных таблиц применили отечественные специалисты из Научно-исследовательского института радио [10.2]. Они предложили таблицы для испытания комбинированных аналого-цифровых трактов, содержащие элементы для проверки как цифровых устройств, включая АЦП, кодеры сжатия, ЦАП, так и обычных аналоговых трактов. К примеру, испытательная последовательность SEC AM содержит 12 различных кадров с разрешением 720 х 576 пикселов, повторяющихся с частотой 25 Гц. Каждый кадр состоит из прямоугольника, обрамленного рамкой, внутри которой изображение разбито на прямоугольные и круглые участки, содержащие различные элементы для анализа цифровых и аналоговых искажений. При последовательной передаче кадров возникает эффект движения, что необходимо для загрузки цифрового кодера. Изображение одного кадра испытательной таблицы SECAM приведено на рис. 10.4. Для проверки работы цифрового кодера сжатия в таблице используются следующие элементы: - области с плавными градациями яркости (так называемые «волны»), движущиеся в разных направлениях и с разными скоростями. Скорости движения волн имеют различные, строго определенные значения в разных частях таблицы. Волны содержат низкочастотные компоненты пространственных частот и служат для оценки блочности и связанных с ней вторичных искажений (эффект мозаики, ложные границы). Волны в четырех квадратах внутри вращающихся колец по углам таблицы позволяют определить качество и точность компенсации движения; - области с резкими границами — вращающиеся кольца в углах таблицы, черные и белые кресты, движущиеся кружки в нижней части таблицы и др. — позволяют оценить возможные искажения типа окантовок, ступенек, размытых изображений (потери разрешающей способности); - три цветных вращающихся кольца в левом верхнем, левом нижнем и правом нижнем углах таблицы отличаются тем, что яркость всех пикселов постоянна, меняется только цветность. Если алгоритм сопряжения макроблоков в кодере построен на анализе только яркостной компоненты, на этих кольцах возможно появление цветовых искажений в виде размытия цвета, неправильных цветов макроблоков, эффекта «привидения». Второе направление в объективной оценке качества представляют анализаторы качества изображения MVA-200 и Mosalina фирмы Snell&Wilcox и PQA-200 фирмы Tektronix. MVA-200 представляет собой многофункциональный анализатор транспортного потока, способный не только показывать в реальном времени структуру потока с анализом всех таблиц, значений PID и точности прихода PCR, но и анализировать процесс кодирования элементарных потоков на всех уровнях, начиная с видеопоследовательности и до макроблока и даже блока ДКП. При этом анализатор показывает, на каких участках изображения кодер принимает то или иное решение. Режимы кодера отображаются поверх нормального изображения в виде цветных меток. При анализе управления скоростью потока на левом краю изображения видны горизонтальные белые полоски, отображающие выбор шкалы квантования для данного слайса. В режиме анализа
258 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю компенсации движения наложенные метки показывают направление и длину вектора перемещения каждого макроблока. Можно дополнительно наложить цветные метки, указывающие на используемый тип компенсации движения (вперед, назад, двунаправленно). Наиболее интересной особенностью MVA-200 является разработанная компанией Snell&Wilcox технология PAR (Picture Appraisal Rating — оценка изображения), позволяющая измерить численно ухудшение изображения, вносимое MPEG-компрессией. Важно, что эта технология нечувствительна к обычным дефектам изображения, таким, как шумы, зернистость кинопленки, помехи композитного декодирования, и учитывает только искажения, вносимые кодером сжатия. Результаты анализа могут быть выделены в виде отчета, показывающего, в какие моменты времени оценка падала ниже заданного уровня. Эта же технология PAR используется в значительно более доступном приборе фирмы Snell&Wilcox под названием Mosalina. Это даже не прибор, а программное обеспечение, которое может работать под управлением Windows на любом современном компьютере и осуществлять анализ и оценку компрессированного видеоматериала вне реального масштаба времени. Как и у анализатора MVA-200, эта оценка учитывает только дефекты компрессии и позволяет объективно оценить качество работы кодеров сжатия. По-иному подходит к проблеме объективных измерений компания Tektronix. Ее специалисты считают [10.6], что для исключения влияния содержания программы на результат следует при объективных измерениях, как и при субъективных оценках, не измерить качество изображения непосредственно, а показать, как ухудшилось изображение или сцена по сравнению с эталоном. В результате анализа отобраны два метода объективного измерения качества изображения: 1) сравнение фильтрованных эталонного и испытуемого изображений; 2) извлечение особенностей из обоих изображений и сравнение по особенностям. Первый метод наиболее точный, он использует матричный алгоритм для обработки каждого изображения или последовательности в фильтрованное изображение, похожее на исходное, но с меньшим объемом информации. Фильтрованное изображение эталона и испытуемого кадра или сцены сравниваются по пикселам, и по специальному алгоритму вычисляется оценка. Второй метод использует математический расчет для извлечения особенностей (features) одиночного изображения (пространственные особенности) или последовательности изображений (временные особенности). Объем получаемой информации не превышает нескольких сотен байтов на изображение. Эту информацию нетрудно передать вместе с компрессированным сигналом к удаленному месту испытаний, где она будет использована для сравнения с аналогичными особенностями изображения на выходе канала. Исследования показали, что первый метод дает лучшую корреляцию с результатами субъективных испытаний. Метод измерения без сигнала от источника считается пригодным только для мониторинга и обнаружения артефактов компрессии, но не для численной оценки качества изображения. Разработанный по первому алгоритму анализатор качества изображения PQA-200 работает в режиме со сравнением изображений и предлагается как реальная замена субъективных методов оценки с помощью экспертов. Прибор содержит генератор эта-
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 259 лонного тестового материала и анализатор. В процессе измерений двухсекундный отрезок тестовой видеопоследовательности пропускается через испытуемый кодер сжатия, записывается в память и анализируется с помощью быстродействующего процессора путем сравнения с оригиналом. Результат выдается в виде числа, называемого оценкой качества изображения (PQR — Picture Quality Rating). В качестве критерия оценки используется восприятие изображения человеком, основанное на модели человеческого зрения, разработанной корпорацией Sarnoff. В процессе обработки модель сравнивает наборы отсчетов сигнала яркости Y для испытуемого и эталонного сигналов и такие же наборы для двух цветоразностных сигналов CR и Св. Перед сравнением испытуемый сигнал проходит нормализацию, которая устраняет различия, вызванные систематическими погрешностями, независящими от времени (горизонтальные и вертикальные смещения изображения, различия усиления яркости и цветности, временные сдвиги компонент и т.д.). Результаты сравнения появляются на выходе устройства в виде полей оценок PQR для каждого участка изображения с учетом маскирования восприятия цветности сигналов яркости. Интегральная оценка получается усреднением оценок для яркости и цветности. Оценка 5 баллов по Рекомендации ВТ.500 (нет ухудшений) дает PQR = 3...5 по шкале PQA-200, 1 балл по Рекомендации ВТ.500 соответствует PQR = 15...20. По результатам специального сравнительного исследования, проведенного фирмой Tektronix и Мюнхенским институтом радиотехники [10.6], оценки, данные PQA-200, весьма близки к оценкам, полученным для тех же сюжетов в результате субъективных тестовых испытаний. Коэффициент корреляции достигает 0,9. 10.3. ТЕСТИРОВАНИЕ ТВ КАНАЛА С КОМПРЕССИЕЙ НА УРОВНЕ ТРАНСПОРТНОГО ПОТОКА 10.3.1. Контроль и анализ транспортного потока в процессе передачи Оперативный контроль цифрового потока осуществляется в режиме реального времени и должен подтверждать, что транспортный поток удовлетворяет действующим нормативным документам. В частности, должны присутствовать правильно закодированные данные PSI и SI, которые позволяют идентифицировать отдельные составляющие транспортного потока. Во избежание срыва синхронизации дрожание временных меток не должно выходить за определенные пределы. Используемые кодером профили не должны выходить за пределы списка профилей, возможного для декодеров, применяемых в данной конкретной системе. Для облегчения мониторинга Технический отчет ETR290 DVB Project (Руководство по измерениям для DVB систем) [10.7] подразделяет все подлежащие контролю параметры транспортного потока на три группы по приоритетности. К приоритету первого, высшего уровня отнесены параметры, необходимые для декодирования потока, — потеря синхронизации, ошибки синхробайта, ошибки PAT и т.п. Приоритет второго уровня составляют параметры, важные для обеспечения устойчивой работы системы в целом, которые рекомендуются отслеживать непрерывно. И, наконец, к приоритету третьего уровня отнесены параметры, представляющие интерес для отдельных приложений. В
260 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю настоящее время DVB готовит новую версию Отчета [10.8], в которой переопределяются некоторые подлежащие контролю параметры. В табл. 10.3-10.5 приведен предлагаемый в [10.8] перечень параметров и указаны возможные ошибки потока. Ниже даны некоторые комментарии к таблицам. TSjsync_loss. Захват цепи синхронизации важнейшая функция в оценке состояния ТП, только после достижения синхронизации возможно оценивать все остальные параметры потока. Захват зависит от числа правильно принятых последовательных синхробайтов. Считается, что пять корректных синхробайтов достаточно для установления синхронизации, а два последовательных поврежденных синхробайта свидетельствуют о потере синхронизации. Syncjbytejerror. Индикатор ошибки синхробайта устанавливается в «1», если корректный синхробайт 0x47 не появляется после каждых 188 или 204 байтов. Это важный параметр, так как синхробайт используется для синхронизации кодера и декодера. PATjerror Новая редакция п. 1.3 изложена с учетом того, что PAT может состоять из нескольких последовательных секций с тем же table_id 0x00. Continuityjcount_error В этом индикаторе объединены сразу три проверки. Потеря пакетов характерна для сетей ATM, повторение пакетов свидетельствует о глубоких нарушениях в аппаратуре сжатия. PMTerror. Как и для PAT, редакция изменена с учетом последовательных секций. PID_error Для большинства PID установленный период не должен превышать 5 с, хотя пользователь может установить и другие значения для каждого PID. PCR error В новой редакции п. 2.3 разбит на два. В DVB рекомендуется, чтобы Табл.10.3 Параметры контроля транспортного потока первого уровня приоритета № п/п 1.1 1.2 1.3 1.4 1.5 i 1-6 Параметр Потеря синхронизации Потеря синхро-байта Ошибка PAT Ошибка непрерывности счета Ошибка РМТ Ошибка PID Индикатор TS_sync_loss Syn_byte_error PAT_error Continuity_count_ error PMT_error PID _error Проявление ошибки Потеря синхронизации (с учетом параметров гистерезиса) Синхробайт не равен 0 х 47 Секции с tablejd 0x00 не появляются по меньшей мере каждые 0,5 с под РЮ 0x0000; Секции с tablejd 0x00 не равным 0x00 обнаружены под PID 0x0000; Scrambling control field не равен 00 для PID 0x0000 Неверный порядок пакетов; пакет появляется более чем дважды; потеря пакетов Секции с tablejd 0x02 не появляются по меньшей мере каждые 0,5 с в каждом program_map_PID, указанном в PAT; crambling_controlJield не равен 00 для всех пакетов, содержащих информацию о секциях с tablejd 0x02 в каждом program_map_PID, указанном в PAT Указанный PID не появляется в определенный пользователем период
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 261 Табл. 10.4 Параметры контроля транспортного потока второго уровня приоритета № п/п 2.1 2.2 2.3а 2.36 2.4 2.5 2.6 Параметр Ошибка транспортного потока Ошибка котрольных сумм Ошибка повторения PCR Ошибка непрерывности PCR Ошибка точности PCR Ошибка PTS Ошибка CAT Индикатор Transport_error CRC_error PCR_repetition_error PCRjdiscontin- uityJndicator_ error PCR_accuracy_ error PTS_error CAT_error Проявление ошибки Transport_error_indicator в заголовке ТП установлен на «1» Ошибка CRC появилась в CAT, PAT, PMT, NIT, EIT, I ВАТ, SDT или ТОТ Интервал времени между двумя последовательными метками PCR более 40 мс | Разница между двумя последовательными значениями PCR вне диапазона 0...100 мс без установки discontinuity_indicator_set | Точность PCR выбранной программы вне пределов ±500 не | Период повторения PTS более 700 мс | Присутствуют пакеты с ненулевым transport_scrambling_control, но отсутствуют секции с tableJd 0x01 (CAT) В пакетах с PID 0x0001 найдены секции с tablejd, отличным от 0x01 период повторения PCR не превышал 40 мс, иначе наступает заметное дрожание или дрейф тактовой частоты и декодер даже может выйти из синхронизма. Фиксируется также нарушение непрерывности временных меток более чем на 100 мс без предварительного сообщения установкой индикатора непрерывности. PCR_accuracy_error. Считается, что точность PCR в пределах ± 500 не достаточна для синтеза частоты цветовой поднесущей в композитном сигнале (для PAL, по-видимому, это значение более критично, чем для SECAM). На рис. 10.5 показаны для сравнения гистограммы временного дрожания PCR двух транспортных потоков: с малым дрожанием (100... 150 не) и значительным дрожанием, близким к предельному. Понятно, что устойчивость приема первого потока значительно выше, чем второго. PTSjerror Данный параметр доступен, если транспортный поток не скремблирован. CATjerror. Этот индикатор указывает на возможность для приемника найти EMM, связанные с данной системой УД. NITjerror. Пункт 3.1 разбивается на два: один — относящийся к обязательной таблице NIT текущего ТП и второй к таблицам других потоков, которые могут отсутствовать. То же относится и к п. 3.5 (SDT_error). EIT_error. Пункт 3.6 разбивается на три с учетом того, что из четырех групп таблиц EIT (текущий и другие потоки, события текущее/следующее и планируемые) только одна является обязательной. В дополнение к перечисленным в таблицах предлагается еще одна, комплексная проверка все обязательные дескрипторы должны присутствовать в SI таблицах, и информация в таблицах не должна быть противоречивой. В новой версии Отчета вводятся дополнительные испытания, в первую очередь из-
262 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл. 10.5 Параметры контроля транспортного потока третьего уровня приоритета № п/п 3.1а 3.16 3.2 3.3 3.4 3.5а 3.5 3.6а Параметр Ошибка NIT данного потока Ошибка NIT других потоков Ошибка повторения SI Ошибка буфера Неупомянутый PID Ошибка SDT данного потока Ошибка SDT других потоков Ошибка EIT данного потока Индикатор NIT_actual_ error NIT_other_ error SI_repetition_ error buffer_error Unreferenced PID SDT_actual_ error SDT_other_ error EIT_actual_ error Проявление ошибки В пакетах с PID 0x0010 найдены секции с tablejd, отличающимся от 0x40, 0x41 и 0x72 ( т.е. NIT и ST); Отсутствуют секции с tablejd 0x40 под PID 0x0010 более 10 с; Любые две секции с tablejd 0x40 появляются под PID 0x0010 в установленный период времени (25 мс и менее) | Интервал времени между секциями с одинаковым номером и tablejd = 0x41 в пакетах с PID 0x0010 превышает установленное значение (10 с и более) | Частота повторения SI таблиц вне указанных пределов ТВ_ buffering _error — переполнение транспортного буфера; TBsys_ buffering _error — переполнение транс-портного буфера для системной информации; МВ_ buffering _error — переполнение буфера мультиплексора (или опустошение буфера мультиплексора, если используется метод vbv_delay); ЕВ _ buffering _error— переполнение буфера ЭП, или опустошение буфера ЭП при использовании метода vbv_delay или метода утечки (leak) с low_ delayjlag и DSM_trick_mode_flag установленными на 0; В_ buffering _error —переполнение или опустошение основного буфера; Bsys_ buffering _error— переполнение входного PSI буфера | PID (кроме относящихся к РМТ, PID с номерами от 0x00 до 0x1 F или определенных пользователем как потоки данных), не упомянутые в РМТ или CAT в течение 0,5 с | Секции с tablejd 0x42 (SDT), отсутствующие в пакетах с PID 0x0011 более 2 с; Секции с tablejd, отличным от 0x72, 0x42, 0x46, 0х4А в пакетах с PID 0x0011; Любые две секции с tablejd = 0x42, появляющиеся под PID 0x0011 в установленный период времени (25 мс и менее) Интервал между секциями с одинаковым номером и tablejd = 0x46 под PID 0x0011 превышает установленное значение (10 с и более) Секция «0» с tablejd 0х4Е (ЕГГ-Р, данный поток) отсутствует под PID 0x0012 более 2 с; Секция «1» с tablejd 0x4E (EIT-F, данный поток) отсутствует под PID 0x0012 более 2 с; Секции с tablejd, отличным от 0x72 или 0x4F ...0x6F, в пакетах с PID 0x0012; Любые две секции с tablejd = 0x4E, появляющиеся под PID 0x0012 в установленный период времени (25 мс и менее)
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 263 Табл. 10.5 (продолжение) № п/п 3.66 З.бв 3.7 3.8 3.9 3.10 Параметр Ошибка EIT других потоков Ошибка EIT текущий/ следующий Ошибка RST Ошибка TDT Ошибка опустошения буфера Ошибка задержки данных Индикатор EIT other error EIT PR error RST_error TDT_error Empty_buffer_ error • Data_delay_ error Проявление ошибки Интервал между секциями «0» с tablejd 0x4F под РЮ 0x0012 превышает установленное значение (10 с и более); Интервал между секциями «1» с table id 0x4F под РЮ 0x0012 превышает установленное значение (10 с и более); Если представлены секции «0» или «1» каждой из подтаблиц EIT-P/F, обе должны существовать Секции с table id, отличным от 0x71 или 0x72, в пакетах с РЮ 0x0013; Любые две секции с tablejd = 0x71, появляющиеся под РЮ 0x0013 в установленный период времени (25 мс и менее) Секции с tablejd 0x70 (TDT), отсутствующие в пакетах с РЮ 0x0014 более 30 с; Секции с tablejd, отличным от 0x70, 0x72 (ST), 0x73 (ТОТ) в пакетах с РЮ 0x0014; Любые две секции с tablejd = 0x70, появляющиеся под РЮ 0x0014 в установленный период времени (25 мс и менее) Траспортный буфер (ТВ) не опустошается по меньшей мере 1 раз в секунду, или Транспортный буфер для системной информации (TBsys) не опустошается по меньшей мере 1 раз в секунду, или Буфер мультиплексора при использовании метода утечки не опустошается по меньшей мере раз в секунду Задержка данных (исключая неподвижное изображение) в буфере TSTD превышает 1с, или Задержка неподвижного изображения в буфере TSTD превышает 60 с мерение временного дрожания и скоростей потоков. Низкочастотные компоненты дрожания PCR (дрейф и блуждание, см. разд. 10.4.2) будут отделены от высокочастотных. При измерении скорости потока будут установлены различия между кратковременными и долговременными измерениями и введены понятия пикового и среднего значения скорости. Для более детального мониторинга транспортных потоков предлагается отслеживать: - на уровне сети — networked, название сети; - на уровне ТП — transport__stream_id, скорость ТП, число сервисов; - на уровне сервиса — service_id, название сервиса, тип сервиса, статус УД, PID для РМТ, PID для PCR, число компонентов и их тип (видео, звук, данные). Наряду с контролем транспортного потока в режиме передачи должен осуществляться и оперативный анализ, позволяющий выявить нарушения его структуры и другие источники ошибок. Часть выпускаемых промышленностью приборов предназначена для
264 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю PCR Jitter Histoaram for P D 320 Resolution: 27 Range: j'soo.O ' jHtstogram ^j Frequency •500.0ns Mean: Std. 0«v.. —\ « h- •425 .g -351» +0.137 AS ♦35.081ns •2777 -203.7 Mift.: Mec: P" Show value Start »e©ofdlng -h ■+- Status: Reoordin g «topped Hit 'start1 to start ov«r.. 128,0 203.7 277,7 Sin Delia: *37.037ns Elapsed. 00.00:31 Samples 808<p) _| , h 351.8 425,0 600.0ns Java applet memory Statistics Resolution: J27 Range: 1500.0 PCR Jitter Histoaram for PID 1660 jHistogra p" Show value | -5000ns Mean: Std. Dev.: Status: -425.0 -351.8 -277.7 •0.075ns ♦221.044ns Reoordlng stopped.Hit 'staff to start over... •203.7 Min.: Max.: -128.0 -55.5 -518,318ns ♦518.518ns 0 55.6 tM.e Bin Delta Elapsed: Samples: 203.7 277,7 ♦37,037 ns 0000:41 102500) 351.8 425.0 500.0ns Java applet statistics 1.0MB ■ Рис. 10.5. Диаграмма распределения временного дрожания PCR для двух транспортных потоков - с низким дрожанием (верхний рисунок) и с высоким, близким к предельно допустимому (нижний рисунок)
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 265 текущего анализа в режиме реального времени. Такие приборы позволяют определить структуру потока, скорость суммарного цифрового потока и всех его компонент, периодичность повторения пакетов с определенным PID, наличие и состав таблиц PSI/ SI. Типичным представителем этой группы можно считать анализатор ТТ4000 компании Tandberg Television. Он обеспечивает анализ в режиме реального времени транспортного потока MPEG на уровне таблиц и PID, позволяет определить состав потока, Декодер Витерби \ ' Задержка N ) \Ь Компенсатор перемежения Сверточный кодер —* / / Сравнение Вероятность ошибки Ф Рис. 10.6. Схема измерения вероятности ошибки до декодера Витерби правильность передачи опорных тактовых сигналов, дает данные о наличии и виде скрем- блирования цифрового потока и других характеристиках. В зависимости от конструкции возможен мониторинг от 1 до 8 транспортных потоков одновременно. Кроме проверки целостности и структуры транспортного потока, в процессе оперативного контроля проверяются и измеряются некоторые параметры, важные для обеспечения устойчивой передачи. В спутниковой системе измеряется вероятность ошибки на бит BER на входе приемника, до декодера сверточного кода, и на выходе этого декодера. На рис. 10.6 показана структурная схема измерителя достоверности на входе. За основу измерений принимается тот факт, что в условиях нормальной работы (BERbx < 710"2) число ошибок на выходе сверточного кода («210"4) значительно меньше, чем на входе, и ими в первом приближении можно пренебречь. Выходная последовательность декодера Витерби кодируется таким же сверточным кодом, как и пришедший сигнал, и побитно сравнивается с I, Q потоками на входе декодера. Различие между потоками считается ошибкой, и число ошибок относят к общему числу принятых битов. Для получения достоверных результатов время обработки должно быть таким, чтобы набралось, по крайней мере, несколько сотен ошибок. Некоторые измерители прокалиброваны в единицах E6/No, но измерение ведется по коэффициенту ошибок. Схема измерения достоверности после декодера Витерби значительно проще (рис. 10.7) и основана на сравнении двух последовательностей пакетов транс- Модулятор \—* Т" Декодер Витерби И Компенсатор перемежения Декодер PC Ч Сравнение Вероятность ошибки т г L ^ , Генератор | нулевых | / • пакетов портного потока (точнее, их си- ■ ■ стематических частей длиной по 188 байтов) — до декодера Рида- рИс. 10.7. Схема измерения вероятности ошибки после деко- Соломона, содержащих ошибки, дера Витерби и после декодирования, практически не содержащих ошибок (BER < 10"10). Измерение может проводиться в процессе эксплуатации, с использованием информационных пакетов, или вне эксплуатации, в последнем случае на вход модулятора должна быть подана последовательность нулевых пакетов (пакетов, содержащих стандартную 4-байтовую синхронизирующую последовательность и 184 нулевых байта). Если измеренное отношение превышает 10~3, оно должно быть признано недостоверным и отброшено, так как выходит за пределы корректирующей способности кода Рида-Соломона.
266 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю В цифровых сетях кабельного и эфирного телевидения, где не используется сверточ- ное кодирование, измеряется только достоверность на входе декодера Рида-Соломона. 10.3.2. Анализ транспортного потока вне реального времени Анализаторы реального времени не успевают произвести «глубокий» анализ структуры транспортного потока на битовом уровне, который часто бывает необходим для проверки совместимости со стандартом MPEG кодеров. Для этой цели выпускаются приборы другого класса, способные работать в режиме «отложенного» времени, для чего большие MPEG-файлы длиной в сотни мегабайт и даже гигабайты (это 15-30 мин цифровой записи) могут записываться в память и затем автоматически анализироваться с любой желаемой детальностью, вплоть до битов. Необходимой частью приборов этого класса являются источники эталонных MPEG последовательностей, воспроизводящие заведомо корректный цифровой поток, по которому можно проверять работу декодеров. В качестве примера оборудования данной группы рассмотрим комплект фирмы Snell&Wilcox, включающий генератор MPEG-сигнала MSP-100, анализатор цифрового потока MSA-100 и видеоанализатор MVA-100. MSP-100 это устройство воспроизведения цифрового потока MPEG, предназначенное для получения точных последовательностей с точной синхронизацией. Это важно для испытаний и отладки MPEG-систем, имеющих в своем составе мультиплексоры, модуляторы, линии передачи, спутниковые декодеры. Прибор MSP-100 может создавать и воспроизводить как однопрограммный, так и многопрограммный транспортный поток. Он обеспечивает «бесшовное» замыкание в кольцо любого цифрового потока MPEG, что очень важно для отладки декодеров и систем в целом. MSA-100 осуществляет в реальном масштабе времени полную программную проверку исправности кодирующего оборудования. Имеющиеся утилиты просмотра позволяют убедиться в правильности и полноте системной информации. Предусмотренные режимы запуска дают возможность автоматически фиксировать любые данные в транспортном потоке в случае появления ошибки и выводить их на устройство записи. Когда произведена запись, прибор архивирует выбранные данные на диске с целью последующего анализа вне реального времени для выявления возникших неисправностей. Предусмотрено измерение дрожания PCR в реальном масштабе времени, отображение счета битов и нарушений непрерывности счета. MVA-100 дополняет MSA-100 и обеспечивает анализ видеосигнала на уровне изображения, слайсов и макроблоков, с его помощью легко проверить характеристики любого MPEG-кодера и декодера и оценить их совместимость. Прибор включает «эталонный» MPEG-декодер с очень высокими характеристиками, может выводить на экран монитора детальную информацию о процессе обработки сигнала в испытуемом кодере. К этому же классу относится комплект приборов MTS-200 фирмы Tektronix. Подробные технические характеристики анализаторов и источников транспортного потока различных производителей приведены в табл. АН Приложения А.
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 267 10.4. ИЗМЕРЕНИЕ ПАРАМЕТРОВ И ОБНАРУЖЕНИЕ ОШИБОК ПЕРЕДАЧИ В ЦИФРОВОМ КАНАЛЕ БЕЗ КОМПРЕССИИ 10.4.1. Оценка качества изображения Мы уделили большое внимание описанию методов измерений в ТВ каналах с компрессией, но это не означает, что можно не обращать внимания на качественные показатели цифровых каналов без компрессии. С некомпрессированными сигналами приходится иметь дело в процессе производства телепрограмм, так как ряд операций (ввод субтитров, спецэффекты) не удается пока осуществить в компрессированном формате. Связь между отдельными аппаратными или зданиями в производственном комплексе часто осуществляется в формате последовательного видеостыка SDL Ограниченное использование кодеков сжатия на промежуточных стадиях диктуется также экономическими соображениями. Все сказанное подтверждает необходимость тщательного контроля параметров цифровых каналов на всех участках. Контроль качества изображения в ТВ канале без сжатия облегчается тем обстоятельством, что такой канал в основном может, тестироваться хорошо известными методами и несложными испытательными сигналами, в том числе и разработанными для аналогового телевидения. Желающие ознакомиться с предметом подробнее могут обратиться к Рекомендации ВТ.813, посвященной этому вопросу, а мы перейдем к измерению характеристик канала на уровне цифрового потока. 10.4.2. Измерение фазового дрожания Наиболее простым и доступным средством измерения основных характеристик последовательного цифрового ТВ сигнала остается осциллограф с достаточно широкой полосой пропускания и быстродействием. Если подать на вход вертикального отклонения SDI сигнал и на горизонтальные отклоняющие пластины сигнал тактовой частоты 270 МГц, на экране появятся несколько прямоугольных импульсов со сглаженными скатами и размытыми за счет шумов и фазового дрожания контурами — глазковая диаграмма, о которой мы уже рассказывали в первой главе. Измерив в вольтах расстояние между верхней и нижней границами сигнала, получим размах сигнала, который на выходе передатчика должен быть в пределах 0,8±0,08В, а на входе приемника не менее 185 мВ. Время нарастания и спада импульса от 10 до 90% амплитуды должно быть в пределах от 0,4 до 1,5 не. Для точного измерения параметров импульса полоса пропускания осциллографа должна составлять не менее 1 ГГц, измерения амплитуды возможны с более узкополосным осциллографом (300..500 МГц). С помощью осциллографа измеряется один из важнейших параметров цифрового сигнала — фазовое дрожание. В первой главе упоминалось о двух компонентах фазового дрожания общем и высокочастотном. Для измерения общего значения фазового дрожания на горизонтальный вход осциллографа необходимо подать тактовый сигнал, свободный от дрожания (например, от внешнего синхрогенератора). Измерение высокочастотной составляющей производится при подаче синхросигнала, выделенного из пришедшего сигнала с помощью цепи ФАПЧ с соответствующей полосой пропускания. В некоторых случаях видеоинженеры пытаются измерять фазовое дрожание, используя в качестве синхронизирующего тот же входной SDI-сигнал без цепи выделения такто-
268 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Табл.10.6 Допустимая величина фазового дрожания в некоторых стандарт' ных интерфейсах Стандарт AES/EBU Audio SDI Параллельный, ТСЧ Параллельный, ТВЧ Период тактовой частоты, НС 163 3,7 37 7 Фазовое дрожание, НС 40 0,74 6,0 1,0 %от периода тактовой частоты 25% 20% 16% 14% Требование дрожания для ЦАП, не 1 0,5 0,5 0,1 вой частоты. При всей его простоте и кажущейся очевидности, этот метод может быть рекомендован только для наблюдения и ни в коем случае не для измерений. Дело в том, что в современных стробоскопических осциллографах имеется значительная задержка сигнала в цепи самосинхронизации, и это вызывает эффект гребенчатого фильтра. В результате составляющие фазового дрожания с некоторыми частотами вообще не будут присутствовать на осциллограмме, а другие будут присутствовать с удвоенной амплитудой. Общий эффект проявляется как подавление высокочастотных компонент, и можно наблюдать вполне приемлемую глазковую диаграмму при фазовом дрожании, значительно превышающем допустимые пределы. В табл. 10.6 приведены допустимые значения фазового дрожания некоторых интерфейсов для цепей синхронизации и цифро-аналогового преобразования. 10.4.3. Измерение ошибок передачи Поговорим теперь об ошибках. Ошибка, приводящая к приему символов, отличных от переданных, единственный вид искажений, которые претерпевает цифровой сигнал в тракте передачи. Обнаружение и измерение параметров ошибок играет решающую роль в цифровой технике. В шумящей среде (спутниковый, эфирный вещательный канал), где ошибки носят случайный характер, основной характеристикой ошибок принято считать вероятность ошибки или коэффициент ошибок — отношение числа ошибочно принятых битов к общему числу переданных. Линии передачи SDI сигнала внутри студийных комплексов относятся скорее к классу нешумящих — при достаточном запасе по длине кабеля ошибка, вызванная шумами, может происходить раз в сутки или даже раз в месяц. Методы, используемые обычно для измерения вероятности ошибок, не очень подходят для «нешумящих» сред по следующим причинам: 1. Измерение может проводиться только вне эксплуатации, так как SDI сигналы сами по себе не содержат необходимых последовательностей. 2. Типовые измерительные ПСП не соответствуют формату SDI и могут не проходить по измеряемому тракту. 3. Из-за редкого появления случайных ошибок измерение может затянуться на длительный срок или стать вообще невозможным. 4. Измерительные приборы для измерения вероятности ошибок сравнительно дорогостоящи, чтобы их можно было широко применять в ТВ системах.
Глава 10. Оценка качества, измерения и контроль цифровых вещательных ТВ каналов 269 Данные Сопроцессор «£ Ч Расчет CRC Параллельно- последовательный преобразователь Тракт Ч. й. передачи Последовательно- параллельный преобразователь Извлечение CRC Расчет CRC Добавление флагов L. Сравнение Сопроцессор Сообщение об ошибках Рис. 10.8. Структурная схема ввода и обработки сведений об ошибках методом EDH SDI каналы нельзя считать и вовсе нешумящими. Ошибки, вызванные различными причинами (импульсные помехи, наводки, программные сбои в аппаратуре и т.п.), могут происходить достаточно часто и группироваться в пакеты или пачки. Понятие вероятности для таких ошибок статистически не определимо и их принято характеризовать последовательными поврежденными секундами (ППС), т.е. тем отрезком времени, в течение которого каждую секунду имела место хотя бы одна ошибка. Этот подход особенно удобен в системах с пакетными ошибками. Для студийных комплексов цифрового телевидения разработан и применяется недорогой и эффективный метод обнаружения и обработки ошибок (EDH — Error Detection and Handling) [10.9], заключающийся в расчете циклических проверочных сумм (CRC) длиной 16 битов для каждого поля цифрового видеосигнала и передаче этих сумм к приемнику в составе цифрового сигнала. Приемник проводит повторный расчет CRC для тех же отсчетов видеоданных и сравнивает результаты со значениями, полученными от передающей стороны. Если контрольные суммы совпадают передача прошла без ошибок, если отмечено несовпадение —00 имели место ошибки при передаче данных. Ошибки отмечаются установкой флагов, которые сохраняют установленные значения, пока не будут погашены оператором. Метод позволяет организовать полностью автоматизированную систему сбора и обработки данных об ошибках на объектах любой сложности. Гибкая система ввода данных позволяет дифференцировать ошибки, возникшие во всем поле в активной части строки, или в дополнительных данных, вводимых в интервалы гашения, а также определить, возникла ли ошибка в данном устройстве или в предшествующих ему по тракту прохождения сигнала. На рис. 10.8 показана структурная схема ввода и обработки сведений об ошибках в системе EDH.
=11— ПОСТРОЕНИЕ АППАРАТУРЫ ЦИФРОВОГО ТВ ВЕЩАНИЯ 11.1. ТИПОВАЯ КОНФИГУРАЦИЯ СЕТИ ЦИФРОВОГО ВЕЩАНИЯ В предыдущих главах мы рассмотрели отдельные аспекты формирования и обработки цифровых вещательных сигналов — сжатие видео- и звуко- данных, ввод дополнительных данных пользователя в цифровой поток, организацию условного доступа, построение интерактивных систем. В данной главе мы обратимся к практической реализации систем цифрового вещания и попытаемся дать читателю представление о построении отдельных устройств — кодеров, мультиплексоров, приемников, объединении их в аппаратурные комплексы, взаимодействии между собой в составе комплексов и принципах организации эксплуатации передающих центров и сетей цифрового вещания. На рис. 11.1 в качестве примера приведена обобщенная конфигурация сети цифрового вещания (для определенности спутникового), включающая все упомянутые виды взаимодействия. Основные элементы сети комплекс подготовки программ (студии, аппаратные видеозаписи, аппаратные выпуска программ), передающий центр, средства передачи (в данном случае — стволы спутникового ретранслятора), приемная сеть, каналы взаимодействия интерактивной сети, технические средства провайдера интерактивных услуг, оборудование условного доступа. Подготовленные ТВ программы (процесс подготовки в данной книге не рассматривается) в формате SDI поступают на вход аппаратуры цифровой компрессии, обеспечивающей сжатие информации и формирование цифровых транспортных потоков. Это важнейший комплекс сети цифрового вещания, от устойчивой работы которого в значительной степени зависят качество и надежность работы всей сети. Видеоданные поступают на вход видеокодера, звукоданные — на вход звукового кодера сжатия. В большинстве конструкций звуковой кодер является составной частью видеокодера, хотя имеются технические решения и с отдельным звуковым кодером. Для повышения надежности кодеры сжатия обеспечиваются «горячим» резервом с автоматическим переключением на резервный комплект. Обычно предусматривается один, реже два резервных кодера на комплект из 6...8 рабочих, обеспечивающих работу в стволе спутникового ретранслятора. Переключение входного сигнала производится с помощью быстродей-
272 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю гг4|п пе«>в- п^и L* U датчик \w * о с; о »- о о 2 Инкапсу- лятор ^~ ЕСМ генератор Сервер данных (ЭПП, телетекст, Интернет, данные пользователя) Передатчик EMM инжектор Генератор КС Интерактивные приложения SAS SMS Рис. 11.1. Упрощенная структурная схема сети цифрового вещания
Глава 11. Построение аппаратуры цифрового ТВ вещания 273 ТВ приемник Персональный компьютер
274 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю ствующего матричного переключателя, который по команде управляющего компьютера изменяет свою конфигурацию таким образом, что цифровой сигнал отказавшего кодера поступает в резервный, на котором автоматически задаются необходимые начальные установки скорость потока, параметры ГВК, разрешающая способность и т.д. Каждый кодер, как правило, имеет два равноценных выхода сжатого сигнала в формате ПЭП, которые подсоединяются к входам основного и резервного мультиплексоров. Звукоданные могут поступать на аппаратуру цифровой компрессии как в виде отдельных цифровых потоков AES/EBU, так и внедренными в соответствующий SDI поток видеоданных. В последнем варианте значительно упрощается резервирование достаточно иметь один матричный переключатель, а не два раздельных для SDI видео и AES/EBU звука, как в случае раздельной подачи. При встраивании звука уменьшается также вероятность потери звука или изображения или их несоответствия из-за неверного срабатывания переключателей. Ценой таких упрощений является необходимость применения устройств ввода внедренного звука на входе соединительной линии и устройств вывода после матричного переключателя. Выбор способа передачи звука связан еще с одним аспектом построения сети выбором места расположения аппаратуры цифровой компрессии. Современные вещательные комплексы, как правило, располагаются в нескольких пространственно разнесенных зданиях, в частности, комплекс подготовки программ и передающий центр (особенно в системах спутникового вещания) могут быть разнесены на многие десятки километров. Компрессия занимает некоторое промежуточное положение между подготовкой программ и их передачей, поэтому аппаратура компрессии может быть с успехом размещена и в комплексе подготовки программ, и в передающем центре. Мировая практика подсказывает примерно равное число случаев того и другого размещения. При большом расстоянии до передающего центра размещение аппаратуры компрессии в составе комплекса подготовки программ более экономично, так как передавать по линиям связи в этом случае придется не исходные ТВ программы, а сжатые в несколько раз цифровые потоки. Если же аппаратура компрессии размещена на передающем центре, то передача внедренного звука, безусловно, будет более экономичным решением, чем раздельная передача видео- и звукоданных. Итак, сжатые сигналы поступили на вход мультиплексора. Здесь формируется суммарный транспортный поток, в который, кроме звуковых и видеосигналов, включаются также PSI/SI таблицы, сообщения системы условного доступа ЕСМ и EMM, сигналы ЭПП, дополнительные данные пользователя, сигналы прямого канала взаимодействия интерактивной системы и др. В непосредственной близости от мультиплексора должны находиться ЕСМ генератор и EMM инжектор. Система управления подпиской (SMS) и система авторизации абонентов (SAS) могут находиться на любом расстоянии от EMM инжектора, так как их информация передается по любым наземным каналам с низкой скоростью и не засекречивается. В седьмой главе мы рассказывали, что данные пользователя обычно поступают в формате IP и переводятся в формат транспортного потока (чаще всего DVB-ASI) в инкапсуляторе. Последний может размещаться вблизи мультиплексора или связываться с мультиплексором соединительнсж линией, допускающей прохождение сигналов в формате ASI (150...250 м для коаксиального кабеля или 20...40 км для оптической линии). Обратные каналы от абонентов замыкаются на провайдера интерактивных услуг, которым может быть как компания-вещатель, так и другая организация. В частном случае спутникового Интернета это может быть Интернет-провайдер, а инкапсулятор
Глава 11. Построение аппаратуры цифрового ТВ вещания 275 для ввода информации из Интернета в транспортный поток может находиться как у Интернет-провайдера, так и на передающем центре (рис. 11.1). Транспортный поток MPEG-2 с выхода мультиплексора поступает на DVB модулятор, где осуществляется помехоустойчивое кодирование и модуляция сигнала ПЧ. Где бы ни находилась аппаратура цифровой компрессии, модулятор всегда расположен вблизи передатчика, так как связан с ним радиочастотным интерфейсом, не допускающим удаления более чем на несколько десятков метров. Требования надежности диктуют резервирование модулятора и передатчика. Возможны несколько способов резервирования, показанных на рис. 11.2. Выбор между схемами рис. 11.2а и 11.26 зависит от построения системы контроля и управления станцией и от надежности переключателей. Схема (6) более экономична, так как содержит только один переключатель. На многоствольных станциях иногда в целях экономии применяют резервирование модуляторов и передатчиков по схеме N:l, как показано на рис. 11.2в. Сигнал, излученный антенной передающего центра в сторону спутника, ретрансли- Модулятор Модулятор f \ Преобразователь частоты Преобразователь частоты а Передатчик Передатчик d а) I Модулятор Модулятор Преобразователь частоты Преобразователь частоты Передатчик Передатчик й б) Вход 1 Вход 2 Вход п Коммутатор Модулятор Модулятор Линейка 1 Преобразователь частоты Линейка 2 Преобразователь частоты Передатчик Передатчик Модулятор Линейка п+ Преобразователь частоты 1 Передатчик Мост слежения в) Рис. 11.2. Способы резервирования модулятора и других узлов передающего тракта
276 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю руется им обратно и принимается антеннами абонентов. После усиления в малошумя- щем конверторе и преобразования на высокую ПЧ сигнал поступает в приемник-декодер, который выполняет функции выделения и обработки цифрового сигнала. С выхода приемника-декодера аналоговый сигнал в одном из общепринятых форматов цветности PAL, SECAM или NTSI поступает на вход ТВ приемника (по радиоканалу на антенный вход или в виде видеосигнала и тонального сигнала звукового сопровождения — на соответствующие низкочастотные входы). С внедрением полностью цифровых ТВ приемников функции обработки будут постепенно передаваться от отдельного приемника- декодера к модулю, встроенному в ТВ приемник. Это позволит в дальнейшем исключить аналоговый интерфейс на выходе MPEG декодера и доводить до экрана полное цифровое качество изображения. Рассмотрим более подробно устройство и функционирование отдельных элементов цифрового тракта. 11.2. КОДЕРЫ ЦИФРОВОГО СЖАТИЯ Кодер сжатия считается самым ответственным элементом в цепочке обработки цифрового сигнала, он в значительной мере определяет устойчивость и качество изображения при заданной скорости цифрового потока. Как уже неоднократно отмечалось, стандарт MPEG определяет структуру потока и эталонную модель декодера, но не накладывает ограничений на построение кодера или алгоритм его работы, так что для компаний- производителей имеется широкое поле деятельности в достижении наилучших показателей при минимальных ресу] сах расхода битов. Рассмотрим устройство и работу кодера формата ТСЧ на примере семейства кодеров Е-1х00 (Е-1000, Е-1100, Е-1500) компании Tadiran Scopus. Структурная схема устройства показана на рис. 11.3. Кодер имеет модульную конструкцию и позволяет использовать сменные блоки входных интерфейсов, допускающие подачу как аналоговых (компонентных и композитных), так и цифровых видеосигналов. При работе с аналоговыми сигналами осуществляется композитное декодирование и аналого-цифровое преобразование сигнала. При необходимости из аналогового сигнала с помощью дополнительного декодера выделяются сигналы телетекста для последующего ввода в мультиплексор. В случае использования цифрового входного интерфейса SDI с внедренным звуком в модуле входного интерфейса осуществляется выделение звуковых сигналов, которые затем поступают на кодеры звука. Как уже отмечалось, композитное декодирование приводит к заметному ухудшению качества изображения и потому не рекомендуется к использованию, его следует применять только при невозможности получить видеосигнал от источника в иной форме. Важные функции в составе кодера выполняет предпроцессор. В Е-1000 он осуществляет цифровую фильтрацию и синхронизацию кадров. В модели Е-1100 производятся дополнительная временная обработка и шумоподавление. Предпроцессор также вводит тестовые сигналы и заставки. Видеокодер построен на базе однокристального MPEG-2 процессора DVXpert компании C-Cube. Компрессированный поток видеоданных с выхода кодера поступает через высокоскоростную шину PCI в буфер, позволяющий поддерживать постоянную скорость цифрового потока на входе мультиплексора.
p3 RS-422 20 Мбит/с Интерфейс RS-422 a [Последовательно-параллельный] преобразователь И Буфер а Аналоговое видео _ Цифровое видео Телетекст Входной модуль видео Декодер PAL/ NTSC И АЦП zr SDI Оценка движения ^прям. | обрати. —г4 / Компенсация движения *— Векторы перемещения Видеокодер Входной модуль звука Канал А. Канал Б. АЦП SZ АЦП зг и о Кодер А Кодер Б Флэш-диск kj: RS232 Управление Загрузчик RS232 - Данные ОЗУ > дкп Обратное ДКП £ Буфер =м PCI мост PCI шина 7Т 1Z I PCI мост 3 Я 3 Центральный контроллер ж Лицевая панель Отладка и "^обновление Ц Преобразователь к=а ж К сети Ethernet Рис. 11.3. Структурная схема кодера цифрового сжатия
278 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Стандартным решением для кодера считается наличие двух стереоканалов звука. В кодерах Е-1х00 предусмотрена подача как цифровых сигналов AES/EBU, так и аналоговых сигналов, в последнем случае осуществляется аналого-цифровое преобразование с разрядностью 18 бит/отсчет и частотой дискретизации 32, 44,1 или 48 кГц. Звуковые кодеры выполнены на цифровых сигнальных процессорах. В зависимости от выбранного режима скорость выходного потока в канале может изменяться в пределах от 32 до 384 кбит/с, обеспечивая Уровни I или II стандарта MPEG-1 (MPEG-2). Возможна установка двух дополнительных кодеров звука, что дает возможность организовать в общей сложности 4 стерео или 8 моноканалов. С выходов кодеров элементарные потоки сжатых звукоданных подаются на мультиплексор. Общепринятым для кодеров сжатия становится наличие каналов передачи данных пользователя низкоскоростного асинхронного со скоростью до 115,2 кбит/с и синхронного со скоростью до 2 и более мегабит в секунду. Кодеры семейства Е-1x00 позволяют сформировать оба вида каналов. Для высокоскоростных данных используется последовательный синхронный интерфейс RS422. Данные с этого входа преобразуются в параллельный формат и через управляемый буфер подаются непосредственно на вход мультиплексора. Максимальная скорость передачи данных — 20 Мбит/с. Оригинальное техническое решение компании Tadiran Scopus позволяет использовать высокоскоростной вход данных для каскадного подключения второго кодера. Специальное программное обеспечение загружается в мультиплексор и обеспечивает возможность ремультиплексирования транспортного потока от другого кодера. Внешний транспортный поток подается на вход модуля мультиплексора вместе с внутренними элементарными потоками и объединяется в единый транспортный поток, при этом осуществляется замена PID и ресинхронизация PCR. Низкоскоростные данные поступают для обработки на последовательный асинхронный порт центрального контроллера. Этот контроллер управляет также всей работой кодера. При запуске устройства он считывает из специальной энергонезависимой памяти конфигурационные параметры кодера. Далее с флэш-диска в оперативную память загружается программа работы кодера, которая содержит инструкции по выполнению всех операций предобработки, цифрового сжатия, мультиплексирования. Для целей обновления программного обеспечения существует отдельная энергонезависимая память, позволяющая хранить предыдущие загрузочные версии программного обеспечения. Такая система позволяет гибко конфигурировать кодер, производить модернизацию программного обеспечения и по мере необходимости устанавливать различные опции, такие, как статистическое мультиплексирование, скремблирование и поддержка профиля «4:2:2». Контроллер имеет два последовательных асинхронных порта RS-232. Один порт, как уже упоминалось, предназначен для приема низкоскоростных асинхронных данных на скорости до 115 кбит/с. Другой порт может использоваться для управления и диагностики посредством подключения к персональному компьютеру. Передняя панель кодера имеет шесть кнопок для управления, жидкокристаллический индикатор и светоди- од для отображения состояния. Для доступа к сети Ethernet имеется специальный преобразователь. Помимо первоначального конфигурирования интерфейсов, кодера, мультиплексора и других компонентов устройства, контроллер осуществляет взаимодействие с внешними по отношению к кодеру приборами, что позволяет: — управлять кодером с помощью системы управления NMS-4000; — управлять кодером через сеть Telnet;
Глава 11. Построение аппаратуры цифрового ТВ вещания 279 осуществлять загрузку нового программного обеспечения с использованием TFTP протокола; управлять процессом статистического мультиплексирования; — управлять процессом скремблирования. Большая часть выпускаемых промышленностью кодеров формирует минимально необходимый набор PSI таблиц и потому может работать в одноканальном режиме без дополнительного мультиплексора, непосредственно создавая транспортный поток на входе модулятора. Разумеется, в этом режиме не обеспечивается ввод извне сообщений условного доступа, ЭПП и других дополнительных сигналов. В кодерах Е-1х00 генерация служебных таблиц осуществляется центральным контроллером, при этом назначение PID для разные потоков производится с передней панели кодера. В случае использования внешней базы данных сервисная информация поступает от системы управления через интерфейс с Ethernet. Модуль мультиплексора в составе кодера решает две основные задачи. Первая задача — прием элементарных потоков от видеокодера и звуковых кодеров, потоков данных (низкоскоростных и высокоскоростных), прием и ресинхронизация транспортного потока от другого кодера (вместо высокоскоростных данных), мультиплексирование всех потоков, введение и замена служебной информации. Второй задачей является скремблирование выходного транспортного потока. Кодер может поддерживать два типа скремблирования: 1) собственной разработки Tadiran Scopus — с фиксированным ключом; 2) скремблирование BISS для систем цифровой видеожурналистики (DSNG-CA) с возможностью смены ключей. На выходе мультиплексора формируется суммарный однопрограммный или двухпрограммный транспортный поток MPEG-2/DVB. При этом источником сигнала синхронизации скорости всех потоков может служить как внешний, так и внутренний генератор. Выходной сигнал может формироваться в одном или нескольких общепринятых стандартах. Наиболее широко применяется стык DVB-ASI, реже используются DVB-SPI, RS-422 и нестан- дартизованные форматы отдельных производителей (M2S и М2Р компании Divicom/Harmonic, TAXI компании NDS/Tandberg Television и др). Максимальная скорость цифрового потока определяется выбранным профилем и уровнем компрессии, для наиболее часто применяемого сочетания ML@MP она составляет 15 Мбит/с. Практически используемая скорость в канале зависит от назначения передачи (распределение программ, непосредственное вещание), содержания программы, качества кодера («хорошие» кодеры обеспечивают равное качество при меньшей скорости потока), требуемого разрешения по вертикали и горизонтали. Последняя зависимость иллюстрируется табл. 11.1. В кодерах Е- 1x00 стандартной конфигурации имеются выходные интерфейсы DVB- ASI и RS-422, как опция могут быть заказаны стыки G.703 (потоки El, E2, ЕЗ) и DS-3 (ATM/AAL-1). Табл. 11.1 Зависимость скорости цифрового потока на выхо де типового кодера от требуемого разрешения Разрешающая способность Число пикселей в строке 720 544 480 352 544 480 352 Число строк 576 576 576 576 288 288 288 Скорость потока, Мбит/с 4...8 2Д..6 2...6 1.5...4 1.5...3 1.5...3 1...2.5
280 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Подробные технические характеристики кодеров Е-1х00 приведены в табл. А1 Приложения А. Появившиеся в последние два года кодеры ТВЧ обрабатывают входные отсчеты на скорости « 1,5 г6ит/с. Современные процессоры не обеспечивают достаточного быстродействия, поэюму входной сигнал разделяется на шесть потоков меньшей скорости, соответствующих изображению, разделенному на шесть горизонтальных полос (с довольно большим перекрытием), и обрабатывается параллельно в шести предпроцессо- рах и шести видеокодерах. Отсчеты сжатых видеоданных с выходов видеокодеров накапливаются в буферной памяти, а затем считываются и объединяются в единый цифровой поток. Главный процессор следит за тем, чтобы изображение на стыках полос сшивалось гладко и не испытывало скачков и перепадов яркости, такие же меры принимаются и по обеспечению эффективной компенсации движения по всему экрану. Микросхемы кодеров взаимодействуют между собой и непосредственно по сверхбыстродействующим шинам. Характеристики моделей кодеров цифрового сжатия различных компаний-производителей приведены в табл. А1 Приложения А. Здесь же в табл. А4 можно найти сведения по перевозимым комплектам для цифровой видеожурналистики (DSNG). Заслуживают упоминания новые тенденции в развитии кодеров сжатия, отмеченные в [11.1]. До сих пор соперничество конкурирующих компаний происходило в направлениях улучшения качества кодирования при низких скоростях потока и расширения функциональных возможностей («полевое» кодирование наряду с «кадровым», расширение области поиска при компенсации движения, поддержка профессионального профиля «4:2:2», поддержка кодирования ТВЧ изображений). Разработаны уже по крайней мере два поколения кодеров. В первом во главу угла ставилось достижение параметров, второе поколение отличается усовершенствованной архитектурой и конструкцией (уменьшены размеры, улучшено программное обеспечение в части управления работой кодера в системе). Сейчас основное внимание уделяется реализации предельных, энтропийных возможностей кодирования, и ключевое слово для этого этапа адаптация. Рассматриваются следующие направления усовершенствования: Адаптация сцены к кодеру (шумоподавление) Первые модели кодеров имели простые системы шумоподавления типа пространственной фильтрации, которые давали положительный эффект в некоторых случаях, но портили изображение во всех остальных, и их приходилось отключать. Новые схемы шумоподавления используют пространственно-временные фильтры с компенсацией движения и эффективно подавляют шумы различного происхождения: из-за зернистости кинопленки, пыли, грязи и царапин, шумы выпадений магнитной ленты, шумы композитного декодирования и т.д. На изображениях с высоким уровнем шума удается экономить до 20...30% битов. Достижение наибольшей эффективности требует ручной настройки порога подавления, а это неудобно в условиях эксплуатации. Усредненная настройка приводит к некоторому ухудшению изображения для медленных движений и больших однородных областей. Исследования ведутся в направлении адаптивных самонастраивающихся систем с динамическим шумоподавлением для Гауссова шума и медианной фильтрацией для «местных» шумов. Необходимо найти компромисс между шумоподавлением и потерей разрешения, к которой неизбежно приводит пространственная фильтрация. Первые результаты показывают, что выигрыш в отношении сигнал-шум на выходе может составить от 0,5 до 3 дБ.
Глава 11. Построение аппаратуры цифрового ТВ вещания 281 Изменение пространственного разрешения Исследования показывают, что понижающая передискретизация по горизонтали может улучшить качество изображения за счет снижения числа обрабатываемых пикселей, хотя при этом несколько снижается разрешение. Пока нет ясного ответа, какая разрешающая способность оптимальна в каждом конкретном случае, однако не вызывает сомнения, что она связана со скоростью передачи, и ведутся поиски алгоритма автоматического выбора оптимального разрешения. Возможно, вместо передискретизации будет применяться фильтрация как механизм, теснее связанный с содержанием изображения. Адаптация кодера к сцене (структура ГВК) Размер и структура ГВК — параметры, наиболее тесно связанные с изображением, и удачный их выбор позволил бы значительно улучшить качество изображения. Одно из возможных решений — двухпроходное кодирование, когда на первом проходе выбирается структура ГВК, близкая к оптимальной, а на втором проходе осуществляется собственно компрессия изображения. Расчеты показывают, что выигрыш составляет около 1 дБ в среднем и до 5 дБ на отдельных сюжетах. Выбор метода кодирования В стандарте MPEG-2 уже заложен механизм адаптации — выбор полевого или кадрового кодирования. Кадровое кодирование более подходит для медленных движений, полевое для быстрых. Оптимизация может дать выигрыш в отношении сигнал-шум 0,7 дБ в среднем и до 3 дБ на пиках при быстром движении. Многопроходное и итеративное кодирование При цифровом сжатии видеоданных наступают моменты, когда качество изображения ухудшается весьма существенно смена кадра, очень быстрые движения, всплески шума. Предотвратить срывы можно путем усложнения алгоритма кодирования — использования двух или нескольких проходов кодера по кадру. При первом проходе кодер получает полезную информацию о кадре, оценивает сложность сцены, движение, скорость потока, шаг квантования, обнаруживает момент смены кадра. Эти данные используются при втором проходе для сохранения постоянного качества изображения. С увеличением быстродействия процессоров возможно будет перейти к многопроходному кодированию и даже к итеративному режиму, когда процесс кодирования повторяется до тех пор, пока не будут достигнуты удовлетворительные характеристики качества на всей длине ГВК. Использование дополнительных данных при перекодировании При многократной последовательной компрессии-декомпрессии цифрового сигнала качество изображения заметно ухудшается, если скорость потока не очень велика. Замечено, что процесс деградации можно существенно замедлить, если сообщать каждому следующему кодеру некоторые параметры предыдущего. Использование единой сфази- рованной структуры ГВК позволяет уменьшить проигрыш в отношении сигнал-шум после восемь перекодирований с 6 до 1,5 дБ. Добавление информации о шкале квантования и векторах перемещения позволяет отыграть еще 0,9 дБ. Этот метод положен в основу разработанной компанией Snell&Wilcos технологии MOLE, в которой дополнительная информация передается от декодера к следующему кодеру в двух младших битах компонента цветности SDI сигнала.
282 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 11.3. МУЛЬТИПЛЕКСОРЫ И РЕМУЛЬТИПЛЕКСОРЫ Мультиплексор служит для объединения в единый транспортный поток цифровых потоков от различных источников — кодеров сжатия, выходов других мультиплексоров, инкапсуляторов, выходов приемников-декодеров, генератора PSI/SI таблиц, ЕСМ генератора и EMM инжектора, формирователя ЭПП и т.д. Приходящие сигналы могут иметь разную временную базу (т.е. формироваться с несколько различающимися тактовыми частотами), и задача мультиплексора сформировать асинхронный поток с сохранением синхронизирующей информации каждого из компонентов. Ранее в четвертой главе мы рассматривали механизм синхронизации в потоке MPEG-2 с помощью PCR — ссылок на программные часы. Принцип действия мультиплексора основан на свойствах буфера памяти — информация записывается в него с одной тактовой частотой, а считывается с другой, более высокой частотой. Если представить себе цепочку последовательно соединенных буферов, синхронизированных таким образом, что выходные пачки импульсов не перекрываются во времени, это и будет мультиплексор. В некоторых конструкциях цепочку замыкают в кольцо. Приходящие потоки (как правило, в формате DVB-ASI, однако в старых моделях мультиплексоров могут использоваться и другие стыки) демультиплексируются до уровня ПЭП и затем заново «сшиваются» в единый транспортный поток с общей тактовой частотой, синхронизированной с местным источником частоты 27 МГц. Поскольку время прихода пакетов на разные входы не синхронизировано, время их пробега внутри мультиплексора также различается, что может вызвать дрожание меток PCR. Для устранения этого явления для всех ремультиплексируемых сервисов производится коррекция PCR на основе специальных временных меток, вставляемых в пакет на входе мультиплексора. Большинство мультиплексоров оперируют с дескремблиро- ванными потоками, хотя в последнее время появились модели, обрабатывающие скрем- блированные потоки с сохранением всей информации условного доступа. Основным параметром мультиплексора считается выходная скорость транспортного потока, которая у большинства моделей составляет 55...60 Мбит/с. Существуют и образцы со скоростью до 100 Мбит/с. Разумеется, устанавливаемая на выходе скорость потока должна быть по крайней мере не ниже суммы скоростей всех объединяемых потоков. Превышение скорости выходного потока компенсируется введением нулевых (пустых) пакетов на выходе мультиплексора. Чаще всего используется формат DVB-ASI, в то же время многие модели имеют несколько выходов с различными форматами цифрового сигнала. В системах с УД мультиплексор (точнее, входящий в его состав скремблер) выполняет функцию скремблирования заданных сервисов транспортного потока. Для этого, как мы знаем, генерируется контрольное слово, которое передается в скремблер и на зашифровку в генератор ЕСМ, а затем в составе ЕСМ вводится в транспортный поток. Если программа передается в открытом виде, скремблер обрабатывает ее пакеты контрольным словом, состоящим по умолчанию из одних единиц. Ремультиплексоры представляют собой разновидность мультиплексоров, работающих не с отдельными сервисами, а с мультиплексированными транспортными потоками. Ре- мультиплексор выделяет из приходящих транспортных потоков нужные сервисы и комбинирует их в новые транспортные потоки, изменяя при этом соответствующим образом таблицы служебной информации и, если необходимо, режим скремблирования. Ремультиплексоры называют еще процессорами транспортного потока (Transport Stream Processor). Параметры и технические характеристики некоторых моделей мультиплексоров и ремультиплексоров, имеющихся на рынке, приведены в табл. А2 Приложения А.
Глава 11. Построение аппаратуры цифрового ТВ вещания 283 11.4. ЦИФРОВЫЕ МОДУЛЯТОРЫ Модулятор осуществляет все операции помехоустойчивого кодирования и модуляции радиочастоты, предусмотренные соответствующим стандартом DVB. Для рассматриваемого нами примера спутникового вещания типовая структурная схема модулятора приведена на рис. 11.4. Параметры внутреннего и внешнего кодеров и перемежителя мы подробно рассматривали в главе б и не будем повторяться, коснемся здесь только характеристик модулятора, не регламентируемых стандартом DVB-S. Выходная ПЧ большинства моделей лежит в диапазоне 52...88МГц, хотя по заказу может быть поставлен модулятор с ПЧ 140±36 МГц (для загрузки ретрансляторов с полосой 72 МГц). Информационная скорость цифрового потока для массовых моделей составляет 1...60 Мбит/с, соответствующая символьная скорость до 30...35 Мсимв/с. Некоторые компании выпускают модуляторы на символьную скорость до 60 Мсимв/с (информационная скорость до 100 Мбит/с). Выходной уровень регулируется шагами по 0,1 дБ в пределах от минус 20 до примерно + 5 дБм. Нестабильность уровня выходного сигнала не должна превышать 0,3 дБ в условиях эксплуатации, в противном случае это приведет к нарушению режима работы спутникового ретранслятора. Особенно важно, чтобы изменения уровня не превосходили указанной величины при пропадании или изменении параметров цифрового потока на входе, когда модулятор теряет синхронизацию. Замечено, что модели некоторых производителей в этих условиях могут давать кратковременные снижения и выбросы выходной мощности глубиной до 10 дБ. Стандартной функцией можно считать логическую инверсию I и Q потоков на входе модулятора ФМ-4, что проявляется на модулированном сигнале как инверсия радиочастотного спектра. Признаком качественной работы является глубокое (не менее чем на 40 дБ) подавление остатка несущей в режиме модуляции. Неравномерность плоской части спектра в пределах ПЧ ±0,8 Rchmb должна быть не более 0,5 дБ, на краях спектра скорость спада должна соответствовать трафарету рис. 6.8 из стандарта DVB-S с учетом выбранного коэффициента скругления формы импульса. Важно, чтобы фазовые шумы выходного сигнала были ниже, чем у последующих радиочастотных каскадов, и не вносили заметного вклада в общий баланс шумов. Можно ориентироваться на следующие примерные значения: < минус 90 дБс при расстройке 100 Гц; < минус 95 дБс при расстройке 1 кГц < минус 95 дБс при расстройке 10 кГц ; < минус 110 дБс при расстройке 100 кГц. о о © s © i СО о 2 о. 1Ф ее Э >> СП ОТ Щ> С Х Si <D CD CL О * Q. U ^ CO ;F ° A- 2 Q.O Ф С <D lis У Ф I о. О- Ф Ф © * CD c О ,CCO J око V' Q. * Ф CD О *2 со m ^ 2 о s со ю 0_ >s S- ^ ° £ *- I CO Q. Q. О ф c I О © 4 ? о. ° Ь- co CO © н- I s о Выход L-диапазона —> Выход 70 МГц Рис. 11.4. Структурная схема модулятора для спутниковых сетей
284 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Паразитные составляющие спектра в полосе рабочих частот не должны превышать уровня минус 55 дБс. Для цифровых спутниковых систем сбора новостей предлагаются модуляторы, обеспечивающие наряду с ФМ-4 также режимы модуляции ФМ-8 и КАМ-16. Эффективность использования спектра в этих режимах выше, но выше и требования к отношению сигнал-шум на приеме. Совсем недавно появились модуляторы, использующие вместо каскадного кодирования по стандарту DVB-S турбокодирование, кратко описанное в первой главе. Эти устройства в определенных режимах обеспечивают наиболее эффективное использование пропускной способности канала и могут применяться в отдельных случаях, например, при организации обратных спутниковых каналов. Модуляторы для сетей кабельного телевидения и для наземного эфирного вещания строятся с учетом соответствующих стандартов и имеют характеристики, отличающиеся от рассмотренных по многим параметрам. В табл. A3 Приложения А приведены основные параметры некоторых моделей модуляторов, выпускаемых промышленностью. 11.5. ПРОФЕССИОНАЛЬНЫЕ ДЕКОДЕРЫ И ПРИЕМНИКИ-ДЕКОДЕРЫ Реализация преимуществ цифрового сжатия в немалой степени зависит от устройств, восстанавливающих исходное изображение и звуковое сопровождение декодеров и приемников-декодеров (ПД). По функциональным возможностям и стоимости их можно разделить на две большие группы устройства профессионального назначения и абонентские приемные устройства. Профессиональные декодеры и ПД применяются для декодирования сжатых сигналов в студийных комплексах подготовки программ (для целей мониторинга и контроля, монтажа, преобразования стандартов), для приема сигналов в спутниковых распределительных системах с целью использования при подготовке программ или для ввода в сети кабельного телевидения на головных станциях, для приема компрессированных сигналов, передаваемых по существующим синхронным и асинхронным сетям связи, в системах делового телевидения для приема одновременно с телевидением потоков данных, для измерений и контроля качества цифровых каналов с компрессией и т.д. Основные признаки, по которым можно отличить приемное устройство профессионального класса, возможность использования большого числа различных входных и выходных интерфейсов, в том числе цифровых выходов видеоданных и транспортного потока; зачастую модульное построение с возможностью смены модулей и частичного изменения функций; развитое программное обеспечение с обширным меню, позволяющим программно менять в широких пределах параметры приема и обработки сигналов; поддержка различных уровней и профилей стандарта MPEG-2; наличие встроенных измерителей достоверности, отношения Eb/No и других параметров; возможность как автоматической, так и ручной загрузки исходных данных о цифровых потоках; наличие дисплея, отображающего параметры приема и состояния узлов самого устройства; возможность как локального (с передней панели), так и дистанционного управления приемником и его функциями. На рис. 11.5 приведена обобщенная схема профессионального ПД модульной конст-
Вход ТП 0,95...2,15 ГГц Вход Цифровой фильтр ж-ж ^ Тюнер Ид войной Ы АЦП Измерение коэффициента ошибок —ж Демодулятор Коррекция ошибок, восст. тактовой частоты,захват синхронизации Интерфейс клавиатуры, дисплея и микропроцессор управления внешним портом ж -ж~ ОЗУ У ЦАП -> Выход ТП Канал А Декодер звука 7F" J Ключ 1—^ Дескре- мблер RS-422 RS-232 ^ Демульти- плексор Декодер видео Л Микропроцессор управления модулями приемника —ж Лицевая панель и клавиатура ^| Внешний порт —ж Дистанционное управление Синхро- генератор Процессор КГИ К-* озу 7 Микропроцессор системы доступа ж ^ ^ рормирова-| тель SD! Интерфейс абонентской карточки ^ ^ Графический процессор Видеокодер 1 Видеокодер 2 qqI Мониторный Выход выход PAL/SECAM/ NTSC Рис. 11.5 Структурная схема профессионального приемника-декодера
Модуль входного интерфейса Ы LaI Двойной I—| Демод\ Г| Тюнер Гч АЦП II лятор I р}| 6 битов [I ФМ-4 М одул ь условного доступа Абонентская карточка Модуль обработки MPEG-2 Ш Демульти- плексор Модем rf Декодер звука [J Декодер IJ ^Ч видео |Ч Наложение графики Ж Модуль контролера Главный процес- 1 сор Флеш- память ОЗУ ПЗУ Лицевая панель Я ЦАП Выходной модуль Звук Модуль радио канала т цдп Радио| Кодер PAL/ SECAM канал I PAL/ ISECAMI RGB 4 Порт данных Данные Рис. 11.6. Структурная схема типового абонентского приемника-декодера (тракты данных показаны утолщенными линиями, управляющие сигналы - тонкими)
Глава 11. Построение аппаратуры цифрового ТВ вещания 287 От конвертора 0,95..2,15 ГГц 480 МГц Поло совой |-)| фильтр Смеситель —ж— 1,43...2,63 ГГц ПАВ фильтр УПЧс АРУ ГУН —7F""' Опорный генератор Э| ФАПЧ £ "7F" Управление Н См 1 И АЦП ~~Ф— Гетеродин 90° Ч См 2 АЦП Фильтр Найк- виста Тактовый генератор Фильтр Н Найк- |Демоду- лятор ФМ-4 —^ Декодер Витерби щемоду- Н лятор ФМ-4 н\ Декодер переме- жения Декодер Рида- Соломона dPEG-2 ~~ТП I Дескрем- блер Рис. 11.7. Пример реализации тюнера и модуля входного интерфейса ОЗУ 2 Мбайта Я* Кэшпамять Таймер С 1 Демульти- плексор К—* Контроллер шины к—i Центральный процессор 150 MIPS 32 бита К—* Модуль УД Параллельный порт IEEE1284 Ш JJL Последовательный порт Я* Контроллер ОЗУ Ш Телетекст Декодер видео Декодер звука Цифровое видео Цифровой звук Рис. 11.8. Архитектура приемника-декодера 3-го поколения
288 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю рукции, позволяющего принимать сигналы как в L-диапазоне первой ПЧ спутникового телевидения, так и в видеоспектре по различным сетям связи. Тракт обработки сигнала в целом соответствует структуре, определяемой стандартами DVB, но имеется и большое число вспомогательных узлов и блоков (на схеме показана часть из них). В схеме ПД условно можно выделить три основных узла: входное устройство, декодер, выходную часть. Входной узел поддерживает различные типы интерфейсов для приема цифрового сигнала в желаемой транспортной среде. Транспортный поток может поступать на декодер либо с входного узла, либо непосредственно из транспортной сети через интерфейсы DVB-ASI либо RS-422. Декодер выполняет демультиплексирование и декодирование элементарных потоков видео, звука, данных, служебной информации. Выходной узел формирует видео- и звуковые сигналы, потоки данных и может иметь различные интерфейсы. Входное устройство для приема сигналов в полосе первой ПЧ спутникового телевидения включает в себя тюнер, демодулятор и схемы коррекции ошибок. Тюнер преобразует принятый сигнал в два квадратурный сигнала I и Q, которые оцифровываются двойным АЦП и поступают на демодулятор ФМ-4. Демодулированный сигнал проходит последовательно декодер Витерби, восстановитель перемежения и декодер Рида- Соломона и в формате транспортного потока MPEG-2 поступает на вход узла декодера. Многие модели профессиональных ПД позволяют вывести принятый транспортный поток в формате DVB-ASI или, реже, DVB-SPI на специальный выход (например, для последующего ремультиплексирования). В эту же точку через электронный ключ могут вводиться внешние транспортные потоки от других интерфейсных модулей. Принятый транспортный поток поступает на вход демультиплексора, который выделяет элементарные потоки отдельных компонентов из общего цифрового потока. Если часть сервисов скремблирована, дескремблер, установленный перед демультиплексо- ром, «открывает» соответствующие компоненты. Далее потоки распределяются по назначению. ЭП служебной информации поступают на центральный процессор, ЭП видео, звука и данных обрабатываются в соответствующих декодерах. Центральный процессор на основе служебной информации и установок пользователя управляет всеми узлами ПД, формирует необходимые сигналы для генератора синхросигналов и потоки данных пользователя через интерфейсы RS-232 и RS-422. Синхрогенератор, в свою очередь, осуществляет координацию работы интерфейса SDI, видеокодеров и графического процессора. Видеодекодер осуществляет декомпрессию потока видеоданных. Восстановленный видеосигнал поступает на кодеры аналогового композитного сигнала и формирователь SDI сигнала через коммутатор, который в интервале кадрового гашения вводит в сигнал информацию от процессора кадрового гасящего импульса (телетекст, сигналы цветовой синхронизации SECAM и т.п.). Блок «Видеокодер 1» формирует сигнал PAL, SECAM или NTSC, в «Видеокодере 2» этот же сигнал проходит через графический процессор, где на него накладываются графические изображения, которые необходимо отобразить на экране контрольного монитора (экранное меню приемника, параметры сигнала и т.д.). Выходные усилители формируют необходимые параметры аналогового сигнала. Декодер зву ко данных принимает поток звукоданных с выхода демультиплексора, осуществляет его декомпрессию и направляет восстановленный сигнал на ЦАП. В большинстве профессиональных ПД имеется возможность получать как цифровые, так и аналоговые звуковые сигналы. Типовые пределы по символьной скорости для большинства профессиональных устройств
Переклкзчатели (аналоговые, цифровые] а Рис 11.9. Передающий центр цифрового вещания
\ W ЛОКАЛЬНЫЕ! сервера! - ВИДЕО I - 1/irPOBb т T5 :> о —••« 1и.Ш=1Ш.1!ЯЯ MSSBBsSSM ■.и.ьу.ыладая ¥ Мультиплексор RTM3BOO Ж^^ А V у ^ 1 шт
1 ОДИНОЧНЫЙ АБОНЕНТ г * intIrmet i J <• ПЕРЕДАЮЩИЙ ЦЕНТР !,'ЙШЙ) ■ЛЫмЫЛ! ,/ri*- цртмii< ОРПОРАТ1/1ВНЫ1/1АБОНЕНТ /&\ ■ftl«NNft| <•► TCP/IP J ^ #~^ва?^" 9SSBESB3J ^Sf-' ■^'ESSSSSSBJ Рис 11.11. Дистанционное обучение
КОДЕР 1 интерфейс RS-422 HSD D А f ПШЕШ W I KW.IM.I ! ГЛАВНЫЙ КОДЕР (мастер) 1= ' УТгТЯ=ПТ»Т» I ЕЕЕ35Е W ► •—(Si КОДЕР 1 > Г] интерфейс RS-422 HSD л—-ГШ5ЕШЛ w i ЕеЕСИ ] I ГЛАВНЫЙ КОДЕР (мастер) I I •► HS<»D=jSl»l»l Рис 11.12. Каскадирование кодеров
■) к. Приёмное ВЧ Оборудование У '► ЬЬЬЫшЫ Приёмн С Приёмное ВЧ Оборудование Hi_ > ■italatal^lal Приёмник С Приёмное ВЧ Л ^ ^-М { ^ Оборудование J у U :bi~gr ^Jj r naatelal^B] Приёмник fcasiaiswiai Приёмник Рис 11.13 Пример построения сети цифрового радиовещания
Цифровой переключатель ASI Цифровой переключатель ASI Цифровой переключатель ASI Дистанционный доступ управления NMS условного доступа Рис 11.14. Система ремультиплексирования
wf %d ▼ Of :_ Корпоративнь le Абоненты *
Оборудование MPEG-2 DVB компании Tadiran SCOPUS Видео-аудио кодеры 4:2:2/4:2:0 CODICO E-1X00 DSNG кодер CODICO E-1500 Приемники-декодеры 4:2:2/4:2:0 CODICO IRD-2XOO Мультиплексоры ремультиплесоры RTM-3XOO IP-DVB шлюз IGW-600 IP-DVB PCI приемник ISM-600 DM-240 IP-DVB NET-600 Оборудование MPEG-2 DVB компании RadyneComStream Аудио кодер DAC-700 Аудио приемник ABR-202 1 ■*_. ■ DVB модуляторы DVB-3030, Рис 1116. Оборудование для построения сетей телерадиовещания и Интернет, предлагаемое компанией Syrus Systems
Глава 11. Построение аппаратуры цифрового ТВ вещания 289 составляют 2...31 Мсимв/с, диапазон входных частот по радиоканалу 900...2150 МГц, пороговое отношение Eb/No зависит от скорости кодирования и вписывается в рекомендованные DVB значения (см. табл. 6.2). Наличие широких возможностей по приему обусловливает довольно высокую цену профессиональных устройств. Она определяется значительными затратами на разработку программного обеспечения, высокой стоимостью набора специализированных микросхем из-за их незначительной серийности (десятки тысяч по сравнению с миллионами для абонентских приемников), наличием большого числа вспомогательных узлов и блоков (интерфейсы, измерители достоверности, высококачественные кодеры сигналов цветности и т.д.). Самые универсальные декодеры и ПД стоят сегодня 2,5-4 тыс. долл. США, несколько более простые устройства для головных станций кабельных сетей — от 1200 до 2500 долл. Незаполненной остается ниша для профессиональных устройств с уровнем цен 1000 долл. и ниже. Некоторые сведения о выпускаемых устройствах можно найти в табл. А5 и А6 Приложения А. 11.6. АБОНЕНТСКИЕ ПРИЕМНЫЕ УСТРОЙСТВА Абонентское приемное устройство, в отличие от профессионального, имеет конкретную и ограниченную задачу — восстановить после цифрового сжатия исходное изображение и звуковое сопровождение и подать их в аналоговом виде на ТВ приемник. Соответственно и структурная схема абонентского ПД (рис. 11.6) значительно проще, чем профессионального, хотя сигнал проходит те же основные этапы обработки — это выделение в тюнере нужного канала, демодуляция, демультиплексирование, декодирование выбранных цифровых потоков, преобразование в аналоговую композитную форму в одном из выбранных стандартов цветности. В схеме можно условно выделить пять функциональных модулей: входного интерфейса, обработки MPEG-сигнала, условного доступа, модуль контроллера и выходной модуль. Модуль входного интерфейса выполняет очевидные функции выделения и демодуляции принимаемого сигнала. В зависимости от назначения приемного устройства он может быть выполнен в спутниковом, кабельном или эфирном вариантах, различающихся диапазоном входных частот и методом модуляции. На рис. 11.7 в качестве примера показана схема модуля для спутникового приема. Сигнал с малошумящего конвертора в полосе частот 0,95...2,15 ГГц преобразуется в тюнере на более низкую промежуточную частоту, например, 480 МГц. Для облегчения фильтрации побочных составляющих в смесителе частота гетеродина выбирается обычно выше частоты сигнала, получающаяся при этом инверсия спектра компенсируется инвертированием цифрового сигнала. В качестве гетеродина используется генератор, управляемый напряжением (ГУН) с выхода схемы ФАПЧ, подстраивающей его частоту по опорному генератору приемника. Сигнал с выхода смесителя фильтруется высокоизбирательным фильтром на поверхностных акустических волнах (ПАВ) и поступает на вход демодулятора ФМ- 4. Как и в модуляторе, применяется квадратурная схема и раздельная обработка I и Q компонентов. После декодера Витерби, восстановителя перемежения и декодера Рида- Соломона на выходе модуля формируется транспортный поток MPEG-2.
290 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Дальнейшая обработка ТП осуществляется в микросхемах высокого уровня интеграции (БИС или СБИС — больших или сверхбольших интегральных схемах). По мере развития цифровой техники число основных микросхем, применяемых в ПД, постоянно уменьшалось, соответственно снижалась и их стоимость. Этот процесс можно продемонстрировать на примере продукции компании LSI Logic — одного из ведущих производителей комплектов микросхем (чипов) для цифровых приемников. В приемниках первого поколения, выпускавшихся в середине 90-х годов, все основные функции выполнялись отдельными ИМС, каждая использовала собственные ОЗУ на отдельных микросхемах памяти, 8- или 16-битовый процессор имел относительно невысокую производительность, общее число микросхем превышало полтора десятка, а их стоимость составляла до 55% стоимости изделия. Появившиеся на пару лет позже приемники второго поколения обходились лишь тремя основными чипами — входного модуля, демультиплексора и MPEG-декодера, двумя ОЗУ А 32-битовый процессор имел производительность уже 45 MIPS (Million Instructions Per Second — миллион операций в секунду). В приемниках третьего поколения функции демультиплексора и декодера удалось объединить в одной микросхеме (так называемая «одночиповая» модель), при этом и число ОЗУ сократилось до одного, что позволило еще снизить стоимость приемника. Архитектура основной микросхемы такого приемника показана на рис. 11.8. Все современные модели строятся на основе одной интегральной микросхемы MPEG- демультиплексора — декодера и ограниченного числа других узлов (тюнер, микросхемы памяти, блок питания, корпус). К другим факторам, способствующим прогрессирующему снижению стоимости абонентских ПД, следует отнести рост объема производства (по подсчетам, в год выпускается более 15 млн цифровых спутниковых приемников), ограниченный по сравнению с профессиональными моделями набор функций, относительно несложное программное обеспечение и простые входные и выходные интерфейсы. Совокупное действие этих факторов позволило снизить оптовую цену массовых моделей до 140-160 долл. США, и ожидается дальнейшее снижение до 100-120 долл. к концу 2001 года. Тем не менее современный абонентский ПД обладает достаточно широкими возможностями по приему и декодированию ТВ программ. Ниже в качестве примера для иллюстрации этих возможностей приведена спецификация приемника XSat.CDTV.310, используемого на сети «НТВ Плюс». Спецификация цифрового приемника XSat.CDTV.310 1. Число программируемых каналов — не менее 200. 2. Обеспечивается возможность загрузки «по эфиру» новых версий программного обеспечения. 3. Приемник имеет один вход, входное сопротивление 75 Ом, входной разъем типа «F» — розетка. 4. Полоса рабочих частот по входу 0,95...2,15 ГГц. 5. Диапазон изменения уровня входных сигналов — от минус 65 до минус 25 дБм. 6. Коэффициент шума: < 8 дБ. 7 Избирательность по зеркальному каналу приема не менее 40 дБ. 8. Формат входного цифрового сигнала: MPEG-2/DVB, режим «Главный уровень Главный профиль», максимальная разрешающая способность 720 х 576 пикселов. 9. Символьная скорость цифрового потока на входе: в пределах 13...30 Мсимв/с. 10. Система цветности на выходе приемника — PAL, полярность видеосигнала — положительная.
Глава 11. Построение аппаратуры цифрового ТВ вещания 291 11. Формат ТВ изображения: 4:3 или 16:9. 12. Поддержка режима телетекста (с повторной вставкой в VBI). 13. Объем флэш-памяти: не менее 2 Мбайт. 14. Объем динамической памяти: не менее 2 Мбайт. 15. Система условного доступа: Viaccess (версия 1.0). 16. Приемник обеспечивает следующие выходные сигналы: композитный ТВ сигнал PAL с размахом 1,0+0,15 В на нагрузке 75 Ом; компонентный RGB сигнал (на разъеме типа SCART); стереофонический сигнал звукового сопровождения телевидения или звукового вещания; AM ТВ радиосигнал в диапазоне дециметровых волн. 17 Формат звуковых сигналов: MPEG1/2 Layer II (Musicam) с частотами дискретизации 32 кГц, 44,1 кГц и 48 кГц, полоса передаваемых частот 30... 15 000 Гц (по уровню минус 1,5 дБ) при 32 кГц и 20...20 000 Гц при 48 кГц, номинальное значение эффективного напряжения выходного сигнала — 0,5 В на нагрузке 10 кОм. 18. Поддерживается функция приглушения звука (MUTE). 19. Приемник формирует AM ТВ радиосигнал на частотах 21...69 каналов в стандарте PAL-K с выходным уровнем не менее 72 дБ(мкВ) на нагрузке 75 Ом. 20. Обеспечивается транзит через приемник с затуханием не более 1 дБ сигналов наземного телевидения в полосе частот 48...862 МГц и суммирование этих сигналов с выходным сигналом тюнера. 21. Приемник обеспечивает выход сигнала первой ПЧ (разъем типа «F» — розетка) с разрывом по постоянному току для подключения дополнительного приемника и прохождение сигнала 22 кГц от этого приемника. 22. Приемник обеспечивает напряжение 13...14 В и 17...19 В для управления поляризатором и питания конвертера при токе потребления не менее 400 мА. Предусмотрена защита от короткого замыкания по этой цепи. 23. Управление приемником осуществляется с передней панели (функции включения/выключения и последовательного переключения программ) и с пульта дистанционного управления на расстоянии не менее 8 м в секторе углов ±45°. 24. Приемник обеспечивает следующий набор сервисных функций: — ручная установка частоты гетеродинов конвертора (одиночного или универсального); — ручная установка частоты сигнала; ручная установка символьной скорости (PID-коды должны определяться автоматически); — ручная установка FEC (1/2, 2/3, 3/4, 5/6, 7/8); ручная установка поляризации; — автоматическая настройка (после набора кода); — стирание ранее записанных в памяти программ; — режим фаворитного списка программ; — установка родительского кода; индикация перечня записанных программ; — вывод на экран информации ЭПП (7 дней, 50 каналов, 25 событий в день). 25. На задней панели приемника расположены: — разъем типа SCART: — выход композитного ТВ сигнала;
292 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю — выход сигнала RGB; выход сигнала звукового сопровождения (левый/правый); разъемы типа RCA: выход композитного ТВ сигнала; одна пара «левый/правый» для звукового стереосигнала; — разъемы типа IEC: розетка вход от радиоантенны или кабельной телевизионной сети; — вилка — выход AM ТВ модулятора; разъемы типа «F» (розетка): вход сигнала ПЧ от конвертора; выход сигнала ПЧ ко второму приемнику; 9-штырьковый разъем DB9 для подключения к ПК. 26. В приемнике предусмотрена оптическая индикация уровня принимаемого сигнала на ТВ экране для обеспечения настройки антенны на ИСЗ и измерение отношения E6/N. 27 Электропитание приемника осуществляется от сети переменного тока напряжением (220+22/минус 33) В и частотой (50+2,5) Гц. Потребляемая мощность не более 40 Вт. 28. Приемник удовлетворяет данным требованиям в интервале температур от +5 до +40°С и в условиях воздействия верхнего значения относительной влажности 80% при 25°С. 29. Среднее время наработки на отказ приемника более 30 000 часов. 30. Срок службы приемника более 10 лет. Как видно из спецификации, приемник обладает достаточно широким диапазоном входных скоростей, может осуществлять загрузку программного обеспечения «по воздуху» и даже имеет упрощенный измеритель Eb/No для оценки запаса по приему. ПД более высокого класса выпускаются для сетей интерактивного телевидения. Такой приемник, как правило, имеет увеличенный объем флэш-памяти и динамической памяти, в него при изготовлении заложена интерактивная операционная система (см. главу 9), обратный канал интерактивного взаимодействия функционирует посредством встроенного или внешнего модема (телефонного, кабельного) или адаптера к цифровой абонентской сети (ISDN, ADSL). Следующий уровень развития технологии индивидуального приема — недавно появившиеся мультимедийные приемники, обеспечивающие одновременно с просмотром ТВ программ, выходом в Интернет, реализацией различных интерактивных приложений и независимо от них возможность получения, обработки и хранения на жестком диске мультимедийного контента самого различного содержания. Совмещение функций во времени достигается благодаря наличию в приемнике второго тюнера. «Интеллектуальное» программное обеспечение выбирает из передаваемого контента программный материал с учетом вкусов владельца, исходя из предшествующего опыта и проявленных ранее предпочтений, и записывает этот материал на носителе с большим объемом памяти (имеются сообщения о моделях с дисками емкостью до 40 Гбайт). Передача контента может происходить и в ночное время, когда каналы связи относительно свободны и тарифы понижены. В качестве примера мультимедийного приемника рассмотрим модель met@box 2000 (Phoenix) компании Met@box AG. Он поддерживает широкий круг мультимедийных' форматов, включая CD, DVD, МРЗ. Объем оперативной памяти составляет 32 Мбайт с
Глава 11. Построение аппаратуры цифрового ТВ вещания 293 возможным расширением до 512 Мбайт (хотя разработчики и признают, что такой объем едва ли когда-либо понадобится), флэш-памяти до 8* Мбайт. Жесткий диск емкостью 6,4 Гбайт (может заменяться на более емкий) позволяет накапливать значительный объем информации. Имеются привод для проигрывания CD дисков, привод DVD и DVD-проигрыватель, совместимый с форматами MPEG-1, MPEG-2, MPEG-4. В приемнике предусмотрен широкий выбор высокоскоростных интерфейсов для работы в различных сетях коммутируемой телефонной, сети кабельного телевидения, цифровых сетях ISDN, Ethernet, ADSL — и соответствующих модемов. Набор тюнеров позволяет подключаться к спутниковым, кабельным и эфирным источникам сигналов. Видео- и звуковые интерфейсы включают аналоговые видео (RGB, композитный сигнал) и звук, цифровой звук SP/DIF, для обмена данными можно использовать стандартный параллельный порт IEEE1284, последовательные порты, высокоскоростной порт данных USB. Программное обеспечение приемника включает операционную систему Linux, виртуальную машину Java и новейшие Java API, последнюю версию HTML и Интернет- браузер, что дает возможность посылать и получать электронную почту, извлекать любую информацию из Интернета и использовать интерактивные приложения типа ЭПП и интерактивного телевидения. Предусмотрены режимы «картинка в картинке», наложение видеоизображений (телевидение поверх Интернета, полупрозрачные надписи поверх телевидения с четырьмя уровнями прозрачности). К приемнику могут подключаться разнообразные периферийные устройства беспроводная клавиатура, принтер, микрофон, акустические колонки, видеокамера, видеомагнитофон и другие источники видеосигнала. Технические характеристики абонентских ПД различных производителей сведены в табл. А12 Приложения А. 11.7. УСТРОЙСТВА ПЕРЕДАЧИ И ПРИЕМА ДАННЫХ ПОЛЬЗОВАТЕЛЯ Передача данных в составе транспортного потока MPEG-2 относится к сравнительно новым видам связи и начала развиваться после принятия стандарта EN 301 192 в направлении скоростного Интернета передачи информации из Интернета по скоростным каналам систем цифрового вещания. Наиболее подходящим средством ввода IP- дейтаграмм в пакеты транспортного потока оказалась многопротокольная инкапсуляция, этот процесс рассматривался нами в главе 7 Инкапсуляторы, осуществляющие процесс ввода дейтаграмм, характеризуются скоростью выходного потока (обычно в пределах пропускной способности спутникового ствола 38...40 Мбит/с), числом поддерживаемых потоков (числом различных PID), входными и выходными интерфейсами. Ввод информации обычно осуществляется по высокоскоростной сети Ethernet 100BaseT, в качестве формата выходного потока предпочитают DVB-ASI как наиболее универсальный, хотя в качестве опций могут использоваться и другие интерфейсы. Адресация передаваемой информации осуществляется путем присвоения каждому абоненту уникального 48-битного MAC адреса. Специальное программное обеспечение на передающей стороне управляет потоками передаваемой информации, ведет учет трафика и тарификацию, осуществляет расчеты с абонентами.
294 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Гибкость стандарта MPEG-2 и разработанная DVB концепция контейнера данных позволяют передавать в одном транспортном потоке инкапсулированные данные и любые другие сигналы в стандарте MPEG-2/DVB, если выход инкапсулятора подключен к одному из входов мультиплексора. Многие модели инкапсуляторов формируют минимально необходимый набор таблиц PAT, PMT, С А и могут работать непосредственно на модулятор, если на данной несущей частоте не предполагается передачи других сигналов. Инкапсуляторы первого поколения, такие, как упомянутые в табл. А.9 Приложения A DBN24, DBN25, DBN26 компании SkyStream, DVS5010, DVS5015 компании Philips, IP Encapsulator компании NDS, представляли собой сложные и дорогостоящие устройства. Сейчас появились более компактные и недорогие устройства, обеспечивающие более гибкое управление потоками и более эффективное использование емкости ствола. Некоторые из этих устройств также описаны в табл. А.9. В качестве примера рассмотрим подробнее устройство и работу инкапсулятора IGW- 600 компании Tadiran Scopus. Это устройство обеспечивает соединение между сетями с разными стандартами — IP-сетью и широкополосным спутниковым или кабельным DVB каналом — и потому относится к категории шлюзов (см. главу 6). На входной стороне IGW-600 соединяется по интерфейсу 10/100BaseT с двумя независимыми локальными сетями, по одной из которых происходит передача данных (эта сеть может быть незащищенной, например, Интернет), по другой, защищенной, осуществляется контроль и управление работой устройства. По выходу инкапсулятор IGW-600 имеет интерфейс DVB-ASI и может непосредственно подсоединяться к DVB модулятору (в режиме SCPC) или входу мультиплексора (в режиме МСРС). IGW-600 полностью совместим со спецификацией DVB стандарта передачи данных EN 301 192 и обеспечивает следующие возможности передачи: 1. IP-multicast — возможность посылать одно и то же сообщение одновременно нескольким абонентам. 2. Конвейеризация данных, потоковая передача и многопротокольная инкапсуляция. 3. Взаимодействие со стандартными маршрутизаторами. 4. Обеспечение заданного QoS. 5. Заполнение дейтаграмм для обеспечения прохождения TCP/IP через DVB мультиплексоры со встроенными буферами. 6. Поддержка до 8192 PID в выходном транспортном потоке. 7. Дистанционная установка новых версий программного обеспечения. 8. Поддержка пользовательских групп. 9. Пакетное кодирование для обеспечения конфиденциальности передаваемой информации. Инкапсулятор принимает TCP/IP дейтаграммы, адресованные абонентам, и преобразует их в DVB-совместимый транспортный поток MPEG-2. Принимаются два типа дейтаграмм — индивидуальные пакеты и групповые (многопользовательские) пакеты. Групповые пакеты обычно служат для распределения файлов или распределения потоков аудио или видео. Когда абонент делает запрос на получение данных, пакет запроса направляется к прокси-серверу. Последний действует как посредник между адресатом и абонентом. Прокси-сервер выбирает данные из своей кэш-памяти или Интернета и возвращает запрошенные данные абоненту через шлюз. Инкапсулятор управляется и конфигурируется Центральным Устройством Конфигурации CCU (Central Configuration Unit) — так называется программное приложение, работающее на платформе Windows NT. Это приложение подключается к локальной
Глава 11. Построение аппаратуры цифрового ТВ вещания 295 сети контроля и управления, оно контролирует действия абонентов, выбирает прокси- сервер для каждого сеанса связи, обслуживает таблицу маршрутизации на прокси-сервере и взаимодействует с внешними системами тарификации и аутентификации. Каждый раз при входе абонента в сеть CGU информирует IGW-600 о классе и качестве предоставляемых абоненту услуг, группе и параметрах кодирования. При выходе абонента CCU обновляет данные инкапсулятора и забирает накопленную им учетную информацию об абоненте. Управление качеством предоставляемых услуг осуществляется путем выделения абоненту ресурса пропускной способности, определяемого его абонентской платой. IGW- 600 позволяет оперировать двумя параметрами QoS для каждого пользователя: согласованной скоростью передачи информации (Committed Information Rate) и максимальной скоростью передачи (Maximum Rate). Основным средством индивидуального приема данных в системах высокоскоростного доступа в Интернет была и пока остается специализированная компьютерная плата, вставляемая в свободный слот на материнской плате компьютера и взаимодействующая с ресурсами компьютера по высокоскоростной шине данных. Такие платы выпускаются многими производителями, и их цена сейчас опустилась ниже цены абонентских цифровых приемников. Корпоративные пользователи офисы компаний, небольшие локальные сети используют для приема данных устройства более высокого класса, соединяющие в себе функции обратного преобразователя данных из формата транспортного потока в IP- дейтаграммы и шлюза локальной сети, распределяющего принятую информацию в соответствии с присвоенными адресами. Некоторые из имеющихся на рынке устройств приема данных упомянуты в табл. А.9 Приложения А. В любом случае абоненту для работы необходим обратный кан^л, который чаще всего организуется через модемное соединение или по выделенной линии (см. главу 9). Бот как организуется, например, сеанс передачи данных при использовании описанных выше инкапсулятора IGW-600 и управляющей системы, разработанных компанией Tadiran Scopus. Если абонент использует модемное соединение, он до начала работы должен соединиться с локальным оператором, предоставляющим услуги Internet. После установления модемного соединения абоненту присваивается динамически выделяемый IP-адрес. Далее инициализируется приложение, которое обеспечивает установление соединения с центральной станцией, настройку приемного оборудования, контроль соединения. Это приложение отправляет в Центральное Устройство Конфигурации (CCU) следующую информацию об абоненте: логин и пароль; текущий IP-адрес; МАС-адрес приемного оборудования. Одновременно осуществляется настройка приемного оборудования. После получения запроса от абонента CCU посылает запрос с информацией об абоненте в систему аутентификации. Если абонент зарегистрирован, система аутентификации подтверждает, что абонент имеет право работать в системе. Одновременно с подтверждением передается и информация о качестве сервиса, если таковой был определен. После получения подтверждения CCU посылает информацию системе тарификации о начале работы абонента и команду прокси-серверу включить данного абонента в список маршрутов. В инкапсулятор посылается команда зарегистрировать динамического абонента с определенным IP-адресом, определенным МАС-адресом и качеством сервиса. После всех процедур приложению абонента посылается подтверждение о корректности регистрации в системе и возможности работы. В ходе сеанса CCU осуществляет непрерывный контроль за целостностью обратного
296 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю канала от абонента, посылая к абоненту запросы и ожидая подтверждения. Если время ожидания превышает допустимое или от приложения абонента пришло сообщение о конце работы, CCU сообщает системе тарификации о выходе абонента из системы, посылает команду инкапсулятору об исключении абонента из своей базы, удаляет IP- маршрут в прокси-сервере. С этого момента вся информация для данного абонента будет игнорироваться. Если абонент использует выделенный канал доступа в Internet или непосредственно на центральную станцию сети, процесс регистрации в начале каждого сеанса исключается. Такой абонент регистрируется в инкапсуляторе только один раз, при этом прокси- серверу сразу указывается постоянный маршрут для данного абонента. Все приложения абонента должны быть настроены на работу с тем прокси-сервером, который ему назначен. Запрос от приложения поступает на прокси-сервер. Сервер подменяет IP-адрес абонента на свой и отправляет запрос в Internet от своего имени. Ответы возвращаются на прокси-сервер, который, в свою очередь, восстанавливает адрес абонента и пересылает ответы в инкапсулятор. Инкапсулятор проверяет наличие IP-адреса абонента в своей базе и при наличии такового осуществляет преобразование и передачу IP пакетов в сторону абонента. 11.8. ПРИМЕРЫ ПОСТРОЕНИЯ ЦИФРОВЫХ АППАРАТУРНЫХ КОМПЛЕКСОВ В предыдущих разделах данной главы описана обобщенная конфигурация сети цифрового вещания и приведены сведения об устройстве и функционировании отдельных элементов аппаратуры. В данном разделе мы дадим несколько конкретных примеров построения различных подсистем и комплексов, решающих те или иные задачи цифрового вещания. А. Передающий центр студии цифрового вещания При построении передающего центра использована аппаратура цифрового сжатия и обработки сигналов компании Tadiran Scopus. Изменяя число кодеров и кратность резервирования, можно построить передающий центр практически любой конфигурации. В приведенной на рис. 11.9 структурной схеме комплекса использована следующая конфигурация: число ТВ программ 8 число видеокодеров 10 (8 + 2) число звуковых программ 4 стерео число звуковых кодеров 2 (1 + 1) число 1Р-шлюзов 2 (1 + 1) система сетевого управления NMS-4000 1 система статистического мультиплексирования 1 система условного доступа 1
Глава 11. Построение аппаратуры цифрового ТВ вещания 297 ТВ и радиопрограммы, подготовленные на студии, подаются на входную коммутационную матрицу. Программы могут подаваться в аналоговом или цифровом формате. Входная матрица позволяет осуществлять как ручное, так и автоматическое, под управлением NMS-4000, переключение на резервный кодер. В качестве видеокодеров используются Е-1x00, описанные в разделе 11.2, для обработки звуковых сигналов применены кодеры Е-900, в этом режиме они обеспечивают сжатие до четырех стереосигналов. Сжатые цифровые сигналы с выходов кодеров через ASI-переключатель поступают на входы основного или резервного мультиплексора, который объединяет потоки отдельных программ в единый транспортный поток. При необходимости в мультиплексоре могут осуществляться замена идентификаторов PID входного потока на другие значения, ресинхронизация потоков с коррекцией PCR, введение служебной информации — как обязательной, так и дополнительной (ЭПП). Мультиплексор имеет встроенный DVB скремблер, управляемый по протоколу Simulcrypt, и может работать с любой системой условного доступа, поддерживающей данный протокол. Выходы мультиплексоров подключены к входам модуляторов, а выходы рабочего и резервного модуляторов подсоединяются к переключателю резерва RSW-7100, обеспечивая таким образом резервирование ветвей «мультиплексор — модулятор» (аналогично рис. 11.26). Можно резервировать мультиплексоры и модуляторы отдельно, установив на выходах мультиплексоров дополнительный переключатель (аналогично рис. 11.2а). Комплекс работает под контролем системы управления NMS-4000. Система обеспечивает широкие возможности управления сетью: конфигурирование, контроль, диагностику, управление пропускной способностью, переключение на резерв. Например, несколькими щелчками «мыши» оператор может подключить любой канал из студии на вход любого кодера. Так же легко осуществить конфигурирование любого компонента - кодера, мультиплексора, модулятора или переключателя. NMS-4000 может управлять автономным функционированием оборудования. При этом система следит за состоянием каждого устройства и при возникновении сбоев осуществляет переконфигурирование резервного комплекта и переключение на него. Параллельно производится регистрация всех событий в системе, что позволяет проводить последующий анализ поведения аппаратуры. Возможность дистанционного управления системой позволяет осуществлять удаленный доступ, контроль, диагностику и принятие оперативных мер без присутствия оператора на рабочем месте. Дополнением к системе управления является система статистического мультиплексирования. Статистическое мультиплексирование позволяет экономить полосу пропускания благодаря тому, что кодеры серии Е-1x00 поддерживают переменную выходную скорость выходного потока. Статистический мультиплексор осуществляет непрерывный контроль и управление работой каждого кодера, выделяя ему ресурсы битовой скорости, пропорциональные сложности обрабатываемого в данный момент изображения. Алгоритм управления каждым кодером и мультиплексором определяется критериями качества и приоритетами для той или иной телевизионной программы. NMS-4000 отображает результаты работы статистического мультиплексора в виде наглядных графиков, удобных для оператора. По данным Tadiran Scopus, использование статистического мультиплексирования уже при пяти кодерах позволяет реально экономить до 25...30% используемой емкости канала без ухудшения качества изображения. Дополнительно в передающий центр может быть установлена система Internet-вещания. Эта система строится на базе инкапсуляторов IGW-600 и в полной конфигурации состоит из следующих компонентов:
298 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю — инкапсуляторы IGW-600 — рабочий и резервный; — сервер резервирования инкапсуляторов HAS-2000 с переключателем; — центральная управляющая система CCU; — система авторизации и тарификации; — прокси-сервер (один или несколько); — система защиты; — маршрутизатор доступа к Internet. Приемная сторона может строиться как на базе компьютерной платы ISM-600, так и на базе приемника с интерфейсом Ethernet (NET-600). Б. Объединение распределенных студий Широкий спектр оборудования цифровой компрессии и обработки сигналов компании Tadiran Scopus позволяет строить распределенные цифровые телевизионные системы, а наличие разнообразных интерфейсов дает возможность соединять оборудование, работающее в различных транспортных средах. Примером комплексного предоставления услуг может служить техническое решение по построению распределенной сети кабельного телевидения (рис. 11.10). Не всегда удается сформировать на местной студии кабельного телевидения весь необходимый набор услуг, в этом случае предлагается сформировать такой набор на центральной студии. Кроме вещательных телерадиопрограмм, в пакет могут быть введены «видео по запросу», электронные базы данных «по запросу», интерактивные игры и многое другое. Все цифровые потоки объединяются в единый поток с помощью мультиплексора RTM-3600, выход которого подключается к сети связи с SDH через интерфейс G.703. На удаленной студии кабельного телевидения, а их может быть достаточно много, транспортные потоки, принятые по сетям SDH с одной или нескольких студий, подаются на мультиплексор RTM-3600. Сюда же подаются транспортные потоки местных телепрограмм с кодеров Е-1x00, программы, принимаемые со спутников, транспортные потоки, несущие дополнительные услуги. Мультиплексор RTM-3600 позволяет повторно обработать многопрограммные транспортные потоки с других студий, местные потоки и сформировать транспортный поток с программами и услугами, представляющими интерес для абонентов данной кабельной сети. В качестве приемников могут использоваться приемники-декодеры компании Tadiran Scopus IRD-25xO, IRD-26xO и кабельные модемы. Такое построение сети позволяет абоненту получить весь спектр услуг, сформированных на различных студиях кабельного телевидения. В. Дистанционное обучение Во многих странах в высших учебных заведениях, коммерческих и государственных организациях, банках используются возможности и принципы телерадиовещания для организации дистанционного обучения и консультаций. В общем случае центр дистанционного обучения может состоять из лекционного класса, консультационного центра, технического центра, системы управления и коммуникационного сервера. Лекционный класс (рис. 11.11) обычно оборудуется видеокамерой, микрофонами, телефонами, системой управления демонстрационным оборудованием. Видео и звуковые сигналы из лекционного класса поступают на студию технического центра, где преобразуются в цифровой формат кодерами Е-1x00. Здесь же производятся вставка в цифровой поток, изображений со слайдов, синхронизация передачи материалов лекции, с сопроводительными данными, вставка дополнительных звуковых сигналов (перевод на другие языки) и т.д. Далее все цифровые потоки объединяются мультиплексором
Глава 11. Построение аппаратуры цифрового ТВ вещания 299 RTM-3600, при необходимости скремблируются с использованием системы условного доступа CAS-5000 и поступают на передающий центр. Абонентами сети могут выступать и индивидуальные абоненты, и специально организованные классы дистанционного обучения. Информация поступает на приемное оборудование (приемники IRD-25xO, IP-модемы ISM/ICM-600), обрабатывается и проецируется на экран с нужным звуковым сопровождением. Дополнительные данные поступают на компьютер, позволяя отображать, сохранять и обрабатывать материалы лекций. Наличие обратных голосового (телефон) и низкоскоростного цифрового каналов позволяет проводить лекции более динамично. Консультационный центр как раз и предназначен для приема голосовой информации от абонентов, оперативного подбора дополнительной информации и передачи ее лектору. Цифровой обратный канал может быть организован через любую сеть: TCP/IP, X.25, Internet и т.д. Коммуникационный сервер осуществляет прием и обработку обратных запросов, цифровой информации, что необходимо для гарантированной доставки цифровой информации до абонентов. Г. Каскадирование кодеров Кодеры цифрового сжатия серии Е-1x00 компании Tadiran Scopus, как отмечалось в разд. 11.2, обеспечивают не только высокоэффективное сжатие видеоданных, но и обладают уникальной способностью мультиплексирования дополнительного высокоскоростного транспортного потока. Внутренняя архитектура кодера Е-1x00 позволяет использовать вход высокоскоростных данных, работающий на скоростях до 20 Мбит/с, для подключения другого кодера. В результате, когда выход дополнительного кодера подключен к входу данных главного кодера, мы получаем на выходе главного кодера единый транспортный поток. Возможны два режима мультиплексирования сигнала от второго кодера. В стандартном режиме он обрабатывается как обычные данные и может быть принят дополнительным приемником, подключенным к выходу высокоскоростных данных основного приемника IRD-2xxO (рис. 11.12). Если в главный кодер установлено дополнительное программное обеспечение, внешний транспортный поток обрабатывается как MPEG-поток телепрограммы и мультиплексируется с основным потоком на более глубоком уровне, что позволяет одним приемником IRD-2xxO принимать любую из двух ТВ программ. В приведенном примере рассматривается структура с двумя кодерами. Однако высокопроизводительный внутренний мультиплексор позволяет каскадировать до 5-6 кодеров и осуществлять формирование полноценного многопрограммного потока. Ограничением служит предельная скорость интерфейса RS-422 главного кодера, стоящего последним в цепочке. Такая уникальная возможность позволяет, к примеру, строить переносные или перевозимые репортажные станции DSNG с несколькими одновременно передаваемыми программами без использования мультиплексора. При этом для увеличения числа программ достаточно установить дополнительный кодер и подключить его ко входу имеющегося. Настройка всей цепочки потребует нескольких минут. Д. Пример построения сети цифрового радиовещания Технология цифрового сжатия может быть эффективно использована при передаче не только телевизионных, но и звуковых программ. Разработанные компанией ComStream звуковой кодек DAC700 и цифровой звуковой приемник ABR202 позволяют передавать и принимать звуковые программы с высоким качеством, не уступающим качеству CD, но при значительно более низких скоростях цифрового потока. В зависимости от требуемого качества может быть выбрана одна из семи скоростей передачи: 64, 96, 112,
300 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 128, 192, 256 или 384 кбит/с. Типовое применение включает распределение радиопрограмм и новостей, создание сетей передачи звуковых программ для регионов с несколькими разговорными языками, корпоративных сетей коммерческого вещания. Возможная схема построения сети показана на рис. 11.13. Помимо звуковых сигналов, оба устройства обеспечивают трансляцию низкоскоростных данных пользователя со скоростями от 300 до 9600 бит/с и сигналов релейных замыканий для управления местными приборами. Подробные технические характеристики DAC700 приведены в табл. Al, ABR202 в табл. А6 Приложения А. Е. Пример построения комплекса ремультиплексирования транспортных потоков Рассмотрим пример реализации системы ремультиплексирования большого числа ТВ программ. Система имеет следующую конфигурацию: 4 входных скремблированных транспортных потока; 3 выходных скремблированных транспортных потока; — модуляция ФМ-4. Для реализации такой системы используются 5 дескремблеров, 4 ремультиплексора, 6 скремблеров, 4 модулятора, управляющий центр и переключатели резервирования. На рис. 11.14 показана структурная схема комплекса. Согласно схеме, четыре транспортных потока подаются на дескремблеры, работающие в режиме горячего резервирования 4:1 (4 рабочих и 1 резервный) и осуществляющие дескремблирование транспортных потоков. Далее транспортные потоки подаются на матричный переключатель ASI, который осуществляет коммутацию и распределение входных потоков таким образом, что каждый транспортный поток поступает на входы четырех ремультиплексоров, один из которых работает в режиме горячего резерва (конфигурация 3:1). Такое включение позволяет каждому ремультиплексору выбирать любые программы из любого входного транспортного потока, формируя новый транспортный поток. Каждый ремультиплек- сор имеет два идентичных выходных интерфейса ASI, которые подключены к двум коммутационным матрицам ASI сигнала. В системе используются ремультиплексоры Cherry Picker CP7000 компании Terayon. Эти устройства являются хорошим решением для кабельных, наземных и спутниковых операторов, которым требуется гибкий и эффективный способ управления сжатыми цифровыми потоками с широким выбором опций программирования для оптимизации занимаемой емкости. Ремультиплексор Cherry Picker позволяет разбирать и собирать компрессированные потоки от большого числа источников входного сигнала для создания нового мультиплексированного выходного сигнала. Пакет услуг, предоставляемых оператором, может включать такие сервисы, как видео по запросу, программы от удаленных и местных вещателей, звуковые программы, реклама, дополнительные данные для улучшенного (enhanced) телевидения и др. Оператор имеет возможность гибкого управления скоростью цифрового потока, включая статистическое мультиплексирование, и приоритетами отдельных программ для оптимизации параметров выходных потоков. Конфигурирование, управление и контроль за ремультиплексорами осуществляет специальный «Контроллер Cherry Picker». Дополнительно этот контроллер взаимодействует с управляющим центром NMS, передавая ему информацию о состоянии ремультиплексоров. В случае выхода из строя одного из ремультиплексоров «Контро'л- лер Cherry Picker» осуществляет переконфигурирование резервного ремультиплексора.
Глава 11. Построение аппаратуры цифрового ТВ вещания 301 NMS, получив сообщение о неработоспособном ремультиплексоре, управляет процессом коммутации переключателей для перехода на резервный ремультиплексор. Выходы матричных ASI переключателей подключены к DVB скремблерам, которые построены на базе мультиплексоров RTM-3600. Для скремблирования канала используется система условного доступа С AS Irdeto (M-Crypt). Управление скремблерами осуществляется по локальной сети, подключенной к С AS Irdeto. С целью повышения надежности для каждого транспортного потока установлены два DVB скремблера рабочий и резервный (схема 1:1), итого шесть скремблеров. Дополнительный контроль за состоянием скремблеров осуществляет система управления NMS. Если скремблер не подтверждает своей работоспособности, NMS осуществляет переключение на рабочий скремблер и сообщает системе условного доступа о проблемах. Далее скремблированные транспортные потоки подаются на переключатель ASI, выходы которого подключены к четырем цифровым модуляторам DVB-3030 — трем рабочим и одному резервному. Выходы модуляторов коммутируются с помощью выходного высокочастотного переключателя RCS-20. Управляющий центр NMS позволяет осуществлять конфигурирование модуляторов, контроль работоспособности и переключение на резерв. Ж. Интернет/Интранет услуги на базе DVB Разработанное компанией Tadiran Scopus оборудование для передачи данных в DVB транспортном потоке описано подробно в разд. 11.7 На схеме рис. 11.15 показан пример построения асимметричной сети передачи данных с использованием IP-шлюза IGW- 600, системы управления NMS, Центрального Устройства Конфигурации CCU, спутникового ISM-600 и кабельного ICM-600 IP-модемов. На рис. 11.16 показаны некоторые образцы цифрового оборудования производства Tadiran Scopus и Radyne Comstream, используемого компанией Syrus Systems. 11.9. ОРГАНИЗАЦИЯ ЭКСПЛУАТАЦИИ СЕТИ ЦИФРОВОГО ТВ ВЕЩАНИЯ Процесс эксплуатации складывается из многих составляющих, но мы в данном разделе остановимся только на одном вопросе, вызывающем наибольшие трудности при переходе от аналогового к цифровому вещанию контроле качества и текущем мониторинге каналов. Рассмотрим его на примере системы спутникового вещания, хотя общие принципы применимы и в других сетях. Проведенный в предыдущей главе анализ искажений и ошибок в цифровом тракте и их влияния на качественные показатели канала приводит к выводу, что оперативный контроль, во всяком случае на данном этапе, должен осуществляться в большей мере субъективно, путем визуального наблюдения оператора за изображением на экране монитора и периодического прослушивания звукового сопровождения. Ни один из предложенных методов и ни одно из выпускаемых промышленностью устройств не предназначены для текущего оперативного контроля объективной меры качества изображения, и в этом по большому счету нет необходимости. Если параметры цифрового сжатия выбраны в соответствии с возможностями кодера и аппаратура работает устойчиво, без
302 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю программных сбоев, качество изображения в тракте передачи будет оставаться очень высоким всегда, за исключением крайне редких «стрессовых» изображений. Отказы оборудования и аппаратные сбои устраняются переходом на «горячий» резерв, и задачей оператора остается отслеживание и устранение программных сбоев, которые не всегда обнаруживаются управляющей системой аппаратуры компрессии. В этой связи часто обсуждается вопрос, приобретать ли резервный комплект оборудования: кодер, мультиплексор, модулятор. Для небольшой телекомпании, планирующей передавать в цифровом формате одну ТВ программу, резервирование означает практически удвоение расходов на оборудование — 140... 160 тыс. долл. вместо 60...80 тыс. на комплект без резервирования. Хорошим решением здесь может быть обращение к спутниковому оператору, предлагающему в аренду не часть емкости ствола, но готовый ТВ канал — с соединительной линией, земной станцией, вещательным спутником. Возможна также кооперация нескольких небольших телекомпаний и совместное приобретение оборудования компрессии для работы в общем стволе. Резервирование N:l оказывается более экономичным, чем схема 1:1. Наконец, можно положиться на статистику и работать некоторое время без резерва. По нашим оценкам, достигнутая на сегодня надежность аппаратной части такова, что в год выходит из строя 3-5% устройств. С вероятностью 85-90% можно ожидать, что в течение года цепочка «кодер-мультиплексор-модулятор» будет работать без отказа. Возвращаясь к оперативному контролю, можно рекомендовать следующий набор контрольных средств на передающей станции: — контрольный профессиональный декодер на выходе мультиплексора или, лучше, приемник-декодер на контрольном выходе модулятора в L-диапазоне с возможностью оперативного вывода изображения и звукового сопровождения на контрольные устройства; — контрольный прием собственного сигнала со спутника на антенну большого диаметра (например, передающую антенну) для эпизодической оценки работы линии вверх (например, при интенсивных осадках); — постоянный прием собственного сигнала на абонентскую приемную антенну и абонентский ПД — для контроля того, что видит в данный момент абонент (этот и предыдущий пункты рекомендаций выполнимы, если передающий центр расположен в пределах зоны покрытия, в противном случае нужно организовывать в зоне покрытия отдельную контрольную станцию); — к этой же абонентской антенне необходимо подключить устройство, позволяющее измерять вероятность ошибки после декодера Витерби или. отношение Eb/No на входе демодулятора (это может быть специальный измерительный приемник, профессиональный ПД или, в крайнем случае, абонентский приемник с функцией измерения Eb/No, например, ПД XSat.CDTV.310); — весьма полезно иметь на станции анализатор транспортного потока, работающий в режиме реального времени (например, описанный в главе 10 анализатор ТТ4000 компании Tandberg Television или аналогичный) для контроля параметров собственного транспортного потока; В данный перечень не включено общестанционное оборудование, необходимое для контроля приходящих сигналов изображения и звукового сопровождения (зависит от интерфейсов соединительной линии) и контроля высокочастотных устройств (анализатор спектра, измеритель мощности, частотомер и т.д.).
ПРИЛОЖЕНИЕ Б СЛОВАРЬ СОКРАЩЕНИЙ И СПЕЦИАЛЬНЫХ ТЕРМИНОВ Абонентская карточка Адаптивное квантование Адаптивное предсказание АДИКМ Активная часть строки Алгоритм максимального правдоподобия Альтернативные данные AM Амплитудная модуляция Аналоговая передача Аналоговый сигнал Аналого-цифровое преобразование Анимация пластмассовая карточка с вмонтированным в нее кристаллом микросхемы, обеспечивающая обработку информации УД и защиту от несанкционированного доступа алгоритм квантования} в котором некоторые параметры изменяются в соответствии со статистическими характеристиками квантуемого сигнала предсказание, в котором оценка производится с учетом спектральных характеристик дискретизируемого сигнала адаптивная дифференциальная И КМ (алгоритм цифрового сжатия с использованием адаптивного предсказания и адаптивного квантования) используемая для передачи видеоданных часть строки длиной 720 периодов частоты дискретизации 13,5 МГц последовательность декодирования, при которой декодер выбирает то кодовое слово, условная вероятность передачи которого максимальна данные, передаваемые при наличии возможности, в противоположность гарантированной передаче данных (например, передача данных в стандарте ATSC) см. Амплитудная модуляция процесс изменения амплитуды высокочастотного колебания под воздействием модулирующего сигнала способ передачи информации посредством аналогового сигнала сигнал, один или несколько параметров которого являются непрерывными функциями времени преобразование аналогового сигнала в цифровой путем последовательного применения операций дискретизации, квантования и цифрового кодирования в MPEG-4 метод кодирования синтетических объектов, заключающийся в однократной передаче базового статического объекта и досылке сообщений, описывающих динамические изменения объекта
388 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю Ансамбль сигналов Арифметический код Асинхронная передача ATM передача Аудиовизуальный объект Аудиообъект АЦП АЧХ совокупность положении вершин суммарного вектора (I+Q) в системе координат (I, Q) алгоритм кодирования без потерь, ставящий в соответствие передаваемой последовательности символов определенный узкий интервал в пределах [0, 1] техника передачи цифрового сигнала без передачи сигнала тактовой частоты, с синхронизацией по специальным битам или знакам (старт-стопные биты, флаги и т.д.) технология высокоскоростной пакетной передачи цифровых сигналов (голоса, видео, данных), базирующаяся на мультиплексировании и коммутации пакетов (ячеек) фиксированной длины 53 байта см. Медиа-объект см. Медиа-объект аналого-цифровой преобразователь, аналого-цифровое преобразование амплитудно-частотная характеристика Базисные изображения ДКП Базовый слой Байт БВН БВНИ Без возврата к нулю Без установления соединения БИС Бит Бифазный код ортогональные двумерные функции, по которым раскладывает изображение дискретно-косинусное преобразование минимальный набор цифровых потоков в масштабируемом профиле единица двоичной информации, равная 8 битам см. Без возврата к нулю БВН инвертированный сигнал "Без возврата к нулю" не пересекает нулевую линию в течение тактового интервала способ связи, при котором не требуется организации фиксированного тракта передачи между передатчиком и приемником (например, пакетная передача) большая интегральная схема — интегральная схема с числом элементов в кристалле до 1000 единица двоичной информации, соответствующая передаче 0 или 1 код, в котором два состояния передаются импульсами двух частот, период одной из которых равен тактовому интервалу, а второй — половине тактового интервала
Приложение Б. Словарь сокращений и специальных терминов 389 Блоковый код БПФ Букет программ Буфер (буферная память) - БФ Быстрое преобразование Фурье код, в котором кодирование и декодирование производятся в пределах определенного участка кодовой последовательности блока см. Быстрое преобразование Фурье совокупность сервисов, предлагаемых абоненту как единый программный продукт устройство памяти большой емкости, позволяющее записывать и хранить большой объем данных и благодаря этому выравнивать скорость поступления данных от источника и бороться с фазовым дрожанием блок фильтров (группа полосовых фильтров с общим входом и раздельными выходами, на каждый из которых поступает часть сигнала, попадающая в полосу пропускания соответствующего фильтра) алгоритм расчета преобразования Фурье с уменьшенным объемом вычислений Вектор перемещения Векторное кодирование Видео по требованию Видео почти по требованию Видеокадр Видеопоследовательность - Виртуальный канал Витая пара В двумерный вектор, описывающий направление и величину перемещения макроблока в опорном кадре при компенсации движения метод кодирования, при котором по каналу посылаются не значения блока отсчетов изображения, а адрес в кодовой книге блока, наиболее близкого к передаваемому способ организации ТВ вещания, при котором абонент получает для просмотра заказанную им программу разновидность службы "видео по требованию" в которой абонент может получить заказанную программу в течение фиксированного интервала времени (15 или 30 мин) набор видеоданных, описывающих один кадр или два поля исходного изображения, состоит из трех прямоугольных матриц 8-битовых чисел, представляющих отсчеты ярко- стного и цветоразностных сигналов последовательность видеокадров произвольной длины канал, организованный в мультиплексоре из ПЭП, принадлежащих другим программам, и воспринимаемый приемниками-декодерами как самостоятельная программа кабель связи, состоящий из двух медных изолированных проводов, свитых вместе; используется для прокладки телефонных линий и локальных вычислительных сетей
390 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю вн Внешний кодер (декодер) Внутренний кодер (декодер) Волновое кодирование Восстановление Восстановление тактовой частоты Восходящий поток (upstream) Временная метка воспроизведения Временная метка декодирования Временное сжатие Временной план предоставления пакетов терминалу (ТВТР) Вставка (plug-in) Встроенный (внедренный) звук Высокочастотное дрожание (alignment jitter) см. С возвратом к нулю в каскадном кодировании каналу кодер (декодер) в каскадном кодировании к каналу кодер (декодер) внешний по отношению к внутренний по отношению итерационный алгоритм кодирования, в котором на каждом этапе благодаря последовательной двукратной фильтрации и децимации образуются уменьшенное базовое изображение и три разностных с меньшим суммарным числом битов операция построения аналогового сигнала по заданному дискретному сигналу выделение сигнала тактовой частоты из принятого сигнала данных обратный тракт (абонент — головная станция) интерактивного канала взаимодействия в сети кабельного телевидения число, указывающее момент времени, когда данный видеокадр должен появиться на выходе декодера число, указывающее момент времени, когда данный видеокадр должен быть декодирован операция сжатия сигнала во времени, осуществляемая записью данных в память с одной тактовой частотой и считыванием с другой, большей тактовой частотой адресуется группам станций и отдельным станциям и указывает выделенные им слоты сменный программный модуль, позволяющий адаптировать программное приложение к иной платформе цифровой поток звукоданных, встроенный в сигнал SDI и передаваемый совместно с видео случайное смещение фронтов сигнальных импульсов относительно сигнала тактовой частоты гвк Геостационарная орбита см. Группа видеокадров круговая орбита высотой 35 786 км в плоскости экватора, находясь на которой, спутник неподвижен относи-
Приложение Б. Словарь сокращений и специальных терминов 391 Гибридное кодирование Гиперканалы Гистограмма Глазковая диаграмма ГО Головная станция Группа видеокадров Группа экспертов по движущимся изображениям ГУН тельно поверхности Земли, так как вращается с той же угловой скоростью, что и Земля. кодирование с использованием более чем одного метода, например, с предсказанием и с преобразованием частотные каналы в полосе частот 300...470 МГц, используемые в сетях кабельного телевидения столбчатая диаграмма (вид графического изображения распределения какой-либо величины по количественному признаку, используется как дескриптор в MPEG-7) интерференционная картина, возникающая при наложении большого числа периодов цифрового сигнала см. Геостационарная орбита комплекс оборудования для формирования вещательного ТВ сигнала в полосе частот 47...860 МГц и ввода его в сеть кабельного телевидения часть видеопоследовательности, начинающаяся с 1-кадра и заканчивающаяся последним видеокадром перед следующим 1-кадром сформирована в 1988 г. МОС и МЭК для выработки стандарта цифрового сжатия движущихся изображений и звуковых сигналов генератор, управляемый напряжением Двунаправленное предсказание Дейтаграмма Декодер Декодирующая карточка Демультиплексор д метод кодирования, использующий предсказание "вперед" (по предыдущим видеокадрам) или "назад" (по предшествующим видеокадрам) единица данных (пакет), передаваемая в сети, работающей по протоколу TCP/IP; содержит адреса источника и адресата и полезные данные устройство, преобразующее сигнал в первоначальную форму, которую он имел до прохождения через кодер см. Абонентская карточка устройство, разделяющее цифровой поток на компоненты Дескремблер Дескриптор устройство, восстанавливающее первоначальный порядок битов, который они имели до скремблирования средство описания признаков мультимедийного контента
СОДЕРЖАНИЕ ПРЕДИСЛОВИЕ 3 ВСТУПЛЕНИЕ 5 1 ВВЕДЕНИЕ В ЦИФРОВОЕ ТЕЛЕВИДЕНИЕ 1.1. ОБЩИЕ ПРИНЦИПЫ ОБРАБОТКИ И ПЕРЕДАЧИ ЦИФРОВЫХ СИГНАЛОВ 9 1.1.1. Элементы цифровой техники 9 1.1.2. Формирование и обработка цифровых сигналов 12 1.1.3. Передача цифровых сигналов по линиям связи 17 1.1.4. Некоторые сведения из теории помехоустойчивого кодирования 20 1.1.5. Модуляция в системах цифрового вещания 28 1.2. ПРЕОБРАЗОВАНИЕ СИГНАЛОВ ИЗОБРАЖЕНИЯ В ЦИФРОВУЮ ФОРМУ 36 1.2.1. Характеристики аналогового видеосигнала 36 1.2.2. Аналого-цифровое преобразование сигнала изображения 40 1.2.3. Форматирование цифрового видеосигнала 42 1.2.4. Частотное и временное представление сигналов 43 1.3. ЦИФРОВЫЕ ИНТЕРФЕЙСЫ В ТЕЛЕВИДЕНИИ 45 1.3.1. Параллельный цифровой интерфейс 45 1.3.2. Последовательный цифровой интерфейс 48 1.3.3. Электрическая часть интерфейса i 51 1.3.4. Оптический последовательный цифровой интерфейс 52 1.3.5. Цифровые интерфейсы ТВЧ 53 1.4. ПРЕОБРАЗОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ В ЦИФРОВУЮ ФОРМУ 54 1.4.1. Двухканальный и многоканальный звуковой сигнал 54 1.4.2. Цифровой сигнал AES/EBU 56 1.4.3. Ввод звукоданных AES/EBU в сигнал последовательного стыка SDI 58 2 СЖАТИЕ ЦИФРОВЫХ СИГНАЛОВ 2.1. ПРИНЦИПЫ ЦИФРОВОГО СЖАТИЯ ВИДЕОДАННЫХ 61 2.1.1. Обзор методов цифрового сжатия 61 2.1.2. Устранение пространственной и временной избыточности видеосигнала 65 2.1.3. Предфильтрация и шумоподавление 67
442 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 2.1.4. Квантование и кодирование коэффициентов ДКП 68 2.1.5. Некоторые действующие стандарты цифрового сжатия 69 2.2. СЖАТИЕ ЗВУКОДАННЫХ 71 2.2.1. Эффект маскирования и психоакустическая модель слуха 71 2.2.2. Полосное кодирование и блок фильтров 73 2.2.3. Квантование и распределение битов 75 2.2.4. Усовершенствованные алгоритмы полосного кодирования 76 3 СТАНДАРТ ЦИФРОВОГО СЖАТИЯ MPEG-1 3.1. ВВОДНЫЕ ЗАМЕЧАНИЯ 77 3.2. АЛГОРИТМ ОБРАБОТКИ ВИДЕОДАННЫХ 78 3.3. СТРУКТУРА ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ 82 3.4. УРОВНИ ОБРАБОТКИ ЗВУКОДАННЫХ 85 3.5. АЛГОРИТМЫ СЖАТИЯ ЗВУКОДАННЫХ КОДЕРАМИ ПЕРВОГО И ВТОРОГО УРОВНЕЙ 86 3.6. АЛГОРИТМ СЖАТИЯ ЗВУКОДАННЫХ КОДЕРАМИ ТРЕТЬЕГО УРОВНЯ 88 3.7. ФОРМИРОВАНИЕ ЦИФРОВЫХ ПОТОКОВ ВИДЕО И ЗВУКА 91 4 ФОРМИРОВАНИЕ ЦИФРОВОГО ПОТОКА ПО СТАНДАРТУ MPEG-2 4.1. СОСТАВНЫЕ ЧАСТИ СТАНДАРТА MPEG-2 95 4.2. СЖАТИЕ ВИДЕОДАННЫХ 96 4.2.1. Особенности алгоритма обработки видеоданных 96 4.2.2. Уровни и профили стандарта MPEG-2 98 4.2.3. Передача киноматериала в каналах с компрессией 102 4.3. РЕАЛИЗАЦИЯ ЦИФРОВОГО МНОГОПРОГРАММНОГО ЗВУКА 103 4.3.1. MPEG-2 —расширение MPEG-1 в сторону многоканального звука 103 4.3.2. Кодирование с пониженными частотами дискретизации 105 4.3.3. Система улучшенного кодирования звука ААС 107 4.4. СИСТЕМНЫЙ УРОВЕНЬ, ПОТОКИ ДАННЫХ И ИНФОРМАЦИОННЫЕ ТАБЛИЦЫ 108 4.4.1. Элементарные потоки сжатых данных и их объединение в единый поток 108 4.4.2. Принципы обеспечения синхронизации цифровых потоков в стандарте MPEG-2 109 4.4.3. Структура транспортного потока 109
Содержание 443 4.4.4. Мультиплексирование, ремультиплексирование и статистическое мультиплексирование 111 4.4.5. Таблицы программно-зависимой информации ^ 113 5 ПЕРСПЕКТИВНЫЕ СТАНДАРТЫ СЕМЕЙСТВА MPEG 5.1. СТАНДАРТ ПРЕДСТАВЛЕНИЯ МЕДИА-ОБЪЕКТОВ MPEG-4 117 5.1.1. Предпосылки создания стандарта 117 5.1.2. Описание сцены 119 5.1.3. Доставка потоков данных 120 5.1.4. Кодирование визуальных объектов 122 5.1.5. Кодирование звуковых объектов 128 5.1.6. Профили и уровни стандарта MPEG-4 132 5.1.7. Идентификация и защита интеллектуальной собственности 137 5.1.8. Перспективы применения MPEG-4 в вещании 138 5.2. СТАНДАРТ ОПИСАНИЯ МЕТАДАННЫХ MPEG-7 139 6 ПЕРЕДАЧА КОМПРЕССИРОВАННЫХ СИГНАЛОВ ПО КАНАЛАМ СВЯЗИ 6.1. ПРОЕКТ DVB И ОСНОВНЫЕ СТАНДАРТЫ ГРУППЫ DVB 143 6.2. ТАБЛИЦЫ ИНФОРМАЦИИ О СЛУЖБАХ SI 145 6.3. СТАНДАРТ DVB-S 149 6.3.1. Элементы спутникового вещания 149 6.3.2. Передача цифровых сигналов MPEG-2/DVB-S по спутниковым каналам 150 6.3.3. Модуляция в DVB-S 152 6.4. СТАНДАРТ DVB-C 156 6.4.1. Структура типовой кабельной сети 156 6.4.2. Особенности передачи цифровых сигналов по сетям кабельного телевидения 158 6.4.3. Методы модуляции и помехоустойчивого кодирования, используемые в стандарте DVB-C 159 6.5. СТАНДАРТ DVB-T 161 6.5.1. Требования, положенные в основу разработки стандарта DVB-T 161 6.5.2. Выбор параметров COFDM 162 6.5.3. Построение передающего тракта эфирного цифрового вещания 164 6.5.4. Работа COFDM передатчиков в одночастотной сети 166 6.5.5. Иерархическая модуляция в системах с COFDM 167 6.6. СТАНДАРТЫ ISDB 168
444 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 6.7 СТАНДАРТ ATSC 173 6.7.1. Обработка видеоданных ТВЧ 173 6.7.2. Выбор вида модуляции для стандарта ATSC 174 6.7.3. Формирование сигнала стандарта ATSC 177 6.7.4. Передача звуковых сигналов в стандарте ATSC — система АС-3 (Dolby Digital) 181 6.8. СРАВНЕНИЕ ОБП-8Т С COFDM 184 6.9. ИНТЕРФЕЙСЫ ТРАНСПОРТНОГО ПОТОКА MPEG-2 192 6.10. ПЕРЕДАЧА КОМПРЕССИРОВАННЫХ СИГНАЛОВ ПО МАГИСТРАЛЬНЫМ ЛИНИЯМ СВЯЗИ СОВМЕСТНО С ДРУГИМИ СИГНАЛАМИ 196 6.10.1. Ввод сжатых данных в сети ATM 196 6.10.2. Передача MPEG сигналов по каналам SDH, PDH и IP 199 7 ПЕРЕДАЧА ДАННЫХ ПОЛЬЗОВАТЕЛЯ И ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ В ТРАНСПОРТНОМ ПОТОКЕ MPEG-2 7.1. ПЕРЕДАЧА ДАННЫХ ПОЛЬЗОВАТЕЛЯ 201 7.1.1. Методы передачи 201 7.1.2. Особенности применения различных методов 204 7.1.3. Протокол высокоскоростной передачи информации DSM-CC 206 7.2. ВВЕДЕНИЕ В ТРАНСПОРТНЫЙ ПОТОК КОНТЕНТНО-ЗАВИСИМОИ ИНФОРМАЦИИ. 208 8 УСЛОВНЫЙ ДОСТУП (УД) В СИСТЕМАХ ЦИФРОВОГО ТВ ВЕЩАНИЯ 8.1. ОГРАНИЧЕНИЕ ДОСТУПА КАК ОСНОВА ПЛАТНОГО ТЕЛЕВИДЕНИЯ 211 8.2. ПОСТРОЕНИЕ СИСТЕМ УД 212 8.3. ПРИЕМ СИГНАЛОВ В НЕСКОЛЬКИХ СИСТЕМАХ УД 217 8.4. УПРАВЛЕНИЕ УД ПРИ СМЕНЕ СРЕДЫ ВЕЩАНИЯ 219 8.5. БОРЬБА С ПИРАТСТВОМ 219 9 ИНТЕРАКТИВНЫЕ ВЕЩАТЕЛЬНЫЕ СЛУЖБЫ 9.1. ВИДЫ ИНТЕРАКТИВНОГО ВЗАИМОДЕЙСТВИЯ АБОНЕНТА С ПРОГРАММОЙ 221 9.2. МОДЕЛЬ СИСТЕМЫ, УРОВНИ ВЗАИМОДЕЙСТВИЯ С ИСТОЧНИКОМ 223
Содержание 445 9.3. РЕАЛИЗАЦИЯ КАНАЛОВ ВЗАИМОДЕЙСТВИЯ В РАЗЛИЧНЫХ ТРАНСПОРТНЫХ СРЕДАХ 225 9.3.1. Коммутируемые сети общего пользования 225 9.3.2. Сети кабельного телевидения 226 9.3.3. Сети спутникового вещания 227 9.3.4. Сети эфирного вещания 233 9.4. ПРЕДОСТАВЛЕНИЕ ИНТЕРНЕТ-УСЛУГ В ВЕЩАТЕЛЬНЫХ СИСТЕМАХ 235 9.5. ОПЕРАЦИОННЫЕ ИНТЕРАКТИВНЫЕ СИСТЕМЫ ДЛЯ ЦИФРОВЫХ ТЕРМИНАЛОВ 237 9.6. СТАНДАРТ МНР. ПЕРСПЕКТИВЫ РАЗВИТИЯ ИНТЕРАКТИВНЫХ СИСТЕМ 241 9.7. IHDN -ДОМАШНИЕ ЦИФРОВЫЕ СЕТИ 245 10 ОЦЕНКА КАЧЕСТВА, ИЗМЕРЕНИЯ И КОНТРОЛЬ ЦИФРОВЫХ ВЕЩАТЕЛЬНЫХ ТВ КАНАЛОВ 10.1. МЕТОДЫ КОНТРОЛЯ И ИЗМЕРЕНИЙ ПАРАМЕТРОВ ЦИФРОВЫХ ТВ КАНАЛОВ 249 10.1.1. Постановка задачи тестирования цифрового канала 249 10.1.2. Концепция качества обслуживания и ее применение к цифровому вещанию 250 10.2. ИЗМЕРЕНИЕ КАЧЕСТВА ИЗОБРАЖЕНИЯ В ТВ КАНАЛАХ С КОМПРЕССИЕЙ 252 10.2.1. Искажения и дефекты изображения после компрессии-декомпрессии 252 10.2.2. Оценка качества изображения методом субъективных экспертиз, ее преимущества и недостатки 254 10.2.3. Оценка качества изображения после декомпрессии методом объективных измерений 255 10.3. ТЕСТИРОВАНИЕ ТВ КАНАЛА С КОМПРЕССИЕЙ НА УРОВНЕ ТРАНСПОРТНОГО ПОТОКА 259 10.3.1. Контроль и анализ транспортного потока в процессе передачи 259 10.3.2. Анализ транспортного потока вне реального времени 266 10.4. ИЗМЕРЕНИЕ ПАРАМЕТРОВ И ОБНАРУЖЕНИЕ ОШИБОК ПЕРЕДАЧИ В ЦИФРОВОМ КАНАЛЕ БЕЗ КОМПРЕССИИ 267 10.4.1. Оценка качества изображения 267 10.4.2. Измерение фазового дрожания 267 10.4.3. Измерение ошибок передачи 268 11 ПОСТРОЕНИЕ АППАРАТУРЫ ЦИФРОВОГО ТВ ВЕЩАНИЯ 11.1. ТИПОВАЯ КОНФИГУРАЦИЯ СЕТИ ЦИФРОВОГО ВЕЩАНИЯ 271 11.2. КОДЕРЫ ЦИФРОВОГО СЖАТИЯ 276 11.3. МУЛЬТИПЛЕКСОРЫ И РЕМУЛЬТИПЛЕКСОРЫ 282
446 ЦИФРОВОЕ ВЕЩАНИЕ: от студии к телезрителю 11.4. ЦИФРОВЫЕ МОДУЛЯТОРЫ 283 11.5. ПРОФЕССИОНАЛЬНЫЕ ДЕКОДЕРЫ И ПРИЕМНИКИ-ДЕКОДЕРЫ 284 11.6. АБОНЕНТСКИЕ ПРИЕМНЫЕ УСТРОЙСТВА 289 11.7. УСТРОЙСТВА ПЕРЕДАЧИ И ПРИЕМА ДАННЫХ ПОЛЬЗОВАТЕЛЯ 293 11.8. ПРИМЕРЫ ПОСТРОЕНИЯ ЦИФРОВЫХ АППАРАТУРНЫХ КОМПЛЕКСОВ 296 11.9. ОРГАНИЗАЦИЯ ЭКСПЛУАТАЦИИ СЕТИ ЦИФРОВОГО ТВ ВЕЩАНИЯ 301 ПРИЛОЖЕНИЕ А. ТЕХНИЧЕСКИЕ ПАРАМЕТРЫ АППАРАТУРЫ ЦИФРОВОЙ КОМПРЕССИИ РАЗЛИЧНЫХ ПРОИЗВОДИТЕЛЕЙ 303 Таблица А1. Кодеры цифрового сжатия 304 Таблица А2. Мультиплексоры и демультиплексоры 322 Таблица A3. Модуляторы 326 Таблица А4. Кодеры цифровой видеожурналистики 330 Таблица А5. Декодеры, дескремблеры 334 Таблица А6. Демодуляторы, приемники-декодеры 342 Таблица А7. Управляющие центры 352 Таблица А8. Системы условного доступа 354 Таблица А9. Устройства передачи и приема данных в формате MPEG-2 356 Таблица А10. Преобразователи интерфейсов 366 Таблица А11. Мониторы и плейеры транспортного потока 370 Таблица А12. Абонентские приемники-декодеры 374 ПРИЛОЖЕНИЕ Б. СЛОВАРЬ СОКРАЩЕНИЙ И СПЕЦИАЛЬНЫХ ТЕРМИНОВ 387 СПИСОК ЛИТЕРАТУРЫ 433