Текст
                    Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

9 785991 204033


Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Рекомендовано в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям подготовки бакалавров «Радиотехника» (профиль «Аудиовизуальная техника»), «Инфокоммуникационные технологии и системы связи» (профиль «Цифровое телерадиовещание»), по специальности подготовки дипломированных специалистов «Радиоэлектронные системы и комплексы» Регистрационный номер рецензии № 2313 от 18.04.2013 г. МГУП Москва Горячая линия - Телеком 2015
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» УДК 621.397.6 ББК 32.841 Б39 Р е ц е н з е н т : канд. техн. наук, доцент А. М. Мончак Б39 Безруков В. Н., Балобанов В. Г. Системы цифрового вещательного и прикладного телевидения. Учебное пособие для вузов / Под ред. профессора В. Н. Безрукова. – М.: Горячая линия – Телеком, 2015. – 608 с.: ил. ISBN 978-5-9912-0403-3. Систематизированы сведения в области построения и функционирования различных систем вещательного и прикладного телевидения. Рассмотрены: специфика построения и современная аппаратурная реализация систем прикладного телевидения; стандарты ТВ вещания ATSC, DVB-T, ISDB, IP-TV; методы цифровой обработки сигналов изображения и повышения их информативности; способы формирования и применения испытательных сигналов для оценки качества ТВ изображений; характеристики цифрового сжатия спектра видеосигналов. Представлены функциональные схемы построения ТВ систем, рассмотрены особенности их работы и характеристики, даны рекомендации по применению. Уделено внимание вопросам построения отдельных узлов и устройств, используемых как в вещательном, так и в прикладном телевидении, принципам и специфике их реализации. Рассмотрены физические процессы цифрового преобразования сигналов и специфика современных преобразователей «свет-сигнал» и «сигналсвет» (ПЗС- и КМОП-матрицы, жидкокристаллические, плазменные и FED-панели, OLED-дисплеи) и др. Студентам вузов, обучающимся по инфокоммуникационным и радиотехническим направлениям подготовки бакалавров и магистров, специалистам и аспирантам соответствующих профилей. ББК 32.841 Адрес издательства в Интернет WWW.TECHBOOK.RU Безруков Вадим Николаевич, Балобанов Владимир Григорьевич СИСТЕМЫ ЦИФРОВОГО ВЕЩАТЕЛЬНОГО И ПРИКЛАДНОГО ТЕЛЕВИДЕНИЯ Учебное пособие для вузов Все права защищены. Любая часть этого издания не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения правообладателя © ООО «Научно-техническое издательство «Горячая линия – Телеком» www.techbook.ru © В. Н. Безруков, В. Г. Балобанов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Семёну Исидоровичу Катаеву — основателю Кафедры телевидения МТУСИ — посвящается ПРЕДИСЛОВИЕ Начало перехода к цифровому телевизионному (ТВ) вещанию стало подлинной революцией на рубеже XX–XXI веков. Цифровое телевидение, дающее значительное увеличение эффективности передачи по каналам связи сигналов изображения и звука, увеличение числа программ и сервиса для телезрителей, должно занять ведущее положение в ТВ вещании, поэтому подготовка специалистов по цифровому ТВ является важной задачей. Области применения методов кодирования и сжатия видеоинформации весьма разнообразны: от передачи и хранения изображений до спутниковых цифровых телекоммуникационных систем. Если цифровому телевизионному вещанию посвящено много научных работ и статей, то цифровой технике прикладного телевидения уделено значительно меньшее внимание, хотя роль и значение прикладного телевидения в настоящее время возрастает. В учебниках и пособиях этому вопросу уделяется недостаточное внимание. В науке, производстве, охране объектов, в военном деле, медицине и быту без прикладного телевидения не обойтись. Также не уделяется должное внимание и подготовке специалистов по обслуживанию и проектированию систем прикладного телевидения. Основной задачей настоящего пособия является ознакомление студентов с основами построения цифровых систем вещательного и прикладного ТВ, с применяемой аппаратурой и её назначением. В пособии освещены в основном только те вопросы, которые нашли отражения в учебных планах по подготовке специалистов направления 210700 — «Инфокоммуникационные технологии и системы связи» профиля «Радиотехника» по дисциплинам «Системы цифрового вещательного и прикладного телевидения», «Основы телевидения и видеотехники, а также направления 210400 для профиля «Цифровое телерадиовещание» по дисциплинам «Телевидение», «Системы и сети цифрового телерадиовещания», «Информационные технологии в телевидении». Настоящее учебное пособие предназначено для студентов радиотехнических специальностей и может быть использовано при написании курсовых и дипломных проектов, при прохождении производственной практики, будет полезным также и для инженерно-технических работников по вещательному и прикладному телевидению.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» ВВЕДЕНИЕ Практическая реализация телевидения стала возможной благодаря ряду открытий и изобретений, сделанных в различных областях науки и техники. Выдающую роль в развитии телевидения сыграли русские и советские учёные. В 1888 г. А.Г. Столетовым впервые в мире были выполнены фундаментальные исследования фотоэлектрических явлений, положивших начало развития фотоэлектрических приборов, имеющих важное значение для телевидения. Работы А.Г. Столетова заложили фундамент создания фотоэлектрических приборов. Изобретение радио — заслуга нашего выдающегося соотечественника, талантливого русского ученого профессора А.С. Попова. Первая публичная демонстрация устройства А.С. Попова для приема электромагнитных волн состоялась в Петербурге на заседании Русского физико-химического общества 7 мая 1895 г. Этот день и вошел в историю как день изобретения радио. В марте 1896 г. А.С. Попов передал электрическими сигналами без проводов текст, состоящий из двух слов «Генрих Герц», на расстояние всего 250 м. А уже в 1900 г. радиосвязь была использована на практике при снятии с камней броненосца «Генерал-адмирал Апраксин» и при спасении рыбаков, унесенных в море. Первая советская радиовещательная станция в Москве была открыта в 1922 году. Она имела мощность около 12 кВт и была в то время самой мощной в мире. Впервые в мире российский учёный Б.Л. Розинг в 1907 г. предложил воспроизводящее устройство — кинескоп, что послужило началу развития электронного телевидения. Первая передающая ТВ трубка, в которой удалось практически реализовать эффект накопления зарядов, была изобретена 24 сентября 1931 г. русским учёным профессором С.И. Катаевым, основателем кафедры телевидения в Московском электротехническом институте связи, в дальнейшем переименованного в Московский технический университет связи и информатики (МТУСИ). На четыре дня раньше профессором С.И. Катаевым в соавторстве с Ю.С. Волковым была подана заявка на изобретение приёмной ТВ трубки, основанной на применении керр-эффекта (поляризация светового потока для управления интенсивностью свечения ТВ экрана). Предложенное здесь
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Введение 5 техническое решение используется во многих современных воспроизводящих ТВ устройствах, В 1932 г. С.И. Катаевым была опубликована статья, содержащая подробное описание передающей телевизионной трубки и способа изготовления мозаичного фотокатода. Это было первое в мировой литературе сообщение о практической конструкции передающей телевизионной трубки с накоплением заряда. В середине 1933 г. в лаборатории Всесоюзного электротехнического института были изготовлены опытные экземпляры отечественной телевизионной передающей трубки. За границей работы по созданию передающей трубки с накоплением были проведены русским учёным В.К. Зворыкиным в США. В середине 1933 г. корпорацией RCA была изготовлена передающая трубка, названная иконоскопом. Прибор, разработанный В.К. Зворыкиным, по принципу действия практически не отличается от передающей трубки С.И. Катаева. Заявка на изобретение была подана С.И. Катаевым раньше заявки В.К. Зворыкина. Следует также учитывать тот факт, что до подачи заявки на патент К.В. Зворыкин приезжал из США в Москву и лично встречался с С.И. Катаевым. Изобретение передающей трубки с накоплением явилось важным этапом в развитии телевидения. Иконоскоп успешно применялся во многих странах более 20 лет. В 1933 г. советскими учёными П.В. Шмаковым и П.В. Тимофеевым была предложена передающая трубка, названная в последствии супериконоскопом, которая отличается от иконоскопа более высокой фоточувствительностью и меньшими габаритами. Поэтому супериконоскопы вытеснили полностью иконоскопы и много лет использовались в телевизионных студиях. С 1931 г. по 1938 г. в СССР проводились опытные радиопередачи телевидения по механической системе с разложением изображения на 30 строк. В 1935 г. в СССР под руководством Я.А. Рыфтина был разработан комплект системы электронного телевидения более высокой чёткости — 180 строк. В 1938 г. Московский телевизионный центр на Шаболовке, оборудованный аппаратурой электронной системы с разложением изображения на 343 строки, начал регулярное телевизионное вещание. Несколько раньше, в 1937 г., вступил в строй Ленинградский телевизионный центр. В связи с войной их работа была прервана до 7 мая 1945 г. В 1948 г. в СССР был введен новый стандарт разложения на 625 строк при 25 кадрах в секунду, предложенный профессором С.И. Катаевым. Этот стандарт впоследствии был принят в большинстве стран мира. С тех пор телевидение в нашей стране развивается быстро нарастающими темпами. С 1 октября 1967 г. было начато регулярное цветное телевизионное вещание по системе СЕКАМ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 6 Введение Современное состояние телевизионного (ТВ) и звукового вещания на территории России можно кратко охарактеризовать следующими данными. В пользовании у населения находится более 100 млн телевизоров. Распространяются десятки федеральных программ телевидения и значительное количество местных программ. Охват населения России одной программой составляет около 100 %. По состоянию на 01 января 1999 г. функционировало 332 ТВ станции мощностью более 1 кВт, 7500 станций мощностью менее 1 кВт и около 9000 ретрансляторов со спутниковыми приемными антеннами [27]. Распределение сигналов ТВ программ на территории России осуществляется с помощью разветвленной сети радиорелейных линий и спутниковых систем связи «Орбита», «Экран» и «Москва». В наземной распределительной сети используются свыше 300 тыс. каналокилометров наземных РРЛ. В крупных городах России развиваются системы кабельного телевидения. В настоящее время всё более высокими темпами развивается спутниковое телевидение непосредственного телевизионного вещания, позволяющее принимать ТВ сигналы с высоким качеством как в городах, так и в сельских местностях независимо от удалённости от города. В крупных городах начало появляться сотовое телевидение, основными достоинствами которого является высокое качество ТВ приёма и отсутствие такого дорогостоящего сооружения, как высотная телевизионная башня; бурными темпами внедряется кабельное телевидение; к 2015 г. планируется завершить переход на цифровое ТВ вещание. Отметим основные достижения техники ТВ вещания за последние 5...7 лет [2]. Ноябрь 2005 г. — начало экспериментального цифрового вещания в стандарте DVB-T в г. Якутске и 21 декабря 2005 г. в г. Саранске. 10 марта 2006 г. — начало тестового мобильного ТВ вещания в России компанией МТС, а в августе 2006 г. в Москве и С.-Петербурге компанией «Скай Линк» запущено мобильное ТВ в стандарте CDMA. 2006 г. впервые в России в г. Челябинске осуществлено опытное многоканальное эфирное цифровое вещание (10 программ) в стандартной полосе 8 МГц в стандарте MPEG-4.10. 28 апреля 2007 г. началось вещание в компании «НТВ-Плюс» спутниковых программ в стандарте HDTV (1080i, MPEG-4.10) в телеканалах «HD-Кино», «HD-Спорт» и «HD-Life». Кроме вещательного телевидения, в настоящее время бурными темпами развивается прикладное телевидение. Это, в первую очередь, охранное телевидение, ТВ системы наблюдения на транспорте в строительной технике (например, на больших подъёмных кранах), системы для технологического контроля в промышленности, видеоконт-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Введение 7 роля в медицине, астрономии, системы военного телевидения (особо точного оружия) и ТВ системы в других областях науки и техники. Телевизионные системы по характеру решаемых задач делятся на вещательные и прикладные. Последние в свою очередь подразделяются на системы визуального отображения, воспроизводящие для оператора обстановку в пределах контролируемого пространства и не производящие вычислительную оценку параметров (характеристик) наблюдаемого изображения, соответствующего ТВ сигналу, и измерительные, с помощью которых проводится количественный анализ таких параметров. Системы прикладного телевидения предназначены для передачи и приема изображений в промышленности, науке, образовании, медицине, военном деле, обеспечении безопасности и других областях деятельности человека. Главным отличием систем прикладного телевидения от систем ТВ вещания является ограниченное количество получателей информации. Поэтому в прикладном телевидении нет необходимости в такой жесткой стандартизации параметров разверток и сигналов, как в ТВ вещании. Цифровые технологии в прикладном телевидении используются в первую очередь для сжатия спектра видео- и аудиоинформации с целью передачи по узкополосным каналам связи и записи в запоминающие устройства (ЗУ) для анализа изображений с целью автоматизации некоторых функций системы. В частности, прикладные ТВ системы используются для автоматизации при выполнении работ физического, биологического, медицинского характера, производственно-технологических процессов, астрономических наблюдений, при исследовании природных ресурсов и космоса. В связи с этим возросли требования к точности и эффективности ТВ систем. Другой важной тенденцией следует считать универсальность ТВ систем, т. е. способность решать различные задачи без существенной перестройки аппаратуры за счет изменения алгоритмов управления и обработки данных. Это, в первую очередь, связано с применением ЭВМ в ТВ измерительных системах (ТВИС). Телевизионное изображение — это отображение пространственных и временных изменений яркости, цвета или других физических параметров исходного изображения. С математической точки зрения ТВ изображение представляет собой многомерную скалярную функцию. В аналоговом телевидении параметры изображения являются непрерывными (по горизонтали внутрикадрового пространства) функциями пространственных и временных координат, в цифровом они представляются упорядоченными множествами отсчетов, дискретизиро-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 8 Введение ванных по пространственному, временному и цветовому направлениям и квантованных по характеристическому параметру. По сравнению с классическим аналоговым телевидением цифровое телевидение представляет собой более высокую стадию развития. Преимущества цифровых методов передачи ТВ сигналов по сравнению с аналоговыми заключаются в следующем: • высокая динамика оперативного и адаптивного управления режимами функционирования и характеристиками оборудования; • широкое применения электронных ЗУ, причем качество цифровых сигналов почти не зависит от времени их хранения; • достигнутое отношение сигнал-шум чаще всего не зависит от числа выполняемых с цифровыми ТВ сигналами операций; • выходной сигнал цифровых ТВ трактов не накладывает жестких требований на стабильность их коэффициента усиления; • в значительно меньшей степени проявляются градационные искажения; • реализация эффективных методов цифровой обработки сигналов при кодировании, преобразовании и декодировании ТВ изображения; • возможность миниатюризации электронной аппаратуры c одновременным повышении качества изображений, значительной экономии электроэнергии, долговечности и надежности ее работы. Все перечисленные выше факторы определили развитие технического прогресса и активное внедрение ТВ систем во многие отрасли народного хозяйства. Цифровая обработка сигналов ТВ изображений важна тем, что является, по сути, основой создания нового поколения ТВ техники. Однако для передачи информации в цифровом виде без использования специальных процедур сжатия требуется существенное увеличение пропускной способности каналов связи, что влечет за собой разрушение действующих частотных планов. Цифровые методы обработки сигналов в настоящее время широко практикуются на телецентрах и в прикладном телевидении. Планируется к 2015 г. полностью перейти на цифровое ТВ вещание. Это стало возможным благодаря достижениям в микросхемотехнике и совершенствованию методов обработки и сжатия спектра сигналов ТВ изображений, определяющих соответствующее снижение необходимой скорости цифрового потока в канале связи. Цифровое преобразование сигналов изображений широко используется в вещательных, измерительных и прикладных ТВ системах. Назначение цифрового преобразования изображений состоит в создании условий для улучшения качества и распознавания изображения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 9 Введение Ðèñ. Â.1. Классификация ТВ систем по спектральному диапазону (например, цветовое контрастирование в рентгено- или ультразвуковой медицине, дефектоскопии, многозональных ТВ установках, микроскопах и т. д.). Вместе с тем методы преобразования и анализа текущей пространственно-временной и цветовой структуры сигналов ТВ изображений активно применяются в современной технике связи, компьютерной технике, медицине, экологии, кинофототехнике и в других областях [1–5]. В прикладном телевидении в значительной степени используются способы цифровой обработки сигналов, характерные для вещательного телевидения. Например, при цветовом контрастировании чернобелых изображений раскрашиванию подвергаются только крупные детали, а мелкие детали черно-белого изображения позже подмешиваются в цветное изображение для получения высокой четкости. Глаз не замечает подобной манипуляции в силу ограниченной цветовой разрешающей способности. Архивирование ТВ сигналов и их передача по каналам связи по запросу является актуальным направлением развития систем прикладного телевидения. Следует также отметить, что спектральный диапазон функционирования прикладных ТВ систем (ПТС) является существенно более широким (250...2500 нм) по отношению к системам вещательного телевидения (380...760 нм). Принимая за критерий оценки диапазон спектральной чувствительности, все ТВ системы можно разделить на два класса: однозональные и многозональные (рис.В.1) [1]. Однозональные ТВ системы могут функционировать как в видимой, так и в невидимых (УФ и ИК) областях спектра. Форма и ширина характеристик спектральной чувствительности систем могут быть произвольными. Исключение составляют только черно-белые системы, характеристика спектральной чувствительности которых должна соответствовать кривой видности глаза.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 10 Введение Ðèñ. Â.2. Классификация систем по назначению Многозональные ТВ системы делятся на цветные (вещательные и прикладные) и спектрозональные (СТС), предназначенные для одновременного анализа пространственно-временного распределения лучистого потока объекта передачи в двух или более зонах оптического диапазона. Такие системы позволяют получить значительно больший объём информации по цветовому направлению, чем однозональные или цветные. По назначению ТВ системы можно разделить на вещательные и прикладные (рис. В.2). Системы вещательного ТВ хорошо известны из литературы. Системы прикладного ТВ динамично развиваются, проникая во всё новые отрасли народного хозяйства и в научные исследования. Остановимся более подробно на системах для дистанционного анализа объектов. Они могут работать в стандарте ТВ вещания, в малокадровом режиме, малострочном и однострочном, могут работать как в видимой части, так и в УФ и ИК областях спектра. Полученные видеоинформационные сигналы используются для формирования сигналов управления, специфика контролируемого процесса или функционирования объекта может отражаться на экране монитора в виде изображений или в виде цифровой индикации. В заключении следует отметить роль вещательного и прикладного телевидения в общеобразовательном процессе в школах и вузах страны. Современный образовательный процесс невозможно представить без телевидения. К сожалению, мы пока недооцениваем его роль, хотя за рубежом в рамках Болонского процесса учебное ТВ практически внедрено во все учебные заведения, а по каналам ТВ вещания организованы передачи наиболее важных разделов образовательных программ, большое внимание придаётся и дистанционному обучению. Открываются новые возможности создания видеосетей, способных осуществить интерактивный режим работы для пользователя (возможность выбора ТВ программы, учебного материала и т. д.).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü I ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ ПРИКЛАДНОГО И ВЕЩАТЕЛЬНОГО ТЕЛЕВИДЕНИЯ 1 ОСНОВНЫЕ ПРИНЦИПЫ ТЕЛЕВИДЕНИЯ Электрическая передача изображений имеет некоторое сходство с электрической передачей информации (например, звуков), но в то же время эти виды передачи имеют и существенные различия. Как известно, мы слышим звуки благодаря звуковым колебаниям, распространяющимся в воздухе вокруг соответствующего источника и воздействующим на барабанную перепонку нашего уха. Для электрической передачи звуковых колебаний последние с помощью микрофона превращаются в электрические колебания. Эти колебания передаются по проводам или по радио на приемный пункт, где посредством телефонной трубки или громкоговорителя опять превращаются в звуковые колебания (рис. 1.1,a). Таким образом, простейшее устройство для передачи звуков состоит из 3-х частей: преобразователя звуковых колебаний в электрические — микрофона, канала связи и преобразователя электрических колебаний в звуковые — телефона. Окружающие нас предметы мы видим благодаря излучаемому или отраженному ими свету, попадающему в наш глаз. Поэтому для Ðèñ. 1.1. Упрощенная структурная схема электрической передачи звука (a) и изображений (b)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 12 Часть I. Принципы построения систем телевидения передачи изображений по аналогии с передачей звуков в первую очередь необходимо иметь «световой микрофон», превращающий падающий на него свет в электрический ток. Таким прибором может быть фотоэлемент. Затем требуется канал связи и, наконец, нужно вместо телефонной трубки применить прибор, преобразующий пришедший электрический ток в свет. Подобными приборами могут быть лампы накаливания, газосветные и люминесцентные лампы и др. (рис. 1.1,b). Однако данная схема не позволяет сформировать, передать и воспроизвести сигнал телевидения. В лучшем случае можно узнать лишь какой предмет передается — светлый или темный. Основное различие между восприятием нашими органами чувств звуков и изображений заключается в том, что звук в каждый данный момент оказывает на ухо лишь одно вполне определенное давление, в то время как от самого простого объекта в глаз попадает множество одновременно действующих различных по силе света распределённых в пространстве потоков, создающих на сетчатке изображения отдельных условных точек этого объекта. Поскольку, рассматривая какую-либо картину, мы получаем на сетчатке глаза оптическое изображение каждой ее точки, то, передавая изображение этой картины, мы должны на приемном конце воспроизвести также все ее точки. Если передаваемая сцена состоит из сравнительно больших площадок, все точки которых имеют одинаковую яркость, то передавать изображение можно сразу по целым клеткам [6, 7]. Расположив в определенном порядке лампы на приемном конце, получим изображение передаваемой сцены в виде горящих ламп (рис. 1.2). Чем сложнее передаваемый предмет или сцена, тем на большее число площадок или, как их называют, элементов разложения (пикселей) нужно делить передаваемую сцену, чтобы получить достаточно высокое качество изображения. В современном телевидении число элементов разложения составляет ∼500000. Ясно, что система одновременной передачи сигналов изображения, представленная на рис. 1.2, практически неосуществима, так как изготовить такой многожильный кабель практически невозможно. При этом подобная система обеспечивает связь только с единичным приемным устройством. При сегодняшнем многомиллионном парке телевизоров она совершенно непригодна. По этой причине в телевидении используется принцип последовательной передачи элементов, поясняемый рис. 1.3. Коммутатор на передающей стороне поочередно подключает все фотоэлементы к каналу связи. Движок коммутатора на приёмной стороне должен вращаться синхронно и синфазно с коммутатором передатчика. При достаточно быстром вращении коммутаторов световые
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения Ðèñ. 1.2. 13 Принцип передачи телевизионных изображений вспышки каждого элемента на приемной панели сольются при восприятии в непрерывное свечение. Главным недостатком устройства рис. 1.3 является необходимость использования коммутаторов с трущимися контактами. Поэтому в современных системах вместо механических коммутаторов используют электронные. На рис. 1.4 представлена структурная схема электронного передающего устройства (черно-белого телевидения). Датчик ТВ сигнала является основным прибором в устройстве преобразования светового потока, исходящего от объекта 1 передачи, в электрический сигнал. Передающая видеокамера содержит ПЗС- или КМОП-фотоматрицу (см. гл. 5), способную накапливать распределённый потенциальный рельеф под действием падающего на нее света. Ðèñ. 1.3. Поочередная передача изображений
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 14 Ðèñ. 1.4. Часть I. Принципы построения систем телевидения Структурная схема электронной телевизионной системы: a — передающая часть; b — приемная часть Изображение объекта проецируется на фотомишень. На светочувствительных элементах фотомишени под действием света накапливаются заряды (зарядовые пакеты) в количестве, пропорциональном освещенности ее отдельных элементов. Так на мишени образуется дискретизированный потенциальный рельеф. Его считывание осуществляется подачей импульсов на вертикальные шины твердотельной матрицы с частотой следования элементов изображения и строчных импульсов на горизонтальные шины. Электрические заряды под действием этих импульсов «шаг за шагом» (элемент за элементом) перемещаются к выходу матрицы на вход предварительного усилителя. Развертка изображения осуществляется блоком управления матрицей (БУМ). В соответствии с глубиной изменений потенциального рельефа в каждом элементе мишени на выходе матрицы формируются перепады уровня видеосигнала, который далее усиливается предварительным и промежуточным усилителями. Затем сформированный сигнал ТВ изображения поступает на модулятор передатчика и полученный ТВ радиосигнал излучается антенной в эфир. Синхрогенератор СГ формирует импульсы синхронизации и управляет частотой и фазой считывающих импульсов. Импульсы синхронизации строк и кадров также поступают в промежуточный усилитель и замешиваются в ТВ сигнал, обеспечивая на приёмной стороне синхронизацию генераторов разверток многочисленных телевизоров. На рис. 1.4,b представлена упрощённая структурная схема телевизора, преобразующая принятые сигналы в оптическое изображение. Видеоусилитель телевизора имеет два выхода: с одного из них видеосигнал достаточной величины поступает на вход преобразователя «сигнал-свет», преобразующий видеоимпульсы в оптическое изображение; с другого выхода видеосигнал поступает на амплитудный се-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 15 лектор (АС), где из телевизионного сигнала извлекаются синхроимпульсы. Эти импульсы затем подаются в блоки разверток БР, обеспечивая их синхронную и синфазную работу с блоками разверток передающей матрицы (ПЗС или КМОП). В качестве преобразователей «сигнал-свет» в современных системах телевидения используется жидкокристаллические (ЖК) и плазменные панели (ПП). Первые экономичны, дают не мелькающее изображение, которое образуется на ЖК экране благодаря модуляции светового потока видеосигналом. Вторые сами являются источником световых импульсов, поэтому дают бо́льшую яркость и контрастность, чем ЖК. В отечественном вещательном телевидении изображение характеризуется следующими цифрами: число кадров в секунду составляет 25, а число строк в одном кадре равно 625. Формат кадра (отношение длины изображения к его высоте) составляет 4/3 (ГОСТ 7845-92). Более подробно информация о форматах ТВ изображения изложена в последующих разделах. Таким образом, основным принципом современного телевидения является принцип последовательной передачи изображений — элемент за элементом, строка за строкой, кадр за кадром, т. е. принцип развертки изображений. Основной задачей телевидения является передача визуальной информации как о подвижных, так и неподвижных объектах. 1.1. Свет и телевидение. Световые единицы Свет — это физическое явление, интерпретируемое психологическими процессами в нашем мозге. И поэтому его сложнее оценивать или измерять, чем любой другой физический процесс. Чтобы проделать объективные измерения, необходимы некоторые предварительно заданные условия. Одно из них — это полоса рассматриваемых частот излучения, обычно соответствующих по длинам волн пределам от 400 нм до 700 нм. Все частоты вносят свой вклад в световую энергию, излучаемую источником. Сначала рассмотрим различные типы источников света. Обычно их делят на две основные группы: • первичные источники (солнце, уличное освещение, осветительные лампы, например накаливания, мониторы); • вторичные источники (все объекты, которые не генерируют свет, а только отражают). Для измерения количества света, излученного, например, лампой накаливания, и света, отраженного от объекта, применяются различные способы и единицы измерения (рис. 1.5). Есть несколько причин того, почему используют различные единицы измерения света.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 16 Часть I. Принципы построения систем телевидения Ðèñ. 1.5. Световые единицы и их смысл Наука, изучающая все эти аспекты, называется фотометрией, а соответствующие единицы измерения — фотометрическими единицами. Различные ученые, в зависимости от своих взглядов, вводили несколько отличающиеся единицы света. Поэтому возникают определенные трудности при попытке понять или описать характеристики видеокамер. Рассмотрим источники света, затем распространение света в пространстве, падение на объект и, наконец, отражение. Сила света (I) характеризует световую энергию первичного источника, излучающего во всех направлениях. Единица измерения силы света — кандела (кд). Одна кандела примерно равна количеству световой энергии, испускаемой обычной свечой. В 1948 г. появилось более точное определение канделы: кандела — это сила света, излучаемая черным телом, нагретым до температуры перехода платины из жидкого в твердое состояние [28]. Световой поток (F ) — это сила света в некотором телесном угле. И, следовательно, единица светового потока получается делением силы света на 4π радиан (в сфере 4π = 12,56 стерадиан) и измеряется в люменах (лм). Один люмен — это световой поток, испускаемый источником с силой света в 1 кд внутри единичного телесного угла (угла в 1 стерадиан). Поскольку ощущение яркости зависит от чувствительности человеческого глаза, то световой поток зависит также от длины волны. Например, свет мощностью в 1 ватт на 555 нм (зелено-желтый цвет) дает световой поток приблизительно равный 680 лм, а все другие длины волн с такой же силой света дают меньший световой поток. Теоретически световая энергия может быть выражена в ваттах, но
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 17 при этом субъективное ощущение яркости источника света будет зависеть от длины волны: синие и красные цвета будут казаться менее яркими, чем жёлто-зелёные при одинаковой их мощности (кривая видности глаза) [5]. Освещенность (E) — это наиболее часто используемый в прикладном ТВ термин, особенно при оценке минимальной (пороговой) освещенности, необходимой для ТВ камер данного типа. Освещенность очень похожа на яркость, за исключением того, что в этом случае имеются в виду объекты, являющиеся вторичными источниками света. Освещенность поверхности — это световой поток, приходящийся на единицу площади. Если световой поток в 1 люмен падает на поверхность площадью в 1 м2 (квадратный метр), он измеряется в люменах на квадратный метр или метр-свечах, более известных под названием люкс (лк). Это означает, что если у нас есть сфера радиусом 1 метр и источник света с силой света в 1 канделу, расположенный внутри сферы, то освещенность на внутренней поверхности сферы будет равна 1 лк. Математически это соотношение может быть записано следующим образом: Flux F E= = [лк], (1.1) Area A где Flux = F — световой поток, Area = A — освещаемая площадь. Поток F по определению равен силе света, умноженной на телесный угол ω, т. е. F = Iω [лм]. (1.2) Предполагая, что источник света является точечным, и, опираясь на формулы сферической тригонометрии, мы можем выразить ω через освещаемую площадь A и расстояние до источника d: A [рад]. (1.3) d2 Подставив составляющие из (1.2) и (1.3) в (1.1), получаем ω= I [лк]. (1.4) d2 Это означает, что освещенность перпендикулярной площадки обратно пропорциональна квадрату расстояния до источника. Если же площадка расположена под некоторым углом к падающему свету, то мы можем оценить эквивалентную поверхность (изменение ω), сделав проекцию на поверхность, расположенную под углом θ. В этом случае формула (1.4) принимает вид [28] E= E= I cos θ [лк]. d2 (1.5)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 18 Часть I. Принципы построения систем телевидения Ðèñ. 1.6. Некоторые типичные уровни освещенности Типичные уровни освещенности приведены на рис. 1.6. Очень редко, в малых областях пространства и при очень сильных источниках света могут обеспечиваться уровни освещенности выше 100 000 лк (например, солнечный полдень или вблизи мощной импульсной лампы). Для описания таких освещенностей иногда используются другие, более крупные единицы — футы. Один фут равен 10 000 лк. В американской терминологии, где все еще широко используется квадратный фут, освещенность выражается в канделах на квадратный фут, или фут-свечах. Поскольку соотношение между квадратным метром и квадратным футом равно примерно 10 (или точнее 9,29), то довольно просто перевести люксы в фут-свечи и наоборот. Если освещенность задана в фут-свечах, то достаточно разделить эту величину на 10 и вы получите приблизительное значение в люксах, а если значение задано в люксах, то, чтобы перевести его в фут-свечи, умножьте его на 10. Термин яркость (B) характеризует свечение поверхности первичного или вторичного источника света. Поскольку свечение имеет субъективный подтекст, то в качестве объективного, научного термина используется понятие «яркость» [28]. Яркость зависит от силы света самой поверхности и от угла наблюдения, поэтому рассчитывается на единицу перпендикулярной направлению взгляда площадки. Существует всего несколько единиц яркости. Предпочитаемая в мире метрическая единица яркости — это нит. Один нит равен одной канделе на квадратный метр спроецированной площадки (I/A). Если для измерения светового потока источника вместо кандел использовать люмены, то яркость будет выражена в апостильбах (асб). Все становится несколько более сложным, если мы имеем дело с поверхностью, на которую световой поток падает под углом θ к нормали (или отражается); в этом случае световой поток прямо пропорционален cos θ. Тогда со всех направлений будет казаться, что поверхность имеет одинаковую яркость, потому что и отраженный свет, и спроецированная поверхность подчиняются одним и тем же тригонометрическим законам.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 19 Глава 1. Основные принципы телевидения Таблица 1.1 Основные световые единицы, их взаимная связь и единицы измерений Термин Обозначение Определение Световая энергия Световой поток W Энергия, переносимая светом Лучистый поток, оцениваемый по световому восприятию человеческим глазом Световой поток, приходящийся на единицу телесного угла Световой поток, излучаемый в определенном направлении с единицы светящейся поверхности, перпендикулярной этому направлению Световой поток, падающий на единицу поверхности Ф(F ) Сила света I Яркость B Освещенность E Связь с другими величинами W = Ф= I= ∫ t2 t1 Ф dt dW dt dW dΩ Единица измерения Лм-с (люменсекунда) лм (люмен) кд (кандела) B= dI dS cos α кд/м2 E= dФ dS лк (люкс) Такой тип поверхности называется ламбертовским радиатором или рефлектором [28] (в зависимости от того, является ли поверхность первичным или вторичным источником света) и обычно описывается как равномерно рассеивающая поверхность. Для измерения яркости в этом случае в метрическую систему была введена еще одна единица — ламберт. Эквивалентная американская единица — фут-ламберт. То, какова будет освещенность, воспринимаемая камерой, на самом деле зависит от силы света самого источника и от отражательной способности освещаемого объекта. Объект может быть черным или белым, и понятно, что это не одно и то же. Если объекты (по среднему фону) белые, то, естественно, при одном и том же количестве света можно видеть больше. Поэтому, говоря об освещенности, необходимо ввести еще один фактор: коэффициент отражения, выраженный в процентах. Определение коэффициента отражения можно задать следующим простым соотношением: ρ= отраженный от поверхности свет [%]. падающий на поверхность свет (1.6) Замечание. Это справедливо лишь для ЧБ объектов и для нормированного источника света, например с одинаковой плотностью распределения мощности по λ. На деле эта величина меняется от очень низкого значения в 1 % для черного вельвета, 32 % для средней поверхности почвы и до 93 % для чистого снега в поле зрения. Кожа человека европеоидной расы имеет коэффициент отражения от 19 % до 35 %.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 20 Часть I. Принципы построения систем телевидения Этот фактор очень важен при определении минимальной освещенности для работы камеры, так как при одинаковом уровне освещенности, но различных коэффициентах отражения, объекты в пределах сцены будут иметь в конечном счете различную относительную яркость. В табл. 1.1 приведены основные светотехнические единицы. 1.2. Вычисление количества света, падающего на фотоприемник Чтобы как следует себе представить «световой вопрос» с точки зрения нормального режима функционирования камеры, нужно знать, какое количество света действительно падает на фотоприемник. Освещенность на ПЗС-матрице (или лицевой панели) EПЗС в первую очередь зависит от яркости объекта B, а также от F -числа, т. е. собирающей способности линзы. Чем ниже F -число, тем больше света проходит через объектив (ниже мы еще рассмотрим этот вопрос). Эта величина также пропорциональна коэффициенту пропускания объектива τ . А именно, в зависимости от качества стекла, а также от механики внутренних поверхностей определенный процент света теряется в самом объективе. Все вышеупомянутые факторы можно представить следующим соотношением [28]: Bτ π [лк], (1.7) 4F 2 где B — средняя яркость объекта, люкс; τ — коэффициент пропускания объектива, %; F — F -число; π = 3,14159. Объект, находящийся в поле зрения камеры и освещенный источником света, испускает свет практически во всех направлениях в зависимости от функции отражения. На практике объект с гладкими поверхностями в большинстве случаев может считаться ламбертовской равномерно рассеивающей поверхностью (рис. 1.7). Рассмотрим поток, проходящий через полусферу радиуса r с центром ds. Пусть dθ — это изменение угла θ к нормали (рис. 1.7), тогда поток в объеме, образованном вращением угла dθ, проходит через окружность на поверхности сферы, причем радиус окружности равен r sin θ, а длина — 2πr sin θ. Элементарная площадка в виде круговой полосы на поверхности сферы с некоторым приближением задается следующим соотношением (рис. 1.8): EПЗС = dA = 2πr2 sin θdθ, (1.8) и тогда телесный угол ω, стягиваемый конусом в центре сферы, за-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 21 Глава 1. Основные принципы телевидения Ламбертовская рассеивающая поверхность Ðèñ. 1.7. Ðèñ. 1.8. Вычисление светового излучения дается соотношением dA 2πr2 sin θdθ = = 2π sin θdθ [стерадиан]. (1.9) r2 r2 Поскольку сила света на ламбертовской поверхности (поток в стерадиане) в заданном направлении пропорциональна косинусу угла к нормали, а сила света полной поверхности (s — площадь основания полусферы) в направлении нормали равна I, то под углом θ она будет равна I cos θ. Сила света dI элементарной площадки ds, соответственно, равна ω= I cos θds [люмен/стерадиан = кандел], (1.10) s а поскольку I/s — действительная яркость B в перпендикулярном направлении, то вышеприведенное соотношение принимает вид dI = dI = B cos θds [кд]. (1.11) Элементарный поток dF равен элементарной силе света dI, умноженной на телесный угол: dF = B cos θds2π sin θdθ [лм]. (1.12) Общий поток в конусе, образованном углом θ, можно найти интегрированием от 0 до θ: ∫ F = 2πBds sin θ cos θ dθ = πBds sin2 θ [лм]. (1.13) Если мы хотим найти полный световой поток, испускаемый во всех направлениях, то нужно положить угол θ равным 90◦ , тогда получим Ft = πBds [лм]. (1.14) При вычислении потока в телесном угле, меньшем 90◦ , как это
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 22 Часть I. Принципы построения систем телевидения Ðèñ. 1.9. Вычисление количества света, падающего на ПЗС-матрицу происходит в случае, когда камера направлена на объект, общий поток Ft задается формулой [28] F0 = πBds0 sin2 θ0 [лм]. (1.15) Если коэффициент пропускания линзы равен τ , то поток, падающий на плоскость ПЗС (или лицевую панель), FПЗС = F0 τ = τ πBds0 sin2 θ0 [лм]. (1.16) Освещенность соответствующей элементарной площадки ПЗСматрицы (или лицевой панели) будет равна потоку, деленному на площадь, т. е. EПЗС = τ πBds0 sin2 θ0 [лк]. dsПЗС (1.17) Из рис. 1.9, на котором изображен рассеивающий ламбертовский источник, видно, что sin θ0 можно выразить так: d sin θ0 = √ . 2 2 D + (0, 5d)2 (1.18) Обычно при видеоконтроле sin θ0 = d ≪ D. В таком случае d ∼ = sin θ0 2D и тогда соотношение (1.17) принимает вид tg θ0 = EПЗС = τ πBd2 [лк]. 4D2 (1.19) Воспользуемся широко известной формулой линзы 1 1 1 + = , p D f (1.20) где p — расстояние от линзы до плоскости изображения; D — расстояние между объектом и линзой; f — фокусное расстояние линзы. Так называемый коэффициент увеличения объектива задается величиной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 23 m, равной отношению p к D: p . (1.21) D Используя (1.20) и (1.21), можно выразить D следующим образом: D = f (m + 1). (1.22) m= Если это выражение для D подставить в формулу (1.19), получим EПЗС = τ πBd2 . 4f 2 (m + 1)2 (1.23) Известно, что F -число объектива определяется отношением фокусного расстояния объектива к диаметру диафрагмы, в нашем случае это d: τ πB EПЗС = . (1.24) 4F 2 (m + 1)2 На практике D намного превосходит p и m ≪ 1. Тогда (1.24) можно приближенно представить в виде τ πB . (1.25) 4F 2 Эта формула позволяет с учётом введённых выше допущений приблизительно оценить количество света, попадающего на ПСЗ-матрицу или лицевую панель, когда известны яркость объекта B и F -число объектива в момент измерения. Обычно коэффициент пропускания объектива τ меняется в пределах от 0,75 до 0,95. Для вычислений обычно принимается значение 0,8. Рассмотрим пример такой оценки. Пусть освещенность плоскости объекта составляет около 300 лк, как примерно в любом помещении офиса (пусть это будет E0 ), тогда яркость можно найти, используя коэффициент отражения окружающих объектов, т. е. B = E0 ρ [131]. Как уже упоминалось выше, различные объекты имеют различные коэффициенты отражения. Примем его равным 50 % для условий офиса. Если диафрагма объектива установлена на F /16, то освещенность ПЗС-плоскости будет составлять приблизительно EПЗС = 0,8 · 300 · 0,5/(4 · 256) = 0,1146 лк. Это вместе с АРУ (или АРЯ — автоматическая регулировка яркости) для камеры вполне реальная по динамическому диапазону освещенность плоскости ПЗСматрицы полного видеосигнала. Если же диафрагма объектива установлена, например, на F /1,4, то освещенность ПЗС-плоскости существенно увеличится и может оказаться выше допустимой по размаху для данной светочувствительной матрицы. В реальности при этом формируется идентифицируемое изображение только в случае, когда EПЗС =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 24 Часть I. Принципы построения систем телевидения используется автоматическая установка диафрагмы или если камера снабжена электронной регулировкой времени накопления потенциального рельефа. При использовании фиксированной (ручной) установки и когда АРУ камеры отключено, на её выходе формируется смещённое на уровень белого (интенсивное) малоконтрастное изображение или нелинейно ограниченное и размытое белое изображение. Однако даже при выборе низкого F -числа свет в объективе ослабляется в десятки раз. Чем выше F -число, тем ниже (обратно пропорционально квадрату F -числа) количество света, достигающего светочувствительной поверхности матрицы. Если освещенность объекта такая же, как в солнечный день (примерно, 100 000 лк), то F -число должно быть очень значительным. Необходимо относительное ослабление входного светового воздействия приблизительно до 0,1...0,3 лк. Тогда приемлемое F -число объектива должно обеспечить ослабление светового сигнала примерно в 1 000 000 раз. Используя приближенную формулу (1.16) и значения для τ = 0,8 и ρ = 0,5, а также учитывая, что ПЗС-матрица ч/б камеры требует ∼0,2 лк на выходной ТВ сигнал размахом в 1 В (1 Vpp), получим F -число, равное 886. Это слишком большое число для механических регулировок диафрагмы. Наряду с этим при малых раскрытиях диафрагмы становится заметен нежелательный оптический эффект, называемый краевой рефракцией Френеля. В реальных условиях очень высокие F -числа не могут быть достигнуты при использовании лишь механических регулировок. Поэтому при высокой освещённости для ослабления исходного светового сигнала используются специальные оптические фильтры нейтральной плотности, чтобы обеспечить высокие результирующие значения F -чисел, требуемые для чувствительных ПЗС-матриц. В ТВ камерах эта задача решается и электронным затвором. В практических расчетах при определении освещенности в плоскости оптического изображения, образованного объективом, используется формула (1.24) в несколько другой модификации [5]: EФ = EПЗС = ρE0 τ Ö2 , 4(m + 1)2 (1.26) где ρ — коэффициент отражения наиболее светлых участков объекта; E0 — освещенность поверхности объекта; τ — коэффициент светопропускания объектива, τ < 1; Ö = d/f = 1/F — относительное отверстие объектива (d — диаметр входного зрачка с учетом диафрагмы, f — фокусное расстояние); m = xи /x0 = p/D — линейный масштаб изображения (xи — линейный размер изображения на линии ПЗС; x0 — линейный размер объекта; p — расстояние от линзы до плоскости изображения — мишени; D — расстояние между объектом
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 25 и линзой). На практике D ≫ p, поэтому m можно считать равным нулю, тогда формулу (1.26) можно представить в виде τ Ö2 . (1.27) 4 Пояснение. Действительно, учитывая, что B0 = ρE0 /π, подстановкой в (1.25) легко получить формулы (1.26) и (1.27) [5]. EФ = EПЗС = ρE0 1.3. Согласование параметров оптического и ТВ изображений с характеристиками зрения Для всех ТВ систем получателем информации является человек (кроме ТВ автоматов, в которых исполнителем служит механическое устройство). В прикладном телевидении (ПТВ) важную роль играет критерий верности воспроизведения наблюдаемых процессов. В отличие от систем ТВ вещания, в ПТВ параметры и характеристики системы могут изменятся в зависимости от условий наблюдения. Например, при воспроизведении черно-белых и цветных изображений и наблюдении объектов в инфракрасном свете требования к спектральным характеристикам преобразователей «свет-сигнал» будут разными. Поэтому при проектировании аппаратуры необходимо учитывать особенности восприятия ТВ изображений. 1.3.1. Строение глаза. Основные характеристики зрения Глаз имеет приблизительно шарообразную форму диаметром около 2,5 см (рис. 1.10). Внешняя прочная оболочка 1, называемая склерой, защищает глаз от внешних повреждений. На передней части глаза склера прозрачна и называется в этом месте роговицей 2. За роговицей располагается хрусталик 3, представляющий собой прозрачное упругое тело, имеющее форму двояковыпуклой линзы. Спереди хрусталик прикрыт радужной оболочкой 4, имеющей в середине круглое отверстие — зрачок 5. Диаметр зрачка может при функционировании изменяться (без участия сознания человека). Таким образом реализуется адаптация — автоматическая регулировка количества света, поступающего на светочувствительный слой (сетчатка), Схема устройства глаза: 1 — склера; 2 — роговица; 3 — хрусталик; 4 — радужная оболочка; 5 — зрачок; 6 — передняя камера; 7 — стекловидное тело; 8 — сетчатка; 9 — жёлтое пятно; 10 — слепое пятно; 11 — зрительный нерв; 12 — оптическая ось Ðèñ. 1.10.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 26 Часть I. Принципы построения систем телевидения имеющая целью защиту от световых перегрузок. Между роговицей и радужной оболочкой находится передняя камера 6, заполненная прозрачной жидкостью — камерной влагой. Вся полость глаза за хрусталиком заполнена прозрачной студенистой жидкостью, называющейся стекловидным телом 7. Таким образом, оптическая система глаза состоит из роговицы, камерной влаги, хрусталика и стекловидного тела. При помощи этой оптики изображение наблюдаемого объекта проецируется на внутреннюю оболочку глаза, называемую сетчаткой 8. Сетчатка представляет собой скопление множества мельчайших светочувствительных элементов — колбочек и палочек. Эти элементы наиболее густо располагаются в центральном участке сетчатки, называемым желтым пятном 9 (область наилучшего зрения или область ясного видения, см. рис. 1.10). Здесь имеется центральная впадина, обладающая наибольшей способностью различать мелкие детали изображения. Кривизна и, следовательно, фокусное расстояние поверхности хрусталика, выполняющего роль линзы, перестраиваются в результате действия охватывающей его со всех сторон мышцы. Таким образом осуществляется аккомодация — получение на сетчатке наиболее резкого изображения предметов, находящихся на различных расстояниях от глаза. В структуре сетчатки выявлены два вида светочувствительных элементов— палочки и колбочки, которые обладают различными свойствами. Палочки имеют значительно большую чувствительность к свету, чем колбочки, но не имеют способности различать цвета. Поэтому зрительное ощущение в сознании человека, обусловленное только работой палочек, представляется в виде серых, неокрашенных тонов. Менее чувствительные к световому воздействию колбочки обладают способностью различать цвета наблюдаемого объекта. Одни из них реагируют лишь на красный цвет, другие — на зеленый и третьи — на синий. На участке ясного видения (желтое пятно) преобладает колбочковый аппарат, а на его периферии — палочковый (рис. 1.10 и 1.11). Специалистами определено, что число светочувствительных элементов на сетчатке составляет огромную величину — около 100 млн палочек и более 5 млн колбочек. От коры головного мозга к глазу подходит зрительный нерв 11, разветвляющийся по сетчатке отдельными нервными волокнами. В центральной впадине желтого пятна к каждой колбочке подходит одно нервное волокно. По мере смещеия от центральной впадины одно волокно приходится уже на два–три светочувствительных элемента, а на периферии желтого пятна одно волокно соединяется даже с группой палочек и колбочек. Общее число волокон зрительного нерва в среднем составляет около 1 млн. Способность глаза различать мелкие детали изображения зависит от того, на какое место сетчатки проецируется это изображение.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения Ðèñ. 1.11. 27 Распределение колбочек (кривая 1) и палочек (кривая 2) на сетчатке человеческого глаза Наибольшая разрешающая способность глаза соответствует центральной впадине, отличающейся распределением колбочек с большой плотностью. Оптимальная фокусировка при оптическом проецировании реализуется в таком случае, соответственно, на фиксированную по положению поверхность за счёт перестройки формы хрусталика. При этом предельная разрешающая способность, называемая также остротой зрения, количественно определяется минимальным углом φ, в пределах которого два отдельных предмета, например две черные линии а и б на белом фоне, представляются еще различаемыми как отдельные (рис. 1.12,a). Очевидно, что полоски а и б будут видны как отдельные, если их изображения а и б на сетчатке будут разделены хотя бы одним светочувствительным элементом (в). В этом случае наличие промежуточного элемента (в) вызывает в сознании ощущения раздельности полосок. При яркостях, соответствующих ТВ и киноэкрану, острота зрения составляет примерно одну угловую минуту, или 1/60. На эту цифру можно ориентироваться при разнообразных расчетах. Как уже говорилось выше, плотность нервных волокон быстро уменьшается по мере удаления от центральной впадины к периферии жёлтого пятна. Форма жёлтого пятна и его размеры приведены на рис. 1.13,a [27]. Соответственно падает и острота зрения. На рис. 1.12,b показан спад остроты зрения в зависимости от угла α, образованного оптической осью глаза 12 (рис. 1.10), проходящей через центр хрусталика и центральную впадину, и лучом аа*, исходящим от рассматриваемого объекта. Как видно из графика рис. 1.12,b, острота зрения быстро падает с увеличением угла α. Приняв допустимым снижение остроты зрения до 20 % от максимальной, получим угол ясного зрения αясн = 10◦ , или 2αясн = 20◦ . Эта цифра означает, что предметы, находящиеся вне поля этого угла, будут видны с меньшим разрешением и нерезко. Для рассмотрения их мелких деталей человек должен повернуть глаза или даже голову. Глаз человека обладает различной чувствительностью (видностью) к световым потокам различного цве-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 28 Часть I. Принципы построения систем телевидения Ðèñ. 1.12. Острота зрения: a — принцип определения остроты зрения; b — зависимость остроты зрения от угла α между направлением наблюдения и оптической осью глаза Форма и размеры желтого пятна глаза (a) и кривая видности глаза (b) Ðèñ. 1.13. та (различных длин волн). Наибольшая видность соответствует длине волны λ0 = 0,55 мкм (желто-зеленый цвет). Таким образом, при одинаковой мощности световых потоков различных участков спектра жёлто-зеленый поток будет казаться наиболее ярким. В соответствии с формой жёлтого пятна выбирается формат кадра k = b/h = 4/3, где b и h — ширина и высота кадра соответственно. Для существующих в настоящее время ТВ систем формат изображения составляет 4:3 (как и в кино). Позднее, когда появились ЖКэкраны и плазменные панели (ПП) для телевидения высокой четкости формат кадра приняли равным 16:9, что соответствует лучшему согласованию форматов жёлтого пятна и кадра к более приятному восприятию широкоформатных изображений с ТВ экранов больших размеров. Ранее принятие таких форматов для экранов ЭЛТ больших размеров препятствовало резкое увеличение потребляемой от сети мощности выходным каскадом строчной развёртки по сравнению с обычным форматом k = 4/3. В общем случае спектр электромагнитного излучения простирается в очень широком диапазоне — от гамма-лучей (10−12 м) до радиоволн (10−4 ...104 м) (рис. 1.14). Воспринимаемое глазом излучение (видимое излучение) занимает очень узкую часть в середине этого диапазона. Границами видимой области спектра принято считать 400 нм в коротковолновой части и 760 нм — в длинноволновой. Однако даже в таком узком спектральном интервале глаз не одинаково воспринимает излучения равной мощности различных длин волн (рис. 1.13,b).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения Ðèñ. 1.14. 29 Спектр электромагнитных волн Но в ПТВ возникает потребность наблюдать и исследовать объекты в невидимой глазом части спектра электромагнитного излучения (ИК, УФ, рентгеновское и др.). Например, в медицине (исследование рентгенограмм), в промышленности (дефектоскопия), в военном деле (наблюдение в ночное время суток) и т. д. Естественно, и спектральные характеристики датчиков сигналов должны быть разными. Например, датчики ТВ черно-белых систем, работающие в видимой части спектра, должны иметь спектральные характеристики, идентичные кривой видности глаза (рис. 1.13), т. е. яркость жёлтозелёных цветов должна быть максимальной, а синих — минимальной. Только при этом условии одинаковые по яркости цвета объектов на экране черно-белого телевизора будут различимы. При цветной передаче, наоборот, на экране цветного телевизора искажений по яркости и цветности быть не должно (верность цветопередачи). Если спектральная характеристика датчиков заходит в ИК область, мы имеем возможность видеть объекты в ночное время суток, при заходе в УФ и рентгеновскую области исследуем строение и дефекты тела в коротковолновой части спектра. Здесь происходит преобразование спектров в видимое изображение. Полученные монохромные изображения для повышения визуальной информационной ёмкости могут быть раскрашены в условные цвета (псевдоцвета). При этом каждому уровню яркости по определенному алгоритму присваивается свой цвет. 1.3.2. Параметры качества ТВ изображения Важным показателем ТВ изображения является четкость, определяемая в основном числом строк в растре. Количество строк в растре определяется разрешающей способностью глаза (минимальный угол φ ≈ 1′ в разделе 1.3.1) и углом (α), под которым наблюдается воспроизводимое ТВ системой изображение. В современном вещательном ТВ принято рассматривать ТВ изображение под углом αТВ ≈ 10◦ , а в ТВ высокой чёткости αТВЧ ≈ 30◦ . Смежные строки растра не должны восприниматься раздельно при видеоконтроле, т. е. угол их видеоконтроля по крайней мере не должен превышать указанный минимальный угол (приблизительно одна мину-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 30 Часть I. Принципы построения систем телевидения та). Исходя из этих данных можно определить необходимое количество строк в растре в современной системе вещательного ТВ NсТВ и в ТВ высокой чёткости NсТВЧ из следующего выражения: Nс = αТВ /φ. Подставив в выражение значения αТВ = 10◦ и αТВЧ = 30◦ , получим, соответственно, необходимые минимальные значения количества строк для вещательного ТВ (NсТВ ) и ТВ высокой чёткости (NсТВЧ ): NсТВ = 10◦ : 1′ = 600; NсТВЧ = 30◦ : 1′ = 1800. В настоящее время в европейских странах, где частота энергетической сети равна 50 Гц, число строк NсТВ = 625. Впервые такое число строк было предложено русским учёным профессором кафедры телевидения Московского электротехнического института связи (МЭИС, ныне МТУСИ) Семёном Исидоровичем Катаевым. В странах, в которых частота энергетической сети равна 60 Гц, количество строк в кадре равно 525 (США, Япония и др.). В телевидении высокой чёткости число строк в кадре удваивается, и, например, для европейского стандарта NсТВЧ = 1250, а там, где в вещательном стандарте 525 строк, NсТВЧ = 1050. В различных вариантах предлагаемых систем ТВЧ число строк разложения составляет 1050, 1125, 1250, 1350 и 1875. При таком числе строк зритель не воспринимает (не видит) строчную структуру растра. Разрешающая способность телевизионной системы является объективной характеристикой и полностью определяется выбранным числом строк. Восприятие человеком изображения на экране телевизора существенно зависит от свойств зрения и особенностей наблюдения. Важное значение имеет уровень адаптации зрительной системы к интегральной (в текущем времени) или средней освещённости визуально контролируемого пространства, где экран телевизора является одной из его составляющих. В условиях статической адаптации к дневному уровню освещённости зрение человека обладает наиболее высокой разрешающей способностью. Для сумеречного уровня освещённости характерно существенное её падение. Для оценки качества передачи пространственной (внутрикадровой структуры) ТВ изображений используют две субъективные характеристики — четкость и резкость. Четкость характеризует качество восприятия мелких деталей изображения, резкость — границ крупных деталей изображения. В прикладном телевидении (ПТВ) для увеличения четкости изображения число строк может различным и определяется в основном относительным расстоянием наблюдения (отношением высоты экрана H и расстояния до наблюдателя L).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 31 Если в вещательном телевидении относительное расстояние L : H = 5 : 6, то в ПТВ оно значительно меньше и определяется разрешающей способностью регистрирующего устройства. Возникает вопрос, какое число строк требуется для воспроизведения удовлетворительного по четкости изображения. На этот вопрос нельзя ответить однозначно. Требуемое число строк зависит от характера передаваемого изображения, от его «сложности», т. е. степени насыщенности средними и мелкими деталями, резкими переходами яркости. Важное значение имеет и тот факт, каким планом (мелким, средним или крупным) снимается ТВ камерой передаваемый объект. Для ориентировки ниже приводятся некоторые данные, взятые из практики (четкость изображения здесь оценивается на «удовлетворительно»). Передаваемое изображение Минимально необходимое число строк Лицо крупным планом . . . . . . . . . . . . . . . . . . . . . . . 120–150 2–3 человека во весь рост . . . . . . . . . . . . . . . . . . . 250–300 Большое количество людей (хор, публика на стадионе и пр.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450–650 Так как по телевидению возможны передачи самых разнообразных изображений, в том числе и мелкоструктурных (вроде публики на стадионе), то при разработке радиовещательной ТВ системы следует ориентироваться на возможно большее число строк. Однако увеличение их приводит к значительному повышению требуемой полосы частот аналогового ТВ сигнала и, следовательно, возрастанию скорости соответствующего цифрового потока, что отражается, в свою очередь, значительным усложнениям в практической реализации необходимых функциональных элементов ТВ техники. В 30-х годах в нашей стране существовала опытная вещательная ТВ система с 30 строками разложения (механическое ТВ) и полосой частот видеосигнала примерно 6 кГц. В 1937 г. в Москве стала действовать электронная ТВ система с 343 строками и полосой частот примерно 1,5 МГц. Сейчас используется ТВ стандарт разложения в 625 строк и с полосой частот около 6 МГц. Являются ли 625 строк разложения разумным пределом или имеет смысл улучшать четкость за счет увеличения числа строк, несмотря на усложнение ТВ аппаратуры? При средней (фоновой) яркости, свойственной видеоконтролю экрана телевизора, острота зрения составляет φ = 1′ (угловая минута). Основываясь на этой цифре, подсчитаем максимальное число строк разложения, выше которого не имеет смысла двигаться. К современному ТВ изображению предъявляются требования различения мелких деталей и обеспечения эффекта присутствия, как в современном кинематографе (широкоэкранном). Эффект присутствия зависит от угла наблюдения φ, под которым рассматривается ширина ТВ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 32 Часть I. Принципы построения систем телевидения изображения. Оптимальный формат ТВ изображения определяется, по сути дела, формой жёлтого пятна человеческого глаза. Наилучшим угловым размером φ визуального анализа ТВ изображений является такой, чтобы глаз наблюдателя не замечал строчной структуры ТВ изображения. В широко используемом в настоящее время ТВ стандарте (Z = = 625) расстоянием зрителя от телевизионного экрана следует считать расстояние, которое в 5...6 раз больше высоты экрана (угловой размер высоты изображения составляет 10◦ ), т. е. L = (5...6)h. При таком расстоянии наблюдения не возникает необходимости двигать головой для увеличения угла обзора изображения. Угол зрения α оказывается таким, что человек охватывает своим взором всю поверхность экрана. Этот угол равен примерно 14...20◦ . Строчная структура ТВ растра не будет заметной (светящийся растр представляется в виде тонких светлых линий — строк, разделенных более темными промежутками), если расстояние между строками в угловой мере окажется, как было указано ранее, не больше остроты зрения. Это и определяет необходимое число строк: Zmax = α 14...20 = = 840...1200. φ 1/60 При выборе стандартного числа строк разложения необходимо учитывать также следующие обстоятельства. При определение Zmax мы пользовались полной остротой зрения в одну угловую минуту. Реально человек редко пользуется максимальной остротой зрения. Чтобы разглядеть отдельные элементы с угловым расстоянием между ними около одной минуты, необходимо сосредоточено в них всматриваться. Такое внимание пришлось бы сохранять долго (в течение всей телевизионной передачи). Кроме того, мелкие детали в телевидении воспроизводятся с пониженной контрастностью, что ухудшает остроту зрения. Далее, в ТВ вещании значительное место занимает передача движущихся изображений, при рассмотрении которых разрешающая способность глаза существенно падает по направлению движения. Наконец, в программах телевидения так же, как и в кино, для лучшей разборчивости и выразительности можно основной объект (например, лицо артиста) давать крупным планом. Исходя из этих соображений, можно утверждать, что стандарт разложения в 625 строк следует признать приемлемым по воспроизводимой четкости. Надо заметить, однако, что часто на экране телевизора при 625 строках разложения изображение оказывается неудовлетворительным по качеству (размытым, нечетким). Объясняется это не недостаточностью строк разложения, а плохой работой отдельных узлов ТВ аппаратуры из-за ограничения спектра частот во многих приемниках,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 33 недостаточно хорошим качеством работы передающей трубки, плохой амплитудной характеристикой тракта, влиянием помех. Однако в различных частных случаях ТВ видеоконтроля необходимо вводить коэффициент, уточняющий остроту зрения, принимая φр = βφ. При этом значение β может как превышать, так и быть меньшим единицы в зависимости от условий видеоконтроля (размер экрана, его влияние на уровень адаптации, уровень текущей фоновой адаптации зрения) и требований к чёткости контролируемых ТВ изображений. Определяющими параметрами качества ТВ изображения также являются яркость, контрастность и число воспроизводимых градаций яркости. Диапазон яркостей наблюдаемого объекта оценивается контрастом Bmax , K= Bmin где Bmax и Bmin — максимальная и минимальная яркости объекта в поле зрения. В окружающем нас мире могут регистрироваться самые различные значения яркости. Наибольшую яркость имеет самый мощный естественный источник излучения — Солнце — 109 кд/м2 . Яркость пламени горящей свечи составляет 103 ...104 кд/м2 , яркость телевизионных экранов (на белых участках изображения) — 200...500 кд/м2 , яркость киноэкранов 30...50 кд/м2 , минимальная яркость воспринимаемая человеком — 10−3 ...10−5 кд/м2 . Таким образом, диапазон яркостей в природе достигает 1012 ...1014 . Человеческое зрение не в состоянии воспринимать такой большой контраст, поэтому глаз подстраивается к среднему уровню освещенности и сжимает воспринимаемый динамический диапазон яркостей до контраста K ≈ 100. Это явление, как отмечалось, называется адаптацией глаза и осуществляется в текущем времени изменением чувствительности фоторецепторов и изменением диаметра зрачка. Из выражения (1.27) следует, что освещенность сетчатки глаза: 2 Eоб , E ∼ Dвх.зр (1.28) где Dвх.зр — диаметр зрачка; Eоб — освещенность объекта. Различают световую и темновую адаптации. При световой адаптации (переходе от темноты к свету) резко уменьшается диаметр зрачка и в колбочках вырабатывается специальный темный пигмент, играющий роль нейтрального фильтра. Световая адаптация происходит очень быстро, что предохраняет светочувствительные элементы сетчатки от ослепления. Темновая адаптация (переход от света к темноте) достигается расширением зрачка (до 7...8 мм), рассасыванием темного пигмента и, при необходимости, объединением отдельных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 34 Часть I. Принципы построения систем телевидения фоторецепторов в группы. Все указанные изменения вызывают повышение чувствительности, но первое и последнее из них отражаются снижением разрешающей способности зрения. Темновая адаптация происходит медленно, время полной адаптации достигает 30...50 мин. Зрение человека неспособно регистрировать очень малые изменения яркости. Если в поле зрения находятся две соприкасающиеся площадки с яркостями B1 и B2 , то мы воспринимаем их как отдельные объекты только в том случае, если ∆B = |B1 − B2 | больше некоторого порога — ∆Bпор . Эта особенность зрения оценивается пороговой контрастностью ∆B δ= . (1.29) B В соответствии с законом Вебера–Фехнера, в рабочем диапазоне освещенностей пороговая контрастность есть величина постоянная и составляет 0,02...0,05 в зависимости от условий наблюдения. Зная значение пороговой контрастности, нетрудно определить число различных градаций яркости m: m= 2,3 Bmax lg . δ Bmin (1.30) Подставив в выражение (1.30) максимальный контраст, воспринимаемый глазом (K = Bmax /Bmin = 100), и наименьшее значение пороговой контрастности (δ = 0,02), получим, что максимальное число различимых градаций яркости составляет 230. Следует отметить, что полученное значение m характеризует потенциальные возможности зрения. В реальных условиях наблюдения число градаций яркости значительно меньше. Для повышения контрастной разрешающей способности в прикладном телевидении применяют методы цветового контрастирования черно-белых изображений. Как известно, цветное изображение обладает большей информативностью, чем черно-белое. Цветное изображение является трехмерным: изменяется по яркости, цветовому тону и насыщенности. Более подробно методы цветового контрастирования рассмотрены ниже. Чёткость ТВ изображения, таким образом, характеризует различимость мелких деталей в изображении и определяется относительными размерами элемента изображения и разрешающей способностью устройств ТВ тракта воспроизводить мелкие детали. В заключение раздела сделаем следующие выводы. 1. Параметры оптического и ТВ изображений систем телевидения должны быть согласованы с характеристиками зрения. 2. Для обеспечения правильного соответствия цветность-яркость на экране черно-белого телевизора спектральная характеристика пре-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 35 образователя свет-сигнал должна быть идентичной кривой видности глаза (см. рис. 1.13). 3. При цветной передаче спектральная характеристика датчика должна обеспечивать верность цветовоспроизведения на экране ТВ приёмника. 4. При наблюдении объектов в невидимых лучах спектральные характеристики датчиков должны охватывать более широкий спектр электромагнитных волн, чем видимая область. 5. Яркостный сигнал (при черно-белой и цветной передачах) формируется в строгом соответствии с кривой видности глаза: наиболее темным местам в изображении соответствуют синие и красные цвета, более светлым — голубые (г), оранжевые (о) и желто-зеленые (ж-з) цвета (самые светлые места в изображении) (см. рис. 1.13). 1.3.3. Специфика анализа апертурных характеристик в системах телевидения Одним из важных показателей телевизионных изображений является качество передачи локальных, точечного типа, объектов. Нежелательное увеличение во внутрикадровом пространстве их протяжённости, сопряжённое со снижением уровня соответствующих составляющих ТВ сигнала, чаще всего обусловлено в ТВ камерах действием апертурных искажений. Апертурные искажения возникают изза усреднения мелкой пространственной (внутрикадровой) структуры изображения и определяют соответствующее падение относительного уровня высокочастотных составляющих пространственного спектра сигнала изображений, которое имеет место при формировании текущего ТВ сигнала. При этом степень указанного падения отражает последовательное действие нескольких факторов. Если, например, K0 (ωx , ωy , z) — пространственная частотная характеристика (ПЧХ), отражающая усредняющее действие среды; K1 (ωx , ωy , x, y, x0 , y0 , z) — характеристика оптической системы; K2 (ωx , ωy ) — характеристика светочувствительного элемента; K3 (ωx , x, x0 ) — ПЧХ, отражающая усредняющее действие в горизонтальном по растру направлении за счёт, например, неэффективности переноса; K4 (ωy , y, y0 ) — ПЧХ, отражающая усредняющее действие в вертикальном по растру направлении за счёт накопления зарядового пакета в течении времени кадра и нестабильности в положении ТВ камеры по отношению к поверхности земли, то результирующая апертурная характеристика ТВ камеры определяется произведением указанных ПЧХ: KR (ωx , ωy , x, y, x0 , y0 , z) = j=4 ∏ j=0 Kj (ωx , ωy , x, y, x0 , y0 , z). (1.31)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 36 Часть I. Принципы построения систем телевидения Здесь z — расстояние между оптической системой и контролируемым объектом; x, y — координаты точки на светочувствительной поверхности; x0 , y0 — координаты центра растра (обычно x0 , y0 принимают, условно, равными нулю); ωx , ωy — пространственные частоты, отражающие число периодов гармонических колебаний уровня сигнала изображения в пределах участка фиксированной по осям 0x, 0y протяженности. В ТВ системах снижается к тому же и общий уровень коэффициента передачи интенсивности элементов контролируемого воздействия и существенно возрастает степень падения результирующей апертурной характеристики в области высоких пространственных частот на краях растра по отношению к его центру [90]. Соответственно каждому элементу внутрикадровой структуры изображения фактически соответствует индивидуальная сквозная апертурная характеристика. При этом в соотношении (1.31) целесообразно раздельно учитывать падение относительного уровня коэффициента передачи в области высоких частот и влияние общей зависимости его максимального уровня от координат в пределах внутрикадрового пространства. Предельная площадь сечения пространственной импульсной характеристики (ПИХ) в современных ТВ камерах многократно уступает размеру внутрикадрового пространства. Это позволяет преобразовать соотношение (1.31) к виду KR (ωx , ωy , x, y, x0 , y0 , z) = = KA (x, y, x0 , y0 ) j=4 ∏ Kj (ωx , ωy , x, y, x0 , y0 , z). (1.32) j=0 Первый сомножитель KA (x, y, x0 , y0 ) в соотношении (1.32) учитывает специфику действия на пространственный спектр изображений во внутрикадровом пространстве общей неравномерности коэффициента передачи оптической системы, а второй — KR0 (ωx , ωy , x, y, x0 , j=4 ∏ y0 , z) = Kj (ωx , ωy , x, y, x0 , y0 , z) — действие усредняющих, в больj=0 шинстве линейных, преобразований при формировании ТВ сигнала. Причём апертурные искажения мелкой пространственной структуры ТВ изображений обусловлены влиянием второго сомножителя. При ωx → 0, ωy → 0, амплитуда второго сомножителя имеет постоянный уровень в каждой точке растра, а от их координат зависит лишь объём функции, отражающей данный сомножитель. Первый сомножитель в (1.32) не зависит от частоты, но косвенно влияет на высокочастотные составляющие пространственного спектра ТВ изображений и, следовательно, на эффективность его сжатия в системах цифрового телевидения. В частотном пространстве влияние
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 37 общей неравномерности коэффициента передачи проявляется соответствующим интегральным усреднением (искажение) высокоградиентных изменений в структуре пространственного спектра контролируемого воздействия. При этом увеличение относительной величины модулирующей во внутрикадровом пространстве амплитуды сигнала изображения (мультипликативной) неравномерности отражается расширением её спектра. А чем шире спектр самой мультипликативной неравномерности, тем больше степень указанных интегральных искажений пространственного спектра видеоинформации. В первую очередь влияние мультипликативных искажений затрагивает форму спектра таких составляющих изображений, как периодические структуры фиксированной пространственной частоты. Во внутрикадровой структуре ТВ изображений могут возникать в данном случае сопутствующие ассиметричные искажения формы и интенсивности соответствующих составляющих изображений С изменением амплитуды коэффициента передачи оптической системы во внутрикадровом пространстве связано и появление аддитивной неравномерности фона ТВ изображений. На объектах размером > 2◦ заметны фоновые искажения ∼2 %. Визуально контролируемый размер ТВ изображений лежит в пределах от 10 до 25◦ . Следовательно, общая неравномерность изображений в системах телевидения не должна составлять более 10 %. Коррекцией в электрическом тракте (изменение коэффициента усиления в пределах строк и от строки к строке во внутрикадровом пространстве) аддитивные и мультипликативные искажения могут компенсироваться, но сохраняются сопутствующие данному фактору ухудшение отношения сигнал/шум, обусловленное неэффективным использованием амплитудного диапазона в преобразователе «свет-сигнал». Обратное преобразование Фурье позволяет по виду сквозной апертурной характеристики KR0 (ωx , ωy , x, y, x0 , y0 , z) определить пространственную импульсную характеристику ТВ системы в каждой точке растра. Иногда практически удается использовать условие аппроксимации сквозной апертурной характеристики непрерывной функцией, одновременно отражающей зависимость коэффициента передачи от координат и пространственных частот [36]. При этом выбор функций для аппроксимации KR0 (ωx , ωy , x, y, x0 , y0 , z) целесообразно осуществлять с учётом известного условия физической реализуемости. Рассмотрим специфику такого учёта. Для упрощения перейдём к одномерному варианту. Будем считать, что ωx = ω, ωy → 0, x = 0, y = 0, x0 = 0, y0 = 0, z = const = z0 , где положение отображаемого элемента в пространственной структуре контролируемого объекта совпадает с плоскостью фокусировки оптической системы и оптичес-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 38 Часть I. Принципы построения систем телевидения кой осью ТВ камеры. Тогда KR0 (ωx , ωy , x, y, x0 , y0 , z) = KR00 (ωx , z0 ) = KR00 (ω). (1.33) Другим, по эквивалентной протяжённости в частотном пространстве, вариантом является апертурная характеристика при ωx = ω, ωy → 0, x = const, y = const, x0 = 0, y0 = 0 и z = const = z0 + ∆z. В данном случае проецируемый в плоскость светочувствительной поверхности элемент объекта, находящегося в плоскости ортогональной оптической оси, уже не совмещён с плоскостью фокусировки оптической системы, которая, с некоторым приближением, отражается участком сферической поверхности, имеющей радиус r = z0 , и с центром внутрикадрового пространства. Соответственно, получим KR0 (ωx , ωy , xk , yk , x0 , y0 , z) = KR00 (ωx , xk , yk , z0 + ∆z) = KRK0 (ω). (1.34) По отношению к варианту, представленному выражением (1.33), в (1.34) учитывается зависимость степени подавления верхних пространственных частот в структуре изображений от удаления контролируемого элемента объекта от центра внутрикадрового пространства. При этом, чем больше удаление от оптической оси, тем в большей степени уменьшается в частотном пространстве эквивалентная протяжённость апертурной характеристики, соответствующей, по координатам во внутрикадровом пространстве, проецируемому элементу контролируемого объекта. Реализуемость вариантов аппроксимации апертурных характеристик. Необходимым при выборе, в ходе выполнения анализа, варианта аппроксимации реальной апертурной характеристики KR00 (ωx ) математическим соотношением является выполнение условия по критерию осуществимости Пэли–Винера: ∫ ∞ ln |KR00 (jω)| dω < ∞. (1.35) 1 + ω2 0 Если общий коэффициент передачи системы отражается произведением коэффициентов передачи составляющих ее звеньев, то существование интеграла (1.35) обеспечивается наличием составляющих соотношения в данном произведении KR00 (jω) = N ∏ Kn (jω). n=1 При этом условие (1.35) приобретает несколько другой вид. Представим, в частности, KR00 (jω) следующим образом: [ ] N ∑ Kn (jω) KR00 (jω) = K1 (jω) 1 + . (1.36) K1 (jω) n=1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 39 Подставляя (1.36) в (1.35), получим { [ ]} ∫ ∞ N ∑ 1 Kn (jω) ln |K1 (jω)| + ln 1 + dω < ∞. (1.37) 1 + ω2 K1 (jω) 0 n=2 Учитывая, что при x > −1, x ̸= 0 значение ln |1+x| < x, приведем (1.37) к следующему виду: ∫ ∞ ∫ ∞ N ∑ ln |K1 (jω)| 1 Kn (jω) dω + dω < ∞. (1.38) 2 2 1 + ω 1 + ω K1 (jω) 0 0 n=2 Таким образом, для проверки по критерию осуществимости функций, аппроксимирующих заданный коэффициент передачи суммой (1.36), целесообразно в некоторых случаях использовать принцип последовательного контроля, заключающийся в первоначальном контроле одного из коэффициентов суммы. В случае существования первого интеграла в левой части неравенства (1.38) реализуется дальнейшая проверка существования второго интеграла. При этом необходимо последовательно оценить модули отношений коэффициентов суммы (1.36) и проверить существование соответствующих интегралов. При выполнении теоретических исследований широко используются варианты аппроксимации заданного коэффициента передачи линейных устройств по локальным последовательным участкам на оси частот. Последнее чаще всего связано с чрезмерной сложностью математической аппроксимации заданного коэффициента передачи реальных систем непрерывной функцией в интервале частот значительной протяженности. При этом коэффициент передачи системы может выражаться в виде суммы следующего вида: KR00 (jω) = n ∑ Ki (jω, ωi )Fi (ω, ωi ), (1.39) i=0 где Ki (jω, ωi ) — функция, аппроксимирующая частотный коэффициент передачи в участке частот от ωi до ωi +1; Fi (ω, ωi ) — соответствующая функция, обеспечивающая разделение участков аппроксимации по оси частот. Подставим (1.39) в (1.35). В результате получим условие осуществимости для такого случая: n ∫ ωi +1 ∑ ln |Ki (jω, ωi )| dω, 0 6 ωi 6 ∞. (1.40) 1 + ω2 i=0 ωi Требования к функциям, аппроксимирующим сквозную апертурную характеристику. При анализе функции аппроксимации по усло-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 40 Часть I. Принципы построения систем телевидения вию (1.40) следует учитывать то, что факт сходимости или расходимости данного интеграла зависит в основном от поведения функции Ki (jω, ωi ) на бесконечности, т. е. при достаточно больших ω. Другими словами, интеграл (1.40) в пределах от 0 до ∞ и в пределах от ωi до ∞ сходится или расходится одновременно, если между 0 и ωi подинтегральное выражение не обращается в бесконечность. Соответственно, в диапазоне рабочих частот функция аппроксимации должна обеспечивать максимальную точность собственно аппроксимации, а в диапазоне более высоких частот должно обеспечиваться и выполнение условия осуществимости. Функция вида (1.40), реализующая необходимое приближение по участкам, может допускать наличие разрывов первого рода на границах сопряжения смежных участков аппроксимации. Последнее, однако, следует считать возможным, например, в условиях дальнейшего использования аппроксимирующего выражения в качестве подинтегральной функции. Процесс интегрирования приводит в таком случае к существенному уменьшению влияния таких ошибок аппроксимации на конечный результат. С другой стороны, необходимость дальнейшего дифференцирования исключает возможность использования функции аппроксимации, имеющей на границах сопряжения участков аппроксимации разрывы первого рода. Соответственно, желательно, при выполнении прецизионной аппроксимации, обеспечивать сопряжение смежных участков аппроксимирующей функции не только по уровню, но и по значениям первой, второй и производным более высокого порядка. Целесообразно при этом осуществлять аппроксимацию сквозной апертурной характеристики ТВ камеры с учётом специфики изменения уровня, например, её первой производной. Методика осуществления аппроксимации реальных апертурных характеристик гауссовскими функциями. Анализ соответствующей импульсной характеристики. Рассмотрим, в частности, вариант анализа ПИХ ТВ камеры с использованием аппроксимации апертурных характеристик суммой ограниченных по протяжённости гауссовских функций. Ограничение по протяжённости участком нижних пространственных частот определяет в данном случае выполнение условия по критерию осуществимости Пэли–Винера. На рис. 1.15 представлены результаты экспериментальных измерений апертурных характеристик ТВ камер прикладного телевидения, выполненных в научном отделе «Цифрового телевидения и видеоинформатики» Московского технического университета связи [120]. Графиками 1 и 2, в частности, здесь представлены результаты измерений характеристик в центре и на краю внутрикадрового пространства, а графиками 3 и 4 — результат их интерполяционной обработки. Как можно заметить, на рис. 1.15 определены апертурные характеристики в зависимости и от
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 1. Основные принципы телевидения 41 Сквозные апертурные характеристики ТВ камеры: 1 — результаты измерения характеристики в центре внутрикадрового пространства; 2 — результаты измерения характеристики на краю внутрикадрового пространства; 3, 4 — соответствующие характеристики, полученные усреднением характеристик 1 и 2 Ðèñ. 1.15. числа ТВ линий, и от частоты. Преобразование числа линий в частоту осуществлено в данном случае с использованием известного соотношения [121]: fmax = 0,01278N или N = 78,24fmax , где fmax в МГц, N — количество телевизионных линий (ТВЛ) испытательной таблицы (сумма чёрных линий и белых промежутков между ними данной толщины, помещающихся на высоте таблицы). Осуществим процедуру аналитической аппроксимации апертурной характеристики, представленной на рис. 1.15 (график 3) и найдём соответствующую ПИХ. При этом следует обеспечивать максимальную точность аппроксимации в пределах каждого из участков в точках низких (или нулевых) значений функции второй производной характеристики (рис. 1.15, график 3). В соответствии с указанным графиком наиболее резкое изменение крутизны функции первой производной имеет место лишь при f ≈ 4,45 МГц. Следовательно, аппроксимацию в данном случае осуществим с суммированием двух гауссовских функций, имеющих существенно отличающиеся максимальные значения функций первых производных, и с обеспечением перехода в области частоты f ≈ 4,45 МГц от одного значения первой производной к другому. Первоначально определим аппроксимирующую функцию K2 (f ) = E2 exp[−(b2 2πf )2 ]. Низкое значение уровня второй производной имеет место здесь при f ≈ 7, 04 МГц. Высокочастотный участок. Найдём значение K2 (f ) = K2 (0) = = E2 . Из графика 3 следует, что K2 (f ) = 0,04 при f ≈ 7,04 МГц и этому значению соответствует максимум первой производной гауссовской функции, который, как известно, имеет место при b22 (2πf )2 = = 0,5. Соответственно, получим exp(−0,5) = 0,60653 и E2 = = 0,04/0,60653 = 0,066, b22 = 0,5/(2π · 7,04 · 106 )2 = 2,5554 · 10−16 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 42 Часть I. Принципы построения систем телевидения Результат и составляющие аппроксимации апертурной характеристики телевизионной камеры: аппроксимируемая (1) и аппроксимирующая (2) характеристики в центре внутрикадрового пространства; аппроксимируемая (3) и аппроксимирующая (4) составляющие области относительно низких частот, аппроксимирующая (5) составляющая области относительно высоких частот Ðèñ. 1.16. С использованием этих значений E2 , b22 расcчитана одна из двух гауссовских составляющих аппроксимирующей суммы (график 5 на рис. 1.16). При f = 0 составляющая K2 (f ) = K2 (0) = 0,066. Тогда вторая составляющая аппроксимации K1 (f ) = KR (0) − K1 (0) = = 0,934, где KR (0) = 1, 0 — значение реальной (измеренной) апертурной характеристики телевизионной камеры при f = 0. Оценим функцию разности KR1 (f ) = KR (f ) − K2 (f ) реальной характеристики и второй реальной составляющей аналитического выражения аппроксимации, которая показана графиком 4 на рис. 1.16. Согласно рис. 1.16, для аппроксимирующей реальную составляющую KR1 (f ) гауссовской характеристики K1 (f ) нулевое значение второй производной (максимум первой) имеет место при KR1 (f ) = K1 (f ) = 0,463 (f ≈ 2,56 МГц). Соответственно, K1 (f ) = E1 exp[−(b1 2πf )2 ] = = E1 K11 (f ) = 0,934 exp[−(b1 2πf )2 ]. Тогда аппроксимирующий гауссовский сомножитель E1 K11 (f ) = 0,4/0,934 = 0,496 при f = = 2,56 МГц, а b21 = ln 0,496/(2π · 2,56 · 106 )2 = 2,71 · 10−15 . С использованием полученных значений E1 , b21 рассчитана соответствующая гауссовская составляющая суммы, график 3 которой показан на рис. 1.16. Искомая аппроксимирующая функция определяется суммой двух составляющих: KΣ (f ) = K1 (f ) + K2 (f ) = E1 exp[−(b1 2πf )2 ] + E2 exp[−(b2 2πf )2 ]. (1.41) В диапазоне изменения частот от −∞ до +∞ аппроксимирующее выражение не обеспечивает выполнение условия по критерию осуществимости Пэли–Винера. В связи с этим целесообразно в данное соотношение ввести множитель, обеспечивающий при |ω| → ∞ выполнение данного критерия. Представим, в частности, аппроксимирующую
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 43 Глава 1. Основные принципы телевидения функцию следующим образом: KΣ (f ) = [K1 (f ) + K2 (f )]rect(ω/ω0 ), (1.42) где функция rect(2ω/ω0 ) определяется известным соотношением: { 1 при ω 6 |ω0 | rect(ω/ω0 ) = 0 при ω > |ω0 |. Обратное преобразование Фурье позволяет определить ПИХ g(t), соответствующую выражению (1.42): g(t) = g1 (t) + g2 (t) = )[ ( ) ( )] ( √ 2 1 1 π jt jt t = erf b1 ω0 − − erf −b1 ω0 − + E1 exp − 2 2π 2 b1 2b1 2b1 4b1 ( ) ( )] ) [ ( √ t2 1 1 π jt jt E2 exp − 2 + − erf −b2 ω0 − . erf b2 ω0 − 2π 2 b2 2b2 2b2 4b2 (1.43) В реальных современных системах телевидения чаще всего реализуют коррекцию апертурных искажений сигналов изображений в горизонтальном и вертикальном по растру направлениях. В условиях высокого отношения сигнал/шум в исходном ТВ сигнале применение такой коррекции может обеспечивать существенное увеличение внутрикадровой чёткости ТВ изображений. При этом предварительный перевод аналогового ТВ сигнала в цифровую форму чаще всего осуществляют с ограничением полосы частот соответствующего многомерного спектра лишь в горизонтальном направлении по растру. Однако увеличение исходного числа строк и кадров в датчиках ТВ сигнала позволяет, в некоторых случаях, с применением цифровой обработки ограничивать полосу соответствующих частот и по другим направлениям видеоинформационного пространства с получением соответствующего выигрыша за счёт дополнительного подавления составляющих шума и уменьшения вероятности возникновения нелинейных искажений, свойственных многомерной дискретизации сигналов изображений [52, 105]. Будем условно считать, что ограничение полосы частот реализуется в горизонтальном направлении внутрикадрового пространства, например до частот ωx = 6,4 МГц. Результат расчёта ПИХ, соответствующих составляющим соотношения (1.43), показан на рис. 1.17. Следует заметить, что в большинстве ТВ камер ограничение спектра с граничной частотой ω0 = ωx0 = 6,4 МГц осуществляют при преобразовании ТВ сигнала в цифровой вид лишь в горизонтальном направлении. Поэтому условная граничная частота ωy0 при расчёте с использованием соотношения (1.43) вертикальной ПИХ может быть
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 44 Часть I. Принципы построения систем телевидения Ðèñ. 1.17. Расчётная импульсная характеристика и графики её составляющих несколько увеличена. Вид двумерной ПИХ, с некоторым приближением, может определяться, как известно, произведением соответствующих одномерных, вертикальной и горизонтальной, её составляющих. Площадь апертуры принято оценивать в сечении на уровне 0,5 от уровня функции ПИХ. Аналогичным образом может быть осуществлён анализ функции ПИХ и для края внутрикадрового пространства. Контрольные вопросы 1. Особенности передачи изображений и звука по каналу связи. 2. Принцип современного телевидения и его реализация на практике. 3. Нарисуйте структурную схему ТВ системы от «света» до «света». 4. Опишите области применения телевидения. 5. Дайте определение, что такое телевидение. 6. Перечислите основные световые единицы. 7. В каких единицах измеряется яркость? 8. По какой формуле можно найти освещенность объекта, если известна чувствительность датчика свет-сигнал — EПЗС ? 9. Как можно определить светосилу объектива Ö? 10. Устройство человеческого глаза. 11. Основные характеристики человеческого глаза. 12. Жёлтое пятно и его основные характеристики. 13. Светочувствительные элементы сетчатки глаза и их параметры. 14. Острота зрения глаза. 15. Цветное зрение. 16. Распределение светочувствительных элементов на сетчатке глаза. 17. Характеристики и параметры телевизионного изображения. 18. Формат телевизионного изображения. 19. Чёткость телевизионного изображения. 20. Градации яркости. 21. Контрастность изображения. 22. Закон Тальбота. 23. Апертурные искажения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 2 ПРИКЛАДНОЕ ТЕЛЕВИДЕНИЕ КАК СРЕДСТВО ВИДЕОНАБЛЮДЕНИЯ, ТЕХНОЛОГИЧЕСКОГО КОНТРОЛЯ И УПРАВЛЕНИЯ ПРОИЗВОДСТВЕННЫМИ ПРОЦЕССАМИ 2.1. Информационные свойства прикладных телевизионных систем Источником визуальной информации является объективная оптическая информация, не зависящая от зрительной системы человека. Отождествление двух этих вопросов информации допустимо лишь относительно процесса непосредственного зрительного восприятия. В общем случае оптическая информация несоизмеримо богаче и полнее, чем зрительная. Это может быть подтверждено простейшими примерами. Глядя на отполированную поверхность металла, мы можем судить о его цвете, можем в какой-то степени оценить степень обработки, полировку поверхности. Вот, пожалуй, и все, что дает непосредственное наблюдение глазом. Вместе с тем оптическая информация, заключенная в отраженном поверхностью свете, несет в себе сведения о структуре металла, о форме и размерах кристаллов, составляющих его, о наличии микроскопических вкраплений различных примесей и т. п. Наблюдая окружающий нас мир, мы используем оптическую информацию о нем лишь в ограниченном пространстве и со стороны, обращенной к зрителю, тогда как оптическая информация объективно существует во всем пространстве. Известно, что одни и те же предметы в видимом спектре познаются не полностью. Значительно расширить сведения о них можно, если «наблюдать» эти предметы в невидимой ультрафиолетовой или инфракрасной области оптического спектра. Однако такое наблюдение требует использования фотографии или электронно-оптических преобразователей и не может быть непосредственно отнесено к визуальному наблюдению. Ограничение реализуемой информации определяется конечной пространственно-временной разрешающей способностью глаза, ограниченным углом зрения и физиологическим строением светочувствительных элементов зрительной системы, т. е. ограниченностью спектра видимых электромагнитных колебаний.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 46 Часть I. Принципы построения систем телевидения Для того чтобы увидеть тонкую структуру предметов, мы применяем лупу или микроскоп. Желая увидеть обратную сторону предмета, его поворачивают или пользуются различными зеркальными устройствами. В обоих случаях имеют место пространственные преобразования за счёт изменения угла наблюдения и его направления. При этом повышение детальности видимого изображения достигается при проецированиии в область желтого пятна уменьшенного по размеру участка общей поверхности наблюдения, т. е. с переходом анализа общей поверхности по частям. Визуальное сканирование по участкам осуществляется и при необходимости видеоконтроля предметов, лежащих за пределами нормального угла зрения, т. е. и в этом случае увеличивается время, затрачиваемое на получение необходимой зрительной информации. Это объясняется тем, что пропускная способность глаза ограничена. Количество информации, вводимой в глаз, определяется его строением и свойствами. Телевизионная система призвана передавать изображения удаленных от зрителя предметов. Очевидно, что производительность ТВ системы, определяемая количеством информации, содержащейся в соответствующем изображении, должна быть согласована с пропускной способностью глаза — приемника визуальной информации. Если производительность телевизионной системы будет меньше пропускной способности глаза, то мы получим обеднение зрительного восприятия. Если производительность ТВ системы будет значительно превышать пропускную способность глаза, то будет иметь место избыточность информации, которая частично не осваивается наблюдателем. Естественно, что производительность ТВ системы находится в прямой связи с ее сложностью и стоимостью и в обратной связи с надежностью ее работы и избыточностью, что снижает ее экономические и эксплуатационные показатели. Под пропускной способностью глаза будем понимать максимальное количество информации, вводимой в глаз в единицу времени при видеоконтроле двухмерных изображений. За единицу измерения информации принимают двоичную единицу («да» — «нет»). Считая, что все изображения рассматриваются в угле ясного зрения, охватывающем 16◦ по горизонтали и 12◦ по вертикали, и минимальный разрешаемый угол глаза равен 1′ , общее число отдельно различаемых точек на изображении (кадре) определится как 16 · 60 12 · 60 = 7 · 105 [дв.ед./кадр]. 1 1 Здесь Nг выражено в двоичных единицах, если принять возможность двух состояний каждой видимой точки: светлая — темная. Nг =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 47 С учетом инерционности зрения, равной примерно 0,1...0,2 с, будем считать, что глаз способен идентифицировать информацию в условиях, когда Nг соответствует воспроизведению пяти раздельных изображений в секунду. И тогда количество информации, воспринимаемое глазом в секунду, Cг = Nг nг = 7 · 105 · 5 = 3,5 · 106 [дв.ед./с]. При определении производительности ТВ системы следует учесть последовательность передачи элементов — элемент за элементом, в силу которой для обеспечения сменности восприятия ТВ изображения необходимо передавать 50 кадров в секунду при построчной или 25 кадров в секунду при чересстрочной развертке. Количество информации в телевизионном кадре должно составлять Nт > Nг (для ТВ вещания Nт = 5 · 105 дв.ед./с), так как иначе разрешающая способность ТВ системы будет ниже разрешающей способности глаза и последняя не будет полностью реализована.Тогда необходимая производительность телевизионной системы определится как Cт = Nт nт [44]: (Cт )постр = Nт nт = 7 · 105 · 50 = 3,5 · 107 [дв.ед./с]; (Cт )черезстр = Nт nт = 7 · 105 · 25 = 1,75 · 107 [дв.ед./с], где nт — частота кадров. Производительности ТВ системы относительно пропускной способности глаза определяется двумя факторами: 1) необходимостью передачи изображений движущихся объектов, что требует передачи 10–12 кадров в секунду (это обеспечивает слитную передачу движущихся изображений); 2) необходимостью слитного (без мельканий яркости) восприятия принятого изображения (требуется 50 кадров в секунду). Если превышение за счет первого фактора можно отнести к числу полезных, то превышение за счет второго приводит к избыточности и, по существу, не увеличивает количество полезной информации, что является принципиальным недостатком системы передачи изображений. Рассмотренные условия согласования ТВ системы с глазом обеспечивают оптимальные условия наблюдения. Но глаз является лишь частью зрительной системы, ее внешним органом. Что касается пропускной способности системы визуального анализа (зрения), охватывающей и осмысливание информации, то она на несколько порядков ниже пропускной способности глаза и оценивается всего 50...70 дв.ед/с, при сложении двух однозначных чисел — 12 дв.ед/с, а при вычитании одного числа из другого — всего 3 дв.ед./с [44].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 48 Часть I. Принципы построения систем телевидения До сих пор мы рассматривали зрительную информацию в ее общем виде, а ТВ систему как переносчик этой информации. Заметим, что весьма низкая пропускная способность зрительной системы отнюдь не свидетельствует о ее несовершенстве, а скорее говорит о ее высокой организованности, о способности оптимального отбора истинной информации, о максимальном использовании ранее накопленных сведений и опыта человека, т. е. архивированной информации и видеоинформации. При решении различного рода частных задач в практике человека зрительная информация используется для получения вполне конкретных ограниченных сведений. Так, например, необходимо подсчитать расстояние в поле зрения, детали, измерить расстояние между двумя точками, выбрать и отбраковать детали, отличные по форме от заданных, или отыскать предмет известной формы, подсчитать движущиеся в пределах поля зрения предметы или, наконец, просто наблюдать, не нарушаются ли заданные форма, цвет, положение предмета, границы раздела двух предметов и т. д. Каждая из приведенных задач нередко составляет постоянную многочасовую деятельность человека. Примерами этого могут служить подсчет красных кровяных телец или лейкоцитов в поле зрения микроскопа при лабораторном исследовании крови, наблюдение за уровнем воды по водомерному стеклу, сортировка деталей и т. п. Все эти и аналогичные им задачи легко могут автоматизированно выполняться ТВ системой без участия человека. В этом случае нет необходимости воспроизводить информацию, полученную ТВ системой, в виде изображения на приемном экране. Вся информация содержится в видеосигнале и может быть извлечена с помощью анализа без воспроизведения самого ТВ изображения, при этом достаточно иметь видеосигнал одного или нескольких кадров и анализирующее его по заданной программе устройство. Рассмотрим простейший пример. Пусть в поле изображения в случайном порядке размещены черные и белые элементы изображения. Фрагмент такого изображения приведен на рис. 2.1. Необходимо подсчитать черные или белые элементы. Человеку для подсчета на изображении потребуется большое время для решения этой задачи, если она вообще может быть им выполнена (в поле ТВ изображения около полумиллиона элементов), тогда как счетчик импульсов или сумматор их длительности может выполнить эту задачу за время развертки одного кадра. В этом случае информационная пропускная способность (производительность) телевизионной системы на десятки порядков выше пропускной способности зрительной системы. Рассмотренные ранее примеры позволяют сделать вывод о том, что информационные свойства ТВ системы как составляющей про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 49 Глава 2. Прикладное телевидение Ðèñ. 2.1. Фрагмент изображения для подсчета черных и белых элементов изводственных комплексов не могут быть оценены безотносительно к их применению, к характеру задач, решаемых с их помощью. Вместе с тем правильная информационная оценка технико-экономической эффективности ТВ систем стимулирует применение типовых телевизионных средств, их совершенствование и разработку новых типов ТВ систем. С позиций информационной оценки телевизионных средств прикладного (промышленного) применения они могут быть разделены на следующие классы [44]: Собственно телевизионные системы, т. е. системы, заканчивающиеся воспроизведением ТВ изображения. Информационная способность систем этого класса, включённых в текущий производственный процесс с участием оператора (наблюдателя), чаще всего определяется пропускной информационной способностью зрительной системы оператора. Что же касается производительности самой ТВ системы, то она конкретизируется исходя из необходимой детальности наблюдения, т. е. из минимального относительного (относительно поля зрения) размера обнаруживаемых деталей ∆, определяемого как ∆= Smin , Sпз где Smin — площадь минимальной детали; Sпз — площадь поля зрения. Очевидно, что Smin и Sпз могут быть измерены как на фотокатоде, т. е. на оптическом изображении, так и на объекте, а равно и отнесены к размерам ТВ растра. С целью повышения надежности обнаружения детали необходимо исключить растровые ошибки, для чего минимальная анализируемая деталь должна превышать элемент растра по площади в 5...10 раз, т. е. следует выбрать Nт = (5...10)/∆. Это обстоятельство может привести как к увеличению, так и к уменьшению производительности системы относительно рассчитанной из условия Nг = Nт , так как система может увеличивать детальность, играя роль лупы (узкоугольный ТВ контроль) или микроскопа,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 50 Часть I. Принципы построения систем телевидения или, наоборот, ограничивать ее, при этом оператор автоматически интуитивно изменит расстояние наблюдения изображения на экране, выбирая угол относительного восприятия, и результирующая пропускная способность система-оператор останется неизменной. Во всем остальном для систем этого класса справедливы сделанные ранее выводы, в том числе и неизбежность избыточной производительности ТВ системы. Телевизионные полуавтоматические системы, т. е. системы, в которых наряду с воспроизведением изображения на ТВ экране на выходе системы получаются количественные данные об объекте наблюдения или его изменении на основе входной оптической информации. Информационные свойства этого класса систем определяются так же, как и системы первого класса, если количественные данные получает оператор на основе анализа изображения или сравнения двух изображений или изображения с шаблоном. Если же количественные данные дополняют наблюдение и получаются инструментальным анализом, то пропускная способность системы складывается из пропускной способности зрения и пропускной способности анализирующего устройства. Телевизионные автоматические системы, т. е. системы, анализирующие закодированную в форме видеосигнала оптическую информацию, обрабатывающие ее и предоставляющие либо окончательный результат анализа, либо сигнал текущего управления объектом (процессом). Информационные свойства систем этого класса определяются производительностью ТВ преобразователя, играющего роль кодирующего устройства, или пропускной способностью декодирующего (анализирующего) устройства. Роль декодирующего устройства могут выполнять как простейшие суммирующие устройства, устройства счета и сравнения импульсов и т. д., так и сложные анализирующие устройства, вплоть до ЭВМ с соответствующим программным обеспечением. Информационная оценка этих устройств не входит в предмет данной книги. По этому вопросу читатель может почерпнуть сведения в специальной литературе. Поэтому будем считать, что пропускная способность анализирующего устройства Cа известна. Если она меньше пропускной способности ТВ системы, то последняя будет работать в неэкономичном режиме с большой избыточностью ТВ информации. В этом случае целесообразно отказаться от типовой ТВ установки и реализовать частную ТВ систему, согласованную по информационным свойствам с анализатором. В случае превышения пропускной способности анализатора над производительностью ТВ системы вопрос выбора системы должен
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 51 Глава 2. Прикладное телевидение решаться на основании технико-экономического анализа построения и работы всего комплекса с учетом преимущественного применения типовых серийных технических средств. При оценке производительности ТВ систем этого класса следует учесть принципиальную возможность устранения избыточности, определяемой инерционностью зрения и необходимостью получения слитного изображения. Как правило, в системах этого класса нет необходимости в большом числе кадров, так как для анализа достаточно иметь видеосигнал одного кадра, а смена сюжетов с частотой десятков кадров в секунду может быть реализована лишь при исследованиях быстродвижущихся объектов или c помощью предварительной записи (съемки) сюжетов на видеоинформационный носитель. Кроме того, при построении ТВ автоматов их производительность должна выбираться с учетом времени работы ТВ систем. При малой загрузке возникает необходимость накапливания анализируемой информации, что само по себе ведет к снижению реализуемой пропускной способности и, кроме того, недоиспользованию больших капитальных вложений. Таким образом, выбор производительности ТВ системы необходимо осуществлять с учетом скорости поступления анализируемой оптической информации и заданного (технико-экономически обоснованного) максимального времени анализа. При этом следует учесть, что надежно реализуемая детальность анализа видеосигнала требует превышения производительной способности кодирующей части по сравнению с пропускной способностью системы в целом в 2...4 раза. Если максимальная плотность информации на один кадр Nт = = kz 2 , где k — коэффициент формы кадра, т. е. отношение размера кадра вдоль строк к размеру вдоль нормали к строке, а z — число строк разложения, то реализуемая плотность на кадр NТА = Nт kz 2 = , 2...4 2...4 а пропускная способность CТА = Nт kz 2 = , Tа (2...4)Tа где Tа — время анализа одного сюжета. Эксплуатационная пропускная способность системы будет значительно ниже, так как при ее определении нужно учесть время Tп , необходимое на смену анализируемого сюжета (подготовительное время), т. е. (CТА )э = CТА Tа . Tа + Tп
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 52 Часть I. Принципы построения систем телевидения Из этого следует, что при проектировании ТВ автоматических систем наряду с выбором оптимальных параметров системы необходимо уделять внимание проектированию и разработке вспомогательных устройств и организации эксплуатации систем. Последнее весьма важно и при использовании систем первых двух классов, где быстрая смена оптических устройств (изменение угла поля зрения), наличие поворотных устройств (изменение направления видеоконтроля), выбор оптимального числа передающих камер и приемных устройств и их взаимной коммутации также приводят к увеличению эксплуатационной пропускной способности, а следовательно, к повышению технико-экономических показателей работы системы в целом. 2.2. Задачи, решаемые телевизионными средствами в различных областях народного хозяйства Прикладное (промышленное) телевидение, несмотря на сравнительно короткий срок своего существования, стало самостоятельной областью науки и производства, получило достаточно широкое развитие и накопило немалый опыт в решении многочисленных практических задач народного хозяйства. По методу использования все промышленные ТВ системы могут быть разделены на две группы [44]. К первой группе относятся собственно ТВ системы, т. е. системы с видимым изображением наблюдаемых объектов. Здесь ТВ изображение является окончательно воспринимаемой оператором информацией. Системы этой группы находят широкое применение прежде всего там, где человек не в состоянии наблюдать контролируемый объект или процесс либо по причинам их удаления или расположения вне пределов прямой видимости (в другом помещении, за преграждающими предметами и т. д.), либо по условиям вредности среды, окружающей предмет наблюдения, либо невозможности нормального видения по условиям освещенности предметов (яркие вспышки, раскаленные предметы и т. д.), либо когда необходимо быстро осмотреть ряд объектов, территориально разнесенных и не лежащих в поле прямого видения наблюдателя. Системы прямого видения находят применение также там, где необходимо наблюдение объекта вести большому числу наблюдателей с одной оптимальной точки их позиционирования, или в случае коллективного наблюдения объектов через окуляр оптического прибора (например, микроскопа, телескопа и т. д.), рассчитанного на наблюдение одним человеком, или в случае коллективного наблюдения объектов крупным планом, т. е. в непосредственной близости к объекту, и во многих других случаях, когда возникает необходимость дистанционного наблюдения. Иными словами, системы первой группы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 53 применимы всегда, когда необходимо трансформировать оптическое пространство. К системам этой группы следует отнести также и системы видения в различных (по длине волны контролируемого электромагнитного излучения) зонах спектра, в том числе в невидимых лучах (например, в ультрафиолетовых, инфракрасных, рентгеновских), а также при облучении предметов электромагнитными волнами радиодиапазона («радиовидение») и ультразвуковыми лучами. Эти системы значительно отличаются по техническим средствам, а по принципу использования они близки к системам прямого видения. Ко второй группе систем промышленного телевидения относятся системы, в которых наряду с видимым изображением (или без него) анализируется видеосигнал, обеспечивающий получение количественной (или качественной) абсолютной или относительной информации о свойствах наблюдаемого объекта. Общим для систем этой группы является превращение пространственно размещенной информации в информацию последовательно временную. Вместе с тем эти системы отличаются большим разнообразием оконечных устройств, т. е. устройств извлечения информации из сигналов ТВ изображений. Как правило, последние предназначены для решения конкретных, четко очерченных задач (например, измерения линейных и двухмерных размеров объекта, подсчета действий объекта, сравнения объекта с эталоном или шаблоном, цветового контрастирования черно-белых изображений и т. д.). Ко второй группе систем следует отнести и системы с обратным преобразованием, где с помощью того же процесса развертки можно последовательно поступающие сведения параллельно разместить (накопить) на воспроизводящей плоскости. Такие системы могут не только заменить различные громоздкие транспаранты, сложные многоканальные системы сигнализации (например, диспетчерские системы), но и производить логические операции по управлению и программированию действий механизмов или процессов, охваченных системой. Иными словами, системы второй группы являются техническим средством автоматизации, организации и управления производством, технологическими и процессами исследования и т. п., т. е. средством включения многогранной оптической информации в общий поток информации, необходимой для определения оптимальных условий деятельности человека или течения сложных производственных, научных, организационных и других процессов. В зависимости от конкретных задач, решаемых с помощью ТВ систем, могут быть выделены различные подгруппы. Так, например, по общности решаемых задач
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 54 Часть I. Принципы построения систем телевидения можно определить подгруппу систем организационно-технического назначения. К ним следует отнести диспетчерские системы, системы контроля за ритмичностью процесса, за качеством продукции и др. Самостоятельную подгруппу составляют так называемые технологические системы, являющиеся неотъемлемой частью того или иного технологического процесса. К числу этих систем можно отнести: ТВ установки, применяемые на погрузочно-разгрузочных и строительных кранах, обеспечивающие повышение точности управления кранами и повышение их производительности; установки контроля за нормами загрузки сырья; установки на крупногабаритных металлообрабатывающих станках, обеспечивающие управление ими с одного постоянного места наблюдения; установки контроля за режимом газа в электросварочных системах; установки непрерывного измерения размеров крупногабаритных горячих поковок; установки разбраковки деталей по их размерам и форме или подсчету выпускаемых деталей. Следует заметить, что для решения одних и тех же производственных или организационных задач могут быть использованы как системы первой, так и системы второй группы, т. е. одни и те же задачи могут решаться либо с участием человека (оператора), либо автоматически. Учебные ТВ системы, обеспечивающие повышение эффективности процесса обучения или сокращение его срока, также составляют самостоятельную подгруппу телевизионных систем. Примером таких систем может служить медицинская ТВ установка для непосредственного наблюдения за ходом сложных операций или система для обучения процессам сборки сложных малогабаритных механизмов и устройств (сборка часов, монтаж микроминиатюрных радиотехнических и электронных приборов и пр.). Самостоятельные подгруппы составляют системы подводного, подземного, космического телевидения и многие другие задачи, решаемые с помощью ТВ средств. Трудно ограничить возможные варианты применения ТВ систем так же, как невозможно перечислить существующие функции, выполняемые человеком с использованием зрения в его многогранной жизнедеятельности. Трудно также переоценить возможности использования ТВ средств и методов в науке, промышленности, строительстве, энергетике, учебном процессе и других областях деятельности человека. Вместе с тем следует учесть, что технические средства телевидения все еще остаются достаточно сложными и дорогими и их успешное применение в любой области может быть обеспечено только при условии рентабельности этого применения. Это требует в свою очередь тщательного анализа и выбора технических средств, решающих
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 55 поставленную задачу, проведения серьезного технико-экономического обоснования применения ТВ средств в каждом конкретном случае. 2.3. Технико-экономическая оценка использования системы промышленного телевидения как средства охраны, контроля, управления и автоматизации Телевизионные системы промышленного применения как средства механизации и автоматизации контроля и управления технологическими процессами, научного поиска и научного исследования, процесса обучения и прочее являются одним из элементов обеспечения технического прогресса. Объективным критерием эффективности технического прогресса, а следовательно, и внедрения промышленных систем телевидения является уровень производительности труда. Иными словами, экономическая эффективность внедрения ТВ систем в общем случае определяется снижением общественного труда в его стоимостном выражении на единицу продукции и может быть выражена как [44] ξ= ∆wт · 100 %, w1 где ∆wт — абсолютное снижение затрат на единицу продукции, руб./шт., за счет применения ТВ средств; w1 — затраты на единицу продукции до их применения, руб./шт. В свою очередь затраты на единицу продукции определяются как w1 = l1 + εн k1 [руб./шт.], где l1 — удельные эксплуатационные расходы, руб./шт.; k1 — удельные капитальные вложения, руб./шт. в год; εн — нормативный коэффициент эффективности капитальных вложений (в долях единицы в год). Затраты на единицу продукции после применения ТВ средств составят w2 = l2 + εн k2 + εн kт [руб./шт.], где l2 и k2 — удельные эксплуатационные расходы и удельные капитальные вложения после внедрения ТВ оборудования; kт — дополнительные удельные капитальные вложения, руб./шт., определяемые стоимостью ТВ оборудования. И, наконец, ∆wт = w1 − w2 [руб./шт.]. Очевидно, что применение ТВ средств будет целесообразно, если w2 < w1 и, следовательно, ξ > 0, что может достигаться за счет повышения производительности оборудования (k2 < k1 ), сокращения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 56 Часть I. Принципы построения систем телевидения обслуживающего персонала (l2 < l1 ), повышения сортности, что приводит к увеличению производительности труда, и т. п. Следует учесть, что новые эксплуатационные расходы l2 должны учитывать и эксплуатацию ТВ оборудования, его плановый и профилактический ремонт, обслуживание, расход запасных деталей и пр. При определении kт должны быть учтены как стоимость самого ТВ оборудования, так и его установка, дополнительная оснастка, а равно и реконструкция основного оборудования, если она вызывается применением ТВ средств. При технико-экономическом анализе должны также учитываться потери, вызываемые остановкой ТВ оборудования на время профилактического ремонта или трудоемкой замены деталей из-за ограниченного срока службы (например, монитора), если эта остановка влечет за собой остановку или изменение режима работы основного оборудования. Если время производства этих работ сокращено до минимума за счет резервирования, то в стоимость kт и в эксплуатационные расходы l2 должна войти стоимость обслуживания резерва. Все перечисленные факторы могут быть учтены по общепринятой методике технико-экономического анализа. Рассмотренный выше показатель экономической эффективности полностью характеризует рентабельность применения ТВ технологических систем в условиях массового выпуска продукции. В случае мелкосерийного или разового производства изделий необходимо учесть загрузку ТВ оборудования, определяющую собой срок окупаемости затрат на такое оборудование τт , который не должен превышать нормативного срока окупаемости τн , установленного для данной конкретной области промышленности. В зависимости от целевого назначения ТВ системы и оборудования приведенные критерии могут видоизменяться. Отличаться будет и их структура, но основное содержание их будет тем же. Кроме приведенных показателей, существует ряд других и в их числе качественные показатели, отражающие как технико-экономическое существо процесса, так и основные требования, предъявляемые к промышленному телевидению при решении вполне конкретных задач производства. Однако показатели экономической эффективности, являясь общими для всех видов промышленного телевидения, не всегда могут быть однозначно определены. Более того, ограничиваться нахождением только этих показателей во всех случаях значило бы сузить, ограничить роль промышленного телевидения в техническом прогрессе. Телевизионные промышленные системы, являясь средством переноса или обработки (при ТВ автоматике) обширной оптической информации, открывают в ряде случаев новые возможности в создании необходимого продукта, удовлетворяющего потребности человека. Так,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 57 при подземных исследованиях, подводных изысканиях, изучении космических объектов и пр. трудно оценить экономическую эффективность в ее стоимостном выражении. Более того, эта эффективность может быть определена и реализована лишь в будущем, однако вряд ли необходимо отрицать эффективность использования ТВ средств в этом случае. Даже в технологических системах при массовом или мелкосерийном производстве не всегда удорожание продукта, т. е. значение ξ < 0 является доказательством нерентабельности применения ТВ средств. Являясь элементом механизации или автоматизации, ТВ средства могут позволить резко изменить условия труда, упразднить вредные профессии, повысить точность обработки и т. п., что является основным в оценке эффективности системы. Иными словами, технико-экономический анализ, предшествующий проектированию или внедрению промышленных телевизионных систем, должен охватывать все стороны этого вопроса. Прежде всего должны быть проанализированы все возможные критерии оценки эффективности — как положительные, так и отрицательные. В результате этого анализа они должны быть систематизированы по их важности и расположены по их удельному весу. Следующим этапом анализа является рассмотрение возможных вариантов применения ТВ средств. Далее следует рассмотреть перспективность этого применения с учетом развития основной (использующей ТВ средства) отрасли и развития самих ТВ средств. Заключительным этапом является анализ основных критериев эффективности, заканчивающийся ответом, надо или не надо применять в данном случае ТВ средства, и сравнение (при положительном ответе на первый вопрос) возможных вариантов — выбор наиболее эффективного и наиболее перспективного варианта. Следует заметить, что расчет и анализ экономической эффективности независимо от убедительности организационных, качественных и других критериев должны быть выполнены с максимально возможной полнотой. Только такой расчет и анализ позволяют определить, какой ценой достигается то или иное новое качество, т. е. определить технико-экономическую рентабельность, место и роль в общем техническом прогрессе и время и место внедрения ТВ системы. С другой стороны, тщательный анализ экономической эффективности и факторов, его определяющих, позволяет воздействовать на развитие самой техники промышленного телевидения, позволяет правильно сформулировать предъявляемые к ней требования. Необходимо также отметить важность учета работы уже внедренных промышленных ТВ систем. Этот учет должен охватывать все стороны их работы. Сюда в первую очередь относятся: реальная (реализованная) экономическая эффективность; загрузка, чис-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 58 Часть I. Принципы построения систем телевидения ло, причины и продолжительность выходов из строя; время, объем и продолжительность плановых ремонтов и профилактических мероприятий; квалификация и численность обслуживающего персонала и др. Накопление и анализ полученных в процессе эксплуатации статистических данных обеспечат дальнейшее уточнение технико-экономических решений, позволят создать стройную методику технико-экономического анализа и получить необходимые научно обоснованные нормативные показатели рентабельности промышленных ТВ систем. 2.4. Требования, предъявляемые к ТВ промышленным системам Требования, предъявляемые к ТВ промышленным системам, весьма разнообразны и зависят в первую очередь от назначения системы. Однако максимально возможное упрощение всей системы и обеспечение надежности ее работы являются ключевыми требованиями к промышленной ТВ системе. Удовлетворение их достигается за счет правильности выбора параметров технических средств и рациональной компоновки оборудования. Выбор параметров системы диктуется ее целевым назначением. В одном случае может быть сокращено число строк разложения, в другом — число кадров, в третьем — число воспроизводимых градаций яркости и т. д. При определении числа строк разложения для промышленной телевизионной системы следует исходить из возможности наблюдения (обнаружения) минимальной детали наблюдаемого объекта, при этом часто допустима заметность растровой структуры экрана. В зависимости от выбранного фокусного расстояния объектива (угол поля зрения) на светочувствительную поверхность передающей матрицы можно спроецировать одну и ту же деталь крупным и мелким планом. Чем крупнее минимально различимая деталь, тем меньше необходимое число строк разложения изображения. В общем случае необходимое число строк разложения может быть определено из отношения Z = (2...4)H/α, где Z — число строк разложения; H — высота поля наблюдения; α — линейный размер минимально различимой детали. При выборе числа строк разложения Z необходимо учитывать, что с ростом Z увеличивается полоса частот ТВ сигнала, а это влечет за собой увеличение стоимости и габаритов системы, а также снижение устойчивости ее работы. Поэтому необходимо определить минимально допустимое поле зрения системы и по нему выбирать оптику передающей камеры. Это позволит максимально использовать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 59 разрешающую способность ТВ системы или определить ее минимально допустимое значение. Частота кадров промышленной ТВ системы иногда может выбираться не из физиологических условий наблюдения, а с учетом скорости перемещения объектов в поле зрения и может быть значительно уменьшена или увеличена, например, при моделировании столкновения быстро движущихся объектов. В последнем случае должна быть существенно увеличена частота кадров nк ≫ 50 Гц, что снижает время накопления и может приводить к сопутствующему падению уровня сигнала ТВ изображений. И, наоборот, увеличение продолжительности кадров приводит к возрастанию уровня ТВ сигнала, соответствующего неподвижным объектам в пределах контролируемого пространства. Число воспроизводимых градаций яркости в промышленной ТВ системе также может быть значительно сокращено. Больше того, при обнаружении малоконтрастных деталей или объектов целесообразно за счёт нелинейной обработки в пределах динамического диапазона ТВ сигнала повысить контрастность изображения в его локальных участках, как бы подчеркнуть малоконтрастные детали и тем самым повысить их различимость. В отношении геометрических искажений изображения к промышленным ТВ системам предъявляются более жесткие требования, чем к вещательным. В промышленных системах встречается необходимость как абсолютного, так и относительного измерения размеров деталей изображения. В этом случае допустимые геометрические искажения будут определяться заданной точностью измерения и, как правило, будут меньше допустимых в телевизионном вещании. Уменьшение таких искажений чаще всего связано с уменьшением угла поля зрения используемых объективов. Из рассмотренного выше можно сделать вывод, что простой перенос требований, предъявляемых к ТВ изображению, из вещательного в промышленное телевидение неприемлем. Это обстоятельство приводит к тому, что многие технические решения отдельных задач телевидения, с успехом используемые в ТВ вещании, оказываются нецелесообразными для промышленного телевидения, и наоборот. Правильное сочетание физиологии зрения с возможностями технических средств позволило нашей промышленности определить и освоить минимум технических средств, необходимых для построения ТВ системы промышленного применения. Были созданы типовые промышленные телевизионные установки (ПТУ), пригодные для применения в ряде областей народного хозяйства. Как известно, создание типовых систем облегчает их производство, уменьшает стоимость и способствует быстрому их внедрению.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 60 Часть I. Принципы построения систем телевидения Опыт, накопленный в процессе эксплуатации ПТУ, позволил усовершенствовать их схемы и конструкции. Однако следует подчеркнуть, что было бы ошибочным считать, что построением нескольких типовых систем полностью решается вопрос использования телевидения в народном хозяйстве. Огромное разнообразие производственных процессов и научных исследований, различие физических явлений, требующих применения ТВ средств, вызывают такое же разнообразие задач, стоящих перед этими средствами, и дальнейшее развитие должно идти как по пути расширения типов ПТУ, так и по пути создания специализированных промышленных систем телевидения. 2.5. Функциональная схема промышленной телевизионной системы По построению функциональной схемы промышленные (прикладные) ТВ системы можно разбить на четыре основные группы: • системы, в которых большая часть функциональных узлов сосредоточена на передающей стороне, — системы с усложненной передающей стороной; • системы, в которых большая часть функциональных узлов сосредоточена на приемной стороне, — системы с усложненной приемной стороной; • системы с пропорциональным размещением функциональных узлов; • системы, в которых часть функциональных узлов вынесена в отдельные (промежуточные) блоки — многозвенные системы. В качестве примера приведем функциональную схему прикладной ТВ системы (рис. 2.2) с несколько усложнённой передающей стороной. Система состоит из камеры и приемного устройства. Передающая камера включает в себя преобразователь свет-сигнал (например, ПЗС- или КМОП-фотоматрицу), предварительный видеоусилитель, синхрогенератор, блок управления матрицей ПЗС, модулятор, осуществляющий преобразование видеосигнала в радиосигнал, и камерный блок питания. Приемное устройство содержит демодулятор, видеоусилитель, цепи выделения синхронизирующих импульсов, блоки разверток преобразователя сигнал-свет и блок питания приемного устройства. Основной особенностью данной системы является то, что импульсы синхронизации и гашения передаются совместно с сигналом изображения. Поэтому для связи передающей камеры с приемным устройством требуется только одна сигнальная пара (коаксиальный кабель). В данной системе исключаются временные сдвиги между сигналом и импульсами синхронизации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение Ðèñ. 2.2. 61 Функциональная схема телевизионной системы с усложненной передающей стороной Благодаря тому, что в этих системах можно получить достаточно большой уровень выходного сигнала, затухание его в кабеле не является определяющим, и доминирующую роль в ограничении дальности действия системы играют фазовые искажения. Однако в ряде моментов фазовыми искажениями, проявляющимися особенно сильно на низких частотах, можно пренебречь. Это возможно при заведомо известной мелкоструктурности передаваемого изображения. В этом случае дальность связи определяется затуханием видеосигнала в кабеле и его тепловыми шумами. Чтобы оценить дальность передачи видеосигнала (без преобразования его в радиосигнал) по кабельной линии связи, определим предельную дальность передачи видеосигнала, ограниченную внутренними помехами в кабеле. Положим, что напряжение сигнала на выходе камеры на ПЗС с двух- или трехкаскадным скорректированным усилителем с рабочей полосой пропускания ∆f = 4 МГц (что соответствует разложению в 500 строк) при токе сигнала с датчика iс = 0,1 · 10−6 A составляет 0,1...0,2 В, при этом выходная мощность камеры в случае применения кабеля РК-19 (РК-50-2-13) с волновым сопротивлением ρ = 50 Ом составит Pг = 2 · 10−4 Вт. Уровень мощности тепловых шумов Pтш в кабеле может быть определен по формуле Pтш = 10 lg 4kT ∆f = −102 [дБ], 10−3 где k = 1,38·10−23 Вт·с/град — постоянная Больцмана; T = 300 ◦ С — абсолютная температура; ∆f = 4 · 106 Гц — рабочая полоса частот. Допустимый уровень сигнала на входе приемника при передаче ТВ сигналов можно принять равным −70 дБ. Для качественной передачи
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 62 Часть I. Принципы построения систем телевидения сигнала ТВ изображения необходимо обеспечить превышение уровня сигнала в месте приема над уровнем помех на 35...50 дБ. В связи с вышеизложенным можно принять уровень сигнала на входе приемного устройства Pпр = −102 + 50 = −52 [дБ], уровень мощности передающей камеры Pг = −10 lg(Pг /P0 ) = −7 [дБ], где P0 — нулевой уровень мощности, равный 10−3 Вт. Дальность передачи определим по формуле Pг − Pпр l= = 1,15 [км], β где β = 39 дБ/км — затухание кабеля на частоте 4 МГц. Как видно из приведенного примерного расчета, передача сигнала в таком случае может производиться на предельное расстояние примерно 1000 м. Однако в большей степени ограничение в длине линии связи в таких системах происходит не из-за затухания, а из-за искажений сигналов управления (синхронизации) разверткой, обусловленных фазовыми искажениями в реальном кабеле. Для снижения их влияния используется смещение спектра ТВ сигнала в область более высоких частот. Видеосигнал модулирует при этом несущую частоту, на которой и осуществляется передача сигнала по кабелю на приемное устройство. Элементы промежуточного преобразования видеосигнала показаны на рис. 2.2 (модулятор и демодулятор). Важным критерием при построении функциональной схемы системы прикладного телевидения является такой важный показатель, как соотношение цена/качество. Этот показатель обязывает проектировщиков использовать только серийно выпускаемые узлы и блоки, определяющие стоимость и технико-экономическую эффективность использования ТВ систем. Действительно, специфика функционирования систем прикладного телевидения диктует использование технических решений с возможностями адаптационных изменений и наращивания, отличающихся простотой и экономической эффективностью практической реализации. Например, одним из важнейших параметров ТВ систем охранной сигнализации является удобство их монтажа и ввода в эксплуатацию, благодаря чему используется максимум стандартных решений, облегчающих и ускоряющих инсталляцию. Технические решения, заложенные в элементах (приборах) оборудования систем охранного телевидения, минимизируют трудоемкость работы монтажника, а значит, и возможные его ошибки:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 63 • в приборах применяется «сквозной видеопроход» (параллельно соединенные разъемы ВNС), обеспечивающий последовательное подключение нескольких приборов к одному источнику видеосигналов, причем согласующий резистор 75 Ом установлен внутри приборов и включается аппаратно или программно; • программные переключатели или перемычки позволяют оперативно выполнять необходимое конфигурирование прибора; • автоматическое распознавание вариантов управления диафрагмой объектива или параметров сигналов ТВ системы не требуют дополнительных действий монтажника. 2.6. Принципы построения ТВ систем с цифровой обработкой сигналов Задачи, решаемые ТВ системами с цифровой обработкой изображения, весьма разнообразны. В соответствии с назначением цифровые ТВ системы (ЦТВ) можно условно разделить на три основные группы. К первой группе относятся системы для решения сложных научных проблем. Центральной частью этих систем является ЭВМ общего назначения. Ко второй группе относятся универсальные ТВ системы, предназначенные для решения широкого круга задач обработки изображений. Эти системы часто также используются для научных исследований. К третьей группе можно отнести системы, предназначенные для работы в промышленности и способные обрабатывать относительно простые ТВ изображения. Универсальность этих систем ограничивается выполнением строго определенного круга задач. Построение промышленных ЦТВ отличается высокой степенью интеграции и наличием микропроцессора или микроЭВМ, а в отдельных случаях и аппаратной реализации вычислителя с жесткой логикой. Промышленные ЦТВ широко применяют в качестве систем технического зрения (СТЗ) роботов, служащих для автоматического контроля изделий, а также осуществления сборочных и ряда других технологических операций. В зависимости от сложности задачи СТЗ выполняют операции обнаружения, опознавания, классификации и измерения параметров контролируемых объектов. К числу задач, решаемых обзорными ЦТВ, относятся анализ клеток в биомедицинских исследованиях, устранение шумов и помех в изображениях, получаемых от межпланетных станций, отделение движущихся объектов от фона, распознавание образов, долговременная запись изображений на жёсткий диск и др. По времени обработки изображения ЦТВ можно разделить на работающие в реальном времени и с длительной обработкой. В первом случае обработка сигнала осуществляется за время одного кадра и обработанное изображение немедленно предъявляется получателю.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 64 Часть I. Принципы построения систем телевидения К системам такого типа относятся промышленные ЦТВ. Во втором случае обработка изображения ведется длительное время, в зависимости от сложности задачи — минуты и десятки минут. Все это время исходное изображение находится в памяти системы. Таким образом, например, обрабатываются фотоснимки, получаемые со спутников. Существует понятие предварительной обработки изображения. Это различные операции по преобразованию исходного изображения, в результате которых улучшается его качество. Преобразованное изображение может быть конечной целью обработки, а также являться исходным для дальнейшего автоматического анализа. Понятие предварительной обработки часто связывается с понятием реставрации изображения, т. е. освобождения исходного изображения от различного рода искажающих факторов, к числу которых относится явление скоростного смазывания, обусловленного действием процесса накопления потенциального рельефа, шумы, нелинейность в системе сканирования, искажающее влияние среды, искажения сжатия спектра сигналов ТВ изображений, масштабные и амплитудные искажения в пределах внутрикадрового пространства и т. д. В общем случае исходное и реставрированное изображения связаны между собой через преобразующее звено с передаточной функцией T [f (k, l)]. Эта функция должна отражать преобразования, обратные искажающим преобразованиям. Следует отметить, что в аналоговых системах такие задачи решаются с помощью различных корректоров (частотных, градационных) или подбором соответствующего режима работы системы, например режима импульсного экспонирования фотопреобразователя, практически устраняющего явление скоростного смазывания. С другой стороны, снижение времени накопления снижает уровень формируемого сигнала ТВ изображений с сопутствующим относительным весовым увеличением вносимых в элементах видеотракта шумовых составляющих. На рис. 2.3 представлена общая структурная схема ЦТВ, предназначенной для решения различного рода задач, определяемых алгоритмом обработки данных в ЭВМ. Видеосигнал в цифровой форме формируется на выходе телевизионного датчика ТД, в состав которого входит объектив О, преобразователь «свет-сигнал» (например, матрица ПЗС), блок управления матрицей (БУМ), синхрогенератор СГ, видеоусилитель ВУ с каскадами аналоговой обработки, включая формирование полного телевизионного сигнала, и преобразователь «напряжение-код» ПНК (АЦП). Для контроля изображения при ориентировании ТД и наведения его на объект служит видеоконтрольное устройство ВКУ (СИ, ГИ, ТИ — синхронизирующие, гасящие и тактовые импульсы соответственно).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение Ðèñ. 2.3. 65 Структурная схема цифровой телевизионной системы Кодированный сигнал с выхода ПНК поступает в буферное запоминающее устройство БЗУ, предназначенное для организованного ввода информации в ЭВМ. Ввод информации осуществляется с помощью устройства ввода УВ, представляющего собой параллельный интерфейс. Перед БЗУ может дополнительно устанавливаться преобразователь стандартов, согласующий скорости поступления информации из ТД с быстродействием ЭВМ. По команде из ЭВМ, предусмотренной специальной программой, УВ переводит информацию из БЗУ в ЭВМ, после чего в ней осуществляется обработка данных по основной программе с выдачей результатов в устройство регистрации УР. При необходимости УР можно заменить следящим устройством, воздействующим на поворотное устройство ТД. При решении различных задач обработки изображений устройство регистрации состоит из преобразователя «код-напряжение» и второго видеоконтрольного устройства, на котором наблюдается обработанное изображение. Последнее может также воспроизводиться на первом ВКУ, что удобно при сравнении исходного и обработанного изображений. 2.7. Системы телевизионного наблюдения для офисов и квартир Системы, которые выполняют функции дверного глазка и переговорного устройства, называются домофонами. По форме домофон напоминает телефон. Он состоит из монитора и переговорного устройства (рис. 2.4). При снятии телефонной трубки домофон включается автоматически. Домофон позволяет наблюдать пространство перед входной дверью и беседовать с человеком, находящимся за дверью. Кроме того, он выполняет функцию звонка. Переговорное устройство со стороны посетителя представляет собой моноблок, в котором расположены камера, переговорное устройство и кнопка вызова.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 66 Ðèñ. 2.4. Часть I. Принципы построения систем телевидения Схема подключения домофона Ðèñ. 2.5. Схема подключения двух камер и домофона При нажатии на кнопку вызова домофон издает в офисе (квартире) мелодичный сигнал вызова и автоматически включает монитор. Расположение камеры с переговорным устройством в моноблоке не всегда удобно. Камеру обычно располагают так, чтобы она обозревала максимальное пространство перед дверью, максимальную площадь пола и профиль человека, стоящего лицом к двери. От расположения камеры зависит Ваша безопасность. Переговорное устройство устанавливают рядом с дверью на уровне лица человека среднего роста. Большинство ТВ камер домофонов оснащено инфракрасным подсветом. Эффективность его невысока и позволяет различать лицо человека на расстоянии до одного метра. Это следует учитывать при монтаже камеры. Камера может быть оборудована более мощным инфракрасным прожектором и видеть при отсутствии освещения на расстоянии до 8 м. Корпус переговорного устройства часто выполнен из пластмассы и может легко повреждён случайными посетителями. Поэтому ТВ камеру лучше монтировать в прочном корпусе, заделанном заподлицо в стену и как можно выше с тем, чтобы она не привлекала внимания. Выходной зрачок камеры должен защищаться, например, противоударным стеклом толщиной не менее 5 мм. На внешней стороне корпуса переговорного устройства и камеры не должны находиться относительно простые и доступные для снятия элементы крепежа. Кнопка вызова не должна заклиниваться, например, спичкой, изготавливатся из негорючего материала. Вся конструкция должна быть максимально вандалоустойчивой. При монтаже переговорного устройства в защищенном корпусе может возникнуть самовозбуждение микрофонного усилителя из-за акустической связи между микрофоном и наушником. Для исключения самовозбуждения микрофон и громкоговоритель разносят на максимально возможное расстояние в корпусе, а микрофон закрывают с трех сторон звукопоглощающим материалом.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение Ðèñ. 2.6. 67 Схема подключения двух домофонов к одной камере К домофону может подключаться несколько камер (рис. 2.5). При этом Вы сможете видеть свой автомобиль, выходы из квартиры, если их несколько. Например, камера, расположенная на потолке перед дверью «черного хода» (в зданиях старой постройки), позволит Вам контролировать пространство перед дверью и несколько пролетов лестничных маршей. Расположение камеры на потолке затрудняет к ней доступ. При необходимости скрытного расположения камер пользуются миниатюрными объективами. Телевизионные системы для дома и офиса способствуют повышению безопасности и создают дополнительные удобства. Домофоны относятся к малоформатным системам. Поэтому для них используются недорогие видеокамеры средней чувствительности с небольшими размерами и разрешением (до 300–400 линий). В офисе домофон может использоваться для переговоров с секретарем и позволяет руководителю видеть посетителей в приемной. Несколько домофонов, как и несколько мониторов, могут подключаться к одной или нескольким камерам (рис. 2.6). Подключение к домофону нескольких камер позволяет наблюдать за входом в офис и стоянкой автомобилей. Кроме того, домофон, например модели FPV-4ST фирмы СОММАХ, выполняет функции домофона и телефона. Все модели домофонов имеют возможность управления электрическим замком. Оборудовав входную дверь электрическим замком, можно сэкономить рабочее время своего секретаря и исключить попадание в офис незнакомых людей. Кроме того, такая предосторожность повысит безоÐèñ. 2.7. Схема с подключением пасность сотрудников (рис. 2.7). электрического замка к домофону
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 68 Часть I. Принципы построения систем телевидения Домофоны моделей DPV-30S и CH-931S выполняют охранные функции. Модели SH-931М и СН-93IS дополняются блоком памяти на 8 кадров. Если в отсутствие начальника были посетители, он сможет их увидеть, воспроизведя записанное изображение. При каждом вызове домофон с дополнительным блоком памяти записывает изображение одного кадра. Все предыдущие 7 кадров при этом хранятся в памяти. Малоформатные системы ТВ наблюдения могут выполнять и охранные функции. Домофоны выполняются по двухпроводной и четырехпроводной схемам соединения блока монитора и переговорного устройства с камерой. Преимущество двухпроводной схемы заключается в том, что для соединения монитора и переговорного устройства с камерой может использоваться обычный телефонный провод. Однако такая схема соединения допускает только штатное включение домофона. Расстояние между домофоном и переговорным устройством ограничено сопротивлением соединительного кабеля. При четырехпроводной схеме соединения возможны комбинации включения нескольких домофонов и камер, использование витой пары или коаксиального кабеля увеличивает расстояние между домофоном и переговорным устройством с камерой и т. д. 2.8. Особенности построения систем охранного телевидения Используемый в охранном телевидении стандарт на ТВ сигнал первоначально разрабатывался для вещательного телевидения с целью представления наблюдателю на одном экране одного изображения. Основными требованиями при разработке стандарта являлось создание техническими средствами на экране телевизора качественного изображения с учетом особенностей человеческого зрения, рационального использования частотного диапазона и совместимости различных систем телевидения. Задачей охранного телевидения нередко является представление оператору одновременно нескольких (иногда многих) изображений из различных контролируемых зон, запись и передача видеосигналов от многих видеокамер. Получение этих изображений в режиме реального времени, т. е. без потери информации, возможно лишь при параллельной обработке видеосигналов, в противном случае (например, при использовании пониженной частоты кадров, предъявления сигналов контролируемых отдельными камерами ТВ изображений) движение объектов на экране отображается прерывисто (проявляется так
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 2. Прикладное телевидение 69 называемый «строб-эффект»). До последнего времени простота реализации и экономические соображения диктовали применение в охранных видеосистемах мультиплексирования сигналов; однако технический прогресс уже сейчас делает возможной и экономически доступной обработку, например, 16 видеоканалов в режиме реального времени. Это не только делает более комфортной работу оператора, но и, как будет показано далее, уменьшает длину так называемой ближней зоны видеокамеры. С другой стороны, возрастание объема записываемой и передаваемой информации является платой за стремление получения «живых» изображений. Если благодаря прогрессу в области компьютерных технологий объем жесткого диска перестал быть ограничением на длительность видеозаписи, то все более актуальной становится задача эффективного поиска видеоинформации в архиве. Необходимо отметить, что главной задачей охранного телевидения является не получение качественного изображения на экране видеомонитора, а возможность выработки достоверного суждения о наличии тревожной ситуации. В этом плане искажения изображения, недопустимые в вещательном телевидении, оказываются приемлемыми в охранном телевидении, а именно: • частота смены кадров может быть существенно ниже 25 Гц; • вместо обработки двух полей может обрабатываться только одно поле; • цветопередача и передача градаций серого могут существенно отличаться от естественной; • нелинейные или геометрические искажения не играют существенной роли. Поэтому в охранном телевидении широко используются компромиссные решения, при которых одни параметры «размениваются» на другие, а именно: • разрешающая способность на скорость обновления; • чувствительность на разрешающую способность; • чувствительность на быстродействие; • коэффициент усиления на полосу пропускания. Размен обычно осуществляется за счёт изменения параметров формируемого ТВ сигнала или за счёт использования интегральной пространственно-временной обработки сформированного сигнала. С другой стороны, приобретают значимость некоторые характеристики, не оцениваемые в вещательном телевидении (например, возможность оператору контролировать изображение на экране видеомонитора под острым углом обзора к его экрану). Для охранного телевидения должны учитываться условия круглосуточной эксплуатации оборудования в реальных условиях жизнедея-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 70 Часть I. Принципы построения систем телевидения тельности человека с учетом влияния окружающей среды и несанкционированного воздействия нарушителей. Без преувеличения можно назвать революционным направлением в развитии охранного телевидения широкое практическое применение цифровых систем. Это позволило вывести решение некоторых задач на качественно новый уровень, ранее не доступный при использовании аналогового оборудования; появились новые направления применения охранного телевидения — использование его в банкоматах, расчетных кассовых узлах магазинов, казино, для распознавания автомобильных номеров, идентификации посетителей, для применения в пожарных сигнализациях. Большие возможности даёт и применение современной цифровой обработки сигналов изображений. Контрольные вопросы 1. Назначение систем прикладного телевидения. 2. Особенности построения прикладных ТВ систем. 3. Требования к системам прикладного телевидения. 4. Принцип построения систем с цифровой обработкой сигнала. 5. Малокадровые системы ТВ наблюдения для офисов и дома. 6. Импульсные ТВ системы наблюдения за быстродвижущимися объектами. 7. Как определяется информационная пропускная способность прикладной телевизионной системы? 8. Для чего требуется согласование характеристик зрения с параметрами телевизионной системы? 9. Требования к построению систем прикладного телевидения. 10. Основные требования, предъявляемые к системам прикладного телевидения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 3 ТЕЛЕВИЗИОННЫЕ СИСТЕМЫ ОХРАНЫ ОБЪЕКТОВ И НАБЛЮДЕНИЯ ЗА ПРОИЗВОДСТВЕННЫМИ ПРОЦЕССАМИ За последние годы видеонаблюдение стало неотъемлемой функцией комплексной системы безопасности объекта, поскольку современное оборудование видеонаблюдения позволяют не только наблюдать и записывать видео, но и программировать реакцию всей системы безопасности при возникновении тревожных событий. Охранные системы видеонаблюдения предназначены для визуального наблюдения за охраняемым объектом с помощью видеокамер. Системы видеонаблюдения позволяют следить одновременно за одним или несколькими объектами. Камеры видеонаблюдения можно установить как внутри помещения, так и снаружи. Задача охранной системы видеонаблюдения состоит в наглядном представлении видеоинформации об оперативной обстановке на контролируемом объекте. Самая простейшая система видеонаблюдения включает в себя одну или несколько видеокамер и монитор или телевизор. Камеры видеонаблюдения могут устанавливаться на поворотных устройствах снаружи или внутри помещения и позволяют осуществлять круглосуточное слежение за охраняемой территорией. Совместно с системой видеонаблюдения можно использовать датчики движения (детекторы), системы освещения и другие дополнительные устройства. В системах видеонаблюдения, рассчитанных на использование нескольких видеокамер, на экране одного монитора можно одновременно отображать изображения от всех видеокамер. Для этого служат квадраторы (делители пространства экрана). Для последовательного вывода изображений используются мультиплексоры (коммутаторы), которые последовательно подключают видеокамеры к монитору или телевизору. Мультиплексоры позволяют наблюдать одновременно на экране монитора до 16 изображений и более. Охранные системы видеонаблюдения позволяют создать гибкую и наращиваемую систему безопасности, в которую могут входить не только компоненты систем видеонаблюдения, но и охранно-пожарная сигнализация и системы контроля доступа. Системы скрытого видеонаблюдения используются для повышения эффективности охраны и устанавливаются там, где необходимо
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 72 Часть I. Принципы построения систем телевидения скрыть факт наблюдения. Задача систем скрытого видеонаблюдения — не изучать посетителей, а контролировать ситуацию на охраняемой территории. Единая система видеонаблюдения на территории отдельно взятого участка местности позволит решить следующие задачи: • возможность централизованно отслеживать состояние различных стратегически важных объектов и территорий; • получение информации одновременно и моментально всеми органами, контролирующими безопасность объекта; • возможность оперативного реагирования на любых уровнях на возникающие нештатные ситуации, особенно при использовании мобильных точек доступа; • возможность принятия решений, при необходимости, сразу на вышестоящем уровне; • возможность в динамике отслеживать события, происходящие на территории объекта, благодаря архиву видеоинформации, что значительно упростит оперативно-розыскную деятельность; • получение информации для анализа произошедших событий. В качестве примера рассмотрим систему наблюдения, разработанную фирмой Intelligent Instrument Corporation, США. Система обеспечивает наблюдение за многими зонами, расположенными в разных частях города, автоматически идентифицирует изменение ситуации по отношению к допустимому варианту, т. е. выбирает для показа оператору зону, в которой что-то происходит, и обладает другими полезными свойствами. Ðèñ. 3.1. Структурная схема системы наблюдения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.2. 73 Структурные схемы ПС системы охранного телевидения Система (рис. 3.1) состоит из центральной станции ЦС и многих периферийных станций ПС, подключенных к сети ISDN через блоки управления и связи (БУиСв). Каждая периферийная станция содержит ТВ камеру, кодер изображения (видеокодер), блок ввода/вывода звука (В/В звука), кодер/декодер звука (кодек звука), ЗУ. Центральная станция содержит декодер изображения (декодер видео), монитор и указанные выше блоки звукового канала. БУиСв на ЦС выполняется на основе ПК, а на каждой ПС — на основе микропроцессоров.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 74 Часть I. Принципы построения систем телевидения В процессе наблюдения в каждой ПС видеосигнал записывается в ЗУ, которое все время содержит несколько последних кадров, сжатых методом JPEG. Каждый новый кадр сравнивается с запомненным предыдущим с целью обнаружения изменений, которые могут быть результатом наличия движения в наблюдаемой зоне. При обнаружении движения данная ПС устанавливает через ISDN связь с ЦС и начинает пересылать в реальном времени сжатое движущееся изображение. Оператор на ЦС наблюдает полученное изображение на экране монитора. Он может также слышать звуки и устанавливать голосовую связь с людьми в наблюдаемой зоне. При необходимости оператор может вызвать пересылку с ПС запомненного неподвижного изображения высокого качества (не в реальном времени). В зависимости от характера наблюдаемых объектов, количества видеокамер, условий работы ТВ системы структурные схемы построения ПС, соответственно, также будут иметь свои особенности. Рассмотрим два наиболее типовых варианта построения периферийных станций охранного телевидения. Показанная на рис. 3.2,a схема ТВ системы охраны, наблюдения и контроля имеет в своем составе и мультиплексор, и видеорегистратор. С выходов мультиплексора видеосигналы поступают на видеорегистратор, монитор, через модем на центральную станцию (диспетчерскую) ЦС (см. рис. 3.1), а сигнал тревоги — на устройство звукового или светового оповещения. Вторая схема ПС системы охранного телевидения (рис. 3.2,b) имеет в своем составе видеорегистратор, сочетающий функции мультиплексора и регистратора изображений на жесткий диск, мониторы, звуковую и световую сигнализацию, компьютер для передачи данных в сеть через модем в центральную станцию. 3.1. Видеокамеры Основу любой ТВ системы составляют видеокамеры. Использование видеокамер предоставляет оператору одновременного, например, последовательного во времени визуального контроля нескольких удаленных мест, позволяет не только контролировать изменение ситуации в этих зонах, но и осуществлять, при необходимости, запись соответствующих сигналов ТВ изображений. Основой современной видеокамеры является ПЗС- или КМОПматрица (ПЗС — прибор с зарядовой связью), преобразующая падающий на нее свет в электрические заряды, которые используются для получения выходного сигнала изображений с помощью специальной электронной схемы. Упрощенно прибор с зарядовой связью можно рассматривать как матрицу близко расположенных МДП-конденсаторов. Структуры ме-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 75 талл-диэлектрик-полупроводник (МДП-структуры) научились получать в конце 50-х годов. Были найдены и развиты технологии, которые обеспечивали низкую плотность дефектов и примесей в поверхностном слое полупроводника. С физической точки зрения ПЗС интересны тем, что электрический сигнал в них представлен не током или напряжением, как в большинстве других твердотельных приборах, а зарядом (зарядовыми пакетами). При соответствующей последовательности тактовых импульсов напряжения на электродах МДП-конденсаторов зарядовые пакеты можно переносить между соседними независимыми областями под смежными электродами прибора. Поэтому такие приборы и названы приборами с переносом заряда или с зарядовой связью (более подробно про ПЗС- и КМОП-матрицы — в главе 5). На рис. 3.3 показана структура одного элемента линейного трехфазного ПЗС в режиме накопления. Структура состоит из слоя кремния p-типа (подложка), изолирующего слоя двуокиси кремния SiO2 и набора пластинэлектродов. Один из электродов Ðèñ. 3.3. Структура одного элемента ПЗС смещен более положительно, чем остальные два, и именно под ним происходит накопление заряда. Полупроводник p-типа получают добавлением (легированием) к кристаллу кремния акцепторных примесей, например атомов бора. Акцепторная примесь создает в кристалле полупроводника свободные положительно заряженные носители — дырки. Дырки в полупроводнике pтипа являются основными носителями заряда, свободных электронов там очень мало. Если теперь подать небольшой положительный потенциал на один из электродов ячейки трехфазного ПЗС, а два других электрода оставить под нулевым потенциалом относительно подложки, то под положительно смещенным электродом образуется область, обедненная основными носителями — дырками. Они будут оттеснены вглубь кристалла. На языке энергетических диаграмм это означает, что под электродом формируется потенциальная яма. Радужную поверхность ПЗС-матрицы можно увидеть через отверстие (с резьбой) в корпусе видеокамеры (рис. 3.4), в которое вворачивают объектив с выбранным углом поля зрения (большинство видеокамер стандартного дизайна поставляется без объективов). От используемой ПЗС-матрицы произошло название «ПЗС-видеокамера» (в первых телекамерах использовались электровакуумные приборы — передающие трубки). ПЗС-матрица состоит из большого
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 76 Часть I. Принципы построения систем телевидения Ðèñ. 3.4. Конструкции видеокамеры в стандартном корпусе числа светочувствительных ячеек, с помощью которых сфокусированное на ней изображение оптической проекции преобразуется в соответствующую совокупность зарядов, соответствующих каждой ячейке. Дискретные элементы такого разложения изображения называются пикселями (от англ. pixel — picture element)∗ . Чем больше число пикселей, тем менее заметны искажения пространственной дискретизации результирующего ТВ изображения. Количество пикселей указывается в паспорте на видеокамеру, эта характеристика является одной из наиболее важных. Чаще всего используются ПЗС-матрицы с количеством пикселей 512×576 или 768×1024 (первые используются в видеокамерах стандартного разрешения, вторые — в видеокамерах высокого разрешения). В последнее время начинает проявляться интерес к использованию в охранном телевидении так называемых мегапиксельных видеокамер, у которых размер ПЗС-матрицы (и, соответственно, разрешающая способность) может быть существенно большим (например, 4096×4096 пикселей). Дискретный характер преобразования аналогового изображения в заряды определенных ячеек явилась предпосылкой для создания цифровых видеокамер (в частности, на базе CMOР-технологии). В этих видеокамерах выходная информация может быть представлена в виде цифрового кода, соответствующего освещенности каждой ячейки, что позволяет достаточно легко интегрировать подобные видеокамеры в компьютерные сети и вычислительные системы. Отметим, что при этом отсутствует потеря информации, которая сопутствует существующему и доминирующему в настоящее время неоднократному цифроаналоговому и аналого-цифровому преобразованию: сначала дискретные сигналы ячеек ПЗС-матрицы преобразуются в аналоговый выходной сигнал видеокамеры, затем аналоговые сигналы видеокамер преобразуются в цифровые сигналы устройств обработки и регистрации видеосигналов (разделителей экрана, видеомультиплексоров, цифровых видеорегистраторов), а те, в свою очередь, преобразуют цифровые сигналы в аналоговые. ∗ Иногда их также называют сенсилями (от англ. censor element). — Прим. ред.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 77 Тем не менее в настоящее время большинство используемых в охранном телевидении видеокамер является аналоговыми, т. е. их выходным сигналом является стандартный композитный видеосигнал размахом 1 В. Следует отметить, что в некоторых аналоговых видеокамерах осуществляется цифровая обработка сигнала DSP (Digital Signal Processing) — это позволяет получать качественное изображение при различных условиях освещенности, а также дистанционное управление, обнаружение движения, формирование надписей и т. п. Тем не менее следует подчеркнуть, что подобные видеокамеры не являются цифровыми в указанном выше смысле этого слова. Рассмотрим параметры видеокамер, анализируемые при их выборе для решения конкретной задачи. Электроды ПЗС в течение некоторого времени после изобретения чаще всего изготавливались в одном слое металла. Слой алюминия толщиной около 1 мкм наносили на прибор испарением. Затем с помощью фотолитографии формировали электроды. Наиболее критичным этапом в технологическом цикле изготовления одноуровневой структуры этого типа является вытравливание межэлектродных зазоров. Для обеспечения хорошего переноса зарядовых пакетов надо, чтобы потенциальные ямы соседних электродов перекрывались. Глубина потенциальной ямы зависит от степени легирования кремния и приложенного к электроду потенциала. Типичные значения — единицы микрон. Отсюда следует, что межэлектродные зазоры не должны быть больше единиц микрон. Суммарная длина этих узких зазоров в больших приборах весьма велика. 3.1.1. Синхронизация LineLock (от сети переменного тока) Этот вариант синхронизации может быть выполнен только с камерами, питающимися переменным током, так как в этом случае синхронизация всех камер осуществляется от питающего напряжения. Это возможно только в том случае, если питание камер происходит от одного источника переменного тока. Поэтому, пока ток в сети синфазный, синхронизация системы будет обеспечена. Если же разные камеры подключены к различным фазам, возникает необходимость их согласования по питанию и настройке фазы для каждой камеры в отдельности. Существуют специальные устройства фазирования/синхронизации для проведения работ по настройке и синхронизации камер в режиме LineLock. Внешняя синхронизация предполагает использование внешнего опорного источника сигнала. Затем этот сигнал распределяется на каждую камеру посредством специального коаксиального кабеля. Опорный сигнал может быть сформирован генератором синхросигналов. Также в качестве опорного сигнала может быть использован
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 78 Часть I. Принципы построения систем телевидения сигнал с видеовыхода одной из камер. Такие варианты предполагают применение дополнительных соединений и кабелей, однако являются единственными способами осуществления синхронизации для камер с питанием от источника постоянного тока, которые не могут быть синхронизированы по питанию (LineLock). 3.1.2. Автоматический электронный затвор Автоматический электронный затвор обеспечивает компенсацию изменения уровня освещенности и постоянную среднюю яркость изображения. Это достигается за счет изменения времени накопления фотозаряда и, как следствие, амплитуды видеосигнала. Скорость переключения затвора (время накопления) может достигать 1/100000 секунды. 3.1.3. Автодиафрагма В течение суток освещенность на контролируемом объекте, как правило, претерпевает существенные изменения. Для поддержания на постоянном уровне количества света на матрице используют встроенный в камеру автоматический электронный затвор или объектив с автодиафрагмой. Объективы с автоматической диафрагмой поддерживают освещенность матрицы на постоянном уровне, изменяя величину относительного отверстия. Диафрагма объектива, подобно зрачку человеческого глаза, при высокой освещенности сужается, пропуская меньше света, а при низкой освещенности расширяется. Необходимый сигнал управления диафрагмой получают за счёт детектирования и последующего интегрирования ТВ сигнала. В конечном счете использование автодиафрагмы позволяет получить сигнал от видеокамеры с хорошей контрастностью, без засветки или затемнения. В системах наружного наблюдения рекомендуется использовать объективы с автоматической диафрагмой. 3.1.4. Фокусное расстояние Фокусное расстояние объектива указывается в миллиметрах и при прочих равных условиях определяет угол зрения. Более широкий угол обеспечивается меньшим фокусным расстоянием. И, наоборот, чем больше фокусное расстояние, тем меньше угол поля зрения объектива. Нормальный же угол зрения ТВ камеры приблизительно эквивалентен углу зрения человека, при этом объектив имеет фокусное расстояние, пропорциональное размеру диагонали матрицы ПЗС. Исходя из вышесказанного, объективы принято делить на нормальные, короткофокусные (широкоугольные), длиннофокусные (телеобъективы).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 79 Объективы, фокусное расстояние которых может изменяться более чем в 6 раз, называются ZOOM-объективами (объективами с трансфокатором). Данный класс объективов применяется при необходимости детального просмотра объекта, удаленного от камеры. Например, при использовании ZOOM-объектива с десятикратным увеличением объект, находящийся на расстоянии 100 м, будет наблюдаться как объект, удаленный на расстоянии 10 м. Наиболее часто используются ZOOM-объективы, оборудованные электроприводами для управления диафрагмой, фокусировкой и увеличением (motorized zoom). Управление камерой, оборудованной данным объективом, оператор может осуществлять с удаленного поста. 3.1.5. Относительное отверстие Обычно объектив имеет два значения относительного отверстия (Ö = 1 : F ) или апертуры: F = f /d, где f — фокусное расстояние; d — диаметр входного зрачка объектива; F минимально — полностью открытая диафрагма; F максимально — диафрагма закрыта. Значение F влияет на выходное изображение. Малое значение F означает, что объектив пропускает больше света, соответственно, камера лучше работает в темное время суток. 3.1.6. Формат матрицы и разрешающая способность видеокамеры Видеокамеры характеризуются специальным параметром, который называется форматом ПЗС-матрицы (Format), это не что иное, как округленное значение длины диагонали матрицы, выраженное в дюймах (можно подчеркнуть, что формат видеокамеры — это не размер, а условное обозначение типоразмера матрицы) [4]. В настоящее время существуют следующие форматы ПЗС-матриц (или тоже самое КМОП-матриц): «1′′ » — 12,8×9,6 мм (в настоящее время практически не используется, но объективы под такую матрицу выпускаются); «2/3′′ » — 8,8×6,6 мм; «1/2′′ » — 6,4×9,6 мм; «1/3′′ » — 4,8×3,6 мм; «1/4′′ » — 3,6×2,7 мм. Следует отметить, что при производстве ПЗС-матриц выход годных приборов зависит от их типоразмера; технологическими и экономическими соображениями продиктовано стремление производителей выпускать ПЗС-матрицы меньших размеров (вплоть до «1/5′′ »). Судя по паспортным данным, производителям при этом удается сохранить основные технические характеристики, однако при уменьшении размера ПЗС-матриц уменьшается контраст воспроизводимого на экране видеомонитора изображения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 80 Часть I. Принципы построения систем телевидения Значение формата ПЗС-матрицы необходимо для выбора подходящего объектива: • диаметр окружности, в которой отображается сфокусированное объективом изображение по сути является диагональю ПЗС-матрицы. Так как ПЗС-матрица имеет форму прямоугольника, то на нее приходится только часть проецируемого изображения; • если формат ПЗС-матрицы и формат объектива совпадают, то прямоугольник матрицы точно вписывается в окружность. Отметим, однако, что если видеокамера поставляется с собственным объективом, то указание в документации на видеокамеру информации о формате ПЗС-матрицы по сути является избыточным. Важный параметр ТВ камеры — разрешение. Этот параметр определяет возможности камеры по воспроизведению мелких деталей изображения: чем выше разрешение, тем больше детальность, информативность картинки. Разрешение измеряется в телевизионных линиях (ТВЛ) и зависит не только от числа пикселей в матрице, но и от параметров электронной схемы камеры. В большинстве случаев разрешение 380...400 ТВЛ вполне достаточно для наблюдения. Существуют камеры, имеющие более высокое разрешение — 560...570 ТВЛ. Такие камеры позволяют четко видеть мелкие детали изображения (номера машин, лица людей и т. д.). Разрешение цветных камер несколько хуже, чем разрешение черно-белых: 300...350 ТВЛ. Существуют цветные камеры более высокого разрешения — 460 ТВЛ и более. Разрешение определяется как количество переходов (в видимой части растра) от черного к белому или обратно, которое может быть передано камерой. Поэтому единица измерения разрешения называется телевизионной линией (ТВЛ). Разрешение по вертикали у всех камер стандарта CCIR (кроме камер совсем уж плохого качества) одинаково, ибо ограничено телевизионным стандартом — 625 строк телевизионной развертки. На разрешение камеры влияют два фактора: количество элементов матрицы и полоса частот видеосигнала, формируемого камерой. Принято считать, что надежно передается количество линий, не превышающее 3/4 от числа строк в растре [7]. То есть камера с 520 элементами имеет разрешение 390 ТВЛ. В настоящее время такой подход практически закрепился в стандартах. Существуют зависимости между разрешающей способностью (N чернобелых линий) и максимальной частотой видеосигнала fN [57]: fN = 0,0127N [МГц] и N = 79fN [лин]. Так, для передачи сигнала 390 ТВЛ необходима полоса частот 4,95 МГц, но полоса пропускания усилителей камеры обычно значительно (в 1,5...2 раза) превосходит необходимую. Так что разреше-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 81 ние ограничивается именно дискретностью структуры ПЗС-матрицы. Разрешение системы в целом определяется тем компонентом, который имеет самое низкое разрешение, т. е., если камера имеет разрешение 430 линий, а монитор — 200, то изображение на экране будет воспроизведено с разрешением лишь в 200 линий. Разрешение может меняться при различных условиях освещенности, при низкой освещенности оно обычно снижается. Это обусловлено увеличением аберраций в объективах с уменьшением значения F и маскирующим действием составляющих шума относительный уровень которых в таком случае возрастает. 3.1.7. Чувствительность Чувствительность — еще один важный параметр ТВ камеры. Этот параметр определяет качество работы камеры при низкой освещенности. Чаще всего под чувствительностью понимают минимальную освещенность на объекте, при которой можно различить переход от черного к белому, но иногда подразумевают минимальную освещенность на матрице. С теоретической точки зрения правильнее было бы указывать освещенность на матрице, так как в этом случае не нужно оговаривать характеристики используемого объектива. Но пользователю при подборе камеры удобней работать с освещенностью на объекте, которую он заранее знает (или может измерить). Формула, связывающая освещенность на объекте и на матрице (1.27): τ Ö2 , Eпзс = ρE0 4 где Eпзс — освещенность на ПЗС-матрице; E0 — освещенность на объекте; ρ — коэффициент отражения объекта; Ö — относительное отверстие объектива; τ — коэффициент светопропускания объектива. Объект Коэффициент отражения, % Снег . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Белая краска . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75...90 Стекло . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Автостоянка с автомобилями . . . . . . . . . . . . . . . . . . . . . 40 Кирпич . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Бетон . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25...30 Трава, деревья . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Человеческое лицо . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15...25 Единица измерения чувствительности — люкс. Значения минимальной освещенности на матрице и на объекте отличаются, как правило, больше, чем в 10 раз. Например, если указано, что минимальная освещенность на матрице равна 0,01 люкс, то это значит, что при объективе F1.4 минимальная освещенность объекта равна 0,1 люкс. По сравнению с человеческим глазом чувствительность монохромных ТВ камер существенно сдвинута в инфракрасную область.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 82 Часть I. Принципы построения систем телевидения Это обстоятельство позволяет при недостаточной освещенности использовать специальные инфракрасные прожекторы с перестройкой фокусировки в ТВ камере. Инфракрасное излучение не видно человеческому глазу, но прекрасно фиксируется ТВ камерами на ПЗС- и КМОП-матрицах. Чувствительность большинства современных монохромных ТВ камер примерно 0,01...1 люкс (при F1.2). Наиболее чувствительные камеры могут использоваться для ночных наблюдений без ИК подсветки. Для их эффективной работы вполне достаточно лунного света. Для цветных ТВ камер по сравнению с монохромными характерна значительно меньшая чувствительность и её отсутствие в инфракрасной области спектра. Особого упоминания заслуживают сверхвысокочувствительные ТВ камеры, фактически, являющие собой комбинацию обычной ТВ камеры и прибора ночного видения (например, электронно-оптического преобразователя — ЭОП). Подобные камеры обладают не только чувствительностью в 100...10000 раз выше обычных, но не являются долговечными: среднее время наработки на отказ составляет около одного года, причем камеры не следует включать днем. Рекомендуется даже закрывать их объектив, чтобы предохранить от выгорания катод ЭОП. Во время работы камеру необходимо регулярно чуть-чуть поворачивать, чтобы избежать «прожога» изображения. Для этого применяют специальные двухкоординатные устройства управления, которые постоянно перемещаются вверх-вниз, влево-вправо. Но если необходимо полностью скрытое видеонаблюдение, которое злоумышленник, экипированный ночными прицелами, не смог бы обнаружить, альтернативы ТВ камерам с ЭОП нет. Освещенность объектов На улице: безоблачный, солнечный день . . . . . . . . . . . . . 100 000 люкс солнечный день, с легкими облаками . . . . . . . . . . . . . . . . 70 000 люкс пасмурный день . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 000 люкс раннее утро . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 люкс сумерки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 люкс ясная ночь, полная луна . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,2 люкс ясная ночь, неполная луна . . . . . . . . . . . . . . . . . . . . . . . . . . 0,02 люкс ночь, луна в облаках . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,007 люкс ясная, безлунная ночь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,001 люкс безлунная ночь с легкими облаками . . . . . . . . . . . . . . . . . 0,0007 люкс темная, облачная ночь . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,00005 люкс в помещении без окон . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100...200 люкс хорошо освещенные помещения, офисы. . . . . . . . . . . . . .200...1000 люкс 3.1.8. Отношение сигнал/шум С чувствительностью тесно связан параметр «отношение сигнал/шум» (S/N — signal to noise), который измеряется в децибелах: S/N = 20 lg(сигн/шум).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 83 Например, сигнал/шум, равный 60 дБ, означает, что амплитуда сигнала в 1000 раз больше шума. При параметрах сигнал/шум 50 дБ и более на мониторе будет видна чистая картинка без видимых признаков шума. При 40 дБ иногда заметны мелькающие точки, а при 30 дБ — «снег» по всему экрану, 20 дБ — изображение практически неприемлемо. Часто чувствительность камеры указывают для «приемлемого сигнала», под которым подразумевается такой сигнал, при котором отношение сигнал/шум составляет 24 дБ. Это предельное значение отношения сигнал/шум, при котором изображение еще можно записывать на видеопленку и надеяться при воспроизведении что-то увидеть. Другой способ определения «приемлемого» сигнала — шкала IRE (Institute of Radio Engineers). Полный видеосигнал 0,7 вольта принимается за 100 единиц IRE. «Приемлемым» считается сигнал около 30 IRE. Некоторые производители, например BURLE, «приемлемым» указывают сигнал 25 IRE, другие — 50 IRE. Наибольшей чувствительностью среди ПЗС-матриц массового применения обладают Hyper-CAD матрицы Sony, имеющие микролинзу на каждой светочувствительной ячейке. Именно они применяются в большинстве ТВ камер высокого качества. 3.1.9. Цветная видеокамера или черно-белая Известно, что цветные ТВ системы более информативны. Цветные видеокамеры особенно ценно использовать в тех местах, где важно различать цвета, например в метро или на улице, если требуется вести видеонаблюдение за автомобилями. Высокая информативность цветных видеокамер является их важным преимуществом перед черно-белыми, подчас это является решающим аргументом в пользу цветных видеокамер, несмотря на их сравнительно высокую стоимость, а также зависимость качества изображения от интенсивности и типа источника света. В свою очередь черно-белые видеокамеры имеют более высокую разрешающую способность и чувствительность, меньшую стоимость. Для формирования видеосигнала цветного изображения в видеокамере, применяемой в охранном телевидении, как правило, используется одна ПЗС-матрица, перед ячейками которой создаются микросветофильтры основных цветов (красного, зеленого, синего: R, G, В), т. е. один пиксель цветного изображения формируется из трех ячеек, что приводит к падению разрешения, значительному усложнению ПЗС-матрицы и, соответственно, к ее удорожанию. Выбор видеокамеры (цветной или черно-белой) непосредственно определяется техническим заданием на систему охранного теле-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 84 Часть I. Принципы построения систем телевидения видения. Следует отметить, что в одной и той ТВ системе можно одновременно использовать и цветные, и черно-белые видеокамеры (конечно, если в этом есть необходимость). Например, в основном система охранного телевидения может быть цветной, а среди используемых в ней видеокамер может быть и так называемый видеоглазок (черно-белая видеокамера со сверхширокоугольной оптикой, устанавливаемая во входной двери). Такое решение может быть вполне оправданным (естественно, что изображение на экране цветного видеомонитора, поступающее от видеоглазка, будет черно-белым). Или, наоборот, вся уличная видеосистема (включая видеомонитор) может быть черно-белой, но по каким-то причинам (архивирование) в ней может использоваться и цветная видеокамера — при этом все изображения будут нормально отображаться как черно-белые. 3.2. Среды передачи телевизионных сигналов После считывания заряда с ПЗС-матрицы и преобразования его в электрический сигнал полученный ТВ сигнал должен быть передан на видеосервер. Расстояние от видеокамеры до последнего может быть не близким, так как камеры могут располагаться за несколько километров от места видеонаблюдения. Также надо учитывать и электромагнитные помехи, которые также оказывают действие на видеосигнал, поэтому следует внимательно подойти к выбору среды передачи данных от видеокамеры к видеосерверу. Каждый её тип имеет свои ограничения по применению, что необходимо учитывать при проектировании схемы размещения компонентов ТВ системы. Из всех перечисленных типов кабелей оптоволокно наилучшим образом подходит для использования в системах цифрового видеонаблюдения как при передаче сигнала от камер к концентратору, так и при объединении видеосерверов, рабочих мест операторов видеонаблюдения и серверов резервного копирования в единую компьютерную сеть. Поэтому стоит отдельно остановиться на достоинствах оптоволоконного кабеля, принципиальном устройстве оптоволокна и видах оптоволокна. Преимущества волоконной оптики как передающей среды 1. Широкая полоса пропускания. Волоконная оптика теоретически может работать в диапазоне до 1 ТГц, однако используемый сейчас диапазон еще далек от этого предела, и коммуникационные возможности волоконной оптики только начинают развиваться, тогда как медный кабель уже исчерпал свои возможности. 2. Низкие потери. Маленькое уменьшение амплитуды сигнала при передаче больших пакетов информации на большие расстояния. 3. Нечувствительность к электромагнитным полям.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 85 Глава 3. Телевизионные системы охраны объектов Таблица 3.1 Сравнительные характеристики кабелей Тип кабеля Длина линий связи без усилителя Дополнительное оборудование Примечание Коаксиальный кабель До 300 м Не используется Витая пара До 1800 м Передатчики и приемники сигнала по витой паре До 4 км многомодовое; до 40 км одномодовое Передатчики и приемники сигнала по оптоволокну Возможность возникновения токовых петель. Чувствительность к различным наводкам. Малая длина линий связи Отсутствие токовых петель. Высокая защищенность от помех Стоимость кабеля и монтажа ниже, чем при использовании коаксиального кабеля Отсутствие токовых петель. Максимальная защищенность от наводок Оптоволокно многомодовое и одномодовое 4. Малый вес. 5. Малый размер. 6. Безопасность. 7. Секретность. Сравнительные характеристики различных кабелей приведены в табл. 3.1. 3.3. Принцип работы оптического волокна Оптическое волокно имеет два концентрических слоя: ядро (сердцевина) и оптическая оболочка. Внутреннее ядро предназначено для переноса света. Окружающая его оптическая оболочка имеет отличный от ядра показатель преломления и обеспечивает полное внутреннее отражение света в ядре. Волокна имеют дополнительную защитную оболочку вокруг оптической оболочки. Защитная оболочка, представляющая собой один или несколько слоев полимера, предохраняет ядро и оптическую оболочку от воздействий, которые могут повлиять на их оптические свойства. Защитная оболочка не влияет на процесс распространения света по волокну, а всего лишь предохраняет от ударов. Свет заводится внутрь волокна под углом, большим критического, к границе ядро/оптическая оболочка и испытывает полное внутреннее отражение на этой границе. Поскольку углы падения и отражения совпадают, то свет и в дальнейшем будет отражаться в границу. Таким образом, луч света будет двигаться зигзагообразно вдоль волокна. Свет, падающий на границу под углом меньшим критического, будет проникать в оптическую оболочку и затухать по мере распрос-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 86 Часть I. Принципы построения систем телевидения транения в ней. Оптическая оболочка не предназначена для переноса света, и свет быстро затухает. Внутреннее отражение служит основой для распространения света вдоль обычного оптического волокна. Специфические особенности движения света вдоль волокна зависят от многих факторов, включая размер волокна, состав волокна, процесс инжекции света внутрь волокна, классификацию волокон. Оптические волокна могут быть классифицированы по двум параметрам. Первый — материал, из которого сделано волокно: • стеклянное волокно имеет как стеклянное ядро, так и стеклянную оптическую оболочку; • cтеклянное волокно с пластиковой оптической оболочкой (PSC), • пластические волокна имеют пластиковое ядро и пластиковую оптическую оболочку. Второй способ классификации основан на индексе преломления ядра и модовой структуре света. Есть три основные особенности волокон в соответствии с этой классификацией. Первая особенность — различие входного и выходного импульса, это связано с затуханием его мощности, вторая — траектория лучей, возникающих при распространении света, третья — распределение значений показателей преломления в ядре и оптической оболочке для различных видов волокон. 3.4. Сжатие видеоданных При записи изображения обычно используется по 8 битов (1 байт) для представления 256 уровней яркости красного, зеленого и синего цветов (RGB)— на каждый элемент цвета. Таким образом, для хранения одного цветного элемента изображения (пикселя) требуется 3 байта памяти. Стандартный видеокадр формата 352×288 пикселей требует 304128 байтов, а изображение на экране монитора даже при разрешении 640×480 занимает почти целый мегабайт. Использование классических алгоритмов сжатия «без потерь», таких как RLE (кодирование длин серий) или LZW (метод Зива–Лемпела–Уэлча), не решает проблемы, поскольку предельные для них коэффициенты сжатия (2...3 в случае черно-белых полутоновых или 1,5...2 для RGB изображений) совершенно недостаточны для большинства приложений. Коэффициент сжатия, достигаемый при использовании любого метода, зависит от характера изображения. Например, одноцветный фон в любом случае сожмется более эффективно, чем мелкостуктурная область ТВ изображения (более подробно в гл. 16 и 17). Полноцветные 24-битовые изображения можно сжать синтезом изображения с искусственной палитрой и применением кодирования длин серий в сочетании со статистическим кодированием, но при этом
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 87 максимальный коэффициент сжатия будет не более 3...5 относительно исходного изображения, причем основное сжатие произойдет за счет перехода от RGB к 256-цветному изображению с искусственной палитрой, причем искажения, возникающие при таком переходе, необратимы, и уже это обстоятельство не позволяет считать такой способ сжатия неискажающим. Большинство современных методов сжатия видеоизображений как неподвижных, так движущихся объектов, обеспечивающих сжатие в десятки, а иногда в сотни раз, предполагает некоторые потери, т. е. восстановленное изображение не совпадает в точности с исходным. Потери эти связаны с отказом от передачи или некоторого «загрубления» тех компонентов изображения, чувствительность к точности воспроизведения которых у человеческого глаза невелика. Рассмотрим это на конкретных примерах. Как было сказано выше, при записи изображений традиционно используется RGB-представление, когда на каждую цветовую составляющую приходится по одному байту. Альтернативный подход состоит в переходе от RGB- к YCrCb-представлению: Y = 0,299R + 0,587G + 0,114B; Cb = (B − Y)/0,866/2 + 128; Cr = (R − Y)/0,701/2 + 128. Чувствительность человеческого глаза к искажениям яркостной Y-компоненты и цветоразностных компонентов Сb и Сr неодинакова, поэтому вполне допустимым представляется выполнение этого преобразования с прореживанием (интерливингом) Сb- и Cr-компонентов, когда для группы из каждых четырех соседних пикселей (2×2) вычисляются Y-компоненты, а для Сb и Сr формируются соответствующие усреднённые или общие (схема 4:1:1) компоненты. Более того, преи постфильтрация в плоскостях Сb и Сr позволяет использовать прореживание по схеме 16:1:1. Схема 4:1:1: Y = 0,299 · 8 + 0,587 · 8 + 0,1 · 14 · 8 = 7,856 бит; Y Y Cb = = 1,964 бит; Cr = = 1,964 бит; Y + Cr + Cb = 11,784 бит. 4 4 Расчет показал, что схема 4:1:1 позволяет сократить выходной поток вдвое. Схема 16:1:1: Y = 0,299 · 8 + 0,587 · 8 + 0,1 · 14 · 8 = 7,856 бит; Y Y Cb = = 0,491 бит; Cr = = 0,491 бит; Y + Cr + Cb = 8,838 бит. l6 l6 Схема 16:1:1 позволяет сократить выходной поток в 2,71 раза.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 88 Часть I. Принципы построения систем телевидения В основе ставших уже классическими стандартов сжатия JPEG (для статических изображений) и MPEG (для видеоданных), так же, как и в сравнительно новых методах сжатия на основе Wavelet-преобразования, лежит переход от пространственного представления изображения к спектральному. В случае JPEG/MPEG для такого перехода используется дискретное косинусное преобразование (ДКП) различных независимых блоков (квадратных и прямоугольных) с числом пикселей от 4×4 до 16×16, в случае Wavelet — система с пространственной фильтрацией и децимацией составляющих сигналов ТВ изображений. Максимально достижимые коэффициенты сжатия при использовании Wavelet-преобразования зависят от размеров исходного изображения, и при приемлемых искажениях на экранном разрешении можно говорить о 50...70-кратном сжатии. Более подробно вопросы снижения скорости цифрового потока, соответствующего ТВ сигналу, рассмотрены в разделе V (главы 12–18). 3.5. IP-видеокамеры IP-видеокамера представляет собой некий симбиоз видеокамеры и элементов рассмотренной выше видеосистемы на базе компьютера. Если на выходе обычной видеокамеры существует стандартный аналоговый видеосигнал, то на выходе IP-камеры имеется цифровой сигнал, предназначенный для передачи по компьютерной сети. Таким образом, внутри IP-камеры осуществляется формирование аналогового видеосигнала, его оцифровка, компрессия, а соответствующий интерфейс обеспечивает подключение IP-камеры к сети Ethernet 10/100 Мбит/с (протоколы TCP/IP, HTTP и пр.). Встроенный webсервер обеспечивает просмотр изображения от IP-камеры (которой присваивается свой IP-адрес) на включенном в сеть компьютере с помощью стандартного интернет-браузера или специальной программы. Если первые IP-видеокамеры имели сравнительно невысокие технические характеристики (малая чувствительность, встроенный объектив без автодиафрагмы), то в настоящее время эти устройства отвечают всем требованиям, необходимым для использования их в охранном телевидении (например, чувствительность 0,3 лк для цветного изображения и 0,005 лк при переключении в черно-белый режим, формат изображения 720×576 пикселей и более и т. д.). Существуют модификации IP-камер со встроенным жестким диском, детектором движения, с возможностью подключения аналоговых видеокамер (например, при трех аналоговых видеокамерах изображение может передаваться как в полноэкранном, так и в «квадровом» режиме, т. е. 2×2).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 89 Особенно эффективно использовать IP-видеокамеры на объектах, где существует локальная вычислительная сеть, обеспечивающая необходимый трафик. Среди характеристик современных IP-камер можно назвать следующие [4]: • стандартные функции обычных видеокамер: автоматическая регулировка усиления, автоматический баланс белого, компенсация встречной засветки; • автофокусировка встроенного объектива, трансфокатор, автодиафрагма; • управление по компьютерной сети; • уровни доступа (в том числе разрешенные для просмотра временные окна), пароли, фильтрация IP-адресов; • детектор движения; • входы подключения датчиков тревоги, срабатывание которых может использоваться для отправки изображений по e-mail, для позиционирования скоростного поворотного устройства в соответствии с заданными предустановками, для включения внешних устройств; • скорость передачи (до 25 изображений/с); • встроенная операционная система (нередко используется Linux); • многопользовательский доступ; • возможность отображать на изображении время/дату, текст; • возможность передачи аудиосигналов (у некоторых моделей наличие встроенного микрофона); • возможность подключения модема; • буфер хранения изображений в момент тревоги, до нее и после (флэш-накопитель); • защита от переполнения сетевого трафика; • цифровое увеличение; • выход аналогового сигнала. Использование IP-камер особенно экономически оправдано там, где уже существует компьютерная сеть. Недостатками некоторых IPкамер является невысокая частота передачи изображений, невозможность передачи по сети несжатых кадров и сравнительно высокие требования к клиентским компьютерам. 3.6. Мультиплексор Родоначальником мультиплексора является видеоквадратор. Видеоквадратор помещал изображение от четырех (или менее) видеокамер на один экран, разделенный на четыре прямоугольные области, по аналогии с прямоугольной системой координат иногда называемые квадрантами. Для решения этой задачи видеосигнал вначале должен
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 90 Часть I. Принципы построения систем телевидения быть оцифрован, а затем сжат по спектру и преобразован до размера соответствующего квадранта. В системах охранного телевидения мультиплексоры позволяют выводить на экран 16 и более изображений, выполняют функции детекторов движения и исполнительных устройств, вырабатывающих сигналы для записи видеоизображений. Мультиплексор позволяет вести запись изображений от всех видеокамер последовательно по времени или по выбору с одной или нескольких камер одновременно. Цифровая запись видеоизображений на жесткий диск даже с очень большой емкостью памяти (160 Гбайт и более) без их сжатия невозможна из-за чрезвычайно большого объема записываемой информации. Но естественная эволюция устройств цифровой обработки изображений сделала видеомультиплексоры лучшей альтернативой видеоквадраторам, особенно для записи. Видеомультиплексоры — это устройства, выполняющие временное мультиплексирование входных видеосигналов и дающие два типа выходных видеосигналов: один для просмотра и один для записи. Выход для видеонаблюдения позволяет показывать изображения со всех видеокамер на одном экране одновременно. То есть, если у нас есть 9-канальный видеомультиплексор с 9 видеокамерами, то все они будут представлены на экране в виде мозаики 3×3. Та же концепция применима к 4- и 16-канальным видеомультиплексорам. В большинстве видеомультиплексоров любая видеокамера может быть выбрана для полноэкранного отображения. Пока на видеовыходе воспроизводятся эти изображения, на магнитофонный выход видеомультиплексора посылаются разделенные по времени мультиплексированные изображения со всех видеокамер, выбранных для записи. Мультиплексор может иметь тревожные входы Alarm. В качестве источника тревоги могут быть различные датчики: акустические, движения, инфракрасные и т. д. При появлении сигнала тревоги мультиплексор может начать медленную запись либо вывести на монитор изображение с камеры, где предположительно нарушен режим безопасности. Симплексные и дуплексные мультиплексоры. Многие мультиплексоры позволят просматривать изображения с любой выбранной видеокамеры в мозаичном режиме. Если нужно просмотреть записанную ленту, то, как мы уже говорили, вначале сигнал с выхода видеомагнитофона поступает не на видеомонитор, а на мультиплексор, где происходит декодирование сигналов. В этот момент мультиплексор не может быть использован для записи. Итак, если необходимо одновременно сделать запись и просмотреть изображение, то потребуется еще один мультиплексор и видеомагнитофон. Видеомультиплексоры,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 91 которые в конкретный момент времени могут выполнять только одну задачу, называются симплексными. Но бывают и дуплексные мультиплексоры, фактически представляющие собой «два в одном» — два видеомультиплексора в одном корпусе, один для записи, другой для воспроизведения. Если требуется одновременное воспроизведение и запись, то потребуется два видеомагнитофона. Некоторые производители изготавливают мультиплексоры, называемые триплексными. Эти устройства обладают той же функциональностью, что и дуплексные, но вдобавок могут воспроизводить на одном экране комбинацию из наблюдаемых в данный момент и воспроизводимых с видеомагнитофона изображений на одном видеомониторе. Основным назначением видеомультиплексоров (Multiplexers) является организация качественной видеозаписи с минимальными временными потерями информации в сигналах от нескольких видеокамер (рис. 3.5). Достигается это тем, что видеомультиплексор формирует на Ðèñ. 3.5. Использование видеомультиплексора выходе мультиплексированный видеосигнал, получаемый переключением видеокамер с частотой полей (если подключить видеомонитор к этому выходу видеомультиплексора, на экране будут видны мелькающие изображения от подключенных видеокамер). Таким образом, на устройство видеозаписи с видеомультиплексора поступают с частотой полей видеосигналы, соответствующие полноэкранному отображению, и в этом заключается основное преимущество видеомультиплексоров перед разделителями экрана. Понятно, что чем больше входов у видеомультиплексора, тем больше время между обращениями к каждой видеокамере, а значит, тем сильнее проявляется «строб-эффект». Например, если подключено 16 видеокамер, то время между обращениями к каждому каналу равно 0,32 с, что близко к пределу, когда движущееся изображения последовательности еще опознаётся как слитное (рис. 3.6). Однако следует учесть, что реально в видеомультиплексорах время коммутации существенно больше указанного. Дело в том, что, с одной стороны, для нормальной работы устройств, оцифровывающих видеосигна- Ðèñ. 3.6. Формирование идеальной мультиплексированной последовательности
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 92 Часть I. Принципы построения систем телевидения Ðèñ. 3.7. Формирование реальной мультиплексированной последовательности Ðèñ. 3.8. Принцип работы PVP. Тревога в 5 зоне лы, в общем случае не требуется синхронизация видеокамер. С другой стороны, поскольку видеосигналы могут приходить не синхронизированными, во избежание искажений в большинстве видеомультиплексоров закладывается пауза в два–три поля (на гарантированное завершение предыдущего поля) — отсюда на экране видеомонитора появляется уже явно заметная прерывистость движущихся изображений за счёт пустого поля (рис. 3.7). Данная проблема решена в видеомультиплексорах, использующих функцию PVP (Parallel Video Processing) — параллельное использование двух поочередно подключаемых к четным и нечетным входам прибора видеопроцессоров (рис. 3.8). Благодаря этому обращение к каждому каналу происходит действительно на частоте полей, а значит, и запись производится с меньшей потерей информации [4]. При фиксированном значении суммарной скорости обновления информации (25 полей/с или 50 полей/с) на все каналы и заданном числе коммутируемых видеовходов повышение информативности отдельных каналов может достигаться только за счет уменьшения информативности оставшихся каналов, иначе говоря, перераспределения потоков видеоинформации. Таким образом, для ускорения обновления информации по отдельным видеовходам порядок коммутации каналов должен меняться (например, в случае срабатывания внешнего датчика тревоги или встроенного детектора движения). В этом случае возможны режимы: • приоритетный (переключение каналов происходит с нарушением порядка номеров каналов, а именно: к каналу с тревогой обращение идет чаще; каждый раз осуществляется возврат к нему после обращения к очередному каналу без тревоги) — рис. 3.9;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.9. Ðèñ. 3.10. 93 Приоритетный режим работы видеомультиплексора Эксклюзивный режим работы видеомультиплексора. Тревога в 5-й зоне • эксклюзивный (отображаются только каналы с тревогой) — рис. 3.10. Необходимо отметить, что некоторые видеомультиплексоры позволяют заранее запрограммировать порядок переключения каналов при видеозаписи (даже при отсутствии тревоги), априорно предполагая большую информационную значимость отдельных зон. Важно и то, что в течение цикла может быть не одно, а произвольное количество обращений к приоритетным видеокамерам в любом порядке (в том числе и к нескольким подряд в последовательности). Еще одна особенность некоторых приборов — видеовходы, к которым не подключены видеокамеры, автоматически исключаются из мультиплексируемой последовательности (за счет чего повышается скорость обновления остальных видеовходов). Установленный режим работы видеомультиплексора и режим записи видеомагнитофона (3-часовой, 12-часовой и т. д.) при их совместной работе должен четко совпадать, что не вполне удобно при переходе видеомагнитофона на другой режим работы. Некоторые видеомультиплексоры обеспечивают такое соответствие автоматически, за счет использования специального импульса синхронизации, поступающего с видеомагнитофона. Следует иметь в виду, что видеозапись, выполненная с помощью мультиплексора одного производителя, может оказаться непригодной для воспроизведения с помощью мультиплексора другого производителя. Поэтому важной является информация о совместимости приборов. Кроме видеозаписи, видеомультиплексоры широко используются для одновременного отображения сигналов от нескольких видеокамер (в литературе такой режим называют по-разному: мультисценовый, мультиэкран, мультикартинка и пр.). Видеомультиплексоры выпускаются на 4, 8, 9, 10 и 16 входов; кроме того, некоторые производители выпускают видеомультиплек-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 94 Часть I. Принципы построения систем телевидения соры, совмещающие в себе функции матричного видеокоммутатора, наращиваемого до 32 входов (5 выходов). Видеомультиплексоры могут иметь два выхода на видеомонитор: аналоговый и цифровой, что обеспечивает одновременное наблюдение мультисценового отображения и полноэкранного от любой видеокамеры. При наличии в видеосистеме нескольких видеомультиплексоров они могут управляться от одной клавиатуры через интерфейс RS-485. Видеомультиплексоры могут быть цветными или черно-белыми. Они характеризуются следующими параметрами: • формат мультисценового отображения (например, 2×2, 3×3, 4×4, кадр в кадре и др.); • количество пикселей (естественно, что 720×576 лучше, чем 512×512); • количество градаций яркости (например, 256) — чем больше это значение, тем изображение более естественное; • частота обновления изображения (50 Гц лучше, чем 25 Гц, поскольку при этом меньше заметен «строб-эффект»); • частота выборок при цифровой дискретизации и обработке, которая определяет размер мелких деталей (16 МГц лучше, чем 13,5 МГц); • электронное увеличение. Современные видеомультиплексоры выполняют следующие функции [4, 29]: • программирование по экранному меню; • детектор движения; настройки позволяют, например, обнаруживать появление в кадре нового объекта; • электронное панорамирование (при увеличении «живого» изображения); • автоматическая регулировка усиления входных видеосигналов, приводящая их к единому нормируемому размаху (при этом контрастность сегментов мультисценового отображения на экране видеомонитора одинаковая); • запоминание последнего (перед пропаданием видеосигнала) изображения; • стоп-кадр, позволяющий детально проанализировать изображение; • возможность последовательного автоматического переключения видеовходов; • тревога при пропадании видеосигнала; • выход контактов реле (срабатывание от встроенного детектора движения, по макрокоманде и пр.);
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 95 • встроенный текстовый генератор (время, дата, сообщение о тревоге, потере видеосигнала, наименование контролируемой зоны); • макрокоманды, позволяющие осуществлять гибкое программирование прибора на выполнение последовательности различных операций; запуск макрокоманд осуществляется нажатием двух клавиш, либо замыканием контактов охранного датчика, либо по таймеру; • блокировка доступа; • возможность дистанционного управления от клавиатур несколькими видеомультиплексорами, а также поворотными устройствами; • дистанционное программирование (в том числе и по модему, что позволяет организовать техническую поддержку для дилеров в удаленных от поставщика регионах); • запрет на вывод сигнала от одной из видеокамер на экран (например, для конфиденциальной записи действий охраны); • сохранение всех настроек в энергонезависимой памяти; • возможность ИК дистанционного управления. Отметим, что видеомультиплексоры, как правило, имеют так называемый сквозной видеопроход (иногда называемый «видеопетля»), т. е. устройство согласования коаксиального кабеля с оконечным резистором 75 Ом, отключаемым различным образом: • механически вручную; • механически автоматическим образом (при подключении байонетного разъема); • программно. Данная опция гарантирует отсутствие появления в видеосистеме искажений, вызванных несогласованностью кабелей. 3.7. Детекторы движения Детектор движения (Motion Detector), или видеосенсор, служит для формирования сигнала нарушения и привлечения внимания оператора в случае обнаружения изменений в контролируемой зоне, а также для изменения режима работы системы охранного телевидения (например, включения видеозаписи или перехода видеорегистратора в более информативный режим) и/или включения внешних устройств (например, системы охранной сигнализации). Причиной срабатывания детектора движения является наличие превышающих заданный пороговый уровень изменений в последовательности сигналов кадров внутрикадровой структуры ТВ изображений, соответствующих контролируемой сцене или территории.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 96 Часть I. Принципы построения систем телевидения Таким образом, выполняя функции охранного датчика, детектор движения не требует установки на объекте реальных охранных датчиков, позволяя при этом уменьшить появление ложных тревог. Это происходит потому, что будучи более подвержен ложным тревогам, чем охранные датчики, детектор движения обычно позволяет устанавливать границы контролируемого участка общей территории. При этом в случае изменения условий эксплуатации его не надо куда-то физически переносить, изменять монтаж и пр., а достаточно лишь изменить настройку. В современных детекторах движения следует различать функции обнаружения активности и обнаружения вторжения. Обнаружение активности (Activity) имеет целью поиск изменений в видеосигнале, соответствующих яркости отдельных участков изображения, и, если эти изменения превышают установленный порог, детектор движения трактует его как активность. К сожалению, изменения в освещенности объекта или, например, вибрации видеокамеры также будут истолкованы (в данном случае ложно) как активность. Подобный метод используется в детекторах движения, применяемых в видеомультиплексорах, — его использование приемлемо для тех контролируемых зон, где ложное обнаружение не имеет значения, и (или) активность не трактуется как тревожная ситуация, а само перемещение людей здесь является обычным и ожидаемым явлением, которое необходимо наблюдать и регистрировать. По сигналу детектора движения видеозапись и отображение сигнала от видеокамеры с активностью зоны происходят более информативно (с приоритетом). Функция обнаружения вторжения (Intrusion) имеет целью поиск реального движения в зоне наблюдения запрещенного объекта и активизацию тревоги в случае его обнаружения. Она используется для мониторинга участков, где не разрешено или не предполагается перемещение людей. Если движение обнаруживается, то наиболее вероятно, что оно было вызвано чьим-то вторжением. Естественно, что для эффективной работы системы охранного телевидения детекторы вторжения должны вызывать минимум ложных тревог вследствие изменения освещенности, вибрации видеокамеры, случайных отражений света в зоне наблюдения и т. п. Поэтому основным отличием детектора вторжения от детектора активности являются широкие возможности отстройки от ложных тревог. Детекторы движения можно классифицировать следующим образом: • аналоговые или цифровые; • одноканальные или многоканальные (с параллельной обработкой каждого видеосигнала);
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 97 • с аппаратной или программной реализацией. Аналоговые детекторы движения имеют достаточно простые функции, что определяет их экономическую эффективность. Такой прибор обычно имеет один сквозной видеопроход; прибор позволяет произвольным образом устанавливать на экране видеомонитора местоположение, например, четырех маркеров (в виде полупрозрачных прямоугольников), в которых контролируется изменение изображения, причем чувствительность срабатывания детектора движения может регулироваться. Например, один из маркеров может быть установлен по экрану в то место, где располагается дверь, — при обнаружении изменения в сигнале (вызванного, открыванием двери) звучит зуммер и срабатывают контакты реле. Для повышения секретности работы устройства отображение маркеров на экране видеомонитора может быть отключено. Подобные детекторы удобно использовать в местах с постоянным освещением (большей частью в помещениях). Цифровые детекторы движения позволяют осуществлять обнаружение тревоги с достаточно высокой степенью достоверности за счет интегрально-дифференциальной, а не интегральной (как в аналоговых приборах) оценки параметров видеосигналов. При этом изготовителями декларируются следующие опции: • осуществляется достаточно гибкая отстройка от ложных тревог, вызванных облаками, падающей листвой, снегом, качанием видеокамеры и пр.; • производится селекция контролируемых целей по размеру, скорости и направлению перемещения. Реальность решения перечисленных задач требует тщательной экспериментальной проверки. Отображение тревожной ситуации сопровождается цветной окраской областей, в которых обнаружено движение. Программирование цифровых детекторов движения осуществляется выбором в меню прибора специальной точечной сетки (например, 16×16), накладываемой на изображение, с последующим указанием активных зон, чувствительности и пр. Подобный метод позволяет достаточно гибко программировать охраняемые зоны (например, можно разместить активные зоны вдоль изображения забора, организуя таким образом охрану периметра). При программировании зон детектора движения следует отключать активность зон, в которых может быть случайное, несущественное движение (раскачивание деревьев на ветру, движение автомобилей или людей в неконтролируемых зонах, изменяющееся отражение от окон, воды и других поверхностей). Что касается селекции по размеру, скорости и направлению, то она имеет свои ограничения, поскольку при обработке изображения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 98 Часть I. Принципы построения систем телевидения используется монокулярное «зрение» видеокамеры, формирующее плоское изображение. При этом близко расположенный мелкий предмет и далеко расположенный крупный объект на экране видеомонитора будут иметь сопоставимые размеры. Искажающее масштабное представление о реальных размерах объекта и перемещениях его в пространстве требует определенных навыков при настройке детекторов движения. В связи с развитием компьютерных систем охранного телевидения появились детекторы движения с программной реализацией; возможности таких детекторов движения намного шире по сравнению с описанными выше приборами с аппаратной реализацией. В первую очередь это относится к количеству контролируемых зон (которых может быть более 1500). Кроме того, детекторы движения позволяют решить проблемы, которые принес с собой прогресс в области цифровых систем охранного телевидения, а именно: • противоречие между желанием записывать изображения с максимальной скоростью при максимальном разрешении и ограниченностью дискового пространства компьютера; • необходимость оперативного поиска требуемого фрагмента видеозаписи в больших архивах. Не менее перспективным является активное использование детекторов движения в периметровых охранных системах. В отличие от широко используемого анализа изменения изображения в дискретных зонах, прогрессивным направлением в области детекторов движения является обработка видеосигнала, соответствующего полному изображению. Однако для реализации этого в компьютерной системе охранного телевидения компрессия видеоизображения, обогащающая пространственно-временную и цветовую структуру сигнала ТВ изображения искажениями сжатия спектра, не должна предшествовать анализу видеосигнала в детекторе движения. Следует отметить, что в последнее время в детекторах движения используется технология Slow Down Detection (детектирование замедления) — обнаружение оставленных или унесенных предметов (например, остановка движущегося автомобиля), а также детекторы движения, которые совместно с поворотными видеокамерами обеспечивают слежение за объектом в случае обнаружения цели заданного типа. 3.8. Устройства видеозаписи До последнего времени практически основным устройством регистрации видеосигналов в охранных системах были охранные видеомагнитофоны (VCR — Video Cassette Recorder). В настоящее время на смену им все больше приходят цифровые устройства видеозаписи (так называемые видеорегистраторы).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 99 Причиной этого являются следующие недостатки охранных видеомагнитофонов: • необходимость перемотки ленты в процессе работы; • сравнительно медленный доступ к интересующей оператора записи; • большой расход пленки (причем предпочтительно, чтобы она была специального качества); • снижение качества при каждой перезаписи; • необходимость периодически заменять пленку и обслуживать видеомагнитофон. Нельзя не учитывать и существенное снижение цены цифровых видеорегистраторов по мере значительного увеличения объема их производства. При этом, однако, следует отметить ряд характерных моментов. Можно прогнозировать, что еще некоторое время охранные видеомагнитофоны будут выпускаться и будут востребованы в небольших малобюджетных системах охранного телевидения. Определенное время охранные видеомагнитофоны будут продолжать эксплуатироваться в видеосистемах, реализованных в течение последних лет. Разработчики автономных цифровых видеорегистраторов стремятся в конструктивном исполнении и назначении органов управления использовать те удачные идеи и технические решения, которые были разработаны и широко используются в охранных видеомагнитофонах, поскольку в этом случае операторам легче осваивать и эксплуатировать новую технику. Указанные причины определяют целесообразность того, чтобы охранным видеомагнитофонам было уделено определенное внимание. 3.9. Охранные видеомагнитофоны Охранные видеомагнитофоны предназначены для регистрации событий, контролируемых системой охранного телевидения. Основными их отличиями от бытовых видеомагнитофонов являются: • длительное время видеозаписи на стандартную 3-часовую видеокассету (от 3 до 24 ч, а в некоторых моделях даже до 960 ч); • наличие входа для подключения датчика тревоги (как правило, рассчитанного для работы на замыкание контактов). Достаточно удобны видеомагнитофоны, рассчитанные на запись в течение 24 ч, поскольку сутки — это период работы одной смены охраны. Однако, как правило, технические характеристики и функциональные возможности у видеомагнитофонов, рассчитанных на 960 ч,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 100 Часть I. Принципы построения систем телевидения оказываются выше. Следует отметить, что длительная запись в охранных видеомагнитофонах достигается за счет использования двух технических приемов: • прерывистый режим продвижения ленты (time-lapse) — при этом достаточно заметен «строб-эффект»; • замедленный режим движения ленты (realtime) — 17 кадров в секунду (вместо 25 кадров, необходимых для идеального восприятия движущихся объектов), что для оператора все-таки комфортнее по сравнению с режимом «time-lapse» — и в ряде случаев делает обновление информации на экране видеомонитора малозаметным. Время обновления изображения в 24-часовом режиме составляет 0,32 с, в то время как в режиме 960 ч — 12,8 с (при мультиплексированной записи сигналов от нескольких видеокамер эти цифры должны быть умножены на число подключенных видеокамер). Естественно, перед выбором режима записи следует проанализировать, насколько он приемлем с точки зрения актуальности записываемой видеоинформации. Время записи звука в видеомагнитофонах обычно не превышает 24 ч, хотя у видеомагнитофонов «realtime» оно может достигать 40 ч. Разрешающая способность является одной из важнейших характеристик видеомагнитофонов и практически определяет разрешающую способность всей видеосистемы, поскольку, как правило, оказывается худшей по сравнению с остальными приборами системы охранного телевидения. В черно-белом режиме разрешающая способность охранных видеомагнитофонов составляет 320...400 ТВЛ, в цветном — 210...400 ТВЛ; цифровой видеомагнитофон обеспечивает 520 ТВЛ (напомним, что качеству VHS соответствует 280 ТВЛ, качеству SVHS — 400 ТВЛ). 3.10. Видеорегистраторы В системах охранного телевещания большое внимание уделяется записи изображений на запоминающее устройство ЗУ. В качестве носителей записи в основном используются магнитная лента и жесткие диски. Наиболее широкое применение нашла цифровая запись видеосигналов на диски. Важным преимуществом видеодисков является низкая стоимость носителя записи, быстрый доступ к любому участку записанной на диске информации, возможность воспроизведения относительно простыми средствами ускоренного, замедленного и неподвижного ТВ изображений. В настоящее время широкое применение в системах прикладного телевидения нашли видеорегистраторы — новое поколение систем
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 101 безопасности. Представленная на рис. 3.2 структурная схема видеонаблюдения и регистрации изображений охраняемых объектов кратко обозначает основные функции видеорегистратора. Видеорегистратор — ядро цифровой системы видеонаблюдения. Это устройство объединяет в себе функции видеомагнитофона, мультиплексора и компьютера. Главной задачей цифрового видеорегистратора является сбор и запись видеопотоков с камер наблюдения, а также хранение видеоинформации. Видеорегистраторы сравнительно недавно появились на рынке систем безопасности, однако уже успели зарекомендовать себя как мощный и надежный инструмент для обеспечения охраны. Цифровые технологии позволили создать это устройство нового поколения, его функциональность предоставляет широкие возможности для работы с видеоизображением. Особенности видеорегистраторов: • обеспечение цифровой записи видеоинформации на жесткий диск, что дает возможность получать быстрый доступ к ней, позволяет обрабатывать эту информацию современными методами; • возможность хранить большие объемы информации за счет современных методов сжатия данных; • возможность работать в компьютерных сетях как локальных, так и глобальных, например в Интернете; • удаленное управление видеокамерами; • запись по детектору движения; • настройка параметров видеосигнала; • печать видеокартинки на принтер; • высокая скорость обработки видеопотока; • возможность записи видеоизображения высокого качества. Наиболее распространенными системами сжатия спектра видеоизображения в системах охранного и прикладного телевидения при записи изображений на жесткий диск на сегодняшний день являются следующие: MPEG-1, MPEG-2, MPEG-4, JPEG и очень перспективное вейвлет-преобразование при записи изображений на жесткий диск. MPEG-1 ориентирован на обработку изображений в режиме реального времени со скоростями передачи информации от 1,5 до 3,5 Мбит/с. Применение MPEG-1 оправдано в тех случаях, когда важнее получить снимок в режиме реального времени, а не изображение высокой четкости при более низкой скорости передачи данных. MPEG-2 представляет собой стандарт, нацеленный на более высокое качество передачи и записи цифровых движущихся изображений и звука. Наибольший интерес в системах охранного ТВ представляет в MPEG-2 транспортный поток, поскольку он хорошо подходит для передачи сигналов цифрового телевидения по телефонным линиям,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 102 Часть I. Принципы построения систем телевидения оптическому волокну и по коаксиальным кабелям, а также для хранения информации на жестких дисках. В настоящее время широкое применение в системах записи на жесткий диск нашел способ сжатия цифрового потока MPEG-4. Стандарт MPEG-4 позволяет передавать и записывать в различные запоминающие устройства (ЗУ) видео- и звуковую информацию с очень большими коэффициентами сжатия. MPEG-4 получил широкое распространение как средство записи кинофильмов и видеопрограмм на лазерные диски. MPEG-4 по своим возможностям будет использоваться также и в ТВ вещании. Рассмотренные стандарты сжатия видеоданных легли в основу построения современных видеорегистраторов. В продаже имеется большой ассортимент видеорегистраторов, применяемых в телевидении. Промышленностью налажен серийный выпуск аппаратов записи на жесткий диск видеорегистраторов. Видеорегистраторы для сжатия цифрового потока используют рассмотренные алгоритмы сжатия: JPEG, MPEG-1, MPEG-2, MPEG-4 и вейвлет-преобразование и другие перспективные алгоритмы. Детекторы движения встраиваются практически во все мультиплексоры и квадраторы достаточно высокого класса. Для одновременной записи сигналов от нескольких телекамер применяются мультиплексоры, которые сигналы от телекамер коммутируют по очереди для записи на видеорегистраторы. Периодичность записи определяется режимом использования дискового пространства видеорегистратора. При воспроизведении из последовательности всех кадров автоматически выбираются и выводятся на монитор только те, которые относятся к интересующей в данный момент камере. Рассмотрим некоторые из уже применяемых видеорегистраторов и дадим им характеристику. 16-канальный цифровой видерегистратор DX-TL5000E компании Mitsubishi Electric записывает видеокадры в формате JPEG 2000 с разрешением до 720×576 пкс и скоростью до 200 кадров в секунду. Это устройство цифровой видеозаписи имеет русифицированное меню управления/настройки и предназначено для работы как в небольших, так и в многоканальных системах видеонаблюдения. Данный видеорегистратор предусматривает несколько вариантов наращивания памяти для видеозаписи, допускает подключение внешних носителей (RAID, DX-ZD5), поддерживает соединения с NAS-сервером и объединение в каскад до 16 видеорегистраторов Mitsubishi. В отличие от предшественников DX-TL5000 может управляться с передней панели, с помощью «мыши» или пульта, по сети и через Интернет, а также производит архивирование на встроенное устройство DVD.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 103 Видеорегистратор VR-716E компании JVC Professional предназначен для работы в составе цифровой системы видеонаблюдения. Видеорегистратор записывает видео одновременно с 16 видеокамер со скоростью 400 к/с при разрешении кадра 740×576 пкс, использует формат сжатия видеосигнала MPEG-2, автономно переходит на летнее или зимнее время и позволяет точно настраивать детекторы движения каждого канала и делать дубликат видеозаписи. Видеорегистратор также записывает один канал аудиоинформации, имеет два жестких диска емкостью 80 Гбит каждый и передает кадры по LAN/WAN сетям. При необходимости память видеорегистратора может быть расширена внешними дисками и DVD-устройством. Благодаря использованию современных технологий цифровой обработки и записи видеосигнала компании JVC видеорегистратор VR716E записывает видео с каждого канала со скоростью 25 кадр/с, с использованием метода сжатия MPEG-2 позволяет записать на жесткие диски более 9 часов видео с каждой из 16 видеокамер при установке максимальной скорости видеозаписи и наивысшего качества кадра. В зависимости от требований к качеству кадров видеорегистратор VR-716E предоставляет оператору системы видеонаблюдения возможность выбора одного из 4 уровней сжатия видео и 10 значений скорости видеозаписи. Профессиональная 9-канальная система видеорегистрации CS909-AR с широкими возможностями работы. Цифровой видеорегистратор CS-909-AR отличается возможностью записи в реальном времени изображений от 9 видеокамер, записью 9 звуковых каналов, возможностью организации больших внутренних и внешних архивов, развитыми сервисными функциями и удобной эксплуатацией. Благодаря наличию в конструкции 9 цифровых каналов обработки сигнала, видеорегистратор CS-909-AR обеспечивает индивидуальные настройки для каждого канала и суммарную скорость видеозаписи для 9 видеокамер до 225 кадр/с. Запись ведется с качеством 720×576 пикселей. Используется алгоритм сжатия MPEG-4. Возможна запись по таймеру, по сигналу тревоги или детектору движения. Для воспроизведения предусмотрены два видеовыхода (основной — мультиэкран, дополнительный — камеры по выбору) и один VGA выход для подключения стандартного компьютерного монитора. Регистрация ведется на встроенные жесткие диски, возможна установка до 8 внутренних HDD и 1 съемного HDD (Mobile Rack). Резервное копирование видеоархива может осуществляться как на съемный HDD, так и на HDD, подключенный через USB-интерфейс. Развитые сетевые возможности позволяют совмещать режим воспроизведения с режимом записи и управление устройством с компьютера.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 104 Часть I. Принципы построения систем телевидения Видеорегистратор CS-909-AR удобен в управлении, которое осуществляется с передней панели устройства, с дистанционного пульта управления или с ПЭВМ. Технические характеристики видеорегистратора CS-909-AR. Входы/выходы Видеовходы/выходы . . . . . . . . . . . . . . . . . 9×BNC (1 B, 75 Ом)/2×BNC (1×RCA (8 дБ, 22 кОм), 1 B, 75 Ом) + 1×S-Video + 1×VGA Аудиовходы/выходы . . . . . . . . . . . . . . . . . 9 (8 дБ, 22 кОм)/1 (8 дБ, 22 кОм) Входы/выходы тревоги . . . . . . . . . . . . . . 9 (И.О.)/4 (И.О. или КЗ) Режимы и основные характеристики Разрешение кадров . . . . . . . . . . . . . . . . . . 720×576 пкс Стандарт видеосигнала . . . . . . . . . . . . . . PAL/NTSC Стандарт видеосжатия . . . . . . . . . . . . . . . MPEG4 Стандарт аудиосжатия . . . . . . . . . . . . . . . MPEG1 Layer I, II Суммарная скорость отображения . . . . 225 кадр/с Скорость записи для 1 видеосигнала . 25 кадр/с Суммарная скорость записи . . . . . . . . . . 225 кадр/с, реальный масштаб Количество каналов записи живого видео . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Видеозапись . . . . . . . . . . . . . . . . . . . . . . . . . Последовательная, циклическая, по таймеру, по сигналу тревоги, по детектору движения Поиск . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . По времени, тревоге, метке Воспроизведение . . . . . . . . . . . . . . . . . . . . 2 аналоговых монитора (основной и дополнительный), 1 VGA-монитор, удаленное подключение по сети Режимы воспроизведения . . . . . . . . . . . . Полноэкранный режим + варианты c мультиэкранным изображением Уровни сжатия . . . . . . . . . . . . . . . . . . . . . . 8, устанавливаются индивидуально для каждого канала Поворотные устройства . . . . . . . . . . . . . . Управление в каждом канале, RS-485/2×RS232 Детектор движения . . . . . . . . . . . . . . . . . . До 192 зон, 1–99 уровней чувствительности для каждого канала Сетевое подключение . . . . . . . . . . . . . . . . RJ45 Port Сетевые протоколы . . . . . . . . . . . . . . . . . . Ethernet 10M/100M, TCP/IP, PSTN Резервное копирование . . . . . . . . . . . . . . USB-устройства, съемный жесткий диск, по сети Управление . . . . . . . . . . . . . . . . . . . . . . . . . . С передней панели, с дистанционного пульта управления или с ПЭВМ Безопасность . . . . . . . . . . . . . . . . . . . . . . . . Трехуровневая система паролей Тип жесткого диска. . . . . . . . . . . . . . . . . .8 IDE-каналов для жестких дисков, до 8 несъемных дисков высокой емкости + один съемный диск. HDD в комплект не входит Питание, габариты и масса Потребляемая мощность . . . . . . . . . . . . . 50 Вт (без учета HDD) Питание . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110/220 В, переменный ток 60/50 Гц Габариты . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420×380×105 мм Новый 16-канальный видеорегистратор DX-TL2500 предназначен для работы в составе системы видеонаблюдения средних и крупных объектов. Этот видеорегистратор обеспечивает запись видеоинфор-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.11. 105 16-канальный видеорегистратор VR-616E мации со скоростью 50 полей в секунду в формате Wavelet с разрешением 450 ТВЛ и запись одного канала аудиоинформации. Встроенный в видеорегистратор веб-сервер и сетевая карта позволяют управлять записью и воспроизведением видео с любого компьютера через стандартный веб-браузер. Обеспечивается работа в режиме триплексного мультиплексора и запись аудиосигнала. Видеорегистраторы DX-TL2500E могут работать одновременно с двумя видеомониторами, каждый из которых независимо настраивается на контроль текущей ситуации или на просмотр видеоархива. Одновременно с просмотром видеорегистраторы производят запись видео с подключенных к ним 16 телекамер. Поскольку видеорегистраторы используют алгоритм сжатия Wavelet, на штатный носитель можно записать до 196 суток качественного видео. Также DX-TL2500E может записывать аудиоинформацию в формате РСМ через один аудиоканал, что очень удобно, если требуется получить звуковое сопровождение из зоны видеонаблюдения одной из телекамер. Емкость жесткого диска видеорегистратора равна 120 Гбайт. 16-канальный видеорегистратор VR-616E c Wavelet-преобразованием для многоканальной системы видеонаблюдения (рис. 3.11). JVC Professional представляет новый цифровой видеорегистратор VR-616E на 16 видеоканалов и один аудиоканал, который позволяет осуществлять управление купольными видеокамерами непосредственно с передней панели или из окна просмотра изображения. Как и другие видеорегистраторы JVC, этот цифровой видеорегистратор записывает 16 каналов видео в формате Wavelet со скоростью до 50 полей в секунду с разрешением кадра до 720×576 пикселей, имеет жесткий диск 240 Гбайт и позволяет установить в корпус один стационарный и один съемный диск типа HDD или CD-RW. При необходимости VR616E можно доукомплектовать клавиатурой с джойстиком, которая
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 106 Часть I. Принципы построения систем телевидения делает управление VR-616E и купольными видеокамерами максимально удобным. Удаленный просмотр изображения и управление видеокамерами через видеорегистратор осуществляется по LAN/WAN сети из окна стандартного web-браузера или с помощью клиентского ПО, входящего в комплект поставки. За счет использования алгоритма сжатия Wavelet данный видеорегистратор может записывать на жесткий диск гораздо больше видеоинформации, чем предшествующие видеорегистраторы JVC, использующие формат JPEG. Его максимальная скорость записи составляет до 50 полей в секунду или около 3 полей в секунду на канал, что вполне достаточно для многих систем видеонаблюдения. Вместе с тем скорость записи по тревожному каналу или по расписанию можно увеличить. Максимальное разрешение записываемого кадра составляет 720×576 пикселей, но по желанию оператора системы видеонаблюдения оно может быть изменено выбором одного из 7 уровней качества видео для каждого канала. Для одновременной записи, просмотра «живого» видео и видеоархива на разных мониторах видеорегистратор имеет встроенный триплексный мультиплексор. В режиме просмотра VR-616E выводит на экран изображение со скоростью до 225 кадр/с или 25 кадр/с на канал в мультиэкранном режиме, поддерживает 7 режимов разбивки, включая «картинка в картинке». На задней панели видеорегистратор имеет выход S-Video и разъем VGA для подключения компьютерного монитора, LCD-монитора или плазменной панели. Помимо композитного выхода для подключения монитора видеонаблюдения, видеорегистратор имеет Spot-выход для монитора выборочного видеоконтроля, на который могут выводиться кадры с видеокамер особо ответственных участков объекта видеонаблюдения. Для «замораживания» картинки на передней панели и пульте управления имеется кнопка FREEZE, а для увеличения кадра в 2 раза — кнопка ZOOM. 3.11. Типовые примеры построения систем видеонаблюдения и охраны объектов Наиболее часто встречающийся случай охраны объектов — это небольшой офис, магазин, отделение милиции. Обычно в этом случае используют систему на основе квадратора и 4 видеокамер. Одна камера наблюдает за входом. Две устанавливаются в помещении, где бывают посетители (клиенты, покупатели). Четвертая используется для наблюдения за местом хранения ценностей (складским помещением, комнатой хранения оружия, местом работы кассира, сейфом и т. п.). Все сигналы через квадратор выводятся на монитор. Запись ведется
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 107 на спецвидеомагнитофон, который помещается в комнату, доступную только руководителю. Другой класс объектов — склад, небольшое производственное предприятие. В ночное время на объекте никого нет, поэтому система должна обеспечивать охрану здания и периметра, а в случае появления какого-либо движения подать сигнал тревоги. Днем основное предназначение системы регистрация всех происходящих событий: кто вошел, кто вышел, что вынес. Как правило, используется 9 или 16 камер, 2 монитора, спецвидеомагнитофон или видеорегистратор с возможностью уплотненной записи и мультиплексор на 9 или 16 входов соответственно, обязательно с детектором движения, который при возникновении движения в ночное время суток инициирует тревогу. Иногда детектор движения могут заменить датчики системы сигнализации. Камеры располагаются по периметру здания, около въездных ворот, в помещении, где хранится денежная выручка и финансовые документы. Крупные торговые центры также имеют свою специфику. Основная задача системы — сбор и оперативное отслеживание всей информации. Каждый посетитель должен знать, что за ним наблюдают, тогда срабатывает чисто психологический эффект. Поэтому для супермаркетов используют как большие камеры, демонстративно наблюдающие за посетителями, так и специальные камеры, не выделяющиеся по дизайну из общего стиля магазина. Рекомендуется использовать поворотные камеры в затемненном плафоне. Это позволит отслеживать действия подозрительных личностей, а темный плафон не дает возможности узнать, куда в это время направлено внимание охраны. Крупные заводы, исследовательские центры, гостиничные комплексы и т. д. тоже имеют свою специфику. Как правило, основа подобной системы — матричный коммутатор (или даже сеть коммутаторов, так называемая сателлитная структура). Счет камер идет уже на сотни, мониторов – на десятки. Информации слишком много и, чтобы не утонуть в этом море, необходимо создать эффективную систему отсеивания полезных данных. Для этого, как уже было показано выше, можно использовать видеодетекторы движения, информацию от датчиков сигнализации и т. п. При установке системы в публичных местах нельзя забывать о законе, требующем предупреждать посетителей, что за ними ведется наблюдение. Еще одно требование к системам подобного масштаба — обязательное дублирование и резервирование элементов. В условиях, когда объект наблюдения и пост наблюдения находятся на значительном удалении друг от друга (рис. 3.12), возможно применение выносных направленных антенн беспроводной сети Wi-Fi.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 108 Часть I. Принципы построения систем телевидения Ðèñ. 3.12. Видеонаблюдение на удалённом объекте Направленные антенны обеспечивают устойчивый канал связи на расстоянии нескольких километров. Скорость обмена данными по радиоканалу позволяет работать с видеонакопителем нескольким пользователям. Для загородного дома сезонного проживания целесообразно применение системы видеонаблюдения с возможностью удаленного доступа (рис. 3.13). Для удаленного видеонаблюдения используют подключение сотовой сети SkyLink посредством модема. К видеонакопителю подключается до четырех камер как внутреннего, так и наружного наблюдения. Во внутренних помещениях возможна установка микрофонов. Трал запитывается от резервированного источника питания «Тверца 5»; расширенный диапазон входных напряжений источника позволяет обеспечить устойчивую работу системы в условиях нестабильного загородного энергоснабжения. Через контроллер шлейфов к видеонакопителю подключаются внешние охранные датчики: движения, разбития стекла, открытия двери. Для удаленного видеонаблюдения используют подключение сотовой сети SkyLink посредством модема. В такой конфигурации доступ к видеонакопителю может быть осуществлен из любой точки доступа в Интернет, пользователь также имеет возможность получать сообщения по электронной почте о текущих событиях и соответствующие изображения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.13. 109 Видеонаблюдение в загородном доме В условиях, когда точки наблюдения находятся на расстоянии 50...100 метров от устройства просмотра, можно избежать прокладки кабеля локальной сети, используют адаптер Ethernet-to-Powerline для передачи видеоданных по осветительной сети 220 В (рис. 3.14). В непосредственной близости от видеокамер устанавливается видеонакопитель «Трал», к сетевому интерфейсу которого подключен Ðèñ. 3.14. Видеонаблюдение периметра
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 110 Часть I. Принципы построения систем телевидения Ðèñ. 3.15. Видеонаблюдение в метро, поезде адаптер Powerline bridge. Все устройства запитываются от блока бесперебойного питания «Тверца» 12 В. Пользователь имеет возможность просмотреть как текущее изображение, так и видеоархив, в случае обесточивания системы запись по-прежнему проводится и может быть просмотрена по восстановлению энергоснабжения. Зонный видеодатчик движения проинициирует подачу сигнала тревоги при движении на охраняемой территории. Весьма актуальной является проблема видеонаблюдения в движущимся транспорте: метро, поезде, самолете (рис. 3.15). Наряду с необходимостью записи событий, происходящих в вагоне (самолете), машинисту электропоезда необходима текущая видеоинформация для принятия оперативного решения. Для этих целей в кабине машиниста устанавливается устройство просмотра видеопотока NetCore Vision, а все видеонакопители «Трал» в составе электропоезда объединяются локальной сетью. Не всегда есть возможность обеспечить электрическое соединение локальной сети между вагонами. В этом случае уместно применение Wi-Fi радиомоста. Для повышения устойчивости канала радиосвязи антенны радиомодемов монтируются на торцах вагонов друг напротив друга. Просмотр видеоизображения и копирование фрагмента видеоархива любого из «Тралов» осуществляется через USB интерфейс устройства просмотра видеопотока NetCore Vision. При видеонаблюдении в офисном помещении (рис. 3.16) к видеонакопителю подключается до четырех камер, находящихся как непосредственно в офисе, так и перед его входом. Доступ к видеонакопителю может быть осуществлен по локальной сети офиса или по беспроводной сети Wi-Fi. Беспроводная сеть позволяет облегчить монтаж и обеспечить конфиденциальность установки видеонакопителя. Малое энергопотребление видеонакопителя и использование резервированного источника
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.16. Видеонаблюдение в офисном помещении Ðèñ. 3.17. Система обзорного видеонаблюдения 111
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 112 Часть I. Принципы построения систем телевидения Ðèñ. 3.18. Система наблюдения в автомобиле питания позволяет обеспечить видеозапись в случае обесточивания офиса в ночное время. При обзорном видеонаблюдении (рис. 3.17) подключение управляемой купольной камеры к видеонакопителю «Трал» позволяет решать задачи обзора больших площадей. Программное обеспечение видеонакопителя позволяет задать управляемой камере точки наблюдения и скорость их перебора. Видеозапись, сделанная в таком режиме, позволяет получить общую картину происходящих на объекте событий, что может быть полезно для решения задач управления, равномерности загрузки участков цеха и удаленного наблюдения за ходом выполнения работ. При видеонаблюдении в автомобиле (рис. 3.18) к видеонакопителю подключаются две камеры — одна курсовая, вторая направленная на водителя. Наряду с записью видео проводится запись текущих географических координат, поступающих от GPS приемника. Если автомобиль находится в зоне действия сотовой сети SkyLink, возможен удаленный доступ к «Тралу» и его видеоархиву. Используя модель со съемным диском, удобно вести просмотр всего видеоархива без извлечения видеонакопителя из автомобиля. 3.12. Принципы построения современных систем охранного телевидения и регистрации изображений на примере VideoNet VideoNet— это цифровая система регистрации и видеонаблюдения, поставляемая в виде системной платы видеозахвата для установки в видеосервер и программного обеспечения. Система VideoNet позволяет получать высококачественное (до 768×576 пкс) изображение, выполнять запись видеоизображения и звука на жесткий диск компьютера и быстро находить нужное событие
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 113 или фрагмент записи. Детектор движения обеспечивает обнаружение активности в любой определенной оператором области изображения для каждой из заданных камер. Интегрированные каналы звука позволяют производить аудиозапись синхронно с видео и отдельно от него (в отдельных помещениях, по срабатыванию датчиков, по времени и т. д.). Запись видеоданных проводится на внутренние дисковые накопители по циклу, т. е. заменяя самые старые видеоданные текущими. Запись осуществляется одновременно со всех камер. Необходимый фрагмент записи может быть сохранен на CD/DVD-RW. В системе VideoNet предусмотрена возможность самостоятельно настраивать и конфигурировать пользовательский интерфейс. Мультиэкранный интерфейс VideoNet позволяет осуществлять одновременныйпросмотр на мониторе изображения, поступающего от ТВ камер, и воспроизведения раннее записанных в архив видеофрагментов, что очень важно для некоторых прикладных задач (например, в супермаркетах или казино). Для удаленного просмотра текущего изображения и архивов необходимо дополнительное программное обеспечение. Количество удаленных пользователей неограничено. Модульная структура VideoNet позволяет построить системы видеонаблюдения любой конфигурации от простейших, локальных, до систем со сложной распределенной структурой с любым количеством пользователей. Интерфейс системы VideoNet. Интерфейс VideoNet позволяет производить любые операции над видеоокнами, режимами экрана, создавать всплывающие окна (содержащие любые типы окон и панели) и добавлять проигрыватель в видеорежим в качестве окна. Размеры видеоокон могут быть абсолютно любыми, что позволяет максимально эффективно использовать площадь экрана для работы (рис. 3.19). Кроме того, при работе с многомониторными конфигурациями, система сама распознает подключение монитора и автоматически создает для него режимы экрана. Модернизированный проигрыватель. При помощи функциональной возможности «Пользовательские списки воспроизведения» пользователь самостоятельно, наиболее удобным для него образом, может отображать список источников, записи которых присутствуют в доступных архивах (локальных и сетевых), а также оперативно переключаться между ними (рис. 3.20). Данная возможность позволяет наиболее эффективно работать с большим количеством как локальных, так и сетевых источников.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 114 Часть I. Принципы построения систем телевидения Ðèñ. 3.19. Ðèñ. 3.20. Интерфейс системы VideoNet Пользовательские списки воспроизведения Систематизация источников в списки воспроизведения по типам позволит быстро найти интересующую камеру или микрофон и потребует от пользователя минимального количество действий и времени. Определив цвета записи для типов событий в системе, пользователь легко и просто может осуществить фильтрацию записей. Таким образом, повышается наглядность карты записей, повышается эффективность работы с архивом, существенно сокращается время на поиск нужной информации (рис. 3.21, 3.22). Для просмотра записей с высокой скоростью, необходимо просто задать желаемый коэффициент ускорения (от 2× до 24×) и нажать кнопку перемотки. Проигрыватель будет сам следовать по шкале времени и переходить между фрагментами записей.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.21. 115 Фильтрация записей Ðèñ. 3.22. Поиск записей Для удобства использования функции перемотки проигрыватель различает «нажатие» и «нажатие с удержанием кнопки перемотки». При нажатии с удержанием проигрыватель начинает перемотку с установленной скоростью до тех пор, пока удерживается кнопка. При коротком нажатии на кнопку перемотки проигрыватель также начнет перемотку с установленной скоростью, но удерживать кнопку нажатой нет необходимости. При анализе происшедших событий часто возникает потребность в неоднократном просмотре записей за один и тот же интервал времени, что с успехом реализует новый проигрыватель. Пользователь задает временной диапазон, а проигрыватель сам будет воспроизводить записи в режиме «по кругу» (рис. 3.23). Ðèñ. 3.23. Воспроизведение записей
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 116 Часть I. Принципы построения систем телевидения Ðèñ. 3.24. Управление последовательностями Для удобства вывода изображения от воспроизводимых камер в проигрывателе установлена функция «Размещение источников». С ее помощью можно выводить воспроизводимые камеры на указанный монитор и расставлять камеры в видеоокнах не только в текущем видеорежиме, но и создавать временный режим, который будет соответствовать количеству выбранных камер. При окончании работы с проигрывателем на рабочем мониторе будет полностью восстановлен прежний режим отображения. Работа с видеоокном. Функция «Пользовательское представление списка источников» помогает составить списки из доступных источников, организовав их по какому-либо признаку, например наиболее часто используемые, наружные, внутренние камеры объекта № 1 и т. д. Функции работы с видеоокном системы VideoNet позволяет не только создавать программные последовательности (программных коммутаторов камер в видеоокне), но и управлять ими (рис. 3.24). При работе в видеоокне с последовательностью пользователь может остановить/ продолжить коммутацию на отображаемой камере или переклюÐèñ. 3.25. Прерывание коммутации чить коммутатор на следуюкамеры щую/предыдущую камеру. Таким образом, в системах с большим количеством камер оператор может создать такую последовательность из любых доступных камер и, при необходимости, прервать коммутацию на интересующей камере (рис. 3.25). Для оперативного просмотра записи по текущей камере предусмотрена функция «Повторного воспроизведения в видеоокне». Пользователь может осуществлять не только воспроизведение, но и перемотку вперед/назад, а также выбирать любые значения даты и вре-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов Ðèñ. 3.26. 117 Повторное воспроизведение в видеоокне мени для воспроизведения соответствующих записей. Такая возможность превращает функцию «Повторное воспроизведение в видеоокне» в полноценный асинхронный проигрыватель, т. е. пользователь может воспроизводить камеры (или одну и ту же камеру в разных видеоокнах) в разных временных интервалах. Это позволяет осуществлять просмотр того, как объект двигался, переходя по зонам охраны камер, или одновременно наблюдать, сравнивать объекты, появляющиеся в разное время в зоне действия одной камеры (рис. 3.26). 3.13. Неортогональный телевизионный контроль видеоинформационного пространства в системах прикладного телевидения В настоящее время имеет место значительное увеличение количества телевизионных систем связи, используемых в РФ при решении разнородных задач развития народного хозяйства инфраструктуры, что связано с падением стоимости соответствующего оборудования и возрастанием его качественных характеристик. Широкое распространение в последнее время получает, например, видеоконтроль территории вокруг объектов, в том числе и объектов связи, с цифровой передачей сигналов ТВ изображений по узкополосным каналам в опорный пункт для их архивирования и обработки. При этом ТВ камера размещается на относительно большой высоте и под углом к контролируемой поверхности, т. е. её оптическая ось не является ортогонально ориентированной по отношению к контролируемому пространству. Для подобного, неортогонального, ТВ контроля характерны трансформации пространственной структуры изображений объектов в зависимости от параметров и условий оптического отображения исходного распределения совокупности контролируемых объектов в пределы светочувствительной поверхности датчиков ТВ сигнала. При этом усложняется реализация ТВ систем, осуществляющих текущий видеоконтроль без участия оператора. Из-за масштабных изменений формы контролируемых объектов в данном случае значительно расширяется алфавит ситуаций, которые следует учитывать при принятии решений, соответственно, увеличивается и объём
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 118 Часть I. Принципы построения систем телевидения памяти, необходимой для хранения информационного архива, возрастает инерционность принятия решений, усложняется процесс идентификации ситуации и процесс принятия решения и т. д.. Минимизация указанного алфавита может достигаться на основе учёта результатов анализа и моделирования масштабных преобразований пространственной структуры объектов в зависимости от координат их локализации в контролируемом видеоинформационном пространстве. Особое значение учёт изменений формы контролируемых объектов приобретает при разработке эффективных методов и устройств цифровой обработки, сжатия спектра и передачи сигналов изображений с адаптивными регулировками характеристик и режимов функционирования в зависимости от изменения условий реализации видеоконтроля. Если известна, в частности, функция распределения контролируемых с применением ТВ камеры объектов q(x, y, z), то её спектр может определяться в соответствии с преобразованием Фурье ∫ ∞ ∫ ∞ ∫ Q(ωx , ωy , ωz ) = ∞ = −∞ −∞ −∞ q(x, y, z) exp[−(jωx x+jωy y+jωz z)] dxdydz, (3.1) где ωx , ωy , ωz — пространственные частоты (пер./градус). При ортогональном видеоконтроле ТВ камера устанавливается на высоте h0 , значение которой обеспечивает симметрирование её положения по отношению к контролируемому пространству. В связи с этим оптическая ось видеоконтроля обычно смещается по отношению к началу координат (x = 0, y = 0, z = 0). Введём в (3.1) замену x = x, y = y − h0 , z = z. Тогда Q(ωx , ωy , ωz ) = exp(−jωy h0 )Qs (ωx , ωy , ωz ). (3.2) Здесь Qs (ωx , ωy , ωz ) — многомерный спектр в преобразованной системе координат. Сопоставление соотношений (3.1) и (3.2) позволяет сделать вывод о том, что при ортогональном контроле может упрощаться структура многомерного спектра за счет симметрирования контролируемого пространства по отношению к точке установки ТВ камеры. При этом в структуре спектра Qs (ωx , ωy , ωz ) может иметь место увеличение доли косинусных составляющих по отношению к спектру Q(ωx , ωy , ωz ). Преобразованный (по отношению к началу координат) спектр распределения объектов в данном случае может быть получен простым учетом смешения в соответствии с соотношением (3.2). Для систем неортогонального ТВ контроля подстилающей поверхности характерны увеличение высоты подвеса камеры и преобразования угла наклона осей координат по отношению к контролируемому
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 119 пространству. Фактически имеет место сопряженный поворот осей 0z и 0y относительно оси 0x. Осуществим соответствующее преобразование координат [63]. Известно, что в полярной системе координат y = r cos φ, z = r sin φ. При повороте осей на угол α имеем r = r и φp = φ+α. Соответственно, yp = r cos(φ+α) и zp = r sin(φ+α). Отсюда последовательной заменой переменных и с учётом (3.1) и (3.2) получим Q(ωx , ωy , ωz ) = exp(−jωy h0 )Qp (ωpx , ωpy , ωpz ). (3.3) Здесь Qp (ωx , ωpy , ωpz ) — многомерный спектр в преобразованной системе координат; ωpx = ωx ; ωpy = ωy cos α−ωz sin α; ωpz = ωy sin α+ωz cos α. (3.4) Соотношения (3.3) и (3.4) связывают спектры распределения объектов в исходной и преобразованной системах координат. Однако действующий в ТВ камере оператор оптического проецирования не относится к операторам линейного типа. Это не позволяет получить с применением (3.3) и (3.4) спектр функции распределения объектов на светочувствительной поверхности преобразователя «свет-сигнал» в виде одного из частных случаев преобразования координат. Задача в данном случае должна решаться с учётом всех особенностей проецирования исходной функции распределения объектов в пределы светочувствительной поверхности датчиков ТВ сигнала [63, 89, 90]. Область оптического отображения при неортогональном ТВ контроле может быть приближенно представлена за счёт преобразований функции конуса. На светочувствительную поверхность ПЗС ТВ камеры, установленной на высоте h, в данном случае оптически отображаются с различным масштабом, чёткостью, контрастностью, спектральным составом соответствующего электромагнитного излучения объекты, распределённые в пространстве, ограниченном функцией конуса x2 y2 z2 + − = 0. a2 a2 c2 Для упрощения будем считать c = 1. Тогда x2 y2 + − z 2 = 0. a2 a2 При сечении функции конуса плоскостью z = z0 = const произведение az0 определяет радиус окружности, ограничивающей функцию сечения. По существу a в пределах сечения функции конуса, например плоскостью y0z, геометрически отражает tg ψ/2, где ψ — угол в вершине указанного сечения конуса. С учётом этого представим
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 120 Часть I. Принципы построения систем телевидения исходное выражение конуса в следующем виде: ψ 2 z = 0. (3.5) 2 Установка телевизионной камеры на высоте h изменяет в (3.5) значения по оси y: x2 + y 2 − tg2 ψ 2 z = 0. (3.6) 2 Осуществим поворот функции (3.6) на угол θ (отрицательный) относительно оси 0x (плоскость x0z). При этом координаты точек функции конуса по оси 0x не изменятся. Отношения же между исходными координатами точек (y, z) и координатами точек повёрнутого конуса (y θ , z θ ) определяются выражениями: x2 + (y − h)2 − tg2 y θ = y cos θ − z sin θ; z θ = y sin θ + z cos θ. (3.7) С учётом высоты установки ТВ камеры и её поворота соотношения (3.5)–(3.7) приобретают следующий вид: y θh = (y − h) cos θ − z sin θ; z θh = (y − h) sin θ + z cos θ; (3.8) ψ x2 + ((y − h) cos θ − z sin θ)2 − tg2 ((y − h) sin θ + z cos θ)2 = 0. 2 (3.9) Из (3.9) получим √ ψ x = ± tg2 ((y − h) sin θ + z cos θ)2 − ((y − h) cos θ − z sin θ)2 ; (3.10) 2 ψ x2 + z 2 − tg2 h2 = 0. 2 Соответственно, в случае, когда x = 0, получим z1 = −z2 = = tg ψ/h и протяжённость области видеоконтроля (диаметр окружности) по оси z ψ h. 2 Если же не конкретизировать угол наклона θ, то соотношение (3.9) принимает (y = 0) следующий вид: d0 = 2 tg ψ (−h sin θ + z cos θ)2 = 0. 2 Протяжённость области видеоконтроля на подстилающей поверхности определим на оси 0z, задаваясь значением x = 0. Тогда ( ) ( ) 2 2 2 2 ψ 2 ψ z sin θ − cos θ tg + z 2h sin θ cos θ + 2h sin θ cos θ tg + 2 2 x2 + (−h cos θ − z sin θ)2 − tg2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 121 Глава 3. Телевизионные системы охраны объектов ( ) ψ + h2 cos2 θ − sin2 θ tg2 = 0. 2 (3.11) Введем обозначения A = sin2 θ − cos2 θ tg2 ψ ; 2 B = 2h sin θ cos θ + 2h sin θ cos θ tg2 C = cos2 θ − sin2 θ tg2 ψ ; 2 ψ , 2 тогда решения уравнения (3.11) √ −B B 2 − 4AC z1,2 = ± . (3.12) 2A 2A По существу при θ = −90◦ имеет место случай ортогонального видеоконтроля подстилающей поверхности ТВ камерой с высоты h. Согласно (3.12) первое решение z1 = −h tg(ψ/2), а второе z2 = h tg(ψ/2). Протяжённость зоны видеоконтроля в данном случае определяется разностью ψ . 2 Величины z1 , z2 определяют в соотношении (3.12) на оси z координаты (x = 0, zi ) двух точек пересечения функции угла поля зрения телевизионной камеры при вариациях параметрами её функционирования: угол поля зрения ψ, угол наклона по отношению к горизонту θ и высоты установки h. Положение точки пересечений оптической оси с подстилающей поверхностью можно определить за счёт преобразования соотношения (3.12) к случаю ψ = 0: l = z2 − z1 = 2h tg −h cos θ . sin θ Размер зоны видеоконтроля на оси z зависит при условии фиксации параметров ψ и h от угла наклона ТВ камеры. С уменьшением его модуля (|θ| > 0) положение зоны видеоконтроля смещается по оси z в область более высоких положительных значений и её размер на подстилающей поверхности значительно возрастает. Соответствующие расчётные графики, полученные с использованием соотношений (3.10)–(3.12) для отдельных значений фиксированных параметров, представлены на рис. 3.27,a, b, v. Расчётные результаты свидетельствуют о том, что общая протяжённость и конфигурация зоны видеоконтроля на подстилающей поверхности существенно зависит от параметров θ, ψ и h (возрастает при увеличении фиксированных параметров ψ, h и уменьшении модуля θ). z10 = z20 =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 122 Часть I. Принципы построения систем телевидения Сечение пространства неортогонального видеоконтроля плоскостью y = 0 при фиксированных значениях параметров: a — ψ = 30◦ , h = 1; b — θ = −60◦ , h = 1; v — θ = −60◦ , ψ = 30◦ Ðèñ. 3.27. Фиксация угла наклона по отношению к горизонту θ и высоты установки ТВ камеры позволяет выявить особенности изменения конфигурации зоны видеоконтроля в зависимости от угла поля зрения ТВ камеры (рис. 3.27,b). Если задаваться шкалой изменения угла поля зрения, то можно объективно, на основе представленных выше результатов, выявить специфику изменения масштаба контролируемых участков (независимых объектов) в зависимости от их положения на подстилающей поверхности по отношению к точке пересечения последней с оптической осью телевизионной камеры, осуществляющей видеоконтроль. В частности, протяжённость участков такой поверхности в пределах оси z по отношению к указанной точке пе-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 123 ресечения, контролируемых при симметричном изменении угла поля зрения, будет иметь эквивалентный размер на светочувствительной поверхности ТВ камеры. Однако объективная протяженность данных участков в пределах реально контролируемой конфигурации области видеоконтроля на подстилающей поверхности существенно возрастает при смещении их положения на оси z от точки z = z1 к точке z = z2 (граничные точки контролируемой области на подстилающей поверхности по оси 0z). Последнее, в условиях фиксации других параметров, и является причиной масштабных трансформаций пространственной структуры объектов при неортогональном видеоконтроле. Шкалу изменений конфигурации области видеоконтроля и, соответственно, деталей в пределах горизонтально ориентированных поверхностей реальных объектов в зависимости от изменения высоты их локализации в пространстве можно конкретизировать на основе соотношений (3.9) и (3.10). Фиксируя, например, в соотношении (3.9) значения θ = const, y = 0,1h; 0,2h; 0,3h; 0,4h; 0,5h..., можно получить решения указанного соотношения, изменения конфигурации и параметров области видеоконтроля для различных значений угла поля зрения ψ и учесть полученные изменения масштаба деталей контролируемых объектов при конкретизации используемого оборудования сжатия и самой системы ТВ контроля объектов. В связи с этим введём понятие относительного размера оптического отображения объектов в пространство светочувствительной поверхности датчика ТВ сигнала при наземном ТВ контроле: h ctg(θ0 − ∆θ0 ) − h ctg(θ0 + ∆θ0 ) L0 = = L h ctg(θ − ∆θ) − h ctg(θ + ∆θ) ctg(θ0 − ∆θ0 ) − ctg(θ0 + ∆θ0 ) = , ctg(θ − ∆θ) − ctg(θ + ∆θ) m(θ, ∆θ) = (3.13) где h — высота установки ТВ камеры; L0 , L — линейный размер объектов, спроецированных в центр и в периферийную часть внутрикадрового пространства соответственно; θ0 , θ — угол проецирования объектов в центр и в периферийную часть внутрикадрового пространства соответственно; 2∆θ, 2∆θ0 — угловой размер спроецированных объектов. Соотношение (3.13) показывает существенное влияние угла оптического проецирования при наземном контроле на изменения относительного масштаба контролируемых объектов. Результаты расчёта функции m(θ, ∆θ) для варианта θ0 = π/4 и ∆θ = ∆θ0 = 3π/180 представлены на рис. 3.28. На рис. 3.29 иллюстрируются масштабные преобразования при ТВ контроле пространственной структуры объектов, имеющих одинаковые угловые размеры в пределах светочувствительной поверхности (СВП) датчика ТВ сигнала.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 124 Часть I. Принципы построения систем телевидения В пределах участков СВП, имеющих эквивалентные угловые размеры, в данном случае проецируют поверхности 1, 2, ПОК и ПНК. При этом в последовательность эквивалентных (по угловой протяжённости) участков на СВП отображаются поверхности, существенно отличающиеся в контролируемом пространстве и по положению, и по размерам. ПоÐèñ. 3.28. График функции изменения относительного размера объверхности 1, 2 показаны с наложенекта ной ступенчатой аппроксимацией, с помощью которой иллюстрируется динамика изменений масштаба при отображении реального распределения участков на плоскость СВП. Положению плоскости СВП (ПОК) коллинеарны каждая из аппроксимирующих участки поверхностей 1 и 2 ступеней. В соответствии с рис. 3.29 при проецировании в пространство СВП объекта позиционированного в ПОК масштабные искажения имеют минимальное значение. В пределах ПНК имеет общее падение относительного масштаба по отношению к вариантам 1, 2, ПОК. Относительный масштаб в пределах поверхностей ПНК, 1, 2 имеет, кроме того, динамику изменений в зависимости от удаления участка поверхности от точки установки ТВ камеры. В связи с последним масштабные искажения в пределах поверхностей 1 и ПНК имеют ярко выраженный обратный характер динамики в диапазоне дискретных изменений угла проецирования на рис. 3.28. Специфика функционирования ТВ камеры при реализации наземного телевизионного контроля удалённых объектов в конечном счете Преобразование пространственной структуры объектов при видеоконтроле: О — местоположение оптической системы, обеспечивающей отображение объектов в плоскость СВП; ПОК — плоскость ортогонального контроля, ПНК — плоскость наземного контроля; 1, 2 — варианты распределения объектов в контролируемом пространстве; 3 — оптическая ось системы наземного ТВ контроля Ðèñ. 3.29.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 125 определяет параметры сигнала изображения, формируемого на её выходе, и, следовательно, должна учитываться при конкретизации частных вариантов систем видеоконтроля. Необходимо учитывать при этом и то, что форма растра в пределах светочувствительной поверхности матрицы ПЗС имеет прямоугольную форму, которая, с учётом процедуры проецирования, охватывает аналогичный по форме участок зоны видеоконтроля на подстилающей поверхности. 3.14. Специфика реализации цифровых систем эффективного видеоконтроля удалённых объектов В настоящее время задача обнаружения (селекции) изменений в пространственно-временной и цветовой структуре изображений при телевизионном контроле объектов является, безусловно, актуальной. Решение данной задачи существенно усложняется в условиях низкой или не оптимальной по уровню и спектральному составу освещенности контролируемых объектов, при необходимости селекции медленных временных изменений в структуре ТВ изображения, определяющих несанкционированное вторжение, при воздействии на текущий ТВ сигнал помех, в том числе дискретизации [119], неравномерности фона [90], мешающего действия локальных и распределённой подсветок от источников света и т. д. При видеоконтроле в естественных (наружных) условиях мешающее влияние могут оказывать изменения мелкоструктурных составляющих изображения: колебания листвы и ветвей на деревьях, наличие в зоне контроля разнородно освещенных объектов, теневых в области контроля зон, фоновых изменений во времени средней освещенности, погодных условий, муаровые преобразования мелкой структуры изображений, маскирующие несанкционированные нарушения задымлением, распылением и др. Существенное влияние на эффективность видеоконтроля оказывает и заданный режим контроля объектов: c регистрацией нарушений или без регистрации, с пространственно спектральной селекцией и опознаванием типа, средств, элементов и инициаторов нарушений или без такового, с передачей соответствующих последовательностей информационных сигналов на удалённый пункт реагирования или нет, с приёмом сигналов управления режимом работы системы видеоконтроля и реагирования от пункта приёма (интерактивность) или нет. В действующей системе видеоконтроля значительное внимание должно быть уделено защите функциональных элементов и обеспечению живучести при функционировании посредством её реализации в виде распределённой структуры с заданным числом независимо и параллельно действующих составляющих, обеспечивающих разнородный и взаимодополняющий контроль смежных зон пространства объ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 126 Часть I. Принципы построения систем телевидения ектов с определённой степенью резервирования. При этом коммутация введённых дополнительных связей между указанными независимыми составляющими с соответствующим изменением условий и режима их использования обеспечивает при выходе из строя отдельных из последовательно включённых функциональных элементов сохранение работоспособности системы в наиболее важных, по крайней мере, для видеоконтроля участках контролируемого пространства. Достоинством такого варианта построения является возможность адаптивного изменения общей конфигурации функционирования системы при изменении условий, требований, типа, местоположения и формы контролируемых объектов Интегральный учёт всей совокупности существующих и возможных требований к функциональным характеристикам и параметрам системы видеоконтроля фактически невозможно обеспечить в рамках реализации одного, общего для всех случаев, например, адаптивного варианта. Экономически выгодно определить и разработать ограниченное число типовых, минимизированных по числу элементов оборудования, вариантов систем видеоконтроля, обеспечивающих эффективное и относительно полное целевое решение ограниченного круга задач для наиболее часто встречающихся и в то же время существенно разнородных условий применения. Использование таких вариантов и составляющих их структуры для решения более сложных, комплексного типа, задач видеоконтроля, существенно упростит в экономическом отношении реализацию распределённых систем, удовлетворяющих по характеристикам функционирования требования подавляющего числа пользователей. Следует учитывать необходимость накопления и обновления в распределённых системах архива разрешенных ситуаций с формализацией соответствующих им независимых признаков (параметров) и их вычислительной оценкой в текущем режиме работы по всей совокупности контролируемых объектов. Это позволит, в конечном счете, создавать системы, реализующие автоматизированный адаптивный контроль объектов с ограниченным участием оператора или даже без его участия. В системе должна в таком случае осуществляться, например, периодическая относительная оценка формальных параметров развития ситуации в зоне контроля. Когда результаты оценок превышают заданный порог, реализуется архивирование ситуации, определяется, по виду соответствующего параметра, тип нарушения и соответствующей реакции. Одним из наиболее сложных вариантов является вариант текущего ТВ контроля удалённых объектов. Сложность в данном случае в основном определяется необходимостью передачи видеоинформационных сигналов на относительно большие расстояния с использовани-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 127 ем узкополосных каналов связи. При этом чаще всего целесообразно опираться на уже реализованные системы, например мобильной связи. Соответственно, в любом случае в системе контроля удалённых объектов должно быть предусмотрено применение цифрового сжатия спектра видеоинформационных (ТВ) сигналов. Важное значение имеет также правильное согласование информационных характеристик сигналов изображений и характеристик операций процесса их преобразования, цифровой обработки и кодирования. Это обусловливает необходимость дифференциального выявления и конкретизации пространственно-временных параметров видеоинформационных сигналов на всех этапах процесса их формирования. Неортогональный телевизионный контроль. Обычно в цифровых системах наземного видеоконтроля удалённых объектов используют вариант неортогонального оптического отображения видеоинформации на датчик ТВ сигнала. На рис. 3.30 схематически показан вариант наземного контроля ситуации с использованием высотной установки телевизионной ка- 3.30. Неортогональный телевизионный контроль удаленных объектов: ПНК — пространство неортогонального (наземного) контроля; ПИОК — пространство (поверхность) идеального ортогонального контроля; ПОК — пространство ортогонального контроля Ðèñ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 128 Часть I. Принципы построения систем телевидения меры, позволяющей осуществлять обзорный стационарный контроль удалённого наземного участка местности. Поверхность идеального оптического отображения чаще всего имеет форму сферы. Первоначально рассмотрим специфику идеального ортогонального контроля. При идеальном ортогональном контроле пространства видеоинформация, распределённая в пределах соответствующей поверхности, проецируется в плоскость изображений. Из-за несовпадений форм поверхностей в пространствах объектов и изображений возникают, соответственно, искажения контроля расстояний в видеоинформационном пространстве и габаритных размеров в пространственной структуре объектов. Если понятие протяженности объекта сопоставлять с выбором максимального из его существующих размеров по направлениям в пространстве, то последующим определением максимального размера по ортогональному направлению выявляется прямоугольная область локализации объекта. Усреднённые размеры объекта могут в таком случае, например, определяться с использованием реальной площади объекта. Важное значение при видеоконтроле имеет отношение площадей контролируемого объекта и всего пространства ортогонального контроля. Будем полагать, что в идеальном случае поверхность ортогонально контролируемого пространства локализована в пределах поверхности сферы (поверхность идеального ортогонального контроля — ПИОК на рис. 3.30). Спецификой неортогонального ТВ контроля объектов являются, как указывалось выше, масштабные искажения, обусловленные уменьшением угла оптического проецирования видеоинформации на светочувствительную поверхность телевизионной камеры. Последнее приводит к существенным относительным снижениям размера объектов, проецирование которых из области видеоконтроля реализовывается с уменьшенными значениями углов оптического переноса в пределы светочувствительной поверхности данной телевизионной камеры. Существенное падение стоимости телевизионных камер, которое имеет место в последнее время, позволяет увеличивать эффективность неортогонального видеоконтроля за счёт перехода к многокамерным вариантам систем. Целесообразно реализовывать при этом сопряжение (по углам наклона и поля зрения, по высоте установки) двух и более ТВ камер. Если две камеры, например, осуществляют в таком случае симметричный видеоконтроль верхней части соответствующего пространства и имеют уменьшенные углы поля зрения и наклона, то одна может осуществлять видеоконтроль нижней части пространства, имея, соответственно, увеличенные углы и уменьшенную высоту подвеса.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 129 Основным результатом является в данном случае достижение, приблизительно, эквивалентности условий видеоконтроля объектов во всех частях пространства. Последнее позволяет увеличить при ТВ контроле изотропность и уравнять общие параметры пространственного спектра всех распределённых на подстилающей поверхности объектов, что отражается не только существенным возрастанием качественных характеристик преобразования соответствующей видеоинформации в электрический сигнал, но и существенно увеличивает общую эффективность последующего цифрового сжатия спектра видеоинформации. Телевизионный контроль динамики объектов. Использование лишь статически установленных (обзорного типа) ТВ камер не может обеспечить в системах неортогонального видеоконтроля возможность эффективного архивирования информационных сигналов и последующего опознавания объектов, осуществивших нарушение. Соответственно, в системе должно быть предусмотрено параллельное использование камер статического и динамического контроля объектов. При этом телевизионные камеры, используемые для статического контроля, должны обеспечивать высокое разрешение, а для динамического контроля — иметь относительно малый угол поля зрения, что позволяет в условиях реализации автоматического прослеживания обеспечивать видеоконтроль подвижных объектов с относительным увеличением масштаба соответствующего изображения [120]. Одновременно с этим обеспечивается растровое стробирование полезной информации. Снижается, соответственно, избыточность пространственной структуры анализируемого изображения и возрастает эффективность сжатия его спектра. Обзорные телевизионные камеры в таком случае используются для обнаружения нарушений, формирования сигналов координат и управления положением узкоугольной камерой, тревожной сигнализации и данных. Предварительное стробирование видеоинформации и определение координат объекта, осуществляющего нарушение, реализуется в системе за счёт выбора по результатам текущего анализа одного из сопряжённых растров. В случае попадания подвижного объекта на участки сопряжения растров имеет место идентификация момента полного его перехода из области, контролируемой одной из камер обзорного типа, в область, контролируемую другой из них. Дифференциальная обработка исходного сигнала изображений в пространстве кадров и во времени позволяет подавить влияние низкочастотных (пространственновременных) составляющих на сигналы управления, которые формируются по результатам анализа изменений в структуре видеоинформационного сигнала. Селекция указанных изменений должна осуществляться в реальных системах с предварительным определением и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 130 Часть I. Принципы построения систем телевидения ограничением их возможного диапазона и по высокочастотной области. Если V = iVx +jVy — вектор скорости перемещения независимого объекта, оптически отображённого во внутрикадровое пространство на светочувствительной поверхности преобразователя, направление которого определяется, соответственно, значениями косинусов: cos(V x ) = √ Vx Vx2 + ; Vy2 Vy cos(V y ) = √ , 2 Vx + Vy2 √ а длина модуля вектора V = Vx2 + Vy2 , то в реальной ТВ системе в каждом кадре формируется сигнал ТВ изображений последовательности положений объекта с учётом трансформации по ходу движения его конфигурации при данных условиях видеоконтроля. От относительной скорости его перемещений во внутрикадровом пространстве зависит протяжённость временного спектра, которая и определяет по существу требования к необходимой частоте кадров при формировании ТВ сигнала. По сути в системах видеоконтроля с применением сжатия необходимо передавать на приёмную сторону лишь участки видеоинформации, отражающие её санкционированные или, наоборот, несанкционированные изменения (динамику) во времени. Чаще всего на передающей стороне должна быть решена задача селекции ТВ сигнала движущихся объектов и их параметрической оценки. Может быть предложен следующий алгоритм её осуществления. 1. Если используется вариант оценки сигнала нарушения по отношению к эталонному изображению, то превышение порога сигналом разности фактически определяет исходные координаты («параметр») и момент («параметр») обнаружения нарушения. 2. В следующий отрезок времени и в текущем режиме по межкадровому направлению должна осуществляться относительная оценка изменений амплитуды («параметр») сигнала изображения и площади («параметр») локализации объекта, осуществляющего нарушение. 3. Момент времени, когда прекратилось возрастание площади независимого объекта, осуществляющего данное нарушение, определяет «параметр» совершения, например, однократного нарушения. 4. Момент времени, когда прекратилось возрастание общей площади и площади последнего из независимых объектов, осуществляющего нарушение, определяет «параметр» совершения группового нарушения. 5. Должна осуществляться периодическая фиксация отсчётов функций изменения «параметра» координат, «параметра» площади и «параметра» амплитуды каждого из независимых объектов, осуществляющих нарушение.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 131 Глава 3. Телевизионные системы охраны объектов 6. По значениям предшествующих оценок целесообразно осуществлять предсказание в текущем времени новых значений указанных параметров по п. 5. 7. В случаях отклонений предсказанных значений от фактических, превышающих заданное пороговое значение, осуществляют регистрацию и передачу соответствующих участков видеоинформации во внутрикадровом пространстве и по межкадровому направлению. 8. Cледует осуществлять по межкадровому направлению также передачу параметров и фрагментов внутрикадровой структуры изображений, определяющих в системе санкционированные изменения опорной видеоинформации. Пространственная чёткость видеоконтроля подвижных объектов. Фактически эталонное изображение определяет ранее регистрируемую по заданному закону внутрикадровую видеоинформацию в контролируемом пространстве, соответствующую отсутствию нарушений. По отношению к эталонной внутрикадровой видеоинформации реализуют выделение и накопление сигнала нарушений. При этом, по возможности, должна быть сохранена пространственная четкость соответствующего изображения. С учётом результатов, представленных в [36, 52, 105], рассмотрим специфику изменения «параметра» пространственной чёткости движущихся объектов при ТВ контроле. Зададимся идеализированным входным воздействием в виде подвижной δ-функции δ(x, y, t) = δ(x + Vx t)δ(y + Vy t). (3.14) Воздействию такого вида соответствует пространственный спектр S(ωx , ωy ) = exp(jωx Vxt + jωy Vyt ). (3.15) Будем считать, что оптическая система не вносит фазовых искажений и её коэффициент передачи совпадает с пространственной частотной характеристикой и отражается функцией Kos (ωx , ωy ). Тогда сквозной коэффициент передачи определяется в данном случае произведением: K0 (ωx , ωy , t) = K0S (ωx , ωy ) exp(jωx Vx t + jωy Vy t). (3.16) Учтём время накопления в течение кадра: ∫ Tк /2 K0 (ωx , ωy , t) = K0S (ωx , ωy ) exp(jωx Vx t + jωy Vy t) dt = −Tк /2 = Tк K0S (ωx , ωy ) sin(ωx Vx Tк /2 + ωy Vy Tк /2) . ωx Vx Tк /2 + ωy Vy Tк /2 (3.17) Полученное соотношение показывает существенное влияние на чёткость ТВ изображения объекта скорости его перемещения в пределах
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 132 Часть I. Принципы построения систем телевидения внутрикадрового пространства. Обозначим через φV угол между направлением перемещения объекта и, например, горизонтальным направлением внутрикадрового пространства. Тогда √ VX = |V | cos φV = Vx2 + Vy2 cos φV ; √ VY = |V | cos(π/2 − φV ) = Vx2 + Vy2 sin φV . Следовательно, модуль скорости и угол φV определяют перемещение объекта во внутрикадровом пространстве. Чем меньше относительная скорость движения объекта по данному направлению во внутрикадровом пространстве, тем в меньшей степени, согласно (3.17), по направлению его движения подавляется высокочастотная структура его пространственного спектра. С другой стороны, именно в ортогональном направлении, по отношению к направлению движения, минимизируется подавление высокочастотной части пространственного спектра движущегося объекта. Соответственно, в системах неортогонального телевизионного контроля удалённых объектов существенное внимание необходимо обращать на оценку параметров перемещения объекта во внутрикадровом пространстве. Область текущей локализации движущего объекта выявляется в таком случае с использованием сигнала межкадровой разности. Целесообразно сигнал изображений во внутрикадровом пространстве при решении данной задачи представить, например, двумя смещёнными под 45◦ друг по отношению к другу последовательностями блоков (1) и (2). В последовательности блоков структур распределения (1) и (2) предлагается независимо вычислить изменения модуля сигнала межкадровой разности. По результатам вычислений определить в первом приближении для каждой из последовательностей конфигурацию пространственных границ указанного сигнала и вычислить изменения градиента сигнала в пределах границ. Направление минимального градиента границ может совпадать с направлением движения объекта. По относительной оценке результатов независимых функций градиента для указанных случаев реализуется уточняющая оценка границ движущегося объекта. При вычислении сигнала межкадровой разности следует использовать блоки с относительно большим числом пикселей, что позволяет компенсировать ухудшение отношения сигнал/шум, характерное для реализации дифференциальной обработки ТВ сигнала. Параллельно в межкадровой области вычисляется траектория изменений координат центра проекции движущегося объекта, который определяется точкой пересечения ортогональных линий, разделяющих площадь проекции объекта на две, равные половине, части.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 133 Определим пространственно-временной спектр, соответствующий подвижной δ-функции: ∫ ∞∫ ∞∫ ∞ S(ωx , ωy , ω) = δ(x + Vx t)δ(y + Vy t) exp(−jωx x − jωy y); −∞ −∞ −∞ ∫ ∞ exp(−jωt) dxdydt = exp(−j(−ωx Vx − ωy Vy + ω)t) dt. (3.18) −∞ Осуществим замену переменной: ω ω τ = t; dτ = dt. ωx Vx + ωy Vy + ω ωx Vx + ωy Vy + ω В результате получим S(ωx , ωy , ω) = ωδ(ω) . ω − ωx Vx − ωy Vy (3.19) Соотношение (3.19) отражает пространственно-временной спектр подвижной δ-функции без учёта влияния интегральных искажений спектра сигнала изображения, обусловленных действием процесса накопления и апертурных искажений в датчиках ТВ сигнала. Структура соотношения (3.19) свидетельствует о том, что движение (|V | > 0) определяет изменения структуры и пространственного, и временного спектров объектов. В структуре спектра подвижного объекта при фиксированной скорости возможно возникновение максимумов в области верхних пространственных частот. С увеличением относительной скорости движения максимум смещается в область более низких пространственных частот и падает коэффициент передачи в области высоких пространственных частот. Следует отметить, что данный результат полностью согласуется с выводом, полученном при анализе соотношения (3.17). Результаты проведённого выше анализа должны безусловно учитываться при реализации систем неортогонального ТВ контроля удалённых объектов. В системе целесообразно использовать два вида ТВ камер: общего (интегрального или обзорного) видеоконтроля и пространственно-селективного видеконтроля с прослеживанием движения объекта. Сигнал изображений от ТВ камер общего видеконтроля обеспечивает при этом возможность предварительной передачи по относительно узкополосному каналу связи и архивирование (накопление) на приёмной стороне фиксированной (фоновой по отношению к вариантам внештатных ситуаций или, по другому, опорной) видеоинформации. Необходимое накопление опорной видеоинформации может быть реализовано фактически без потерь в качестве пространственной структуры за счёт, например, использования последовательной передачи участков изображения и восстановления их прос-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 134 Часть I. Принципы построения систем телевидения транственного распределения в пределах растра видеоинформации на приёмной стороне. Накопление и архивирование такой же видеоинформации реализуется и на передающей стороне. С использованием сигнала изображений общего видеоконтроля (обзора) осуществляют в текущем режиме также выделение сигнала межкадровой разности по отношению к последнему моменту штатной ситуации. Подвергают его интегральной обработке, например суммируют дискретные отсчёты в сигнале ТВ изображения межкадровой разности в соответствии с распределениями блоков (1 и 2) с присвоением каждого результата конкретному блоку. Количество отсчётов в каждом из таких блоков выбирается 2×2; 4×4; 8×8 или даже больше в пропорциональной зависимости от освещённости контролируемой территории и, следовательно, от соотношения сигнал/шум. Получают модуль сигнала межкадровой разности, подвергнутого интегральной обработке. Пороговой оценкой раздельно формируют сигнал нарушения штатной ситуации в каждой из последовательностей блоков. Если сигнал нарушений превышает по совокупности смежных блоков заданное число, то вводится режим тревожной сигнализации и фиксации видеоинформации в участке нарушения. Соответственно, осуществляется вычисление уточнённой конфигурации области нарушения с учётом, на её граничных участках, блоков и первого и второго вариантов их распределения в соответствии с результатом пороговой оценки модуля сигнала межкадровой разности. Далее определяется центр области нарушения, и в текущем режиме осуществляется оценка последовательных изменений координат её центра. Формируют сигналы управления положением оптической оси ТВ камеры прослеживания, пропорциональные смешениям центра области нарушений в горизонтальном и вертикальном направлениях. Расстояние от центра растра и размер области нарушений определяют режим фокусировки и угол поля зрения ТВ камеры, осуществляющей прослеживание данной области нарушений. Применение прослеживания, согласно полученным выше результатам, увеличивает (за счёт снижения относительной скорости движения проекции объекта в пределах растра) пространственную чёткость контролируемых ТВ изображений в зоне нарушения. В конечном счете за счёт этого возрастает эффективность видеоконтроля и опознавания контролируемых объектов. Управление углом поля зрения ТВ камеры позволяет фиксировать при выполнении видеоконтроля во внутрикадровом пространстве масштаб изображения объекта, реализующего в данный момент нарушение. Последнее стабилизирует во внутрикадровом пространстве пространственный спектр контролируемого объекта, что, безусловно, упрощает реализацию сжатия. С другой стороны, главной задачей прослеживания является снижение протяжённости временного спектра, соответ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 3. Телевизионные системы охраны объектов 135 ствующего движущемуся в пределах контролируемого пространства объекту. Последнее позволяет резко снизить частоту передачи опорных кадров в условиях применения метода сжатия спектра с фрагментацией изображения совокупностью независимых блоков. Параллельно на передающей стороне канала связи с использованием ТВ камер общего обзора осуществляют оценку изменений общей протяжённости области локализации нарушения по отношению к моменту фиксации нарушения. Протяжённость в данном случае определяется общим числом независимых блоков, соответствующих структурам их распределения и позиционируемым в пределах области нарушения. Архивируют внутрикадровую видеоинформацию при изменениях протяжённости, превышающей заданное значение. С учётом результатов, полученных при исследовании искажений масштаба, целесообразно также изменять точность передачи пространственной структуры изображений в зависимости от положения контролируемых участков изображения вдоль оптической оси ТВ камеры, реализующей неортогональный видеоконтроль. Например, шаг квантования амплитуды коэффициентов пространственного спектра изображения после ДКП сигнала изображения в пределах блоков целесообразно уменьшать для тех передаваемых независимых участков изображения, которые контролируются при относительно более низких углах наклона ТВ камеры. При этом для передачи сигнала от ТВ камеры с прослеживанием реализацию варианта сжатия с ДКП целесообразно осуществлять с увеличением размера блока по отношению к стандарту MPEG-2, а передачу сигнала ошибки — с использованием статистического кодирования. Контрольные вопросы 1. Назначение видеокамер в охранном телевидении. 2. Проблема передачи сигналов от видеокамер до пункта контроля. 3. Принцип работы световолокна. 4. Методы регистрации видеоизображений. 5. Мультиплексоры и видеорегистраторы и их назначение в системах охраны. 6. IP-видеокамеры. 7. Проблема сжатия видеоданных в системах видеонаблюдения. 8. Типовые примеры построения систем видеонаблюдения и охраны объектов. 9. Чем определяется разрешающая способность видеокамеры? 10. Назначение датчиков движения в ТВ системах охраны объектов. 11. Особенности систем прикладного и вещательного телевидения. 12. Специфика масштабных преобразований при неортогональном ТВ контроле. 13. Характеристики передачи пространственного спектра подвижных объектов при видеоконтроле. 14. Телевизионный контроль динамики подвижных объектов в пределах заданного пространства.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 4 СИСТЕМЫ ТЕЛЕВИДЕНИЯ С ВЫСОКОЙ ВИЗУАЛЬНОЙ ЧЁТКОСТЬЮ Передача изображения с высокой чёткостью — новый этап в развитии телевидения. Проблема повышения качества изображения особенно актуальна в прикладном телевидении, где информационная составляющая полученного изображения является преобладающей по сравнению с художественными показателями изображений вещательного телевидения. Работы по ТВЧ стали особенно актуальными и активизировались в последнее время в связи с появлением преобразователей «светсигнал» и «сигнал-свет» с высокими качественными показателями: разрешающей способностью (более 1000 лин), яркостью (более 1000 кд/м2 ) и контрастностью (более 500:1) при одновременном уменьшении габаритов первых и потребления электроэнергии вторыми. Достигнутые показатели позволили выработать новые подходы к решению проблем построения систем ТВЧ, а именно: • создание систем ТВ вещания высокой чёткости (ТВВЧ); • производство кинофильмов ТВ методами (ПКТМ); • комплексы телетеатров; • разработка прикладных систем на основе единой системы стандартов ТВЧ. Решение поставленных задач позволит: • за счёт внедрения в кинопроизводство аппаратуры ТВЧ существенно снизить себестоимость изготовления кинопродукции; • удовлетворить желание зрителей рассматривать изображение большего размера и лучшего качества (при наблюдении изображений ТВЧ возникает эффект «присутствия»); • решить многие проблемы в прикладном телевидении (например в электронной микроскопии, где требуется разрешение более 2000 лин) [93]. Работы по ТВЧ проводятся во многих странах, стремительно растет число публикаций и в нашей стране [91–96, 104, 112]. Одним из традиционных путей решения проблем ТВЧ является повышение качества изображения за счёт прямого увеличения числа
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 137 строк и, соответственно, рабочей полосы частот сигнала изображений [91, 92]. 4.1. Краткие сведения о системах телевидения высокой чёткости Основное внимание при выборе системы ТВЧ должно быть обращено на её широкое применение в народном хозяйстве: в ТВВЧ, ПКТМ, системе телетеатров и системах прикладного телевидения. В телевидении стандартной чёткости (ТСЧ) частота развёртки равна 50 или 60 Гц. При использовании воспроизводящих устройств с большой яркостью мелькания на светлых участках изображения становится более заметными. Для устранения этих мельканий в компьютерах частота смены кадров увеличивается до 70...100 Гц. Однако в ТВ увеличение частоты кадров приведёт к пропорциональному увеличению полосы частот в канале связи, что являлось основным препятствием для принятия этого стандарта. Этот недостаток может быть устранён, если частоту смены полей увеличить на приемной стороне до 100 Гц интерполяцией двух соседних полей. Этот способ используется в телевидении для устранения мерцания и получения плавной передачи движения без передачи дополнительной видеоинформации. Для определения числа строк изображения необходимо знать минимальное расстояние наблюдения. В ТВ вещании стандартной чёткости оно не превышает 5...8 высот экрана H. Для ТВЧ оно будет соответственно меньше из-за увеличения пространственной плотности строк и сопутствующего падения заметности строчной структуры растра. В [104] для достижения эффекта «большого экрана» предлагается сократить это расстояние до величины, не превышающей ЗН, а также приведены результаты сравнения оценок субъективно воспринимаемой чёткости и уменьшения заметности помех строчной структуры в зависимости от числа строк сканирования. Испытываемые изображения оценивались с расстояния 3H, коэффициент чересстрочности 2:1, частота кадров 30 Гц. Было отмечено, что при достижении 1125 строк рост субъективной чёткости замедляется и при числе строк, равным 1600, приближается к нулю, заметность строчной структуры также становится нулевой. Поэтому число строк в растре, равное 1125...1350, следует считать оптимальным [104]. ТВЧ следует рассматривать как семейство стандартов, различающихся по количеству строк, частоте кадров и методу развертки — прогрессивной или чересстрочной. Всего насчитывается около 20 разновидностей ТВЧ. Более подробно о стандартах и истории ТВЧ читатель найдёт в [95]. Наиболее жизнеспособными оказались стандарты
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 138 Часть I. Принципы построения систем телевидения ТВЧ 720p, 1080i и 1080p (i-interlaset — чересстрочная, p-single — прогрессивная, построчная). Все три стандарта используют формат кадра 16:9 с частотой кадровой развёртки 25, 30, 50 или 60 Гц. Стандарты цифрового вещания ATSC и DVB были созданы с учётом ТВЧ. Население США и Европы в настоящее время получают сигнал ТВЧ в кабельном пакете или через спутник в стандартах 720p и 1080i (1920×1080). Вещание ТВЧ быстро начинает замещать вещание стандартной чёткости, так как изображение ТВЧ является более визуально информативным. В России пионером ТВЧ вещания стал оператор «НТВ-Плюс», который реализовал ТВЧ стандарт 1080i в эфире в тестовом режиме в 2006 году [94]. Характеристики ТВЧ (HDTV) определяются числом строк развёртки, частотой кадров и строк, сигналом цветности, форматом цифровой дискретизации и стандартом сжатия. Общего соглашения на развёртку международного стандарта для будущего ТВЧ достичь не удалось. Доминирующее положение получили два стандарта — 1080i и 720p, которые практически являются равноценными. Различие в том, что 1080i обеспечивает несколько лучшее разрешение при отображении неподвижных объектов, а 720p — лучшее отображение подвижных изображений и свободен от артефактов, связанных с чересстрочной развёрткой [94, 112]. Таким образом, проблема выбора формата изображения, типа компрессии, скорости цифрового потока данных для ТВЧ для многих стран остаются актуальной и по настоящее время. Новый метод оценки качества с использованием двух опорных изображений позволил получить интересные результаты [94, 96, 104, 112]. Уровни качества некомпрессированных изображений в форматах 1080i/25 и 720/50 оценивают как близкие при наблюдении с расстояния, равного трём высотам экрана. Такой результат можно объяснить следующим образом. Известно, что эквивалентность оценки вертикального разрешения чересстрочного изображения в сравнении с построчным достигается в том случае, когда активное число строк чересстрочного изображения умножают на поправочный коэффициент 0,6...0,7 [104]. Умножая число строк формата 1080i/25 на 0,6...0,7, получаем 1080 · (0,6...0,7) = 650...750. Это означает примерную эквивалентность форматов 1080i/25 и 720p/50 в отношении чёткости. Однако эквивалентность не означает равенство. Чересстрочное изображение в формате 1080i/25 обеспечивает большую статистическую чёткость, а в построчном разложении в формате 720p/50 лучше воспроизводятся границы движущихся объектов. Было также
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 139 Таблица 4.1 Скорости передачи при использовании компрессии MPEG-4/H.264 Формат Активное число строк и число пикселей 720/24p или 25p 720×1280 720/50p 720×1280 1080/50i 1080(2×540) ×1920 1080/24p или 25p 1080×1920 1080/50p 1080×1920 Число кадров в секунду Число пикселей в секунду Скорость передачи для MPEG-4, H.264, Мбит/с 24/25 50 25 24/25 50 23040000 46080000 51840000 51840000 106680000 4...5 7...9 8...10 7...9 14...18 отмечено, что преобразование чересстрочного изображения в построчное сопровождается большими искажениями и артефактами, чем повышающее преобразование формата 720p/50 в формат 1080i/25 [112]. Следует также отметить, что выбор построчного формата 720p/ 50 вместо 1080i/25 позволит также устранить преобразование чересстрочного растра в построчный, выполняемое в мониторах и телевизорах с ухудшением качества изображения. Использование же построчного формата 720p/50 позволит уменьшить скорость потока данных при доставке ТВ программ хорошего качества. Дополнительное снижение цифрового потока в канале связи можно получить при использовании «сегментных» кадров [20]. В табл. 4.1 приведены рекомендованные скорости передачи для различных стандартов при использовании компрессии MPEG-4/H.264 [94]. В России в 2005 году было принято решение о внедрении европейского стандарта цифрового телевидения DVB (Digital Video Brodcasting — цифровое видеовещание) и переходе на цифровое ТВ вещание к 2015 г. В настоящее время ведётся работа по приобретению регионами России оборудования и проведению опытного ТВ вещания в стандарте H.264/DVB-T2 [133]. В плане передачи сигналов по каналам связи следует ожидать первоочерёдного развития ТВЧ в четырёх сегментах — спутниковом, кабельном, наземном и Интернет-вещании (трансляция в IP-сетях). Спутниковый сегмент («НТВ-Плюс») оказался более динамичным в предоставлении сервисов ТВЧ. Однако здесь существуют сложности: в области компрессии на головной станции (транскодирование MPEG-2 в MPEG-4) и приёмных устройств [94]. Как известно, транскодирование ухудшает качество, а одновременное вещание в двух форматах (стандартном и ТВЧ) означает, что приёмных устройств должно быть два, а универсальное приёмное устройство по стоимости будет более дорогим.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 140 Часть I. Принципы построения систем телевидения Кабельное телевидение ТВЧ — весьма интересное и перспективное направление, особенно с учётом бурно развивающейся многоканальной сети MMDS. Так, например, компания «Космос-ТВ» по этой технологии доставляет 70 каналов. У кабельной сети есть преимущества в доставке ТВЧ сигналов потребителю в формате 1080i с превосходным качеством. Интернет-вещание (IPTV) имеет большой потенциал в будущем. Здесь речь идёт о телевидении как части тройного пакета: интернеттелефония-цифровое телевидение. Люди проводят больше времени на телефоне, они изучают новости из Интернета, там же совершают покупки, заказывают билеты и тому подобное. К тому же монитор компьютера и есть ТВЧ-монитор. Поэтому услуга широкополосной сети будет включать доставку киноновинки в формате 720p, а Ehternet-вход компьютера заменит приставку — ресивер, без которой спутниковый оператор работать не сможет. Тем не менее широкое применение ТВЧ в мультисервисной сети имеет ограничение по пропускной способности у операторов кабельного телевидения и интернет-вещания. У абонентов же спутникового оператора таких сложностей не предвидится. Кроме повышенного числа строк (более 700...1000), ТВЧ отличается от стандартного большими размерами экрана с форматом кадра от 5:3 до 2:1. Естественно, при высокой чёткости наблюдение изображения с расстояния 6...8 высот экрана (H) приводит к снижению визуальной различимости мелких деталей в силу ограниченной разрешающей способности зрительной системы человека. Поэтому изображение ТВЧ рекомендуют наблюдать с расстояния 3H [20], чтобы по своему качеству оно приближалось к исходной сцене. При этом система ТВЧ должна была позволить получать изображения на больших экранах с широким форматом кадра, создающим у зрителя впечатление реальности, что (эффект присутствия) изображение находится «вокруг» него. Система высокого качества изображений должна также найти применение в кинопроизводстве, полиграфии, компьютерной технике, обучении, медицине, в промышленности и т. д. В основу такой системы будут положены новые технологии, которые, главным образом, будут решать проблемы передачи сигналов на большие расстояния. 4.2. Стандарты ТВЧ Телевидение высокой чёткости с большим экраном стало целью следующего этапа развития ТВ техники, в том числе и более широкого использования его в других областях. С самого начала считалось, что технология ТВЧ позволит упростить обмен программами благодаря объединению процессов производства программ для телевиде-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 141 ния и кино. Концепция единого стандарта для всех регионов мира обеспечит большие выгоды для создателей программ. Работа над таким стандартом показала, что задача его разработки связана с определёнными трудностями из-за различных целей, которые ставятся перед ТВЧ в разных частях мира. Большая работа, проведённая ранее специалистами по созданию единого стандарта, как известно, не привела к сбалансированному, в международном плане, решению. Были определены три номинальные полосы частот для ТВ радиосигналов [5]: 6,0 МГц — системы M, N (NTSC, PAL); 7,0 МГц — система B (SECAM, PAL); 8,0 МГц — системы O, H, I, D, K, KI, L (SECAM, PAL). В связи с этим было введено новое условное обозначение и узкополосной передачи сигналов ТВЧ, отражающих все три вида международных стандартных радиоканалов: 6, 7 и 8 МГц — ТВЧ-6-7-8. Демонстрация цифрового ТВЧ на международном симпозиуме в Монтре в 1997 году убедительно подтвердила возможность передавать сигналы ТВЧ в стандартных радиоканалах 6, 7 и 8 МГц с высоким качеством [20]. В 1989 году были предприняты попытки создать единый международный стандарт ТВЧ. Был согласован формат кадра 16:9, число элементов в активной части строки 1920. В то же время не удалось согласовать число строк развертки — предлагалось использовать 1050, 1125, 1250, 1375 строк в кадре. В 1999 году была принята новая редакция стандарта ТВЧ. Теперь значения единых параметров не зависит от частоты кадров, значения которой могут быть равными 60, 50, 30, 25 и 24 Гц. Для формирования изображения определены прогрессивный (P) и чересстрочный (I) способы. Для транспортировки изображений, сформированных первым способом, можно применить канал передачи прогрессивных кадров (P) либо канал передачи сегментных кадров (Ps F). Для распространения изображений, сформированных вторым способом, применяется канал передачи чересстрочных полей (I). Термин «сегментный кадр» означает, что изображение сформировано с применением прогрессивной развёртки, а передаётся в виде двух сегментов, один из которых содержит нечётные строки изображения, а другой — чётные. Это приводит к снижению скорости цифрового потока в канале связи в два раза и устранению искажений при передаче границ подвижных объектов, свойственных первоначальному варианту чересстрочной развертки. Характеристики развертки изображений в соответствии с единым стандартом приведены в табл. 4.2 для первого варианта системы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 142 Часть I. Принципы построения систем телевидения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью Ðèñ. 4.1. 143 Глобальная модель ТВЧ ТВЧ — 1125 строк в кадре. Из таблицы видно, что в стандарт включено новое значение частоты кадров при прогрессивной развёртке — 24 Гц, которое используется в кинематографии. Применение частоты 24 кадр/с обеспечивает упрощение преобразования фильмов в видеосигнал [20]. При этом разумеется, что с частотой 24 кадр/с будет производится и видеосъёмка. Это облегчит международный обмен программами в виде кинофильмов, которые будут редактироваться в электронном виде и передаваться по цифровым каналам связи. В настоящее время наиболее широкую известность получили два варианта системы ТВЧ: 1125 строк/60 полей и 1250 строк/50 полей. Основные характеристики видеосигналов, базирующихся на системах 1125/60 и 1250/50 (H.264/DVB-T2), приведены в табл. 4.3. Как уже отмечалось ранее, сигналы ТВЧ, формируемые на ТВ центре, затем поступают в вещательную распределительную сеть: ве-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 144 Часть I. Принципы построения систем телевидения Таблица 4.3 Основные характеристики видеосигналов Характеристика 1125/60 1250/50 Число строк в кадре Число активных строк в кадре Коэффициент чересстрочности Формат кадра Частота полей, полей/с Частота строк, Гц 1125 1035 2:1 16:9 60,0 33750 1250 1080 2:1 16:9 50,0 31250 щание в диапазонах ОВЧ и УВЧ, спутниковое вещание, службы кабельного телевидения (СКТ), интернет-вещание, запись и распределение программ на носителях (видеоленты, диски и др.) (рис. 4.1). Как видно из схемы доставки программ ТВЧ, все службы глобальной модели ТВЧ по своему назначению подразделяются на четыре вида: 1) центр производства программ ТВЧ, 2) преобразование и кодирование сигналов ТВЧ, 3) службы доставки потребителям программ ТВЧ различными каналами связи (наземные, спутниковые и кабельные) и 4) потребители (диски/кассеты, дисплеи, приёмники и т. д.). 4.3. Телевидение сверхвысокой чёткости К началу 1990-х годов в мировом сообществе возникла заинтересованность в применении ТВ изображений с разрешением более 1000 строк (выбираемым для систем ТВЧ) во многих областях, таких, как телевидение с большим экраном, кино, компьютерная графика, полиграфия, медицина, наука, системы мультимедиа и т. п. При разработке систем ТСВЧ учитывались перспективы вещательного и прикладного телевидения, ставилась задача разработки методов реализации подобных систем и передачи сигналов потребителям и их воспроизведение. Одним из применений систем ТСВЧ являются цифровые оптические эффекты и другие виды электронной обработки изображений на киноплёнке, например ретуширование, с целью удаления отдельных участков и введения новых фрагментов, обработка изображений в ТВ системе растрового электронного микроскопа (РЭМ) при проведении научных исследований для получения максимального объёма пространственной информации. Было предложено пересмотреть рекомендацию ВТ.1201 «Изображения СВЧ» [95] и ввести в неё информационное приложение с результатами исследований, проведённых в Японии компаниями CRL, JVC, NTT и NHK (табл. 4.4), и сведениями о профилях и уровнях стандарта MPEG-4, которое можно использовать при кодировании в ситуациях ТСВЧ. Параметры пространственной разрешающей способности аппаратуры должны быть кратны количеству пикселей по
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 145 Глава 4. Системы телевидения с высокой визуальной четкостью Таблица 4.4 Системы сверхвысокой чёткости, разрабатываемые в Японии Разработчик Параметр Иерархия Формат кадра Разрешающая способность по горизонтали (пиксели) Разрешающая способность по вертикали (пиксели)2160 Частота кадров/полей (ГЦ) Развёртка Разработанное оборудование CRL, JVC NTT NHK HRI1 16:9 3840 HRI1 16:9 3840 HRI3 16:9 7680 2160 4320 24/48/(96) Прогрессивная Дисплей 60 30/60 Камера и дисплей Камера и дисплей горизонтали и вертикали формата разложения 1920×1080 по рекомендации МСЭ-Р ВТ.1361. При реализации такой разрешающей способности необходимо учитывать накопление пространственных интегральных искажений, возникающих как при формировании исходного ТВ сигнала, так и при его воспроизведении. В то же время уменьшение пространственного размера пикселя при формировании видеосигнала отражается снижением его уровня и возрастанием требований к подавлению составляющих шума, которые могут снижать разрешение. Иерархия пространственной разрешаюшей способности (число отсчётов) систем сверхвысокой чёткости: НК1-0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1920×1080 НК1-1 . . . . . . . . . . . . . . . . . . . . . . . . . . 3840×2160 НК1-2 . . . . . . . . . . . . . . . . . . . . . . . . . . 5760×3240 НК1-3 . . . . . . . . . . . . . . . . . . . . . . . . . . 7680×4320 4.4. Выбор параметров систем телевидения высокой визуальной чёткости и качества Раннее было отмечено, что увеличение визуального качества изображений возможно за счёт прямого увеличения числа строк в единицу времени и, соответственно, рабочей полосы частот. Недостаток этого преобразования — резкое увеличение полосы частот, несовместимость с существующими системами ТВ вещания и трудности реализации приёмного оборудования. Повышение визуального качества изображений без значительного расширения полосы частот может быть частично реализовано за счет преобразования переданных сигналов на приемной стороне, что эффективно согласует пространственно-временную структуру преобразованного сигнала и соответствующих изображений с характеристиками зрительной системы наблюдателя [96].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 146 Часть I. Принципы построения систем телевидения Таким образом, если в первом случае выигрыш в визуальном качестве изображений связан с прямым увеличением количества переданной пространственной информации, то во втором случае выигрыш достигается за счет комплексного преобразования переданной структуры ТВ изображений, учитывающего особенности зрительного восприятия. В результате преобразований и интегрального эффекта повышается общее визуальное качество ТВ изображений. Следует заметить, что возможность реализовать второй вариант появилась в связи с развитием микроэлектроники и, особенно, цифровой обработки сигналов с применением элементов памяти. В частности, разработка малогабаритных устройств запоминания ТВ сигналов на интервалы времени, кратные длительностям строк, полукадров и кадров ТВ сигнала, позволяет осуществлять в настоящее время цифровую фильтрацию и преобразование непосредственно в ТВ приемниках. При этом ожидается, что в перспективе стоимость таких приемников будет не выше стоимости приемников без цифровой обработки сигналов [98]. Сопоставление результатов работ по разработке систем высокой четкости и повышенного качества позволяет, с учетом перспектив развития ТВ вещания, предположить следующее: • ближайшее будущее ТВ вещания — системы, повышение визуального качества в которых будет достигнуто за счет цифровой обработки сигналов в ТВ приемнике (или пункте приема); • развитие систем повышенного качества позволит реализовать эффективный переход к системам высокой четкости без избыточного увеличения полосы частот переданных ТВ сигналов и будет содействовать повсеместному переходу к согласованной и эквивалентной цифровой обработке ТВ сигналов на передающей и приемной сторонах ТВ систем. Параметры таких систем могут быть обоснованы лишь с учетом характеристик и специфических особенностей работы зрительной системы наблюдателя (ЗСН). Это следует принимать во внимание при выборе размера экрана ТВ приемника, частоты кадров и числа строк при считывании, передаче и воспроизведении ТВ изображений. 4.4.1. Размер экрана ТВ приемника Выбирая размер экрана ТВ приемника, необходимо учитывать мешающее воздействие на наблюдателя его краев. Для упрощения, например, будем считать, что за счет пространственно-временного усреднения на наблюдателя воздействует усредненное значение яркости B0 . Светящийся экран представим в виде произведения постоянной яркости B0 на некоторую ограничивающую функцию F (x, y), а именно Bэ = B0 F (x, y). Пространственный спектр воздействия постоянной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 147 яркости можно представить с помощью δ-функций: Sп (ωx , ωy ) = (2π)2 B0 δ(ωx )δ(ωy ), где ωx , ωy — пространственные частоты. Если F (x, y) соответствует спектр Ф(ωx , ωy ), то спектр ограниченного экраном воздействия постоянной яркости можно найти с помощью свертки этой функции с Sп (ωx , ωy ). В результате придем к выражению SП (ωx , ωy ) = B0 Ф(ωx , ωy ). Таким образом, пространственный спектр светящегося экрана полностью определяется произведением спектра ограничивающей функции F (x, y) и яркости B0 . Известно, что пространственная частотно-контрастная характеристика (ПЧКХ) зрительной системы наблюдателя (ЗСН) имеет подъем в области средних пространственных частот и зависит от яркости фона. Пусть Kнч — усредненное значение ЧКХ зрения в области низких (около 0,4 пер./град) пространственных частот в вертикальном направлении; Kmax — значение в окрестности максимальной чувствительности; η = Kmax /KНЧ — степень подъема ЧКХ. Считаем также выполненным условие: относительные значения составляющих мешающего воздействия экрана в окрестности максимальной чувствительности зрения не должны превышать ∆ от максимального значения. Поэтому относительная амплитуда спектральных составляющих границ экрана в окрестности максимума ЧКХ наблюдателя не превышает K = ∆/η. Ограничивающую функцию F (x, y) по вертикали можно представить прямоугольной функцией. Нормированная огибающая модуля спектра этой функции ξ = | sin z/z|, где z = ωу φэв /2; φэв — вертикальный размер экрана; ωy = 2π/y — пространственная частота. В соответствии с результатами работ по измерению ПЧКX зрительной системы человека η ≈ 5...10. Максимум чувствительности зрения соответствует пространственной частоте fym ≈ 6...8 пер./град. Условие ξ = ξ0 6 K выполнено при z = z0 ≈ 1/K. Поэтому 1/K = ωуm φэв /2 = πfуm φэв . Следовательно, φэв = 1/(πfуm K) = η/πfуm ∆. Принимая η ≈ 8 и fym = 7 пер./град, несложно подсчитать, что при ∆, соответственно равных 4, 2 и 1 %, углы принимают значения 9, 18 и 36◦ . Таким образом, чтобы мешающее воздействие экрана не превысило ∆ = 2 %, угловой размер ТВ экрана должен быть не меньше 20◦ . Не следует и превышать этот угловой размер, поскольку при
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 148 Часть I. Принципы построения систем телевидения этом изменяется режим работы зрительной системы наблюдателя во времени, возрастают интервалы вертикального угла и, следовательно, относительное время работы ЗСН в режиме сканирования, что в конечном счете (за счет инерционности зрения и соответствующего преобразования временного спектра воздействия) ухудшает визуальную четкость ТВ изображений. По этой причине угловой размер по вертикали следует ограничить сверху примерно до 25...30◦ . Конкретные размеры экрана должны быть такими, чтобы способствовать созданию при восприятии ТВ изображений психологического эффекта реальности. Для этого размеры изображений объектов должны быть сравнимы с размерами реального восприятия объектов в условиях, эквивалентных условиям передачи. Последнее достигается при сравнительно резком увеличении размера экрана по вертикали и горизонтали. При изменении расстояния наблюдения в интервале 0,5...2,5 м рекомендуемые высоты экрана следует отбирать, исходя из угловых размеров 18...30◦ . При расчетах наблюдается значительный разброс возможных высот экрана. Однако психологический эффект реальности (присутствия) возникает, если размеры высот экранов приблизительно составляют 0,7...1,38 м. Один из важнейших параметров ТВ экрана — соотношение сторон, которое следует выбирать с учетом особенностей работы ЗСН. При восприятии ТВ изображений чаще всего интервал визуального сканирования по вертикали ограничен, что связано с ограничениями соответствующих угловых размеров помещения. С другой стороны, следует учитывать, что более удобным в работе ЗСН остается сканирование изображений по горизонтали. Уменьшение относительного времени сканирования по вертикали позволяет без заметного ухудшения визуального качества изображения увеличить интервал сканирования по горизонтали. С учетом этого фактора соотношение сторон, безусловно, может быть увеличено. Предельным, по-видимому, будет вариант 2:1. Дальнейшее увеличение размера изображений по горизонтали может привести к чрезмерному увеличению относительного времени сканирования с сопутствующим ухудшением пространственных ЧКХ ЗСН в таком режиме работы из-за инерционности. 4.4.2. Частота воспроизведения ТВ изображений и частота кадров При выборе частоты кадров и числа строк разложения ТВ изображения необходимо учесть основные особенности характеристик ЗСН. К сожалению, до сих пор отсутствует однозначный подход к экспериментальному исследованию таких характеристик. Результаты соответствующих работ часто приводятся без необходимых сведений об
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 149 условиях (угловые размеры и форма поля адаптации, освещённость, функция и спектр испытательных сигналов и др.) и методике экспериментального исследования, других особенностях испытательного воздействия. Все это затрудняет конкретизацию данных на основе результатов работ по экспериментальному измерению характеристик ЗСН. Диапазон яркостей ТВ изображений во многих случаях ограничен уровнями, при которых зрительную систему человека можно представить как линейный фильтр с четырехмерной частотной характеристикой K(ω, ωx , ωy , ν), сигнал с выходов которого поступает на входы приемника ограниченной чувствительности [99]. При экспериментальном исследовании характеристик зрения необходимо помнить, что общую характеристику K(ω, ωx , ωy , ν) можно свести к трехмерному, двухмерному или одномерному случаям лишь при условии параметрической фиксации одного, двух или трех аргументов соответственно. Временную частотную характеристику (ВЧХ), отражающую зависимость чувствительности зрительной системы наблюдателя от частоты временных изменений интенсивности воздействия, обычно измеряют, фиксируя спектральный состав и угловые размеры воздействия. Начальная чувствительность зрительной системы в этом случае определяется трехмерным спектром исходного воздействия Sв (ωx , ωy , ν, ). И, следовательно, чем сложнее функция Sв (ωx , ωy , ν, ), тем труднее использовать полученные результаты в условиях анализа с изменением спектра исходного воздействия. Учитывая тенденцию роста угловых размеров ТВ изображений, воспользуемся для вычисления предельных значений частоты кадров результатами измерения ВЧХ, представленными Д. Келли [100]. При этом считаем, что воздействие белого света (его спектральная плотность энергии) постоянно. Основная часть энергии пространственного спектра воздействия приходится на низкие пространственные частоты. Полное поле зрения 68◦ , причем освещенность постоянна в центральной зоне поля зрения до 50◦ и далее убывает к краям до нуля, что снижает воздействие переходных процессов на краях на результаты измерений. На рис. 4.2 по данным [100] построена ВЧХ при яркости экрана около 50 кд/м2 . Методами численного анализа экспериментальных кривых найдена аппроксимирующая ВЧХ функция, которая также показана на рис. 4.2. На интервале пространственных частот 0...f аппроксимирующая функция K(f ) = K0 − K1 exp(−b1 f 2 ) имеет постоянное значение K(f ) = 1 на интервале f1 − f2 и K(f ) = K2 exp(−b2 f ) + K3 exp(−b3 f ) − K4 exp(−b4 f )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 150 Часть I. Принципы построения систем телевидения Временная частотная характеристика: 1, 4 — ВЧХ, построенные по результатам экспериментальных исследований; 2, 5 — аппроксимирующие функции K(f ); 3, 6 — функции K 2 (f ) Ðèñ. 4.2. Зависимости относительной энергии визуального восприятия от временной частоты при расчете с использованием аппроксимирующих функций 2 на рис. 4.2 (1) и 5 на рис. 4.2 (2) Ðèñ. 4.3. при f1 > f2 . Входящие в аппроксимирующую функцию параметры имеют следующие числовые значения: K0 = 1,263; K1 = 1,173; b1 = = 0,0138; K2 = 3,4; b2 = 0,08; K3 = 6,6; b3 = 0,12; K4 = 22,3; b4 = 0,2; f1 = 10,4 пер./град; f2 = 15 пер./град. Используя аппроксимирующую функцию, можно рассчитать относительную энергию визуального восприятия от временной частоты при условии, что воздействие имеет постоянную спектральную плотность в области временных частот: ∫f ∫ f |K(τ )|2 dτ 1 V (f ) = ∫ 0∞ = |K(τ )|2 dτ. (4.1) 2 dτ C |K(τ )| 0 0 0 Результаты расчета V (f ) представлены на рис. 4.3. Если считать, что качество визуального восприятия определяется в основном относительной энергией восприятия, то при передаче временных частот в диапазоне до 17 Гц обеспечивается 50 % соответствующего качества визуального восприятия объектов со значительными угловыми размерами; 25 Гц — 86 %; 30 Гц — 94 %; 40 Гц — 98,9 %; 50 Гц — 99,5 %; 55 Гц — 99,9 % и т. д. визуального качества восприятия объектов. Полученный результат дает общее представление о качестве визуального восприятия в заданном диапазоне временных частот. Однако функция V (f ) получена интегрированием, что обусловливает сглаживание особенностей характеристик зрения. В связи с этим целесообразно проанализировать необходимый диапазон передаваемых временных частот по виду функции C(f ) = dV /df = V (f )/C0 . Штрихпунктирной линией 3 на рис. 4.2 показан вид функции V (f ) = K 2 (f ), соответствующий аппроксимирующему выражению.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 151 Для выявления особенностей функции V (f ) были рассчитаны в ′ диапазоне f > 15 Гц функции V (f ) и V ′′ (f ). Значение √ функции V (f ) максимально на частоте f = 20 Гц, снижается в 2 раз на частотах 17,5 Гц и 25 Гц, в 1,6 раза на частоте 26 Гц, в 2,7 раз на частоте 30 Гц, приблизительно в 10 раз на частоте 38 Гц. Значение функции V ′′ (f ) максимально на частоте 26 Гц, снижается в 1,55 раза на частоте 30 Гц, приблизительно в 10 раз на частотах до 44 Гц. Следует при этом иметь в виду, что значения функции V ′ (f ) характеризуют крутизну спада функции V (f ), а значения V ′′ (f ) — степень изменения крутизны спада функции V (f ). Если связывать полосу пропускания ВЧХ с крутизной спада (среза) функции V (f ), то частота среза ВЧХ (f = fс ) в условиях наблюдения крупных деталей ТВ изображения составляет f = = fс >≈ 20 Гц. Особого внимания заслуживает расчетное значение fс = 26 Гц. В этой точке сохраняется большое значение крутизны спада V (f ) при максимальной степени ее изменения. Участок повышенной крутизны спада V (f ) практически заканчивается в диапазоне fс ≈ 44 Гц. Это значение fс можно считать предельным для полосы пропускания ВЧХ. Согласно данным, представленным на рис. 4.3 при fс ≈ 20 Гц, может использоваться больше 70 % относительной энергии визуального восприятия. Однако в таком случае неискаженная передача временных частот воздействия вплоть до примерно fс должна быть реализована с учетом всех преобразований сигналов в ТВ системе. В датчиках ТВ сигнала необходимо выполнить при этом следующие условия: • заданный диапазон временных частот должен сохраняться с учетом времени накопления информации, эффективности считывания и т. д.; • в заданный диапазон временных частот не должны проникать значительные по энергии побочные спектральные составляющие, возникающие при дискретизации воздействия во времени с частотой кадров. Первое из условий может быть выполнено за счет уменьшения времени накопления, а второе за счет использования специальных (цифрового типа) фильтров временных (в последовательности кадров) частот в датчиках ТВ сигнала. Уменьшение времени накопления определяет необходимость увеличения частоты считывания (кадров) сигнала в датчике fcч . При этом не только уменьшится степень влияния процесса накопления на процесс формирования ТВ сигнала в области верхних, временных частот, но и уменьшится степень проникновения побочных составляющих дискретизации (с частотой кадров) в диапазон передаваемых временных частот. Последнее обусловливается, во-первых, естественным уменьшением энергии спектра ансамбля
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 152 Часть I. Принципы построения систем телевидения воздействия в области верхних временных частот и, во-вторых, влиянием характеристик инерционности в датчике. Затем необходимо методами цифровой фильтрации ограничить спектр временных частот до частоты примерно fс и осуществить цифровую дискретизацию ограниченного по временным частотам сигнала уже с частотой fд > 2fс . На приемной стороне ТВ системы должно быть реализовано оптимальное согласование переданного спектра временных частот воздействия с ВЧХ при воспроизведении ТВ изображений. Для этого целесообразно методами цифровой фильтрации выделить спектр переданных временных частот воздействия с последующим увеличением их частоты дискретизации при воспроизведении. Частота дискретизации воспроизведения fв должна обеспечить попадание в область пропускания ВЧХ лишь составляющих спектра временных частот в диапазоне от 0 до fс и исключить пересечение лепестков соответствующего спектра. Разностная частота fр = fв −fс не должна наложиться на участок с увеличением крутизны подъема ВЧХ. Соответственно результатам проведенных расчетов fр >∼ 44 Гц, при fс = 20 Гц, fв > 64 Гц. При увеличении fс частота fв должна увеличиться. Предельной для диапазона пропускания ВЧХ можно считать частоту fс = 44 Гц. Целесообразно рекомендовать выбор частоты воспроизведения 88 Гц. Следует заметить, что полученный результат хорошо согласуется с результатами исследований воздействия электросети на особенности зрения человека, которые показали наличие минимума чувствительности зрения человека к временным изменениям интенсивности воздействия, а именно в районе частоты около 90 Гц. Чувствительность зрительной системы и вид ВЧХ существенно зависят от пространственных размеров воздействия. На рис. 4.2 показана ВЧХ 4, экспериментально измеренная для воздействия, представляющего собой периодическую миру пространственной частоты fx = fx0 = 4 пер./град. Вид ВЧХ соответствует варианту параметрического сечения характеристики K(ωx , ωy , ω, ν) при фиксированном значении ωx = 2πfx0 и отражает особенности изменения ВЧХ, свойственные вариантам с уменьшением углового (например, в горизонтальном по пространству направлении) размера объекта. Штриховой линией 5 на рис. 4.2 показана аппроксимирующая функция  0 6 f 6 f1 ;  exp(−b1 f ), (4.2) K(f ) = K1 − K2 f, f1 6 f 6 f2 ;  K3 exp(−b2 f ), f2 6 f 6 ∞, где K1 = 0,748; K2 = 0,0275; K3 = 2,296; b1 = 0,09; b2 = 0,158; f1 = 6 Гц; f2 = 10 Гц. Штрихпунктирной линией 6 показана функция K 2 (f ).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 153 Рассчитанная с использованием соотношения (4.2) функция V (f ) показана на рис. 4.3 (кривая 2). Можно видеть, что для такого случая 90 % относительной энергии визуального восприятия обеспечивается уже при передаче временных частот в диапазоне от 0 до 12 Гц. Дальнейшее увеличение пространственной частоты сопровождается сокращением необходимого для передачи диапазона временных частот и уменьшением относительного влияния переданных составляющих на визуальное качество изображений. Полученные данные позволяют сделать вывод о целесообразности более полного согласования параметров сигнала передачи с характеристикой K(ωx , ωy , ω, ν) зрительной системы наблюдателя. Не вызывает сомнений эффективность раздельного формирования на передающей стороне передаваемого диапазона временных частот для соответствующих участков диапазона пространственных частот воздействия. За счет этого может быть существенно сокращена избыточность сигнала передачи. Однако и в таком случае на передающей и приемной сторонах ТВ системы необходимо методами цифровой фильтрации ограничить спектр соответствующих временных частот на передающей стороне, осуществить дискретизацию ограниченного по временным частотам сигнала с пониженной частотой дискретизации, выделить спектр переданных временных частот с последующим увеличением их частоты дискретизации при воспроизведении. При этом рассмотренное формирование сигналов на передающей и приемной сторонах ТВ системы целесообразно реализовывать в различных по растру направлениях. 4.4.3. Число строк при передаче и воспроизведении Число строк ТВ изображения, необходимое для передачи, можно выбрать из результатов работ по экспериментальному исследованию пространственной частотной характеристики (ПЧХ) зрительной системы наблюдателя ТВ изображений. На рис. 4.4 (кривая 1) представлена ПЧХ, построенная на основе результатов работы для воздействия белого света. Следует, однако, отметить, что при построении спадающей части ПЧХ учитывались также другие результаты. Методами численного приближения получена функция, аппроксимирующая ПЧХ, представленная на рис. 4.4 штриховой линией 2:  0 < fy 6 fy1 ;  K0 − K0 exp(−b0 x), 1 fy1 6 fy 6 fy3 ;  K1 exp(−b1 x) + K2 exp(−b2 x) − K3 exp(−b3 x), fy2 < fy < ∞, (4.3) где K0 = 1,31; K1 = 1,12; K2 = 10,9; K3 = 10,9; b0 = 0,239; b1 = 0,071; b2 = 0,325; b3 = 0,756; fy1 = 6,03 пер./град; fy2 = = 8,6 пер./град.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 154 Часть I. Принципы построения систем телевидения Пространственная частотная характеристика: 1, 4 — ПЧХ, построенные по результатам экспериментальных исследований; 2, 5 — аппроксимирующие функции K(fx ); 3, 6 — функции K 2 (fx ) Ðèñ. 4.4. Зависимости относительной энергии визуального восприятия от пространственной частоты при расчете с использованием аппроксимирующих функций 2 на рис. 4.4 (1) и 5 на рис. 4.4 (2) Ðèñ. 4.5. В соответствии с соотношением (4.1) и условием (4.3) была рассчитана функция относительной энергии визуального восприятия в зависимости от пространственной частоты fy . Результаты расчета представлены на рис. 4.5 (кривая 1). Полученная функция V (fy ) показывает, что при передаче пространственных частот в диапазоне до fy ≈ 9 пер./град обеспечивается 50 % соответствующего качества визуального восприятия фиксированных во времени объектов. При передаче в диапазоне до fy ≈ 12 пер./град — 80 %; до fy ≈ 16 пер./град — 90 %, до fy ≈ 20 пер./град — 95 % и т. д. Штрихпунктирной линией 3 на рис. 4.4 показан вид функции V (fy ) = K 2 (fy ), соответствующий аппроксимирующему выражению (4.3). Для выявления особенностей функции V (fy ) были рассчитаны в диапазоне fy > fy2 = 8,6 пер./град функции V ′ (fy ) и V ′′ (fy ). В соответствии с полученными результатами значение функции V ′ (fy ) максимально на частоте fy = 10 пер./град, снижается приблизительно √ в 2 раз на частоте fy = 12 пер./град, в 5 раз на частоте fy = = 16 пер./град, приблизительно в 10 раз на частоте fy = 19 пер./град. Значение функции V ′′ (fy ) максимально на частоте fy = = 12 пер./град, снижается приблизительно в 3 раза на частоте fy = = 16 пер./град, приблизительно в 10 раз на частоте fy = 19 пер./град. Если связывать полосу пропускания, ПЧХ с крутизной спада (среза) функции V (fy ), то частота среза ПЧХ (fy = fyc ) в условиях наблюдения неподвижных объектов равна fy = fyc > 10 пер./град. Особого внимания заслуживает расчетное значение fy = 12 пер./град. В этой точке сохраняется большая крутизна при максимальной степени ее изменения. Участок повышенной крутизны спада V (fy ) практически заканчивается в диапазоне fy ≈ 19...20 пер./град.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 155 Следовательно, особыми точками ПЧХ можно считать точки, соответствующие fy = 12 пер./град и fy = 19...20 пер./град. Учитывая идентичность структуры ВЧХ и ПЧХ зрительного анализатора, можно, кроме того, предположить, что участок с пониженной крутизной спада ПЧХ (fy > 20 пер./град) заканчивается в диапазоне fy ≈ 38... ...40 пер./град. Соответственно, этим значением, по-видимому, полностью и исчерпываются резервы повышения визуального качества изображений за счет увеличения числа строк разложения. Если задаваться углом зрения φ ≈ 30◦ , то расчетное значение fy ≈ 12 пер./град обеспечивается при числе строк ТВ изображения Z > 720, расчетное значение fy ≈ 19...20 пер./град при Z > 1140...1200 и, наконец, fy ≈ 38...40 пер/град при Z > 2280...2400. Полученные выше результаты могут быть несколько скорректированы при учете анизотропии ПЧХ зрительной системы, уточненные исследования которой были осуществлены в [99]. Согласно данным, представленным на рис. 4.5, при fyc > > 12 пер./град, может обеспечиваться использование более 75 % относительной энергии визуального восприятия. Однако в таком случае неискаженная передача пространственных частот воздействия вплоть до порядка fс должна быть реализована с учетом всех преобразований сигналов в ТВ системе. В датчиках ТВ сигнала, так же, как и для случая временных частот воздействия, необходимо выполнить следующие условия: • заданный диапазон пространственных частот должен сохраняться с учетом пространственного интегрирования воздействия в оптической системе, при считывании сигнала, возникновении относительных пространственных смещений датчика и воздействия и т. д.; • в заданный диапазон пространственных частот не должны проникать значительные по энергии побочные спектральные составляющие, возникающие при дискретизации пространственной структуры воздействия. Выполнение первого из условий обусловливает увеличение требований к соответствующим характеристикам датчика, а выполнение второго — необходимость увеличения числа строк в датчике при считывании сигнала. При этом уменьшается степень проникновения побочных составляющих дискретизации в диапазон передаваемых пространственных частот. Затем методами цифровой фильтрации необходимо ограничить спектр пространственных частот до частоты fyc и осуществить дискретизацию ограниченного по пространственным частотам сигнала с частотой дискретизации при передаче fудп > fус .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 156 Часть I. Принципы построения систем телевидения На приемной стороне ТВ системы должно быть реализовано оптимальное согласование спектра пространственных частот воздействия с ПЧХ зрительного анализатора при воспроизведении ТВ изображений. Для этого целесообразно методами цифровой фильтрации выделить спектр переданных пространственных частот с последующим увеличением и частоты дискретизации по строкам (числа строк) при воспроизведении. Частота дискретизации при воспроизведении fудв должна обеспечить попадание в область пропускания ПЧХ составляющих спектра пространственных частот в диапазоне от 0 до fyc . Разностная частота fp = fудв − fyc не должна наложиться на участок с резким увеличением крутизны подъема ПЧХ. Соответственно, по результатам проведенных расчетов fуп > 20 пер./град. При, например, fyc = 14 пер./град имеем fудв = fуp + fус = 34 пер./град. При увеличении fус частота fудв должна увеличиваться. Чувствительность зрительной системы и вид ПЧХ существенно зависит от временных параметров воздействия. На рис. 4.4 (кривая 4) показана ПЧХ, экспериментально измеренная для воздействия, представляющего собой периодически мелькающее изображение временной частоты f = f0 = 6 Гц [101]. Вид ПЧХ, показанный на рис. 4.4 (кривая 4), соответствует варианту параметрического сечения характеристики K(ωx , ωy , ω, ν) при фиксированном значении ω = 2πf0 и отражает особенности изменения ПЧX, свойственные вариантам наблюдения периодически меняющихся во времени объектов. Штриховой линией 5 на рис. 4.4 показана аппроксимирующая функция  0 6 fy 6 fy1 ;  1 − K1 fy , fy1 6 fy 6 fy2 ; (4.4) K(fy ) = K2 − K3 f,  K4 exp(−bfy ), fy2 6 f 6 ∞, где K1 = 0,029, K2 = 1,84, K3 = 0,25, K4 = 1,31; fy1 = 3,8 пер/град, fy2 = 5 пер./град; b = 0, 16. Штрихпунктирной линией 6 на рис. 4.4 показана функция K 2 (fy ). Рассчитанная с использованием соотношения (4.1) и условия (4.4) функция V (fy ) показана на рис. 4.5 (кривая 2). Можно видеть, что для такого случая 90 % относительной энергии визуального восприятия обеспечивается уже при передаче пространственных частот в диапазоне от 0 до 7 пер./град. Особенности других характеристик данного типа, приведенных в [101], показывают, что дальнейшее увеличение временной частоты изменений воздействия сопровождается сокращением необходимого для передачи диапазона пространственных частот и уменьшением относительного влияния переданных составляющих на визуальное качество изображений. Не вызывает
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 157 сомнений эффективность раздельного формирования на передающей стороне передаваемого диапазона пространственных частот для соответствующих участков диапазона временных частот воздействия. За счет этого может быть существенно сокращена избыточность сигнала передачи. Однако и в таком случае на передающей и приемной сторонах ТВ системы необходимо методами цифровой фильтрации ограничить спектр соответствующих пространственных частот на передающей стороне, осуществить, если необходимо, дискретизацию ограниченного по пространственным частотам сигнала с пониженной частотой дискретизации, выделить спектр переданных пространственных частот с последующим увеличением их частоты дискретизации при воспроизведении. При этом рассмотренные формирования сигналов целесообразно согласовывать и с характером временных изменений воздействия. Таким образом, параметры систем телевидения повышенного визуального качества целесообразно конкретизировать на основе учета особенностей многомерной частотной характеристики зрительной системы человека K(ωx , ωy , ω, ν). При использовании методов экспериментального исследования характеристики K(ωx , ωy , ω, ν), выполненных с применением конкретных элементов ТВ техники, удается в общем случае учесть и влияние характеристик последних на результаты измерения [99, 102]. На этой основе, безусловно, можно увеличивать и эффективность решения задач выбора параметров систем телевидения различного назначения и, в том числе, систем высокой визуальной четкости и качества. 4.5. Цифровой кинематограф Быстрое развитие электронно-оптических технологий на рубеже XX–XXI столетий обусловило прогресс в создании электронных цифровых средств записи, преобразования и отображения информации, на основе которого стало возможной реализация цифрового кинематографа. Появились технологии, позволяющие, в частности, сформировать, записать и воспроизвести высококачественное цветное изображение с объёмным звуковым сопровождением. Соответственно начала развиваться новая область — цифровой кинематограф (D-cinema) и появилась возможность создавать фильмы в цифровом виде, близкие по качеству к оптическим изображениям, а также передавать информацию в виде файлов на неограниченное расстояние по каналам связи вместо традиционных методов распространения и доставки фильмов для кинотеатров и воспроизводить их и в домашних условиях. Отметим, что перспективы электронного кинематографа обсуждались в нашей стране задолго до создания системы ТВЧ [95].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 158 Часть I. Принципы построения систем телевидения Цифровой кинематограф является кульминацией развития техники средств телевидения сверхвысокой чёткости. Можно отметить следующие основные преимущества цифрового кинематографа по сравнению с традиционной киноплёночной технологией: • ускорение процесса съёмок и монтажа материала; • простота монтажа и редактирования; • высокое качество изображения даже во многих случаях при неблагоприятных световых условиях съёмки; • 100 % качества эталонной копии при кинопоказе; • гарантия сохранности исходных материалов и копий в течение длительного времени (примерно 100 лет); • высокое качество конечной продукции и низкая себестоимость производства по сравнению с затратами на плёночный кинематограф; • простота доставки копий в кинотеатры с использованием цифровых сетей вещания и телекоммуникаций; • высокая надёжность съёмочной проекционной аппаратуры. Была предусмотрена возможность передачи сигнала изображения ТВЧ с прогрессивным разложением и частотой кадров 24 Гц через интерфейс, предназначенный для чересстрочного видеосигнала. Для этого каждый кадр исходного сигнала разделяется на два сегмента с чётными и нечётными строками и удваивается частота кадров. При этом осуществляется преобразование сигнала в псевдочересстрочный сигнал с нумерацией строк, идентичной принятой в стандартном последовательном цифровом интерфейсе. Причём полностью электронное производство фильмов предоставило кинорежиссерам большую свободу творчества. В области кинопроката влияние нового международного стандарта на киновидеопроизводство оказалось поистине революционным. Кинопрокатные организации, ещё использующие киноплёнку, могут получать по каналам связи электронные «фильмы» и на месте изготавливать «целлулоидные» копии высокого технического качества. Другая перспективная возможность — организация видеопроката в мировом масштабе с показом ТВЧ изображений на проекционных видеоэкранах. Применение частоты 24 кадр/с обеспечивает упрощенное преобразование фильмов в видеосигнал. Ожидается, что с такой частотой будет производится и видеосъёмка. Создатели программ получат ещё одно средство для «бесшовного» объединения изображений от различных источников. Цифровой кинематограф — это электронно-цифровой комплекс с современным носителями информации, которые при максимальной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 4. Системы телевидения с высокой визуальной четкостью 159 компактности обеспечивают производство и запись полнометражного фильма с высококачественным звуковым сопровождением, что даёт возможность существенно снизить расходы на производство копий кинопроката, затраты на изготовление которых в среднем составляют 2000...3000 долларов США за каждую копию, а также на доставку этих копий в кинотеатры. Количество копий при тиражировании фильмов может быть сколько угодно большим с полным сохранением исходного высокого качества изображения и звука. Качество копий остаётся высоким и при их хранении на различных носителях, например на цифровых лазерных видеодисках, магнитных дисках и цифровых магнитных лентах. Заметно уменьшаются также расходы на доставку копии в кинотеатры. Для этого могут использоваться спутниковые и наземные сети связи и другие средства телекоммуникаций. В условиях России весьма эффективной может оказаться доставка копий в любое количество кинотеатров по каналам связи или по каналам «вездесущего» ТВ и звукового вещания. В перспективе в каждом кинотеатре можно будет получать любые материалы из любой точки земли с помощью Интернета. Быстрое развитие электронно-оптических технологий определило перспективу развития современного кинематографа, сделав его современным зрелищным мероприятием, совместимым практически со всеми известными источниками информации при сохранении высокого качества изображения и объёмного звукового сопровождения. Важное значение имеют методы доставки программ цифрового кинематографа в кинотеатры в реальном масштабе времени с помощью наземных и спутниковых средств. Подход к этой проблеме был предложен администрацией связи Италии, отмечалось возможность производства программ с использованием студийного формата ТВЧ 1920/1080/24P и их доставки в соответствии с методами, изложенными в существующих рекомендациях МСЭ-Р по системам наземного и спутникового ТВ вещания [95]. Контрольные вопросы 1. Как зависит полоса частот видеосигнала от параметров ТВ системы? Приведите математическое выражение. 2. Что такое ТВЧ? Области применения. 3. С какой целью используются в ТВЧ «сегментные» кадры? 4. Назовите основные параметры систем ТВЧ. 5. Какие каналы связи можно использовать для передачи сигналов ТВЧ? 6. Исходная скорость цифрового потока в системах ТВЧ. 7. Как осуществляется повышение визуального качества изображений за счёт преобразования сигналов на приёмной стороне? 8. Цифровой кинематограф и его преимущества по сравнению с традиционной киноплёночной технологией.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü II ПРИНЦИПЫ ПОСТРОЕНИЯ ТВЕРДОТЕЛЬНЫХ ПРЕОБРАЗОВАТЕЛЕЙ «СВЕТ-СИГНАЛ» И «СИГНАЛ-СВЕТ» 5 ТВЕРДОТЕЛЬНЫЕ ФОТОЭЛЕКТРИЧЕСКИЕ ПРЕОБРАЗОВАТЕЛИ ИЗОБРАЖЕНИЯ Микроминиатюризация ТВ передающей аппаратуры тормозилась использованием в ней в качестве преобразователя «свет-сигнал» электровакуумного прибора, обладающего достаточно большими габаритами и сложной системой управления электронным лучом. В связи с этим в течение многих лет велись широкие поисковые работы в направлении безвакуумных анализирующих устройств — аналогов ТВ передающих электронно-лучевых трубок. Развитие твердотельной технологии, технологии тонкопленочных покрытий позволило разработать твердотельные матричные фотоэлектрические преобразователи (ФЭП) изображения, состоящие из массива фоточувствительных элементов, расположенных в местах пересечения проводящих шин. В качестве фоточувствительных элементов такой матрицы могут быть использованы фотосопротивления, фотодиоды, фототранзисторы с коммутацией фоточувствительных элементов в направлении координат 0X и 0Y тонкопленочными сдвиговыми регистрами. 5.1. Приборы с зарядовой связью (ПЗС) Твердотельные фотоэлектрические преобразователи (ТФЭП) изображений являются аналогами передающих ЭЛТ и являются основой современной видеокамеры. ПЗС-чип может иметь линейную форму (линейный ПЗС), либо форму двумерной матрицы (ПЗС-матрица) и состоять из дискретных элементов (пикселей), но ПЗС-устройства не являются цифровыми
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 161 устройствами, так как каждый пиксель может содержать любое число электронов, пропорциональное падающему свету, таким образом представляя аналоговую информацию. Пакеты электронов переносятся одновременным сдвигом рядов по строкам и столбцам на внешний каскад чипа. В настоящее время ПЗС не используются в качестве ТВ запоминающих устройств (ЗУ), а только в качестве фотоприёмников. ПЗС-видеокамеры обладают преимуществами перед камерами с вакуумными трубками: • очень высокая чувствительность (черно-белая видеокамера работает при освещенности объекта менее 0,1 лк); • отсутствие геометрических искажений; • низкое энергопотребление; • малые размеры; • большая долговечность. Рассмотрим устройство и принцип работы ПЗС-матрицы. ТФЭП ведут начало с 1970 г. с так называемых ПЗС и формируются на основе отдельных ячеек, представляющих собой конденсаторы МДП- или МОП-структуры. Одной из обкладок такого элементарного конденсатора является металлическая пленка М, второй — полупроводниковая подложка П (p- или n-проводимости), диэлектриком Д служит окисел беспримесного полупроводника, наносимого в виде тонкого слоя на подложку П [5]. В качестве подложки П применяется кремний, легированный акцепторной (p-типа) или донорной (n-типа) примесью, а в качестве Д — окисел кремния SiO2 (рис. 5.1). При подаче на металлический электрод напряжения под ним образуется «карман», или потенциальная яма, в которой могут «накапливаться» неосновные носители (в нашем случае электроны), а основные носители, дырки, будут отталкиваться от М. На каком-то расстоянии от поверхности, концентрация неосновных носителей может оказаться выше концентрации основных. Вблизи диэлектрика Д в подложке П возникает инверсионный слой, в котором тип проводимости изменяется на обратный. Зарядовый пакет в ПЗС может быть введен электрическим путем или с помощью световой генерации. При световой генерации фотоэлектрические процессы, возникающие в кремнии, приведут к накоплению неосновных носителей в потенциальных ямах. Накопленный заряд пропорционален освещенности и времени накопления. Направленная передача заряда в ПЗС обеспечивается расположением МОП-конденсаторов на столь близком расстоянии друг от друга, что их обедненные области перекрываются и потенциальные ямы соединяются. При этом подвижный заряд неосновных носителей будет накапливаться в том месте, где глубже потенциальная яма.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 162 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 5.1. Конденсатор МОП-структуры Перемещение зарядов под действием электрического поля Ðèñ. 5.2. Пусть под воздействием света накоплен заряд под электродом U1 (рис. 5.2). Если теперь на соседний электрод U2 подать напряжение U2 > U1 , то рядом появится другая потенциальная яма, более глубокая (U2 > U1 ). Между ними возникнет область электрического поля, и неосновные носители (электроны) в соответствии с воздействием этого поля будут дрейфовать (перетекать) в более глубокий «карман» (см. рис. 5.2). Чтобы исключить двунаправленность в передаче зарядов, используют последовательность электродов, объединенных в группы по 3 электрода (рис. 5.3). Если, например, накоплен заряд под электродом 4 и необходимо передать его вправо, то на правый электрод 5 подается более высокое напряжение (U2 > U1 ) и заряд перетекает к нему и т. д. Практически вся совокупность электродов подсоединена к трем шинам: I — 1, 4, 7, . . . ; II — 2, 5, 8, . . . ; III — 3, 6, 9, . . . . В нашем случае напряжение «приема» (U2 ) будет на электродах 2, 5. . . , но электрод 2 отделен от электрода 4, где хранится заряд, электродом 3 (у которого U3 = 0), поэтому перетекания влево не будет. Далее, если подать напряжение приема на шину III, а на шину I — U1 = 0, то реализуется перенос заряда от 5-го электрода (ячейки) к 6-му, и т. д. Трехтактная работа ПЗС предполагает наличие трех электродов (ячеек) на один элемент ТВ изображения, что уменьшает полезную площадь, используемую световым потоком. Для сокращения числа ячеек (электродов) ПЗС металлические электроды и слой диэлектри- Перемещение зарядов в двухфазной системе ПЗС Ðèñ. 5.4. Ðèñ. 5.3. Принцип работы трехфазной системы ПЗС
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 163 ка формируются ступенчатой формы (рис. 5.4). Это позволяет при подаче на электроды импульсов напряжения создавать под разными его участками потенциальные ямы разной глубины. В более глубокую яму стекает большинство зарядов из соседней ячейки. При двухфазной системе ПЗС сокращается число электродов (ячеек) в матрице на одну треть, что благоприятно сказывается на считывании потенциального рельефа. ПЗС вначале предлагали использовать в вычислительной технике в качестве запоминающих устройств, регистров сдвига. В начале цепочки ставили инжектирующий диод, вводящий в систему заряд, а в конце цепи — выводной диод, обычно это n-p- или p-n-переходы МОПструктуры, образующие с первым и последним электродами (ячейками) цепочки ПЗС полевые транзисторы. Но выяснилось, что ПЗС очень чувствительны к свету, и поэтому их лучше и эффективнее использовать в качестве светоприемников, а не в качестве запоминающих устройств. Если ПЗС-матрица используется в качестве фотоприемника, то накопление заряда под тем или иным электродом может быть осуществлено оптическим методом (инжекция светом). Можно говорить, что ПЗС-матрицы, по сути, являются светочувствительными аналоговыми сдвиговыми регистрами. Сегодня ПЗС не используются в качестве запоминающих устройств (ЗУ), а только в качестве фотоприемников (хотя ранее использовались в телевизорах 5 и 6 поколений) [26]. Они используются в факсимильных аппаратах, сканерах (линейки ПЗС), в фотокамерах и видеокамерах (матрицы ПЗС). Обычно в ТВ камерах используются так называемые ПЗС-чипы. Мы предполагали, что все 100 % зарядов передаются в соседний карман. Однако на практике имеет место перенос (считывание) зарядового пакета с потерями. Одним из источников потерь являются «ловушки», способные захватывать и удерживать некоторое время заряды. Эти заряды не успевают перетечь в соседний карман, если скорость передачи будет велика. Второй причиной является сам механизм перетекания. В первый момент перенос зарядов происходит в сильном электрическом поле — дрейф в E. Однако по мере перетекания зарядов напряженность действующего поля компенсируется и падает, дрейфовый процесс затухает, поэтому последняя порция перемещается за счет диффузии, в 100 раз медленнее дрейфа. Дождаться последней порции — значит снизить быстродействие. Дрейф дает более 90 % переноса. Но именно последние проценты являются основными при определении потерь. Пусть коэффициент передачи одного цикла переноса k = 0,99, полагая число циклов N = 100, определим суммарный коэффициент передачи 0,99100 = 0,366.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 164 Часть II. Принципы построения твердотельных преобразователей Очевидно, что при большом числе элементов даже незначительные потери на одном элементе приобретают большое значение для всей цепочки переносов в целом. Поэтому вопрос о сокращении числа переносов зарядов в матрице ПЗС является особо важным. В этом отношении у матрицы двухфазной ПЗС коэффициент передачи зарядов будет несколько большим, чем в трехфазной системе. 5.2. Считывание потенциального рельефа с матрицы ПЗС Фотоэлектрические преобразователи изображения на ПЗС делятся на два класса: линейные (одномерные) и матричные (двумерные). В линейных ФЭП фоточувствительные элементы расположены вдоль одной линии, т. е. строки, и формируют одномерное её изображение. Такие однострочные ФЭП могут быть использованы при контроле за технологическими процессами производства, при специальном анализе и анализе оптической плотности макро- и микрообъектов. Однострочные ФЭП могут быть использованы и для получения двумерного изображения. При этом необходимо осуществить перемещение ФЭП или объекта в направлении, перпендикулярном направлению строчной развертки. Твердотельным аналогом передающей трубки с электронным сканированием по строке и кадру является матричный формирователь сигнала изображения. Он представляет собой двухкоординатный массив светочувствительных элементов, в котором осуществляется электронное сканирование по координатам x и y. При проектировании такой двухкоординатной матрицы решается вопрос организации ее считывания. Для наиболее полного использования достоинств ПЗС зарядовые пакеты должны перемещаться к одному выходному устройству, а порядок считывания информации — обычно соответствовать принятому ТВ стандарту. При выборе способа организации считывания необходимо обеспечить минимальное смазывание изображения, возникающее при переносе накопленных зарядовых пакетов через освещенные области прибора. Поэтому в современных матричных ФЭП на ПЗС области накопления заряда и его переноса разделяют. По способу организации процесса считывания матрицы ПЗС делятся на матрицы с кадровым переносом заряда (КП), матрицы со строчным переносом заряда (СП) и матрицы со строчно-кадровым переносом заряда (СКП) [5]. Матрицы ПЗС КП (рис. 5.5) включают в себя секцию накопления — фотоприемную секцию, секцию хранения или памяти, которая защищена от света и равна по площади секции накопления, и один или несколько параллельных выходных сдвиговых регистров.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.5. 165 Способ организации покадрового считывания Во время активной части поля происходит накопление зарядовых пакетов в фотоприемной секции. Во время кадрового гасящего импульса накопленные заряды всех строк поля последовательно переносятся в защищенную от света секцию хранения. Далее во время накопления в фотоприемной секции следующего кадра информация из секции хранения построчно передается в секцию переноса заряда — сдвиговый регистр. Сдвиг строк в секцию переноса осуществляется во время обратного хода горизонтальной развертки. Затем зарядовые пакеты строки поэлементно выводятся сдвиговым регистром к выходному устройству, преобразующему заряды в сигнал изображения. После считывания всей видеоинформации из секции хранения начинается перенос следующего кадра. Одним из основных достоинств покадрового считывания является уменьшение эффекта смазывания изображения, так как зарядовая информация считывается из защищенной от света секции хранения и дополнительной засветки при сканировании не происходит. При покадровой организации легко осуществляется чересстрочное разложение изображения, также проста электродная структура, что позволяет компактно расположить ячейки матрицы. Принцип покадрового переноса удобен для освещения матрицы со стороны подложек, что позволяет удвоить квантовую эффективность прибора и получить более равномерную характеристику спектральной чувствительности. Таким образом, в матрице с покадровым считыванием перенос зарядовых пакетов к выходному устройству осуществляется в три приема: 1) перенос из секции накопления в секцию памяти; 2) перенос из секции памяти в сдвиговый регистр; 3) перенос из сдвигового регистра в выходное устройство. Нетрудно видеть, что число переносов для разных элементов кадра будет различным. Максимальным оно будет для первого элемента верхней строки и минимальным — для последнего элемента нижней. Максимальное число переносов для одного зарядового пакета нетрудно подсчитать. Для покадровой организации считывания по трехтактной схеме сдвига (см. рис. 5.5) число переносов будет равно Nmax = 2 · 3z + 3n, где z — число строк; n — число
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 166 Часть II. Принципы построения твердотельных преобразователей элементов в строке. В приведенном равенстве первый член учитывает число переносов по кадру, а второй — число переносов вдоль строки: 3z + 3z + 3n = 3(z + z + n). Учитывая, что зарядовые пакеты переносятся с потерями, так как, во-первых, часть заряда теряется в ловушках, существующих на границе кремния с окислом, а во-вторых, при определенной скорости переноса часть заряда может отстать от пакета и появиться в следующем. Неэффективность переноса заряда ε накладывает определенные ограничения на скорость работы ПЗС и полное число переносов, которые можно совершить без существенного разрушения сигнала. Если ε — относительная величина и характеризует часть заряда, отставшую от пакета на один перенос, умножив ε на число переносов в приборе N , получим результирующую неэффективность переноса N ε всего прибора. Недостатком матриц ПЗС КП является неполное устранение смаза изображения, которое проявляется в виде вертикальных тянущихся продолжений за очень яркими деталями. Смаз появляется из-за того, что при переносе накопленных зарядов из фотоприемной секции за время кадрового гасящего импульса в секцию памяти свет всё продолжает попадать в фотоприемную секцию. Для уменьшения смаза изображения были разработаны матрицы со строчным переносом зарядов (рис. 5.6), в которых область накопления образована вертикальными столбцами светочувствительных элементов, между которыми помещены фотозатворы и защищенные от света вертикальные сдвиговые регистры. В течение времени кадра в светочувствительных элементах накапливаются зарядовые пакеты. Во время гасящего кадрового импульса они одновременно и относительно быстро переносятся в соседние ячейки вертикальных сдвиговых регистров. Во время накопления следующего кадра зарядовые пакеты из вертикальных регистров одновременно сдвигаются в горизонтальный (выходной) регистр. Сдвиг по вертикальным регистрам на один элемент происходит во время обратного хода строчной развертки, а последовательный вывод зарядовых пакетов из горизонтальных регистров в выходное устройство — за время прямого хода строчной развертки. Полное освобождение вертикальных сдвиговых регистров от зарядов происходит за время кадра. Во время накопления зарядовых пакетов в светочувствительных ячейках (фотодиодах) на фотозатвор подается низкий потенциал, обеспечивающий барьер между фотодиодами и ячейками вертикального регистра. По окончании накопления на фотозатвор кратковременно подается положительный потенциал, разрешающий перенос зарядов из фотодиодов в ячейки вертикальных регистров. Затем с фотозатвора снимается положительное смещение, и накопление зарядовых пакетов в фотодиодах возобновляется.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.6. Матрица со строчным переносом зарядов Ðèñ. 5.7. 167 Матрица со строчно-кадровым переносом зарядов Для обеспечения чересстрочной развертки в матрице ПЗС СП заряды из светочувствительных ячеек в вертикальные регистры переносятся: в нечетных полях — из нечетных ячеек, а в четных полях — из четных ячеек. Смаз изображения в матрицах ПЗС СП существенно меньше, чем в ПЗС КП. Однако при наличии на объекте ярко освещенной детали уровень смаза оказывается заметен. В матрицах ПЗС СП он обусловлен попаданием части наклонно падающего света под алюминиевый экран над вертикальным ПЗС регистром. Это паразитная засветка значительно меньше, чем в матрицах ПЗС КП, но время ее действия существенно больше и равно длительности поля. В трехматричных камерах вещательного назначения необходимо дальнейшее снижение уровня смаза изображения. Для обеспечения этого требования были разработаны гибридные матрицы ПЗС со строчно- кадровым переносом заряда (СКП). Матрицы ПЗС СКП (рис. 5.7 и 5.8) отличаются от матриц ПЗС СП (см. рис. 5.6) наличием в них дополнительной секции хранения зарядов на длительность поля. Поэтому частота переноса заряда из вертикальных ПЗС регистров в секцию хранения может быть выбрана в десятки раз больше частоты строк, используемой в матрицах ПЗС СП. Это позволяет во столько же раз уменьшить уровень смаза изображения. Недостатки матриц ПЗС СКП заключаются в относительной сложности изготовления и высокой стоимости производства. Основные недостатки матричных ПЗС СП — невозможность освещения со стороны подложки и неполное использование светового потока из-за того, что фотодиоды занимают не всю площадь кристалла (рис. 5.8). Фотоны, попадающие на экранированные от света вертикальные ПЗС-регистры, не создают зарядов. Вследствие этого существенно снижается чувствительность камер. Эта проблема мо-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 168 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 5.8. Концепция строчно-кадрового переноса жет быть разрешена очень просто (хотя технологически это очень сложно) — поверх каждого пикселя (фотодиода) помещается микролинза. Микролинза концентрирует весь падающий свет на маленькую область, на сам пиксель (фотодиод), собирает в него весь световой поток, и этим самым эффективно увеличивает минимальную освещенность фотодиода (рис. 5.9). Сравнение традиционных схем с микролинзами (a) и структура ПЗСматрицы с микролинзами (фотография сделана электронным микроскопом) (b) Ðèñ. 5.9.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 169 Число фотодиодов в столбце матричного ПЗС выбирается равным числу строк в кадре. Чересстрочное разложение в матричных ПЗС со строчным переносом может быть реализовано различными способами. В простейшем случае в первом поле зарядовые пакеты из нечетных фотодиодов считываются в вертикальный ПЗС-регистр, а в четных фотодиодах накопление продолжается. Во втором поле считываются заряды, накопленные в четных фотодиодах. Размер светочувствительного элемента по вертикали оказывается равным размеру одного фотодиода. Центры соседних строк расположены на равном расстоянии друг от друга. Время накопления при таком считывании составляет в телевизионном режиме 40 мс — время кадра. Поэтому данный режим получил название режима накопления кадра. Столь большое время накопления приводит к искажениям при передаче подвижных объектов. Появляется зубчатость вертикальных границ при движении объектов по горизонтали. Для преодоления этого недостатка был разработан режим накопления поля, сущность которого заключается в следующем: в матрицах со строчно-кадровым переносом накопление зарядов происходит за время одного поля, а во 2-м поле накопленные заряды заземляются, как при работе электронного затвора [28]. Световая характеристика матрицы ПЗС в рабочем диапазоне освещенности линейна (рис. 5.10). Точка 1 соответствует выходному сигналу в отсутствие освещения и определяет темновой ток, обусловленный в большой степени термогенерацией неосновных носителей. Точка 2 характеризует режим насыщения элемента матрицы, т. е. полное заполнение потенциальной ямы неосновными носителями. Глубина потенциальной ямы определяется конструктивными параметрами матрицы и потенциалом накопления, значение которого ограничено напряжением пробоя МОП-конденсатора. Ðèñ. 5.10. Световая характеристика матрицы ПЗС Ðèñ. 5.11. Спектральная характеристика матрицы ПЗС
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 170 Часть II. Принципы построения твердотельных преобразователей Спектральная чувствительность глаза и ПЗС-матрицы Ðèñ. 5.12. Инфракрасный отсекающий фильтр изменяет характеристику спектральной чувствительности ПЗС-матрицы Ðèñ. 5.13. Спектральная чувствительность матричного формирователя (рис. 5.11 и 5.12) имеет подъем в длинноволновой области спектра и спад в области длин волн 0,4...0,5 мкм (кривая 1), который обусловлен сильным поглощением света на этом участке спектра нанесенными на полупроводниковую подложку поликремниевыми электродами. Для повышения чувствительности в этой области спектра в поликремниевых электродах вскрыты окна. Площадь окон составляет примерно 15...20 % от площади фоточувствительной поверхности элемента. Это подняло чувствительность матрицы на длине волны λ = 0,4 мкм до 20 % (кривая 2), что позволило использовать матрицу в цветном телевидении. Разрешающая способность определяется числом элементов накопления в матрице ПЗС. Для систем телевидения высокой четкости разработаны матрицы ПЗС с числом элементов 1035×1920. Спектральная чувствительность ПЗС-матрицы зависит от типа кремниевой подложки, но общая характеристика является результатом фотоэффекта: более длинные волны глубже проникают в кремниевую структуру ПЗС. Имеется в виду красный и инфракрасный свет (рис. 5.12). Однако воздействие электромагнитного излучения с такой длиной волны (диапазон λ > 0,7 мкм на рис. 5.11) настолько велико, что могут генерироваться электронные носители в смежных ячейках светочувствительной поверхности, которые не подвергаются воздействию данного света. В результате в изображении пропадают мелкие детали, так как заряд освещённых ячеек растекается по соседним, теряя при этом компоненты высокого разрешения и вызывая «эффект заплывания». Может быть затронута также и масковая зона (см. рис. 5.8), предназначенная лишь для временного хранения зарядов и не предназначенная для засвечивания, в результате чего могут в значительной степени возрасти шумы и вертикальный ореол. Поэтому в
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 171 усовершенствованных ПЗС-видеокамерах применяются специальные оптические инфракрасные отсекающие фильтры. Они монтируются сверху ПЗС-матрицы и ведут себя как оптические фильтры с частотой среза, соответствующей λ = 700 нм вблизи красного цвета (рис. 5.13) [28], отсекая ненужную информацию. Однако в тех случаях, когда предполагается использовать видеокамеру (черно-белую) в условиях низкой освещенности или в систему входят источники инфракрасного освещения объектов, такие фильтры не используются (чтобы не ослаблять чувствительность камер). В цветных ПЗС-камерах, напротив, нужно использовать ИК отсекающий фильтр. Типичная черно-белая ПЗС-матрица без инфракрасного фильтра может дать приемлемый уровень видеосигнала при освещенности мишени камеры в 0,01 лк. Та же камера с ИК фильтром потребует освещенность в 10 раз большую. Но в этом случае верность цветопередачи является определяющим критерием. 5.3. Цветные ПЗС-камеры Большинство цветных видеокамер в ТВ вещании имеют три ПЗСматрицы, на каждую проецируют свой компонент света. Разделение белого света на три цветовых компонента R, G, B производится специальной оптической цветоделительной призмой, устанавливаемой между объективом и ПЗС-матрицами (рис. 5.14). Цветоделительная призма — очень дорогой и точный оптический блок с дихроичными зеркалами. Такие видеокамеры, называемые трехматричными цветными камерами, более дорогие, чем одноматричные видеокамеры. Однако они имеют высокую разрешающую спо- Ðèñ. 5.14. Цветная ПЗС-камера с тремя матрицами использует светоделительную призму для разделения цветов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 172 Ðèñ. Часть II. Принципы построения твердотельных преобразователей 5.15. Фильтр полос RGB ПЗСматрицы Комплементарный (Cy, Ye, Mg, Сr) мозаичный фильтр ПЗС-матрицы Ðèñ. 5.16. собность и обеспечивают необходимые технические характеристики. В бытовых и охранных видеокамерах используются более дешевые и простые одноматричные цветные видеокамеры. Они формируют композитный цветной видеосигнал, который состоит из яркостного Y и двух цветоразностных: красного — V = R−Y и синего — U = B−Y . В одноматричных цветных ПЗС-видеокамерах цветоделение производится одним из двух методов фильтрации: 1) фильтр полос RGB, где три вертикальные пиксельные колонки (полоски) расположены рядом друг с другом: красная, зеленая, синяя и т. д. (рис. 5.15); 2) комплементарный мозаичный цветовой фильтр, где пиксели ПЗС-матрицы не чувствительны к R, G и B-цветам, а чувствительны к дополнительным (комплементарным) цветам — голубому, пурпурному, желтому и зеленому, расположенным в виде мозаики (рис. 5.16) [28]. Первый тип одноматричной цветной ПЗС-камеры дает очень хорошее цветовоспроизведение и требует простых схем. Однако такие матрицы страдают очень низкой разрешающей способностью по горизонтали, обычно около 50 % от общего числа пикселей в горизонтальном направлении матрицы. Что касается разрешения по вертикали, то оно определяется полным числом пикселей (элементов) по вертикали. Подобный тип видеокамер формирует цветные сигналы RGB. Мозаичная одноматричная ПЗС-видеокамера требует более сложной электроники и отстает по качеству цветопередачи в сравнении с RGB-моделями, но дает гораздо более высокую разрешающую способность по горизонтали (более 65 % горизонтальных пикселей). В мозаичной видеокамере эти четыре сигнала соответствующим образом обрабатываются, в результате чего получают яркостный (Y ), цветоразностные — красный (R − Y ) и синий (B − Y ) сигналы. 5.4. Электронный затвор — затвор с переменной экспозицией Использование ПЗС-матриц в видеокамерах позволило реализовать у них затвор с переменным временем экспозиции, что было не-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.17. 173 Принцип работы электронного затвора возможно в камерах на передающих трубках. Эта функция аналогична механическому обтюратору кинокамеры и может использоваться таким же образом. При включении затвор позволяет камере снимать движущиеся объекты с достаточной резкостью. Конечно, следует иметь в виду, что чем выше скорость затвора, тем меньше света попадает на ПЗС и требуется большее открытие диафрагмы. Чтобы понять работу затвора, рассмотрим кратко принцип строчного переноса зарядов. Электроны, генерируемые световым потоком, накапливаются в фотодатчике и переносятся в вертикальный регистр сдвига (см. рис. 5.6). Когда электронный затвор установлен и положение OFF (выключен) — 1/60 с (1/50 c), 1-е поле — электроны, накопленные за период одного поля, считываются в вертикальный регистр. При этом электроны, соответствующие изображению движущегося объекта, будут генерироваться, и объект получится нерезким из-за относительного падения времени накопления, уровня сигнала границ и их «размывания» в направлении движения. Нерезкость можно снизить сокращением времени накапливания электронов таким образом, что меньшее смещение объекта отражается в каждом периоде считывания с частотой кадров. Когда затвор включается, на выход ПЗС поступают только электроны, генерируемые во время открытия затвора (рис. 5.17). Электроны, генерируемые до этого момента, направляются в отводящий сток ПЗС. Чем быстрее скорость срабатывания затвора, тем короче время дискретизации (эффективной апертуры) и тем меньшее указанное за период одного поля (1/60 с), (1/50 с) указанное «размывание» тонкой пространственной структуры движущихся объектов в направлении движения. При этом электронный затвор позволяет работать ПЗС-матрице в большом динамическом диапазоне освещенностей. Видеокамеры, снабженные объективом с ав-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 174 Часть II. Принципы построения твердотельных преобразователей тодиафрагмой, работают при очень больших значениях освещенности, не используя ручной режим регулировки параметров видеокамеры. Матрицы ПЗС СП широко используются в бытовых одноматричных ТВ камерах. Камеры вещательного телевидения работают на матрицах ПЗС СКП, обладающих более высокими светотехническими параметрами. В заключение следует отметить, что видеокамеры на ПЗС-матрицах более чувствительны к радиационному облучению (воздействию), чем камеры на ЭЛТ. Поэтому видеокамеры на ЭЛТ и приборах незаменимы в зонах наблюдения и охраны в условиях сильной радиации. 5.5. ПЗС-матрица как устройство дискретизации ПЗС-матрица является двумерной, состоящей из элементов изображения (пикселей). Разрешающая способность такой матрицы зависит от числа пикселей. Структура матрицы ПЗС является дискретной как по горизонтали, так и по вертикали, т. е. отсутствует непрерывность видеосигнала по горизонтали: сигнал во времени является дискретным. Изображение (видеосигнал) горизонтальной линии, формируемое видеокамерой с передающей трубкой в результате непрерывного сканирования электронным лучом вдоль строки, является непрерывным. В ПЗС-матрице такое изображение формируется последовательностью дискретных пикселей и состоит из дискретных значений, соответствующих каждому пикселю в пределах данной строки. Таким образом, ПЗС-матрица — это оптическое устройство с пространственной дискретизацией в пределах внутрикадрового пространства (рис. 5.18). Как и в случае других устройств дискретизации, мы не получаем полную информацию по каждой строке, только дискретные значения в позициях, соответствующих позициям пикселей. Отечественный и зарубежный учёные, Котельников и Найквист, показали, что сигнал может быть реконструирован без потери информации, если частота дискретизации равна, по меньшей мере, двойной ширине спектра сигнала. При этом значения сигнала между дискретными отсчётами сигнала учитывать не обязательно. Это важная теорема, доказанная и используемая во многих электронных устройствах дискретизации, CD-аудио, видео и др. Частота дискретизации, эквивалентная удвоенной ширине спектра, называется частотой Котельникова или Найквиста. Есть, однако, и нежелательный побочный продукт ПЗС-дискретизации. Это хорошо известная муаровая картина, которая получается в случаях, когда формируется сигнал от объекта с излишне высоким разрешением и шириной спектра по направлению в пределах внутрикадрового пространства. Обычно это хорошо видно, например, если
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.18. 175 ПЗС-матрица как устройство дискретизации диктор, ведущий программу новостей, наденет рубаху с очень мелким узором. Математически это соответствует случаю, когда максимальная частота приближается к частоте дискретизации. Поскольку пространственная частота дискретизации по любому направлению должна быть в два раза больше максимальной частоты оптического изображения Fs max , то можно представить ее в частотной области одним значением частоты в области частоты Найквиста FNYQUIST . Пространственный спектр оптического сигнала основной полосы частот будет модулироваться в окрестностях этой частоты, что очень похоже на амплитудную модуляцию спектра боковых полос. Если в оптическом изображении, спроецированном на ПЗС-матрицу, присутствуют высокие частоты и эти частоты выше половины частоты FNYQUIST , то боковые полосы (после дискретизации) побочных лепестков спектра сигнала наложатся на видимую основную полосу и в результате возникнут нежелательные искажения ТВ изображений, муар. Муаровая частота ниже самой высокой частоты видеокамеры [28] FNYQUIST /2 − Fs max . Чтобы минимизировать этот эффект применяется НЧ оптическая фильтрация (low-pass optical filtering, LPO).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 176 Часть II. Принципы построения твердотельных преобразователей Фильтры обычно составляют часть стеклянной маски ПЗС-матрицы и формируются комбинированием нескольких двояко преломляющих кварцевых пластин. Эффект их действия аналогичен пространственному «размыванию» (blurring) мелких деталей оптического изображения. 5.6. Видеокамеры на фоточувствительных КМОП-матрицах Технология производства ПЗС-матриц к настоящему времени доведена до совершенства. Однако им присущи недостатки: • низкий процент выхода годных матриц; • необходимость осуществления в пределах пространства матриц переносов зарядовых пакетов; • значительные потери зарядовых пакетов в процессе переносов. Чем дальше переносятся зарядовый пакет, тем больше потерь, что приводит к интегральным искажениям и снижению контраста мелких деталей изображения. Причём контраст таких деталей неравномерен как по кадру, так и по строке: в начале кадра (строки) потерь больше, в конце меньше. Эффективность переноса зависит от количества переносов и скорости переноса (частоты переноса). Например, для ПЗС типа ICX415AL фирмы SONY эффективность одного переноса Э1 = 0,9995 при fпер = 29, 5 МГц [107]. При количестве пикселей по горизонтали N = 782 и 3-фазном горизонтальном регистре максимальное число переносов составит Nпер = 2346. Эффективность всех переносов составит Э2346 = 0,309, т. е. до выходного каскада дойдет только 31 % электронов. Разница в размахе видеосигнала между крайними левым и правым пикселями составит 100 − 31 = 69 % (более, чем в 3 раза). Кроме того, особенностью технологии ПЗС является многоуровневая технология, которая не позволяет совместить на одном кристалле ПЗС и транзисторы [108]. Подлинной революцией в ТВ явилось создание фоточувствительных КМОП-матриц, которые оказались перспективнее ПЗС-матриц, так как свободны от перечисленных выше недостатков. Принципиальное отличие этих приборов от ПЗС состоит в методе реализации разверток. Координация адресации доступа к каждому элементу вместо протаскивания заряда каждого элемента сначала по всему столбцу, а потом по всей строке позволяет избежать искажений, связанных с неэффективностью переноса заряда. Телекамеры на КМОП-матрицах объединяют в себе фотоприемник, устройства разверток, квантования и обработки сигналов изображения. КМОП-фотоприемники в будущем могут вытеснить не только вакуумные приборы усиления слабых оптических сигналов (ЭОП), но и ПЗС. Новая технология соз-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.19. 177 КМОП-матрица с пассивным пикселем дания КМОП-фотоприемников открыли перспективу заметного повышения качества формируемых ТВ сигналов благодаря возможности многоканального считывания (в пределе с применением отдельного АЦП для каждого элемента разложения) и введения усиления до воздействия шумов считывания. БИС КМОП-матрицы имеют достаточно простую структуру, степень их интеграции превышает 109 транзисторов на одном кристалле, хотя технология изготовления матрицы является сложной. Упрощенная схема фоточувствительной матрицы на КМОП-транзисторах приведена на рис. 5.19 [107]. Данная БИС содержит матрицу светочувствительных фотодиодных (ФД) сенсоров, электронных ключей, генераторов вертикальной развертки (регистр) и горизонтальной развертки (регистр). При освещении матрицы в каждом ФД образуются заряды, количество которых пропорционально освещенности ФД и времени накопления зарядов. В результате на матрице ФД образуется потенциальный рельеф. Ключи КГ1 , КГ2 ,. . . по очереди подключают горизонтальные ряды ФД к вертикальным шинам. Ключи горизонтальной развертки КВ по очереди подключают вертикальные шины к выходной шине на вход усилителя, который преобразует заряды в видеосигнал. Особенностью КМОП-матрицы с пассивным сенсором является то, что шины обладают емкостью, сравнимой с емкостью сенсора ФД. Поэтому при считывании около 50 % заряда на
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 178 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 5.20. КМОП-сенсор с активным пикселем и активным столбцом емкости ФД остается не использованным, т. е. теряется. Этот остаточный потенциал является помехой при следующей его подзарядке, особенно заметной при движении объекта. При передаче движения относительно контрастных объектов в данном случае могут возникать тянущиеся их продолжения. По этой причине рассмотренные КМОП-матрицы с пассивным пикселем не нашли применения. Для исключения влияния паразитной емкости стали использовать усилители для каждого фоточувствительного элемента (ФД), получившего название КМОП-сенсор с активным пикселем и активным столбцом (рис. 5.20). В результате емкость ФД и емкость вертикальной шины оказались разделенными усилителем. Применение активного усилителя (докоммуникационного усиления) позволяет добиться коэффициента преобразования на порядок больше, чем у ПЗС (до 250 мкВ/элем.), что значительно повышает отношение сигнал/шум. Тенденцией развития современной ТВ техники является полный переход на цифровую технику формирования и обработки сигналов. Поэтому следующим шагом на этом пути была реализация аналогоцифрового преобразователя (АЦП) на этом же кристалле. Сформированный фотоматрицей КМОП аналоговый сигнал подается на размещенный на выходе этого же кристалла БИС АЦП. Частота дискретизации сигнала равна стандартной 13,5 МГц. Цифровой поток, соответствующий сигналу яркости, с выхода 10-разрядного АЦП равен
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения Ðèñ. 5.21. 179 КМОП-сенсор с активным пикселем и АЦП на каждый столбец 135 Мбит/с. Для снижения тепловых потерь преобразования стали ставить АЦП на каждый столбец (рис. 5.21). Это позволило существенно снизить рассеиваемую АЦП мощность и частоту преобразования каждого из АЦП в число раз, равное числу столбцов в фотосекции. Имеются также варианты КМОП-матриц с установленным АЦП в каждом пикселе, что существенно снижает площадь светочувствительного элемента и тем самым чувствительность матрицы. Однако рассеиваемая мощность здесь существенно уменьшается. Типовая структура современного КМОП-сенсора с АЦП на выходе показана на рис. 5.22. Фотодиодная матрица с усилителями и КМОП-ключами управляется регистром вертикальной развертки. Видеосигнал со всех пикселей строки поступает на столбцовые усилители и, при необходимости, обрабатывается схемой двойной коррелированной выборки (ДКВ). Далее сигнал при помощи сдвигающего регистра (мультиплексора) горизонтальной развертки подается на видеопроцессор и встроенный АЦП. Оцифрованный видеосигнал обрабатывается цифровым процессором, в котором могут быть осуществлены гамма-коррекция, апертурная коррекция, баланс белого и черного, формирование цветоделенных или яркостного и цветоразностных сигналов и т. п. Могут присутствовать выходные ЦАП, формирующие аналоговый выходной сигнал или же кодер системы NTSC или PAL. Большинство сенсоров
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 180 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 5.22. Типовая структура КМОП-сенсора с активным пикселем, активным столбцом, аналоговым и цифровым процессором формируют выходной видеосигнал в цифровой форме. Внешнее управление матрицей осуществляется при помощи интерфейса — I2 C, SPI и т. д. При помощи интерфейса даются такие параметры, как размер окна считывания, коэффициент усиления видеопроцессора, время накопления, значение гамма-характеристики и т. п. Управление всеми узлами сенсора осуществляется от блока управления. В состав КМОП-сенсора могут входить оперативные и постоянные запоминающие устройства (ЗУ), необходимые, например, для коррекции дефектных пикселей. Таким образом, развитие технологии КМОП-сенсоров привело к созданию однокристальной цифровой ТВ камеры, реализующей функции цифровой и аналоговой обработки. 5.6.1. Разрешающая способность, квантовая эффективность, чувствительность и освещенность Рассмотрим основные характеристики КМОП-камеры. Разрешающая способность фотоприемника определяется числом светочувствительных элементов и их геометрическими размерами. В отличие от технологии ПЗС, КМОП-технология позволяет достаточно простыми средствами организовать фотоприемник, содержащий очень большое число пикселей — десятки миллионов. При таком большом количестве элементов в ПЗС возрастает вероятность появления дефектов в матрице, что приводит к неработоспособности всего преобразователя в целом. В КМОП-сенсоре такой дефект вызовет поражение одного единственного пикселя, значение видеосигнала
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 181 которого может быть интерполировано по соседним элементам непосредственно в самом сенсоре (например, в ДКВ). Тем самым, выход годных приборов, выполненных по КМОП-технологии, существенно выше, чем в ПЗС-технологии. Одной из важнейших характеристик видеокамеры является параметр, описывающий способность фотопреобразователя переводить падающие на фотомишень фотоны в электрический ток. Этим параметром является квантовая эффективность или чувствительность камеры. Чувствительность фотоприемника определяется коэффициентом сбора светового потока, квантовой эффективностью и собственными шумами. Наличие большого числа транзисторов в каждом пикселе приводит к снижению коэффициента использования светового потока в КМОП-сенсорах, однако применение хорошо отработанной технологии изготовления микролинз, расположенных над фотодиодами (on-chip microlenses), позволяет добиться очень высоких значений коэффициента сбора, около 100 % (см. рис. 5.9). Под квантовой эффективностью понимается отношение числа зарегистрированных зарядов к числу попавших на кристалл фотонов. По квантовой эффективности ПЗС- и КМОП-матрицы не имеют себе равных. Для сравнения квантовый выход для глаза равен 1 %, у ПЗС этот параметр может принимать значение от 4 % (низкокачественные) до 50 % и выше (типовая видеокамера), в КМОП-матрицах — до 100 %. Использование оптимизированных структур современных фотодиодов в качестве светочувствительных элементов максимизирует квантовую эффективность, а наличие встроенного в пиксель активного усилителя позволяет достичь меньшего уровня шумов, чем в ПЗСструктурах [107]. Следует также отметить, что в КМОП-сенсорах с активным усилителем (пикселем) коэффициент преобразования заряда в напряжение составляет сотни мкВ/элемент, а в ПЗС — десятки мкВ/элемент [107]. Чувствительность и квантовая эффективность линейно зависимы. Квантовая эффективность связывает количество падающих и зарегистрированных фотонов, а чувствительность определяется в электрических единицах. На практике под чувствительностью понимают минимальную освещенность на объекте (scene illumination), при которой можно различить переход от черного к белому, или минимальную освещенность на матрице (image illumination). С практической точки зрения более удобно было бы указывать минимальную освещенность на матрице, а далее определять освещенность на объекте (см. п. 1.2). В технических данных описания
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 182 Часть II. Принципы построения твердотельных преобразователей видеокамер чувствительность указывается в люксах, а далее легко рассчитывается освещенность объекта (п. 1.2). Очень часто используется упрощенная формула (1.27), связывающая освещенность на объекте и на матрице: τ Ö2 , 4 где Eф = Eматр = EПЗС и Eоб — освещенность матрицы ПЗС-датчика и объекта; τ — коэффициент светопропускания объектива; Ö — относительное отверстие объектива; ρ — коэффициент отражения объекта. Значения Eматр и Eоб различаются примерно на порядок. Чувствительность бывает так же болометрическая (суммарная по всему спектру) и монохроматическая (измеренная в определенном спектральном диапазоне). В некоторых видеокамерах чувствительность в инфракрасной области даже выше, чем в видимой. Эти камеры предназначены для работы с инфракрасными прожекторами и приближаются по отдельным параметрам к приборам ночного видения. Ложные сигналы, возникающие в процессе фотопреобразования и считывания, в КМОП-сенсорах связаны с темновым током и разбросом чувствительности. Наличие схем усиления и обработки приводит к тому, что тепло выделяется в том месте, где накапливаются фотоэлектроны, что вызывает рост темнового тока, проявляющегося в виде вертикальной структуры, особенно на черном фоне при малой освещенности. Было определено, что именно геометрический шум, а не флуктуационный является главным фактором, ограничивающим чувствительность КМОП фотоприемников. Данное ограничение носит технологический характер и будет преодолено по мере совершенствования технологии. Динамический диапазон КМОП-сенсоров определяется максимальным зарядовым пакетом, накопленным в светочувствительном элементе, и шумами считывания или же геометрическим шумом. В настоящее время реализованы КМОП-сенсоры с логарифмической шкалой зависимости выходного сигнала от освещенности, динамический диапазон которых не менее 132 дБ. Эксплуатационные характеристики КМОП существенно лучше, чем у матричных ПЗС. Выход годных матриц при использовании технологий КМОП значительно выше, чем при использовании ПЗС-технологий. Этим объясняется малая стоимость КМОП-сенсоров по сравнению с матричными ПЗС, особенно при большой площади кристалла. В отличие от ПЗС, которым требуется несколько достаточно высоких питающих напряжений, для КМОП требуется одно питающее Eф = EПЗС = ρEоб
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 183 напряжение — +5 или даже +3 вольта. Потребляемая мощность также оказывается значительно меньшей, чем для камеры на матрице ПЗС. Габариты и масса для КМОП-сенсоров также во много раз меньше, чем для ПЗС-камер, что объясняется интеграцией всех основных узлов камеры на одном кристалле. Для камеры на ПЗС требуется, по крайней мере, две–три дополнительные микросхемы плюс большое число дополнительных элементов. Благодаря этому КМОП-сенсоры широко используются в мобильных телефонах. Цифровые структуры КМОП-сенсоров хорошо согласуются с IP-технологиями, в настоящее время целый ряд фирм выпускает камеры на основе КМОПтехнологии для построения видеосетей [109]. Новые функциональные возможности КМОП-сенсоров связаны с возможностью адаптации к изменениям не только освещенности, но и других свойств — динамике наблюдаемых объектов и их числу. Так, при уменьшении временных размеров фрагмента в соответствующее число раз возрастает кадровая частота [107]. В видеокамере при видеозаписи КМОП-сенсор может работать в чересстрочном режиме, а при считывании — в прогрессивном. Новая технология формирования цветного изображения Foveon, основанная на различной глубине проникновения видимого излучения в глубину кремния, позволяет избавиться от кодирующих светофильтров или призм. Так, фотоны синего излучения поглощаются в поверхностном слое, зеленого излучения — глубже, а красного в глубине кремния [107]. В КМОП-сенсоре три фотодиода (R, G и B) располагаются друг над другом и, тем самым, осуществляют цветоделение. Каждый из фотодиодов поглощает свою часть спектрального диапазона. Технология Foveon обеспечивает 100%-ное использование светового потока, так как каждый из фотонов видимого диапазона поглощается в одном из фотодиодов, а также полную разрешающую способность в красном, зеленом и синем участках спектра [110]. В КМОП сенсорах, как и в ПЗС, может быть реализован режим электронного затвора (см. п. 5.4) для улучшения качества передачи динамических изображений. В настоящее время перечень областей, где КМОП-сенсоры находят применение, стремительно растет: мобильные телефоны, цифровые фотоаппараты, видеокамеры, системы видеонаблюдения и т. д. Также необходимо учитывать, что КМОП-видеокамеры быстро эволюционируют в сторону видеосистем на кристалле, в котором осуществляется комплексная обработка видеоинформации — кодирование источника и кодирование канала — непосредственно на том же кристалле, на котором расположен фотоприемный массив элементов. На пороге появление видеосистем на кристалле, объединяющих фотоматрицу большого формата (телевидение высокой четкости — ТВЧ)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 184 Часть II. Принципы построения твердотельных преобразователей и кодер источника (MPEG-2, MPEG-4 и другие перспективные стандарты сжатия в будущем). 5.6.2. Адаптация в твердотельных камерах Задачей адаптации в телевидении было обеспечение максимального качества видеоинформации в условиях как можно большей априорной неопределенности в уровне освещения сюжета или достижения как можно большего динамического диапазона сигналов. Для сравнения, динамический диапазон чувствительности зрительного анализатора человека составляет не менее восьми порядков (от 105 до 10−3 ...10−4 лк). Самым первым шагом адаптации в телевидении была реализация АРУ видеотракта. Следующим шагом адаптации является обмен чувствительности КМОП-сенсора на время накопления и обмен разрешающей способности по полю и по времени на чувствительность [107]. Группирование зарядовых пакетов, позволяющее увеличивать отношение сигнал/шум при потере разрешающей способности, реализует принцип минимума информации при заданном её качестве — количество отсчетов сокращается до тех пор, пока получатель удовлетворен качеством видеоинформации. Этот режим получил название Electronic sensitivity enhancer (ESE) и обеспечивал увеличение времени накопления от 1 до 32 ТВ полей, т. е. с 1/50 до 0,64 с, что привело к улучшению чувствительности √ до 32 раз (сигнал возрастает в 32 раза, отношение сигнал/шум в 32 = 5,6 раза). Видеокамеры с режимом ESE выпускают все ведущие производители ТВ оборудования с чувствительностью 0,0002 лк при отношении сигнал/шум 20 дБ. Так, группирование сигналов соседних, эквивалентного уровня, десяти элементов может приводить к почти десятикратному увеличению сигнала при снижении разрешающей способности. Следующим вариантом адаптированного накопления является суммирование сигналов цветности (R, G и B) в цветных ТВ камерах при снижении освещенности сцены ниже определенного порога. Этим достигается четырехкратное повышение чувствительности ценой потери информации о цвете. Выигрыш в чувствительности ТВ камер при переходе в ночной черно-белый режим может составлять около 10 раз при исключении из оптической схемы отсекающего ИК фильтра (рис. 5.13), однако цветопередача в дневных условиях при этом ухудшается. Заслуживает внимание метод адаптации, реализованный в камерах Super Dunamic. В них используется специальная матрица ПЗС с двумя ячейками памяти на каждый накопительный фотодиод. Одна из ячеек памяти используется для хранения и считывания сигналов, сформированных при большом времени накопления, другая при малом. Удвоение частоты считывания регистров обеспечивает стан-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 185 дартную длительность видеосигнала одного поля при наличии в нем «короткого» и «длинного» компонентов, чередующихся через строку. Демультиплексирование и цифровая обработка этих сигналов обеспечивают преобразование характеристики «свет-сигнал» камеры к логарифмическому виду. В результате мгновенный динамический диапазон ТВ камеры Syper Dinamic превышает этот параметр обычных камер в 20. . . 40 раз. В КМОП-телекамерах динамический диапазон за счет использования этого метода уже превышает миллион. Особое место в ряду адаптивных систем занимает системы адаптации параметров разложения (автоматического изменения числа группируемых зарядовых пакетов) при адаптации ТВ системы к этапам наблюдения, т. е. при переходе от обнаружения объектов к оцениванию их координат [107]. Это делает КМОП-видеокамеру аналогично зрительному анализатору адаптивной не только к сюжету, но и к этапам наблюдения: на первом этапе наблюдения максимизируется чувствительность системы, на втором — точность оценки параметров обнаруженных объектов. 5.6.3. Твердотельные видеокамеры инфракрасного диапазона Матрицы ИК диапазона используют те же принципы развертки, что и матрицы видимого диапазона. Основное отличие матриц ИК диапазона — требуется охлаждение фотоприемника для снижения тепловых шумов, играющих первостепенную роль. Современные криогенно охлаждаемые матричные приемники могут обладать ёмкостью элемента до 106 ...107 электронов, квантовым выходом 80...99,9 % и собственным шумом считывания 1. . . 20 электронов на элемент. Качественный скачок в характеристиках ИК камер обусловлен как наращиванием числа элементов в криогенно охлаждаемых фотоматрицах, так и освоением неохлаждаемых матричных приборов с чувствительными элементами на основе микроболометров. В качестве материалов для микроболометров используются модификации окислов ванадия Vx Oy , поликристаллический и аморфный кремний. Важнейшей характеристикой фотоприемника ИК диапазона является зависимость его чувствительности от длины волны излучения. Принцип работы неохлаждаемого микроболометра заключается в изменении сопротивления материала при поглощении ИК излучения. Основные характеристики такой КМОП-матрицы следующие: • число элементов разложения 320×240; • светочувствительная площадь 14,4×10,8 мм2 ; • шаг между элементами 45 мкм; • частота считывания до 5 МГц (кадровая частота 65 Гц). Матричные ИК приборы во многих приложениях вытесняют сканирующие приборы. Для длин волн не более 14 мкм и тепловой
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 186 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 5.23. Микроболометрическая матрица для дальнего ИК диапазона температуре фотоприемника менее 300 К шум квантовой структуры внешнего фона больше тепловых шумов приемника. Это означает, что накопление сигналов во времени должно привести к увеличению отношения сигнал/шум пропорционально квадратному корню из отношения времени накопления. Так, матричные ИК фотоприемники, имеющие 104 элементов, обеспечивают отношение сигнал/шум на два порядка больше, чем сканирующие одноэлементные и на порядок больше, чем сканирующие строчные фотоприемники. Поэтому выбор типа развертки, так же, как и в ТВ системах видимого диапазона, осуществляется согласно «золотому» правилу малокадрового телевидения: если нужны широкий угол зрения и большая разрешающая способность на местности, то следует применить сканирующую систему (строчную или одноэлементную), если нужна высокая слитность воспроизведения движения объектов, то следует применить систему с кадровым накоплением. Достигаемый с помощью сканирующих одноэлементных систем выигрыш в амплитуде отклика от точечной цели примерно в два раза (нет потери на неинвариантность к сдвигу) не может компенсировать проигрыша из-за уменьшения времени накопления. Это означает, что матричные фотоприемники наилучшим образом осуществляют согласование источника сигнала с получателем,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 187 считая фотоны группами. Следует говорить не о борьбе с «недостатками» матричного фотоприёма, а о минимизации информационного риска в ходе извлечения информации о полезном сигнале из входного потока фотонов системой на матричных фотоприемниках. Пример построения такой матрицы ИК диапазона показан на рис. 5.23. 5.6.4. Сравнительная оценка работы ПЗСи КМОП-матриц В истории телевидения следует выделить три главных периода, сменивших друг друга постепенно, толчком к которым были революционные изобретения, обеспечивающие преодоление крупных технологических барьеров. Первый период развития телевидения характеризуется реализацией одного из важнейших принципов телевидения — развертки с помощью механического сканирования. Второй период — эпоха электронного телевидения, начавшийся с изобретения (С.И. Катаевым) и изготовления (В.К. Зворыкиным) электронно-лучевой передающей трубки — иконоскопа. Принципиально новый — третий период развития телевидения связан с рождением твердотельного телевидения (ПЗС- и КМОПсенсоры, жидкокристаллические и плазменные панели). Приборы с зарядовой связью — ПЗС (изобретены в 1970 г.), пришедшие на смену ЭЛТ, знаменуют первый этап твердотельного телевидения. В настоящее время электронно-лучевые трубки почти полностью уступили место твердотельным преобразователям «светсигнал» и «сигнал-свет». Остались небольшие «островки» в области инфракрасной (ИК) техники и в области разработки аппаратуры, устойчивой к интенсивной радиации. Наглядным примером переходного периода служит борьба кинескопов с новым ЖК и плазменными устройствами отображения видеоинформации. Прикладное телевидение, став твердотельным, по-настоящему внедрилось в нашу жизнь (быт, производство, медицину, науку и т. д.). Второй этап твердотельной революции связан с переходом от фотоприёмников на ПЗС- к КМОП-фотоприёмникам. Принципиальное отличие этих приборов от ПЗС состоит в методе реализации развертки. Координатная адресация, как и в ЭЛТ, к каждому элементу вместо протаскивания заряда каждого элемента сначала ко всему столбцу, а потом ко всей строке позволяет избежать искажений, связанных с неэффективностью переноса зарядов. Совершенствование технологии изготовления КМОП-фотоприёмников позволило выпускать приборы высокой чёткости — с числом элементов в десятки мегапикселей. Новая технология создания КМОП фотоприёмников открыла перспективу повышения качества формируемых ТВ сигналов благодаря многоканальному считыванию-преобразованию (в пределе — с применением
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 188 Часть II. Принципы построения твердотельных преобразователей АЦП для каждого пикселя) и введение усиления до воздействия шумов считывания. Это, по-видимому, позволит в ближайшем будущем вытеснить из практики телевидения не только ЭОП, но и ПЗС. Применение КМОП технологии к реализации матричных фотоприёмников породило новую ветвь твердотельных устройств, объединяющих в себе фотоприёмник, устройства разверток, дискретизации, квантования и обработки изображения, которые названы видеосистемами на кристалле [107]. Стремительный рост объёмов продаж твердотельных камер для охранной индустрии и цифровых фотоаппаратов, мобильных телефонов со встроенными цифровыми фотоаппаратами сделал телевидение массовым не только в смысле приёма, но и передачи изображений. После матриц вещательного формата (около 0,5 мегапикселей) телевидение быстро преодолело многомегапиксельный барьер (5, 10, 22, 39 и даже 160 мегапикселями). Также большие видеоинформационные массивы от фотоматриц (при 16-разрядном АЦП: 160 мегапикселей — это уже 2,5 Гбит/кадр) заостряют вопрос об эффективном кодировании (сжатии) сигналов изображения при их передаче и о создании однокристальных кодеров для цифрового телевидения (ТВЧ и ПТВ) [107]. КМОП-фотоприёмники по сравнению с ПЗС дешевле и позволяют интегрировать на одном кристалле с ним ряд других элементов (АЦП и интерфейсы каналов связи) [107]. Характерной особенностью начала второго этапа твердотельной революции в телевидении является одновременное присутствие на рынке видеокамер на ПЗС- и КМОП-матрицах при тенденции вытеснения ПЗС. Следующим шагом в развитии КМОП-сенсоров была идея объединения светочувствительной секции и управляющих регистров. Однако ёмкость шин считывания оставалась высокой, что не позволяло говорить о высоких чувствительности и отношении сигнал/шум. Введение усилительного каскада в каждый светочувствительный элемент позволило снизить геометрический шум и повысить чувствительность. Таким образом, ёмкость фотодиода (считывания) и ёмкость шин оказываются разделенными этим усилителем. Применение докоммутационного усиления позволило добиться эквивалентного коэффициента преобразования на порядок больше, чем у ПЗС — до 250 мкВ/элемент. Следующим шагом на пути развития КМОП технологии была реализация АЦП на том же кристалле. Однако использование одного АЦП на выходе кристалла приводит к широкой полосе частот видеосигнала, а большая частота преобразования АЦП — к большому выделению тепловой мощности.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 5. Фотоэлектрические преобразователи изображения 189 Для преодоления этого недостатка стали располагать один АЦП на каждый столбец. Это позволило снизить частоту преобразования АЦП в число раз, равное числу столбцов в секции (см. рис. 5.21). В современных матричных ПЗС увеличение частоты переноса зарядов приводит к повышению неэффективности преобразования, увеличению потребляемой мощности. В КМОП- сенсорах частота опроса пикселей в 50 МГц является типичной, а в лучших образцах превышает 100 МГц. Распараллеливание выходов в КМОП-матрицах реализуется даже проще, чем в ПЗС и достижение высоких кадровых частот является более простой задачей (1 кГц и более) [107]. Одной из новых особенностей видеосистем на кристалле является возможность более простой реализации разнообразных алгоритмов считывания. Так называемая развертка z-сканирования позволяет проводить пространственное усреднение групп элементов 2×2, 4×4, 8×8 без применения дополнительных ЗУ. Потенциальная чувствительность видеокамер на КМОП-сенсорах выше, чем у ПЗС не только благодаря докоммутационному усилению, но и потому, что в КМОП удаётся реализовать многоканальное считывание с увеличением числа каналов от одного до числа столбцов и даже до числа элементов в матрице. Это позволяет резко сократить полосу частот в каждом парциальном канале считывания и уменьшить влияние собственных шумов преобразователя. Контрольные вопросы 1. Принцип работы ПЗС. 2. Считывание потенциального рельефа ПЗС. 3. Повышение чувствительности (эффективности использования светового потока) ПЗС. 4. Спектральная характеристика ПЗС. 5. Световая характеристика ПЗС. 6. Способы цветоделения в матричных ПЗС. 7. Назначение и работа электронного затвора видеокамеры на ПЗС. 8. Достоинства и недостатки видеокамер на ПЗС по сравнению с камерами на ЭЛТ. 9. Устройство и принцип работы КМОП-фотоматриц. 10. Проведите сравнение основных характеристик фотоприемников на ПЗС- и КМОП-матрицах. 11. Почему разрешающая способность на КМОП-матрицах выше, чем на ПЗС? 12. Перечислите области использования КМОП-сенсоров. 13. Способы цветоделения в КМОП-фотоматрицах. 14. Принцип работы ИК КМОП-матриц. 15. Почему неравномерность сигнала в ПЗС-матрицах значительно выше, чем в КМОП-сенсорах?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 6 ПРЕОБРАЗОВАТЕЛИ «СИГНАЛ-СВЕТ» 6.1. Жидкокристаллические экраны С момента появления электронного телевидения основным элементом, осуществляющим развертку, был электронный луч, а само изображение воспроизводилось на экране кинескопа. Максимальный угол отклонения электронного луча в кинескопе равен 110◦ , в связи с чем увеличение размеров изображения приводило к значительному увеличению габаритов воспроизводящего устройства — телевизора или монитора. Поэтому в течение многих лет и в настоящее время идут упорные поиски идей и конструкций, позволяющих наблюдать изображение на плоском экране воспроизводящего устройства, что позволяло найти практическую реализацию воспроизводящих устройств на жидких кристаллах и плоских плазменных экранах. Жидкокристаллические мониторы в настоящее время нашли самое широкое использования в прикладном телевидении. Принцип действия ЖК экранов (ЖКЭ) отличается от принципа работы ЭЛТ. Изображение формируется здесь не электронным лучом, а адресацией ЖК ячеек, которые поляризуются в различных направлениях, когда к их электродам прикладывается напряжение. Напряжение определяет угол поляризации, что, в свою очередь, определяет прозрачность каждого пикселя, формируя, таким образом, элементы видеоизображения. Использование поляризации для модуляции светового потока при создании преобразователей «сигнал-свет» было предложено С.И. Катаевым и Ю.С. Волковым в сентябре 1931 г. [144]. 6.1.1. Устройство и принцип работы жидкокристаллических воспроизводящих устройств Жидкокристаллические экраны относятся к разряду так называемых светоклапанных устройств, в которых функции излучения и модуляции светового потока разделены. В этих устройствах ТВ сигнал воздействует на пространственный модулятор света (ПМС), модулирующий световой поток от внешнего источника по поверхности всего ТВ изображения. В ПМС под действием модулирующего ТВ сигнала меняется прозрачность или коэффициент отражения модулирующей
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 191 Глава 6. Преобразователи «сигнал-свет» среды, в результате чего ПМС становится носителем промежуточного изображения (аналогичного по своим оптическим свойствам изображению диапозитива). При этом световой поток, проходящий через ПМС, изменяется по интенсивности в соответствии с распределением плотностей отдельных участков (пикселей ПМС). Работа жидкокристаллических экранов основана на явлении поляризации светового потока. Известно, что поляроиды осуществляют деление изображения поляризацией световых пучков во взаимно перпендикулярных плоскостях. Поляроид пропускает без ослабления только ту составляющую света, вектор электромагнитной индукции которой лежит в плоскости, параллельной оптической плоскости поляризатора. Для оставшейся части светового потока поляроид будет не прозрачным. Данный эффект называется поляризацией света. Два скрещенных (ортогональных) поляризатора, помещенные на пути светового потока, полностью непрозрачны для света. Открытие свойств жидких кристаллов изменять угол поляризации света под действием электростатического или электромагнитного поля позволили создать электронно-оптический модулятор света, степень прозрачности которого меняется под действием приложенного напряжения. Основными элементами модулятора света являются два скрещенных поляризатора и помещенная между ними жидкокристаллическая ячейка, угол поворота плоскости поляризации которой может регулироваться. Прозрачность электронно-оптического модулятора изменяется при изменении угла поворота плоскости поляризации (рис. 6.1) [5]. Принцип работы и конструкцию жидкокристаллического экрана поясняет рис. 6.2. Экран состоит из нескольких слоев, основными из которых являются две стеклянные пластины 3, на которых нанесены полосковые электроды 2. Две пластины соединяются, оставляя Конструкция ЖК электронно-оптического модулятора света: 1 — поляризатор; 2 — полосковые электроды; 3 — стеклянные пластины; 4 — жидкий кристалл; 5 — фильтры R, G, B; 6 — анализатор-поляризатор Ðèñ. 6.2. Зависимость интенсивности света на выходе электронно-оптического модулятора от угла поворота плоскости поляризации Ðèñ. 6.1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 192 Часть II. Принципы построения твердотельных преобразователей зазор, который заполняется жидким кристаллом 4. Полосковые решетки пластин скрещены. В точках пересечения полосковых электродов образуются элементарные конденсаторы, напряжение на которых определяет угол поворота поляризации, а следовательно, и прозрачность элементарной ячейки. С внешней стороны стеклянных пластин располагаются поляризационные фильтры 1, 6, векторы поляризации которых ортогональны. При подаче потенциала на некоторую пару полосковых электродов активизируется ячейка, на которой вертикальные и горизонтальные электроды пересекаются. Коммутация потенциалов осуществляется по закону развертки, используемой в телевидении и компьютерах. Схема строчной развертки переключает с тактовой частотой импульсы — отсчеты видеосигнала с одного вертикального электрода на другой. Схема кадровой развертки осуществляет перекоммутацию горизонтальных электродов. Принцип работы разверток для ЖК экрана и подачи сигналов UR , UB , UG на горизонтальные электроды показан на рис. 6.3, а в практических схемах сигнал подаётся на вертикальные шины (более подробно см. рис. 6.8). Для воспроизведения цветного изображения ЖК панель покрывают цветными RGB-светофильтрами, размеры и форма которых соответствуют размерам модулирующей ячейки. ЖК экраны плоских телевизоров и мониторов работают на просвет. Поэтому обязательным компонентом ЖК экрана является лампа задней подсветки. Для сокращения габаритов лампа помещается на боковой части экрана, а напротив нее — отражающее зеркало. Необходимым требованием к световому потоку, входящему в ЖК ячейку, является его малая расходимость, так как расходящийся световой поток скрещенными поляризаторами задерживается не полностью. Появляется эффект просачивания, т. е. фоновая засветка, снижающая контрастность воспроизводимого изображения. Необходимость направленного светового излучения ведет к тому, что изображение на ЖК экране воспринимается с номинальной яркостью в узком угловом интервале (10...15◦ относительно нормали к экрану). Отклонение от заданных углов наблюдения ведет к существенному уменьшению яркости экрана. Модуляционная характеристика ЖК ячейки (см. рис. 6.1) существенно нелинейна, что заметно уменьшает число воспроизводимых градаций яркости. Поэтому видеосигнал перед подачей на ЖК ячейку необходимо подвергнуть нелинейной обработке, корректирующей форму модуляционной характеристики ячейки. Форма модуляционной характеристики при соответствующей конструкции ЖК экрана может быть и обратной: при α = 0 прозрачность экрана будет максимальна, а при α = 90◦ — минимальна. Устройство и принцип работы ЖК модулятора наглядно показаны на рис. 6.4. Молекулы ЖК материала обладают дипольным мо-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» Ðèñ. 6.3. Принцип работы экрана на жидких кристаллах Ðèñ. 6.4. Принцип работы ЖК экрана 193
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 194 Часть II. Принципы построения твердотельных преобразователей ментом. Взаимодействие электрических полей диполей образуют спиралевидную структуру из молекул ЖК материала. Слои ориентирующего покрытия на верхней и нижней подложках при взаимодействии с дипольной структурой жидких кристаллов обеспечивают в отсутствие электрического поля закрутку спирали на 90◦ . Этот слой ЖК (LCD) обладает свойством поляризации проходящего светового потока. Векторы плоскостей поляризации верхнего и нижнего поляризационных фильтров (поляроидов) повернуты относительно друг друга на 90◦ . В результате плоскость поляризации светового луча в процессе прохождения слоя из ЖК поворачивается на 90◦ (рис. 6.5, 6.6,a). Ðèñ. 6.5. Механизм повоТеперь уже ориентация плоскости рота плоскости поляриза◦ поляризации этого светового потока ции светового луча на 90 при прохождении одной панесовпадает с плоскостью поляризации ли при отсутствии напряжения переднего поляроида, обращенного к зрителю, и поток проходит через него почти без потерь. То есть при отсутствии напряжения ячейка прозрачна благодаря повороту вектора поляризации на 90◦ . Если теперь приложить электрическое поле, то спиралевидная структура в слое ЖК материала разрушается и свойства лучепреломления уменьшаются (и даже совсем исчезают) (рис. 6.6,b). Проходящий через слой ЖК поток света не изменяет вектор поляризации и поглощается в поляроиде, обращенном к зрителю. Таким образом, эффект имеет два оптических состояния — прозрачное и непрозрачное. При этом коэффициент светопропус- Ðèñ. 6.6. Механизм поворота вектора поляризации светового потока: a — при отсутствии напряжения; b — при наличии напряжения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» 195 кания зависит от амплитуды напряжения входного сигнала, т. е. в присутствии электрического поля поворот вектора поляризации происходит на угол меньший 90◦ . Изображение получается проекцией равномерного светового потока на ЖК экран, который работает на просвет в отличие от киноэкрана. Роль кинопленки выполняют ячейки жидких кристаллов (пространство на пересечении горизонтальных и вертикальных электродов). Коэффициент светопропускания этих ячеек зависит от прикладываемого напряжения, т. е. ячейки играют роль световых клапанов, коэффициент светопропускания которых не изменяется в течение времени передачи кадра. С приходом очередного импульса сигнала коэффициент изменяется в соответствии с амплитудой приходящего сигнала. Развертка осуществляется подачей тактовых импульсов на вертикальные электроды (колонки) и сигнальных импульсов — на горизонтальные (см. рис. 6.3). Переключение горизонтальных шин осуществляется коммутатором с частотой строк (кадровая развертка), определяемой стандартом на вещание. Необходимо помнить, что 50 % светового потока теряется при прохождении заднего поляризатора (от зрителя), поверхность которого равномерно освещается люминесцентной лампой (см. рис. 6.4). Исследования показали, что если увеличить закрутку спирали молекул ЖК материала от 90◦ до 180◦ или даже до 270◦ , то можно резко увеличить крутизну вольт-контрастной характеристики. При этом контраст изображения возрастает до 480:1 и более. Повышается также и линейность вольт-контрастной характеристики. При указанной закрутке спирали молекул ЖК возможно изменение полярности изображения без изменения полярности подаваемого сигнала. 6.1.2. Структура модуля ЖКЭ Модуль экрана со схемой управления показан на рис. 6.7. Для матричных ЖКЭ на плате модуля могут находиться только драйверы строк и столбцов, а также схема формирователей напряжений для драйверов. Контролер и оперативное запоминающее устройство (ОЗУ), как правило, устанавливаются вне платы модуля. Формирование изображения (регенерация отдельных кадров на основе данных ОЗУ) и управление разверткой для ЖКЭ матричного типа производится внешним контроллером. ЖКЭ имеет на подложках (на одной или на обеих) выводы управления строками и столбцами, представленные пленочными контактами из In2 O3 . Контакты соединяют выводы ЖКЭ со схемой управления. Они могут быть выполнены в виде металлических гребенок — клипс, которые с одной стороны одеваются на стекло подложки ЖКЭ и с помощью проводящей пасты (клея) контактируют с пленочными выводами, а с другой распаиваются на печатную плату. Таким
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 196 Часть II. Принципы построения твердотельных преобразователей Ðèñ. 6.7. Структура модуля жидкокристаллического экрана образом, ЖКЭ устанавливается на печатной плате как обычный компонент. В большеформатных ЖКЭ контакты изготавливаются на основе гибких шлейфов. Схема преобразователя напряжений обеспечивает для драйверов строк и столбцов формирование специальных уровней напряжений. Уровни напряжений определяются числом мультиплексированных строк и типом жидкокристаллического материала. 6.1.3. Адресация ЖКЭ В телевизионных ЖКЭ требуемое изображение формируется из большого числа элементов (около 450 000), равномерно распределённых по площади экрана и адресуемых индивидуально. Поскольку для подачи управляющего напряжения формирование отдельного контакта исключено, используется матричный принцип организации ЖКЭ (рис. 6.8) [60]. Различают два способа адресации ЖКЭ. При пассивной адресации исключается использование каких-либо ключевых элементов. Основным недостатком режима пассивной адресации является трудность сохранения высокого контраста воспроизводимого изображения при большом числе сканируемых строк. Для устранения этого недостатка в ЖКЭ используется построчное управление с индивидуальной адресацией каждого элемента с помощью своего ключа (см. рис. 6.8), формируемого в непосредственной близости от него. Таким образом, при активной матричной адресации последовательно с каждой ЖК ячейкой включен коммутирующий элемент, заряжающий эквивалентную ёмкость ячейки до напряжения сигнала, подаваемого на вертикальные шины. Выводы транзисторов присоединяются к полосковым взаимно перпендикулярным прозрачным электродам (столбцам и строкам) и к
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» Ðèñ. 6.8. 197 Схема, поясняющая принцип активной матричной адресации точечным электродам элементарных ЖК ячеек, расположенных на одной из подложек. В свою очередь, столбцы соединены схемой развертки с источником видеосигнала (см. рис. 6.8). Элементарные ёмкости ячеек ЖКЭ заряжаются до соответствующих значений видеосигнала. При снятии напряжения с транзисторов электрические заряды на эквивалентных ёмкостях элементарных ячеек ЖКЭ сохраняются в течение кадра до следующего периода развёртки. При этом на элементарные ячейки могут подаваться видеосигналы с меняющимися в широком диапазоне действующими значениями напряжений сигнала, чем обеспечивается передача большого числа полутонов. К ключевым свойствам транзистора предъявляются два требования: сопротивление в проводящем состоянии должно быть достаточно мало, чтобы обеспечить зарядку эквивалентной ёмкости ячейки ЖКЭ до напряжения видеосигнала, а сопротивление в непроводящем состоянии достаточно велико, чтобы напряжения на ячейках заметно не менялись в течение интервала кадра. Этим обеспечивается отсутствие мельканий на ЖК экране. Наилучшим образом удовлетворяют требованиям высококачественного воспроизведения ТВ изображений активные матрицы с тонкоплёночными полевыми транзисторами типа TFT (Thin Film Transistor), изготавливаемые по тонкоплёночной технологии на прозрачных подложках. 6.2. Плоские плазменные экраны Работа плазменной панели основана на свечении люминофоров экрана панели под воздействием ультрафиолетовых лучей, возникающих при электрическом разряде в плазме (разреженном газе). Конструктивный элемент, формирующий отдельную точку изображения — пиксель, включает в себя три субпикселя, излучающих три основных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 198 Часть II. Принципы построения твердотельных преобразователей цвета RGB. Каждый субпиксель представляет собой отдельную микрокамеру, заполненную разреженным газом, на стенках которой нанесены люминофоры одного из трех основных цветов. Пиксели расположены в точках пересечения прозрачных разрядных электродов, образующих прямоугольную сетку (матрицу). Кроме разрядных электродов, каждый пиксель снабжен третьим — адресным электродом. На разрядные электроды постоянно подается напряжение, достаточное для поддержания разряда, но меньшее, чем напряжение зажигания. На адресный электрод подается импульс, размах которого достаточно велик, чтобы зажечь разряд. Во время разряда возникает мощное ультрафиолетовое излучение, возбуждающее находящийся на стенках ячейки люминофор. При этом электроны атомов люминофора оказываются переведенными на более высокие энергетические уровни внешних орбит. При возвращении с внешних орбит на прежние уровни электроны излучают кванты света в соответствующем данному люминофору красном, зеленом или синем участке видимого спектра излучения. Так происходит преобразование ультрафиолетового излучения в видимую часть спектра. Коммутационная система плазменной панели с поэлементной тактовой частотой переключает потенциалы на адресные электроды и со строчной частотой — на разрядные электроды. Интенсивность излучения трех люминофоров пикселя определяется длительностью подаваемых на адресные электроды импульсов, поэтому амплитуды сигналов трех основных цветов Ur , Ug , Ub предварительно модулируются методами широтно-импульсной модуляции. Таким образом, каждая ячейка плазменной панели — миниатюрный газоразрядный прибор. Сотовая структура ячеек размещена между двух пластин. Одна является задней стенкой панели, другая — выходной и поэтому должна быть прозрачной в видимой части спектра. Между пластинами размещена достаточно жесткая конструкция, которая, собственно, и формирует боковые стенки камер ячеек. Заметим, что в своей конструкции плазменной панели фирма Pioneer применила «вафельную» структуру (технологии Waffle или Deep Waffle). Каждая ячейка — это каверна в подложке, имеющая прямоугольную форму. Достоинство — полная изоляция каверн. Типичная конструкция ячейки и базовая конструкция панели поясняются рис. 6.9 и 6.10 [35]. Диэлектрические слои отделяют электроды от камер. Нижний (на рисунке) электрод примыкает к задней глухой стенке, поэтому он металлический. Электроды со стороны входной пластины изготовлены из прозрачного токопроводящего материала. В принципе, защитный слой, стеклянная входная пластина и другие «прозрачные»
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» Ðèñ. 6.9. 199 Конструкция ячейки плазменной панели элементы конструкции ультрафиолет не пропускают и поэтому препятствуют проникновению УФ излучения «во внешний мир». Люминофор покрывает заднюю и частично боковые стенки камеры ячейки. Естественно, используются люминофоры трех разных составов, излучающие основные цвета: красный, зеленый, синий соответственно. Ячейки заполнены инертным газом, это неон или ксенон, реже гелий. Используются также и смеси этих газов. Газы находятся в разреженном состоянии. Пониженное давление — это и пониженные потенциалы поджига и равновесного разряда. Рассмотренная конструкция ячеек сложилась далеко не сразу. Плазма способна, особенно на стадии нормального тлеющего разряда, довольно быстро разрушить люминофорное покрытие. Поэтому поиск оптимальной конфигурации ячейки велся методом проб и ошибок, пока не была решена проблема эффективного отделения зоны плазмы от люминофора. И все же «выгорание» и, как следствие, изменение, в частности, цветовых температур было и остается проблемой. Ðèñ. 6.10. Базовая конструкция плазменной панели
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 200 Часть II. Принципы построения твердотельных преобразователей Еще одна проблема, связанная с ПП, и также принципиальная — высокое энергопотребление. Плазма — это машина по переработке электрического тока в УФ с низким коэффициентом полезного действия [35]. Кроме указанных недостатков, плазменные панели имеют и большие преимущества перед другими преобразователями «сигнал-свет». Высокая яркость (более 500 кд/м2 ) и контрастность (до 400:1) наряду с отсутствием заметности мельканий являются большими преимуществами таких мониторов (для сравнения: у профессионального ЭЛТ монитора яркость равна приблизительно 350, а у телевизора от 200 до 270 кд/м2 при контрастности от 150:1 до 200:1). Высокая четкость изображения сохраняется на всей рабочей поверхности экрана. Кроме того, угол по отношению к нормали, под которым можно видеть нормальное изображение на плазменных мониторах, существенно больше, чем у LCD-мониторов. К тому же плазменные панели не создают магнитных полей (что служит гарантией их безвредности для здоровья), не страдают от вибрации, как ЭЛТ-мониторы, а их небольшое время регенерации позволяет использовать их для отображения видео- и телесигнала. Отсутствие искажений и проблем сведения электронных лучей и их фокусировки присуще всем плоскопанельным дисплеям. Необходимо отметить и стойкость PDP-мониторов к электромагнитным полям, что позволяет использовать их в промышленных условиях — даже мощный магнит, помещенный рядом с таким дисплеем, никак не повлияет на качество изображения. В домашних же условиях на монитор можно поставить любые колонки, не опасаясь возникновения цветных пятен на экране. Главными недостатками такого типа мониторов является довольно высокая потребляемая мощность (примерно в 3 раза большая, чем у ЭЛТ при размерах экрана 81 см), возрастающая при увеличении диагонали монитора, и относительно низкая разрешающая способность, обусловленная большим размером элемента изображения. Кроме этого, свойства люминофорных элементов в процессе эксплуатации ухудшаются и экран становится менее ярким, хотя срок службы плазменных мониторов в настоящее время сравним со сроком службы ЖК-мониторов и составляет по последним данным фирм-изготовителей около 60000 часов (это около 20 лет при офисном использовании и 7 лет при непрерывной работе). Такие мониторы используются для конференций, презентаций, информационных щитов, т. е. там, где требуются большие размеры экранов для отображения информации. Однако в настоящее время в связи с улучшением технических характеристик и снижением стоимости плазменных панелей такой тип устройств с успехом применяется в качестве телевизионных экранов или мониторов для компьютеров.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» 201 6.3. Проекционные системы Одним из направлений улучшения качества ТВ изображения является увеличение размеров воспроизводящего экрана. Большой экран позволяет осуществлять коллективный просмотр ТВ передач в домах отдыха, клубах, санаториях или специально созданных театрах. Он широко используется при проведении конференций и презентаций, в прикладных ТВ системах, например для имитации окружающей обстановки в ТВ тренажерах, а также при слежении за работой и управлении космическими летательными аппаратами. Телевизионное изображение увеличенного размера оказывает существенно большее эмоциональное воздействие на зрителя, усиливает эффект присутствия при наблюдении демонстрируемых событий. Потребность в увеличении экрана, безусловно, возрастет в случае внедрения нового ТВ стандарта с большим числом строк разложения. В настоящее время для получения ТВ изображения на большом экране широко используются проекционные светоклапанные системы, в которых свет от внешнего источника модулируется пространственным модулятором света (ПМС). В ПМС под действием модулирующего ТВ сигнала меняется прозрачность или коэффициент отражения модулирующей среды. Интенсивность излучения, а следовательно, и яркость экрана таких систем определяются лишь мощностью внешнего источника. В большинстве проекционных светоклапанных системах в качестве ПМС используется жидкокристаллическая ячейка. Оптическая схема проекционной системы с жидкокристаллическими модуляторами света представлена на рис. 6.11. Световой поток, создаваемый высокоэффективной лампой 1, проходит конденсорную систему 2, компенсирующую спад светового потока от центра к периферии. Далее с помощью нормальных 3 и дихроических 4 зеркал световой поток разделяется на три спектральных составляющих R, G и B первичных цветов. Разделенные световые потоки посредством конденсорной системы 5 направляются на соответствующую панель ЖК, каждая из которых представляет собой пакет из двух скрещенных поляризаторов (входного и выходного поляризатора-анализатора 8) и помещенных между ними ЖК ячеек 7. ЖК панели расположены на минимальном расстоянии от дихроической призмы 9, суммирующей модулированные по интенсивности световые потоки первичных цветов и направляющей их в проекционный объектив 10. Ячейки ЖК панелей образуют матрицу, степень прозрачности каждого пикселя которой определяется дополнительной поляризацией ЖК ячейки. Величина дополнительной поляризации является функцией приложенного к данному пикселю напряжения. Использование поляроидной сепарации в оптической ЖК панели приводит к 50%-ной потери света на входных поляризаторах, про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 202 Часть II. Принципы построения твердотельных преобразователей Оптическая схема проекционной системы с жидкокристаллическим модулятором света: 1 — источник света; 2 — оптический конденсатор; 3 — отражающие зеркала; 4 — дихроические зеркала; 5 — конденсорная система; 6 — поляризатор; 7 — ЖК панель; 8 — поляризатор-анализатор; 9 — дихроическая призма; 10 — проекционный объектив Ðèñ. 6.11. пускающих только полезную Р-составляющую линейного поляризованного светового потока и поглощающих (превращающих в тепло) ортогональную S-составляющую. Поэтому в современных высокоэффективных проекторах применяются конверторы поляризации, преобразующие составляющую S светового потока в Р. Появление новых термостойких ЖК панелей, модулирующих при пропускании или отражении световой поток от мощного источника света, обусловило создание компактных видеопроекционных систем. Изображение, получаемое с помощью таких систем, обладает высокой разрешающей способностью — 1280×1024 и более и контрастом 300:1. Яркость изображения зависит от размеров экрана и значения светового потока, излучаемого проектором, который в лучших образцах достигает 2000 лм. Мы рассмотрели ЖК проекторы с модификацией пропускаемого светового потока, основным недостатком которых считается невозможность получения глубины черного, т. е. высокой контрастности изображения. Действительно, при использовании модуляторов классической технологии TN (состоящих из скрещенных поляризаторов, разделенных слоем жидкого кристалла Twisted Nematic — TN) этот недостаток есть и обусловлен тем, что такие модуляторы нормально открыты (пропускают свет в обесточенном состоянии). При воздейст-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» 203 вии возрастающего электрического поля, направление напряженности которого перпендикулярно поверхности модулятора, молекулы TN начинают ориентироваться вдоль него, все менее закручиваясь. При напряженности поля выше определенного значения они перестают влиять на поляризацию света, и его прохождение через скрещенные поляризаторы прекращается. Проблемы здесь заключаются в нелинейности и неодинаковости характеристик управления прозрачностью пикселей, особенно по достижении их полного запирания. Из-за невозможности полностью перекрыть пропускание света всеми пикселями при подаче одинаковых, но небольших управляющих напряжений, черное поле, проецируемое ЖК проекторами с такими модуляторами, в затемненном помещении часто воспринимается серым. В борьбе за повышение контрастности было разработано несколько ЖК модуляторов других технологий. Например, фирмами Hitachi и NEC была разработана технология In-Plane-Switch (IPS), по которой ориентация молекул TN всегда остается в плоскости, параллельной поляризаторам, и при отсутствии управляющего напряжения IPSпиксель не пропускает свет, т. е. является нормально закрытым. Под действием управляющего напряжения молекулы TN начинают ориентироваться вдоль электрического поля, поворачиваясь в той же плоскости, и при их повороте на 90 градусов светопропускание достигает максимума. Принципиально новый вид проекционной аппаратуры, базирующейся на светоотражающих микрозеркальных модуляторах света Digital Micromirror Device (DMD), разработала группа инженеров и изобретателей компании Texas Instruments (TI). В 1995 году появились первые промышленные модели цифровых проекторов технологии Digital Light Processing (DLP), свободные от указанных недостатков ЖК модуляторов света. DLP-проекторы содержат три микрозеркальных модулятора DMD. Световой поток, создаваемый источником света, пройдя систему с конденсатором, тепловым фильтром, зеркалами и призмой полного внутреннего отражения, поступает на комбинированную цветоделительную призму, выделяющую из него составляющие первичных цветов и направляющую их на поверхности DMD соответствующих каналов. Эти составляющие модулируются чипами, отражаются и объединяются комбинированной призмой в общий световой поток, поступающий в проекционный объектив. Чип DMD представляет собой световой модулятор, состоящий из матрицы поворотных алюминиевых зеркал размером 16×16 мкм, количество которых соответствует оптическому разрешению проектора. Зеркала крепятся на подложке с помощью механических подпружиненных подвесов, позволяющих им поворачиваться в пределах
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 204 Часть II. Принципы построения твердотельных преобразователей ±10◦ . В зависимости от управляющих напряжений, каждое зеркало может занимать крайние положения «включено» или «выключено». В первом случае отраженный зеркалом свет попадает в оптическую систему объектива, а во втором поглощается. К высшим достижениям жидкокристаллической технологии относятся проекторы компании Sony, созданные по технологии SXRD с разрешением 4К (4096×2160), временем отклика менее 5 мс и световыми потоками от 5000 лм. Они оснащены ксеноновыми лампами и отражающими модуляторами формата 1,85:1 с размерами пикселей и расстояний между ними 8,5 мкм и 0,35 мкм соответственно. 6.4. Мониторы завтрашнего дня Весьма перспективными разработками мониторов завтрашнего дня является использование технологии OLED — Organic Light Emitting Diode (создание дисплеев нового поколения на основе органических светоизлучающих диодов). Органические светодиоды таят в себе такой огромный потенциал, что изготовленные с их помощью дисплеи превзойдут по качеству все, что есть в данном секторе на сегодняшний день, и в сравнении с ними даже современные высококачественные TFT-дисплеи будут смотреться простенькими игрушками. Качество изображения OLED-дисплеев попросту несравнимо с современными мониторами. Привлекательность новой технологии состоит еще и в том, что сочность, яркость и резкость изображения подняты на совершенно новый уровень, угол обзора составляет практически 180◦ . Очень быстро происходит и регенерация изображения: смена кадров может осуществляться в 100...1000 раз быстрее, чем на жидкокристаллическом дисплее. Наряду с этими радикальными улучшениями новая технология обеспечивает и другие важные потребительские свойства: низкий уровень потребляемой энергии, малый вес дисплеев, их невосприимчивость к вибрациям и сотрясениям — то, что необходимо портативным устройствам. Но и это еще не все: благодаря полимерной основе, которая изгибается в любом направлении, дисплею можно придать любую форму, разместить его на любой поверхности. В перспективе компьютерные мониторы станут намного тоньше, чем самый тонкий современный TFT-монитор. 6.5. Мониторы с автоэлектронной эмиссией Концепция плоского экрана с активной эмиссией света получила название «технология FED» (дисплей с автоэлектронной эмиссией). Вместо одного катода (как в случае стандартного дисплея с кинескопом), в FED-устройствах на каждый пиксель приходится сотни маленьких источников катодных лучей. FED-панель состоит из
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 6. Преобразователи «сигнал-свет» Ðèñ. 6.12. 205 Принцип работы FED-панели двух стеклянных пластин, разделённых вакуумом. Заднее стекло (катод) создано из миллионов мельчайших вершинок, источников электронов, ускоряющихся в вакууме. Переднее стекло (анод) покрыто слоями стандартных люминофоров (рис. 6.12). FED-панель обладает многими преимуществами перед лучевыми кинескопами: она тоньше, легче, потребляет меньше энергии и не даёт геометрических искажений. Расположение адресуемого xy-эмиттера исключает нелинейность и подушкообразные искажения, присущие кинескопу. Разработчики утверждают, что эти типы панелей будут дешевле, тоньше и легче [28]. Контрольные вопросы 1. 2. 3. 4. 5. Жидкокристаллические (ЖК) экраны. Устройство и принцип работы. Достоинства и недостатки ЖК экранов Плазменные панели (ПП) и их устройство. Достоинства и недостатки ПП. Перспективы использования твердотельных преобразователей.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü III РАЗВЕРТЫВАЮЩИЕ И СИНХРОНИЗИРУЮЩИЕ УСТРОЙСТВА В ТЕЛЕВИДЕНИИ 7 ВИДЫ РАЗВЁРТОК В ТЕЛЕВИДЕНИИ Основным принципом современного телевидения является принцип последовательной передачи изменений пространственно-временной и цветовой структуры сигналов ТВ изображений — элемент за элементом, строка за строкой, кадр за кадром, т. е. принцип развертки изображений. Процесс передачи изображения по элементам (дискретным отсчётам) называется развёрткой изображения, а порядок передачи таких отдельных элементов — способом развёртки. Рассмотрим требования, предъявляемые к развертке. Развертка может осуществляться по различным законам. В технике телевидения используют радиальную, спиральную, синусоидальную, линейнострочную и другие виды разверток. При этом закон развертки на передающей и приемной сторонах должен быть одинаков, иначе появятся относительные координатные искажения воспроизводимого изображения. Кроме того, указанные развертки должны быть синхронными (равенство частот) и синфазными (совпадение фаз). Невыполнение первого требования, т. е. отличие частот строчной или (и) кадровой разверток воспроизводящего устройства от таковых на передающей стороне ТВ тракта влечет за собой невозможность получения и просмотра устойчивого изображения на экране телевизора или монитора. Если же частоты разверток равны, но есть фазовые различия, т. е. моменты начала разверток не совпадают, то изображение будет сдвинутым по горизонтали или вертикали, может быть «разорвано» на
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 7. Виды разверток в телевидении 207 две части (на экране воспроизводятся изображения интервалов гасящих импульсов). 7.1. Построчная развёртка В ТВ вещании используется наиболее простой в реализации закон развертки — линейно-строчная периодическая развертка, когда анализ (синтез) строки изображения осуществляется с постоянной скоростью слева направо (прямой ход строчной развертки) и одновременно сверху вниз (прямой ход кадровой развертки) (рис. 7.1,a) [5]. Быстрый возврат развертывающего элемента справа налево и снизу вверх происходит во время обратных ходов разверток; сумма времени прямого и времени обратного ходов составляет период развертки, причем период строчной развертки намного меньше периода кадровой. Рисунок траектории, образуемый последовательно смещаемым анализирующим (потенциальный рельеф на светочувствительной поверхности преобразователя «свет-сигнал») или синтезирующим (соответствующее видеоизображение на экране) элементом развертки, называют ТВ растром. Отношение горизонтального и вертикального размеров воспроизводимого ТВ изображения определяет его формат (k). Отдельные элементы на передаче и приеме имеют одинаковые относительные координаты в пределах растров (рис. 7.1,b), если по ТВ каналу будет параллельно передаваться видеосигнал и дополнительный (служебный) сигнал синхронизации приемника, содержащий импульсы строчной и кадровой частот. Обычно оба эти сигнала совмещаются, а в приемнике разделяются. Совмещенный сигнал называют полным ТВ сигналом. Ðèñ. 7.1. Линейно-строчная развертка: a — принцип линейно-строчной развертки; b — синхронизация разверток
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 208 Часть III. Развертывающие и синхронизирующие устройства Образование прямоугольного растра на экране электронно-лучевой трубки (a) под воздействием магнитных полей, создаваемых пилообразными токами катушек вертикального (b) и горизонтального (v) отклонений Ðèñ. 7.2. Развертка, при которой все строки растра развертываются за один период вертикальной развертки в последовательности 1-я, 2-я, 3-я и т. д. (рис. 7.1,a), называется построчной (прогрессивной). Форма отклоняющих токов строчной (iz ) и кадровой (iк ) частот в случае построчной развертки показана на рис. 7.2. Видно, что периоду кадровой развертки Tк соответствует целое число периодов строк Tz . Во время прямых ходов (T1 ) токи линейно нарастают, т. е. скорости разверток по горизонтали и вертикали постоянны: υг = const и υв = const. Это позволяет в рассматриваемом варианте избежать изменения яркости и четкости по полю изображения. Действительно, при нелинейном законе развертки время нахождения развертывающего электронного луча на отдельных элементах растра будет различно и яркость этих элементов на люминофорном экране кинескопа тоже будет неодинакова. Из-за изменений скорости развертки возникают также геометрические искажения: растягивание или сжатие участков изображения. При этом ВЧ составляющие спектра сжатых участков видеосигнала могут превысить 6,0 МГц и в видеотракте будут ограничены с потерей чёткости. Что же касается обратных ходов (T2 ), то линейную форму, изображенную для простоты на рис. 7.2, выдерживать не обязательно, так как возврат электронного луча в исходное состояние не воспроизводят. Этих моментов (возврата к началу прямого хода) зритель не видит — на воспроизводящее устройство подаются специально сформированные гасящие импульсы (ГИ), причем TГИ > T2 (T2 — обратный ход). На рис. 7.2 показана также зависимость положения воспроизводимого элемента на строке от тока развертки. При отсутствии посто-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 7. Виды разверток в телевидении 209 янной составляющей тока его среднее (нулевое) значение соответствует середине строки, а максимумы положительных и отрицательных амплитуд — правому и левому краям растра [5]. Пояснение. С методической точки зрения, в целях наглядности, формирование растра рассмотрено на экране электронно-лучевой трубки. 7.2. Чересстрочная развертка Чтобы свечение экрана приемной трубки воспринималось зрителем с приемлемыми для видеоконтроля остаточными мельканиями, необходимо периодически (>48...50 раз в секунду) осуществлять возбуждение всего поля экрана. В то же время для воспроизведения ТВ изображений движущихся объектов в большинстве случаев требуется более низкое число (>13...16) фаз движений в секунду, т. е. кадров. Так как полоса частот, занимаемая спектром видеосигнала, прямо пропорциональна числу передаваемых в секунду кадров, то целесообразно снизить данную величину. Избыточность числа кадров при передаче ТВ изображений устраняется применением чересстрочной развертки, сущность которой заключается в том, что полное число строк кадра изображения развертывается, т. е. передается и воспроизводится за два полукадра или поля. В первом поле развертываются нечетные строки растра, а во втором — четные. Каждое из полей представляет собой растр с уменьшенным вдвое числом строк и содержит половину отсчётов видеоинформации о передаваемом изображении. Так как критическая частота мельканий (fкр ) практически не зависит от числа строк в растре, то частота передачи полей > fкр , обеспечивает восприятие пространственной структуры изображения без мельканий. Скорость передачи видеоинформации при этом снижается вдвое. В ТВ вещании приняты номинальные частоты: полей — 50 Гц, кадров — 25 Гц. Процесс образования построчного растра иллюстрируется на рис. 7.3,a. Если развертывающий элемент движется по горизонтали с постоянной скоростью, прочерчивая строку растра, и одновременно смещается по вертикали, то к исходу строки он сместится вниз относительно ее начала на h/z, т. е. на один шаг (по высоте) одной строки. Быстро возвращаясь к началу строки (длительностью обратного хода пренебрегаем), развертывающий элемент займет положение, соответствующее началу второй строки и т. д. Если в качестве исходного принять растр с нечетным числом строк (см. рис. 7.3,a) и уменьшить вдвое скорость развертки по горизонтали, то в каждом поле получится не целое, а вдвое меньшее число строк (см. рис. 7.3,b), но из-за разности в полстроки строки растров
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 210 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 7.3. Образование чересстрочного растра: a — построчная развертка при z = 7, fк = 50 Гц, fz = 350 Гц; b — чересстрочная развертка при z = 7, fк = 25 Гц, fп = 50 Гц, fz = 175 Гц первого и второго полей окажутся взаимно сдвинутыми по вертикали на ширину одной строки полного растра, т. е. строки второго поля будут ложиться между строками первого. За два периода вертикальной развертки образуется полный растр, аналогичный по числу строк исходному. Таким образом, с помощью чересстрочной развертки удается, при неизменных числе строк и частоте мельканий, в 2 раза снизить скорость строчной развертки, т. е. скорость передачи ТВ информации, и тем самым уменьшить вдвое верхнюю граничную частоту спектра сигнала изображения. В результате спектр сигнала для отечественного стандарта занимает полосу частот от fmin = 50 Гц до fmax ≈ ≈ 6 МГц. Передача более низких частот, несущих информацию о средней яркости, в телевидении осуществляется косвенным путём с использованием схем фиксации. Для формирования чересстрочной развертки должны быть обеспечены следующие условия: а) нечетное число строк в кадре, т. е. z = 2m + 1, где m — целое число; б) жесткая связь частот развертки по строке и по кадру, т. е. 2fz = (2m + l)fn , обеспечивающая в каждом поле целое число строк с половиной строки. Обычно оба эти условия выполняются при формировании частот горизонтальной и вертикальной разверток от общего задающего генератора с частотой 2fz делением на 2 и на z соответственно. При построчной развертке Tк /Tс = Z или fс /fк = Z, отсюда fс = fк Z и видно, что частота задающего генератора fзг = fс , а частота кадровой развертки fк = fс /Z. При чересстрочной развертке частота задающего генератора fзг будет равна удвоенной частоте строчной развертки, а частоты строк и кадров получаются делением fзг = 2fс на 2 и Z.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 211 Глава 7. Виды разверток в телевидении Действительно, Tп Z 2m + 1 fс 2m + 1 Z = = , или = = , Tс 2 2 fn 2 2 т. е. fзг = 2fс = (2m + 1)fn = Zfn . Отсюда fс = fзг ; 2 fn = fзг . Z Чересстрочная развертка, кратность которой равна 2:1, применяется во всех системах вещательного ТВ для сокращения полосы частот, занимаемой ТВ сигналом. В принципе возможно дальнейшее сокращение полосы частот за счет применения чересстрочного разложения с кратностью 3:1 или 4:1. В этом случае кадр будет состоять из трех или четырех отдельных полей, строки которых последовательно воспроизводятся друг под другом. По ряду причин такие развертки не применяются. Становятся заметными мелькания строк, так как четные (или нечетные) поля повторяются с частотой 12,5 Гц (при кратности 4:1), а угловое расстояние между строчками одного поля становится больше минимального угла разрешения глаза. Уменьшается четкость изображения объектов, движущихся в вертикальном направлении с относительно большой скоростью. Ухудшается воспроизведение вертикальных границ объектов, движущихся с относительно большой скоростью в горизонтальном направлении (границы становятся зигзагообразными и наклонными). Наконец, появляется эффект скольжения строк, которые как бы перемещаются сверху вниз в пределах одного кадра. Объясняется это тем, что, когда луч чертит какую-либо строку четвертого поля, яркость ее максимальна. В то же время расположенные выше строки, прочерченные соответственно в третьем, втором и первом полях, имеют спадающий по яркости во времени характер. Создается эффект последовательного во времени разнояркостного свечения и, как следствие, — перемещение строк. Эти недостатки присущи любой чересстрочной развёртке, но при кратности 2:1 они менее заметны. В табл. 7.1 приведены номинальные значения некоторых параметров разложения изображения для горизонтальной Н и вертикальной V разверток, в том числе абсолютные (TГИ ) и относительные (TГИ /Т) длительности ГИ и длительности активной части строки и кадра Tакт . Точные значения (с допусками) этих и других параметров, определяющих систему вещательного ТВ, приведены в [30]. Здесь отметим только, что средняя нестабильность частоты строк ∆fz /fz в сигнале отечественной системы цветного ТВ SECAM не должна превышать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 212 Часть III. Развертывающие и синхронизирующие устройства Таблица 7.1 Параметры развёрток Развертка f , Гц T , мс T1 , мс T2 , мс Tакт , мс TГИ , мс TГИ /T , мс H V 15625 50 0,064 20 0,057 19 0,007 1 0,052 18,4 0,012 1,6 α = 0,18 β = 0,08 10−6 , т. е. ±15625 · 10−6 ≈ ±0,016 Гц, что необходимо для международного обмена программами цветного ТВ со странами, в которых принята другая система цветного ТВ — PAL. Как видно из табл. 7.1, реально обратный ход вертикальной развертки занимает около 1 мс (5 % периода), или около 15 строк. Они будут воспроизводиться в виде наклонных линий, если на воспроизводящее устройство не подавать ГИ. На рис. 7.2 для упрощения графических построений обратный ход кадровой развертки значительно уменьшен. В заключение подытожим основные требования, предъявляемые к ТВ разверткам: одинаковый закон разверток на передающей и приемной сторонах ТВ системы; простой закон формирования отклоняющих токов (линейно-строчная развертка в ТВ вещании); постоянство скоростей разверток на прямых ходах; синхронность и синфазность разверток передающей и приемной сторон ТВ тракта; отклонение частоты строк от номинальной не должно превышать ±0,016 Гц. 7.3. Спиральная развёртка В некоторых случаях промышленного использования телевидения круглая форма растра оказывается более приемлемой, чем прямоугольная. Например, для контроля объектов, имеющих круглую форму (при просмотре труб, скважин и т. д.). Спиральная развертка может также найти применение при передаче изображения вращающихся объектов. Если необходимо наблюдать изображение вращающегося объекта (например, лопасти турбины), то в приемном устройстве, вращая фазу развертки с той же угловой скоростью, что и вращающийся объект, можно остановить изображение на ТВ экране для осуществления визуального контроля. С помощью спиральной развертки можно измерять скорость. Если при радиосвязи между быстро движущейся камерой и неподвижным приемником передается сигнал развертки, то вследствие эффекта Доплера будет наблюдаться изменение частоты заполнения растра, что приведет к повороту изображения в точке приема. По углу поворота можно судить об относительной скорости движения передатчика в направлении к приемнику [44]. Основное преимущество спиральной развертки перед линейной заключается в том, что время обратного хода луча от периферии к
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 7. Виды разверток в телевидении 213 центру составляет около 2 % от всего времени развертки, в то время как при линейной развёртке время, затраченное на обратный ход луча, в общей сложности достигает 22 %, что значительно снижает эффективность использования канала связи. В системе со спиральной разверткой устраняются трудности, связанные с использованием для развертки сравнительно больших токов и напряжений. При спиральной развертке управление электронным лучом непрерывно, и при сохранении эквивалентной развертки на обоих концах системы геометрические искажения изображения будут отсутствовать. Для получения спиральной развертки необходимо иметь два напряжения: Ux = U1 R(t) sin ωt; Uy = U1 R(t) cos ωt, где ω — частота напряжения, питающего отклоняющую систему; R(t) — закон изменения амплитуды отклоняющего напряжения или радиуса спирали развертки; U1 — амплитуда отклоняющего напряжения. Получить такие напряжения можно одновременной модуляцией двух напряжений, сдвинутых по фазе на 90◦ , пилообразным напряжением. В результате при линейном пилообразном напряжении можно получить спираль с равномерным шагом, а значит, с постоянной радиальной четкостью. Однако при таком методе линейная скорость луча увеличивается от центра к периферии. Непостоянство линейной скорости движения электронного луча по экрану приемной трубки или по мишени передающей трубки приводит в первом случае к неоднородности яркости свечения по полю изображения, а во втором — к искажению размаха видеосигнала, так как при прочих равных условиях величина сигнала, образуемого трубкой, использующей принцип накопления зарядов, пропорциональна скорости считывания. Поэтому желательно использовать систему спиральной развертки с постоянной линейной скоростью луча. В этом случае можно ограничиться рассмотрением архимедовой спирали, так как только она характеризуется постоянным шагом [44]. Уравнение архимедовой спирали в полярных координатах имеет вид ρ = kφ, (7.1) где ρ = f (t) — функция изменения радиус-вектора движущейся точки; φ = f (t) — функция изменения фазового угла текущей точки спирали; k = d/2π — параметр спирали, равный увеличению радиуса-вектора спирали при повороте его на один радиан; d = R/z — шаг спиральной развертки; R — конечный радиус спирали; z — количество витков в растре.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 214 Часть III. Развертывающие и синхронизирующие устройства Скорость точки, движущейся по спирали, выражается формулой √ v = ωk 1 + φ2 , (7.2) где ω = dφ/dt — круговая частота; φ = φ0 + 2πz; φ0 — начальный угол спирали. Так как в ТВ системе z ≫ 1, то φ0 ≪ φ и, пренебрегая φ0 , с достаточной точностью φ ≈ 2πz. Тогда из формул (7.1) и (7.2) имеем v = ωkφ = ωρ. Из этой формулы видно, что при постоянной угловой скорости нельзя получить постоянную линейную скорость точки, движущейся по спирали, так как радиус спирали меняется в течение кадра. Поэтому для получения постоянной линейной скорости √ частота отклоняющего поля должна меняться по закону ω = B/ t. Если принять частоту кадров равной fк = 50 Гц и число витков спирали z = 200, а также задаться значением z0 = zн /z < 1 = 0,2, где zн — начальное число витков спирали, для которых не может выполняться условие постоянной скорости, то можно определить требуемые граничные значения круговой частоты ω: ωв = πz 1 + z02 , T (1 − η) z0 где η — относительное время обратного хода по кадру; πz (1 = z02 ), ωн = T (1 − η) где T — период кадровой развертки; η — обратный ход развертки, равный 0,05; zfk 1 + z02 = 27,5 кГц; 2(1 − η) z0 zfk (1 + z02 ) Fн = = 5,5 кГц. 2(1 − η) Fв = Отсюда видно, что для получения постоянной линейной скорости луча при заданных параметрах развертки необходимо иметь модулированные по частоте колебания с перекрытием Fв /Fн = 5. Блок-схема спиральной развертки с постоянной линейной скоростью луча представлена на рис. 7.4. Частотно-модулированный генератор создает синусоидальное напряжение, промодулированное пилообразным напряжением, которое подается на фазовращающую цепь. С помощью последней получают-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 7. Виды разверток в телевидении Ðèñ. 7.4. 215 Блок-схема спиральной развертки с постоянной линейной скоростью развертывающего луча ся два напряжения, сдвинутые друг относительно друга на 90◦ . Коэффициент передачи этой цепи не должен зависеть от частоты, а сдвиг фазы должен сохраняться в заданном диапазоне. Так как фазовращатель имеет симметричный выход, то необходимо в схему ввести фазоинверсный каскад, дающий на выходе два равных по величине и противофазных напряжения. Далее необходимо оба напряжения промодулировать пилообразным напряжением, для чего в схему включаются два одинаковых реостатных усилителя-модулятора. Конечным элементом схемы являются оконечные усилители тока, работающие на отклоняющую систему передающей трубки. Модулирующее напряжение подается от генератора пилообразного напряжения, задающей частью которого является блокинг-генератор, синхронизированный сетью. Представив спиральную развертку в виде концентрических окружностей с наименьшим радиусом r1 и наибольшим r2 и задавшись числом строк и кадров, можно найти необходимую ширину полосы пропускания при данном типе развертки. Длина средней строки растра, считая за строку некоторую среднюю окружность, r2 − r1 ; l = 2π 2 шаг развертки σ= r2 − r1 2(r2 − r1 ) = , z/2 z а число элементов в средней строке N= 1 1 = πz. σ 2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 216 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 7.5. Построение спирального растра Тогда fс max спир = πz 2 n . 4 Как видно из приведенного выражения, ширина полосы пропускания при спиральной развертке меньше, чем при прогрессивной, определяемой как fс max прог = p kz 2 n 1 − η , 2 1−α где η = β = 0,08 — относительное время обратного хода кадровой развертки; α — относительное время обратного хода строчной развертки; p ≈ 0,7 — коэффициент Кэлла [5]. Число витков в растре определяется по формуле Z= (1 − η)f , n
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 7. Виды разверток в телевидении 217 где η — относительное время обратного хода по кадру, η= tох.к ; Tк f — частота синусоидальных колебаний; n — число кадров в секунду. При η ≪ 1 число витков Z = f /n. Механизм построения спирального растра показан на на рис. 7.5. 7.4. Цифровая схема развертки изображения в твёрдотельной активной матрице Чтобы обеспечить управление изменениями воспроизводимых в пределах внутрикадрового пространства пикселей, требуется формировать напряжения на соответствующих электродах таким образом, чтобы можно было изменять состояние одних из них без изменения состояния других. Топология ЖК экрана представляет собой матрицу, образованную ортогональной системой электродов. Для реализации сканирования элементы изображения локализованы на пересечении системы электродов (шин) строк и столбцов. В твердотельных преобразователях при синтезе изображения на горизонтальные шины подаются строчные импульсы (развертка по вертикали), а на вертикальные — тактовые импульсы с частотой следования пикселей — элементов изображения (развертка по горизонтали). Видеосигнал может быть подан как на горизонтальные, так и на вертикальные шины. А при аналоговом сигнале целесообразно подавать видеосигнал на горизонтальные шины, ключи здесь работают со строчной частотой. При цифровом сигнале ограничений нет. Но особенности работы ЖК ячеек накладывают на построение схемы разверток свои особенности. Если в ЭЛТ синтез изображения осуществляется последовательно — элемент за элементом, то в ЖК экранах по причине инерционности кристаллов подобный способ развертки не используется. Жидким кристаллам (ЖК) свойственна большая инерционность около 2...5 мс и более [114]. Следовательно, для получения максимальной яркости строки время ее сканирования должно быть очень большим, 1,5...3,75 мс. Для повышения частоты сканирования растра необходимо провести одновременное сканирование всех пикселей (для цветного — субпикселей: R, G и B) строки как можно быстрее, но при этом напряжение на обкладках каждой из ячеек оставалось бы на уровне заданного как можно дольше (не меньше времени кадра). Добиться этого удалось в активных матрицах (рис. 7.6). Ячейки активной матрицы способны длительное время сохранять заданную при сканировании строки напряженность электрического поля. Каждая ячейка
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 218 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 7.6. Развертка изображения в активной матрице активной матрицы имеет свой собственный индивидуальный электрод (ИЭ), конденсатор и тонкопленочный транзистор TFT технологии (thin film transistor). Сток TFT соединен с ИЭ, исток с вертикальной шиной данных, а затвор — с горизонтальной шиной выбора строки (см. рис. 7.6). Развертка изображения осуществляется следующим образом. При подаче положительного напряжения на горизонтальный электрод строки с номером N транзисторы всех ее ячеек открываются. Одновременно на вертикальные шины данных подаются потенциалы, соответствующие яркости отдельных ячеек заданной строки. Через открытые транзисторы производится перезаряд конденсаторов и межэлектродных емкостей ячеек. Благодаря хорошей проводимости вертикальных шин данных этот процесс завершается за время обратного хода, т. е. за 10...20 мкс. Таким образом, время сканирования строки очень мало, и, следовательно, частота обновления изображения может быть высокой (60...85 Гц при 768...1080 строках). По окончании процесса перезаряда емкостей на горизонтальный электрод подается нулевой потенциал, и все транзисторы строки закрываются на время прямого хода строчной развертки. ИЭ ячеек отключаются от шин данных, но благодаря наличию конденсаторов напряженность поля в ячейках сохраняется на прежнем уровне в течение всего цикла развертки — до очередного сканирования (время кадра).Таким об-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 219 Глава 7. Виды разверток в телевидении разом, молекулы жидкокристаллического вещества (ЖКВ) успевают повернуться на заданный угол, а ячейка принимает заданное значение яркости. Видеосигналы в цифровой форме поступают на интегральную схему — шкалер (scaler). С выхода шкалера N -разрядный (обычно 8 битов) видеосигнал k-й строки поступает на N -разрядный сдвиговый регистр, который управляется тактовыми синхроимпульсами (ТСИ) с частотой следования элементов изображения [114]. При появлении каждого импульса цифровая последовательность в регистре смещается влево. Когда количество поступивших импульсов равно горизонтальному разрешению матрицы (числу элементов в строке) цифровые данные яркостей пикселей оказываются на соответствующих выходах сдвигового регистра. В этот момент по переднему фронту ССИ производится запись цифровых N -разрядных кодов в N - разрядные регистры хранения RG (см. рис. 7.6), а состояние счетчика адресатора увеличивается на единицу и на шину выбора k строки подается положительное напряжение. Данные с регистров RG преобразовываются в аналоговые сигналы, которые поступают через открытые транзисторы на ячейки k-й строки и перезаряжают их емкости. Одновременно с процессом перезаряда емкостей k-й строки в сдвиговом регистре накапливаются данные следующей строки (k + 1). По окончании процесса накопления счетчик-адресатор сбрасывается кадровым синхроимпульсом (КСИ) в нуль и начинается процесс перезаряда емкостей первой строки и накопление данных второй строки. Таким образом, основные элементы схемы развертки выполняют следующие функции. Счетчик-адресатор преобразует последовательность импульсов в унитарный (позиционный) код. Сдвиговый регистр является преобразователем последовательного кода в параллельный. А регистры памяти RG выполняют две функции — выборки и хранения, запоминая сигнал на выходах сдвигового регистра только в те моменты времени, когда там накопились данные всей строки. Таблица 7.2 Сравнительные данные некоторых типов разверток Тип развертки Линейная прогрессивная Линейная чересстрочная Цифровая Спиральная прогрессивная Полоса пропус- Синхрокания, МГц низация Устойчивость развертки Сложность системы Наличие гасящих импульсов 12 Простая Устойчивая Простая 6 Сложная Сложная В полосе частот К.С. 7,7 Сложная Менее устойчивая Устойчивая Строчные, кадровые То же Сложная Отсутствуют Менее устойчивая Сложная То же Простая
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 220 Часть III. Развертывающие и синхронизирующие устройства Благодаря наличию памяти каждый пиксель (элемент изображения, включающий три субпикселя — R, G и B) панели светится в течение всего кадра, т. е. мерцания экрана практически отсутствуют. Сравнительные данные рассмотренных выше разверток по отношению к прогрессивной при Z = 625 строк и n = 50 кадров приведены в табл. 7.2. Контрольные вопросы 1. Виды разверток, используемые в прикладном телевидении. 2. Построчная развертка. Достоинства и недостатки. 3. Чересстрочная развертка. Области ее применения. 4. Спиральная развертка. Ее применение в прикладном телевидении. 5. Получение кругового растра. 6. Чем определяется число строк в кадре? 7. Минимальная и максимальная частота кадров для систем прикладного телевидения. 8. Полоса частот видеосигнала при построчной и чересстрочной развертках 9. Принцип построения цифровых развёрток в твёрдотельных матрицах. 10. Дать сравнительный анализ работы достоинств и недостатков построчной и чересстрочной разверток. 11. Обоснуйте выбор типа развёрток в цифровом телевидении.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 8 СИНХРОНИЗАЦИЯ РАЗВЕРТЫВАЮЩИХ УСТРОЙСТВ В ТЕЛЕВИДЕНИИ Дальнейшее развитие техники телевидения невозможно без обеспечения заданных требований к параметрам и специальных методов контроля и оценки качества ТВ изображений. Большое влияние на качество ТВ изображения оказывает и работа систем синхронизации, к параметрам которой, особенно с развитием цветного телевидения, предъявляются повышенные требования. Методы формирования синхронизирующих сигналов можно разбить на два основных класса: аналоговые и дискретные (цифровые). Аналоговые методы долгое время были единственными при формировании синхронизирующих и испытательных сигналов. По мере развития транзисторной и интегральной схемотехники стали развиваться и цифровые методы формирования, которым присущи высокая точность и стабильность. По этой причине в пособии нашли отражение цифровые способы формирования сигналов. В прикладном телевидении в зависимости от назначения системы используются различные виды разверток: построчная, чересстрочная, спиральная, синусоидальная и другие. Если в телевизионном вещании нашла применение в основном чересстрочная развертка с числом строк, равным 625 при 25 кадрах в секунду, то в прикладном телевидении число строк и кадров может быть значительно увеличено. Так, при исследовании аварийных ситуаций и быстродвижущихся объектов число кадров может достигать весьма больших значений (1000 и более кадров в секунду). Стандартные синхрогенераторы такие параметры обеспечить не могут. Поэтому возникает необходимость разработки синхрогенераторов для многостандартных ТВ систем прикладного назначения. Зная принципы формирования сигналов синхронизации, не трудно спроектировать синхрогенератор с заданными параметрами. 8.1. Принципы формирования сигналов синхронизации [31] Для получения синхронизирующих и управляющих импульсов на передающей стороне системы используется специальное устройство —
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 222 Часть III. Развертывающие и синхронизирующие устройства Структурная схема задающего устройства синхрогенератора при построчной развертке Ðèñ. 8.1. Структурная схема задающего устройства синхрогенератора при чересстрочной развертке Ðèñ. 8.2. синхрогенератор, с помощью которого формируются импульсы с требуемыми формой и временными параметрами. Число независимых друг от друга выходов для каждого вида импульса устанавливается в соответствии с числом потребителей. Эти задачи решаются при реализации в разрабатываемом синхрогенераторе необходимых функций. В его задающем устройстве генерируются колебания, между которыми устанавливается жесткая связь по частоте и из которых впоследствии будет сформирована необходимая номенклатура импульсов. В формирующем устройстве синхрогенератора создаются импульсы требуемых формы и временных сдвигов между ними. В выходных устройствах согласования и распределения импульсов каждый из видов импульсов распределяется по нескольким кабельным линиям, соединяющим синхрогенератор с многочисленными потребителями. Задающее устройство синхрогенератора состоит из задающего генератора (ЗГ) и формирователя набора (сетки) опорных частот. Частота ЗГ определяется стандартом развертки. При построчной развертке частота кадров fn , число строк в кадре z и частота строк fz связаны простым соотношением fz = fn z = nz (n — число кадров в секунду), которое определяет структуру задающей части (рис. 8.1). С помощью ряда делителей строчная частота fz делится на z, в результате чего на выходе получается сигнал с кадровой частотой fn . Таким образом, частоты fn и fz жестко связаны между собой и обеспечивают постоянство числа строк в каждом кадре изображения. При чересстрочной развертке каждый кадр изображения состоит из двух полей. Частота f2n , с которой работает кадровая развертка, оказывается вдвое больше, чем частота кадров, т. е. f2n = 2fn . Эта частота связана с числом строк в одном поле и частотой строк соотношением fz = 0,5zf2n . Чтобы получить частоту полей f2n из частоты строк fz , необходимо строчную частоту разделить на z/2, т. е. на число строк в одном поле. Но при чересстрочной развертке число строк в кадре z нечетное и z/2, соответственно, — дробное. Простых способов точного деления частоты с дробным коэффициентом деления не существует.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 223 Поэтому поступают следующим образом. Задающий генератор работает на удвоенной частоте строк 2fz (рис. 8.2). Эта частота делится на целое число z, и на выходе устройства получается частота полей f2n . Для получения частоты строк fz частоту ЗГ 2fz делят на 2. С выхода задающего устройства, таким образом, снимаются три колебания: двойной строчной частоты 2fz , строчной fz и частоты полей f2n = n. Частота колебаний ЗГ, равная двойной строчной частоте, является минимально возможной. В современных синхрогенераторах, как показано ниже, для обеспечения работы формирующего устройства необходима широкая номенклатура импульсов с разными частотами, значительно превышающими строчную или двойную строчную частоту. Значения этих частот колеблются от сотен килогерц до нескольких мегагерц. Тем не менее, из приведенного следует, что частота ЗГ должна быть кратной fz при построчной развертке и 2fz — при чересстрочной. Стабильность работы ЗГ должна быть достаточно высока, чтобы обеспечить в соответствии со стандартом погрешность частоты строк не более 0,016 Гц, что в пересчете в относительную погрешность составит δ = 10−6 . 8.1.1. Требования к сигналам синхронизации Синхронная и синфазная работа развертывающих устройств передающей и приемной сторон ТВ системы обеспечивается импульсами синхронизации. Такими импульсами являются: • синхронизирующие импульсы частоты строк (строчные ведущие импульсы); • синхронизирующие импульсы частоты полей (кадровые ведущие импульсы); • импульсы синхронизации приемников (сложная синхросмесь); • гасящие импульсы приемной трубки (гасящая смесь); • гасящие импульсы передающей трубки. Гасящие импульсы приемной трубки и синхросмесь передаются вместе с видеосигналом. Их параметры (длительность импульсов и их фронтов) нормируются стандартом на ТВ систему. Другие импульсы необходимы только для работы передающего оборудования, в сформированном сигнале они не содержатся, поэтому их параметры выбираются исходя из условий работы данного оборудования. Полная форма гасящих и синхронизирующих импульсов, согласно ГОСТ 7845-92, изображена на рис. 8.3, а их длительности приведены в табл. 8.1. Длительность импульсов отсчитывается в точках, соответствующих 0,5 максимального их размаха, а длительность фронтов — между точками, соответствующими 0,1 и 0,9 размаха импульсов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 224 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.3. Полная форма гасящих и синхронизирующих импульсов Все указанные виды импульсов вырабатываются в специальном устройстве, называемом генератором синхронизирующих импульсов или синхрогенератором (СГ). Таблица 8.1 Временные соотношения импульсов по ГОСТ 7845-92 Параметр Длительность строки Строчный гасящий Передний уступ по строке Передний уступ по кадру Длительность ССИ Длительность поля Длительность кадрового гасящего импульса Длительность уравнивающего импульса Длительность врезки Длительность 1-й последовательности уравнивающих импульсов Длительность 2-й последовательности уравнивающих импульсов Длительность последовательности КСИ Длительность фронтов ССИ и КСИ Условное обозначение Значение (мкс или H) Примечание H a c g α v j ρ r l 64 ± 0,032 12 ± 0,3 1,5± 0,3 3±2 4,7± 0,2 20 мс 25H + a 2,35±0,1 4,7±0,2 2,5H 64 12 1,5 1,5 5 20 25 + a 2,5 5 2,5H n 2,5H 2,5H m f, e 2,5H 0,2±0,1 2,5H 0,2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 225 8.2. Упрощённая структурная схема синхрогенератора Синхрогенератор должен вырабатывать импульсы с частотами строк fс (15625 Гц) и полукадров n (50 Гц). Между этими частотами должно выдерживаться постоянное отношение fс /n = z/2. Число строк z в полукадре при чересстрочной развертке должно быть дробным: fс 2m + 1 1 = =m+ , n 2 2 где m — целое число. Разделить или помножить частоту в дробное число раз практически невозможно. Поэтому эту формулу приводят к виду 2fс = z = 2m + 1. n Теперь частота ЗГ берется равной 2fс , а строчные и полукадровые частоты получаются делением частоты ЗГ на 2 и z (625). Существенно упрощенная схема СГ может быть представлена в следующем виде рис. 8.4. Задающий генератор для обеспечения чересстрочности настроен на двойную строчную частоту 31250 Гц, стабилизируемую кварцевым резонатором. Формирование кадровых и строчных синхроимпульсов (КCИ и ССИ), сигнала синхронизации приемников (ССП), гасящей смеси (ГС), опережающих синхроимпульсов и других, осуществляется в блоке формирования импульсов. Временные сдвиги между импульсами можно выразить в микросекундах или в процентах (см. рис. 8.4) относительно длительности строки H, отсчитанные от начала координат 0, в качестве которого можно взять передний фронт ССИ (рис. 8.5). Формирование импульсов осуществляется триггерами, запускаемыми сигналами с соответствующими фазовыми сдвигами. Требуемые фазовые сдвиги получают, применяя линию задержки, на вход которой подают импульсы с частотой 2fс . Отводы линии задержки, отсчитанные от нулевого фазового сдвига, отмечены в процентах от длительности строки и дают опережение или задержку выходных импульсов относительно переднего фронта ССИ. Основным недостатком рассмотренной схемы является временная нестабильность параметров линии задержки, выполненной, как правило, на мультивибраторах или LC-элементах. Бурное развитие микросхемотехники позволило перейти к другому принципу построения СГ — цифровому, использующему способы и схемные решения вычислительной техники.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 226 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.4. Упрощенная схема синхрогенератора Ðèñ. 8.5. Расчет временных сдвигов Цифровые методы формирования сигналов и изображений возникли и начали использоваться сравнительно недавно. Реальная возможность для их развития появилась только после широкого внедрения интегральных микросхем. Сигналы и изображения, сформированные цифровыми способами, характеризуются высокой точностью и временной стабильностью. 8.3. Метод цифрового формирования сигналов синхронизации Рассмотрим принцип построения синхрогенератора, в основу которого положены цифровые способы формирования сигналов синхронизации. При цифровом формировании сигналов синхронизации линия задержки (рис. 8.4) отсутствует, а временные интервалы определяются длительностью импульсов, получаемых делением частоты ЗГ, при этом период следования импульсов ЗГ установит минимальный временной интервал. Для определения оптимальной частоты ЗГ обратимся к табл. 8.1, в которой приведены основные параметры импульсов синхронизации по ГОСТ 7845-92. Из таблицы видно, что наименьший временной интервал равен 1,5 мкс. Если теперь период колебаний ЗГ взять равным 1,5 мкс, то мы можем получить только временные соотношения импульсов, которые кратны 1,5; 3; 4,5; 6; 7,5 и т. д. Другие соотношения, как, например, 4,7 мкс, 2,35 мкс, получить будет невозможно. Для обеспечения заданных соотношений импульсов необходимо найти наибольший общий делитель (НОД) указанных чисел, который равен 0,05. Отсюда частота задающего генератора f0 = 1 = 20 МГц. 0,05 · 10−6 c
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 227 Естественно, полученная частота ЗГ является слишком большой, что приведет к усложнению схемы и повышению требований к быстродействию применяемых микросхем. Для существенного снижения частоты ЗГ параметры некоторых импульсов желательно округлить до значения, кратного 0,25 или 0,5. Это незначительное изменение никак не скажется на работе синхронизирующих устройств, но значительно упростит процесс формирования импульсов и методику изложения. С этой целью в последней колонке табл. 8.1 приведены значения временных параметров импульсов, кратные 0,5, что соответствует частоте задающего генератора f0 = 1 = 2 МГц. 0,5 · 10−6 c Это в 10 раз меньше первоначально полученного значения 20 МГц. Для более точного соблюдения ГОСТ значения временных параметров берут кратными 0,25 и менее. Выбранный нами интервал в 0,5 мкс позволит получить любое временное соотношение, кратное 0,5, причем ошибка формирования будет определяться степенью стабильности частоты ЗГ. Исходя из вышеизложенного, рассмотрим в качестве примера принцип формирования сигналов синхронизации цифровым способом. 8.4. Формирование импульсов строчной частоты Пусть имеется несколько периодических последовательностей импульсов X1 , X2 , X3 ,..., периоды которых кратны периоду колебаний ЗГ X0 (T = 0,5 мкс) (рис. 8.6), а частоты кратны частоте строк. Принцип формирования ВЧ сигналов синхронизации (строчных импульсов) заключается в следующем. Сигнал, вырабатываемый ЗГ, с частотой f0 = 2 МГц поступает на двоичный делитель строк 1:128. Сигнал X7 соответствует частоте строк fс = 2 МГц : 128 = 15625 Гц. Делитель представляет собой двоичный счетчик, выполненный на потенциальных триггерах и формирующий импульсы прямой X1 , X2 , ... и инверсной X̄1 , X̄2 , ... полярности. В этом случае импульсы X1 , X2 , X3 , X4 , X5 , X6 , X7 будут иметь длительности, равные 0,5; 1; 2; 4; 8; 16; 32 мкс соответственно. Совокупность импульсов X1 , X2 , X3 , ... (рис. 8.6), снимаемых с триггеров двоичного счетчика, представляет собой линейно-возрастающую цифровую развертывающую функцию горизонтальной дискретизации. Такие сигналы позволяют при помощи логической схемы сформировать любой прямоугольный импульс либо их сочетания, следующие с частотами fс , 2fс , 4fс , ..., nfс . Минимальные по длительности первичные сигналы X0 , X̄0 являются базисными импульсами, и их величина обусловливается степенью приближения к заданному параметру формируемого импульса.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 228 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.6. Формирование импульсов строчной частоты Местоположение выходных сигналов (строчного гасящего, строчного синхронизирующего и др.) на временной диаграмме рис. 8.6 может быть выбрано любое. Обычно рекомендуется их местоположение выбирать таким образом, чтобы условное начало строки или сброс счетчика 128-м импульсом (на диаграмме все импульсы X0 пронумерованы от 0 до 127) соответствовали началу прямого хода строчной развертки. Это удобно для синтеза других разнообразных изображений, располагаемых на активной части растра. В нашем случае расположение всех выходных импульсов в правой части диаграммы рис. 8.6 весьма неудобно для объяснения с методической точки зрения. В то же время сдвиг выходных сигналов к началу переднего фронта импульса X7 создает определенные удобства в объяснении и не вызовет никаких затруднений в будущем при формировании других изображений, так как практически все счетчики в этот момент, кроме последнего X7 , сбрасываются в 0. Примем за начало отсчета временных интервалов импульсов синхронизации передний фронт строчного гасящего импульса (СГИ), который совместим во времени с передним фронтом импульса X7 . По ГОСТ длительность СГИ равна 12 мкс. Из диаграммы (рис. 8.6) видно, что длительность СГИ может быть получена из временных интервалов импульсных последовательностей X5 и X4 . Простым сумми-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 229 рованием X5 и X4 СГИ получить нельзя, так как их частота не равна fс . Но, если соответствующим образом перемножить импульсные последовательности X7 , X6 , X5 и X7 , X6 , X5 , X4 , а затем сложить, то получим СГИ Fг с частотой fс : Fг = F1 + F2 = X7 X̄6 X̄5 + X7 X̄6 X5 X̄4 . (8.1) При составлении выражения (8.1) по временной диаграмме рис. 8.6 берется инверсный сигнал (например X̄6 , X̄5 , X̄4 ), если значение импульса в рассматриваемый момент равно 0, если же значение импульса равно 1, то берется сама величина. Это необходимо для того, чтобы значение функции Fг в заданном промежутке времени (12 мкс) было равно 1. В противном случае выражение (8.1) теряет смысл. В формуле (8.1) каждое логическое произведение задает местоположение, длительность и частоту формируемых импульсов. Например, в произведении X7 X̄6 X5 X̄4 сомножитель X̄4 задает точное местонахождение импульса F2 и его длительность. Частоту следования задает другой сомножитель X7 . Остальные члены (X̄6 и X5 ) исключают возможность появления других импульсов за время строки Tс . Таким образом, сочетание X7 X̄6 X5 X̄4 за время строки не повторяется. Формулу (8.1) желательно привести к виду, позволяющему использовать универсальные логические элементы И-НЕ и ИЛИ-НЕ: Fг = F1 + F2 = F1 + F2 = F̄1 + F̄2 . Строчный синхронизирующий импульс (ССИ) в целях упрощения схемного построения формируется несколько по-другому. Передний фронт ССИ отстоит от переднего фронта СГИ на 1,5 мкс. На временной диаграмме рис. 8.6 от переднего фронта СГИ отсчитываются три полупериода последовательности импульсов X1 . Отметив на диаграмме точное положение переднего фронта ССИ, приступим к формированию плоской вершины ССИ. Обычный путь перемножения и сложения импульсных последовательностей приводит к усложнению схемы. Действительно, Fс = X7 X̄6 X̄5 X̄4 X̄3 X2 X1 + X̄7 X̄6 X̄5 X̄4 X3 + +X7 X̄6 X̄5 X4 X̄3 + X7 X̄6 X̄5 X4 X3 X̄2 X̄1 . Полученная формула содержит не менее четырех логических операций. Поэтому, если какой-либо из сигналов после минимизации выражается сложной функцией, требующей для реализации большого числа логических ячеек, то формирование такого сигнала целесообразно осуществлять с помощью RS-триггера, запуск и сброс которого осуществляется импульсами, выделяемыми с помощью двух логических ячеек.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 230 Часть III. Развертывающие и синхронизирующие устройства В соответствии со сказанным, логическое выражение для переднего фронта ССИ будет выглядеть следующим образом: F3 = X7 X̄6 X̄5 X̄4 X̄3 X2 X1 . Срез F4 определяется выражением F4 = X7 X̄6 X̄5 X4 X3 X̄2 X1 . Импульс длительностью 5 мкс формируется триггером T1 в блоке формирователя импульсов (рис. 8.7). Если из выражения для F3 изъять сомножитель X7 , то F3′ = X̄6 X̄5 X̄4 X̄3 X2 X1 будет определять начало уравнивающих импульсов и срезов врезок, следующих с двойной строчной частотой, а также и начало кадровых синхронизирующих импульсов КСИ. Из временной диаграммы на рис. 8.6 видно, что уравнивающий импульс Fур формируется сложением двух импульсов: F3′ (tи = = 0,5 мкс) и F5 = X̄6 X̄5 X̄4 X3 (tи = = 2 мкс): Fур = F3′ + F5 = F¯′ 3 + F̄5 . Ðèñ. 8.7. Блок формирователя импульсов строчной частоты Передний фронт врезки отстоит от заднего фронта на 5 мкс и может быть задан на временной диаграмме выражением F6 = X6 X5 X4 X̄3 X̄2 X1 . Формирование врезки осуществляется RS-триггером (см. рис. 8.7). В соответствии с полученными выражениями строится принципиальная схема (рис. 8.7). Принципиальная схема состоит из дешифратора на ограниченное число сочетаний, определяемое количеством формируемых импульсов, и формирователя импульсов. Дешифратор задает временные соотношения импульсов синхронизации
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 231 в соответствии с табл. 8.1, осуществляет соответствующую выборку и определяет точное местонахождение импульсов, задавая им передние и задние фронты. Формирование самих импульсов синхронизации происходит в блоке формирования импульсов с помощью триггеров и логических схем. Сигналы X1 , X2 , X3 , X4 , X5 , X6 , X7 снимаются с прямых выходов соответствующих триггеров счетчика строчной частоты, а X̄1 , X̄2 , X̄3 , X̄4 , X̄5 , X̄6 , X̄7 — с инверсных выходов этого же счетчика. 8.5. Формирование импульсов кадровой частоты Формирование НЧ сигналов синхронизации наглядно поясняется рис. 8.8 и 8.9. Отметим некоторые особенности построения схемы. Счетчик формирования сигналов Y1 , Y2 , ...Y10 целесообразно выполнять в виде одного делителя на 625 (в отличие от классического построения, где используется два делителя по 1:25). С этой целью с двоичного счетчика, состоящего из 10 триггеров, выделяют импульсы, логическое выражение которых Y10 Y9 Y8 Y7 Y6 Y5 Y4 Y3 Y2 Y1 = P625 = 1001110001(2) = 625(10) соответствует 625 импульсу двойной строчной частоты 2fс (X6 ) и тем самым снижает кратность деления счетчика с 1024 до 625. Установка нуля счетчика осуществляется 625 импульсом (Р625 ), формируемым логической схемой. Такое построение делителя позволит легко выделить строку или требуемую группу строк при формировании испытательных сигналов. Рассмотрим принцип формирования НЧ-сигналов синхрогенератора (рис. 8.8 и 8.9). Сигнал с двойной строчной частотой X6 (2fс ) поступает на вход делителя 1:625. С помощью двоичного делителя (счетчика) и последующего дешифрирования соответствующих сигналов определяются временные местоположения КГИ — Vг , КСИ — Vс сигналов для вырезывания строчных синхронизирующих и уравнивающих импульсов V5 и V7 . Формирование КГИ. Кадровый гасящий импульс КГИ имеет длительность, равную 25H. На временной диаграмме рис. 8.8 имеются импульсы длительностью 24,5H, недостающие 0,5H легко получаются из последовательности импульсов Y1 (fс ). В последовательности импульсов Y1 передние фронты импульсов совпадают по времени с передними фронтами СГИ (см. рис. 8.8). Таким образом, КГИ Vг , будет составлен из двух импульсов: Vг = V1 + V2 = Y10 Ȳ7 Y6 Y5 Y4 Y3 Y2 Y1 + Y10 Y7 . При этом импульс V1 соответствует, как это видно из временной диаграммы рис. 8.8, такому состоянию счетчика кадровой частоты, когда
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 232 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.8. Формирование импульсов кадровой частоты в старшем разряде Y10 появляется единица, т. е. импульс V1 определяется в интервале времени от 512 до 625 импульса. КГИ можно также сформировать и с помощью RS-триггера, запуск и сброс которого можно осуществлять импульсами V̄1 и установки «0». В целях упрощения схемного получения V1 и V2 из выражения для Vг выброшены сомножители Y8 и Y9 . Без членов Y8 и Y9 формула дает точное местонахождение КГИ и притом единственное на отрезке времени от 1-го до 625-го импульса. В отрезке же времени от 625-го до 1024-го импульса эта комбинация без Y8 и Y9 может встретиться еще три раза. Действительно, все двоичные десятиразрядные числа от 512 и до 625 не содержат в 9-м и 8-м разрядах единиц, т. е. Y8 = = Y9 = 0 на всем участке двоичных чисел: 10000000002 (51210 ) − 10011100012 (62510 ).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 233 Глава 8. Синхронизация развертывающих устройств Ðèñ. 8.9. Форма ССП в интервале времени КГИ Более наглядно это поясняется так: Y10 1 512 Ȳ9 Ȳ8 Y7 0 0 1 256 128 64 Y6 1 32 Y5 1 16 Ȳ4 0 8 Ȳ3 0 4 Ȳ2 0 2 Y1 1 1 512 + 0 + 0 + 64 + 32 + 16 + 0 + 0 + 0 + 1 = 625 Появление 1 даже в 8-м разряде уже дает число (512 + 128 = = 640 > 625), которое находится за пределами рассматриваемого участка. В интервале времени от 1 до 511 импульса в 8-м и 9-м разрядах (Y8 и Y9 ) по мере счета единицы будут появляться, но это уже будут 9-разрядные двоичные числа, имеющие другую комбинацию, так как здесь Y10 = 0. Если теперь рассмотрим комбинацию 10-разрядных двоичных чисел, то в интервале чисел 1–511 на восьми входах логической схемы И старший разряд Y10 = 0, что автоматически дает 0 на выходе дешифратора (т. е. 1 здесь не появится независимо от того, подключены ли были к схеме И выходы триггеров 8-го и 9-го разрядов или нет). В интервале чисел от 512 до 625 в 10-м разряде появляется «1», а в 8-м и 9-м — только «0». В момент прихода 575 импульса 10001111112 = 57510 , соответствующего выражению V1 = Y10 Ȳ7 Y6 Y5 Y4 Y3 Y2 Y1 , на выходе схемы И появится 1, фиксирующая передний фронт КГИ. Отсутствие Y8 и Y9 на входе схемы И здесь также не влияет на результат. По этой же причине логическая схема «Уст. 0» также не будет содержать членов Y8 и Y9 . Из представ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 234 Часть III. Развертывающие и синхронизирующие устройства ленного выше выражения числа 625 видно, что для выделения импульса «Уст. 0» на практике достаточно 5 членов V0 = Y10 Y7 Y6 Y5 Y1 . Это логическое выражение соответствует импульсу, появляющемуся на выходе схемы один раз за 625 счетных импульсов. Таким образом, дешифратор двоичной комбинации (см. выше выражение для КГИ Vг ) выдает только один импульс за время полукадра. В дальнейшем при формировании других импульсов члены Y8 и Y9 целесообразно также исключать из выражений. Примечание. Исключение членов Y8 и Y9 не означает на практике понижения разрядности. Дешифратор считает одну единицу 10-го разряда Y10 двоичного числа, равным 512 единицам десятичного числа, и так далее, в зависимости от веса разряда и наличия в нем 1 или 0. Формирование КСИ. Передний фронт кадрового синхронизирующего импульса КСИ отстоит от переднего фронта КГИ на 2,5H + + 1,5 мкс (см. табл. 8.1). Начало КСИ задается выражением V3 = Y10 Y7 Ȳ6 Ȳ5 Ȳ4 Y3 Fур . Сомножитель Fур привязывает начало КСИ к началу уравнивающего импульса и обеспечивает необходимый сдвиг в 1,5 мкс. Недостающие 0,5H получаются дешифрированием комбинации V4′ = Y10 Y7 Ȳ6 Ȳ5 Y4 Ȳ3 Ȳ2 Ȳ1 . Сложив V3 и V4′ , получим КСИ Vс = V3 + V4′ = V̄3 + V̄4′ . Практически иногда удобнее формировать КСИ с помощью RSтриггера, запуск и сброс которого осуществлять импульсами V3 и V4 : V4 = Y10 Y7 Ȳ6 Ȳ5 Y4 Ȳ3 Ȳ2 Y1 . Формирование сигналов V5 и V̄7 . Импульс V5 (см. рис. 8.9) вырезает уравнивающие импульсы, a V̄7 — ССИ. Эти сигналы необходимы для формирования ТВ сигнала во время обратного хода кадровой развертки. Формирование временного интервала V̄7 целесообразнее проводить с помощью RS-триггера. Передний фронт V̄7 задан началом КГИ V1 , а местоположение заднего фронта (см. рис. 8.8) определяется выражением V6 = Y10 Y7 Ȳ6 Ȳ5 Y4 Y3 Y2 Ȳ1 . Формирование сигнала V5 осуществляется логической операцией, условия работы которой задаются в табл. 8.2.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 235 Таблица 8.2 Условия работы логической операции для формирования сигнала V5 Vс V̄7 V5 0 0 1 1 0 0 0 1 0 Составляя выражение по «1», получим для V5 : V5 = V̄с + V̄¯ 7 = Vс + V̄7 . Аналогично формируется КСИ с врезками W3 : W3 = Vс + F̄вр = V̄с + Fвр . Принципиальная схема дешифратора и формирователя импульсов кадровой частоты (рис. 8.10) строится по аналогичной методике, описанной выше, отметим только некоторые ее особенности. При формировании КГИ срез устанавливается импульсом установки «0», отрицательный перепад напряжения которого совпадает с перепадом напряжения импульса Ðèñ. 8.10. Принципиальная схеV̄2 . Импульс «Уст. 0» формируется ма дешифратора и формироватесхемой И-НЕ после окончания слеля импульсов кадровой частоты дования 625-го импульса двойной строчной частоты. Этот импульс используется также и для сброса в состояние «0» всех триггеров делителя (счетчика) кадровой частоты (рис. 8.8). Импульс V5 специально не формируется, а получается автоматически при использовании импульсов Vс и V̄7 . 8.6. Формирование СС и ГС Принципиальная схема и принцип формирования сигнала синхронизации приемников (синхросмеси) и гасящей смеси показаны на рис. 8.11 и 8.12. Принципиальная схема составляется в соответствии с логическими выражениями на основании таблиц истинности, которые отражают работу схемы формирования ССП. При составлении таблиц истиннос-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 236 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.11. Принципиальная схема формирования сигнала синхронизации приемников (синхросмеси) и гасящей смеси ти нужно знать входные и выходные сигналы устройства. Из рис. 8.12 видно, что входными сигналами устройства формирования СС являются Fс — ССИ, Fур — уравнивающие импульсы, Fвр — врезки, Vс — КСИ, V7 — импульс для вырезывания (подавления) ССИ, а выходным сигналом WΣ (синхросмесь) — сигнал синхронизации приемников; промежуточными выходными сигналами W1 — ССИ с перерывами в интервале следования уравнивающих импульсов и КСИ, W2 — передние и задние уравнивающие импульсы, W3 — КСИ с врезками. Из рис. 8.12 видно, что WΣ = W1 + W2 + W3 . Ðèñ. 8.12. Принцип формирования ССП
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 237 Глава 8. Синхронизация развертывающих устройств Таблица 8.3 Таблица истинности для формирователя СС CCB Вход Уравнивающий импульс Вход Вых. Вых. КСИ Вход Вых. Fс V7 W1 Fур Vс V7 W2 Fвр Vс W3 1 1 0 1 1 0 1 1 0 1 1 1 1 0 1 1 0 1 0 0 0 0 0 Представим таблицу истинности для формирователя СС и ГС в виде табл. 8.3. Составим логические выражения по «1»: W1 = Fс V̄7 ; W2 = Fур V̄с V7 ; W3 = F̄вр Vс ; WΣ = W1 + W2 + W3 = W̄1 W̄2 W̄3 . Схема формирования гасящей смеси ГС определяется выражением Fг + Vг = Fг + Vг = F̄г + V̄г . Полученные выражения позволяют построить схему формирования СС и ГС. 8.7. Структурная схема синхрогенератора На рис. 8.13 представлена структурная схема синхрогенератора, реализующая цифровой принцип формирования СС. Ðèñ. 8.13. Структурная схема синхрогенератора
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 238 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 8.14. Импульсы строчной частоты Ðèñ. 8.15. Импульсы кадровой частоты
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств Ðèñ. 8.16. Формирование ССП и ГС (крупный план) Ðèñ. 8.17. Формирование ССП и ГС 239
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 240 Часть III. Развертывающие и синхронизирующие устройства Задающий генератор настроен, для упрощения схемы, на 128 гармонику строчной частоты — 2 МГц. Восьмиразрядный счетчик формирования сигналов X0 , X1 , X2 , . . . , X7 с целью повышения быстродействия выполняется по схеме параллельного переноса. Хотя для реализации заданных параметров синхроимпульсов достаточно с выхода ЗГ иметь частоту 2 МГц (128fс ), все же целесообразно ЗГ настраивать на более высокую частоту (4 или даже 8 МГц). Это облегчает получение специальных испытательных сигналов при формировании телевизионной испытательной таблицы (ТИТ). Если строчный счетчик обнуляется автоматически за каждые 128 (256) импульсов, то кадровый счетчик обнуляется 625-м импульсом, сформированным дешифратором полей. С выхода делителей на дешифраторы строк и полей поступают комбинации соответствующих сигналов X1 , X2 , X3 , X4 , X5 , X6 , X7 и Y1 , Y2 , Y3 , Y4 , Y5 , Y6 , Y7 , Y10 для задания временных интервалов синхроимпульсов. Как видно из схемы, сигналы Y8 и Y9 на вход дешифратора полей не поступают, что позволяет сократить число используемых логических схем. Блок формирования импульсов выдает все импульсы, необходимые для нормальной работы телевизионной системы. В блоке формируются также и сигналы цветовой синхронизации. Описанный синхрогенератор можно сравнительно просто перестраивать на различные стандарты, а также обеспечивать ведомый режим с цифровой автоподстройкой фазы. Ценной особенностью такого синхрогенератора для устройств электронного синтеза является однозначная связь всех его импульсов с частотой ЗГ. В устройствах отображения информации сформированное с помощью такого синхрогенератора изображение просто подвергнуть временному преобразованию с помощью изменения частоты ЗГ. При этом формируемое изображение можно передать с незначительной скоростью по узкополосному каналу связи либо осуществить его документирование с помощью фототелеграфного аппарата или графопостроителя. В качестве примера на рис. 8.14–8.17 приведены осциллограммы сигналов синхронизации, смоделированных на компьютере по выражениям, приведенным в разд. 8.4–8.6, в соответствии с табл. 8.1 и рис. 8.1–8.13. Контрольные вопросы 1. 2. 3. 4. 5. мени? Почему для чересстрочной развертки выбрано нечетное число строк? Для чего применяется чересстрочная развертка? Какие требования предъявляются к форме синхроимпульсов? Почему в КСИ сделаны врезки двойной строчной частоты? Почему ССИ и КСИ насаживаются на гасящие импульсы со сдвигом во вре-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 8. Синхронизация развертывающих устройств 241 6. Назовите примерные длительности ССИ, КСИ, уравнивающих импульсов и врезок. 7. Для чего нужны гасящие импульсы? Что произойдет с телевизионным изображением, если на кинескоп не будут поданы: а) СГИ; б) КГИ? 8. Как будет выглядеть телевизионное изображение: а) при наличии синхронности разверток на передатчике и приемнике, но при отсутствии синфазности; б) если частота строчной (кадровой) развертки в приемнике будет в два раза меньше (больше) частоты соответствующей развертки на передатчике? 9. В чем заключается цифровой принцип формирования СС? Его преимущества перед аналоговым? 10. Почему в канале строчной синхронизации применена схема ФАПЧ задающего генератора?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 9 ПРИНЦИПЫ ФОРМИРОВАНИЯ СИГНАЛОВ ТЕЛЕВИЗИОННЫХ ИСПЫТАТЕЛЬНЫХ ИЗОБРАЖЕНИЙ 9.1. Назначение сигналов испытательных изображений Для оценки основных характеристик передающей и приемной телевизионной аппаратуры, а также для проверки качества изображения, которое может обеспечить ТВ оборудование, используют специальные испытательные изображения — оптические и электронные. Оптические таблицы используются для проверки передающих камер. Для измерения и проверки тракта, передающей и приемной аппаратуры ТВ системы предпочитают использовать электронные и электрические испытательные таблицы. Электронные испытательные таблицы, которые ранее формировались специальными трубками типа моноскоп, требуют громоздкой аппаратуры — вакуумных трубок, источников высокого напряжения и т. д. Испытательные изображения, формируемые электрическим путем, просты в реализации, а использование микросхем позволяет создавать малогабаритные генераторы испытательных сигналов, надежные в работе и экономичные в потреблении электроэнергии. При этом сам испытательный сигнал (ИС) свободен от искажений, возникающих в вакуумных трубках (апертурные и координатные искажения, эффект черного пятна, нарушение яркостных градаций и др.). По этой причине они нашли самое широкое распространение в ТВ технике. Испытательные изображения и ИС позволяют проверить и измерить следующие основные параметры: размер и формат изображения; координатные искажения; четкость изображения; воспроизведение градаций яркости; частотные и фазовые искажения сигналов изображений; точность сведения лучей в масочных кинескопах; воспроизведение сигнала цветного телевидения. Для проверки указанных параметров используются следующие ИС: а) вертикальных и горизонтальных полос; б) шахматного поля; в) сетчатого и точечного полей; г) градационного клина; д) круговых фигур; е) цветных полос; ж) рамки таблицы; з) горизонтальной полосы; и) «креста» и др.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений 243 Вертикальные и горизонтальные линии различной частоты следования используются для измерения четкости изображения. Для измерения горизонтальной четкости используются пакеты синусоидальных колебаний частотой 0,5; 1,5; 2,8; 4,43; 6,0; 7,3 МГц. С помощью сигнала шахматного поля возможна качественная оценка работы строчной и кадровой разверток, а также оценка нелинейности по горизонтали и по вертикали, проверка размера изображения и его стабилизации, проверка геометрических искажений растра и центрирования изображения. С помощью испытательного сигнала сетчатого и точечного полей можно проводить операции статического и динамического сведения лучей трехлучевого кинескопа, оценивать геометрические и нелинейные искажения в пределах внутрикадрового пространства, а также визуально оценивать передачу мелкоструктурных составляющих видеосигнала. Для оценки числа воспроизводимых градаций яркости используют испытательные сигналы, создающие на приемном экране изображение в виде ряда полосок различной яркости. Изображения и сигналы градаций яркости в цветном телевидении используются также и для проверки динамического баланса белого и амплитудных характеристик. Основные характеристики изображения градаций яркости следующие: • направление градаций вертикальное и горизонтальное; • направление градационных уровней бывает преимущественно от белого к черному, но иногда от черного к белому; • число градаций яркости изменяется в широких пределах (от 5 до 15); • яркость градационных уровней может соответствовать яркостному сигналу нормализованных цветных полос. При оценке на приемном экране числа воспроизводимых градаций яркости удобно, чтобы яркость наблюдаемых полосок воспринималась изменяющейся равномерно. Восприятие приращений яркости должно подчиняться закону Вебера–Фехнера. Согласно этому закону в широком диапазоне изменения яркостей ощущение ∆S различия яркостей двух смежных поверхностей зависит не от абсолютного значения их разности ∆В = B2 − B1 , а определяется их относительной величиной δ = Bn /Bn+1 . Таким образом, для того чтобы яркость ряда градационных полосок воспринималась глазом равномерно возрастающей или убывающей, отношение яркостей соседних полосок должно быть постоянным: δ = Bn /Bn+1 = const .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 244 Часть III. Развертывающие и синхронизирующие устройства Испытательное изображение круга используется для визуальной оценки геометрических искажений в пределах внутрикадрового пространства. Хотя нелинейности оптического проецирования развертывающих устройств в одинаковой степени приводят к нарушению геометрического подобия как квадратов, так и окружностей, наш глаз наиболее чувствителен к искажениям форм окружностей. Эллипсовидные и яйцевидные фигуры, в которые превращаются окружности, становятся сразу же заметными на глаз по сравнению с изменениями прямоугольников. Основным испытательным изображением для настройки, проверки и ремонта приемников цветного телевидения является изображение цветных полос. Они позволяют осуществить ряд регулировок [7]. Рамка таблицы предназначена для правильного позиционирования испытательного изображения в пределах экрана воспроизводящего устройства. Рамка должна охватывать изображение таблицы со всех сторон. Обычно она выполняется в виде узких полосок, заполненных по закону шахматного поля. Сигнал горизонтальной полосы используется для измерения переходной характеристики или возникающих искажений в области низких частот, а также для проверки степени фиксации уровня гасящих импульсов. Сигналы, соответствующие этим прямоугольникам, при отсутствии искажений будут иметь вид П-образных импульсов различной длительности. Искажения дифференциального или интегрального типов на низких частотах приведут к перераспределению яркости на указанных горизонтальных полосках: по направлению строчной развертки. Горизонтально ориентированный в структуре ТВ изображения черный, например, прямоугольник в первом случае будет постепенно светлеть, сразу же за его правой стороной образуется «тянучка» более светлая, чем окружающий ее фон. Подобные искажения более заметны, чем длиннее прямоугольник. Испытательное изображение «Крест» состоит из одной центральной вертикальной и одной центральной горизонтальной белых линий на черном фоне. Этот сигнал используется для статического и динамического сведения сигналов основных цветов и центровки изображения. Кроме перечисленных испытательных сигналов, существуют и другие сигналы. Строчный пилообразный сигнал, изображение которого представляет собой поле с яркостью, линейно изменяющейся в горизонтальном направлении. Этот испытательный сигнал используется для оценки амплитудной характеристики канала изображения. Для контроля чистоты цвета используется целый ряд испытательных сигналов, формирующих на экране кинескопа равномерные серое, красное, зеленое и синее поля.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений 245 Для контроля установки нулевых точек демодуляционных характеристик частотных детекторов формируется испытательный сигнал, ′ содержащий в строке DB цветовую поднесущую fOB = 4,250 МГц, а ′ в строке DR — fOR = 4,406 МГц. Рассмотрим принцип формирования сигналов испытательных изображений. 9.2. Синтез испытательных изображений Существуют различные способы формирования изображений на ТВ экране, основанные на оптической проекции реального изображения или электрическом синтезе структуры соответствующего видеосигнала в пределах и последовательности кадров. Эти методы достаточно полно освещены в литературе и периодической печати. В последнее время наиболее широкое применение нашли методы формирования изображений электрическим путем, которые можно разбить на три класса: аналоговые, дискретные и комбинированные. Синтезируемое изображение, подлежащее отображению на ТВ экране, можно рассматривать как совокупность конечного числа элементарных участков, характеризующихся геометрическим местоположением и мгновенными значениями яркости. При аналоговом формировании сигнала ТВ изображения необходимы вспомогательные напряжения определенной формы с периодом повторения, равным периоду строки H и периоду полукадра V , которые подвергаются некоторой обработке. С помощью аналоговых методов сравнительно несложно формировать разнообразные многоградационные изображения и первичные сигналы. Однако аналоговым способам формирования присущи недостатки: невысокая точность, временная и температурная нестабильность. Указанные недостатки в отдельных случаях бывают несущественными, но иногда они не позволяют получить необходимые результаты. К дискретным (цифровым) методам в первую очередь следует отнести методы математической логики, применяемые для синтеза сложных изображений из первичных сигналов. В отличие от аналогового варианта формирования изображений, когда в пределах строк ТВ растра изображение определяется непрерывной функцией, при цифровом формировании элементы (отсчёты) изображения могут располагаться только в точно определенных частях растра. Для этого растр предварительно дискретизируется на отдельные участки прямоугольной формы. Эти участки называются дискретными элементами и имеют размеры по горизонтали ∆X (горизонтальный шаг) и по вертикали ∆Y (вертикальный шаг). Горизонтальный шаг в пределах внутрикадрового пространства может быть равен или кратен вертикальному шагу телевизионной развертки δ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 246 Часть III. Развертывающие и синхронизирующие устройства Дискретным способам присущи высокая точность и временная и температурная стабильность изображений. К комбинированным следует отнести методы синтеза ТВ изображений, в которых находит применение как аналоговая, так и дискретная техника. Применение комбинированных методов позволяет добиться необходимой точности при незначительной затрате оборудования. Эти методы основаны на аналого-цифровом и цифроаналоговом преобразованиях. При формировании испытательных изображений, однако, наиболее широкое распространение нашли цифровые методы, использующие математический аппарат алгебры логики. Любое сложное ТВ изображение в данном случае можно рассматривать как состоящее из ряда простых (первичных) изображений. Вполне понятно, что первичные сигналы должны иметь дискретный характер и представляться одним из известных кодов, в частности двоичным. При синтезе сложных изображений с большим числом входных сигналов часто используется метод временных диаграмм, при котором входные и выходные сигналы совмещают по времени. Как показали исследования, все многообразие испытательных сигналов можно получить из первичных сигналов, а именно из сигналов вертикальных и горизонтальных полос. Формирование горизонтальных и вертикальных полос различной толщины или частоты следования осуществляется за счет использования элементарной логической операции умножения. Рассмотрим реализацию данного метода для формирования некоторых испытательных изображений. Пусть имеем три входных сигнала X1 , X2 , Y1 . При этом X1 и X2 образуют на экране вертикальные полосы, a Y1 — горизонтальные (рис. 9.1). Перемножив два первичных сигнала X1 и X2 , получим частоту следования выходного сигнала F1 , равную частоте сигнала X2 , а длительность — X1 . Перемножение сигналов X1 и Y1 дает сигнал точечного поля F2 = X1 Y1 , а сложение — сигнал решетки F3 = X1 + X2 . Аналогично могут быть получены и сигналы более сложных испытательных изображений. На рис. 9.2 представлены изображения первичных сигналов X0′ , X0 , X1 (см. рис. 8.6), Y2 , Y3 , Y4 (см. рис. 8.8). Если использовать элементарные правила алгебры логики, то можно легко составить логические функции для формирования различных испытательных сигналов. В табл. 9.1 приведены изображения формируемых испытательных сигналов и их логические функции F1 –F12 . Как видно из таблицы, каждое испытательное изображение можно формировать из первичных сигналов при помощи логических элементов, которые могут быть сведены в диодную или транзисторную матрицу.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 247 Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.1. Принцип формирования испытательных изображений Таблица 9.1 Испытательные сигналы и их функции Испытательное Выходной сигнал и Испытательное Выходной сигнал и изображение его логическая функция изображение его логическая функция F1 = X0 X0′ F2 = F1 X1 = X0 X0′ X1 F3 = Y 2 Y 3 F4 = F3 Y4 = Y2 Y3 Y4 F5 = F1 + F3 = = X0 X0′ + Y2 Y3 F6 = F2 + F4 = = X0 X0′ X1 + Y2 Y3 Y4 F7 = X̄0 Y3 + X0 Ȳ3 F8 = X̄1 Y4 + X1 Ȳ4 F9 = F1 F3 = X0 X0′ Y2 Y3 F10 = F2 F4 = = X0′ X0 X1 Y2 Y3 Y4 F11 = F7 F8 = (X̄0 Y3 + + X0 Ȳ3 )(X̄1 Y4 + X1 Ȳ4 ) F12 = F̄7 F̄8 = = X̄0 Y2 + X0′ Ȳ2 Таблица 9.2 Таблица истинности функции F8 Ðèñ. 9.2. Сигналы для формирования испытательных изображений X1 Y4 F8 1 0 1 0 1 1 0 0 0 1 1 0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 248 Часть III. Развертывающие и синхронизирующие устройства Для примера рассмотрим синтез логической функции F8 шахматного поля. Составим таблицу истинности для F8 . Если X1 = 1 (или 0), Y4 = 1 (или 0), то F8 = 0, а когда X1 = 1 (или 0), Y4 = 0 (или 1), то F8 = 1, т. е. получаем таблицу состояний X1 , Y4 и F8 (табл. 9.2). Логическое выражение составляем по «1» (по условиям истинности): F8 = X̄1 Y4 + X1 Ȳ4 . (9.1) Составляя выражение по «0», получим F8 = (X̄1 + Y 4 )(X1 + Y4 ), которое преобразованием приводится к виду (9.1). Если поменять местами черные и белые клетки, то выражение для изображения шахматного поля примет вид F8 = X1 Y4 + X̄1 Ȳ4 . Аналогично реализуются и другие логические функции. 9.3. Принципиальные схемы датчиков ИС Рассмотрим несколько примеров практической реализации датчиков испытательных сигналов (ИС) (см. табл. 9.1). Принципиальные схемы датчиков вертикальных, горизонтальных и наклонных линий, а также сетчатого, точечного и шахматного полей непосредственно строятся из логических выражений табл. 9.1, и составление их не вызывает каких-либо трудностей. Некоторые трудности и особенности в построении принципиальных схем встречаются при формировании градационного клина, круговых фигур и цветных полос. А. Цифровое формирование градационного клина Цифроаналоговые методы позволяют сравнительно просто формировать многоградационные сигналы, применяемые в телевидении для контроля установки уровня черного и контрастности изображения. Рассмотрим несколько методов формирования многоградационных клиньев. В настоящее время для формирования градационных клиньев широко используются цифровые способы, позволяющие получить более высокую точность и стабильность размаха ступенек (>0,1 %), чем аналоговые методы. При цифровых методах формирования ступенчатого сигнала с линейным законом изменения используется преобразование сигнала цифрового кода в аналоговый сигнал. Преобразование осуществляется резистивными сетками. Сигнал цифрового кода получается от триггерного счетчика (рис. 9.3), на вход которого подаются импульсы Fxn . Период повторения импульсов Fxn определяет длительность сту-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений 249 пенек. Число триггеров счетчика n выбирается в зависимости от числа ступенек N : n = log2 N . Линейный градационный клин формируется с помощью счетчика СТ (рис. 9.3). На вход счетчика поступают тактовые импульсы Fxn . Временные интервалы градационных клиньев при изменении часто- Ðèñ. 9.3. Преобразование сигнала ты Fxn могут изменяться в широких цифрового кода в аналоговый сигнал пределах. Цифроаналоговый преобразователь (ЦАП), на который подается стабилизированное напряжение Eэ , позволяет получить высокую стабильность размаха отдельных уровней. Логические ячейки И1 , И2 , ..., Иn позволяют ограничить градационный клин в пределах выбранного участка растра (таблицы). Осуществляется это подачей стробирующего адресного сигнала. Направление возрастания уровня градационного клина может быть изменено на обратное использования инверсных сигналов триггеров счетчика СТ. В методическом плане для наглядности рассмотрим работу ЦАП в виде декодирующей сетки на резисторах. Существует несколько типов резисторных сеток, из которых самыми распространенными являются декодирующие сетки типа R-2R и сетки с весовыми значениями разрядных резисторов (рис. 9.4). Положение ключей соответствует записанному в счетчике двоичному коду p, который равняется числу поступивших на вход счетчика импульсов. Выходное напряжение сетки типа R-2R (рис. 9.4,a) p Uвых = n Eэ , 2 а при нагрузке Rн Uвых = Ðèñ. 9.4. Rн p Eэ . Rн + R 2n Принципиальные схемы ЦАП
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 250 Часть III. Развертывающие и синхронизирующие устройства Максимальное ступенчатое напряжение получается при p = 2n −1 и равно Uвых max = Rн 2n − 1 Eэ . Rн + R 2n Для сетки с разрядными резисторами (рис. 9.4,b), соответственно, получается p Uвых = n Eэ ; Uвых max = Eэ . 2 При нагрузке сопротивлением Rн Uвых = Rн p Eэ . Rн + 0,5R 2n Выходное сопротивление сетки R-2R равняется R, a сетки с разрядными резисторами — 0,5R. При изменении сопротивления нагрузки Rн выходное напряжение меньше меняется при меньшем сопротивлении R, при этом резисторы в старших разрядах сетки вносят больше погрешностей, чем резисторы в младших разрядах. Для формирования сигнала изображения градационного клина можно использовать оба вида сеток. Но так как число ступенек в клине не превышает 10, то предпочтение обычно отдается декодирующим сеткам с разрядными резисторами. Их преимущество состоит в меньшем числе резисторов. Величина R обычно выбирается равной от 2 до 20 кОм. Для формирования ступенчатого напряжения, меняющегося по нелинейному закону, используются методы суммирования импульсных сигналов, длительности которых равняются длительности одной ступеньки (рис. 9.5,a). При этом формирователь, построенный по принципу функциональных преобразователей, позволяет с помощью резисторов R1 , R2 ...RN подобрать закон возрастания (спада) уровней отдельных ступенек, временное положение которых задается сигналами дешифратора (рис. 9.5,b). К недостаткам такого метода следует отнести сравнительно невысокую стабильность формируемых уровней сигнала, что требует тщательного выбора транзисторов. Кроме того, в месте стыка двух ступенек могут появиться паразитные выбросы. Этого недостатка лишены схемы, в которых суммируются импульсы переменной длительности (рис. 9.6,a). Принципиальная схема строится на основе (N − 1)-разрядного счетчика Джонсона, построенного на Д-триггерах, нагруженных на резистивную сетку (матрицу). На рис. 9,6,b показана функциональная схема описанного формирователя.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Формирование сигнала градационного нелинейного клина Ðèñ. 9.5. 251 Ðèñ. 9.6. Формирование сигнала градационного клина с помощью счетчика Джонсона Как видно из рассмотренных схем, закон изменения амплитуды ступенек может быть задан любой. При формировании ТИТ для визуальной оценки качества изображения изменение амплитуды ступенек градационного клина должно происходить по логарифмическому закону Вебера–Фехнера [57]. Б. Аналоговое формирование линейного градационного клина Такой сигнал формируется суммированием двух противофазных пиÐèñ. 9.7. Аналоговый способ лообразных импульсов (рис. 9.7). формирования градационного клина Период T0 высокочастотных треугольных импульсов и их размах U0 выбираются исходя из числа m необходимых градаций, воспроизводимых во время прямого хода. При таком методе формирования предъявляются жесткие требования к стабильности размахов пилообразных импульсов, а также к длительности обратного хода высокочастотных импульсов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 252 Часть III. Развертывающие и синхронизирующие устройства Таблица 9.3 Цветные полосы, расположенные в порядке возрастания яркости Цвет G, 22 R, 21 B, 20 Весовая функция Белый Желтый Голубой Зеленый Пурпурный Красный Синий Черный 1 1 1 1 0 0 0 0 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 7 6 5 4 3 2 1 0 В. Формирование цветных испытательных изображений В качестве цветных испытательных изображений очень часто используются цветные полосы, формируемые генераторами цветных полос (ГЦП). Цветные полосы могут располагаться как по вертикали, так и по горизонтали растра. Особое значение имеет выбор последовательности цветных полос. В настоящее время используют три последовательности [58]. 1. Белая, желтая, голубая, зеленая, пурпурная, красная, синяя, черная. Основным цветам с максимальной насыщенностью (B, R, G), расположенным в порядке возрастания яркости, поставили в соответствие весовые функции двоичной системы счисления (20 , 21 , 22 ). Дополнительные насыщенные цвета, а также белый цвет будут представлены соответствующим комбинационным кодом, показанным в табл. 9.3 [58]. Весовая функция рассматриваемой последовательности цветов показывает, что с изменением цветности яркость экрана вдоль строк уменьшается. Яркостный сигнал при этом имеет ступенчатую форму, почти равномерно уменьшаясь от своего максимального значения до нуля. Данная форма сигнала позволяет легко оценить параметры ТВ тракта: баланс «белого» на разных уровнях яркости при подаче его одновременно на катоды кинескопа, линейность амплитудной характеристики каналов и т. д. Равномерное изменение весовой функции, представленной в табл. 9.3, показывает, что сигналы цветности R, G, B можно получить от триггерного счетчика, образованного из трех последовательно связанных триггеров, работающих в режиме вычитания (рис. 9.8,a). 2. Белая, пурпурная, желтая, красная, голубая, синяя, зеленая, черная. Данная последовательность цветных полос характеризуется наличием наибольших яркостных скачков (рис. 9.8,b). Такой сигнал удобен для оценки видеоканала цветного телевидения, так как показывает реакцию канала на скачкообразное изменение яркости. Формирование
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.8. 253 Принцип формирования сигналов цветных полос такой последовательности требует тех же сигналов X0 , X1 , X2 , однако подавать их следует на каналы управления другими цветами, т. е. X1 на B, X2 на R, X0 на G. 3. Белая, синяя, желтая, голубая, красная, зеленая, пурпурная, черная. Такая последовательность цветных полос характеризуется наличием наибольших скачков по частоте в системе СЕКАМ и наибольших скачков по фазе в системе ПАЛ. Кроме описанных сигналов, в цветном телевидении для передачи по каналу связи формируют два цветоразностных UR−Y и UB−Y и один яркостный сигнал UY : UY = 0,3UR + 0,59UG + 0,11UB ; UR−Y = UR − UY = 0,7UR − 0,59UG − 0,11UB ; UB−Y = UB − UY = −0,3UR − 0,59UG + 0,89UB . На рис. 9.9 показана функциональная схема одного из вариантов формирования яркостного и синего цветоразностного сигналов с помощью операционных усилителей [58]. Верхняя часть схемы содержит два суммирующих усилителя (А1 , А2 ) для формирования яркостного сигнала UY с импульсами синхронизации (СС). Операцион- Ðèñ. 9.9. Функциональная схема формирования яркостного и ЦРС
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 254 Часть III. Развертывающие и синхронизирующие устройства ный усилитель А1 компенсирует затухание, вносимое матрицей формирования яркостного сигнала UY , и производит изменение полярности сигнала UY . Второй усилитель А2 выполняет функции усилителясмесителя яркостного и синхронизирующих сигналов. Нижняя часть схемы представляет собой двухкаскадный операционный усилитель формирования цветоразностного сигнала UB−Y . Цветоразностный сигнал UR−Y формируется аналогично. Применение интегральных операционных усилителей с высоким коэффициентом усиления и малым дрейфом нуля позволяет обеспечить кодирование с весьма высокой точностью. 9.4. Формирование телевизионной испытательной таблицы В настоящее время ТВ испытательные таблицы (ТИТ) находят широкое применение для различных ТВ измерений. Используемые ТИТ могут быть двух видов: универсальные и специальные. Универсальные таблицы создаются для оценки многих параметров и характеристик ТВ приемника по одному изображению. Таблицы специального назначения служат для детальной оценки ограниченного числа параметров (сигналы вертикальных и горизонтальных полос, сетчатого и точечного полей, градаций яркости, шахматного поля и другие). Таблицы специального назначения используются для проверки ТВ камер, видеомагнитофонов, радиорелейных линий и т. д. и содержат несколько отличающихся изображений, предназначенных для проверки соответствующих составляющих ТВ системы. Существуют испытательные таблицы как для черно-белого телевидения, так и для цветного. Генераторы цветных таблиц, предназначенные для настройки и контроля ТВ оборудования, имеют три выхода для сигналов трех основных цветов. В генераторах цветных изображений, предназначенных для контроля линий связи, передатчиков, ТВ приемников и т. д., необходимо иметь кодирующее устройство для формирования полного видеосигнала цветного телевидения. Сигналы испытательных таблиц могут формироваться также с помощью ТВ камеры или трубки с бегущим лучом. При таком способе формирования в сигнале испытательного ТВ изображения проявляются несовершенства оптических и электронно-оптических устройств, формирующих электрический сигнал. Поэтому в настоящее время более широко применяется электрический способ формирования испытательных сигналов ТВ таблиц с помощью специально разрабатываемых генераторов ИС. Такие сигналы позволяют не только субъективно оценивать качество изображения на выходе проверяемого тракта, но и при помощи осциллографа измерить ряд характеристик видеоканала. Применение различных методов синтеза сложных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.10. 255 Принцип формирования ТИТ логических структур дало возможность формировать сложное изображение из небольшого числа входных (первичных) сигналов. Это позволило упростить устройства и применить интегральные элементы дискретного действия. Любую ТИТ следует рассматривать как комплексное изображение, составленное из различных испытательных изображений, электрический сигнал которых может быть представлен в цифровом или аналоговом виде. Цифровые методы синтеза испытательных таблиц позволяют получать изображение высокого качества, искажения которых не превышают допустимого значения. Цифровыми способами формируют практически все элементы ТИТ. Независимо от вида таблицы современные принципы её формирования могут быть пояснены с помощью следующей обобщенной схемы (рис. 9.10). Задающий генератор ЗГ1 осуществляет горизонтальную дискретизацию активной части строк. Во время обратного хода строчной развертки колебания ЗГ1 срываются строчными гасящими импульсами (СГИ). С помощью счетчика CЧ1 2 и дешифратора вертикальных полос ДВП 3 формируются импульсы, задающие местоположение формируемого испытательного изображения на экране кинескопа по горизонтали. Коэффициент деления счетчика CЧ1 определяется размерами клеток формируемого шахматного или сетчатого полей. Аналогично работают счетчик СЧ2 4 и дешифратор горизонтальных полос ДГП 5. Выходные сигналы с блоков 2, 3 и 4, 5 подаются на входы формирователя импульсов ФИ 6 испытательных изображений и адресный формирователь АФ 7, который задает местоположение каждого дискретного элемента таблицы по горизонтали и вертикали. Формирование элементов ТИТ (ФЭТИТ) осуществляется в блоке 8, на вход которого поступают сигналы испытательных изображений и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 256 Часть III. Развертывающие и синхронизирующие устройства их адресные сигналы. Формирование ступенчатых сигналов происходит в блоке 9 цифроаналогового преобразователя (ЦАП). С помощью блоков 10 (задающего генератора) и 11 (формирователя пакетов синусоидальных колебаний) формируется испытательный сигнал для визуального контроля четкости изображения. Окончательное формирование ТИТ осуществляется смесителем 12, в котором производится смешение сигналов изображения со строчными (ССИ) и кадровыми (КСИ) синхронизирующими импульсами. Принципиальная схема генератора ТИТ строится на основе ТВ испытательного изображения, которое необходимо получить на экране кинескопа. Рассмотрим принципы формирования ТИТ. Вид испытательной таблицы определяет степень сложности генератора ТИТ. Испытательные таблицы черно-белого телевидения являются более простыми по содержанию, чем таблицы цветного телевидения. В качестве примера рассмотрим электронную испытательную таблицу ЭИТ для черно-белого телевидения. Хотя предлагаемая таблица предназначена для контроля характеристик черно-белых телевизоров, она может быть использована с рядом ограничений и для контроля характеристик цветных телевизоров по черно-белому изображению. К ним относятся однородность цвета, сведения лучей, координатные искажения, АРУ, яркость, контрастность, четкость черно-белого изображения, устойчивость синхронизации и выключение канала цветности во время приема черно-белой программы. 9.4.1. Структурная схема генератора ТИТ В качестве основы для построения структурной схемы генератора ТИТ может быть положена рассмотренная выше схема формирования ТИТ (см. рис. 9.10). В целях упрощения принципиальной схемы генератора ТИТ и более доступного изложения материала произведем некоторые изменения в этой схеме. Задающие генераторы ЗГ1 и ЗГ2 , счетчики CЧ1 и СЧ2 можно из схемы устранить, а формируемые ими сигналы заменить аналогичными сигналами, формируемыми синхрогенератором (см. рис. 9.10). Некоторое расхождение в частотах синусоидальных пакетов и количестве горизонтальных и вертикальных пересекающихся линий в результате такой замены не является препятствием для рассмотрения принципов формирования ТИТ. В то же время такие допущения значительно упрощают принципиальную схему генератора ТИТ. В соответствии со сказанным структурную схему генератора ТИТ можно представить в следующем виде (рис. 9.11). Схема генератора состоит из счетчиков каналов строчной 1 и кадровой 2 частот, расположенных в синхрогенераторе, дешифратора вертикальных ДВП 3 и горизонтальных ДГП 5 полос, адресного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений 257 формирователя АФ 4, формирователя элементов ТВ испытательной таблицы ФТИТ 7, датчика испытательных сигналов ДИС 6 и выходного устройства ВУ 8. Рассмотрим работу схемы. Дешифратор вертикальных полос ДВП 3 формирует необходимые временные интервалы по горизонтали растра и служит в качестве сдвигающего регистра. Сигналы с ДВП определяют местонахождение изображения таблицы Ðèñ. 9.11. Структурная схема генератора ТИТ и отдельных ее деталей на экране кинескопа по строке. Дешифратор горизонтальных полос ДГП 5 служит в качестве сдвигающего регистра по вертикали растра, а его выходные сигналы определяют местонахождение изображения и отдельных его элементов по вертикали (кадру). Далее сигналы с дешифраторов 3 и 5 поступают на адресный формирователь АФ 4, который выдает точные координаты местонахождения отдельных элементов ТИТ. Адресный формирователь синтезирует набор временных интервалов, составляющих испытательное изображение. С выхода АФ сигналы поступают на формирователь элементов ТВ испытательной ФТИТ 7. Испытательные сигналы, поступающие в формирователь 7 с блока ДИС 6, разносятся во времени и пространстве и объединяются в смесителе, на выходе которого получаем сложный сигнал ТИТ. Датчик испытательных сигналов ДИС 6 формирует все необходимые сигналы, из которых синтезируется таблица. Выходное устройство обеспечивает согласование с нагрузкой (75 Ом) и необходимую амплитуду сигнала (1 В) на нагрузке. 9.4.2. Функциональная схема генератора ТИТ Дешифратор полос и адресный формирователь. Функциональная схема строится в соответствии с изображением ТИТ (рис. 9.12), которое требуется получить на экране кинескопа. Обычно поле таблицы делится на прямоугольники, ограниченные общими горизонтальными и вертикальными линиями, образующими сетчатое поле, в центре которого располагаются все испытательные изображения. Представим испытательную таблицу (см. рис. 9.12) вместе с сигналами, необходимыми для ее формирования (рис. 9.13). На рис. 9.13 показаны испытательная таблица, входные сигналы X3 –X7 и Y6 –Y9 , поступаемые с триггеров счетчиков строчной и кадро-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 258 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 9.12. ТИТ для черно-белого телевидения вой частот, и выходные сигналы Z1 –Z6 , J1 –J6 , определяющие адреса испытательных сигналов по горизонтали и вертикали. При выбранной нами сетке частот (X, ..., Y, ...) по горизонтали за время одной строки Tс располагается 32 черно-белых полосы и около 20 черно-белых полос по вертикали. С учетом времени обратных ходов tох число полос будет 26 и 18. Это приведет к некоторому растягиванию квадратов таблицы по вертикали при вписывании ее в экран кинескопа. Однако визуально это будет мало заметно, так как ошибка не превышает 8 %. Для точного соблюдения формата кадра структурную схему генератора ТИТ следует усложнить и привести к виду рис. 9.10. Методика же построения испытательной таблицы при этом не изменяется. Так как испытательные таблицы составлены из отдельных испытательных изображений, то необходимо для каждого изображения сформировать свое «окошко» — адрес испытательного изображения. Для компоновки общего изображения таблицы возможны два варианта. В первом сигнал «окошко» запускает соответствующий генератор изображения, во втором генератор изображения работает непрерывно, а сигнал «окошко» включает или выключает его выходной сигнал. Расположим центральное «окно» ТИТ точно по середине прямых ходов строчной и кадровой разверток (рис. 9.13). Далее определяем точный адрес центрального «окна» по временным диаграммам входных и выходных сигналов. Аналогично, с помощью дешифратора вер-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.13. 259 Принцип формирования ТИТ тикальных и горизонтальных полос определяются адреса «окошек» испытательных изображений, размещенных в центре таблицы. Дешифратор вертикальных полос. Входными сигналами данного дешифратора (ДВП) являются последовательности с частотами 16fс , 8fс , 4fс , 2fс , fс . На временной диаграмме рис. 9.13 им соответствуют сигналы X3 , X4 , X5 , X6 и X7 , снимаемые с плеч триггеров счетчика 1 синхрогенератора рис. 8.7. Выходными сигналами дешифратора являются Z1 , Z2 , Z3 , Z4 , Z5 и Z6 . Сигнал Z1 предназначен для получения прямоугольника (центрального окна), в котором размещаются все основные испытательные сигналы, Z1 располагается посередине видимой части растра; Z2 –Z5 определяют местонахождение пачек частот 4 МГц, 2 МГц, 1 МГц и 0,5 МГц; Z6 предназначен для формирования черной детали на белом фоне; Z1 –Z6 являются адресными сигналами, определяющими местонахождение испытательных изображений на экране кинескопа по горизонтали. Составление выражений работы дешифратора удобно проводить
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 260 Часть III. Развертывающие и синхронизирующие устройства по временным диаграммам рис. 9.13 по описанной в главе 8 методике. Ниже приводятся выражения для Z1 –Z6 : Z1 = Z2 + Z3 + Z4 + Z5 = Z̄2 Z̄3 Z̄4 Z̄5 ; Z2 = X̄4 X̄5 X6 X̄7 ; Z3 = X5 X̄6 X̄7 ; Z4 = X̄5 X̄6 X̄7 ; Z5 = X5 X6 X7 ; Z6 = Z4 + X̄4 X5 X̄6 X̄7 = Z4 + Z7 . Дешифратор горизонтальных полос. Входными сигналами для данного дешифратора (ДГП) являются прямоугольные импульсы Y6 , Y7 , Y8 , Y9 , снимаемые с триггеров счетчика кадровой частоты синхрогенератора. Выходными сигналами являются импульсы J1 , J2 , J3 , J4 , J5 , J6 , которые выполняют следующие функции: J1 формирует окно, в котором размещаются все испытательные сигналы; J2 определяет местонахождение частотных пачек по вертикали; J3 определяет местонахождение шахматного поля; J4 является сигналом «подсветки» черной детали; J5 является сигналом местонахождения градационного клина; J6 формирует черные детали на белом фоне. Методика составления выражений для J1 –J6 работы ДГП остается прежней: J1 = J2 + J3 + J4 + J5 = J̄2 J̄3 J̄4 J̄5 ; J2 = Ȳ7 Y8 Y9 ; J3 = Y7 Ȳ8 Y9 + Y6 Ȳ7 Ȳ8 Y9 ; J4 = Ȳ6 Ȳ7 Ȳ8 Y9 + Y7 Y8 Ȳ9 ; J5 = Ȳ7 Y8 Ȳ9 ; J6 = Y6 Y7 Y8 Ȳ9 . Сигналы J1 –J6 также являются адресными сигналами, определяющими местонахождение элементов ТИТ по вертикали. Адресный формирователь. Адресный формирователь (АФ) определяет координаты расположения отдельных элементов ТИТ на экране кинескопа. Для получения сигнала местонахождения какого-либо элемента ТИТ необходимо ограничить во времени соответствующие сигналы с ДВП и ДГП, перемножив их между собой. Q1 = Z1 J1 — сигнал местонахождения прямоугольника (центрального окна); Q1 = Z1 J1 — сигнал запрета сетчатого поля; Q2 = Z2 J2 — сигнал местонахождения частоты 4 МГц; Q3 = Z3 J2 — сигнал для f = 2 МГц;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.14. 261 Функциональная схема ДВП, ДГП и АФ Q4 = Z4 J2 — сигнал для f = 1 МГц; Q5 = Z5 J2 — сигнал для f = 0,5 МГц; Q6 = Z1 J3 — сигнал адреса шахматного поля; Q7 = Z1 J4 — адрес белого фона для черной детали; Q8 = Z6 J6 — адрес черной детали на белом фоне; Q9 = Z1 J5 — адрес градационного клина. В соответствии с полученными выражениями функциональная схема ДВП, ДГП и АФ может быть представлена в виде, показанном на рис. 9.14. При практической реализации схему рис. 9.14 необходимо преобразовать под элементную базу той или иной серии микросхем. Например, при использовании только схем И-НЕ выражения для J1 и J4 преобразуем к виду, используя закон инверсии: J1 = J2 + J3 + J4 + J5 = J2 + J3 + J4 + J5 = J2 + J3 + J4 + J5 ;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 262 Часть III. Развертывающие и синхронизирующие устройства ′ ′′ J4 = Y6 Y7 Y8 Y9 + Y7 Y8 Y9 = J ′ + J ′′ = Y6 Y7 Y8 Y9 Y7 Y8 Y9 = J J . Формирователь элементов ТИТ. Формирователь ТВ испытательной таблицы (ФТИТ) синтезирует комбинированное изображение из отдельных испытательных сигналов. Входными (информационными) сигналами являются входные сигналы датчика испытательных сигналов ДИС (см. рис. 9.11), а управляющими — выходные сигналы АФ. Формирование ТИТ реализуется, в основном, по принципу подключения или отключения непрерывно работающих датчиков испытательных сигналов с помощью адресного сигнала к выходу схемы. Исключением из этого правила может быть формирование градационного клина. Это объясняется сложностью коммутации сигнала градационного клина. Использование линейных ключей для коммутации аналогового сигнала, по сравнению с нелинейными ключами, представляет определенные технические трудности. Поэтому целесообразно, чтобы аналоговый сигнал на выходе схемы формирования градационного клина появлялся бы только в моменты действия адресного сигнала Q9 = Z1 J5 . Это позволит упростить схему сложения сигнала градационного клина с сигналом испытательной таблицы. По этой причине формирование градационного клина желательно осуществлять в блоке ФТИТ 7 (см. рис. 9.11). Рассмотрим схему формирования клина. Сигнал градационного клина формируется из последовательности импульсов X4 , X5′ , X6′ (рис. 9.15). Сигнал X4 (см. рис. 8.6) снимается с одного из выходов синхрогенератора, X5′ и X6′ образуются делением частоты X4 дополнительным делителем из триггеров, управляемых сигналом Z1 . Необходимые соотношения амплитуд получаются подбором сопротивлений резисторной матрицы R1 , R2 , R3 (рис. 9.16). Адресный сигнал Q9 здесь получается управлением работой триггеров T1 и Т2 и логических схем И сигналами Z1 и J5 . На выходе схемы формирования (рис. 9.16) сигнал градационного клина ограничен во времени и пространстве адресным сигналом Q9 и поэтому может быть непосредственно замешан в сигнал испытательной таблицы на входе оконечного усилителя ВУ 8 (см. рис. 9.11). Логические схемы И устраняют влияние нагрузки на работу триггеров и одновременно выполняют роль формирователя адресного сигнала Q9 . Принцип построения принципиальной схемы ФТИТ состоит в следующем (рис. 9.17). Ко входам логических схем И-НЕ подводятся испытательные сигналы (сетка-точка, шахматное поле, частотные пачки) и управляющие сигналы АФ. Для сокращения количества схем И-НЕ адресные сигналы Q2 –Q8 формируются в логических схемах И-НЕ в сочетании с испытательными сигналами. Объединение элементов ТИТ осущес-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Принцип формирования градационного клина Ðèñ. 9.15. 263 Принципиальная схема формирования градационного клина Ðèñ. 9.16. твляется в блоке 8, а частотных пачек — в блоке 9. Блоки 8 и 9 выполняют роль смесителей. В блоке 10 осуществляется ограничение частотных пачек по вертикали, которые в блоках 3–6 были предварительно ограничены по горизонтали сигналами Z2 –Z5 . Формирование черной детали на белом фоне происходит в блоках 7 и 11. Сигнал градационного клина смешивается с общим сигналом ТИТ в нагрузке Rн . Диоды Д1 и Д2 выполняют роль развязывающих элементов. В момент появления положительного сигнала градационного клина диод Д1 открывается, Д2 закрывается, так как в это время на выходе смесителя 8 появляется «0». И, наоборот, при появлении сигнала на выходе смесителя 8 диод Д2 открывается, а диод Д1 в отсутствие сигнала градационного клина закрывается, так как на его аноде потенциал становится ниже потенциала катода. Поочередное появление сигналов градационного клина и испытательной таблицы исключает появление перекрестных искажений между ними. Датчик испытательных сигналов. Использование методов синтеза сложных логических структур дает возможность формировать сложные сигналы изображения из некоторого числа простых входных первичных сигналов (X0′ , X0 , X1 , ..., Xn ; Y0 , Y1 , ..., Yn ). При этом устройства формирования могут быть выполнены на ячейках, реализующих элементарные логические функции. Так, изображение сетчатого поля получается логическим сложением (дизъюнкцией) сигналов горизонтальных FY и вертикальных FX полос (см. табл. 9.1): Fс = FX + FY = FX FY ,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 264 Часть III. Развертывающие и синхронизирующие устройства Ðèñ. 9.17. Принципиальная схема формирования ТИТ а умножением (конъюнкцией) сигналов FX и FY получим изображение точечного поля: ′ ′ F′ . Fт = FX FY′ = FX Y (9.2) Сигналы вертикальных и горизонтальных полос FX и FY образуются перемножением сигналов горизонтальной и вертикальной дискретизаций (см. рис. 8.6 и 8.8): FX = X0′ X0 X1 X2 ; FY = Y2 Y3 Y4 Y5 . (9.3) Местоположение полос в пределах 1 мкс (для вертикальных полос) и 8H (для горизонтальных полос) определяется инверсией того или иного сигнала в соотношениях (9.3). При образовании точечного поля вертикальные и горизонтальные полосы должны быть сдвинуты относительно полос (9.3) и расположены между ними посередине, что легко достигается инверсией сигналов X2 и Y5 : ′ = X0′ X0 X1 X2 ; FX FY′ = Y2 Y3 Y4 Y5 . ′ Сигналы FX и FY′ , входящие в выражение (9.2), образуют точечное поле, расположенное внутри квадратов сеточного поля. Сигнал X0′ соответствует 256fс = 4 МГц и обеспечивает наименьшую толщину вертикальных линий, равную примерно 1,5...2 элементам изображения. Сигнал Y2 обеспечивает толщину горизонтальных линий, равную одной строке в поле. За кадр (2 поля) будет укладываться
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 9. Формирование сигналов испытательных изображений Ðèñ. 9.18. 265 Функциональная схема ДИС рядом две строки, что обеспечивает толщину горизонтальных линий в растре в две строки (2 элемента). При формировании сигнала шахматного поля (см. табл. 9.1) находит применение логическая операция равнозначности: Fш = X3 Y6 + X3 Y6 = X3 Y6 X3 Y6 . По данным формулам составляется функциональная схема работы датчика ИС (ДИС, рис. 9.18). В схеме в каждой из испытательных сигналов замешивается гасящая смесь ГС. Все рассмотренные схемы могут быть смоделированы с помощью программ EWB и Multisim (МS). Контрольные вопросы 1. 2. 3. 4. 5. 6. 7. Назначение сигналов испытательных изображений. Как определяется чёткость по ТИТ? Назначение сеток квадратов и ТИТ. Способы формирования градационного клина. Как можно сформировать наклонные линии? Поясните принцип формирования сигнала «шахматное поле». Формирование цветных испытательных изображений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü IV ПОВЫШЕНИЕ ИНФОРМАЦИОННОЙ ЕМКОСТИ ТЕЛЕВИЗИОННЫХ ИЗОБРАЖЕНИЙ 10 ПОВЫШЕНИЕ ИНФОРМАТИВНОСТИ ЧЕРНО-БЕЛЫХ ИЗОБРАЖЕНИЙ В ПРИКЛАДНОМ ТЕЛЕВИДЕНИИ 10.1. Цветовое контрастирование — наиболее эффективный способ повышения информативности черно-белых изображений Использование цвета в обработке изображений обусловлено двумя основными причинами. Во-первых, цвет является тем важным признаком, который часто облегчает распознавание и выделение объекта на изображении. Во-вторых, человек в состоянии различать тысячи различных оттенков цвета и всего лишь около двух десятков оттенков серого. Второе обстоятельство особенно важно при визуальном (т. е. выполняемом непосредственно человеком) анализе изображений. Цвет — это представление человека о видимой части спектра электромагнитного излучения. Распознавание цвета человеком зависит от освещения объекта, отражающего свет, от глаз и мозга. Свет, попадая в глаз, преобразуется в сигналы нейронов, находящихся в сетчатке глаза, и по оптическому нерву пересылается в мозг. Существуют два типа светочувствительных фоторецепторов: колбочки, сосредоточенные главным образом в центральной ямке и расположенные в основном по периферии сетчатки, и палочки, не обладающие преимущественной чувствительностью к какому-либо спектральному цвету и играющие главную роль в создании ахроматических зрительных образов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений Функции соответствия цветов МКО (удельные координаты цвета в системе XYZ) Ðèñ. 10.1. 267 Аддитивное смешение трех основных цветов (RGB) Ðèñ. 10.2. Три типа колбочек называют B, G и R. Пики их чувствительности приходятся примерно на 440 нм, 545 нм и 600 нм (для «усредненного» наблюдателя), что соответствует воспринимаемым цветам — синий, зеленый и красный. В каждом глазе 6 млн колбочек и 120 млн палочек, т. е. примерно 250 млн рецепторов на два глаза (рис. 10.1). Вследствие таких спектральных характеристик человеческий глаз воспринимает цвета как различные сочетания так называемых первичных основных цветов: красного (R), зеленого (G) и синего (В). Важно понимать, что наличие стандартного набора монохроматических первичных основных цветов не означает, что все цвета спектра могут быть получены на основе этих фиксированных RGB цветов. Использование термина «основные» часто приводит к тому заблуждению, что все видимые цвета могут быть воспроизведены при смешении основных первичных цветов в различных пропорциях. Первичные основные цвета могут складываться, что дает вторичные основные цвета: пурпурный (красный плюс синий), голубой (зеленый плюс синий) и желтый (красный плюс зеленый). Смешение трех первичных основных цветов или вторичного основного цвета и противоположного ему первичного в правильных пропорциях дает белый цвет. Результат такого смешения представлен на рис. 10.2, где также показаны три первичных основных цвета и их сочетания, дающие вторичные основные цвета. Изучением цвета, его измерениями занимается наука колориметрия (от лат. color — цвет и греч. µετ ρεω — измеряю). В ней существуют методы измерения и количественного выражения цвета и цветовых различий в так называемых цветовых координатах в выбранной системе трех основных цветов. Для измерения какого-либо цвета визуально (на основе спектральной чувствительности глаза человека) или фотометрическим способом меняют интенсивность трех основных цветов, подбирая цвет, не отличимый от исследуемого. Ко-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 268 Часть IV. Повышение информационной емкости ТВ изображений личественное выражение цвета важно в светотехнике для разработки осветительных приборов, в цветном кино, телевидении и т. п. Научно обоснованные системы определения цветов, колориметрические стандарты и терминология по цвету и светотехнике разрабатываются Международной комиссией по освещению (МКО) начиная с 1920 г. Колориметрия непрерывно углубляется и совершенствуется, и получаемые при этом полезные результаты вводятся в международные стандарты. Основана колориметрия на физических (мощность излучения), психофизических (световая мощность излучения) и психологических (ощущение цвета) факторах, характеризующих свет и его восприятие стандартным наблюдателем МКО со спектральной чувствительностью зрения V (λ) (так называемой стандартной относительной видностью глаза): ∫ 780 F = Vm Ф(λ)V (λ) dλ. 380 Стандартная относительная видность глаза (рис. 10.3) определена в результате усреднения экспериментальных данных, полученных для большого числа наблюдателей. Коэффициент Vm , являющийся максимумом кривой стандартной отноÐèñ. 10.3. Стандартная отсительной видности с длиной волны носительная видность глаза λ = 555 нм, устанавливает количественную связь между световым и лучистым потоком. В результате точных измерений установлено, что 1 Вт лучистого потока монохроматического излучения с длиной волны λ = 555 нм равен 683 лм светового потока. Величины красного, зеленого и синего, необходимые для получения некоторого конкретного цвета, называются координатами цвета. Графически цветовые координаты всех цветовых ощущений, которые может испытывать человек, будут представлять собой некую объемную фигуру в пространстве данной ЦКС (цветовая координатная система). Эту фигуру можно назвать пространством цветовых ощущений человека или цветовым пространством человека. Важную роль в науке о цвете играет выбор параметров, характеризующих свет. Когда свет является ахроматическим (неокрашенным), в роли единственной такой характеристики выступает интенсивность. Термин яркость (полутоновая яркость или уровень серого) обозначает количественную меру интенсивности, которая принимает значения в диапазоне от черного до белого с промежуточными серыми оттенками.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 269 Хроматический (окрашенный) свет охватывает диапазон электромагнитного спектра приблизительно от 400 нм до 700 нм. Хроматические источники света характеризуются тремя основными величинами: потоком лучистой энергии, световым потоком и светлотой. Поток лучистой энергии, обычно измеряемый в ваттах (Вт), — это общее количество энергии, излучаемой источником света в единицу времени. Световой поток, измеряемый в люменах (лм), — это поток лучистой энергии, оцениваемой по зрительному ощущению. Например, световой источник, работающий в дальнем инфракрасном диапазоне, может давать значительный поток энергии, но наблюдатель его практически не ощущает, так что световой поток такого источника почти равен нулю. Наконец, светлота является субъективной характеристикой, которая практически не поддается измерению. Она отражает уровень зрительного ощущения, производимого интенсивностью (т. е. световым потоком), и является одним из ключевых параметров для описания цветового восприятия. Глаз является селективным приемником излучения. Это значит, что в видимом диапазоне он воспринимает различные длины волн неодинаково. Ощущение цвета зависит от спектрального состава, воздействующего на глаз излучения. Предельным случаем неравномерного излучения можно считать излучение в малом интервале длин волн ∆λ, так называемые монохроматические излучения. Монохроматические излучения разной длины волны вызывают у человека ощущение различных спектральных цветов, обладающих максимальной (100 %) насыщенностью. Насыщенность — характерное свойство цвета — цветовой параметр, обозначающий степень разбавленности монохроматического цвета белым. Насыщенность белого цвета равна нулю. Спектр монохроматических излучений условно разбит на семь главных цветов (табл. 10.1). Цветовой тон — совокупность цветовых оттенков, сходных с одним и тем же цветом спектра. Оттенки, сходные с одним и тем же цветом спектра (но различающиеся, например, насыщенностью и яркостью), принадлежат к одному и тому же тону. При изменении тона, к примеру, синего цвета в зеленую сторону спектра он сменяется голубым, в обратную — фиолетовым. Таблица 10.1 Спектр монохроматического излучения Длина волны 780...605 Цвет 605...590 590...560 560...500 500...470 470...430 Красный Оранжевый Желтый Зеленый Голубой Синий 430...380 Фиолетовый
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 270 Часть IV. Повышение информационной емкости ТВ изображений Цветовой тон и насыщенность вместе называются цветностью, и поэтому цвет может быть охарактеризован своей светлотой (яркостью) и цветностью. 10.2. Характеристики сигналов цветовых составляющих в системах телевидения При разработке прикладных ТВ систем, при анализе монохромных изображений часто предъявляются высокие требования к информативности воспроизводимого изображения. Информация об объекте содержится в изменениях амплитуды видеосигнала и обычно отображается в виде изменений яркости на экране видеоконтрольного устройства. Теоретически число различимых на изображении градаций яркости ограничивается контрастной чувствительностью зрения и шумами. Однако при практической реализации ТВ системы за счёт ограничений, накладываемых воспроизводящим устройством преобразователя «свет-сигнал», контраст мелких деталей значительно ниже теоретического. Применение цветового кодирования в несколько раз увеличивает различительную способность оператора, снижает его утомляемость, сокращает время зрительного поиска. Содержащаяся в изображении информация не увеличивается, но благодаря лучшему согласованию его параметров с особенностями зрения, возможности и резервы зрительной системы человека используются более эффективно. Осуществление цветового кодирования обеспечивает повышение контраста и визуальной информационной ёмкости чёрно-белых изображений. Цветовое кодирование (контрастирование) успешно применяется в ТВ устройствах, системах медицинской рентгенодиагностики, системах анализа аэрофотоснимков и др. Сущность метода цветового кодирования заключается в преобразовании монохромного изображения в цветное по признакам, отражающим определенные свойства изображения. Правильная реализация такого кодирование может превращать сложную задачу распознавания образов в достаточно доступную. В различных направлениях современной науки применяются растровые электронные микроскопы (РЭМ). Их используют для получения различной информации о структуре и физических свойствах исследуемого объекта. РЭМ обеспечивает возможность локального элементного анализа вещества, что не позволяет сделать оптический микроскоп. Качественный анализ распределения химических элементов с различными атомными номерами проводится, в основном, в режимах рентгеновского излучения, катодолюминесценции, а также при регистрации отраженных электронов. При наблюдении за отраженными электронами с помощью ЧБ изображения, практически невозможно
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 271 идентифицировать элементы с малоотличающимися атомными номерами. Но при использовании цветокодирования на два–три порядка увеличивается число информативных цветов и оттенков, различаемых глазом, и проблема легко решается. Цветовое кодирование применяется также в медицине, конкретно в рентгенодиагностике, с помощью цветокодирования можно в несколько раз увеличить количество визуальной информации о состоянии внутренних органов человека при минимальном рентгеновском облучении. В геологии при количественно-минеральном анализе горных пород определение процентного состава заданного минерала в образце сводится к подсчёту площади, окрашенной цветом, который характеризует искомый минерал и т. д. Для увеличения числа различимых градаций изображения используют кодирование уровней видеосигнала цветом. При этом входной сигнал через несколько параллельных каналов, с подобранными соответствующим образом амплитудными характеристиками, подают на входы преобразователя «свет-сигнал» для управления цветом свечения экрана. Алгоритм цветового кодирования однозначно определяется формами этих характеристик. Необходимо оптимизировать характеристики каналов формирования цветовых сигналов таким образом, чтобы приблизить информационную ёмкость ТВ системы к её теоретическому пределу. Цветокодирующие ТВ системы могут быть с монотонными и разрывными амплитудными характеристиками каналов формирования. Анализ показывает, что последние, давая большее увеличение амплитудной разрешающей способности ТВ системы, при низком отношении сигнала к шуму приводят к полному разрушению изображения. Монотонное преобразование яркости в цвет в принципе может быть полностью согласовано с цветоразличительными свойствами зрения. Известны решения этой задачи на базе аналоговой схемотехники с различной степенью приближения к оптимальным вариантам, но перспективными являются использование для этих целей цифровой техники. Информационная ёмкость системы зависит не только от числа различимых градаций изображения, но и от её пространственной разрешающей способности. В большинстве практических применений цветового кодирования это не имеет существенного значения и даже может играть положительную роль, ограничивая перегрузку оператора излишней информацией, однако в прикладных ТВ системах в силу специфики проведения анализа указанные ограничения в звене преобразования сигнала в изображение недопустимы. Поэтому вопросам
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 272 Часть IV. Повышение информационной емкости ТВ изображений цветокодирования и повышения разрешающей способности изображений при обработке сигналов следует придавать должное значение. Очень часто в производстве, в медицине, искусстве, при проведении научных исследований возникает необходимость раскрашивания черно-белых изображений с целью повышения их информативности и художественной ценности (например, расшифровывание черно-белых фотографий и художественных фильмом). При анализе черно-белых изображений возможности зрительной системы человека используются не полностью; происходит зрительная потеря информации из-за рассогласования объёма содержащийся информации в чёрно-белом изображении с возможностями (пропускной способностью) зрительного анализатора. Поэтому независимо от типа ТВ системы, области её применения в большинстве случаев целесообразно представлять изображение в цвете. Цвет обеспечивает согласование параметров изображения c физиологическими особенностями зрения, так как полностью использует зрительный аппарат человека — палочки (яркость), колбочки (цветность). Цвет определённых деталей исследуемого объекта количественно определяется координатами x и y на плоскости X0Y цветового графика системы XY Z. В отличие от cиcтемы R, G, B в системе XY Z координаты цветности всегда положительны: x= x′ > 0; x′ + y ′ + z ′ y= y′ > 0. x′ + y ′ + z ′ Любой цвет в системе XYZ описывается выражением f ′ F = = x′ X + y ′ Y + z ′ Z и изображается в цветовом пространстве точкой с координатами x′ , y ′ , z ′ , которые определяются выражениями: ∫ λ2 ′ x = x(λ)τx (λ)ρ(λ) dλ; y′ = z′ = ∫ λ1 λ2 y(λ)τy (λ)ρ(λ) dλ; ∫ (10.1) λ1 λ2 z(λ)τz (λ)ρ(λ) dλ, λ1 где λ1 ...λ2 — диапазон длин волн видимого участка спектра (для спектрозональных систем — для невидимых участков спектра); x(λ), y(λ), z(λ) — удельные координаты системы XY Z (рис. 10.1); τ (λ) — спектральная характеристика пропускания датчика видеосигнала; ρ(λ) — спектральная характеристика источника излучения. В системе XY Z одна из координат цветности является зависимой от двух других, так как x + y + z = 1. Поэтому для определения цветности достаточно двух координат, например x и y.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 273 Ðèñ. 10.4. График цветности. На графике: спектральный локус, цветовой охват цветного монитора (треугольная RGB-область), цветного печатающего устройства (область сложной формы) Для практических расчетов в системе XY Z рекомендуется использовать известную диаграмму цветности МКО, полученную проекцией диаграммы цветности единичной плоскости на плоскость xy в направлении оси z (рис. 10.4). Анализируя цветовой график МКО, необходимо отметить следующее: 1. Координаты цветности всех реальных цветов находятся внутри спектрального локуса (геометрического места координат цветности чистых спектральных цветов) и определяются положительными значениями x и y. 2. Равноэнергетический белый цвет E, имеющий чисто теоретический, расчетный характер, находится в центре тяжести треугольника x0y. Его координатам цветности будут x = 1/3 и y = 1/3. Цветность смеси двух цветов отображается точкой, лежащей на прямой, соединяющей смешиваемые цвета. Цветность смеси трех цветов отображается точкой внутри треугольника, вершины которого образованы смешиваемыми цветами.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 274 Часть IV. Повышение информационной емкости ТВ изображений Цветность сложного излучения помимо координат цветности может быть охарактеризована цветовым тоном и насыщенностью. Цветовой тон любого цвета на диаграмме цветности МКО определяется длиной волны монохроматического излучения (доминирующей длиной волны λд ), соответствующей пересечению кривой спектральных цветов — спектрального локуса с прямой, проходящей через точку E и точку, отображающую цветность искомого цвета, например точку М (см. рис. 10.4). Насыщенность численно характеризуется чистотой цвета Pцв , т. е. относительным содержанием в нем спектрального цвета (монохроматического светового потока Fλ ): Pцв = 100Fλ /(Fλ + Fб ) %, где Fб — световой поток белого цвета, входящего в смесь со спектральным цветом. Насыщенность максимальна (Pцв = 100 %) для чистых спектральных и пурпурных цветов и минимальна (Pцв = 0) для белого цвета. Назначение цветового пространства состоит в том, чтобы сделать возможным описание цветов некоторым стандартным образом. По существу цветовая модель определяет некоторую систему координат и подпространство внутри этой системы, в котором каждый цвет представляется единственной точкой. Большинство современных цветовых моделей ориентированы либо на устройства цветовоспроизведения (например, цветные мониторы или принтеры), либо на определенные прикладные задачи (такие, как создание цветной графики в анимации), когда работа с цветом является непосредственной целью. Цветовое тело, или цветовое пространство, олицетворяет идеальный цветовой охват или тот полный набор цветов, который способен воспринимать, например, наш глаз. Цветовой охват — это часть цветового пространства, множество цветовых тонов и оттенков, получаемых при использовании нескольких излучений или красок для синтеза цвета. Цветовой охват — это вся совокупность цветов в данной системе цветовоспроизведения. Другие цветовоспроизводящие системы, например фотохимическая (пленка), или электронная (телевидение), или полиграфическая, по разным причинам имеют цветовой охват гораздо менее совершенный, чем цветовой охват глаза, и это видно на графике цветности (см. рис. 10.4). График цветности полезен при рассмотрении процедуры смешения цветов, поскольку отрезок, соединяющий любые две точки диаграммы, определяет всевозможные различные цвета, которые могут быть получены при смешении двух данных цветов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 275 Треугольник на рис. 10.4 представляет типичный для RGB-мониторов диапазон воспроизводимых цветов. Область сложной формы, показанная практически внутри этого треугольника, представляет цветовой охват современных печатающих устройств высокого качества. Граница области охвата для печатающих устройств имеет сложную форму, потому что в процессе цветной печати одновременно используются аддитивные и субтрактивные процедуры смешения цветов. Управлять таким процессом намного труднее, чем процессом воспроизведения цветов на экране монитора, основанном на смешении трех очень хорошо контролируемых первичных основных цветов. Наглядно представить себе цветовой охват сквозного кинематографического процесса можно, напечатав негатив серой шкалы или любой другой негатив с оптимальным интервалом плотностей на всех значениях цветового паспорта копировального аппарата. Это будет реальный цветовой охват с учетом свойств реальных пленок (негативной и позитивной), с учетом процессов обработки (негатива и позитива) и процессов печати (субтрактивного или аддитивного) и т. д. Для человека, который впервые увидел отпечатанный таким образом позитив, будет большим сюрпризом и неожиданностью богатство цветового охвата. Он будет приятно удивлен тем, что в позитиве много таких оттенков цветов, о которых он предполагал, рассматривая не условное изображение серой шкалы, а какое-либо обычное изображение объекта в текущем материале. Когда возникает необходимость продемонстрировать цветовой охват того или иного устройства, его показывают всегда в сравнении с цветовым охватом человеческого зрения. Соотношения (10.1) показывают, что чувствительность датчика сигналов должна быть избирательной к излучениям красного, зеленого и синего цветов. Требование получения трех сигналов на выходе передающей ТВ камеры в сильной степени усложняет её как в схемном, так и в конструктивном отношениях, что не всегда выполнимо. В то же время черно-белое ТВ изображение можно окрасить в условные цвета в зависимости от амплитуды видеосигнала. Тем более, что некоторые изображения по своей природе черно-белые. При решении этой проблемы возможны два способа раскрашивания. Первый способ. Спектральная характеристика датчика сигналов τ (λ) должна быть монотонно возрастающей или убывающей в спектре передаваемых длин волн. Это позволит в первом приближении судить о цвете исследуемого объекта по изменению яркости. Раскрашивание по этому способу делает изображение более близким к натуральному, так как определенному уровню яркости здесь будет соответствовать по спектральной характеристике заданная цветность, определяемая длиной волны излучения источника.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 276 Часть IV. Повышение информационной емкости ТВ изображений Недостаток этого способа — необходимость подбора соответствующих фильтров для датчика сигналов. Второй способ не требует использования фильтров и поэтому свободен от названного выше недостатка, что упрощает датчик сигнала и повышает его чувствительность за счет исключения фильтра. Здесь каждому мгновенному значению яркости присваиваются условные цвета, не отражающие истинный цвет объекта. Поэтому применяется искусственное раскрашивание изображений для лучшего представления их наблюдателю — так называемое цветовое кодирование. Действительно, о каком цвете можно говорить, например, при рентгеновском просвечивании, при исследовании молекулярного строения вещества в электронной микроскопии. Исключение составляет эндоскопия, где наблюдение внутренних органов проводится при искусственном освещении и цвет несёт важную диагностическую информацию. Сущность метода цветового кодирования заключается в преобразовании черно-белого изображения в цветное по признакам, отображающим определённые свойства изображения. Эти признаки могут быть самыми различными. Например, разделение изображения на цветные области можно производить по значениям сигнала в разных спектральных диапазонах регистрируемого излучения (спектрозональное кодирование), по амплитуде видеосигнала (амплитудное кодирование), по величине сигнала в разных диапазонах спектра пространственных частот (частотное кодирование), по величине сигнала межкадровой разности. Правильное кодирование может превращать сложную задачу распознавания образов в относительно доступную. Это достигается тем, что плавному изменению яркости исследуемого объекта должно соответствовать и плавное изменение цвета. Чёрно-белое изображение несёт информацию только о яркости объекта. При цветокодировании из яркостного сигнала формируют цветовые сигналы UR , UG , UB . Далее можно сформировать сигналы цветности (UR−Y = UR − UY , UB−Y = UB − UY , UG−Y = UG − UY ) и дополнительно сигнал яркости UY . Наиболее широкое применение нашёл способ с использованием трёх сигналов цвета: UR , UG , UB . Преобразование черно-белых изображений в цифровой массив с последующей возможностью обработки изображений методами вычислительной техники стало распространенным процессом. Цифровые методы позволяют получать диагностические изображения, облегчающие точную постановку диагноза. Полученное черно-белое изображение можно преобразовать в цифровую форму с помощью сканирующих приборов, широко используемых в вычислительной технике.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 277 Для исключения появления ложных контуров в полученном цветном изображении достаточно иметь 8 бит/элемент, что обеспечивает точность восстановления 0,4 %. Однако для получения более точных результатов преобразования может понадобиться 10-битовый АЦП (точность 0,1 %). Преимущества цифровой обработки изображений: • оперативность цифровой обработки изображений по сравнению с аналоговой; • цифровая обработка изображений дает существенное повышение визуальной информационной емкости черно-белых изображений способами цветового контрастирования; • более высокое качество изображений при цифровой обработке по сравнению с аналоговой. Кратко рассмотрим отмеченные преимущества∗ . Цифровое отображение при компьютерной обработке позволяет извлечь количественную и качественную информацию и таким образом перейти от интуитивно-эмпирического способа анализа изображения к объективно измеренному изображению. Цифровая обработка изображений дает возможность оперативно выявить аномальные образования или дефекты на осложненной шумовым фоном нормальной структуры биоткани (вещества). Специалист может не заметить мелких деталей в изображении, которые система разрешает, или пропустить слабоконтрастную структуру, видимую на фоне шумов изображения, из-за сложного строения окружающих (или сверхлежащих) тканей. Контрастирование изображений. Главное преимущество цифровых рентгенографических систем по сравнению с обычными системами заключается в том, что цифровая система может обеспечивать более высокую вероятность обнаружения деталей низкого контраста в широком динамическом диапазоне. Несмотря на то что детектор может обладать достаточно высокой чувствительностью к структуре с низким контрастом в изображениях, наблюдателю требуется помощь, чтобы рассортировать сигналы относительно фоновых структур. Исследуемые низкоконтрастные структуры должны быть сделаны более заметными фильтрацией, подавлением шумов, выделением частот и тому подобными способами. ∗ Следует помнить, что число битов на элемент в черно-белом изображении будет значительно больше, чем в цветокодированном. Это зависит от числа участков, на которые разбивается динамический диапазон сигнала черно-белого изображения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 278 Часть IV. Повышение информационной емкости ТВ изображений Повышение качества изображения. Для того чтобы увеличить информативность градиентного снимка применяют метод цветового контрастирования. Для этой цели создается карта градиента цветов с заданными параметрами. Заданными здесь будут три основных цвета с параметрами цветов, соответствующих градиентам полутонов черно-белых изображений, полученных ранее установкой значений переходов между цветами RGB (рис. 10.5, 10.6∗ ). При этом плавность перехода берется 100 %. Вводится нужный цвет по координатам RGB в панели редактора цвета. Расположение цветов внутри локуса показано на рис. 10.7–10.9. Качество изображения при контрастировании значительно повышается, а при цветовом раскрашивании черно-белых кинофильмов поÐèñ. 10.5. Конус цветов в трехмервышается также и художественная ном пространстве в модели CIE XYZ ценность. Сущность цветового контрастирования заключается в поэтапном присвоении условных цветов уровням яркости в соответствии с заданным ранее алгоритмом цветового кодирования. При этом нужно помнить, что информационная емкость черно-белого и цветного изображения не меняется, но различимость деталей резко возрастает за счет трехмерности цветного изображения (яркость, цветовой тон и насыщенность). При наблюдении черно-белого изображения возможности зрительной системы человека используются неполностью. Установлено, что нормальное человеческое зрение различает до 180 цветовых тонов [7]. Наиболее заметны различия цветового тона в диапазоне волн от 480 нм до 640 нм (от голубого до красного цветов, см. рис. 10.1). Особенно на волнах 500 и 600 нм (голубовато-зеленый и оранжевый цвета), на которых глаз различает изменение преобладающей длины волны приблизительно на 1 нм [42]. При уменьшении насыщенности число различимых деталей глазом цветовых тонов снижается. При малой или слишком большой яркости эффект аналогичен. Это учитывается при формировании амплитудной характеристики телевизионного тракта — S-образная характеристика. В нормаль∗ Рисунки 10.6–10.9 см. на цветной вклейке.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 279 ных условиях глаз различает 150 различных спектральных цветовых тонов и 30 высоконасыщенных пурпурных тонов (сторона RB треугольника Максвелла (рис. 10.7∗ ) [42]. Итого, мы различаем на сторонах цветового треугольника RGB 150 + 30 = 180 тонов. Количество воспринимаемых человеком цветов зависит от многих факторов (условий наблюдения, состояния наблюдателя и т. д.). Если учитывать различие цветов по яркости, цветовому тону и насыщенности, то, как считают некоторые специалисты по колориметрии (например, Д. Джад [139]), человек способен различать около 10 млн цветов, отличных друг от друга по этим трем параметрам (яркость, цветовой тон, насыщенность). Есть сведения о том, что если учитывать только отличие по цветовому тону и насыщенности, то человек способен различать до 17000 отдельных цветностей при угловом размере окрашенного предмета 2◦ , яркости фона 50 кд/м2 , угловом размере фона 50◦ . Так как человек воспринимает не более 120 градаций яркости кинескопа∗∗ и иногда не воспринимает незначительных изменений яркости, в особенности темных участков, то цветовое кодирование монохромных изображений в условные цвета позволяет значительно увеличить число воспринимаемых уровней. Кроме того, при цветовом кодировании черно-белого изображения необходимо учитывать различную чувствительность глаза к изменениям насыщенности цвета. По данным [42] чувствительность глаза к изменениям чистоты цвета больше для сильно насыщенных цветов. При средней насыщенности глаз малочувствителен к изменениям насыщенности цвета. В [42] приведена зависимость числа различимых глазом пороговых изменений насыщенности от белого до монохроматического цвета для различимых длин волн. Исследования показали, что чувствительность глаза к изменениям насыщенности желтого цвета является наименьшей (всего 4 порога), а для синего и красного цветов — наибольшей (25 порогов). Это ∗ Обозначения цветов на рис. 10.7: R — красный; rO — красноватооранжевый; O — оранжевый; YO —желто- оранжевый; Y — желтый; YG — желто-зеленый; yG — желтовато-зеленый; G — зеленый; bG — голубоватозеленый; BG — сине-зеленый; gB — зеленовато-синий; B — синий; PB — сине-фиолетовый; P — фиолетовый; rP — красновато- фиолетовый; pR — фиолетово-красный; pPk — фиолетово-розовый; Pk — розовый; OPk — оранжево-розовый; W — белый. ∗∗ Количество воспринимаемых градаций зависит от времени адаптации глаза, которое определяется скоростью химических реакций в его рецепторах. Таким образом, рассматривая статическое изображение, мы имеем возможность различить на нем больше оттенков, нежели на динамически изменяющемся.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 280 Часть IV. Повышение информационной емкости ТВ изображений хорошо согласуется с вышесказанным, в области больших освещенностей чувствительность глаза падает, а при средней освещенности возрастает. Это надо учитывать при выборе оптимального алгоритма цветового кодирования черно-белых изображений. Это подтверждается также диаграммой порогов различимости цветов на графике МКО (рис. 10.9) [45]. Таким образом, цвет является трехмерной величиной, определяется яркостью (Кд/м2 ), цветовым тоном (нм), насыщенностью (%) и описывается основным колориметрическим выражением Ф = f ′ F = r′ R + g ′ G + b′ B. (10.2) Разделив обе части выражения (10.2) на цветовой модуль m = = r′ + b′ + g ′ , получим f ′F r′ g′ b′ = R + G + B. (10.3) m m m m Трехцветные относительные коэффициенты (координаты цветности): r′ r′ g′ g′ b′ b′ = ′ ; g = = ; b = = . m r + g ′ + b′ m r ′ + g ′ + b′ m r ′ + g ′ + b′ (10.4) Их сумма r+g+b = 1, и они определяют относительную (процентную) величину цветов R, G и B в составе единичного потока F : r= F = rR + gG + bB. (10.5) При нахождении оптимального алгоритма цветокодирования черно-белого изображения необходимо учитывать, прежде всего, свойства человеческого зрения при восприятии цветных изображений. Кроме того, не следует забывать, что цветокодированное изображение должно нести максимум информации и ее распознавание при анализе полученного цветного изображения сравниванием его с исходным черно-белым изображением не должно быть трудоемким. То есть максимум получения информации и легкость ее распознавания являются главной задачей при цветокодировании черно-белых изображений. Напрашиваются два основных метода реализации цветового кодирования. Первый заключается в том, что видеосигнал черно-белого изображения в прямой (обратной) и обратной (прямой) полярностях подается соответственно на два и один управляющие цветом электроды преобразователя «сигнал-свет». Достоинство метода — простота. Недостаток — незначительное повышение информационной емкости. Второй метод кодирования амплитуды сигнала заключается в том, что с помощью специального устройства, управляющего тремя
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 281 прожекторами преобразователя «сигнал-свет», осуществляется разделение динамического диапазона сигнала на несколько участков, затем каждый участок растягивается на весь динамический диапазон преобразователя в необходимых для получения результата сочетаниях. Число реализуемых цветов зависит от способа цветокодирования. Определение числа реализуемых цветов осуществляется по известной формуле числа сочетаний изменений уровня ТВ сигналов на управляющих электродах [40]: Cnm = n! . m!(n − m)! (10.6) Здесь необходимо учитывать, что визуально различимое число цветов по субъективным причинам будет несколько меньше. Поэтому для исключения субъективности при определении информационной ёмкости цветного изображения найдём объём сигнала цветного изображения. Пусть в чёрно-белом изображении S1 — число различимых градаций яркости, а N1 — число элементов в строке, имеющих различную яркость; Z1 — число строк в кадре. Тогда число комбинаций из элементов с различной яркостью (т. е. число возможных сочетаний из S1 по N1 с повторениями, отличающимися хотя бы в одном элементе), которое можно получить в одной строке C1′ и в одном кадре C1 чёрно-белого изображения (количество возможных изображений, сообщений), будет равно C1′ = S1 1 ; N Z N1 . C1 = S1 1 (10.7) В цветном телевидении один элемент полного изображения с цветом смеси трёх основных цветов экрана приёмника составляется из трёх элементов с этими цветами. Поэтому число комбинаций C2 из элементов различных цветов с различной яркостью в одном кадре с числом строк Z равно 3Z2 N1 C2 = S2 , (10.8) где S2 и N2 — число различимых градаций яркости и число элементов в строке каждого основного цвета соответственно. Если Z1 = Z2 = Z, S1 = S2 = S, N1 = N2 = N , то C2 = C13 ; C2 /C1 = S 2ZN = (S ZN )2 = C12 . (10.9) Здесь произведение ZN можно назвать разрешающей способностью системы, определяющей число элементов в кадре. Таким образом, в цветном телевидении возможное количество воспроизводимых изображений (кадров) увеличивается в сравнении с чёрно-белым телевидением (при прочих равных параметрах) в (S ZN )2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 282 Часть IV. Повышение информационной емкости ТВ изображений или C12 раз. При этом с ростом разрешающей способности (величина ZN ) отношение C2 /C1 растёт. В теории передачи сообщений под количеством информации (количество сведений) A в двоичном исчислении, содержащейся в сигнале, понимается логарифм числа комбинаций C при основании 2, т. е. A = lg2 C. (10.10) Тогда в чёрно-белом телевидении A1 = lg2 C1 , а в цветном телевидении A2 = lg2 C2 . Иными словами, A2 = lg2 C2 = lg2 C13 = 3 lg2 C1 = 3A1 . (10.11) Таким образом, объём (количество) информации, передаваемой по каналу связи, в цветном телевидении при формате 4:4:4 в три раза больше, чем в чёрно-белом телевидении. Но количество кадров в комбинации, отличающейся по содержанию хотя бы в одном элементе (пикселе) во много раз больше. Иными словами, в этой комбинации кадров хотя бы один кадр отличается от другого в одном элементе изображения. При цветокодировании реализуется анализ одного цветного кадра и сравнение его по содержанию с исходным, чёрно-белым. В отличие от сигнала, несущего информацию по каналу связи к приёмному устройству, при цветовом контрастировании приёмником информации является глаз, свойства которого необходимо учитывать, чтобы получить максимум визуальной информации. Поэтому при оценке информационной ёмкости цветокодированного изображения целесообразно анализировать один элемент изображения, который изменяет свою яркость, цветовой тон и насыщенность в разных пропорциях. Число таких комбинаций (сочетаний) будет, несомненно, в несколько раз (тысяч) больше, чем в чёрно-белом изображении, а следовательно, и информации, которую в чёрно-белом изображении мы не видели. Один элемент в чёрно-белом изображении может принимать примерно 100 значений (уровней) яркости, а каждый уровень яркости из 100 может иметь 120...180 значений цветовых оттенков. Итого 100 · 180 = 18000 значений. А если учесть, что каждое из 18000 значений будет иметь и разную насыщенность порядка 10 и более, то общее количество сочетаний для одного элемента будет составлять 100 · 180 · 10 = 180000. Естественно, что при анализе изображений в результате адаптации глаз не в состоянии воспринимать такое большое количество информации, но, бесспорно, цветовое контрастирование облегчает распознавание и визуально повышает информационную ёмкость чёрно-белых изображений. В свете сказанного большое значение приобретает выбор оптимального алгоритма цветокодирования чёрно-белого изображения: при
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 283 раскрашивании чёрно-белого испытательного изображения «клин» яркость цветного «клина» должна возрастать — чёрному должны соответствовать тёмные цвета (синие), белому — жёлто-зелёные и даже с переходом в белый цвет. Алгоритм цветокодирования, по возможности, должен охватывать насыщенные цвета. Для извлечения максимальной визуальной информации из чёрнобелого изображения динамический диапазон сигнала от чёрного до белого должен быть разбит на несколько участков, каждый из которых растягивается на полный динамический диапазон сигнала ТВ изображения цветного преобразователя «сигнал-свет». Применение того или иного метода кодирования зависит от конкретных требований, предъявляемых к такого вида устройствам. Использование дискретных методов и персональных компьютеров позволяет решить вышеназванные задачи оперативно без внесения сопутствующих аналоговым методам ошибок в цветокодированное изображение. Рассмотрим более подробно вопросы цветового кодирования чёрно-белого изображения. 10.3. Принципы построения цветокодирующих устройств дискретного типа Рассмотрим принцип формирования амплитудных характеристик для цветокодирующего устройства [38]. На рис. 10.10,a представлен линейно-нарастающий сигнал, соответствующий постепенному изменению яркости чёрно-белого изображения от минимальной до максимальной. Разобьем амплитудный диапазон входного сигнала uвх на 6 участков. Каждому участку входного сигнала необходимо присвоить свою гамму цветов на цветовом треугольнике R, G, B, т. е. в диапазоне Ðèñ. 10.10. Принцип кодирования чёрно-белых изображений
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 284 Часть IV. Повышение информационной емкости ТВ изображений уровней первого участка мы должны подать на трёхлучевой кинескоп три сигнала, изменяющиеся по заданному закону. При этом следует учесть, чтобы цвета (цветовой тон и яркость) не повторялись не на одном участке. Если, например, присваиваемые цвета лежат в плоскости цветового треугольника Максвелла, то яркости участков раскрашенного чёрно-белого изображения будут одинаковыми. В данном случае сумма потенциалов на электродах кинескопа должна быть постоянной на всем диапазоне яркости чёрно-белого изображения, т. е. uR + uG + uB = const . (10.12) Если же условие (10.12) не выполняется, то помимо изменения цветового тона будет изменяться и яркость окрашиваемых участков, что соответствует цветовым треугольникам, лежащим в разных плоскостях системы координат первичных цветов. Такой алгоритм раскрашивания дает большой диапазон визуально различимых цветов и поэтому является предпочтительным перед первым. Для наглядности рассмотрим алгоритм формирования раскрашивания чёрно-белого изображения по второму варианту. Пусть стороны цветового треугольника разбиты на два участка, при обходе которых изменяется цвет и яркость. Для получения алгоритма кодирования формы напряжений сигналов, подаваемых на электроды кинескопа, должны соответствовать рис. 10.10,v–d. В точках Г, Ж, П (рис. 10.10,b) яркость цветов будет в 2 раза выше, чем в точках B, G и R, так как в этот момент подается максимальное напряжение на 2 электрода (а в точках B, G и R только на один). Недостатком рассмотренного алгоритма является неоднозначность цветов, соответствующих минимальной и максимальной яркости, так Ðèñ. 10.11. Принципы цветокак начало Н и конец К обхода цветового кодирования чёрно-белых вого треугольника совпадают в точке В изображений: a — треугольник (рис. 10.10,b) и в точке R (рис. 10.11). RGB и путь цветового кодироДля устранения этого недостатка начавания; b — (сверху вниз) шкала яркости, соответствующий ей сиг- ло и конец обхода цветового треугольнал, профили составляющих RGB ника не должны иметь общую точку.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 285 Проквантуем представленный на рис. 10.10,a видеосигнал на 256 уровней. На каждый участок приходится 42,7 уровня, т. е. число дробное, что при дискретном цветокодировании представляет большие неудобства. Если динамический диапазон сигнала разбивать на число участков кратное двум (2n ), то само устройство по своей структуре сильно упрощается. 10.3.1. Цветокодирующее устройство на логических элементах Рассмотрим возможность создания цветокодирующих устройств (ЦКУ) на широко распространенной элементной базе [38]. Зададимся условием, чтобы схема ЦКУ формировала не менее трех алгоритмов цветокодирования. Пусть динамический диапазон сигнала (рис. 10.12) проквантован на 256 уровней. Путем конкретизации старшего разряда x8 динамический диапазон сигнала разбивается на 2 участка: uА и uБ . При x8 равным 0 все значения выходного сигнала uвых = x7 x6 x5 x4 x3 x2 x1 будут соответствовать участку uА , а значение x8 = 1 — участку uБ . То есть старший разряд x8 можно использовать в качестве управляющего сигнала (рис. 10.13). Если же учитывать в цифровом сигнале два первых старших разряда, то диапазон сигнала разбивается на четыре участка, причем участку I соответствует значение x8 = x7 = 0, а участку II: x8 = 0, x7 = 1, участку III: x8 = 1, x7 = 0 и участку IV: x8 = x7 = 1. В этом случае управляющим сигналом является двухразрядный двоичный код x8 x7 . При формировании алгоритмов цветокодирования будем соблюдать условие плавного, непрерывного изменения цветов, как по яркости, так и по цветовому тону. Ðèñ. 10.12. Принцип цифрового цветокодирования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 286 Часть IV. Повышение информационной емкости ТВ изображений Ðèñ. 10.13. Структурная схема ЦКУ Рассмотрим несколько вариантов формирования алгоритмов цветового кодирования (рис. 10.14). Ðèñ. 10.14. Алгоритм цветового кодирования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 287 Вариант I (рис. 10.14,a). При этом варианте сигнал uвх разбивается на два участка uА = YA и uБ = YБ . Первому участку (x8 = 0) присваивается синий цвет, яркость которого изменяется от 0 до максимума, а на участке YБ цвет плавно от синего, через голубой, переходит в зеленый. Полученная гамма цветов достигается формированием напряжений на электродах 3-лучевого кинескопа соответствующей формы: на зеленый электрод G на участке YА подается нулевой потенциал 0, а на участке YБ линейно нарастающее напряжение uG = YБ = x6 x5 x4 x3 x2 x1 , (10.13) на красный электрод — 0: uR = 0, (10.14) на синий: на участке uА линейно нарастающее, а на uБ — линейно падающее: uB = YA + Y Б . (10.15) Вариант II (рис. 10.14,b). Здесь участку YА соответствуют пурпурные цвета (сторона RВ треугольника RGB), а на участке YБ цветовой тон изменяется плавно от синего до зеленого (сторона BG). На этом же рисунке слева показан закон изменения управляющих напряжений G, B и R: uG = YБ ; uB = YA + Y Б ; uR = Y А . (10.16) Вариант III (рис. 10.14,v). В этом варианте цвета некоторых участков изменяются как по яркости, так и по цветовому тону. Всего 4 участка. Для исключения неоднозначности ни один из участков не должен иметь общих точек между собой. На участке I цвет изменяется как по яркости, так и по цветовому тону (сторона RB). В точке R на электрод кинескопа подается половинное от максимального значения напряжение. Это достигается отбрасыванием 1-го младшего разряда x1 в 6-разрядном двоичном числе: x6 x5 x4 x3 x2 x1 . Второй участок II формируется 6-разрядным двоичным кодом (на электрод В подается инвертированный сигнал) Y II = x̄6 x̄5 x̄4 x̄3 x̄2 x̄1 , а на G — прямой YII = x6 x5 x4 x3 x2 x1 , на R — YII = 0, III участок изменяет цвет от зеленого до красного формированием сигналов uG = Y III = x̄6 x̄5 x̄4 x̄3 x̄2 x̄1 , uB = 0 и uR = YIV = x6 x5 x4 x3 x2 x1 , на IV участке цвет изменится и по яркости и по цветовому тону: от красного через белый к голубому большей яркости, чем на участке II. Таким образом, на электроды кинескопа подаются напряжения uG = YII + Y III + YIV ; uB = YI + Y II + YIV ; uR = x̄6 x̄5 x̄4 x̄3 x̄2 + YIII + Y IV . (10.17)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 288 Часть IV. Повышение информационной емкости ТВ изображений На рис. 10.14 слева от диаграмм сигналов uR , uG и uB значения входных сигналов I1 , I2 , I3 , I4 , S1 , S2 , А и B, которые определяют конкретный алгоритм кодирования. Принципиальная схема ЦКУ строится в соответствии с выражениями (10.13)–(10.17) и должна содержать входные цепи, формирующие прямые и инверсные сигналы, блок управления, формирующий управляющие сигналы x8 и x7 (на входы А и B мультиплексоров), электронные коммутаторы (мультиплексоры), управляемые сигналами разрядов x8 , x7 и формирующие напряжения uR , uG и uB . 10.3.2. Цветовое кодирование черно-белых изображений с помощью персонального компьютера Цветовое кодирование монохромных изображений в условные цвета является актуальной задачей в прикладном телевидении при проведении научно-исследовательских работ. Техническая реализация этой проблемы подробно рассмотрена в [38, 134, 135]. В настоящее время в решении рассмотренной проблемы все более широкое применение находят электронно-вычислительные машины (ЭВМ), позволяющие оперативно программным способом разрабатывать алгоритмы цветового кодирования черно-белых изображений. Персональный компьютер обрабатывает монохромное изображение в цифровой форме по наперед заданному алгоритму. Монохромное изображение для последующей обработки в персональный компьютер может быть введено с видеокамеры, сканера или фотоаппарата. Обработанное изображение выводится на экран монитора и принтер для последующего изучения. Персональный компьютер моделирует в данном случае технические средства, необходимые для осуществления цветового кодирования. Следует отметить, что настоящее время промышленность не выпускает устройств цветового контрастирования и поэтому их частная разработка и реализация требуют значительных затрат. Компьютер же обеспечивает решение данной проблемы. Алгоритмы программы цветового кодирования. Практическая реализация процесса цветового кодирования черно-белого изображения с помощью персонального компьютера полностью подтвердила вышесказанное. Была составлена программа цветового контрастирования в Borland Delphi 5. В ней использовался язык программирования Паскаль [39]. Составленные программы позволяют реализовать любой алгоритм кодирования. Рассмотрим процесс составления программы. Вопросы моделирования процесса цветового кодирования чёрнобелого изображения с помощью персонального компьютера были рассмотрены в работах [39, 134], но конкретной программы контрастирования здесь предложено не было.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 289 Выберем один из вариантов цветового кодирования [41]. Пусть динамический диапазон сигнала чёрно-белого изображения разбит на 4 участка (рис. 10.15). На рис. 10.15,b,v,g показан алгоритм формирования сигналов, подаваемых на три электрода цветного кинескопа. При этом цвета на экране кинескопа при возрастании уровня сигнала от чёрного до белого будут изменяться от красного (80%-ной амплитуды от всего размаха участка I) до синего, далее от синего до зелёного (участок II), от зелёного до красного (участок III) и от красного через белое до голубого повышенной яркости (участок IV) по сравнению с голубым II участка. Для рассмотренного алгоритма цветового кодирования (рис. 10.15) условные цвета для монохромного изображения имеют богатую цветовую гамму: трём участкам чёрнобелого изображения присваиваются цвета 100%-ной насыщенности∗ , а последнему учас- Ðèñ. 10.15. Алгоритм тку — цвета с переменной насыщенностью. цветового кодирования Ширина цветовых участков сильно зависит от формы амплитудной характеристики канала цветокодирования (гамма-коррекции). Необходимость введения гамма-коррекции в видеотракт объясняется ещё и тем, что амплитудные характеристики датчиков сигналов и приёмников нелинейны, а также и необходимостью повышения информационной ёмкости отдельных участков исследуемого сигнала чёрно-белого изображения (здесь γ > 1). Амплитудная характеристика датчика сигналов описывается выражением Uс = k1 E γ1 , (10.18) где γ1 — коэффициент нелинейности, обычно γ1 = 0,6...0,7; E — освещённость объекта; k1 — коэффициент пропорциональности. Амплитудная характеристика кинескопа γ B = k2 U с 2 , (10.19) где γ2 — коэффициент нелинейности модуляционной характеристики кинескопа (γ2 = 2,7...3,0). ∗ Необходимо помнить, что 100%-ную насыщенность имеют цвета на границах цветового локуса. Здесь мы допускаем определенную погрешность в целях упрощения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 290 Часть IV. Повышение информационной емкости ТВ изображений Обычно γ1 γ2 < 1, поэтому в цветном телевидении для неискажённой передачи цветов в видеотракт вводится гамма-коррекция сигналов цветности таким образом, чтобы γ1 γ2 γкор = 1, где γкор — коэффициент нелинейности гамма-корректора. При цветовом кодировании монохромных изображений амплитудная характеристика (АХ) монохромного видеоканала разбивается на несколько участков и поэтому проблема цвето- и гамма-коррекции здесь является более сложной. Более подробно этот вопрос будет рассмотрен в разд. 10.4. Таким образом, использование персональных компьютеров в системах цветового кодирования чёрно-белых изображений полностью избавляет специалистов от использования технических средств, выполняющих операции цветового контрастирования. Персональный компьютер значительно упрощает технологию воспроизведения цветов при контрастировании чёрно-белых изображений. 10.3.3. Оптимизация алгоритма цветового кодирования черно-белого изображения При разработке систем цветового кодирования (СЦК) черно-белых изображений в условные цвета в первую очередь решается вопрос максимального повышения информационной емкости преобразованного изображения. Из множества известных алгоритмов кодирования необходимо выбрать тот, который наилучшим образом решает поставленную задачу. В [41] были рассмотрены наиболее простые алгоритмы кодирования. Следует отметить, что выбор алгоритмов в первую очередь определяется способом контрастирования. При построении цветокодирующих устройств на электронных элементах учитывается простота схемного решения, а при использовании персональных компьютеров — информационная емкость [39]. Увеличение информационной емкости цветокодированного изображения объясняется двумя причинами: более высокой цветовой контрастной разрешающей способностью и увеличенным динамическим диапазоном СЦК. Цветное изображение имеет более высокий контраст, так как является трехмерной величиной (яркость, цветовой тон и насыщенность), а чернобелое — одномерной (яркость). Проведенные исследования показали, что из множества алгоритмов цветокодирования оптимальным следует считать тот, который охватывает все цвета треугольника Максвелла, а динамический диапазон сигнала черно-белого изображения рекомендуется разбивать не более, чем на 8 участков. Рассмотрим наиболее подробно вопросы выбора алгоритма цветового кодирования черно-белых изображений для прикладных систем телевидения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 291 При наблюдении за объектом с помощью прикладных ТВ систем, оператору часто приходится проводить сравнительную оценку яркостей различных участков изображения, характеризующих коэффициенты прозрачности или отражения отдельных деталей контролируемого объекта. Известно, что ТВ система способна воспроизводить изображение объекта с числом n различных градаций яркости, которое определяется как n= 2,3 Bmax lg , δ0 Bmin (10.20) где δ0 = ∆B/B — относительный порог различимости градаций яркости, δ0 = 0,02...0,05; Bmax , Bmin — максимальная и минимальная яркости объекта. При δ = 0,03 имеем Bmax /Bmin = 100 и n = 150. Однако визуальное определение градаций яркости в таком диапазоне возможно осуществить лишь сравнением интересующего оператора участка изображения с испытательным и участками серой шкалы градационного клина. Эта шкала размещается рядом с испытуемым изображением по периметру на одной из сторон ТВ растра монитора. Визуально, без специальных приспособлений, оператор способен идентифицировать не более трех-четырех градаций яркости [40]. Использование для этой цели цветового кодирования амплитуды видеосигнала существенно упрощает работу и увеличивает различительную способность оператора, так как число цветов, которое наблюдатель в состоянии различать значительно больше, чем в черно-белом телевидении. Количество различимых глазом цветов очень велико и зависит от многих факторов, таких, как условия наблюдения, тренированность наблюдателя (оператора) и др. Наш глаз, как указывалось ранее, способен различать около 10 миллионов различных цветов, отличных один от другого по трем параметрам — яркости, цветовому тону и насыщенности [42]. По цветовому тону глаз различает только около 180 оттенков. Таким образом, оптимальный алгоритм кодирования должен быть таким, когда цвет изменяется как по цветовому тону, так и по яркости и насыщенности. Очевидно, что точная идентификация по уровню заданных участков изображения здесь также возможна только при сравнении с испытательным изображением серой шкалы, раскрашенной по заданному алгоритму кодирования. Построение СЦК, позволяющей дать максимальную информацию об исследуемом объекте, является актуальной проблемой. В настоящее время нет рекомендаций по выбору оптимального алгоритма цветового кодирования черно-белых изображений. Проведем краткое исследование по определению оптимального алгоритма цветового кодирования. Из множества известных алгоритмов кодирования необходимо
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 292 Часть IV. Повышение информационной емкости ТВ изображений выбрать тот, который наилучшим образом решает задачу повышения информационной емкости данного изображения. При выборе алгоритмов кодирования следует учитывать, что увеличение информационной емкости черно-белого изображения напрямую связано также с числом участков, на которые разбивается динамический диапазон сигнала черно-белого изображения. При двух и более участках динамический диапазон каждого участка растягивается в соответствующее число раз, что, естественно, приводит и к увеличению информационной емкости изображения (эффект микроскопа). Проведенные исследования показали, что из множества алгоритмов цветокодирования оптимальным следует считать тот, который охватывает все цвета треугольника Максвелла. Рассмотренные варианты (см. рис. 10.14) были предназначены для схем без использования ЭВМ. Здесь главным критерием была простота устройства кодирования. При использовании компьютеров этот критерий не играет существенной роли. Увеличение информационной емкости в данном случае связано с ростом числа участков и изменением цветов по трем параметрам — яркости, насыщенности и цветовому тону. При выборе оптимального алгоритма кодирования следует помнить, что разностный порог различимости цветов уменьшается при одновременном изменении всех его параметров. То есть алгоритм изменения цветов должен охватывать треугольник Максвелла, стороны которого имеют цвета со 100%-ной насыщенностью. Внутри треугольника RGB цвета изменяются по насыщенности и цветовому тону. Совершенно очевидно, что на некоторых участках цвет может изменяться только по двум или трем параметрам. При этом повторение цветов недопустимо, но цветность в некоторых точках может повторяться, например на рис. 10.15 цветовой тон (голубой) повторяется в точках в конце II и IV участков, различаясь по яркости, т. е. эти точки находятся в разных плоскостях цветовых треугольников. Учитывая вышесказанное, рассмотрим алгоритмы кодирования с разбиением динамического диапазона сигнала черно-белого телевидения на 8 и 16 участков. Разбиение динамического диапазона сигнала черно-белого изображения на 8 участков (рис. 10.16) приведет к формированию напряжений на электродах цветного кинескопа UR , UG и UB , изображение от которых изменяется по яркости, цветовому тону и насыщенности. Так, на 1-м участке изменяется только яркость цвета, на 2–6-м участках изменяются яркость и цветовой тон изображения, на 7-м участке изменяется как яркость, так и насыщенность. На последнем участке цвет изменяется по яркости от максимума до нуля. Информационная емкость рассмотренного алгоритма является максимальной по сравнению с предыдущими алгоритмами (рис. 10.14, 10.15). Увеличение информационной емкости здесь происходит за
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 293 Алгоритм цветового кодирования с разбиением динамического диапазона сигнала черно-белого изображения на 8 уровней Ðèñ. 10.16. счет более богатой гаммы цветов и большего числа участков (8 вместо 4). Возникает вопрос, увеличивается ли информационная емкость цветокодированного изображения при удвоении числа участков. При построении алгоритма кодирования необходимо исключить повторение цветов. Представленный на рис. 10.17 алгоритм полностью удовлетворяет этому требованию. Анализируя представленный на рис. 10.17 алгоритм, видно, что растягивание динамического диапазона от минимального до максимального значений в цветном кинескопе цветокодированного изображения приходится на два участка, т. е. возвращаемся к предыдущему варианту. Таким образом, дальнейшее увеличение участков деления чернобелого сигнала только усложняет процесс кодирования, практически не увеличивая информационную емкость. Рассмотрим другие возможные алгоритмы кодирования, используемые на практике. Спирально-треугольный алгоритм. Заслуживает внимания спирально-треугольный алгоритм цветового кодирования (рис. 10.18 и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 294 Часть IV. Повышение информационной емкости ТВ изображений Ðèñ. 10.17. Алгоритм цветового кодирования с разбиением динамического диапазона сигнала черно-белого изображения на 16 уровней Ðèñ. 10.18. Спиральнотреугольный алгоритм цветового кодирования 10.19,a). Он дает постепенное увеличение визуальной яркости при приближении к центру, таким образом, устанавливая некое соответствие яркости кодированного уровня с яркостью исходного. Главный его недостаток — цвета внутренних треугольников весьма близки между собой и плохо различаются, что приведет к ошибкам в работе оператора. Кроме того, динамический диапазон сигналов от внутренних треугольников быстро уменьшается, что приводит к уменьшению ин-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 295 Алгоритмы цветового кодирования изображений: a — cпиральнотреугольный алгоритм цветового кодирования; W — точка белого; b — стигмаобразный алгоритм Ðèñ. 10.19. формационной емкости цветокодированного изображения. Благодаря использованию ЭВМ возможно усложнение алгоритма до спирального, дающего более равномерное изменение псевдоспектра. Стигмаобразный алгоритм. Многие алгоритмы, включая спиральные, имеют один существенный недостаток: они не учитывают различия в яркости чистых спектральных цветов и, как следствие, в яркости первичных составляющих RGB. Это делает обработанное изображение не похожим на оригинал в отношении его яркостной структуры и может создать проблемы в восприятии. Попытки учитывать эту разницу привели к созданию стигмаобразного алгоритма (рис. 10.19,b). Согласно ему путь, по которому происходит цветовое кодирование, начинается в области самых «темных» цветов — синих, далее он резко меняет направление в сторону пурпурных, а затем снова — в сторону зеленых и заканчивается в самой яркой области — желтой. Таким образом, алгоритм следует яркости спектральных цветов и при этом «обходит» точку белого. К недостаткам алгоритма можно отнести малый охват красной части спектра и невозможность избежать неравномерного изменения яркости при прохождении пути кодирования внутри треугольника RGB.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 296 Часть IV. Повышение информационной емкости ТВ изображений На рис. 10.20 представлен алгоритм цветового кодирования с возрастающей визуальной яркостью. Режим умножения. Проблему неравномерного изменения яркости, а также проблему похожести цветов на различных участках пути, по которому происходит кодирование, частично удается решить с помощью режима умножения. Ðèñ. 10.20. Алгоритм цветового кодирования В режиме умножения каждая составляющая с возрастающей RGB умножается на значение яркости уровня визуальной яркостью исходного изображения, сопоставленное данному цвету RGB и делится на максимальное значение яркости. Таким образом, происходит нормировка яркости и все цвета, кроме сопоставляемого максимальной яркости, «покидают» плоскость диаграммы цветности и оказываются в более темной области. Наиболее удобным режим умножения является для обработки изображений, на которых наиболее важная часть информации сосредоточена в верхней области значений яркостей (рис. 10.21 и 10.22 на цветной вклейке). Следует также отметить трудности визуального определения яркости раскрашенных участков. Практически это реализуется сравнением исследуемых участков с испытательным изображением, яркость которого монотонно увеличивается. Эта задача упрощается, если использовать свойства зрения: визуальная яркость увеличивается от тёмно-синего до зеленого, желтого и даже белого. Такой алгоритм изображен на рис. 10.20, хотя информационная емкость этого варианта кодирования не велика. Выбор оптимального алгоритма кодирования зависит от характера черно-белого изображения и поставленной пользователем задачи. Здесь легко определить относительную яркость интересующего участка. Наиболее предпочтительным в этом отношении является алгоритм рис. 10.20. Рассмотренные алгоритмы цветокодирования предусматривают составление программы для каждого алгоритма: т. е., если оператору необходимо исследовать новый алгоритм, не предусмотренный заранее, то потребуется новая программа, на составление которой потребуется много времени. Существует возможность избежать этих трудностей. Программа составляется таким образом, чтобы указателем мышки персонального компьютера в цветовом треугольнике Максвелла можно было бы начертить требуемый алгоритм цветокодирования для данного чернобелого изображения, далее составляем программу, чтобы в будущем не рисовать её вручную каждый раз, приступая к работе. Сочетание первого и второго способов делает работу специалистов более оперативной и эффективной.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 297 Результаты цветокодирования при использовании второго способа контрастирования представлены на рис. 10.21 и 10.22. Программа позволяет раскрашивать в условные цвета любые реальные чернобелые изображения. 10.3.4. Практические рекомендации по выбору алгоритма и формы амплитудной характеристики цветокодирующего устройства При практической реализации контрастирования черно-белых изображений необходимо иметь набор из 6–7 составленных программ для отобранных заранее алгоритмов цветокодирования. Далее, тщательным анализом структуры исследуемого изображения подбирают 2–3 алгоритма кодирования и экспериментально на мониторе компьютера проводят сравнительный анализ раскрашенных в условные цвета изображений. По результатам экспериментальной проверки выбирают оптимальную форму амплитудной характеристики: линейную, нелинейную (с γ-коррекцией) или с масштабированием. При масштабировании следует руководствоваться рис. 10.12, оставляя для исследования один участок, учитывая при этом яркость фона изображения, на котором расположены детали (информация). Выделенный участок раскрашивают, а остальные ограничивают. Проведенные эксперименты подтвердили результаты теоретических исследований по определению оптимальных форм амплитудных характеристик ЦКУ и алгоритмов раскрашивания черно-белых изображений. В соответствии с вышеизложенным было смоделировано на персональном компьютере цветокодирующее устройство. Были разработаны 10 программ для раскрашивания черно-белых изображений, в качестве которых исследовались рентгенограммы, черно-белые изображения производственного и научного назначения. Компьютерное моделирование позволяет врачам оперативно по раскрашенным снимкам более точно поставить диагнозы, производственникам находить дефекты изготавливаемой продукций, проводить обучение студентов и готовить специалистов по данному направлению. Методика проведения работы на персональном компьютере (ПК) по раскрашиванию черно-белых изображений заключается в следующем. Первоначально необходимо осуществить относительный анализ специфики и возможных вариантов преобразования данного изображения, а именно черно-белое и все наиболее подходящие алгоритмы для раскрашивания заданного черно-белого изображения, проанализировать все алгоритмы со всеми возможными уровнями квантования по испытательному изображению и сохранить наиболее информативные алгоритмы. Области 4 и 2 (рис. 10.23) позволяют определить
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 298 Часть IV. Повышение информационной емкости ТВ изображений Ðèñ. 10.23. Главное окно программы необходимое число уровней квантования для исключения ложных контуров (определяется по испытательному изображению). Области 5 и 3 дают осциллограммы сигналов раскрашенных изображений для выбранного алгоритма кодирования. Нажимая на вкладку 3, можно проводить раскрашивание реальных изображений по уже исследованным ранее алгоритмам. В окне «Описание» можно поместить выбранный алгоритм раскрашивания. Для наглядности в программу встроены два рентгеновских изображения человеческой кисти и челюсти (рис. 10.24–10.26 на цветной вклейке). В «области» 5 рис. 10.25 логично выбрать исследуемое изображение и проводить экспериментальную часть уже с ним. «Область» 3 содержит испытательный чернобелый клин и раскрашенный по заданному алгоритму клин. Сравнивая их, легко определить яркость исследуемого изображения для определения дефекта. Программа составлена так, что можно раскрашивать (исследовать) любые реальные черно-белые изображения. На рис. 10.23 в областях 4 и 5 показано изображение, проквантованное на 1024 уровня (визуально не различимы), а область 5 дает осциллограммы сигналов этого изображения. В области 2 аналоговый сигнал проквантован на меньшее число уровней (16, 32, 64, 128, 256). В области 3 расположены осциллограммы сигналов исследуемого изображения. Вкладки позволяют наблюдать испытательные и реальные изображения на экране монитора. Проводя сравнения изображений, можно на практике убедиться в достоверности теоретически выводов. К примеру, рассматривая черно-белое изображение испытательного клина при 128 уровнях квантования, визуально мы не замечаем переходов, тогда как рассматривая это изображение после обработки, мы ясно видим переходы между цветами, наблюдая «ступеньки».
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 299 Таким образом, описанная методика определения оптимального алгоритма кодирования раскрашивания черно-белого изображения поможет специалисту более оперативно работать с исследуемым материалом, не допуская при этом грубых ошибок. Выбор оптимального алгоритма кодирования зависит от характера черно-белого изображения и поставленной задачи. Следует также отметить трудности визуального определения яркости раскрашенных участков. Практически это делается сравнением исследуемых участков с испытательным изображением, яркость которого монотонно увеличивается. Эта задача упрощается, если использовать свойства зрения: визуальная яркость увеличивается от тёмно-синего до желтозеленого и белого. Хотя информационная емкость этого варианта кодирования не является максимальной, но здесь легко определить относительную яркость интересующего участка. Естественно, выбор оптимального алгоритма кодирования зависит от конкретной задачи, поставленной перед оператором. Например, требуется выделить на изображении все участки заданного интервала яркости. Поставленная задача может быть решена двумя путями: 1) выделенный участок растягивают от черного до белого, т. е. до полного динамического диапазона преобразователя «сигнал-свет». Остальные участки на экране преобразователя не воспроизводятся, уходя в область отсечки и насыщения модуляционной характеристики кинескопа. Информационная емкость при этом увеличивается только за счет растягивания динамического диапазона участка выделенного сигнала черно-белого изображения. Описанная операция повторяется, при необходимости, для всех участков изображения; 2) цветовое кодирование выделенного участка многократно увеличивает информационную емкость изображения. При необходимости, заданный интервал яркости также может быть разбит на участки, каждый из которых растягивается до полного размаха сигнала цветного кинескопа. При большой зашумленности изображения выделенные участки рекомендуется рассматривать на участках выше уровня серого, где помехи визуально менее заметны, чем на темных участках. Второй способ позволяет наблюдать все раскрашенные участки одновременно или последовательно, раскрашивая выделенные участки в соответствии с рекомендациями, данными в [37]. 10.3.5. Контрастирование в Adobe Photoshop Adobe Photoshop — растровый графический редактор — является лидером рынка в области коммерческих средств редактирования растровых изображений. Photoshop тесно связан с другими программами для обработки медиафайлов, анимации и другого творчества.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 300 Часть IV. Повышение информационной емкости ТВ изображений Практически все представленные в работе алгоритмы реализуются в данной программе, но здесь можно столкнуться со следующим трудностями: • в данной программе невозможно провести квантование, чтобы изучить все тонкости дискретизации по уровню видеосигнала; • при разбивке изображения на несколько участков придется вручную подбирать каждый цвет. Этот процесс крайне трудоёмок и требует больших временных затрат; • Photoshop является коммерческой программой, цена одной лицензионной копии составляет примерно 60 тыс. руб. Предложенная выше методика раскрашивания черно-белых изображений имеет значительные преимущества перед программой Photoshop: • позволяет реализовать большее количество алгоритмов (более оперативно); • простота использования, не требующая специальных навыков работы с ПК; • практически бесплатна; • позволяет использовать маломощные ПК; • универсальность — её можно использовать как в учебном процессе, так и на производстве, потому более удобна, чем Photoshop. Таким образом, подытоживая вышесказанное, можно сделать следующие выводы. 1. Цветовое контрастирование черно-белого изображения повышает визуальную информационную емкость исходного изображения. Хотя содержащаяся в изображении информация не увеличивается, но благодаря лучшему согласованию его параметров с особенностями зрения возможности и резервы зрительной системы человека используются более эффективно. 2. Аналоговым способам цветового контрастирования присущи серьезные недостатки: невозможность изменения алгоритма цветового кодирования от ЭВМ; переходные процессы, возникающие в устройствах в моменты срабатывания, приводят к ложным контурам в изображении. 3. Дискретные способы цветового контрастирования в отличие от аналоговых наиболее оперативны, позволяют легко изменять алгоритм кодирования и вести обработку сигнала с помощью ЭВМ. 4. Цветокодирующее устройство, составленное из логических элементов, является наиболее простым в настройке, надежным в работе, за счет простого переключения позволяет получить 3–4 алгоритма кодирования, рекомендуется для использования в прикладном телевидении — в дефектоскопии, рентгеноскопии, интроскопии и других областях (в полевых условиях).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 301 5. Цветокодирующее устройство с программируемым алгоритмом кодирования на ОЗУ целесообразно использовать в научных исследованиях. 6. Перспективным, эффективным и практически единственным при проведении научных исследований является цветовое контрастирование черно-белых изображений с применением персонального компьютера. 10.4. Дополнительные способы повышения информативности черно-белых изображений при цветовом контрастировании Способы цветового контрастирования являются эффективным средством повышения информационности черно-белых изображений, нашедшие широкое применение в прикладном телевидении и телевизионном вещании, но не единственными. Повышают информативность и художественную ценность способы нелинейной и апертурной коррекции видеосигнала, коррекция резкости изображений и оконтуривания (выделения контуров). Но если в ТВ вещании главной целью является соблюдение соответствия изображения объекту, то в прикладном телевидении при контрастировании черно-белых изображений — извлечение максимальной информации. В ТВ вещании раскрашивание черно-белого изображения не должно искажать естественные цвета (например, лицо человека, которое не должно быть зеленым или синим). Таких ограничений в прикладном телевидении нет. Рассмотрим эти способы. 10.4.1. Гамма-коррекция В аналоговых преобразователях яркостного контраста в цветовой каждому уровню сигнала соответствует свой цвет. Плавное изменение уровня преобразуется в плавное изменение цветности. Число цветовых оттенков определяется неравномерностью фона сигнала ТВ системы и отношением сигнал/шум. При неравномерности фона сигнала ТВ системы (5...10 %) число цветовых градации нецелесообразно делать более 10–20. В противном случае детали объекта одинаковой плотности, расположенные в разных частях растра, раскрашиваются в разные цвета. Для функциональной (Ф) оценки вероятности обнаружения малоконтрастных объектов на исходном контрастируемом цветном изображении в зависимости от отношения сигнал/шум и контраста воспользуемся формулой [ ] Ψф (K − Kп ) 1 √ . (10.21) P0 = + Ф 2 2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 302 Часть IV. Повышение информационной емкости ТВ изображений Вероятность того, что будет иметь место ложная тревога, можно оценить так [ ] 1 Ψф Kп √ Pлт = − Ф . (10.22) 2 2 Здесь Ψф — отношение сигнал/шум; K — контраст обнаруживаемой детали; Kп — пороговая контрастная чувствительность зрительного анализатора. Из отношения (10.21) видно, что при заданном фоновом отношении сигнал/шум повысить вероятность обнаружения малоконтрастного объекта или снизить контраст обнаруживаемого с заданной вероятностью объекта можно изменением пороговой контрастной чувствительности зрительного анализатора или контрастированием объекта методами цветового кодирования, гамма-коррекции с γ > 1, масштабирования с ограничением. Гамма-коррекция изменяет контраст объекта в γ раз (K ′ = Kγ ), где K ′ — контраст обнаруживаемой детали при использовании γ-коррекции при одновременном изменении фонового отношения сигнал/ шум в 1/γ раз за счёт использования, например, шумоподавления на основе адаптивной интегральной обработки сигнала ТВ изображения (Ψ′ф = Ψф /γ). Заменив в формулах (10.21) и (10.22) Ψф и K на их новые значения Ψф /γ и Kγ, получим [ [ ] ] 1 Ψф /γ(Kγ − Kп ) Ψф (K − Kп /γ) 1 √ √ P0 = + Ф = +Ф ; 2 2 2 2 (10.23) ] ] [ [ 1 1 Ψф /γKп Ψф Kп √ √ = −Ф . (10.24) Pлт = − Ф 2 2 2 γ 2 Как видно из соотношений (10.23) и (10.24), применение γ-коррекции эквивалентно изменению пороговой контрастной чувствительности зрительного анализа в γ раз, что (при γ > 1) повышает вероятность обнаружения при одновременном повышении вероятности ложной тревоги, γ-коррекция расширяет диапазон значений видеосигнала в одних участках за счет подавления в других, что для многоградационных изображений в ряде случаев неприемлемо. Когда полезную информацию несет только часть динамического диапазона видеосигнала, наряду с γ-коррекцией черно-белое изображение подвергают цветовому контрастированию, что дополнительно многократно повышает различимость деталей в изображении. В раскрашенном изображении возможно обнаружение объектов, контраст которых меньше контрастной чувствительности зрения при рассмат-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 303 ривании черно-белого изображения. Цветовое кодирование особенно эффективно при высоких отношениях сигнал/шум (Ψф > 50). При Ψф < 20 применение γ-коррекции не рекомендуется, так как увеличивается вероятность ложной тревоги. Можно так же применить метод масштабирования с ограничением, заключающийся в том, что необходимый участок диапазона сигнала растягивается на весь допустимый динамический диапазон видеосигнала и раскрашивается. Детали за пределами выбранного участка подавляются. При достаточно высоком отношении сигнал/шум (Ψф > 50) и неравномерном распределении информации по динамическому диапазону видеосигнала используют γ-коррекцию или масштабирование с ограничением в совокупности с цветовым кодированием. 10.4.2. Апертурная коррекция В основе данного способа лежит принцип коррекции резкости фотографического изображения, заключающийся в том, что при фотопечати на негатив изображения накладывается его расфокусированный позитив малого контраста. Благодаря результирующему уменьшению эффективного размера апертуры реализуется при этом относительный весовой подъём высокочастотных пространственных составляющих в фотоотпечатке. В телевидении практически используются способы апертурной коррекции, основанные на электрическом формировании корректирующего сигнала (КС) пространственных высокочастотных составляющих изображения. Упрощенная структурная схема электрического апертурного корректора (АК) показана на рис. 10.27. Необходимый сигнал КС вырабатывается формирователем и через регулируемый аттенюатор поступает на сумматор для согласованного во времени сложения с основным сигналом (ОС). Регулировкой изменяют относи- Ðèñ. 10.27. Упрощенная структурная тельный вес КС при его суммиро- схема электрического апертурного корректора вании с ОС. Такое построение АК позволяет избежать влияния коррекции на яркость и контрастность результирующего ТВ изображения. В большинстве своём существующие варианты схем АК отличаются лишь способами формирования и структурой формирователя КС. Для сопоставления действия различных вариантов АК на ТВ изображение необходимо определить их эквивалентные пространственные характеристики. Для этого по известной структуре схемы АК определяется его пространственная импульсная реакция G(x, y), за-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 304 Часть IV. Повышение информационной емкости ТВ изображений тем с помощью двумерного преобразования Фурье — пространственный коэффициент (характеристика) передачи пространственных частот корректора K(fx , fy ). Результирующая апертура G1 (x, y) может быть записана в виде G1 (x, y) = G0 (x, y) ⊕ G(x, y), (10.25) где G0 (x, y) — результирующая апертура преобразователя «свет-сигнал»; G(x, y) — эквивалентная апертура (импульсная реакция) АК; символ ⊕ означает двумерную операцию свертки функций вида ∫ ∞∫ ∞ G0 (u, v)G(x − u, y − v) dudv, G0 (x, y) ⊕ G(x, y) = −∞ −∞ где u и v — переменные интегрирования. Результирующая характеристика передачи K1 (fx , fy ) выражается, соответственно, в виде K1 (fx , fy ) = K0 (fx , fy )K(fx , fy ), (10.26) где K0 (fx , fy ) — характеристика фильтра нижних частот, выражающего действие результирующей апертуры преобразователя «светсигнал»; K(fx , fy ) — эквивалентная характеристика самого АК. Вследствие дискретного характера ТВ изображения АК реализуется как дискретный пространственный (двумерный) фильтр. Такой фильтр производит взвешенное алгебраическое суммирование смещенных в пространстве копий исходного изображения. Коэффициент передачи K(fx , fy ) и соответствующая пространственная частотная характеристика дискретного фильтра имеют периодический характер. При апертурной коррекции учитывается центральная область этих характеристик. Необходимое для реализации апертурных корректоров смещение изображения (задержка во времени видеосигнала) в горизонтальном направлении осуществляется задержкой ТВ сигнала на время длительности долей и элементов изображения; смещение в вертикальном направлении требует задержки сигнала на время, кратное периоду строки в пределах ТВ растра. 10.4.3. Обнаружение контуров объектов в цветокодированном изображении Для отображения характеристик и оценки параметров отдельных объектов их изображения предварительно необходимо отделить от фона, т. е. найти границы соответствующие локализации заданных объектов. Эти границы обычно представляют собой криволинейные функции на изображении, вдоль которых имеют место резкие перепады в уровне яркости и наличие соответствующих производных в
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений Ðèñ. 10.28. 305 Зашумленный фрагмент сигнала, его первая и вторая производные ортогональном, по пространственному расположению перепада в данной точке направлении. Формирование контуров требует использования фильтрующей операции, которая должна обеспечить селекцию составляющих текущего сигнала, соответствующих локальным пространственным изменениям уровня высокой крутизны, и подавление фонового типа его участков. На рис. 10.28 иллюстрируется, для одномерного варианта, эффективность действия в качестве такой операции дифференциальных операторов. Первая производная отражает появление импульсного типа реакции (положительный и отрицательный выбросы) на резких, от одного уровня к другому, переходных участках. Вторая производная пересекает ноль в точках максимальной крутизны изменения уровня. Оба критерия можно использовать для выделения контуров [82]. В случае более высокой размерности описание изменений сигнала гораздо сложнее. Во-первых, мы рассматриваем 2-D изображения. Здесь мы можем выделить контуры, углы, линии и локальные экстремумы как подходящие признаки для обработки изображений. Для контура характерно интенсивное изменение уровня сигнала перпендикулярно его направлению. Но в касательном направлении к контуру изменения незначительны. Однако, если крутизна изменения уровня по выбранному направлению и в перпендикулярном существенна, то можно предполагать наличие локальной конфигурации углового типа. Линия характеризуется, приблизительно, нулевыми значениями первой и второй производной вдоль линии и, в отличие от контура, меняет знак первой производной в пределах её ортогонального сечения. Локальные экстремумы характеризуются нулевыми первыми
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 306 Часть IV. Повышение информационной емкости ТВ изображений производными, но высокой крутизной изменения уровня во всех направлениях. Как уже было отмечено, при обычном квантовании для сохранения высокого качества изображения требуется 128–256 уровней квантования, что соответствует 0,8...0,4 % точности передачи значений яркости. Но, если сравнивать фотографии, отпечатанные с одного негатива на фотобумаге различной контрастности (различных номеров), то окажется, что при сходстве изображений имеет место сильное расхождение в яркости соответственных элементов. При этом сохраняется местоположение перепадов уровней яркости, специфика конфигурации в пределах внутрикадрового пространства и, приблизительно, их величина. Это позволяет сделать следующий вывод: при квантовании должны быть сохранены имеющиеся на изображении контуры и не должны возникать мешающие контуры (оконтуриваний низкоградиентных изменений яркости). Именно эти требования заставляют выбирать столь большое число уровней квантования. Контур — понятие до некоторой степени условное. Интуитивно определяются как контур те участки изображения, где максимально (резко) изменяется яркость. Можно, например, считать принадлежащим контурам те элементы изображения, где градиент яркости превосходит по модулю некоторое пороговое значение [135]: √[ ]2 [ ]2 dB(x, y) dB(x, y) + > δ1 . (10.27) dx dy Хорошо согласуется с особенностями зрительного восприятия определение контуров как совокупности элементов изображения, где абсолютные значения лапласиана от B(x, y) превосходят некоторое пороговое значение: |∆B(x, y)| = d2 B(x, y) d2 B(x, y) + > δ2 . dx2 dy 2 (10.28) Там, где перепад яркости имеет высокую динамику по данному направлению внутрикадрового пространства, оба определения указывают на положение контура приблизительно одинаково. Но там, где яркость изменяется более плавно, второе определение говорит о наличии контура только в точках «излома», а согласно первому — к контуру следовало бы отнести весь участок изменения яркости. Известно, что контуры играют важную роль в процессе зрительного восприятия. В контурах содержится много сведений об изображениях. Знание контуров зачастую оказывается достаточным для идентификации объектов и выполнения задач, которые ставятся перед получателем сообщения. Характерно, что рисунки первобытно-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 307 го человека были контурными. Контурными являются и рисунки детей. Контурные изображения составляют основу современной графики. Плоское неподвижное изображение может быть представлено в виде двойного интеграла Фурье: ∫ ∞∫ ∞ 1 B(x, y) = S(ωx , ωy )ei(ωx x+ωy y) dωx dωy , (10.29) 2π −∞ −∞ где ωx и ωy — круговые пространственные частоты, значения которых определяются по направлениям вдоль осей 0х и 0y произведением 2π на число периодов (X0 , Y0 ), эквивалентных по протяжённости условной единице длины, например внутрикадрового пространства. При этом условной единицей может быть один градус угла поля зрения, высота экрана и другие условные единицы. Соотвественно 2π 2π ωx = 2πfx − ; ωy = 2πfx − . (10.30) x0 x0 Преобразование исходного изображения B(x, y) с помощью оператора Лапласа соответствует относительному ослаблению нижних и усилению верхних пространственных частот. Действительно, применим это преобразование к функции B(x, y), разложенной в интеграл Фурье (10.29): ( 2 )[ ] ∫ ∞∫ ∞ d d2 1 i(ωx x+ωy y) ∆B(x, y) = + S(ω , ω )e dω dω = x y x y dx2 dy 2 2π −∞ −∞ ∫ ∞∫ ∞ 1 =− S(ωx , ωy )(ωx2 + ωy2 )ei(ωx x+ωy y) dωx dωy . (10.31) 2π −∞ −∞ Спектр преобразованного изображения S(ωx , ωy ) = (ωx2 , ωy2 )S(ωx , ωy ). (10.32) Операции, эквивалентные весовому ослаблению нижних и усилению верхних пространственных частот, соответствующих выделению контуров, обнаружены в зрительной системе. Сетчатка действует в первом приближении как фильтр пространственных частот изображения, причем степень относительного подавления нижних пространственных частот возрастает в данном случае с увеличением средней освещённости в пределах всего пространства, подвергаемого видеоконтролю, и наоборот. Аппарат сумеречного зрения — палочковые рецептивные поля — работает как фильтр нижних пространственных частот. Он подавляет высокие пространственные частоты, доля которых в передаче мелких деталей изображения и резких перепадов яркости является определяющей, но вместе с тем подавляет и хаотические флуктуации, кото-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 308 Часть IV. Повышение информационной емкости ТВ изображений рые вызваны колебаниями распределения энергии в световом потоке, поглощаемом сетчаткой. Такая фильтрация целесообразна, когда отношение сигнал-шум на входе зрительной системы невелико, т. е. при низком уровне освещенности. Напротив, когда освещенность велика и влиянием квантовых флуктуаций на входе системы можно пренебречь, сетчатка глаза работает как дифференциально-интегральный (полосовой) фильтр, максимум полосы пропускания которого лежит в области средних пространственных частот. Это достигается благодаря тому, что в колбочковых рецептивных полях имеются широкие зоны торможения вокруг центральной зоны возбуждения [135]. Появление торможения рядом с возбужденным участком приводит, по существу, к относительному усилению верхних и ослаблению нижних частот в изображении, т. е. к подчеркиванию перепадов яркости и мелких деталей и кажущемуся уменьшению различия освещенностей больших полей, что можно показать с помощью следующих простых рассуждений. Пусть на сетчатку проектируют перепад освещенности, показанный на рис. 10.29. Cправа от границы, в области, где освещенность больше, рецептивные поля имеют более развитые зоны торможения и меньшую зону возбуждения, чем слева, где освещенность меньше. Следовательно, световой сигнал справа усиливается в среднем меньше (из-за более сильного торможения), чем слева, и разница между сигналами справа и слева должна быть меньше в среднем, чем в исходном изображении. Ðèñ. 10.29. ПреобраИначе обстоит дело на пограничных учасзование изображения тках. Слева от границы (перепада) возникает в сетчатке глаза минимум сигнала (А): здесь сильное торможение, индуцируемое соседним ярко освещенным участком, преобладает над слабым собственным возбуждением этого участка. Напротив, справа от границы появляется максимум сигнала (Б): здесь собственное сильное возбуждение не подавляется так, как справа, потому что слева расположен слабо освещенный участок, оказывающий лишь слабое тормозное воздействие на соседние участки. Имеются много экспериментальных данных, подтверждающих эти представления о подчеркивании перепадов яркости вследствие торможения. Один из наиболее убедительных экспериментов принадлежит Хартлайну. Он записывал электрические сигналы от одного рецептора глаза мечехвоста при медленном сканировании светового поля с градиентом освещенности. Эти сигналы представляют собой
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 309 серии импульсов. Интенсивность кодируется в первом приближении числом импульсов в посылке. Чем больше световой сигнал, тем больше частота ответной импульсации. Когда все рецепторы, кроме исследуемого, были прикрыты маской, регистрируемая частота импульсов правильно отображала распределение интенсивности света. Но когда маску сняли и соседние рецепторы начали оказывать тормозящее воздействие на исследуемый объект, возникли минимум и максимум импульсации, соответствующие усилению перепада освещенности. Подчеркивание контуров наблюдают не только в электрофизиологических опытах на животных, но и в психофизиологических опытах на человеке. Хорошо известно явление Маха: градационная шкала со ступенчатым распределением яркостей представляется наблюдателю так, как будто в местах перепадов подчеркнуты контуры. Явление Маха — частный случай следующей общей закономерности, установленной в психофизиологических опытах: глаз при дневной освещённости выделяет и подчеркивает те участки изображения, где абсолютное значение лапласиана ∆B(x, y) заметно отличается от нуля. Оказалось очень полезным подчеркивать контуры и в ТВ системах. Такая операция позволяет снизить степень мешающего воздействие шумов канала связи при передаче изображения и шумов зрительной системы при видеоконтроле изображения. Рассмотрим способы получения лапласиана изображения в телевизионных системах. Как видно из (10.31), частотная характеристика пространственного фильтра, осуществляющего это преобразование, может быть представлена соотношением A(ωx , ωy ) = ωx2 + ωy2 . (10.33) Хорошим приближением к такой характеристике будет фильтр пространственных частот, результатом действия которого является вычитание расфокусированного изображения из исходного. Действительно, пусть расфокусированное изображение образуется с помощью преобразования α(x, y) = e−α 2 (x2 +y 2 ) , (10.34) где α — некоторая константа. Тогда частотная характеристика ( ) ωx2 + ωy2 A1 (ωx , ωy ) = − exp . 4α2 Обозначим спектр исходного изображения S0 (ωx , ωy ). Спектр
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 310 Часть IV. Повышение информационной емкости ТВ изображений расфокусированного изображения ( ωx2 + ωy2 S0 (ωx , ωy ) exp − 4α2 ) , а спектр изображения на выходе рассматриваемого фильтра имеет вид ( ) ωx2 + ωy2 S(ωx , ωy ) = S0 (ωx , ωy ) − S0 (ωx , ωy ) exp − = 4α2 )] [ ( ωx2 + ωy2 = S0 (ωx , ωy ) 1 − exp − . (10.35) 4α2 Если α достаточно велико (т. е. если расфокусировка невелика), так что α ≫ 2πWx , α ≫ 2πWy , где Wx , Wy — граничные частоты, то можно оставить два первых члена разложения экспоненциальной функции в ряд. Тогда получим приблизительно ωx2 + ωy2 . (10.36) 4α2 Таким образом, получили требуемую характеристику (10.33) (с точностью до постоянного множителя). S(ωx , ωy ) = S0 (ωx , ωy ) Ðèñ. 10.30. Яркостная коррекция
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений 311 Выделение контуров с помощью преобразования (10.33) дополнительно повышает информационную ёмкость цветокодированного изображения. На рис. 10.30 приведены изображения, подвергнутые высокочастотным преобразованиям [136]. 10.4.4. Повышение резкости черно-белых изображений Следует отметить, что в данном случае чаще всего не ставится задача восстановления изображения, т. е. возврата к оригиналу. При повышении резкости иногда следует провести даже перекомпенсацию интегральных пространственных искажений, т. е. избыточно поднять уровень высокочастотных составляющих пространственного спектра. Рассмотрим простой (эффективный) метод, который основан на пространственной линейной обработке изображения «скользящим окном» небольшого размера. Это окно перемещается по изображению, и при каждом его положении в пределах исходной совокупности пикселей формируется один результирующий отсчет выходного поля яркости (обычно этот отсчет соответствует центру окна). В данном случае алгоритм повышения резкости реализуется как двумерный фильтр с конечной импульсной характеристикой (КИХ). Размеры и форма окна определяют область ненулевых значений импульсной характеристики КИХ-фильтра. Рассмотрим качественно, как строится фильтр, подчеркивающий границы. Для этого воспользуемся рядом «одномерных» иллюстраций. Пусть f (n) — произвольная строка исходного нерезкого изображения. На рис. 10.31, кривая 1 представляет соÐèñ. 10.31. Подчёркибой строку реального изображения с вание границ с использованием НЧ-фильтрации неидеально фокусированной границей объекта. Процедуру обработки можно разбить на несколько шагов. Вначале осуществляется низкочастотная фильтрация, т. е. дополнительное сглаживание исходного сигнала. При этом возникает сопутствующая задержка исходного сигнала. Обозначим сглаженный сигнал через f (n) (рис. 10.31, кривая 2). Далее, после согласования во времени исходного и сглаженного сигналов, из первого вычитается второй сигнал. В результате формируется разностный сигнал — высокочастотное изображение f ′ = f (n) − f (n) (рис. 10.31, кривая 3) — корректирующая составляющая, соответствующая (с учётом изменения полярности) второй производной исходного сигнала f (n). Затем этот разностный сигнал прибавляется (с некоторым повышающим весовым коэффициентом) к исходному сигналу. Полученный
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 312 Часть IV. Повышение информационной емкости ТВ изображений результат g(n) — изображение с повышенной резкостью (рис. 10.31, кривая 4). В спектре этого изображения низкочастотные компоненты не изменились (т. е. общий уровень яркости остался прежним), а высокочастотные относительно усилились (т. е. подчеркнуты локальные особенности — границы, мелкие детали). Теперь рассмотрим эту процедуру для двумерного случая. Низкочастотная фильтрация (сглаживание) осуществляется усреднением отсчетов поля яркости в двумерном окне: ∑∑ f (n1 , n2 ) = α(k1 , k2 )f (n1 − k1 , n2 − k2 ). (10.37) (k1 ,k1 )∈D Здесь D — некоторая конечная область в пространстве аргументов x0y, ограничивающая двумерное окно. Выражение (10.37) задает двумерную свертку сигнала f (n1 , n2 ) с импульсной характеристикой сглаживающего КИХ-фильтра. Значение уровней (коэффициентов) отсчётов двумерной КИХ выбираются так, чтобы получить действительное сглаживание (усреднение) отсчетов. Обычно коэффициенты α(k1, k2 ) > 0 в пределах пространства окна. Кроме того, процедура сглаживания не должна изменять среднее значение (постоянную составляющую) результирующего изображения, т. е. необходимо выполнение условия ∑ α(k1, k2 ) = 1. (10.38) (k1 ,k1 )∈D Часто все коэффициенты импульсной характеристик берутся одинаковыми, при этом получается простое усреднение отсчетов изображения по окну. Далее вычисляют высокочастотное изображение f ′ (n1 , n2 ) = f (n1 , n2 ) − f (n1 , n2 ) (10.39) и получают изображение с повышенной резкостью: g(n1 , n2 ) = f (n1 , n2 ) + qf ′ (n1 , n2 ), (10.40) где q — коэффициент усиления и выбора полярности высокочастотного сигнала, модуль которого превышает нулевое значение. Раскрываем обозначения, получаем  + q f (n1 , n2 ) − g(n1 , n2 ) = f (n1 , n2 ) + ∑∑  α(k1 , k2 )f (n1 − k1 , n2 − k2 ) . (10.41) (k1 ,k1 )∈D Если привести подобные члены, то можно получить это выраже-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 10. Повышение информативности черно-белых изображений ние в виде свертки g(n1 , n2 ) = ∑∑ h(k1 , k2 )f (n1 − k1 , n2 − k2 ), 313 (10.42) (k1 ,k1 )∈D где h(k1 , k2 ) — импульсная характеристика КИХ-фильтра, осуществляющая подчеркивание границ (повышение резкости). На практике берут обычно центрированное квадратное окно малого размера (3×3 или 5×5). При этом h(k1 , kk2 ) имеет всего несколько ненулевых отсчетов. Значения этих отсчетов удобно задавать в форме так называемой «маски». Пример. Типичной для повышения резкости изображений является маска размером 3×3 пикселя   0 −1 0  −1 5 −1  . 0 −1 0 В случае, когда уровни отсчётов в пределах маски соответствуют варианту a(0, 0) = a(1, 0) = a(−1, 0) = a(0, 1) = a(0, −1) = 1/5, реализуется сглаживание усреднением по пяти отсчетам. Совмещение во времени сглаженного с исходным сигналом ТВ изображения и их вычитание даёт необходимые для подчёркивания границ высокочастотные оставляющие. Эксперименты по психовизуальному оцениванию качества изображений показывают, что объекты с «неестественно» подчеркнутыми границами на глаз воспринимаются, чаще всего, лучше, чем идеальные с точки зрения фотометрии. Таким образом, задача повышения резкости в равной степени относится и к улучшению качества, и к препарированию изображений. В общем случае искажения имеют сложную природу возникновения. Перед вводом в компьютер реальные изображения обычно подвергаются действию и других искажающих факторов, например искажениям, вызванными нелинейностью амплитудной характеристики устройств рентгеновских аппаратов, рассмотренным в [137]. Для нелинейных искажений характерно появление в спектре исходного сигнала ТВ изображений частотных составляющих (например, гармоник), отсутствующих в исходном его варианте. Нелинейными, соответственно, являются и преобразования спектра ТВ сигнала, которые имеют место при изменении частот воспроизведения строк и кадров, при формировании ТВ радиосигнала, при сжатии и других вариантах цифровой обработки сигналов ТВ изображений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 314 Часть IV. Повышение информационной емкости ТВ изображений Контрольные вопросы 1. Как осуществляется повышение информативности черно-белых изображений его контрастированием? 2. В каких областях науки, техники и производства находят применение методы цветового контрастирования черно-белых изображений? 3. В чем заключается сущность цветового контрастирования? 4. Какие способы преобразования черно-белого изображения в цветное вы знаете? 5. Использование персонального компьютера для контрастирования черно-белых изображений. 6. Что значит оптимизация алгоритма цветового кодирования черно-белых изображений? 7. Почему цветное изображение является более информативным, чем чернобелое? 8. Можно ли черно-белое изображение сделать цветным без цветовых искажений?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 11 ОБЪЕМНОЕ ТЕЛЕВИДЕНИЕ 11.1. Основы стереотелевидения В технике прикладного телевидения стереоскопические системы целесообразно использовать при управлении работой манипуляторов, подъемных кранов и других механизмов, когда оператору необходима информация о пространственном положении объекта наблюдения. Объемное воспроизведение изображений основано на бинокулярном свойстве зрения, благодаря которому объемные предметы на сетчатках левого и правого глаза создают отличающиеся друг от друга изображения. Это отличие определяется глазным базисом b0 , под которым понимается расстояние между центрами зрачков обоих глаз. Для «среднего» наблюдателя b0 ≈ 65 мм. Дальность стереоскопического зрения r0 прямо пропорциональна глазному базису и обратно пропорциональна порогу глубинного зрения δ, которое составляет 10...20′′ . Для δ = 15′′ получаем r0 = b0 /δ ≈ 1 км. Для увеличения дальности стереоэффекта используют стереотрубы и бинокли. При этом базис наблюдения увеличивается по сравнению с невооруженным глазом в b/b0 раз, где b — базис прибора, т. е. расстояние между центрами объективов. Одновременно увеличивается и острота глубинного зрения 1/δ, поскольку порог стереоскопического зрения изменился до значения δ/γ, где γ — угловое увеличение бинокля или стереотрубы. Таким образом, для вооруженного глаза r = b/(δ/γ) или с учетом соотношения для r0 : r= r0 bγ = Пr0 . b0 Величина П = bγ/b0 называется пластикой бинокулярного прибора. Пластика прибора определяет его эффективность с точки зрения увеличения дальности стереоэффекта. Для биноклей при условии b = 2b0 , γ = 6 получаем Π = 12. Для стереотруб пластика достигает 120 [5]. Следовательно, для передачи объемного воспроизведения ТВ изображений необходимо два условия:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 316 Часть IV. Повышение информационной емкости ТВ изображений Ðèñ. 11.1. Структурная схема передачи объемных изображений 1) передача изображений с некоторым базисом съемки. Эти два кадра, снятые с разных позиций, называются стереопарой. Каждый кадр стереопары может передаваться одновременно или последовательно; 2) необходимо раздельное рассматривание правым и левым глазом соответствующих кадров стереопары. Деление изображений стереопары может осуществляться с помощью очков (индивидуальное) и растровых устройств (коллективное). В качестве примера рассмотрим упрощённую структурную схему стереотелевизионной системы (рис. 11.1). Передающие камеры ПЗС 1 и 2 разнесены на расстояние pounds — базис. После усиления и кодирования сигналы поступают в линию связи. На приемной стороне сигналы воспроизводятся на экране стереовидеоконтрольного устройства СВКУ, имеющего два воспроизводящих устройства, для правого и левого изображения стереопары. Разделение изображений выполняется при помощи зеркального стереоскопа. Для коллективного наблюдения объемного изображения применяются воспроизводящие устройства других типов, например поляроидный способ разделения изображения (как в стереокино). 11.2. Многоракурсное телевидение Разновидностью стереотелевидения является многоракурсное телевидение, принцип действия которого заключается в съемке объектов передачи с многих, в том числе и ортогональных в пространстве, позиций несколькими десятками, а может быть и сотнями передающих камер (на ПЗС- или КМОП-матрицах), расположенных определенным образом. Воспроизведение сформированных таким образом изображений осуществляется на общем специального типа экране. Особенностью такой системы является предоставление для оператора возможности осуществления визуального контроля и идентификации объектов сцены с различных направлений позиционирования используемой совокупности датчиков сигнала ТВ изображений. Ниже приводится один из вариантов схем построения многоракурсных систем (рис. 11.2) [5].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 11. Объемное телевидение Ðèñ. 11.2. 317 Схема построения многоракурсной телевизионной системы Всю схему можно разделить на несколько частей, функции которых вполне определенные: съемка объекта, передача изображений, совмещение изображений и селекция ракурсов. Съемка объекта осуществляется размещением, например, по дуге АБ нескольких передающих камер, формирующих ТВ двухмерные изображения, отличающиеся друг от друга только горизонтальным параллаксом. В статических системах, работающих не в реальном времени, можно использовать одну камеру, последовательно перемещая ее по дуге АБ на угловые интервалы ∆ψ. 11.3. Голография и телевидение Голография открывает совершенно новые возможности построения системы объемного телевидения. Воспроизводимое голограммой изображение является оптическим аналогом объекта, позволяющим не только воспроизводить глубину пространства, но и обеспечивать эффект обзора. На изображение можно смотреть с разных направлений через голограмму, как через окно в реальный мир. На голограмму записывается бесконечное количество ракурсов, непрерывно переходящих один в другой, поэтому при обзоре изображений с разных сторон нет скачков ракурсов. Голография основана на записи и последующем восстановлении волнового фронта, рассеянного объектом света. Первый этап использует явление интерференции при взаимодействии двух когерентных пучков (рис. 11.3). Лазерным светом освещают объект и зеркало. Свет, отраженный объектом (предметный волновой фронт, предметный пучок с соÐèñ. 11.3. Запись голограммы ответствующим распределением
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 318 Часть IV. Повышение информационной емкости ТВ изображений фаз и интенсивностей) и зеркалом (эталонный волновой фронт, или опорный пучок, или когерентный фон), пересекаются в определенной области пространства и взаимодействуют, образуя пространственное интерференционное поле, поле узлов и пучностей, максимумов и минимумов интенсивности. Если в этом пространстве поместить фоточувствительную среду, то она зарегистрирует часть этого интерференционного поля. Такая светочувствительная среда после фотохимической обработки называется голограммой. В простейшем случае голограмма представляет собой чередование светлых и темных полос. Число интерференционных полос, т. е. количество светло-темных пар линий на единицу длины голограммы, называется пространственной частотой. Отличие голографического процесса записи от обычного фотографирования заключается в том, что на голограмме записана не только амплитудная (интенсивность), но и фазовая информация, выраженная в виде чередования по определенному закону светлых и темных полос и отражающая информацию об относительном пространственном позиционировании контролируемого объекта. Отсюда и происхождение слова «голография»: от греческих слов Oλoσ — полный и γραψτ ε — пишу, т. е. запись полной информации. Голография была изобретена Дэннисом Габором. В 1947 году он предложил, а в 1948 году опубликовал однолучевую схему для голографирования полупрозрачных плоских объектов. В 1961 году Эммет Лейт и Юрис Упатниекс усовершенствовали исходную схему Габора, предложив свою двухлучевую (с наклонным опорным лучом) схему формирования плоских голограмм непрозрачных трехмерных объектов. На рис. 11.4 показана схема голографической системы телевидения. На мишени передающей трубки (ПЗС) 5 создается голограмма передаваемого объекта 1 с пространственной частотой записи v = sin θ/λ, где θ — угол между волновым фронтом (предметным потоком) и опорным потоком лазерных лучей; λ — длина световой волны лазера 4. Предметный и опорный потоки создаются одним ла- Ðèñ. 11.4. Схема голографического телевидения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 11. Объемное телевидение 319 зером 4, который с помощью объектива 3 освещает передаваемый объект 1 и зеркало 2. Следовательно, на мишени передающей трубки накладываются два потока, отраженные один от объекта, другой от зеркала. Мишень передающей трубки ПЗС 5 регистрирует интерференционную картину, соответствующую отражению исходного потока от объекта передачи и опорного пучка. Записанная таким образом голограмма поступает на кодирующее устройство КУ 6, а затем передается в линию связи на декодирующее устройство ДУ 7 приемника. Полученный сигнал модулирует лазерный кинескоп 8 или другой преобразователь «сигнал-свет» (ЖКЭ или ПП). Модулированный когерентный световой поток с кинескопа 8 объективом 9 проектируется на светочувствительный экран 11. Изображение восстанавливают, освещая голограмму 11 световым потоком от лазера 10. При рассматривании восстановленных голограммой изображений можно не только ощутить глубину пространства, но и оглядеть его с разных сторон. При реализации голографических ТВ систем возникает много технических трудностей, связанных с большой информационной емкостью голограмм и высокой удельной плотностью информации. Для получения высококачественной голограммы требуется создание анализирующих (преобразователь «свет-сигнал») и синтезирующих («сигнал-свет») устройств с очень высоким разрешением, что является трудноразрешимой задачей. Вопрос о путях построения голографических ТВ систем до сих пор еще не решен. Развитие голографического телевидения будет идти, очевидно, в двух направлениях. Одно их них ставит своей целью совершенствование всех звеньев (передающее устройство, канал связи, приемное устройство) для создания голографических ТВ систем. Второе направление заключается в построении промежуточных паллиативных систем, в которых новые качественные параметры пространственных изображений достигались бы не слишком дорогой ценой и которые поэтому могли бы быть реализованы в обозримом будущем. Контрольные вопросы 1. На чем основано объемное воспроизведение изображений? 2. Чем определяется дальность стереоскопического зрения? 3. Как увеличить дальность стереоэффекта? 4. Что такое пластика бинокулярного зрения? 5. Что такое голографическое телевидение? 6. Что такое многоракурсное телевидение? 7. В каких областях науки, техники и производства могут найти применение системы объемного телевидения?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü V ЦИФРОВОЕ ПРЕОБРАЗОВАНИЕ ИЗОБРАЖЕНИЙ В ТЕЛЕВИДЕНИИ 12 ОБЩИЕ ПРИНЦИПЫ ПРЕОБРАЗОВАНИЯ АНАЛОГОВОГО ВИДЕОСИГНАЛА В ЦИФРОВОЙ В настоящее время традиционная аналоговая техника связи повсеместно заменяется более совершенной цифровой. Этот процесс охватил и телевидение. Важнейшее преимущество цифровой техники — возможность многомерной обработки, регенерации цифрового ТВ сигнала, передачи и хранения информации. Цифровая обработка сигналов ТВ изображений в процессе их передачи и приёма позволяет достичь высокого уровня качества и предоставляет пользователю массу новых возможностей и услуг. Цифровые системы телевидения наряду с обработкой изображения широко используют процедуры сжатия спектра и кодирования видеосигналов. Проблемы сжатия спектра и кодирования сигналов стали основными не только в системах ТВ вещания, но и при построении многих прикладных систем (архивирование видеоданных, передача изображений по каналам с низкой пропускной способностью и др.). Создание новейших цифровых устройств обработки, передачи и хранения видеоизображений связано с радикальным изменением технологических возможностей новейших процессорных систем. Использование новейших процессоров с производительностью несколько миллиардов операций в секунду обеспечивает реализацию самых вычислительно сложных алгоритмов сжатия, что невозможно было осуществить ранее. В своём развитии цифровое телевидение прошло несколько этапов. Первый этап развития цифрового телевидения — использование
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 321 цифровой техники в отдельных частях ТВ системы. Наиболее важным достижением данного этапа было создание полностью цифрового студийного оборудования. Другое направление — использование цифровой техники, характерное для первого этапа — введение цифровых блоков в ТВ преемники с целью повышения качества изображения или расширение функциональных возможностей. Примерами таких блоков могут служить цифровые фильтры для разделения яркостного и цветоразностных сигналов для уменьшения влияния шумов на изображение и для подавления эхо-сигналов. Широко известны также устройства для перехода от чересстрочной развёртки к квазипрогрессивной, реализации функции «стоп-кадр» и «кадр в кадре», декодирование и воспроизведение на экране дополнительной информации, передаваемой по системе «Телетекст» и т. д. Все эти усовершенствования не затрагивали стандарт разложения и принцип передачи ТВ сигнала по каналу связи. Второй этап развития цифрового телевидения — создание гибридных аналого-цифровых ТВ систем с параметрами, отличающимися от принятых в обычных стандартах телевидения. Примерами гибридных ТВ систем служит японская система телевидения высокой чёткости MUSE и западноевропейские системы MAC. В передающей и приёмной частях этих систем сигналы обрабатываются цифровыми методами, а в канале связи сигналы передаются в аналоговой форме. Системы ТВЧ MUSE и HD-MAC имеют формат изображения 16:9, число строк в кадре 1125 и 1250, частоту кадров 30 и 25 Гц соответственно. С помощью цифрового кодирования исходная полоса частот сигналов этих систем, превышающая 20 МГц, сжимается до 8 МГц. Третьим этапом развития цифрового телевидения можно считать создание полностью цифровых ТВ систем. В России этот переход активно осуществляется в данное время. Результаты проведённых работ нашли отражение в нескольких стандартах сжатия спектра сигналов ТВ изображений (JPEG, MPEG1, MPEG-2, MPEG-4, MPEG-7, Wavelet-преобразование). Стандарт MPEG-2, предназначенный для систем ТВ вещания как с обычным стандартом разложения, так и с увеличенным числом строк (ТВЧ), был утверждён в 1994 году. Главными особенностями нового поколения ТВ систем являются: • сужение полосы частот цифрового ТВ сигнала, позволяющее передавать 4 и более программ телевидения обычной чёткости или 1–2 программы ТВЧ по стандартному ТВ каналу с шириной полосы 6. . . 8 МГц;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 322 Часть V. Цифровое преобразование изображений в телевидении • единый подход к кодированию и передаче ТВ сигналов с различной чёткостью изображения; • интеграция с другими видами информации при передаче по цифровым системам связи; • обеспечение защиты ТВ программ от несанкционированного доступа, что даёт возможность создавать системы платного ТВ вещания; • выбор оптимального стандарта цифрового кодирования позволит создать общую систему для обмена сигналами в международных масштабах, а также устранить необходимость в преобразовании стандартов, т. е. появляется возможность создания унифицированного видеооборудования, которое использует единый стандарт цифрового кодирования и, в перспективе, вытеснит многочисленные, несовместимые между собой стандартные системы цветного телевидения — SECAM, PAL, NTSC. 12.1. Импульсно-кодовая модуляция Преобразование аналогового сигнала в цифровую форму представляет собой комплекс операций, наиболее важными из них являются дискретизация, квантование и кодирование. Дискретизация — преобразование непрерывного аналогового ТВ сигнала U (t) в последовательность отдельных во времени отсчётов этого сигнала. При использовании в телевидении преобразователей «свет-сигнал» матричного типа видеосигнал является дискретным во времени как в горизонтальном, так и в вертикальном направлениях, т. е. передаётся не каждое значение видеосигнала, а только некоторые, следующие друг за другом через определённые промежутки времени ∆t. При этом видеосигнал принимает любые значения из промежутка значений Uс min ...Uс max . Ранее, при использовании передающих ТВ трубок, исходный видеосигнал в горизонтальном направлении (в пределах отдельных строк) являлся непрерывным, т. е. каждому значению яркости B могло соответствовать любое значение тока (напряжения) сигнала iс (Uс ). Формирование цифрового ТВ сигнала поясняется на рис. 12.1. Здесь аналоговый ТВ сигнал, предварительно ограниченный с применением фильтра нижних частот по частотному диапазону, дискретизируется во времени, квантуется по уровню, преобразуется в цифровую форму и передаётся по каналу связи в двоичном коде с использованием ИКМ. Для сохранения формы аналогового ТВ сигнала на приёмной стороне желательно временной интервал ∆t при дискретизации брать как можно меньше, а число уровней сигнала брать как можно больше.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой Ðèñ. 12.1. 323 Преобразование сигнала из аналоговой формы в цифровую Временной интервал ∆t определяется теоремой Котельникова– Найквиста: Fдискр > 2fгр . (12.1) или ∆t 6 Tгр /2, Tгр > 2∆t, где fгр — граничная частота спектра ТВ сигнала. Согласно этой теореме, непрерывный сигнал U (t), имеющий ограниченный спектр частот, может быть представлен значениями этого сигнала U (tn ), взятыми в дискретные моменты времени (отсчёты) tn = nT (рис. 12.1,b), где n = 1, 2, 3 . . .; T — период или интервал дискретизации (T = Tдиск = ∆t). Формула (12.1) говорит, что для сохранения формы сигнала число отсчётов за один период максимальной частоты колебаний должно быть не меньшим двум (рис. 12.2). Из рис. 12.2 видно, что для неискажённой передачи изображения шахматного поля шаг дискретизации должен быть равен ∆t = τэ =
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 324 Часть V. Цифровое преобразование изображений в телевидении = Tгр /2, где τэ — время передачи одного элемента изображения; Tгр — период граничной частоты видеосигнала. Аналитическое выражение теоремы Котельникова–Найквиста имеет вид [5] U (t) = (12.2) ∞ ∑ sin 2πfгр (t − nT ) = U (nt) . 2πfгр (t − nT ) n=−∞ Предполагается, что отсчёты U (nT ) являются δ-импульсами Ðèñ. 12.2. Дискретизация изображения (бесконечно короткими). шахматного поля с размерами клеток, Для восстановления исходравными одному элементу (пикселю) ного аналогового сигнала U (t) последовательность отсчётов U (nT ) необходимо, в соответствии с (12.2), пропустить через идеальный фильтр нижних частот (ФНЧ) со срезом по частоте fгр . Из теоремы следует, что для точного восстановления исходного сигнала необходимо передать бесконечно большое число отсчётов. На практике же сигнал описывается конечным числом отсчётов. Далее за процессом дискретизации следует квантование, которое заключается в замене полученных после дискретизации мгновенных значений отсчётов ближайшими значениями из набора фиксированных уровней (рис. 12.1,v). Квантование представляет собой дискретизацию ТВ сигнала по уровню сигнала U (t). Фиксированные уровни, к которым привязываются отсчёты, называют уровнями квантования. Области значений сигнала U (t), заключённые между двумя уровнями квантования, называются шагами квантования (рис. 12.1,v), образуя шкалу квантования. Округление отсчёта до одного из ближайших уровней (верхнего или нижнего) определяется положением порогов квантования (рис. 12.1,b). Пороги квантования располагаются посередине между уровнями квантования. Пример 1. В момент времени t1 значение аналогового сигнала U (T ) = U (t1 ) > 0,5, т. е. превышает порог квантования. Квантован′ ′ ный сигнал Uкв принимает значение 1: Uкв = 1 (рис. 12.1,v). Пример 2. Если значение аналогового сигнала в момент t2 зак′ лючено в пределах 1 < U (t2 ) < 1,5, то квантованный сигнал Uкв = 1. Если непрерывный сигнал U (t) = 0,5, или 1,5, или 2,5 и т. д., то квантованный сигнал принимает значение U (t) = 1, или 2, или 3 и т. д., т. е. верхнее значение квантованного уровня.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 325 Строго говоря, дискретизированный и квантованный сигнал Uкв (nT ) уже является цифровым. Действительно, если амплитуда импульсов дискретизированного сигнала U (nT ) может принимать любые произвольные значения в пределах исходного динамического диапазона сигнала U (t), то операция квантования приводит к замене всех возможных значений амплитуды сигнала ограниченным числом значений, равным числу уровней квантования. Таким образом, квантованная выборка сигнала выражается некоторым числом (номером) в системе счисления с основанием m, где m — число уровней квантования. Но цифровой сигнал в такой форме по помехозащищенности мало выигрывает по сравнению с аналоговым, особенно при большом m. Для увеличения помехозащищенности сигнала его лучше всего преобразовать в двоичную форму, т. е. каждое значение уровня сигнала записать в двоичной системе счисления. При этом номер (значение уровня) будет преобразован в кодовую комбинацию символов 0 или 1 (рис. 12.1,g). В этом и состоит третья, заключительная операция по преобразованию аналогового сигнала U (t) в цифровой U (nT ), называемая операцией кодирования. Кодирование, таким образом, есть преобразование квантованного значения отсчета Uкв (nT ) в соответствующую ему в цифровую кодовую комбинацию символов Uц (nT ). Наиболее распространенный способ кодирования ТВ сигнала — представление его дискретных и проквантованных отсчетов в натуральном двоичном коде. Этот способ получил название импульснокодовой модуляции (ИКМ). На рис. 12.1,g показан результат преобразования фрагмента исходного сигнала U (t) в последовательность комбинаций двоичного трехразрядного кода: Tгр = Tс max = 2∆t = 2τэ = 2Tдискр ; 2 1 = = 2fгр = 2fс max . Fдискр = Tдискр Tгр Часто всю совокупность перечисленных операций — дискретизации, квантования и кодирования — для краткости называют кодированием ТВ сигнала. Это имеет определенные технические основания, поскольку все эти три операции выполняются одним техническим устройством — аналого-цифровым преобразователем (АЦП). Обратное преобразование цифрового сигнала в аналоговый производится в устройстве, называемом цифроаналоговым преобразователем (ЦАП). Аналого-цифровые и цифроаналоговые преобразователи — непременные блоки любых цифровых систем передачи, хранения и обработки изображений. Исследования ИКМ в телевидении начались уже давно (30-е годы прошлого столетия). Причина столь длительного внедрения объясняется жесткими требованиями к быстродействию устройства преобра-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 326 Часть V. Цифровое преобразование изображений в телевидении зования и передачи цифрового сигнала в вещательном телевидении. Оценим, в частности, скорость передачи цифровой информации по каналу связи. При непосредственном кодировании ТВ сигнала методом ИКМ кодовые комбинации создаются с частотой, равной частоте отсчетов, т. е. частоте дискретизации fд . Каждая кодовая комбинация соответствует определенному (отдельному) отсчету и содержит некоторое число k двоичных символов (битов). Скоростью передачи цифровой информации называется число передаваемых двоичных символов в единицу времени. За единицу скорости принимается 1 бит/с. Таким образом, скорость передачи ТВ сигнала в цифровой форме будет равна произведению частоты дискретизации fд и числа двоичных символов в одной кодовой комбинации дискретного отсчета: c = fд k. (12.3) Если верхняя граничная частота ТВ сигнала равна 6 МГц, то минимальная частота дискретизации, определяемая по теореме Котельникова, равна 12 МГц. Как правило, в системах цифрового телевидения с ИКМ частоту fд выбирают выше минимально допустимой, определяемой теоремой Котельникова. Связано это с необходимостью унификации цифрового ТВ сигнала для различных стандартов телевидения и с требованиями к характеристикам фильтра нижних частот при АЦП. В частности, для студийного цифрового оборудования рекомендована для всех стран частота дискретизации fд = 13,5 МГц. Число двоичных символов k в кодовой комбинации отдельного отсчета связано с выбранным числом уровней квантования m исходного сигнала соотношением k = log2 m ≈ 3,3 lg m. Число уровней квантования сигнала должно быть выбрано не меньше максимального числа градаций яркости, различимых глазом, которое в зависимости от условий наблюдения колеблется в пределах 100...200. Отсюда k = 3,3 lg m = 3,3 lg(100...200) ≈ 6,6...7,6. Очевидно, число символов в кодовой комбинации может быть только целым, а значит, выбор разрядности кодовой комбинации ограничится числом k = 7 или 8. В первом случае кодовая комбинация может нести информацию о 128 возможных уровнях сигнала (градациях яркости). Во втором случае (соответствующем лучшему качеству в передаче градаций) m = 28 = 256. Если принять k = 8, из (12.3) следует, что скорость передачи цифровой информации c = fд k = 13,5 · 8 = 108 Мбит/с. А если учесть, что, кроме сигнала яркости, должна быть передана информация о цвете, то
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 327 общий цифровой поток, формируемый по методу ИКМ, удвоится и будет равен 216 Мбит/с (см. гл. 15). Столь высоким быстродействием должны обладать как устройства преобразования ТВ сигнала, так и каналы связи. Тем не менее нельзя считать экономически целесообразной передачу такого большого цифрового потока по каналам связи. Важной задачей для построения экономичных ТВ систем является «сжатие» ТВ сообщения. Резервы для уменьшения цифрового потока без ущерба качеству воспроизводимого изображения, безусловно, существуют. Эти резервы заключены в специфике ТВ сигнала, обладающего, как показывают исследования, значительной информационной избыточностью. Эту избыточность обычно разделяют, несмотря на некоторую условность такого деления, на статистическую и физиологическую. Статистическая избыточность определяется свойствами изображения, которое не является в общем случае хаотическим распределением яркости, а описывается законами, устанавливающими определенные связи (корреляцию) между яркостями отдельных элементов. Особенно велика корреляция между соседними (в пространстве и во времени) элементами изображения. Знание корреляционных связей позволяет устранить избыточность в ТВ сигнале, т. е. не передавать многократно одну и ту же информацию и сократить цифровой поток. Второй тип — физиологическая избыточность ТВ сигнала обусловливается ограниченностью возможностей зрительного аппарата. Использовать физиологическую избыточность — значит, не передавать в сигнале ту часть информации, которая не будет воспринята нашим зрением. Уменьшение цифрового потока ТВ сигнала за счет сокращения избыточности в ТВ изображении осуществляется в цифровом телевидении применением более эффективных методов кодирования по сравнению с ИКМ. 12.2. Обобщенная структурная схема тракта цифрового телевидения Подлежащий преобразованию аналоговый ТВ сигнал поступает на вход цифровой ТВ системы (рис. 12.3). Этот сигнал подвергается предварительной обработке для упрощения последующих цифровых преобразующих устройств. Например, полный цветовой сигнал подвергается декодированию с разделением в устройстве предварительной обработки на сигнал яркости и цветоразностные сигналы с тем, чтобы цифровые преобразования производились с каждым из трех сигналов отдельно. Можно также ввести во входной аналоговый ТВ сигнал определенные корректирующие предыскажения линейного и нелинейного вида, предназначенные для улучшения субъективного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 328 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 12.3. Обобщенная структурная схема тракта цифрового телевидения качества выходного изображения и т. п. Несмотря на то что многие из этих предварительных операций по обработке могут быть выполнены и в цифровой форме, на определенном этапе развития технически проще их реализовывать в аналоговой форме. Далее подготовленный для преобразования аналоговый ТВ сигнал поступает на АЦП, в котором он дискретизируется, квантуется и предварительно кодируется (например, по методу ИКМ). Как указывалось, в полученном таким образом сигнале содержится значительная избыточность, которая может быть в определенной степени сокращена дополнительным, более эффективным кодированием в блоке цифровой обработки сигнала. Далее сигнал поступает в передающее устройство канала. Под каналом здесь понимаются линия связи, устройство консервации ТВ сигнала, устройства коррекции ТВ сигнала и другие звенья, в которых сигнал обрабатывается. Кодер канала предназначен для защиты цифрового ТВ сигнала от возможных помех в канале за счет применения специальных, более помехозащищенных кодов. Наконец, сигнал в цифровой форме поступает на выходной преобразователь (например, на модулятор передающего устройства) и далее в канал. Принятый приемным устройством сигнал демодулируется, подвергается обратному преобразованию в декодирующем устройстве канала и поступает в блок цифровой обработки декодирующего устройства цифрового сигнала. В нем лишенный избыточной информации на передающем конце сигнал приобретает исходную форму, затем в ЦАП преобразуется в аналоговый ТВ сигнал. Если на передающем конце тракта использовалась предварительная аналоговая обработка ТВ сигнала, то на приемном конце может производиться обратная операция. Приведенная на рис. 12.3 схема является обобщенной. В зависимости от частных задач, стоящих перед цифровой ТВ системой, она может видоизменяться. Например, система вообще не будет содержать аналоговых звеньев, если использовать преобразователи «свет-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 329 сигнал» и «сигнал-свет», генерирующие и преобразующие сигнал в цифровом виде. В другом случае могут отсутствовать устройства, повышающие помехоустойчивость сигнала в каналах связи. Это допустимо при отсутствии протяженных линий связи и, в частности, при цифровой обработке сигнала внутри одного телецентра. В данном случае чаще всего нет необходимости и в устройствах, устраняющих в ТВ сигнале избыточность и сокращающих необходимую скорость передаваемого цифрового потока. 12.3. Дискретизация телевизионного сигнала Дискретизация — первая операция из всего комплекса преобразований аналогового сигнала в цифровой. Исходный сигнал u(t) после дискретизации можно идеализировано представить в виде суммы дискретных отсчётов: u(nT ) = ∞ ∑ u(t)δ(t − nT ), (12.4) n=−∞ где δ(t) — дельта-функция; T — период дискретизации. Если соотношение (12.4) подвергнуть преобразованию Фурье, то получим ∞ ∑ Sд (f ) = S(f − nfд ), (12.5) n=−∞ где S(f ) и Sд (f ) — спектры исходной и дискретизированной функций соответственно [11]. Из (12.5) следует, что спектр дискретизированного сигнала представляет собой сумму составляющих исходного спектра (n = 0) и «побочных» или дополнительных спектров (лепестков) того же вида, но сдвинутых один относительно другого на fд , 2fд и т. д. (рис. 12.4,a). Из рисунка видно, что с помощью идеального фильтра нижних частот (ФНЧ) с частотой среза fФНЧ можно выделить спектр исходного сигнала, если выполняются два условия: fд > 2fгр и fгр 6 fФНЧ 6 6 fд − fгр . Если же частота отсчетов выбрана из условия fд < fгр , то после дискретизации побочные спектры будут перекрывать основной и в общем виде восстановить исходный сигнал без помех (рис. 12.4,b) невозможно. Однако к настоящему времени разработаны такие методы дискретизации ТВ сигнала, которые позволяют и в этом случае восстановления исходного сигнала избавиться от побочных продуктов. Значимость этих методов сегодня очень велика, поскольку возможное снижение частоты дискретизации позволяет пропорционально уменьшить цифровой поток, т. е. сделать систему цифрового телевидения более экономичной.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 330 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 12.4. Спектр сигнала после дискретизации (a) и перекрытие спектра при fд > 2fгр (b) Прежде чем рассмотреть эти методы, следует указать на то, что при кодировании ТВ сигнала чаще всего применяется дискретизация с постоянной частотой. В свою очередь, частота дискретизации может быть связана или не связана с частотой строчной и кадровой разверток. При жесткой связи получается постоянное число отсчетов в строке, соответствующих одним и тем же элементам изображения. На изображении при этом образуется фиксированная структура отсчетов (структура дискретизации). Ортогональная структура дискретизации. Если частоту отсчетов в сигнале выбрать кратной частоте строк, то на изображении будет образована ортогональная структура дискретизации, в которой отсчеты располагаются в узлах прямоугольной решетки (рис. 12.5). В цифровых устройствах ТВ вещания этот способ дискретизации в настоящее время является наиболее распространенным. Если принять частоту дискретизации fд > 2fгр , то число отсчетов в изображении будет равно числу его условных телевизионных элементов, составляющих около 300 тыс. Попытаться сократить число отсчетов — значит пропорционально уменьшить разрешающую способность ТВ системы и, соответственно, ухудшить качество изображения. При таком подходе предполагается, что наш зрительный аппарат воспринимает изображение как хаотическое распределение различных яркостей в структуре отсчетов и анализирует это изображение точка за точкой. На самом деле это не так. В изображениях существуют значительные статистические связи, к которым в результате эволюционного развития приспособился наш зрительный аппарат. В частности, установлено [11], что зрительный анализатор содержит совокупности рецепторов (рецептивные поля), кодирующие одновременно большие группы элементов изображения. При этом регистрируется не столько яркость, сколько особенности распределения отличающихся по яркости в пространстве и во времени элементов и обеспечивается выделение по отношению к фону наиболее информативных составляющих в структуре изображения: контуры, перепады яркости, изменения во време-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой Ðèñ. 12.5. Ортогональная структура дискретизации 331 К определению разрешающей способности системы с ортогональной структурой дискретизации Ðèñ. 12.6. ни или по цвету. Важно заметить, что подобная обработка сигнала изображения позволяет зрительному аппарату идентифицировать целостные контуры даже при их распаде на отдельные элементы вследствие дискретизации или из-за действия случайных помех. Вид и параметры многомерных характеристик зрения зависят от освещенности, от направления видеоконтроля, от интегральной специфики воздействий. При дневной освещённости зрение, например, обеспечивает интерполяционно-экстраполяционную реставрацию пространственновременной структуры изображений с восстановлением контурной информации и с выявлением относительных изменений (локальных неоднородностей) в направлении границ и линий в пределах пространства видеоконтроля. При низкой освещённости имеет место реставрация лишь интерполяционного типа. Эти свойства зрительного анализатора позволяют допустить, что в ТВ системе не обязательно обеспечивать передачу каждого отдельного из элементов изображения. Можно удовлетвориться передачей определенного ансамбля составляющих структуры изображений с пониженным (по отношению к стандартному) числом элементов. При этом эквивалентные импульсные характеристики зрения должны обеспечивать подавление дискретности и слитность восприятия последовательностей отсчётов в структуре ТВ изображения. Оценим с таких позиций возможности ортогональной структуры отсчетов при получении изображения. Для этого нанесем на ней самые элементарные конфигурации: вертикальные, горизонтальные и наклонные линии, представляющие собой детали некоего ТВ изображения (рис. 12.6). Условимся, что минимальное расстояние между соседними контурами, расположенными по вертикали или горизонтали (линии 1 и 2 или 5 и 6 на рис. 12.6), равно шагу дискретизации — расстоянию меж-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 332 Часть V. Цифровое преобразование изображений в телевидении ду соседними отсчетами. Из рисунка видно, что отдельные наклонные контуры, ориентированные по диагонали (линии 3, 4) содержат меньшее число элементов на одном и том же участке по сравнению с вертикальными и горизонтальными линиями. Ортогональная структура отсчетов, реализующая минимальное расстояние между смежными отсчётами в горизонтальном и вертикальном направлениях, следовательно, обеспечивает в этих направлениях оптимальные условия для слитности восприятия и снижения уровня нелинейных искажений при видеоконтроле, тонкой пространственной структуры ТВ изображений. В то же время разрешающая способность зрения анизотропна, т. е. неодинакова в различных направлениях [71]. Она максимальна вдоль вертикальной, горизонтальной осей и примерно в 1,5 раза превышает разрешающую способность в диагональных направлениях (сечение пространственной частотной характеристики по минимальному уровню). Следовательно, протяженность соответствующих импульсных характеристик зрения минимальна в первом и втором случаях и увеличивается в диагональном направлении. В этом проявляется адаптация зрения к статистике изображений, в которых преобладают перепады яркости в вертикальных и горизонтальных направлениях. Соответственно, для зрительной системы характерна более высокая эффективность интерполяционной реставрации диагональных составляющих тонкой пространственной структуры √ изображений. В данном случае к тому же имеет место уменьшение в 2 раз возможного расстояния между диагональными линиями, что способствует снижению уровня нелинейных искажений при передаче в пределах внутрикадрового пространства относительно протяжённых диагональных составляющих, например периодического типа. Таким образом, характеристики ортогональной структуры дискретизации изображения с шагом следования отсчётов, удовлетворяющим условиям теоремы Котельникова, имеют высокую степень согласованности с характеристиками зрения. Шахматная структура дискретизации. Зададимся, как и в предыдущем случае, числом отсчетов в изображении, соответствующим частоте дискретизации fд > 2fгр . Тогда каждому элементу изображения будет соответствовать определенный отсчет. Если расположить эти отсчеты таким образом, чтобы в соседних строках они были смещены друг относительно друга на половину шага дискретизации (половину размера одного элемента изображения) d/2, то будет образована структура отсчетов, называемая шахматной (рис. 12.7). Нанесем на этой структуре простейшие конфигурации изображения: горизонтальные, вертикальные и наклонные линии. Оценим качество их воспроизведения и возможные расстояния между ними.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой К определению разрешающей способности системы с шахматной структурой дискретизации Ðèñ. 12.7. 333 Пространственная разрешающая характеристика зрительного анализатора человека Ðèñ. 12.8. Горизонтальные линии 5 и 6 воспроизводятся, как и при ортогональной структуре дискретизации, т. е. состоят из такого же числа отдельных элементов изображения. Минимальное расстояние между ними также не изменилось. Оно равно расстоянию шагу дискретизации d. Таким образом, разрешающая способность системы в вертикальном направлении для протяженных горизонтальных границ сохранилась прежней. Однако каждая из вертикальных линий 1 и 2 содержит в 2 раза меньшее число элементов, что может сопровождаться появлением сопутствующих нелинейных искажений и потерями в слитности восприятия. Зато существенно уменьшилось расстояние между этими линиями, что свидетельствует об увеличении потенциальной разрешающей способности в горизонтальном направлении для протяжённых вертикальных составляющих. В диагональных направлениях (линии 3 и 4) интервалы между линиями примерно в 1,8 раза больше, чем в горизонтальном направлении. Но именно в этих направлениях существенно ниже и разрешающая способность зрения (рис. 12.8). Напомним, что уменьшение частоты дискретизации ниже 2fгр приводит к перекрытию основного и побочного спектров дискретного сигнала (см. рис. 12.4), а значит, к невозможности в общем случае восстановления исходного сигнала. Потенциальный уровень нелинейной помехи при этом определяется площадью перекрытия. Однако шахматная структура дискретизации позволяет в значительной степени избавиться от помех, связанных с перекрытием основного и побочного спектров в горизонтальном и диагональных направлениях. Как известно, спектр исходного ТВ сигнала состоит из гармоник, кратных частоте строк, около которых группируются узкие полосы боковых частот, обусловленные кадровой разверткой, изменениями в пределах кадров и перемещением деталей изображения. В области
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 334 Часть V. Цифровое преобразование изображений в телевидении гармоник строчной частоты сосредоточены максимумы энергии сигнала, а между ними — минимумы. В зависимости от содержания изображения отношение максимума к минимуму лежит в пределах 2...35 дБ. Аналогичную структуру имеет спектр побочÐèñ. 12.9. Перекрытие основноных продуктов дискретизации. го и побочного спектров при шахматной структуре дискретизации Поэтому, если частота дискретизации помехи ТВ сигнала кратна полустрочной частоте, то энергия мешающих составляющих от перекрытия спектров попадает в зону минимума энергии исходного сигнала. На рис. 12.9 сплошными линиями показано распределение максимумов энергии сигнала основного спектра, а штриховыми — побочного. С помощью гребенчатого фильтра в участках с отсутствием движений могут удаляться мешающие составляющие ТВ изображения в диапазоне от (fд ...fгр ) до fгр . Гребенчатый фильтр должен при этом иметь максимальное затухание на мешающих частотах и минимальное затухание на частотах полезных составляющих. При ортогональной, в отличие от шахматной, дискретизации максимумы энергии составляющих основного и побочного спектров накладываются друг на друга, что делает невозможным разделение их с помощью гребенчатого фильтра. Согласно результатам проведённого анализа [68], шахматная структура дискретизации отсчетов позволяет без существенного ущерба качеству изображения снизить минимально допустимую частоту дискретизации и, соответственно, пропорционально уменьшить цифровой поток исходного ТВ сигнала. Однако последнее может, повидимому, достигаться при реализации существенной реставрационной, интерполяционно-экстраполяционного типа, многомерной обработки, позволяющей снизить заметность сопутствующих такому варианту дискретизации нелинейных помех и реализовать сохранение слитности визуального восприятия и разрешающей способности в условиях уменьшения плотности отсчётов, отражающих детали ТВ изображений в пределах отдельных кадров. 12.4. Квантование телевизионного сигнала Полученные после дискретизации исходного сигнала u(t) отсчеты u(nT ) могут принимать произвольные значения в пределах своего динамического диапазона. В результате операции квантования должна быть произведена замена всех возможных значений u(nT ) рядом разрешенных значений, названных уровнями квантования (см.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 335 рис. 12.1,b). По своему смыслу операция квантования, таким образом, обязательно предполагает появление ошибки между истинным значением сигнала u(t) и его квантованным приближением uкв (nT ). Эта ошибка ∆ = u(nT ) − uкв (nT ) называется ошибкой квантования. Ошибка ∆ в существенной степени зависит от того, до какого из двух ближайших уровней квантования (верхнего или нижнего) округляется истинное значение сигнала. Устройство квантования делает выбор между этими двумя уровнями при сравнении истинного значения квантуемого сигнала с выбранными порогами квантования. Если истинное значение меньше некоторого уровня, называемого порогом квантования, то оно округляется до ближайшего уровня квантования, расположенного ниже данного порога (см. рис. 12.1,v). Таким образом, от того, как расположены пороги квантования внутри шкалы квантования, образованной ее уровнями, будет зависеть максимальная ошибка квантования. Например, если пороги квантования совместить с уровнями квантования, то ошибка квантования может быть равна разности между двумя этими уровнями, т. е. шагу квантования. Нетрудно доказать, что среднеквадратическая ошибка квантования будет минимальна, если пороги квантования располагаются посередине между уровнями квантования. Ошибки квантования, называемые также шумами квантования, на изображении могут проявляться по-разному, в зависимости от свойства кодируемого сигнала. Если собственные шумы аналогового сигнала невелики по сравнению с шагом квантования, то шумы квантования проявляются на изображении в виде ложных контуров. Такие искажения хорошо заметны при «грубом» квантовании, когда число уровней квантования недостаточно. В этом случае плавные (низкоградиентные) яркостные переходы превращаются в ступенчатые и качество изображения ухудшается из-за заметности ступенчатых изменений. Наиболее заметны ложные контуры на изображениях с крупными планами. Этот эффект усугубляется на подвижных изображениях. Эксперименты показывают, что ложные контуры перестают восприниматься, если число уровней квантования превышает 100...200, т. е. шум квантования не превышает 0,5...1 % размаха сигнала. Эти данные хорошо согласуются с понятиями о контрастной чувствительности зрения, рассмотренными в предыдущих главах, и выбором разрядности кодовой комбинации для передачи цифрового сигнала (m = = (2,3/δ) lg N, где N = Bmax /Bmin . При δ = 0,02...0,04, N = 100 получаем m = 115...230). То есть при восьмиразрядном коде получаем 256 уровней, что превышает полученный экспериментальным путем необходимый минимум числа градаций, при котором отсутствуют ложные контуры в изображении.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 336 Часть V. Цифровое преобразование изображений в телевидении Выше было рассмотрено влияние шумов квантования на качество изображения в условиях, когда собственные шумы в аналоговом сигнале невелики. Когда же они превышают шаг квантования, искажения их преобразования при квантовании проявляются уже не как ложные контуры, а как шумы, равномерно распределенные по спектру. Флуктуационные помехи исходного сигнала как бы подчеркиваются ступенчатым преобразованием, изображение в целом начинает казаться более зашумленным. При недостаточном числе уровней квантования сопутствующие шумы квантования проявляются на цветных изображениях в виде цветных узоров, особенно заметных на таких сюжетах, как лицо крупным планом, на плавных перепадах яркости и т. д. Сократить цифровой поток ТВ сигнала можно за счет применения нелинейной шкалы квантования. Как известно, по закону Вебера– Фехнера ощущение приращения яркости от L1 до L2 пропорционально логарифму отношения L2 к L1 . Поэтому шкала, в которой шаги квантования увеличиваются в зависимости от уровня фона от нижней части к верхней, более соответствует специфике зрения. Эксперимент подтверждает, что применение подобной логарифмической шкалы квантования позволяет уменьшить число уровней квантования вдвое по сравнению с линейной шкалой без ущерба качеству изображения, т. е. уменьшить на один разряд кодовую группу при ИКМ. Иными словами, квантование на 27 уровней по логарифмическому закону может давать изображение того же качества, что и квантование на 28 уровней при равномерной шкале. Сокращения цифрового потока можно достичь, используя и другие особенности зрения. При оценке необходимого числа уровней квантования сигнала яркости в расчет принималось значение порогового контраста δ = 0,02...0,05. Однако эти данные справедливы только для крупных деталей. В общем случае пороговый контраст существенно зависит от размера наблюдаемого объекта. Для объектов, угловые размеры которых ниже одного-двух градусов и соответствуют, например, нескольким минутам, пороговый контраст возрастает в десятки раз и приближается к единице; маленькое пятно становится заметным, когда его яркость превышает фон на величину, сравнимую с яркостью самого фона. Это означает, что небольшие детали в изображении, места резких перепадов яркости можно квантовать на значительно меньшее число уровней, чем крупные участки изображения с постоянной или плавно меняющейся яркостью. В этой особенности зрительного восприятия, как и в факторе наличия сильных корреляционных связей между элементами изображения, кроется большой резерв по сокращению числа уровней квантования, реализация которых, однако, методами ИКМ невозможна.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 337 Должны быть применены более эффективные приемы кодирования сигнала, рассматриваемые в следующих разделах. 12.5. Цифровое кодирование телевизионного сигнала Заключительной операцией в преобразовании аналогового сигнала в цифровой является кодирование квантованных отсчетов в виде последовательности импульсов. Чаще всего эта последовательность реализуется в двоичной форме, где m уровням квантования входной видеоинформации соответствует k = log2 m кодовых импульсов. Как уже отмечалось, такой метод кодирования получил название импульсно-кодовой модуляции. Он стал классическим и универсальным методом, применяемым при обработке и передаче видеоинформации. К достоинствам ИКМ следует отнести универсальность двоичной формы представления, используемой для всех операций над ТВ сигналами, низкую чувствительность к шумам, интерференционным помехам и искажениям, связанным с передачей и записью сигналов, а также простоту восстановления цифрового сигнала регенерацией его формы. Однако с точки зрения скорости передачи ИКМ недостаточно эффективна, так как ее практическое применение связано с необходимостью обеспечения высоких скоростей передачи. Объясняется это тем, что импульсно-кодовой модуляции в телевидении присуща значительная избыточность в передаваемой информации. Ведь, несмотря на равновероятность любых из возможных уровней яркости (цветности) для одного элемента изображения, содержание соседствующих с ним элементов мало отличается или не отличается вовсе. Статистический анализ ТВ изображений устанавливает наличие, в среднем, существенных корреляционных связей между соседними элементами в пределах и последовательности кадров. При поэлементной передаче яркости или цветности изображения, присущей методу ИКМ, в канал, таким образом, чаще всего посылается одна и та же или мало отличающаяся по содержанию информация. В настоящее время существует много методов более эффективного, по сравнению с ИКМ, кодирования сигналов ТВ изображений. Весьма условно их можно разделить на три класса: кодирование ТВ сигнала с предсказанием, групповое кодирование с преобразованием (ДКП) и адаптивное групповое кодирование [5]. Рассмотрим первые два принципа кодирования. Кодирование с предсказанием. Как уже отмечалось, наличие сильных корреляционных связей между близко расположенными элементами изображения определяет нецелесообразность передачи полной информации о каждом элементе. Можно ограничиться передачей
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 338 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 12.10. Структурная схема системы с предсказанием отсчета одного элемента, а остальные элементы, используя статистические законы, предсказать, т. е. вычислить с помощью специальных технических устройств на приемном конце системы. Однако как бы ни был совершенен аппарат, определяющий статистические связи в изображении, предсказание элементов по предыдущему отсчету или их совокупности всегда будет нести ошибку, обусловленную случайным характером распределения в изображении яркости и цветности. Эта ошибка должна быть для каждого элемента изображения учтена, скорректирована. Только при этом условии на приемном конце системы будет воссоздано изображение, соответствующее оригиналу. Отсюда вытекает принцип кодирования сигнала с предсказанием: передача в каждом отсчете не истинного значения элемента, а кодированной разности между истинным значением и предсказанным, называемой ошибкой предсказания. Логично ожидать, что в сигнале ошибки чаще всего содержится меньший объем информации, чем в полном отсчете. Чтобы сформировать сигнал ошибки e(nT ), на передающем конце системы устанавливаются устройство предсказания, такое же, как и на приемном конце, и вычитающий каскад. На рис. 12.10 вместо последнего изображено суммирующее устройство, на входы которого подаются истинное значение отсчета u(nT ) и его приближенно предсказанное значение ũ(nT ), второе из которых вычитают из первого. Сигнал ошибки e(nT ), содержащий в общем случае меньший объем информации по сравнению с сигналом u(nT ), будучи принят на другом конце системы, складывается в суммирующем устройстве с предсказываемым значением ũ(nT ). В результате на приемном конце восстанавливается истинное значение сигнала u(nT ). Следовательно, чем точнее предсказывается сигнал ũ(nT ), тем меньше диапазон изменения сигнала ошибки e(nT ), тем меньшим числом битов может быть он передан, а значит, кодирование является более эффективным. В простейшем случае в качестве предсказанного значения можно использовать значение предыдущего отсчета. Тогда предсказатель реализуется в виде задержки сигнала на время передачи одного элемента изображения. Указанный прием предсказания на первый взгляд не дает сокращения избыточности. Ведь сигнал ошибки e(nT ) при та-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 339 ком предсказании может принимать любые значения, вплоть до максимальных амплитуд самого сигнала u(nT ), да еще при этом меняя знак (разность между u(nT ) и ũ(nT ) может быть положительной и отрицательной). Однако, несмотря на увеличенный динамический диапазон, сигнал ошибки распределяется внутри него не равновероятно. Вероятность его распределения аппроксимируется экспоненциальной функцией с максимумом вероятности вокруг нуля и быстрым спадом вероятности для значений, отличных от него. Следовательно, сигнал ошибки с достаточно высокой достоверностью может быть проквантован значительно меньшим числом уровней, чем исходный отсчет. Это и обеспечивает экономию в объеме передаваемой информации. Конечно, данный прием дает хорошие результаты лишь в среднестатистическом смысле, т. е. для всего изображения. Для деталей же изображения, содержащих резкие яркостные переходы и контуры, будут характерны (хотя и редкие в статистическом плане) всплески сигнала ошибки. При грубом квантовании они обусловят появление на изображении соответствующих искажений. Однако, как показывает эксперимент, эти искажения благодаря особенностям зрения оказываются малозаметными. Известно, что зрительный аппарат хуже различает яркость мелких деталей; более того, физиологи обнаружили явления, называемые латеральным (боковым) торможением, которые подавляют фоновую составляющую изображения и подчеркивают в нем контуры и мелкие детали, выделяя тем самым наиболее информативную его часть. На фоне этих «искажений», обусловливаемых алгоритмом работы зрительного аппарата, искажения из-за грубого квантования сигнала ошибки в области его больших значений становятся менее заметными. Сокращение числа уровней квантования сигнала ошибки оказывается допустимым, таким образом, и для деталей изображения, содержащих резкие переходы и контуры. Число уровней квантования сигнала ошибки для разных систем кодирования с предсказанием выбирается неодинаковым. Но что важно: шкала квантования существенно нелинейна и несимметрична относительно нуля. Итак, принцип действия систем кодирования с предсказанием заключается в передаче вместо истинного значения сигнала закодированной разности истинного и предсказанного значений. В соответствии с этим принципом подобные системы кодирования получили еще одно название — системы с дифференциальной импульсно-кодовой модуляцией (ДИКМ). Простейшей из систем ДИКМ является система с дельта-модуляцией. В этой системе сигнал ошибки квантуется всего на два уровня, т. е. фиксируется только знак ошибки. В качестве предсказате-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 340 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 12.11. Дельта-модуляция: a — структурная схема системы; b — форма сигналов ля при дельта-модуляции применяется интегратор, который линейно суммирует подаваемые на его вход с частотой дискретизации сигналы ошибки ±δ (рис. 12.11). Поскольку последние в течение интервала дискретизации постоянны, суммирование их во времени обусловит образование сигнала ступенчатой формы. Этот сигнал используется в качестве сигнала предсказания ũ(t). Вычитая его из исходного сигнала, получают, после сумматора, разностный сигнал e(t). Квантователь ограничивает этот сигнал всего двумя уровнями. После преобразования полученного сигнала ошибки ±δ в двоичный код его можно передавать. На приемном конце системы двоичный код сначала превращается в биполярные отсчеты ±δ, а в декодирующем устройстве, представляющем собой описанный выше интегратор, формируется сигнал ũ(t). Этот сигнал и используется в качестве восстановленного, хотя он заметно отличается от исходного сигнала. На рис. 12.11,b изображены сигналы, формируемые в системе с дельта-модуляцией. Участок А характеризуется передачей относительно резкого перепада яркости. Квантователь в этом случае выдает сигнал ошибки δ только одного знака. Интегратор последовательно во времени их суммирует, образуя напряжение ступенчато-пилообразной формы. При этом последнее «не успевает» за изменением исходного сигнала, поскольку скорость нарастания сигнала предсказания не может превзойти некоторого значения, определяемого δ и частотой дискретизации. В результате фронты в сигнале предсказания затягиваются по отношению к возможным быстрым перепадам в исходном сигнале. На участке Б, где исходный сигнал имеет сравнительно медленные изменения, сигнал предсказания достигает примерного равен-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой Ðèñ. 12.12. 341 Структурная схема системы с ДИКМ ства с ним. Однако при этом значение сигнала предсказания непрерывно колеблется вокруг значения исходного сигнала. Эти колебания происходят с амплитудой δ и частотой дискретизации. Искажения, характеризующие затягивание фронтов в сигнале предсказания, получили название перегрузки по крутизне. Второй вид искажений, обусловленный ступенчатостью формы сигнала, определяет гранулярный шум изображения. Для уменьшения этих искажений в системах с дельта-модуляцией приходится, по сравнению с ИКМ, значительно увеличивать частоту дискретизации, что снижает эффективность системы в целом. Поэтому дельта-модуляция применяется только в видеотелефонных системах. Лучшие результаты в смысле получения достоверности изображения на приемной стороне дает схема ДИКМ, представленная на рис. 12.12. Действительно, в схемах рис. 12.10 и 12.12 сравнение и образование сигналов e(nT ), u(nT ) и ũ(t) происходит по разному, а следовательно, и ошибки преобразования получаются большими, чем в схеме рис. 12.12. Рассмотрим её работу. На вход вычитающего устройства Σ1 поступают в аналоговой форме исходный сигнал u(t) и его предсказанное (предыдущее) значение ũ(t). Полученный сигнал ошибки e(t) квантуется на определенное число уровней (обычно не более 16) и преобразуется в двоичный код. Эти операции выполняются в АЦП, после чего передается закодированный сигнал ошибки e(nt). Этот же сигнал в ЦАП подвергается обратному преобразованию в аналоговую форму и подается на сумматор Σ2 , в котором складываются ошибка и сигнал предсказания. На выходе сумматора, таким образом, будет восстановлено исходное значение сигнала с погрешностью, определяемой ошибкой квантования (наличие ошибки квантования учтено в обозначениях e′ (t) и u′ (t) на рис. 12.12). По этому значению (а чаще по совокупности предыдущих значений отсчетов) в предсказателе c использованием ЗУ формируется сигнал предсказания ũ(t). В простейшем случае в качестве сигнала предсказания в варианте используются значения предыдущего отсчета (кадра), который подается на вычитающее устройство Σ1 .
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 342 Часть V. Цифровое преобразование изображений в телевидении На приемной стороне в декодирующем устройстве после ЦАП сигнал ошибки e′ (t) поступает на декодирующее устройство, состоящее из аналогичных передающему концу системы сумматора и предсказателя (на основе ЗУ). В целом методами ДИКМ удается сократить число бит на один элемент до 3–5 по сравнению с 7–8 битами при использовании ИКМ. Устранение избыточности в системах с предсказанием не может не сказаться на их помехоустойчивости. Помеха, поразившая один из переданных отсчетов, явится причиной искажений не только этого отсчета, но и всех последующих, поскольку они вычислялись (предсказывались) по предыдущему значению. На изображении образуются характерные искажения — треки ошибок. Уменьшить эти искажения можно более частой передачей «опорных» отсчетов, т. е. самих значений элементов изображения, а не их ошибок. В этом случае действие помехи на изображении прекращается с появлением ближайшего истинного значения сигнала. Конечно, увеличение числа опорных значений в сигнале ДИКМ снижает эффективность кодирования. Повышает помехоустойчивость системы с предсказанием двумерное (например, внутрикадровое) кодирование, при котором предсказание производится как по совокупности предшествующих элементов в строке, так и по совокупности значений уровней соответствующих элементов в предыдущих строках. В этом случае улучшается также качество воспроизведения вертикальных яркостных переходов. Статистические исследования показали, что свойства ТВ изображения, обусловленные межкадровыми связями, практически аналогичны свойствам в неподвижном изображении (внутрикадровые связи: межэлементные и межстрочные связи). Коэффициенты корреляции в соседних кадрах часто являются большими, чем для соседних пикселей в одном кадре. Отмеченные свойства ТВ изображений легли в основу стандарта сжатия цифрового потока в системе MPEG. Следует также отметить, что видеосигнал до преобразования его в цифровую форму подвергают нелинейной обработке с γкор < 1. Это позволяет сделать в приемнике шаг дискретизации ∆u(nt) по уровню большим на светлых (белых) участках, чем на темных и серых, но относительная, визуальная, заметность ступенек будет одинаковой на всех уровнях яркости: ∆B(сер) ∆B(бел) = = const . Bф (сер) Bф (бел) Последнее позволяет понизить разрядность цифрового сигнала без ущерба для качества ТВ изображения. В итоге следует отметить, что основными операциями аналогоцифрового преобразования являются дискретизация, квантование и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 12. Преобразование аналогового видеосигнала в цифровой 343 кодирование. Эффективное использование особенностей преобразования аналоговых сигналов даёт дополнительное сокращение цифрового потока без заметных ухудшений качества изображения. Особенно большие возможности в этом направлении даёт знание всех тонкостей преобразования на первом этапе — дискретизации аналогового видеосигнала. Однако анализ характеристик структур дискретизации лишь в реальном пространcтве зачастую не позволяет осуществить в полной мере их сравнительную оценку и обеспечить решение задачи эффективного согласования с интегральными характеристиками передаваемого ансамбля видеоинформационных воздействий. В связи с последним в следующем разделе рассмотрим вопросы построения и анализа спектральных характеристик структур дискретизации телевизионных изображений [63]. Контрольные вопросы 1. Что такое дискретизация и квантование аналоговых сигналов? 2. Что такое децимация (прореживание) и интерполяция? 3. В чём проявляются искажения изображения при нарушении условия теоремы Котельникова? 4. Что такое пространственная частота? 5. Зачем перед квантованием выполняют гамма-коррекцию ТВ сигналов? 6. В чём заключается сущность метода ДИКМ? 7. Что такое трек ошибки, возникающий при передаче цифрового потока по каналу связи методом ДИКМ?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 13 ПРИНЦИПЫ ПОСТРОЕНИЯ И АНАЛИЗА СТРУКТУР ДИСКРЕТИЗАЦИИ ТЕЛЕВИЗИОННЫХ ИЗОБРАЖЕНИЙ В системах телевидения различного назначения необходимо эффективное согласование характеристик многомерных спектров структур дискретизации и реальных изображений, исходных для процесса дискретизации. Такое согласование может быть реализовано лишь на основе использования результатов теоретических и экспериментальных исследований специфики многомерного спектра реальных изображений. На практике обычно исследуют частные сечения многомерного спектра изображения по пространственному, временному и спектральному (в спектральной зоне) измерениям. В первом случае фиксируется время (t = T1 ) и накладывается ограничивающее условие на спектральный состав излучения, соответствующего реальному изображению. Результат исследования — пространственный спектр изображения Sи (ωx , ωy ). Во втором случае фиксируются координаты точки в пространстве изображения и спектральный состав излучения. Результат исследования — временной спектр изображения Sи (ω). И, наконец, в третьем случае фиксируются координаты точки и время. Результат исследования Фурье — спектр спектральных яркостей изображения. В технической литературе практически нет, к сожалению, данных, отражающих специфику сечений многомерного спектра изображений по горизонтально- или вертикально-временно́му (спектральному), а также спектрально-временному измерениям. В связи с этим на современном этапе возможно лишь раздельное согласование по соответствующему измерению специфики сечений спектров изображений и структуры дискретизации. Пространственный спектр изображения является двумерным. Последнее усложняет решение задачи согласования сечений по данному измерению. Выбор структуры дискретизации ТВ изображений не всегда однозначно определяется усредненной спектральной интенсивностью изображений. Во многих случаях необходимо принимать решение с учетом динамических характеристик изображений и других факторов технологического, конструкторского и т. д. характера. Соответственно, резко увеличилось за последние годы число предложенных вариантов структур дискретизации и их вариаций, появились вари-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 345 анты структур с неравномерным периодом распределения элементов по направлениям информационного пространства и с адаптивным изменением параметров в зависимости от текущих изменений исходной видеоинформации. С последним связана актуальность задачи разработки принципов анализа характеристик спектра структур дискретизации ТВ изображений [49, 52, 63, 64]. Результаты такого анализа дают основу для объективного сопоставления разнородных по типу структур дискретизации изображений, удовлетворяющих по своей специфике заданным ограничениям. В динамическом спектре структуры дискретизации при этом должны адаптивным образом подавляться по уровню составляющие, биениями которых с составляющими спектра изображения провоцируется разрушение структуры последнего или возникновение эффектов «муарового типа». Цель данной главы — разработка принципов построения и анализа характеристик спектра структур дискретизации ТВ изображений, согласование и выбор параметров структур дискретизации с особенностями спектра реальных ТВ изображений. Принципы анализа, разработанные в данной главе, имеют достаточно глубокую связь с результатами, представленными в предшествующих публикациях по данному вопросу [65–69]. 13.1. Анализ характеристик спектра ортогональных структур квазипериодической дискретизации в системах телевидения По существу квазипериодическая дискретизация в пространственно-спектрально-временной области отличается от периодической дискретизации ограничением области суперпозиции элементов дискретизации. Рассмотрим относительно простой вариант многомерной квазипериодической дискретизации, когда идеализированная функция дискретизации может быть представлена в пределах ограничивающей поверхности произведением следующего вида: α0 (x, y, t, λ) = = q ∑ p ∑ k ∑ (13.1) n ∑ δ(x − µx1 )δ(y − ny1 )δ(t − χT1 )δ(λ − φλ1 ). φ=−q χ=−p µ=−k η=−n Определим четырехмерный спектр дискретизирующей функции, соответствующей соотношению (13.1): D0 (ωx , ωy , ω, ωλ ) = (13.2)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 346 Часть V. Цифровое преобразование изображений в телевидении = q p n k ∑ ∑ ∑ ∑ exp(−jωx µx1 − jωy ηy1 − jωχT1 − jωλ φλ1 ). φ=−q χ=−p µ=−k η=−n Структура соотношения (13.2) позволяет представить указанное соотношение следующим образом: ( )( ) k n ∑ ∑ D0 (ωx , ωy , ω, ωλ ) = 1 + 2 cos ωx µx1 1+ 2 cos ωy ηy1 × ( × 1+ µ=1 p ∑ η=1 )( 2 cos ωχT1 χ=1 1+ q ∑ ) 2 cos ωλ φλ1 . (13.3) φ=1 С учетом того, что n ∑ 2 cos ηx − 1 = 1 + 2 cos x + 2 cos 2x + ... + 2 cos(n − 1)x + 2 cos nx = η=0 sin = 2n + 1 x 2 , x sin 2 из соотношения (13.3) получим D0 (ωx , ωy , ω, ωλ ) = 2n + 1 2p + 1 2q + 1 2k + 1 ωx x1 sin ωy y1 sin ωT1 sin ωλ λ1 sin 2 2 2 2 = = ωx x1 ωy y1 ωT1 ωλ λ1 sin sin sin sin 2 2 2 2 = 16π 4 Dk (ωx , x1 )Dn (ωy y1 )Dp (ωT1 )Dp (ωλ λ1 ), (13.4) где Dk (ωx , x1 )Dn (ωy y1 )Dp (ωT1 )D1 (ωλ λ1 ) — функция ядер Дирихле 2n + 1 1 sin 2 Dn (x) = . 2π sin x 2 При больших n по отношению к суммируемым функциям, удовлетворяющим условиям Дини, функции ядра Дирихле обладают фильтрующим свойством δ-функции. Однако нормы функции ядра Дирихле не ограничены. Поэтому в пространстве непрерывных функций ∫π имеются отдельные функции, для которых lim −π f (z)Dn (z) dz не n→∞ существует, т. е. фильтрующее свойство δ-функции в точке x = 0 нарушается [70]. Полученные соотношения позволяют провести анализ специфики характеристик соответствующих структур дискретизации. Будем счи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 347 тать, что x1 , y1 — фиксированные периоды дискретизации исходного сигнала в пространстве, T1 — во времени, а λ1 — в спектральной зоне. С использованием соотношений (13.1), (13.3), (13.4) проанализируем особенности характеристик структур квазипериодической дискретизации в пространственной области. С целью упрощения зададимся при этом, что фиксируется совмещение отсчетов дискретизирующей функции в спектральной и временной зонах с началом координат. Соотношения для идеализированной функции ортогональной дискретизации и спектра данной функции получим в рассматриваемом случае соответствующим преобразованием соотношений (13.1), (13.4): d0 (x, y, t, λ) = di (x, y, t, λ) = δ(t)δ(λ) k n ∑ ∑ δ(x − µx1 )δ(y − ηy1 ); µ=−k η=−n (13.5) 2 D0 (ωx , ωy , ω, ωλ ) = Di (ωx , ωy ) = 4π Dk (ωx x1 )Dn (ωy y1 ). (13.6) Для ортогональной структуры дискретизации максимальный горизонтальный размер пространственной области дискретизации обоз2k + 1 начим xm1 = 2 x1 , а максимальный вертикальный размер — 2 2n + 1 y m1 = 2 y1 . 2 xm1 2k + 1 x1 Введем параметр формата p = = , отражающий y m1 2n + 1 y1 отношение горизонтального и вертикального размеров пространственной зоны дискретизации сигнала. С учетом выражения для введенного параметра p представим соотношение (13.6) в следующей форме: ( ) 2n + 1 2 Di (ωx , ωy ) = 4π Dk ωx p y1 Dn (ωy y1 ). (13.7) 2k + 1 Частным случаем квазипериодической дискретизации является случай симметричной в пространстве дискретизации, когда в соотношениях (13.6), (13.7) 2k + 1 = 2n + 1, а x1 = y1 . При ωx = = ωy = 0 значение пространственного спектра дискретизирующей функции Di (0, 0) = N0 = (2n + 1)(2k + 1). Соответственно, относительная характеристика спектра дискретизирующей функции опреDi (ωx , ωy ) деляется частным . Попеременно задаваясь в (13.6) ωx Di (0, 0) и ωy , получим, с учетом последнего, относительные характеристики
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 348 Часть V. Цифровое преобразование изображений в телевидении спектров дискретизирующей функции: Di (0, ωx ) 2πDk (ωx x1 ) = ; Di (0, 0) 2k + 1 Di (0, ωy ) 2πDn (ωy y1 ) Di0y (0, ωy ) = = . Di (0, 0) 2n + 1 Di0x (0, ωx ) = (13.8) Следовательно, характеристики сечений функции спектра дискретизирующей функции плоскостями 0Di ωx и 0Di ωy описываются функциями ядер Дирихле, имеющими периодическую структуру. При этом основные лепестки таких функций периодически формируются в пределах указанных сечений в точках 0,5ωx x1 = cπ и 0,5ωy y1 = mπ, где m = 0, 1, 2, ...; c = 0, 1, 2, .... Структура соотношений (13.8) свидетельствует о том, что с увеличением числа элементов дискретизации возрастает фильтрующее свойство характеристики пространственного спектра дискретизирующей функции в зонах сечения последней плоскостями 0Di ωx и 0Di ωy . Возрастание фильтрующего эффекта характеристики объясняется в данном случае увеличением частоты взаимнокомпенсационных преобразований (при дискретизации) структуры спектра исходного воздействия в промежутках между основными лепестками характеристики пространственного спектра дискретизирующей функции. Соответственно, имеет место и расширение ансамбля пространственных спектров исходного воздействия, для которых в условиях дискретизации выполняется фильтрующее свойство функций ядер Дирихле, определяющих характеристику спектра дискретизирующей функции. И в то же время ясно, что чем выше степень дискретности пространственного спектра исходного воздействия, тем больше вероятность нарушения взаимнокомпенсационных преобразований в локальных участках, расположенных по оси пространственных частот в промежутках между основными лепестками характеристик пространственного спектра дискретизирующей функции. Воздействие сопутствующих искажений при этом может возрастать для случаев дискретизации воздействий с периодической или квазипериодической структурой пространственного спектра. В частном случае, когда x1 → 0, 2k + 1 → ∞, выражение (13.8) может быть представлено следующим образом: x m1 x m1 Di0dy (ωx , ωy ) = 2π(2k + 1) = sin ωx ωx Dn (ωy y1 ). (13.9) 2 2 Вывод выражения (13.9) основан на допущении sin(ωx x1 /2) → → ωx x1 /2 и учете соотношения для xm1 . Начальные условия (x1 → 0, 2k+1 → ∞) фактически отражают в данном случае вариант квазипериодической дискретизации воздейст-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений Ðèñ. 13.1. 349 Относительная характеристика спектра для варианта дискретизации по строкам: 1, 2, 3 — сечения характеристики спектра вий в пространственной области по строкам. Следовательно, соответствующая относительная характеристика спектра дискретизирующей функции будет иметь следующий вид: xm1 ωx Di0dy (ωx , ωy ) 2π sin 2 Di0dy (ωx , ωy ) = = Dn (ωy y1 ). N0 2n + 1 xm1 ωx 2 (13.10) Для параметров p = 4/3 и Noy = 101 был осуществлен расчет графиков, соответствующих соотношению (13.10). Результаты расчета представлены на рис. 13.1 графиком 1, в частности показан случай ωy y1 = 0. При этом фактически реализуется сечение рассматриваемой функции плоскостью Di0dy 0ωx , результат которого отражается первым сомножителем общего соотношения (13.10). На графике 2 на рис. 13.1 показан результат сечения рассматриваемой функции плоскостью Di0dy 0ωy , которая соответствует второму сомножителю указанного выше соотношения Di0dy (0, ωy ) = 2π = Dn (ωy y1 ). 2n + 1 Если вращать секущую плоскость вокруг оси 0Di0d , то имеют
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 350 Часть V. Цифровое преобразование изображений в телевидении место трансформации структуры графика, отражающего сечение функции Di0dy (ωx , ωy ) секущей плоскостью. Для случая, когда секущая плоскость дает в пересечении с плоскостью ωy 0ωx линию ωx = ωy /p, вид функции сечения, в частности, показан на рис. 13.1 графиком 3. При относительно малых значениях 0,5ωy y1 имеем sin 0,5ωy y1 → → 0,5ωy y1 . Исходя из этого и учитывая равенство ωx = ωy /p (ωx = = −ωy /p, получим из соотношения (13.10) приближенное выражение, соответствующее на рис. 13.1 графику 3: ) ( sin 0,5xm1 ωx 2 . (13.11) Di0dy (ωx , ωy ) = 0,5xm1 ωx Полученное соотношение (13.11) свидетельствует о существовании в структуре относительной характеристики спектра дискретизирующей функции зон нарушений взаимнокомпенсационных преобразований (при ортогональной дискретизации в пространстве) спектра исходного воздействия, локализация которых в плоскости пространственных частот определяется линиями ωy = ±pωx . В пределах указанных зон, соответственно, имеет место падение фильтрующего эффекта характеристики пространственного спектра дискретизирующей функции, обусловленное однополярностью лепестков последней (график 3 рис. 13.1). При дискретизации (свертке спектров дискретизирующей функции и исходного воздействия) имеет место и соответствующее расширение (до двух раз) так называемых основного и побочных спектров по линиям, угол наклона которых в плоскости пространственных частот определяется величиной α = arctg(±p). Данное расширение может приводить в реальных системах телевидения к пересечению указанных спектров и возникновению сопутствующих муаровых составляющих при, например, восстановлении воздействий. Таким образом, местоположение зон повышенной активности муаровых помех (шумов), возникающих при воспроизведении соответствующих ТВ изображений в условиях квазипериодической дискретизации воздействий по строкам определяют взаимосимметричные в пространстве линии, которые пересекаются в центре области дискретизации и наклон которых по отношению к оси абсцисс задается углом α = arctg(±p). С другой стороны, однополярность лепестков характеристики пространственного спектра дискретизирующей функции в условиях свертки последней со спектром исходного воздействия сопровождается возникновением (в данной зоне пространства области дискретизации воздействия) интегральных искажений в структуре основного и побочных результирующих спектров. При этом в преобразованном
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 351 спектре воздействия появляются в указанных зонах области дискретизации сопутствующее подавление и искажение тонкой структуры спектра, связанные с трансформацией при дискретизации энергии спектральных составляющих воздействия в смежные зоны преобразованного дискретизацией пространственного спектра воздействия. Для p = 4/3, α1 = arctg p = 53,13◦ , α2 = arctg(−p) = −53,13◦ вычисленные значения углов α1 и α2 определяют направления увеличенной «активности» муаровых помех при построчной дискретизации воздействия и формате соответствующей пространственной области p = 4/3. Влияние таких искажений на качество изображений в ТВ системах может быть снижено за счет использования предварительного (до дискретизации по строкам) ограничения спектра воздействия в направлениях пространственной области, определенных углами α1 и α2 . В общем случае ортогональной структуре дискретизации соответствует соотношение (13.6) спектра дискретизирующей функции. Рассмотрим вариант сечения функции (13.6) секущей плоскостью, которая в пересечении с плоскостью ωx 0ωy дает линию ωx = ωy /p (ωx = −ωy /p). При этом соотношение (13.6) приобретает следующий вид: ( x ω )2 m1 x sin 2 D1 (ωx , ωy ) = Di (ωx ) = (13.12) xm1 ωx xm1 ωx . sin sin 2(2k + 1) 2(2n + 1) Соотношение (13.12) свидетельствует о том, что и при ортогональной структуре квазипериодической дискретизации имеют место нарушения взаимокомпенсационных преобразований спектра исходного воздействия в промежутках между основными лепестками характеристики пространственного спектра дискретизирующей функции. Локализация таких нарушений в пространстве определяется линией ωy = pωx (ωy = −pωx ). Объясняется это тем, что числитель в соотношении (13.12) не меняет знак с изменением аргумента ωx , а знаменатель имеет отрицательное значение лишь в тех участках значений ωx , где синусы знаменателя противоположны по знакам (к тому же величины xm1 /(2k + 1), xm1 /(2n + 1) ≪ xm1 ). Поворот в пространственной области структуры квазипериодической дискретизации (рис. 13.2,b) ведет к соответствующему повороту и зоны нарушений взаимокомпенсационных преобразований спектра исходного воздействия. Следовательно, в телевизионных системах существует возможность фазового совмещения такой зоны с заданной областью пространства при воспроизведении изображений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 352 Часть V. Цифровое преобразование изображений в телевидении В заключение отметим, что полученные выше результаты анализа свидетельствуют о согласованности специфики пространственного спектра ортогональных структур квазипериодической дискретизации с известной анизотропией усредненной спектральной интенсивности реальных изображений и характеристик зрения человека [71, 75]. 13.2. Принципы построения и анализа характеристик спектра структур квазипериодической дискретизации телевизионных изображений Одно из естественных требований согласования характеристик многомерных спектров структур дискретизации и реальных изображений, исходных для процесса дискретизации, ортогональность специфики изменений формы сечений спектра изображений и основного лепестка структуры в многомерном пространстве. Квазипериодический характер структур дискретизации обусловливает дискретность (квазидискретность) соответствующей структуры пространственного спектра дискретизирующей функции, которая, в конечном счете, определяет преобразование спектра исходного воздействия в процессе дискретизации. Следовательно, при выборе структуры дискретизации должны быть учтены интегральные особенности пространственных спектров, характерные для всего ансамбля воздействий. Отсюда вытекает целесообразность текущей (направленной) перестройки структуры дискретизации при вариациях характеристик спектра видеоинформационных воздействий на входе системы телевидения. Процесс построения структуры дискретизации связан с заполнением многомерной области отсчетами. При этом плотность заполнения в фиксированных направлениях многомерного пространства определяется особенностями воздействия (многомерного спектра воздействия). Для случая статической структуры дискретизации плотность и специфика заполнения, например, по пространственному измерению, определяется соответствующей усредненной спектральной интенсивностью реальных изображений. Отражением спектра изображений в реальной области является усредненная импульсная переходная характеристика. Принцип заполнения реального многомерного пространства отсчетами целесообразно связать с заполнением такого пространства дискретизации совокупностью импульсных переходных характеристик. Ограничивающие (по минимальному уровню) сечения смежных по пространству импульсных переходных характеристик, например, проходят через центры локализации последних. Будем считать опорными в структуре дискретизации точки пространства, размещением по от-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 353 ношению к которым смежных отсчетов учитываются особенности отдельной импульсной переходной характеристики. Установленное распределение отсчетов вокруг каждой опорной точки должно обеспечивать заданным числом отсчетов наиболее эффективную аппроксимацию формы импульсной переходной характеристики. При изотропном спектре воздействия смежные отсчеты целесообразно, соответственно, располагать по линиям окружностей. Центром каждой из таких окружностей может являться опорный отсчет. Радиус задается протяженностью пространственного спектра воздействия. Простейшая совокупность смежных отсчетов определяет ячейку структуры дискретизации. Периодическим распределением ячеек по пространству дискретизации формируется общая структура квазипериодической дискретизации воздействия. Характерной чертой структур ортогонального типа является распределение ячеек в пространстве вдоль ортогональных осей. Соотношение (13.6) для характеристики спектра ортогональной структуры квазипериодической дискретизации по пространственному измерению, в частности, имеет следующий вид: 2n+1 2k+1 ωx x1 sin ωy y1 2 2 = 4π 2 Dk (ωx x1 )Dn (ωy y1 ), D0 (ωx , ωy ) = ωx x1 ωy y1 sin sin 2 2 (13.13) где Dk (ωx x1 )Dn (ωy y1 ) — функции ядер Дирихле; x1 , y1 — фиксированные периоды дискретизации исходного сигнала в пространстве; 2k + 1, 2n + 1 — число отсчетов структуры дискретизации по горизонтали и вертикали соответственно. Каждый отсчет ортогональной структуры (рис. 13.2,a) является опорным для четырех смежных отсчетов, расположенных, например, на окружности фиксированного радиуса. Все отсчеты в данной структуре находятся в относительно эквивалентных в пространстве дискретизации условиях. Нарушения эквивалентности здесь могут быть связаны лишь с ограничением общего пространства области дискретизации. Поворот ортогональной структуры на угол φ = 45◦ (рис. 13.2,b) приводит к почти полному совпадению ориентации зон нарушений взаимокомпенсационных преобразований спектра исходного воздействия с горизонтальными и вертикальными направлениями пространства дискретизации. В условиях визуального восприятия восстановленных изображений последнее вызывает возрастание заметности сопутствующих дискретизации муаровых составляющих. Вариант ячейки структуры дискретизации с размещением семи отсчетов в пределах каждой ячейки и шести отсчетов по линии окружsin
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 354 Часть V. Цифровое преобразование изображений в телевидении Структуры дискретизации телевизионных изображений в пространстве кадра: a, b — ортогонального типа; v — гексогонального типа Ðèñ. 13.2. ности (эллипса), ограничивающей ячейку, является основой для построения структур дискретизации гексагонального типа (рис. 13.2,v). Отдельный отсчет в такой структуре является опорным и однов-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 355 ременно располагается на линии окружности. Соответственно, граница ячейки в данном случае аппроксимируется не четырьмя, как при ортогональной структуре, отсчетами, а шестью. Спектр дискретизирующей функции за счет этого приобретает более изотропный вид. Последнее, в конечном счете, и обеспечивает преимущество данной структуры перед ортогональными структурами при дискретизации воздействий с изотропным спектром, которое при всех прочих равных условиях обусловливает экономию количества отсчетов. Рассмотренные структуры являются структурами с квазипериодической равномерной дискретизацией. К достоинствам подобного рода структур дискретизации можно отнести однозначность алгоритма восстановления изображений, простоту практической реализации, которая определяется периодичностью следования отсчетов в пространстве дискретизации, и согласования параметров структуры со стандартными параметрами дискретизации телевизионных изображений. Дальнейшим развитием структур дискретизации является структура, ячейки которой содержат, например, двенадцать отсчетов. Возможный вариант построения ячейки показан на рис. 13.3,a. Восемь отсчетов аппроксимируют здесь внешнюю окружность, ограничивающую пространство ячейки, а четыре отсчета — центральную окружность, заполняющую внутреннюю зону ячейки. Расстояние между указанными окружностями и диаметр центральной окружности выбирается равным расстоянию между отсчетами, аппроксимирующими внешнюю окружность. Последовательность ячеек заполняет пространство дискретизации. Фрагмент пространства дискретизации показан на рис. 13.3,b. Полученная структура является структурой с квазипериодической неравномерной дискретизацией. В основе построения таких структур лежит выбор и периодическое распределение групп отсчетов по пространству дискретизации. Для восстановления изображений в данном случае могут использоваться различные алгоритмы, основой которых служат процессы интерполяции и экстраполяции промежуточных (отсутствующих) отсчетов [72, 73]. Неравномерная структура отсчетов, показанная, например, на рис. 13.3,b преобразуется при этом в квазипериодическую равномерную структуру, отсчеты которой следуют с частотами, кратными первичным частотам следования групп отсчетов и отсчетов в группах. Затем из полученной (высокочастотной) структуры обычным образом восстанавливают телевизионный сигнал. В структуре рис. 13.3,b экономия отсчетов не может быть (при всех прочих условиях) достигнута за счет, например, уменьшения точности аппроксимации внешней зоны в ячейке. Ячейка подобного вида представлена на рис. 13.3,v. Соответствующая структура показана
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 356 Часть V. Цифровое преобразование изображений в телевидении Варианты составляющих ячеек (a, b) и фрагменты соответствующих структур дискретизации с неравномерным распределением отсчетов (v, g) Ðèñ. 13.3. на рис. 13.3,g. Как можно заметить, здесь, по сравнению с исходной структурой, устранены отсчеты, являющиеся центральными для смежных групп отсчетов. Информация от данных отсчетов учитывается при восстановлении всей структуры отсутствующих (между группами) отсчетов. Соответственно, в структуре рис. 13.3,g, безусловно, снижается достижимая точность восстановления. Необходимое (по отношению к структуре рис. 13.3,b) увеличение точности восстановления в данном случае может достигаться лишь за счет уменьшения площади ячейки, что, в конечном счете, эквивалентно увеличению общего количества отсчетов в структуре дискретизации и плотности отсчетов на единицу измерения пространства дискретизации. Внутренние и внешние отсчеты ячеек структур рис. 13.3 жестко связаны по фазе. Одновременное изменение фазы указанных отсчетов ячеек на одно и то же значение отражается соответствующим поворотом структур рис. 13.3. Целесообразно в связи с этим ввес-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 357 ти понятие сопряженной исходной (дополняющую исходную) ячейки. При всех прочих эквивалентных условиях будем понимать под такой ячейкой вариант ячейки, в которой отсчеты расположены в пределах аппроксимируемой функции внутреннего для ячейки сечения, например окружности, точно в средних точках отрезков последней между каждыми двумя смежными отсчетами, соответствующими ячейке исходного вида. Сопряженные ячейки могут чередоваться по пространственному или другим измерениям в пространстве дискретизации [73, 75]. При использовании такого чередования обеспечивается более высокая (в среднем) степень изотропности характеристик спектра результирующей структуры дискретизации. Основой анализа характеристик спектра структуры дискретизации, представленной на рис. 13.3,b, например, является чередование в заданном порядке частных ячеек, которые соответствуют рис. 13.3,a и v. Независимая обобщённая ячейка структуры дискретизации сочетает в данном случае четыре диагонально расположенных ячейки: две в одной из диагоналей соответствуют ячейке, представленной на рис. 13.3,a, а другие две во второй из диагоналей соответствуют ячейке рис. 13.3,v. Периодическое распределение по пространству дискретизации независимых обобщённых ячеек обеспечивает заполнение отсчётами всего внутрикадрового пространства анализируемого сигнала телевизионного изображения в соответствии с рис. 13.3,b. Можно ожидать относительно высокое содержание гармонических составляющих в структуре двумерного спектра такой обобщённой ячейки дискретизации, что объясняется существенной неравномерностью периода следования отсчётов по отличающимся направлениям пространства дискретизации. Последнее определяет не только указанное обогащение характеристики спектра обобщённой ячейки дискретизации гармоническими составляющими, но и значительное снижение уровня главных лепестков каждой из них. Общее падение уровня лепестков гармоник спектра в данном случае приведёт к снижению вероятности возникновения заметных нелинейных пространственных искажений муарового типа в реальных системах, которые возникают в процессе формирования сигнала ТВ изображения из-за биений составляющих пространственного спектра видеоинформационного сигнала с гармониками спектра внутрикадровой структуры дискретизации и оказывают существенное негативное влияние на функциональные характеристики современных систем телевидения. Основой конкретного анализа характеристик спектра структур дискретизации различных типов являются трансформации ортогональных структур квазипериодической дискретизации. Рассмотрим отдельные варианты реализации таких трансформаций. Найдем, в
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 358 Часть V. Цифровое преобразование изображений в телевидении Фрагменты структур дискретизации анализируемой по характеристике спектра (a) и с уменьшением в 2 раза периода следования отсчётов по горизонтали (b) Ðèñ. 13.4. частности, характеристику спектра структуры дискретизации, вид которой показан на рис. 13.4,a. Анализируемая структура содержит нечетные дискретные строки (отмечены на рис. 13.4,a цифрой 1) и четные строки (отмечены цифрой 2). Общий спектр структуры может быть представлен суммой спектров составляющих структур, соответствующих нечетным и четным строкам. Период следования отсчетов в структуре нечетных строк по горизонтали — x1 , а период следования последних по вертикали — y1 . Зададимся числом отсчетов в данной структуре по горизонтали (2k + 1) и по вертикали (2n + 1), где k = 4, n = 3. С учетом этого спектр структуры нечетных строк Dнс (ωx , ωy ) описывается соотношением (13.13). Число отсчетов в структуре четных строк по горизонтали 2k; по вертикали 2n. Структура рис. 13.4,b отличается от структуры четных строк уменьшением в два раза периода следования отсчетов по горизонтали x1 /2 и вертикали y1 /2. Число отсчетов здесь по горизонтали в строках равно 2m + 1 = 4k − 1; по вертикали в столбцах — 2p + 1 = 4n − 1. Осуществим трансформацию структуры рис. 13.4,b в структуру четных строк рис. 13.4,a.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 359 Для этого необходимо осуществить следующее: 1) из структуры рис. 13.4,b устранить отсчеты четных строк; 2) из структуры нечетных строк, полученных в п. 1, устранить отсчеты четных столбцов. В результате получим необходимую структуру четных строк (рис. 13.4,a). С учетом (13.13) и соответствующих параметров запишем выражение спектра для полной структуры рис. 13.4,b: 4k + 1 ωx x1 4n − 1 ωy y1 sin 2 2 2 2 . D0 (ωx , ωy ) = D0x (ωx )D0y (ωy ) = ωx x1 ωy y1 sin sin 4 4 (13.14) Число четных строк в структуре рис. 13.4,b равно 2d + 1 = n + 2, период следования четных строк y1 . Тогда соответствующее выражение для спектра составляющей структуры дискретизации четных строк рис. 13.4,b может быть представлено следующим образом: sin n+2 ωy y1 2 D0ч (ωx , ωy ) = D0y (ωx )D0чy (ωy ) = D0x (ωx ) ωy y1 . (13.15) sin 2 Соотношение для спектра нечетных строк структуры рис. 13.4,b отражается разностью (13.14) и (13.15): sin D0н (ωx , ωy ) = D0x (ωx )[D0y (ωy ) − D0чy (ωy )]. (13.16) Структура отсчетов нечетных строк, совпадающих с четными столбцами, отличается от нечетных строк структуры рис. 13.4,b числом отсчетов по строке равным 2t+1 = 2k −1 и периодом следования отсчетов (четных столбцов) x1 . В характеристике спектра это учитывается изменением в (13.16) сомножителя D0x (ωx ). Соответственно, спектр структуры отсчетов, совпадающих с четными столбцами и нечетными строками структуры рис. 13.4,b, имеет следующий вид: D0нч (ωx , ωy ) = D0чx (ωx )[D0y (ωy ) − D0чy (ωy )], (13.17) где sin D0чч (ωx , ωy ) = 2k − 1 ωx x1 2 . ωx x1 sin 2 (13.18) Общий спектр полной структуры рис. 13.4,a определяется тремя составляющими: Dс (ωx , ωy ) = Dнс (ωx , ωy ) + D0н (ωx , ωy ) − D0нч (ωx , ωy ). (13.19)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 360 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 13.5. Фрагмент исходной структуры (a) и ячейки дискретизации (b), использованных при анализе характеристики спектра структуры дискретизации гексагонального типа Учет (13.13)–(13.18) позволяет конкретизировать все составляющие анализируемой характеристики Dс (ωx , ωy ), представленной соотношением (13.19). Конкретный анализ полученной двумерной характеристики спектра можно осуществлять использованием системы сечений плоскостями, проходящими, например, через начало координат. При этом определяется связь между ωx и ωy и двумерная характеристика Dс (ωx , ωн ) преобразуется в систему одномерных сечений. Сложность выражения (13.19) обусловливает целесообразность применения для вычислений ЭВМ. На примере гексагональной структуры дискретизации рассмотрим несколько иной вариант выполнения анализа характеристик спектра. Будем считать, что фрагмент преобразованной структуры дискретизации имеет вид, показанный на рис. 13.2,v. Такая структура может быть получена суммированием исходной структуры (рис. 13.5,a) с дополняющей структурой (рис. 13.6,b). В свою очередь, дополняющая структура может быть получена за счет свертки опорной структуры (рис. 13.6,a) с ячейкой дискретизации, вид которой показан на рис. 13.5,b. Зададимся числом отсчетов исходной структуры: по горизонтали 2k + 1; по вертикали 2n + 1. Период следования отсчетов исходной структуры: по горизонтали x1 , по вертикали y1 . Число отсчетов опорной структуры: по горизонтали k + 1; по вертикали n + 1. Пе- Ðèñ. 13.6. Фрагменты опорной (a) и дополняющей (b) структур, использованных при анализе характеристики спектра структуры дискретизации гексагонального типа
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 361 риод следования отсчетов опорной структуры: по горизонтали 2x1 ; по вертикали 2y1 . С учетом этого спектр Dи (ωx , ωy ), соответствующий исходной структуре, описывается соотношением (13.7), а спектр опорной структуры Dоп (ωx , ωн ) — соотношением следующего вида: Dоп (ωx , ωy ) = sin[(k + 1)ωx x1 ] sin[(n + 1)ωy y1 ] . sin ωx x1 sin ωy y1 (13.20) Введем дискретизирующую функцию ячейки, соответствующую рис. 13.5,b: dя (x, y) = 1 ∑ w=−1 − δ(y) 1 ∑ w=−1 δ(x − 0,5wx1 ) 1 ∑ δ(y − 0,5vy1 ) − v=−1 δ(x − 0,5wx1 ) + δ(x)δ(y) − δ(x) 1 ∑ δ(x − 0,5vy1 ).(13.21) v=−1 Спектр данной ячейки дискретизации определяется суммой спектров четырех δ-функций: Dя (ωx , ωy ) = e−j0,5ωx x1 −j0,5ωy y1 + e−j0,5ωx x1 +j0,5ωy y1 + + e−j0,5ωx x1 +j0,5ωy y1 + e−j0,5ωx x1 −j0,5ωy y1 = = 2 cos(0,5ωx x1 + 0,5ωy y1 ) + 2 cos(0,5ωx x1 − 0,5ωy y1 ). (13.22) Если dп (x, y) — дискретизирующая функция преобразованной структуры, dи (x, y) — исходной структуры, а dоп (x, y) — дискретизирующая функция опорной структуры, то dп (x, y) = dи (x, y) + dоп (x, y) ⊗ dя (x, y). (13.23) Тогда, согласно (13.23), выражение для спектра структуры отражается соотношением следующего вида: Dп (ωx , ωy ) = Dи (ωx , ωy ) + Dоп (ωx , ωy )Dя (ωx , ωy ). (13.24) Учет (13.13) и (13.20), (13.22) позволяет конкретизировать все составляющие анализируемой характеристики Dп (ωx , ωy ), представленной соотношением (13.24). Соотношения для характеристик спектра структур рис. 13.3,b, g могут быть также получены с использованием представленных здесь результатов. Например, структура вида рис. 13.4,a может быть преобразована к структуре вида рис. 13.3,g за счет свертки с ячейкой дискретизации, отсчеты которой соответствующим образом размещены в углах квадрата (прямоугольника). В спектральной области это отражается произведением спектров указанной структуры и ячейки дискретизации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 362 Часть V. Цифровое преобразование изображений в телевидении Отличие структуры рис. 13.3,a от структуры рис. 13.3,g касается лишь добавления составляющей, связанной со структурой центральных отсчетов. Полезно заметить, что необходимость учета при анализе различных составляющих конкретной структуры дискретизации определяется относительным весом каждой из таких составляющих, который пропорционален относительному числу отсчетов, входящих в каждую из составляющих структур. Аналогичным образом разработанные в данном разделе принципы расчета позволяют осуществлять анализ спектра квазипериодических структур дискретизации различных типов. Сопоставление вида сечений, полученных для спектров двумерных соотношений, обеспечивает в таком случае возможность выявления наилучшей структуры. Высокая сложность расчетных выражений обусловливает целесообразность использования для реализации необходимых расчетов ЭВМ. Особенности реальных структур квазипериодической дискретизации воздействий в пространственной области связаны с неидеальностью дискретизирующей функции. Такая функция может быть представлена сверткой dr (x, y) = H(x, y) ⊗ di (x, y), (13.25) где H(x, y) — ограничивающая функция, определяющая форму отдельного отсчета; di (x, y) — дискретизирующая функция идеального вида. Согласно соотношению (13.25) идеализированная структура дискретизации определяет количество и закон распределения ограничивающих функций в пространственной области. Если H(ωx , ωy ) — спектр ограничивающей функции, а Di (ωx , ωy ) — спектр идеализированной структуры, то спектр реальной структуры квазипериодической дискретизации может быть представлен следующим образом: Dr (ωx , ωy ) = Di (ωx , ωy )H(ωx , ωy ). (13.26) Общее выражение (13.26) свидетельствует о существенном влиянии вида ограничивающей функции на спектр структуры квазипериодической дискретизации. Следовательно, необходимо установить критерии выбора формы и протяженности функции ограничения для такого случая. Заслуживают внимания в связи с этим следующие требования, которые должны выполняться при реализации структур дискретизации: 1. В минимальной степени за счет действия неидеальности отдельного отсчета должна искажаться картина спектра, соответствующего идеальной структуре дискретизации, в диапазоне от 0 до 1/2 час-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 363 тоты дискретизации для фиксированного направления области дискретизации. 2. Не должна существенно нарушаться взаимокомпенсационная основа смежных участков спектра структуры дискретизации в диапазоне пространственных частот, больших 1/2 частоты дискретизации. 3. Должна быть обеспечена достаточно высокая степень подавления побочных спектров, смежных основному. Нарушение в реальных структурах первого из перечисленных требований обусловливает ухудшение фильтрующего действия структуры дискретизации при формировании основного спектра. С последним связано подавление тонкой структуры в спектре исходного воздействия в процессе дискретизации. Ограничение в реальных случаях степени подавления амплитуды спектра структуры дискретизации в диапазоне от 0 до 1/2 частоты дискретизации (на верхней границе указанного диапазона) является критерием, определяющим пространственную протяженность отдельного отсчета. В связи со вторым требованием следует учитывать тот факт, что взаимокомпенсационная основа смежных участков спектра структуры дискретизации не нарушается в условиях использования отсчетов, спектр которых как функция частоты не меняет полярности. Соответственно, полярность результирующего спектра структуры в смежных участках определяется в соотношении (13.26) полярностью спектра идеальной структуры. Таким образом, второе требование накладывает условие на форму отсчета в структуре дискретизации. И, наконец, третье требование связано с уменьшением степени мешающего воздействия (активности муаров) в условиях пересечения основного и побочного спектров дискретизированного воздействия. Протяженность и форма отсчета в данном случае должны выбираться за счет определения степени подавления побочных спектров. При этом обычно приходится мириться со сглаживанием тонкой структуры спектра воздействия в процессе дискретизации. 13.3. Результаты анализа характеристик спектра структур внутрикадровой дискретизации сигналов телевизионных изображений Анизотропия характеристик спектра структур дискретизации во внутрикадровом пространстве должна быть согласована со спецификой усреднённого пространственного спектра используемого ансамбля возможных изображений. Это позволяет избежать линейных и нелинейных искажений сигналов изображений, обусловленных интегрированием составляющих соответствующего многомерного спектра
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 364 Часть V. Цифровое преобразование изображений в телевидении или изменением (искажением) функции многомерного спектра изображений, обусловленных биениями его периодических составляющих с периодическими составляющими спектра структуры дискретизации. При этом для сохранения качества изображений важно минимизировать, как показано ранее, степень наложения смежных лепестков преобразованного (дискретизацией) спектра сигнала изображения. Проведённые исследования [75] показали, что функция пространственного спектра исследованного ансамбля ТВ изображений имеет минимальную протяжённость в направлении под углом в 45◦ . Выбранная структура дискретизации по специфике своего спектра должна быть в системах телевидения эффективно согласована с анизотропией спектра передаваемого ансамбля изображений. Поэтому при проектировании перспективных систем телевидения и разработке методов сжатия, основанных на преобразованиях параметров структур дискретизации, должное внимание следует уделять вопросам анализа функций спектра последних. Ограниченная в пространстве прямоугольной функцией окна структура внутрикадровой дискретизации с ортогональным распределением пикселей и нечётным их числом во внутрикадровом пространстве может быть представлена [49, 52] следующим соотношением: d01 (x, y, t, λ) = di (x, y, t, λ) = 2k 2n ( ∑ ∑ x1 ) ( y1 ) = δ(t)δ(λ) δ x−µ δ y−η . 2 2 η=−2n (13.27) µ=−2k Здесь x1 /2, y1 /2 — периоды следования пикселей; 4k + 1, 4n + 1 — количество пикселей, укладывающихся по длине и высоте внутрикадрового пространства; x, y, t, λ — координаты по направлениям многомерного пространства (пространство x0y, время и цветовое направление). Характеристика спектра, соответствующего данной (соотношение (13.1)) структуре дискретизации, отражается в частотном пространстве [36, 49, 52] произведением функций: D0 (ωx , ωy , ω, ωλ ) = D01 (ωx , ωy ) = 4π 2 D2k (ωx x1 )D2n (ωy y1 ) = 4n + 1 y1 4k + 1 x1 ωx sin ωy sin 2 2 2 2 , (13.28) = ωx x1 ωy y1 sin sin 4 4 где ωx , ωy , ω, ωλ — пространственные по временному и по цветовому направлениям частоты соответственно; D2k (ωx x1 ), D2n (ωy y1 ) — функции ядер Дирихле. Как можно заметить, для функций ядер Дирихле свойственной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 365 является неопределённость в точках, где числитель и знаменатель одновременно определяются значением, равным нулю. С учётом этого, для упрощения дальнейших вычислений, преобразуем соотношение (13.28) к виду 4k + 1 x1 ωx + (4k + 1) · 10−7 2 2 ∼ D01 (ωx , ωy ) = × ωx x1 sin + 10−7 4 4n + 1 y1 sin ωy + (4n + 1) · 10−7 2 2 × . ω y y1 sin + 10−7 4 sin (13.29) Проведём нормирование соотношения (13.29): F01 (ωx , ωy ) = F1 (ωx )F2 (ωy ) D01 (ωx , ωy ) = . D01 (0, 0) F1 (0)F2 (0) (13.30) На рис. 13.7,a показана расчётная функция спектра F01 (ωx , ωy ) ортогональной структуры дискретизации в области низких значений частот ωx , ωy , а на рис. 13.7,b — графики соответствующих ей сечений для случая нечётного числа пикселей (4k + 1) × (4n + 1) во внутрикадровом пространстве при k = 45, n = 36, x1 = y1 = 0,11. Можно заметить, что для спектра в области нижних частот характерным является колебательный процесс вдоль осей ωx , ωy . Интенсивность колебательного процесса снижается здесь с увеличением частоты. Ðèñ. 13.7. Низкочастотный участок характеристики спектра ортогональной структуры дискретизации (a) и её сечения при числе пикселей в структуре дискретизации (4k + 1) × (4n + 1) (b)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 366 Часть V. Цифровое преобразование изображений в телевидении Специфика колебательного процесса определяет фильтрующие свойства функции ядра Дирихле. Чем выше частота колебательного процесса (в данном случае в пределах оси частот) и чем меньше его остаточный уровень в средней точке между гармониками спектра структуры дискретизации, тем в большей степени соответствует (по фильтрующему свойству) функция ядра Дирихле обычной δ-функции. Сопоставление (рис. 13.7,b) сечений F01 (ω, 0) и F01 (0, ω) показывает, что относительное увеличение числа пикселей в структуре дискретизации по оси 0x к числу пикселей по оси 0y и, соответственно, размера внутрикадрового пространства обеспечивает возрастание частоты колебательного процесса в спектре структуры дискретизации по соответствующему направлению (ось 0x). При дискретизации это отражается уменьшением степени интегральных искажений спектра дискретизируемого ТВ сигнала по данному направлению. При этом его спектр практически без искажений позиционируется по оси 0ωx в пределах каждой гармоники спектра структуры дискретизации. В сечении функции спектра под углом 45◦ (F01 (ω, ω)) колебательный процесс имеет фиксированную (положительную) полярность пульсаций, интенсивность которых существенно падает. Соответственно, по этому направлению функция Дирихле не обладает фильтрующим свойством и, чем больше протяженность основного лепестка и колебательного процесса, тем в большей степени можно ожидать по данному направлению в двумерном частотном пространстве появление искажений исходного сигнала ТВ изображения, обусловленных наложением составляющих смежных лепестков преобразованного спектра при осуществлении дискретизации. Общая функция спектра внутрикадровой структуры дискретизации имеет периодическую структуру гармонических составляющих. На рис. 13.8 представлены в сравнительно широком диапазоне пространственных частот соответствующие соотношению (13.30) сечения спектра структуры дискретизации в горизонтальном и под углом в 45◦ направлениях (k = 45, n = 36, x1 = y1 = 0,11 и число пикселей (4k + 1) × (4n + 1)). Как показали результаты вычислений (соотношение (13.30)), для данной функции спектра характерны неизменная полярность всех её гармоник и увеличение минимальной интенсивности колебательного процесса в средней точке между гармониками спектра по оси 0ωy по сравнению с осью 0ωx , что связано с более низким числом пикселей в структуре дискретизации по первому из пространственных направлений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 367 Ðèñ. 13.8. Фрагмент сечений общей характеристики спектра исходной структуры дискретизации при высокой частоте следования и числе пикселей (4k + 1) × (4n + 1) Представим соотношения (13.27) и (13.28) следующим образом: d02 (x, y, t, λ) = di (x, y, t, λ) = δ(t)δ(λ) k n ∑ ∑ δ(x − µx1 )δ(y − ηy1 ); µ=−k η=−n (13.31) 2 D0 (ωx , ωy , ω, ωλ ) = D02 (ωx , ωy ) = 4π Dk (ωx x1 )Dn (ωy y1 ). (13.32) Преобразуем и нормируем выражение (13.32), также как и выражение (13.28). В результате имеем ∼ F3 (ωx )F4 (ωy ); D02 (ωx , ωy ) = D02 (ωx , ωy ) F3 (ωx )F4 (ωy ) F02 (ωx , ωy ) = = . D02 (0, 0) F3 (0)F4 (0) (13.33) (13.34) На рис. 13.9 представлен соответствующий расчётной характеристике F02 (ωx , ωy ) (соотношение (13.34)) фрагмент спектра структуры дискретизации в относительно широком диапазоне пространственных частот и её сечение в горизонтальном (F02 (ω, 0)) направлении при пониженной примерно в два раза частоте следования и числе пикселей (2k + 1) × (2n + 1) в пределах внутрикадрового пространства. Сопоставление расчётных данных (выражения (13.30) и (13.34)) показало, что в низкочастотном участке нормированные характеристики сечений спектра рассмотренных структур дискретизации практически не изменяются в зависимости от числа отсчётов в условиях сохранения их нечётного числа по длине и высоте внутрикадрово-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 368 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 13.9. Фрагмент спектра структуры дискретизации (a) и её сечение (b) в горизонтальном (F02 (ω, 0)) направлении при числе пикселей (2k + 1) × (2n + 1) го пространства и фиксации размера внутрикадрового пространства. Это в первую очередь связано с неизменностью параметров функции R(x, y), ограничивающей область дискретизации пределами внутрикадрового пространства. Вместе с тем при снижении числа пикселей имеет место уменьшение в частотном пространстве расстояния между смежными гармониками спектра структуры дискретизации и их интенсивности. Существенно в связи с этим возрастает относительный минимальный уровень колебательного процесса в средней точке между гармониками спектра структуры дискретизации, что вызывает увеличение числа возможных реализаций спектра сигналов изображений, для которых нарушается фильтрующее свойство δ-функции в пределах гармоник спектра выбранной структуры дискретизации. Увеличивается в связи с этим и вероятность возникновения интегральных и нелинейных искажений в структуре спектра самого сигнала изображения. При этом даже незначительные изменения параметров структуры дискретизации в реальном пространстве могут существенно сказываться на специфике её спектра. Рассмотрим, в частности, влияние параметра чётности числа пикселей на характер спектра структуры дискретизации. Соответственно, представим структуру дискретизации следующим образом: d03 (x, y, t, λ) = δ(t)δ(λ) k ∑ µ=−k δ(x − µx1 )×
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 369 Фрагмент общей характеристики спектра структуры дискретизации (a) и её сечение в вертикальном направлении (b) при числе пикселей (2k + 1) × (2n) Ðèñ. 13.10. [ ] n ∑ y1 ) × − δ(y − ηy1 ) . δ y−η 2 η=−n η=−2n 2n ∑ ( (13.35) С учётом (13.29), (13.30) и (13.33), (13.34) получим соотношение для нормированной характеристики спектра структуры дискретизации, соответствующей (13.35): F03 (ωx , ωy ) = (F2 (ωy ) − F4 (ωy ))F3 (ωx ) . (F2 (0) − F4 (0))F3 (0) (13.36) На рис. 13.10 представлены соответствующий расчётной характеристике F03 (ωx , ωy ) (соотношение (13.36)) фрагмент спектра структуры дискретизации в относительно широком диапазоне пространственных частот с чётным числом пикселей по высоте внутрикадрового пространства и сечение спектра в вертикальном (F03 (0, ω) направлении, k = 45, n = 36, число пикселей (2k + 1) × (2n)). Сопоставление результатов расчётов соотношений (13.34) и (13.36) свидетельствует о том, что введение чётности выбранного числа пикселей по одному из направлений внутрикадрового пространства определяет появление инверсии лепестков в смежных гармониках спектра структуры дискретизации в частотном пространстве в аналогичном и под углом в 45◦ направлениям. Соответственно, особенностью спектра данной структуры является ассиметричный характер его сечений в горизонтальном и вертикальном направлениях. Указанные инверсия лепестков и асимметрия сечений определяют возможности адаптивного согласования характеристик спектра структуры дискретизации со спектром
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 370 Часть V. Цифровое преобразование изображений в телевидении текущего ТВ сигнала за счёт вариаций параметром чётности, что может обеспечивать уменьшение уровня или заметности сопутствующих процессу внутрикадровой дискретизации нелинейных и интегральных искажений структуры изображений. При выборе четного числа пикселей по вертикальному и горизонтальному направлениям во внутрикадровом пространстве функция структуры дискретизации отражается соотношением   2k k ( ) ∑ ∑ x1 d04 (x, y, t, λ) = δ(t)δ(λ)  δ x−µ − δ(x − µx1 ) × 2 µ=−2k µ=−k ] [ 2n n ∑ ( ∑ y1 ) δ(y − ηy1 ) . (13.37) × δ y−η − 2 η=−n η=−2n С учётом (13.29), (13.30) и (13.33), (13.34) получим выражение для нормированной характеристики спектра структуры дискретизации, соответствующей (13.37): F04 (ωx , ωy ) = (F1 (ωx ) − F3 (ωx ))(F2 (ωy ) − F4 (ωy )) . (F1 (0) − F3 (0))(F2 (0) − F4 (0)) (13.38) Согласно расчётным результатам, введение чётности выбранного числа пикселей по вертикальному и горизонтальному направлениям внутрикадрового пространства определяет появление в частотном пространстве инверсии лепестков в смежных гармониках спектра структуры дискретизации по этим направлениям. Особенностью данного варианта является симметричный характер спектра структуры дискретизации в вертикальном и горизонтальном направлениях и отсутствие инверсии его гармоник в направлении под углом в 45◦ . Структуры дискретизации с чётным числом отсчётов по вертикали и горизонтали могут быть относительно просто трансформированы в структуры «шахматного» типа за счёт добавления пикселей, соответствующих структуре d02 (x, y, t, λ), представленной соотношением (13.31):   2k k  ∑ ( ) ∑ x1 d05 (x, y, t, λ) = δ(t)δ(λ)  δ x−µ − δ(x − µx1 ) ×  2 µ=−2k µ=−k [ 2n ] n ∑ ( ∑ y1 ) δ y−η × − δ(y − ηy1 ) + 2 η=−n η=−2n  k n  ∑ ∑ + δ(x − µx1 )δ(y − ηy1 ) . (13.39)  η=−n µ=−k
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 371 С учётом выражений (13.37)–(13.39) нормированный спектр структуры дискретизации «шахматного» типа имеет следующий вид: (F1 (ωx ) − F3 (ωx ))(F2 (ωy ) − F4 (ωy )) + F3 (ωx )F4 (ωy ) . (F1 (0) − F3 (0))(F2 (0) − F4 (0)) + F3 (0)F4 (0) (13.40) Недостатком структуры дискретизации «шахматного» типа является увеличение числа пикселей по отношению к структуре с чётным числом отсчётов по вертикальному и горизонтальному направлениям (соотношения (13.37), (13.38)). В расчётных характеристиках соответствующего спектра (соотношение (13.40)) неизменной также является полярность его смежных гармоник. В сечениях характеристики спектра по вертикальному и горизонтальному направлениям в два раза по отношении к структуре с чётным числом пикселей увеличивается расстояние между его смежными гармониками. Последнее позволяет эффективно использовать данную структуру дискретизации при формировании изображений, насыщенных вертикально или горизонтально ориентированными составляющими периодического типа. Осуществим качественный анализ специфики характеристик спектра структуры типа рис. 13.3,b. При этом зададимся расстояниями от центра ячейки (см. рис. 13.3,a) до горизонтально и вертикально расположенных по осям 0x и 0y отсчётов на внешней окружности данной ячейки, как r = x0 = y0 = 1. С учётом результатов анализа спектров каждой из ячеек (см. рис. 13.3,b.v) получим нормированное выражение для спектра обобщённой ячейки дискретизации: F05 (ωx , ωy ) = F0 (fx , fy ) = F1 (fx , fy )F3 (fx , fy ) + F2 (fx , fy )F4 (fx , fy ) , F1 (0, 0)F3 (0, 0) + F2 (0, 0)F4 (0, 0) (13.41) где 1 [cos(2πfx x0 ) + cos(2πfy y0 ) + cos(2πfx · 0,7x0 − 6 − 2πfy · 0,7y0 ) + cos(2πfx · 0,7x0 + 2πfy · 0,7y0 )]+ + cos(2πfx · 0,29x0 − 2πfy · 0,29y0 ) + cos(2πfx · 0,29x0 + 2πfy · 0,29y0 ); 1 F2 (fx , fy ) = [cos(2πfx · 0,7x0 − 2πfy · 0,7y0 ) + 4 + cos(2πfx · 0,7x0 + 2πfy · 0,7y0 )] + cos(2πfx · 0,29x0 − 2πfy · 0,29y0 ) + + cos(2πfx · 0,29x0 + 2πfy · 0,29y0 ); F3 (fx , fy ) = cos(2πfx x0 − 2πfy y0 ); F4 (fx , fy ) = cos(2πfx x0 + 2πfy y0 ). F1 (fx , fy ) = Результат вычисления характеристики двумерного спектра обобщённой ячейки пространственной структуры дискретизации идеализи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 372 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 13.11. Характеристика двумерного спектра обобщённой ячейки структуры дискретизации рованного типа показан на рис. 13.11. Можно отметить относительно высокое содержание гармонических составляющих в структуре двумерного спектра такой обобщённой ячейки дискретизации, что объясняется существенной неравномерностью периода следования отсчётов по отличающимся направлениям пространства дискретизации. Последнее определяет не только указанное обогащение характеристики спектра обобщённой ячейки дискретизации гармоническими составляющими, но и значительное снижение уровня главных лепестков каждой из них. При этом имеет место изменение полярности лепестков в общей структуре спектра. Как было показано выше, изменение полярности гармоник спектра связано с чётностью числа (40) отсчётов, содержащихся в обобщённой ячейке структуры дискретизации. Увеличение числа отсчётов структуры дискретизации в пределах внутрикадрового пространства реализуется за счёт непрерывного заполнения всего внутрикадрового пространства совокупностью обобщённых ячеек. При этом имеет место кратное возрастание используемого числа отсчётов в заданном пространстве дискретизации с сопутствующим преобразованием параметров характеристики спектра их полной совокупности. На рис. 13.12,a, в частности, показаны расчётная характеристика двумерного спектра структуры неравномерной дискретизации типа рис. 13.3,b, которая содержит 640 отсчётов в пределах квадратной матрицы, и её сечения в горизонтальном и под углом 45◦ направлениях. Сопоставление результатов, представленных на рис. 13.11 и 13.12, свидетельствует о том, что увеличение числа отсчётов при неравномерной дискретизации отражается сужением главных лепестков
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 373 Двумерная расчётная характеристика спектра квадратной матрицы отсчётов неравномерной дискретизации (a); её сечения в горизонтальном (b) и диагональном (v) направлениях Ðèñ. 13.12. составляющих спектра с сохранением основных общего типа особенностей соответствующей расчётной функции. Сопоставление результатов выполненных расчётов с вычисленными выше характеристиками спектров структур равномерной дискретизации выявляет общее падение уровня лепестков гармоник спектра в случае неравномерной дискретизации, что приведёт к снижению вероятности возникновения и уровня нелинейных пространственных искажений муарового типа в реальных системах. Указанные искажения возникают в процессе формирования сигнала изображения из-за биений составляющих пространственного спектра видеоинформационного сигнала с гармониками спектра внутрикадровой структуры дискретизации и оказывают существенное негативное влияние на функциональные характеристики современных систем телевидения. Разработанная в данном разделе методика анализа, полученные
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 374 Часть V. Цифровое преобразование изображений в телевидении расчётные соотношения, результаты вычислений и выводы дают основу для реализации сопоставительного анализа и осуществления выбора структур разнородной дискретизации при проектировании современных систем цифрового телевидения различного назначения, обеспечивающих снижение уровня сопутствующих (процессу дискретизации) нелинейных и интегральных искажений исходной структуры сигналов передаваемых изображений. 13.4. Характеристики и параметры квазипериодической дискретизации видеоинформации в ограниченной многомерной зоне Простейший вариант идеализированной опорной функции квазипериодической дискретизации воздействий в ограниченной спектрально-пространственно-временной области описывается соотношением (13.1). В соответствии со структурой соотношения спектрально-пространственно-временной спектр данной функции дискретизации отражается произведением соответствующих функций ядер Дирихле (13.4). Выражениями (13.1) и (13.4) представлен вариант дискретизации с равномерным интервалом, что не всегда выполняется в реальных системах телевидения. В соответствующих случаях должна быть определена дискретизация с неравномерным шагом следования отсчетов. Анализ характеристик спектра более сложных спектральнопространственно-временных структур может быть реализован на основе использования опорной структуры, соответствующей соотношению (13.1) и функции преобразования, например, такого вида: d0 (x, y, t, λ) = = b ∑ c ∑ d ∑ (13.42) δ(x − xi − xj − xv )δ(y − yi − yj − yv )δ(t − Tj − Tv )δ(λ − λv ). v=1 j=2 i=1 В результате свертки функции преобразования с опорной структурой (соотношение (13.1)) получим dпо (x, y, t, λ) = = q ∑ p ∑ k ∑ n ∑ δ(x − µx1 )δ(y − ηy1 )δ(t − χT1 )δ(λ − φλ1 ) ⊗ φ=−q χ=−p µ=−k η=−n ⊗ b ∑ c ∑ d ∑ v=1 j=2 i=1 δ(x − xi − xj − xv )δ(y − yi − yj − yv )δ(t − Tj − Tv )δ(λ − λv ). (13.43)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 375 Различным вариациям структур дискретизации, используемых в современных системах телевидения, соответствуют частные случаи соотношения (13.43) в условиях конкретизации величин фиксированных параметров x1 , y1 , T1 , λ1 , xi , yi , xj , yj , Tj , λv , n, k, q, p и т.д. В частности, варианту xj ≡ yj ≡ 0 и dпо (x, y, t, λ) = = q ∑ p ∑ k ∑ n ∑ δ(x − µx1 )δ(y − ηy1 )δ(t − χT1 )δ(λ − φλ1 ) ⊗ φ=−q χ=−p µ=−k η=−n ⊗ b ∑ d ∑ δ(x − xi − xv )δ(y − yi − yv )δ(t − Tv )δ(λ − λv ) v=1 i=1 соответствует, например, циклическая дискретизация во времени с текущей частотой ωj = vω1 совокупности в спектральных отсчетах. Для соответствующих пространственных структур характерны относительные смещения в пространстве, величины которых определяются значениями параметров xv , yv . Значения параметра λv фиксируют при этом положение участка дискретизации в спектральной области. Следовательно, отсчеты, соответствующие различным спектральным зонам, могут в данном случае и не пересекаться в пространстве. Для общего соотношения (13.43) характерна цикличность дискретизации во времени с текущей частотой ωvj = bcω1 . Реальным при этом является вариант, когда ансамбли структур дискретизации в пространстве каждой из спектральных зон (т. е. при фиксации значения параметра v) являются идентичными, а отличия обусловливается лишь трансформациями порядка чередования составляющих указанных ансамблей во времени. В реальных системах телевидения форма отдельного отсчета в структуре дискретизации не является идеальной, т. е. не соответствует по виду δ-функции. Если H(x, y, t, λ) — ограничивающая функция, определяющая форму отдельного отсчета в структуре дискретизации, то учет неидеальности отдельного отсчета структуры обеспечивается при свертке ограничивающей функции с соотношением для структуры дискретизации идеализированного вида. Соответственно, выражение для реальной структуры дискретизации может быть представлено следующим образом: dr0 (x, y, λ, t) = dп0 (x, y, λ, t) ⊗ H(x, y, λ, t) = = d0 (x, y, λ, t) ⊗ dп (x, y, λ, t) ⊗ H(x, y, λ, t). (13.44) Согласно соотношению (13.44) идеализированная структура дискретизации определяет количество и закон распределения ограничи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 376 Часть V. Цифровое преобразование изображений в телевидении вающих функций в спектрально-пространственно-временной области. Четырехмерный спектр функции dr0 (x, y, λ, t) отражается произведением спектров свертываемых в соотношении (13.44) функций d0 (x, y, λ, t), dп (x, y, λ, t) и H(x, y, λ, t). Обозначим Д0 (ωx , ωy , ω, ωλ ) — спектр опорной структуры; Дп (ωx , ωy , ω, ωλ ) — спектр функции преобразования и H(ωx , ωy , ω, ωλ ) — спектр ограничивающей функции. Тогда спектр функции запишем в виде произведения: Дr0 (ωx , ωy , ω, ωλ ) = Д0 (ωx , ωy , ω, ωλ )Дп (ωx , ωy , ω, ωλ )H(ωx , ωy , ω, ωλ ). (13.45) Для структур дискретизации различных типов составляющие выражения (13.45) имеют соответствующие частные значения. При анализе особенностей составляющих выражения (13.45) и вида общего спектра Дr0 (ωx , ωy , ω, ωλ ) с успехом могут быть использованы принципы преобразований, разработанные в предшествующих разделах для структур дискретизации воздействий в пространственной области. При этом необходимо учитывать следующее: 1. Опорная структура дискретизации определяет дискретизацию воздействия в условиях симметрии по отношению к началу координат в пространстве дискретизации. 2. Функция (структура ячейки) преобразования может выполнять преобразование опорной структуры к заданной форме (масштабу) и учесть общее смещение преобразованной структуры дискретизации в соответствующую зону спектрально-пространственно-временной области. До сих пор рассматривались квазипериодические структуры дискретизации воздействий с постоянными параметрами в многомерной области. Однако, если учитывать статическую анизотропию характеристик входного воздействия, возникающую, например, в условиях зависимости коэффициентов передачи элементов ТВ системы от координат в спектрально-пространственно-временной области, может возникать целесообразность использования структур дискретизации с соответствующими масштабными текущими изменениями параметров реальной структуры. Коэффициент передачи оптической системы (ОС) может изменяться в ТВ системах в зависимости от координат анализируемых точек воздействия. Из-за действия указанной зависимости на периферийных участках анализируемого пространства снижаются амплитуда и протяженность пространственного спектра воздействия. Снижение протяженности спектра воздействия на краях анализируемого пространства можно учитывать в ТВ системе сопутствующим увеличением периода в структуре дискретизации. Такое координатно-зависимое преобразование периода дискретизации эквивалентно масштабно-пространст-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 377 венным преобразованиям структуры дискретизации. Аналогия с результатами, полученными при анализе симметричных масштабно-пространственных изменений изображения воздействия в ОС позволяет сделать вывод о том, что в условиях интегрального восстановления дискретизированного воздействия следует ожидать возникновения сопутствующих (масштабно-пространственным преобразованиям) амплитудных искажений воздействия на периферийных участках пространства. Это приведет к резкому падению интенсивности изображения на краях растра. Соответственно, перед процессом интегрального восстановления необходимо в данном случае осуществить компенсацию амплитудных искажений, вызванных уменьшением по периферии пространства изображения коэффициента передачи ОС и частоты дискретизации. Одним из путей реализации подобной компенсации является путь соответствующего изменения формы (протяженности) и амплитуды отсчетов по пространству дискретизации. За счет увеличения протяженности отсчетов в пределах зоны дискретизации удается при этом учесть падение протяженности пространственного спектра воздействия по периферии пространства анализа, связанное с действием искажений коэффициента передачи в ОС. Таким образом, форма (протяженность) отсчета в многомерной структуре дискретизации должна определяться с учетом особенностей спектра входного воздействия. Форма отсчета структуры влияет и на выбор таких важных параметров многомерной структуры дискретизации, как частоты дискретизации по направлениям. При этом требование теоремы Котельникова должно выполняться по всем отдельным направлениям (0x, 0y, 0t, 0λ) многомерного пространства с учётом возможной анизотропии в протяженности спектра исходного многомерного видеоинформационнного воздействия и всех ограничивающих интегральных преобразований при формировании сигнала ТВ изображения (время накопления потенциального рельефа за время кадра, апертурные искажения, действие светофильтров и др.). Дискретизация, например, в оптическом звене ТВ системы может проводиться с предварительной коррекцией спектра воздействия только в условиях работы с квазимонохроматическими воздействиями. Наряду с этим, возможен вариант посткоррекции результата преобразования воздействия в сигнал. Однако, для данного варианта свойственно заметное ухудшение общего соотношения сигнал/шум, которое вызывается вынужденным весовым перераспределением относительной энергии сигнала в зону спектра с пониженным отношением сигнала к шуму. Из-за этого, в конечном счете, уменьшается общее соотношение сигнала и шума.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 378 Часть V. Цифровое преобразование изображений в телевидении Актуальным в связи с этим остается вопрос выбора параметров квазипериодической последовательности отсчетов, обеспечивающих допустимый уровень искажений спектра воздействия при дискретизации. К параметрам такого рода, в первую очередь, следует отнести протяженность (объём) отдельного отсчета и частоту следования отсчетов в ограниченной многомерной зоне. Специфика построения и выбора частоты структуры дискретизации определяется статическими особенностями спектра ансамбля воздействий. Для «естественных» ансамблей воздействий характерна анизотропия усредненных спектральных интенсивностей, которая обусловливает более медленное убывание уровня характеристик вдоль осей ωx и ωy спектральной плоскости, чем в направлении 45◦ под углом к указанным осям. Ясно, что с этим хорошо сочетается вариант строчной дискретизации, который принят в вещательном телевидении. При дискретизации данного вида уменьшается вероятность появления в ансамбле входных воздействий реализаций, имеющих, например, периодическую структуру в направлениях под углами горизонтальной оси растра ∼ 53◦ . Соответственно, снижается и вероятность возникновения интенсивных муаровых помех, обусловленных дискретизацией. Аналогичным преимуществом для систем вещательного телевидения обладают структуры дискретизации ортогонального типа. Если Фс (ωx , ωy ) — усредненный пространственный спектр ансамбля воздействий, то выражение Sс (ωx , ωy ) = 1 |Фс (ωx , ωy )|2 , Sиз где Sиз = SP — площадь функции, ограничивающей изображение, отражает характеристику усредненной спектральной интенсивности. В [75] представлена аппроксимация такой характеристики, полученная экспериментальным путем для ансамблей «естественных» воздействий: Sс (ωx , ωy ) = (a2 + 2a2 E с 2π 2 + E с δ(ωx )δ(ωy ). 2 + ωy )Sиз Sиз ωx2 )(a2 Здесь a — параметр, определяемый характером и размерами изображений, составляющих ансамбль; E с — средняя энергия указанных изображений. С позиции вопроса выбора частоты следования отсчетов в структуре дискретизации основной интерес представляет первая составляющая выражения для Sс (ωx , ωy ), которая описывает поведение характеристики Sс (ωx , ωy ) при ωx > 0 и ωy > 0: Sс1 (ωx , ωy ) = (a2 + 2a2 E с . + ωy2 )Sиз ωx2 )(a2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 379 Анализ |grad Sc1 (ωx , ωy )|2 свидетельствует о том, что наименьшие значения функции |grad Sc1 (ωx , ωy )| имеют место при ωx → 0 или ωy → 0, т. е. в сечениях функции |grad Sc1 (ωx , ωy )| плоскостями Sc1 0ωx и Sc1 0ωy . Целесообразно, соответственно, величину частоты следования отсчетов в структуре дискретизации выбрать по виду характеристики в указанных сечениях, так как выбранное значение частоты следования отсчетов будет удовлетворять при этом предельным параметрам характеристики Sc1 (ωx , ωy ). Основная информативная структура видеоинформационного воздействия не должна подвергаться искажениям при дискретизации в многомерном пространстве. В этом отношении целесообразно увеличить частоту дискретизации по всем его направлениям. С другой стороны, увеличение частоты дискретизации связано с расширением спектра дискретизированного воздействия и соответствующих составляющих одномерного цифрового сигнала изображения. Установление конкретной величины частоты дискретизации связано в реальных случаях с выявлением граничных частот рабочего диапазона спектра сигнала, за пределами которого величина остаточной энергии сигнала пренебрежимо мала по сравнению с основной энергией, локализованной в рабочем диапазоне частот. Если, например, по направлению 0ωx конкретизирована ωгрx = = ωlim — граничная частота рабочего диапазона, то коэффициент ∫ ωlim Sc10 (ωx , 0) dωx Ep = ∫0∞ η(ωlim ) = Eoc Sc10 (ωx , 0) dωx ω lim отражает степень концентрации энергии (Ep ) видеоинформационного сигнала в пределах рабочего диапазона частот, а обратное значение этого коэффициента ξ = 1/η определяет максимальный относительный уровень энергии (Eoc ) составляющих побочных спектров, которые проникают в рабочий диапазон дискретизирующего воздействия. Введем также коэффициент для оценки относительной энергии в пределах и за пределами рабочего диапазона, отличающийся использованием для нормирования полной энергии «среднего сигнала»: ∫∞ ∫ ωlim Sc10 (ωx , 0) dωx S (ω , 0) dω ω c x x 10 ; p(ωlim ) = ∫ lim . K(ωlim ) = ∫0 ∞ ∞ Sc10 (ωx , 0) dωx Sc10 (ωx , 0) dωx 0 0 Можно заметить, что η(ωгр ) = K(ωгр )/P (ωгр ). Исследование характеристик и особенностей приемника дискретизированных сообщений позволяют зафиксировать, например, интегральный коэффициент K(ωгр ) = const. Тогда решением полученного уравнения выявляется необходимая величина по данному ωгр направлению видеоинформационного пространства.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 380 Часть V. Цифровое преобразование изображений в телевидении Результаты вычислительной оценки функции использования относительной энергии сигнала изображения по направлению 0ωx (с учётом симметрии и по 0ωy ), полученной с учётом первой составляющей Sc1 (ωx , ωy ) выражения для усреднённой спектральÐèñ. 13.13. Функция использования ной интенсивности Sc (ωx , ωy ) поотносительной энергии сигнала изобраказаны на рис. 13.13. жения В соответствии с результатами расчетов, представленных графиком на рис. 13.13, коэффициент использования относительной энергии в пределах заданного расчетом диапазона K(ωx /a) имеет относительно высокую динамику изменения уровня в диапазоне отношений граничной частоты усреднённого спектра к его параметру ωx /a 6 4. При выборе, в частности, значения ωx /a = 3,25 (соответственно, при ωlim = 3,25a и частоте дискретизации несколько превышающей 2ωlim ) коэффициент использования энергии сигнала изображения K(ωx /a) = 0,809. В случае выбора коэффициента K(ωx /a) = 0,99 существенно снижается уровень энергии побочных составляющих дискретизации, проникающих в рабочий диапазон частот видеоинформационнного сигнала, но, наряду с этим, необходимая частота дискретизации возрастает в 20 раз, что в большинстве вариантов реализации оборудования совершенно не приемлемо. К сожалению, представленный пример анализа имеет частный характер и полученный результат может использоваться лишь в случае идеализированных характеристик ограничения реальной протяжённости пространственного спектра видеоинформации в преобразователях «свет-сигнал». При разработке конкретных систем телевидения следует не только учитывать указанные усреднённые величины ограничения протяженности многомерного спектра сигнала изображений по всем направлениям видеоинформационного пространства, но и осуществить исследования диапазона и вероятностных характеристик возникновения в текущем времени сообщений с предельной протяженностью, существенно превышающей указанные средние величины. При использовании разнородных структур многомерной дискретизации следует также определять для каждого из вариантов по характеристикам из спектра направления ухудшения фильтрующего эффекта. Как было, например, показано выше, функции ядер Дирихле, отражающие спектр структур дискретизации ортогонального типа, могут обладать по отношению к функциям спектра воздействий, удовлетворяющим условиям Дини, фильтрующим свойством δ-функции,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 13. Анализ структур дискретизации ТВ изображений 381 которое проявляется в процессе дискретизации сверткой указанных функций в пределах от −π до π (от 0 до π). Если, например, x1 — период дискретизации в горизонтальном направлении, то, следовательно, по оси 0X возможна в таком случае дискретизация без искажений основного спектра, когда протяженность спектра воздействия не превышает частоты ωx = 2π/(2x1 ). По некоторым направлениям спектральной области фильтрующая функция отражается произведением функций ядер Дирихле. В сопряженной области такому преобразованию вида фильтрующей функции соответствует свертка соответствующих функций, ограничивающих в спектральной области зоны, в пределах которой возможна дискретизация без искажений основного спектра входного воздействия. При неизменной протяженности спектра входного воздействия по данным направлениям должна быть увеличена зона локализации фильтрующей функции отдельного отсчета спектра дискретизирующей структуры. При этом устраняется возможность необратимых пересечений основного и побочного спектров дискретизированного воздействия в пределах указанных линий. И в то же время в этой зоне сохраняется возможность возникновений интегральных искажений основного спектра, обусловленных усредняющим (в процессе свертки со спектром воздействия) действием однополярной фильтрующей функции. В реальных системах телевидения характеристика усредненной спектральной интенсивности воздействия может иметь различную структуру, что может обусловливаться не только параметрами спектров воздействия, но и характеристиками сред, через которые ведется анализ воздействий. В сечениях спектра такие характеристики могут аппроксимироваться экспоненциальными и гауссовскими функциями или последовательностями таких функций. Решение задачи выбора частоты дискретизации и параметров соответствующей структуры для различных конкретных вариантов функций усредненной и предельной спектральной интенсивности должно осуществляться с контролем анизотропности сопряженных характеристик (спектральной и импульсной пространственной — ИПХ) и выполнения установленных требований по всем направлениям в пространстве анализа. Контрольные вопросы 1. Чем отличается квазипериодическая дискретизация от периодической? 2. Что такое одномерная и многомерная дискретизация? Приведите соответствующие математические выражения. 3. Определите функцию ядра Дирихле и поясните фильтрующее свойство данной функции.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 382 Часть V. Цифровое преобразование изображений в телевидении 4. Конкретизируйте варианты внутрикадровой дискретизации видеоинформационных сообщений 5. Обоснуйте выбор ортогональной структуры для внутрикадровой дискретизации телевизионных изображений. 6. Периодической или не периодической, одномерной или двумерной является функция спектра ортогональной структуры дискретизации? Приведите соответствующие математические выражения. 7. Поясните принципы выбора, построения и согласования структур дискретизации сигналов телевизионных изображений с особенностями спектра последних. 8. Изотропный или анизотропный характер имеет функция спектра ортогональной структуры дискретизации? Поясните специфику возникновения в данном случае нелинейных помех дискретизации. 9. Как влияет чётность числа отсчётов на спектр структуры дискретизации? 10. Чем отличается спектр идеализированной структуры дискретизации от спектра структуры с увеличением протяжённости отсчётов в области низкочастотных и высокочастотных его гармоник? 11. Сравните характеристики спектра равномерной и неравномерной структур вутрикадровой дискретизации. 12. Укажите назначение опорной структуры и функции преобразования (ячейки) при построении и анализе характеристик (параметров) спектра сложных в многомерном видеоинформационном пространстве структур дискретизации сигналов телевизионных изображений. 13. Покажите особенности выбора параметров структур дискретизации по направлениям видеоинформационного пространства с применением функции использования относительной энергии сигнала телевизионного изображения. Приведите соответствующиие математические выражения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 14 ОСНОВНЫЕ ЭЛЕМЕНТЫ ЦИФРОВОГО ПРЕОБРАЗОВАНИЯ СИГНАЛОВ ИЗОБРАЖЕНИЯ В АППАРАТУРЕ СЖАТИЯ ЦИФРОВОГО ПОТОКА Применение цифрового телевидения (ЦТВ) создает основу для качественного изменения принципов функционирования и обеспечивает резкое улучшение соответствующих характеристик отдельных элементов телевизионной (ТВ) аппаратуры и систем телевидения (СT) в целом. Одним из вариантов такого изменения является разработка универсальных систем ЦТВ (СЦТВ), интегрирующих в своей структуре функциональные возможности одной, двух и более систем аналогового телевидения различного назначения. Другим перспективным направлением развития является реализация СЦТВ, обеспечивающих при функционировании автоматическую адаптационную перестройку сквозных характеристик (параметров) блоков и СЦТВ в зависимости от условий использования, особенностей видеоинформации, канала связи и других факторов, которые могут варьироваться при эксплуатации. На передающей стороне канала связи ТВ сигнал (ТВС) изображений в СЦТВ переводят в цифровой вид, подвергают обработке, преобразованиям, сжатию его спектра и передают, чаще всего, в виде аналогового радиосигнала по каналу связи. Принятый радиосигнал и, соответственно, цифровой ТВС (ЦТВС) на приемной стороне канала связи подвергают обработке и обратным преобразованиям. Восстановленный ЦТВС из цифровой переводят в аналоговую форму и воспроизводят в виде ТВ изображений. Указанная здесь последовательность операций характерна для СЦТВ с визуальным контролем переданной видеоинформации. В СЦТВ, где контроль видеоинформации реализуется на базе использования ЭВМ, естественно, отпадает необходимость перевода ЦСТВ в аналоговую форму. Быстрое совершенствование технологии и характеристик цифровой интегральной схемотехники, ее постоянное удешевление способствует внедрению методов обработки ТВС изображений, разработанных для контроля видеоинформации в ЭВМ, в СЦТВ с визуальным контролем видеоинформации. Наблюдается и обратная тенденция, примером которой может служить, в частности, использование цветоразностных сигналов в СЦТ с «машинным» контролем видеоин-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 384 Часть V. Цифровое преобразование изображений в телевидении формации. В перспективе следует ожидать увеличения степени сближения элементов и характеристик СЦТ с визуальным и «машинным» контролем видеоинформации. 14.1. Применение элементов цифровой телевизионной аппаратуры Увеличение числа функциональных блоков систем телевидения, реализуемых на базе цифровой схемотехники, сопряжено с тенденцией уменьшения энергопотребления и стоимости цифровых ИС. В настоящее время цифровая аппаратура активно используется для решения определенных задач обработки и формирования сигналов изображений на передающей стороне канала связи. Это, например, кодирование ТВС, коррекция, противошумовая обработка, синтез и реставрация телевизионных изображений, создание спецэффектов и др. Активно развивается цифровая видеозапись, преимуществом которой является увеличение числа возможных последовательных перезаписей видеоинформации и упрощение электронного монтажа программ. Особое место занимает ЦТВ в решении вопроса сжатия полосы частот ТВС программ. Другим направлением является совершенствование функциональных характеристик ТВ приемников. Можно, в частности, отметить использование цифровой обработки ТВС для параллельного воспроизведения видеоинформации программ на одном ТВ экране с соответственно уменьшенным визуальным качеством изображений, реализации программируемого управления работой ТВ приемника и автоматической адаптационной перестройкой параметров воспроизводимых изображений в зависимости от условий передачи и воспроизведения [81–86]. 14.2. Формирование цифрового телевизионного сигнала Формирование ЦТВС осуществляют с применением специальных интегральных схем аналого-цифрового преобразования (ИС АЦП), на выходе которых исходный ТВС аналогового типа преобразуют в параллельный, например, восьмиразрядный двоичный код. При этом максимально возможная частота следования отсчётов в каждом из разрядов кода определяется частотой дискретизации ТВС. Соответственно, исходный ТВС периодически с частотой дискретизации Fд заменяют в пределах последовательности строк и кадров исходного ТВС мгновенными отсчётами разрядов двоичного кода. Уровень ТВС в момент отсчёта представлен в таком случае числом
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 385 следующего вида: x = . . . + a8 · 27 + a7 · 26 + a6 · 25 + a5 · 24 + a4 · 23 + a3 · 22 + a2 · 21 + a1 · 20 . При этом ai отражают значения разрядов двоичного кода. Число значений двоичного кода определяется числом разрядов параллельного двоичного кода. В случае, когда старший разряд определяется наличием a8 , возможное число значений двоичного кода определяется величиной N = . . . 1 · 27 + 1 · 26 + 1 · 25 + 1 · 24 + 1 · 23 + 1 · 22 + 1 · 21 + 1 · 20 = 255, т. е. соответствует коду 11111111 числа N = 255. 14.2.1. Основные характеристики и параметры цифрового кодирования видеосигналов В 1982 г. Международный консультативный комитет по радио (МККР) принял рекомендацию по цифровому кодированию видеосигналов, в число последовательных функциональных операций которого, как указывалось выше, входят: • дискретизация — приближенное периодическое представление видеосигнала во времени фиксированным (в единицу времени) количеством мгновенных отсчётов (пикселей) или выборок, следующих соответственно с постоянной частотой дискретизации; • квантование — приближенное представление амплитуд каждого из полученных отсчётов конкретным числом дискретных шагов квантования, выбранным в пределах заданного диапазона (максимально допустимого числа) шагов квантования; • собственно преобразование результатов дискретизации и квантования в двоичный параллельный код, число и изменения значений разрядов которого позволяют последовательно во времени, с частотой дискретизации, отражать указанное приближенное представление уровней мгновенных отсчётов текущего видеосигнала [84]. Выбор частоты дискретизации. В базовом стандарте МККР были выбраны частоты дискретизации (Fд ) сигнала яркости и каждого из двух цветоразностных сигналов в пределах прямого хода строк соответственно 13,5 и 6,75 МГц, т. е. указанные частоты находятся в соотношении 4:2:2 (на четыре пикселя текущего сигнала яркости приходится в данном случае по два пикселя каждого цветоразностного сигнала). Последнее соотношение имеет место в условиях реализации раздельного (компонентного) кодирования, когда АЦП подвергают разделённые сигнал яркости и цветоразностные сигналы с последующим их мультиплексированием в цифровом виде. Другим возможным вариантом является совместное (композитное) кодирование,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 386 Часть V. Цифровое преобразование изображений в телевидении для которого характерно АЦП полных сигналов систем вещательного цветного телевидения (ЦT). Как известно, значения полос частот сигнала яркости составляют: 4,2 (стандарты M, N), 5 (стандарты B, G, H), 5,5 (стандарт I) и 6,0 МГц (стандарты D, K, K1, L). Полоса частот сигнала определяет максимально возможное значение частоты дискретизации и требования к быстродействию АЦП. Выбранная МККР частота дискретизации соответствует теореме Котельникова, т. е. в данном случае для всех указанных выше стандартов частота дискретизации более чем в два раза превосходит верхние граничные частоты (Fh ) преобразуемых в цифровой вид ТВС. Отношение верхней граничной частоты Fh = 6 МГц (стандарты D, K, K1, L) и частоты дискретизации Fд = 13,5 МГц равно 2,25. Данное отношение определяет основные требования к характеристикам фильтра нижних частот (ФНЧ), ограничивающего протяжённость спектра видеосигнала перед его дискретизацией с частотой Fд = 13,5 МГц. Дискретизация ТВ сигнала, которой соответствует умножение последнего на функцию (тактовый сигнал — ТС) дискретизации, определяет модуляцию каждой из гармоник спектра ТС исходным ТВС. При этом имеет место резкое усложнение структуры результирующего спектра, в котором наряду с основным спектром ТВС (зафиксирован в начале координат, т. е. в точке с частотой F = 0 в виде верхней и нижней боковых полос) появляются так называемые побочные спектры. Побочные спектры отличаются от основного смещением в спектральной области на частоту Fд = 13,5 МГц и её гармоники более высокого порядка. Амплитуды побочных спектров обычно падают по отношению к основному с увеличением номера гармоники. Степень такого падения тем выше, чем большим является протяжённость мгновенной выборки и усреднение (в пределах протяжённости выборки) ТВС в процессе периодической дискретизации с частотой Fд . Требования к фильтру нижних частот на входе схемы АЦП. Указанные смежные основной и побочные спектры дискретизированного ТВС могут пересекаться на оси частот, если перед реализацией АЦП не ограничить протяжённость исходного спектра ТВС заданной граничной частотой Fh и обеспечить этим выполнение теоремы Котельникова. Однако реальные фильтры нижних частот (ФНЧ) могут не осуществлять необходимую степень подавления составляющих спектра ТВС, превышающих по частоте установленное значение Fh . Возникающие при этом в реальной аппаратуре пересечения спектров проявляются муаровыми помехами на высокочастотной (в горизонтальном направлении по растру) структуре восстановленного ТВ изображения. Уровень указанных нелинейных помех в основном определяется отношением площадей основного и наложенного на него в полосе пропус-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 387 кания (прозрачности) ФНЧ остаточных составляющих от побочного лепестка спектра, смежного основному. Характеристика коэффициента передачи ФНЧ должна обеспечить граничное значение Fh с минимальным затуханием сигнала в полосе прозрачности и с подавлением высокочастотных составляющих (ВЧ) ТВС в полосе задержания (непрозрачности) по отношению к полосе пропускания (прозрачности) ФНЧ на ∼20 дБ в диапазоне частот от Fс = Fh − 0,04Fh до 0,5Fд и на ∼20 дБ от 0,5Fд до Fq = Fд − Fh + 0,04Fh , т. е. для стандартов с Fh = 6, 0 МГц полоса прозрачности завершается частотой Fс = 5,75 МГц, на частоте 6,75 МГц затухание −20 дБ, а полоса задержания начинается с частоты Fq = 7,75 МГц, затухание на которой −40 дБ [84]. Соответственно, этому в переходном участке амплитудно-частотной характеристики (АЧХ) ФНЧ от частоты 5,75 МГц до частоты 7,75 МГц затухание составляющих спектра исходного ТВС возрастает на −40 дБ. Если считать, что фазо-частотная характеристика (ФЧХ) φ(ω) ФНЧ линейна, то ФНЧ не вносит фазовых искажений, а лишь ограничивает протяженность спектра в области ВЧ и задерживает все составляющие спектра и, следовательно, и ТВС в целом на время t = τз , которое для составляющей любой фиксированной частоты ω = ω0 в спектре ТВС определяется отношением уровня φ(ω0 ) к ω0 . При линейной ФЧХ ФНЧ время задержки на фиксированной частоте совпадает с групповым временем распространения видеочастот спектра ТВС τгз , т. е. может определяться и производной dφ(ω)/dω. Однако линейность ФЧХ реальных ФНЧ аналогового типа, например на LCэлементах, зависит от крутизны спада АЧХ фильтра в переходном участке от полосы прозрачности до полосы задержания. Крутизна спада увеличивается с приближением отношения v = Fq /Fс к единице. В рассматриваемом случае (Fq = 7,75 МГц, Fс = 5,75 МГц) параметр v ∼ 1,348 относительно невелик, что существенно усложняет структуру ФНЧ при АЦП ТВС. Для получения необходимой крутизны спада АЧХ ФНЧ приходится увеличивать порядок ФНЧ. Это приводит к увеличению нелинейности ФЧХ фильтра, которая проявляется относительным возрастанием крутизны последней в области ВЧ. Обычно начало изменения крутизны ФЧХ в сторону увеличения в реальных ФНЧ сопряжено с частотой Fp ∼ 0,6Fс = 3,45 МГц. Соответственно, задержка ВЧ составляющих ТВС, расположенных в диапазоне от частоты Fp = 3,45 МГц до Fq = 7,75 МГц, превышает в ФНЧ задержку НЧ составляющих ТВС, расположенных в диапазоне от 50 Гц до Fp = 3,45 МГц. В связи с этим имеет место относительное рассовмещение во времени НЧ и ВЧ составляющих ТВС, расположенных в полосе прозрачности ФНЧ. Возникают сопутствующие асимметричные искажения (оконтуривания, многоконтурность)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 388 Часть V. Цифровое преобразование изображений в телевидении резких перепадов яркости и тонкой (в горизонтальном направлении по растру) структуры изображений. При этом частично проявляется эффект детектирования и интегрирования смещенных по строке ВЧ составляющих зрительной системой наблюдателя, что приводит к ухудшению горизонтальной четкости ТВ изображений при их визуальном восприятии, т. е., в конечном счете, фазовые искажения в ФНЧ отражаются как бы сокращением эффективной полосы частот ТВС. Поэтому для Fh = 6,0 МГц и частот дискретизации (Fд ) сигнала яркости и каждого из двух цветоразностных сигналов соответственно 13,5 и 6,75 МГц важное значение имеет вопрос линеаризации ФЧХ реальных ФНЧ. Для этого обычно используют фазовый корректор, который не относится к цепям минимально-фазового типа, т. е. не имеет однозначной связи между формой АЧХ и ФЧХ, когда любые изменения первой из характеристик жестко сопряжены с изменениями второй и наоборот. Если KF (jω) = |KF (jω)| exp(−jφF (ω)) = KF (ω) exp(−jφF (ω)); KC (jω) = |KC (jω)| exp(−jφC (ω)) = KC (ω) exp(−jφC (ω)) — коэффициенты передачи ФНЧ и фазового корректора соответственно, где KF (ω), φF (ω) — АЧХ и ФЧХ ФНЧ, KC (ω), φC (ω) — АЧХ и ФЧХ фазового корректора, то общий коэффициент передачи Kо (jω) последовательно включенных ФНЧ и фазового корректора определяется произведением: Kо (jω) = Kо (ω) exp(−jφO (ω)) = KF (jω)KC (jω) = = KF (ω)KC (ω) exp(−jφF (ω) − jφC (ω)). Здесь Kо (ω), φо (ω) — общие АЧХ и ФЧХ последовательно включенных ФНЧ и фазового корректора соответственно. Из соотношения для Kо (jω) вытекают требования к АЧХ и ФНЧ фазового корректора. В частности, фазовый корректор не должен практически влиять на форму общей АЧХ в полосе прозрачности, а также уменьшать крутизну спада общей АЧХ в переходном участке и затухание в полосе задержания по отношению к соответствующим параметрам ФНЧ. Следовательно, в диапазоне от 50 Гц до Fh = 6,0 МГц характеристика KC (ω) = 1,0 и далее, т. е. при F > 6,0 МГц, допускается спад уровня АЧХ фазового корректора. С другой стороны должно выполняться условие φо (ω) = φF (ω) + φC (ω) = τзо ω, где τзо — задержка, внесенная в исходный ТВС последовательно включенными ФНЧ и фазовым корректором. При этом τзо не зависит от частоты и не возникает относительных рассовмещений во времени
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 389 НЧ и ВЧ составляющих ТВС в полосе прозрачности ФНЧ. Однако такой вариант возможен лишь в условиях, когда нелинейности характеристик φF (ω) и φC (ω) имеют строго обратный характер. Обеспечить такое требование на практике достаточно сложно. В реальных случаях возникают нарушения взаимной компенсации нелинейностей характеристик φF (ω) и φC (ω), обусловленные старением радиоэлементов ФНЧ и фазового корректора. С другой стороны, нельзя допускать и снижения затухания в полосе задержания последовательно включенных ФНЧ и фазового корректора, так как при этом возникают наложения и биения структуры смежных, основного и побочного спектров. В конечном счете, это приводит к возникновению нелинейных, муарового типа, искажений восстановленного ТВС. Увеличение частоты дискретизации. Формирующий ФНЧ на входе АЦП упрощается с увеличением частоты дискретизации и, соответственно, параметра v = Fq /Fс . При этом снижается крутизна спада АЧХ и порядок ФНЧ, увеличивается, соответственно, линейность ФЧХ ФНЧ, существенно упрощается реализация ограничения спектра входного аналогового ТВС с требуемой степенью подавления ВЧ составляющих его спектра, проникающих в спектр сигнала, полученного в результате выполнения операций преобразования. Недостаточное подавление указанных составляющих, как уже отмечалось, увеличивает «шумы преобразования», проявляющиеся муаровыми помехами на высокочастотной, в горизонтальном направлении, структуре восстановленного ТВ изображения. Однако в случае выбора увеличенной частоты дискретизации (Fд ) спектр преобразованного сигнала смещается в область высоких частот. За счет этого увеличивается взаимное влияние высокочастотной структуры различных рабочих сигналов, энергопотребление. Возрастают требования к быстродействию функциональных элементов, усложняется реализация последних. Поэтому выбор Fд должен осуществляться в каждом конкретном случае с учетом всех факторов. И все же наиболее перспективными являются варианты реализации АЦП с использованием цифровых фильтров, известным преимуществом которых является отсутствие фазовых искажений. При этом резко увеличивают частоту исходной дискретизации АЦП. Преобразованный сигнал на выходе АЦП подвергают эффективной цифровой фильтрации и отфильтрованный таким образом сигнал преобразовывают в цифровой сигнал с более низкой, например стандартной, частотой (13,5 или 6,75 МГц) дискретизации. Выбор числа уровней квантования. Разрядность АЦП определяется как b = log2 N . Значение b округляется до целого числа. По существу при АЦП реализуют ступенчатую аппроксимацию сигнала изображения. При этом имеет место ступенчатое отраже-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 390 Часть V. Цифровое преобразование изображений в телевидении ние и слабых, и резких, в пространстве кадра, изменений, например яркости в структуре изображений. В первом случае протяженность в пространстве кадра смежных ступеней аппроксимации возрастает. Улучшаются, соответственно, условия для относительного восприятия зрительной системой наблюдателя разности в уровнях и конфигурации границы (так называемых «ложных оконтуриваний») между указанными смежными ступенями аппроксимации, что связано с увеличением пороговой чувствительности зрительной системы при визуальном относительном контроле смежных полей большой протяженности. При этом глаз человека воспринимает границы перепадов уровня примерно в 1...0,5 %. Следовательно, надежное подавление заметности элементов ступенчатой аппроксимации возможно лишь при выборе относительного уровня ступеней (уровня квантования) примерно в 0,5...0,25 %. Согласно последнему, число уровней квантования должно быть выбрано в диапазоне ∼200...400. Отсюда число разрядов b > 8, и, следовательно, число уровней квантования N > 255. Соответственно, для передачи используются двоичные числа в диапазоне от 00000000 до 11111111. Согласно рекомендации МККР уровню черного ТВС яркости при этом соответствует 16 (двоичное число — 00010000). Оставшиеся свободными участки полной шкалы квантования обеспечивают резерв защиты от перегрузок при изменениях (колебаниях) уровня ТВС яркости (по отношению к номинальному) на входе АЦП. При этом из-за большей заметности нелинейных искажений на белом по отношению к области черного резерв по защите уровня белого больше, чем резерв по защите уровня черного. ′ В отличие от ТВС яркости цветоразностные сигналы ER−Y и ′ EB−Y являются симметричными по отношению к нулевому уровню, но имеют разную амплитуду (±0,701 и ±0,886 соответственно). Перед АЦП эти сигналы подвергают компрессии (размах и того и другого сигналов приводят к эквивалентному значению ±0,5) и преобразуют к однополярному виду за счет введения соответствующей постоянной составляющей. Резерв при АЦП этих сигналов по 16 уровней квантования сверху и снизу. Следовательно, нулю каждого цветоразностного ТВС соответствует 128 уровней квантования, максимальной амплитуде — 240, минимальной — 16 [84]. Скорость передачи двоичных символов цифрового сигнала. Данный параметр определяется произведением частоты дискретизации при АЦП и числа разрядов. Минимальные значения частоты дискретизации (Fд ) сигнала яркости и каждого из двух цветоразностных сигналов 13,5 и 6,75 МГц соответственно, а числа разрядов b = 8. Тогда скорость передачи двоичных символов цифрового сигнала яркости SY = Fд b = 13,5 · 8 = 108 Мбит/с, а каждого из цветораз-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 391 ностных сигналов SR−Y = SB−Y = 6,75 · 8 = 54 Мбит/с. Общая скорость передачи цифровых сигналов яркости и цветности соответственно определяется суммой: S0 = SY + SR−Y + SB−Y = (108 + 54 + 54) Мбит/с = 216 Мбит/с. Отсюда находим объём двоичных символов, необходимый, например, для передачи (запоминания) строки ТВС в случае, когда число строк в кадре Z = 625, частота кадров Fк = 25 Гц, частота строк FS = = ZFк = 15625 Гц и TS = 64·10−6 с — протяжённость строки сигнала яркости. При этом искомый объём OS определяется произведением: OS = SY TS = (108 · 106 ) бит/с × 64 · 10−6 с = 6912 бит = 6,91 кбит. Число отсчётов на длительность строки задаётся при этом отношением NS = OS /b = 6912/8 = 864. Аналогичным образом для варианта Z = 525, Fк = 29,67 Гц, FS = 15734,25 Гц и TS = 63,555 · 10−6 с (NTSC) OS = SY TS = (108·106 ) бит/с·63,555·10−6 с = 6864 бит = 6,864 кбит; NS = OS /b = 6864/8 = 858. 14.2.2. Характеристики и параметры современных схем АЦП Зависимость между значениями входного аналогового напряжения (U ) и выходного кода αi называется характеристикой преобразования (ХП) АЦП [78, 81–84]. Под напряжением межкодового перехода ХП понимается такое входное аналоговое напряжение, статические вероятности преобразования которого в смежные значения выходного кода равны. Для идеального АЦП уровни межкодовых напряжений Ui соответствуют дискретным значениям опорных напряжений, формируемых соответствующим делителем АЦП. Разность смежных значений уровня межкодовых переходов определяет шаг квантования АЦП. Идеальный вариант ХП представлен графиком 1 на рис. 14.1. Напряжение первого межкодового перехода Ui отстоит от опорного напряжения Uref1 на величину, равную половине шага квантования ХП. Напряжение последнего межкодового перехода Ui+3 отличается от опорного напряжения Uref2 на такую же величину. Реальная ХП АЦП может значительно отличаться по виду от идеальной, представленной на рис. 14.1. Степень несоответствия конкретизируется статическими точностными параметрами АЦП. К таким параметрам относят следующие [83]:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 392 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 14.1. Характеристика преобразования (ХП) идеального АЦП (1) и прямая, проведенная через центры ступеней ХП (2) • напряжение смещения нуля, которым отражается наличие параллельного сдвига ХП вдоль оси абсцисс. Уровень этого напряжения определен действительным значением входного напряжения в точке ХП, соответствующей номинальному нулевому значению этого напряжения. Напряжение смещения нуля может составлять в реальных АЦП несколько единиц младшего разряда (ЕМР), т. е. средних значений ступени квантования; • нелинейность АЦП — отклонение действительного значения входного напряжения, соответствующего заданной точке ХП, от значения, соответствующего идеальной ХП в этой же точке. Данный параметр определяет отклонение положения точек центров ступеней реальной ХП от прямой линии, соединяющей указанные точки идеализированной ХП; • дифференциальная нелинейность АЦП определяет отклонение действительных значений шагов квантования ХП от их среднего значения; • монотонность ХП АЦП отражается наличием всех кодовых комбинаций на его выходе при изменении входного напряжения. Знак наклона монотонной ХП должен быть неизменным. Нарушения монотонности ХП сопровождаются отсутствием кодовых комбинаций, соответствующих определенным точкам ХП. Ухудшение указанных статических точностных параметров обычно связано с возрастанием погрешностей изготовления делителей опорных напряжений и компараторов интегральной схемы (ИС) АЦП. Быстродействие ИС АЦП оценивается рядом динамических параметров. К таким параметрам относят время преобразования и максимальную частоту преобразования. Время преобразования — время от начала скачкообразного изменения уровня входного напряжения до появления на выходе АЦП соответствующего устойчивого кода. Время преобразования tп отсчитывается от момента скачкообразного изменения аналогового сиг-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 393 нала: tп = tз + tк , где tз — время задержки запуска, tк — время цикла кодирования. При этом время задержки — минимальный временной интервал от начала скачка аналогового сигнала до момента запуска АЦП, которым обеспечивается возникновение на выходе АЦП номинального кода, соответствующего (со статической погрешностью) измененному уровню входного напряжения АЦП. Время задержки определяется протяженностью переходных процессов во входных цепях АЦП, включая стробируемые компараторы. Время цикла кодирования — временной интервал, в пределах которого имеет место требуемое преобразование установившегося уровня входного аналогового сигнала. Время цикла кодирования определяется задержкой сигналов в выходных блоках АЦП. Для АЦП, имеющих внешний запуск, время преобразования — интервал времени от импульса запуска до момента появления на выходе АЦП соответствующего значения кода. Максимальная частота преобразования — частота дискретизации входного сигнала, при которой параметры АЦП сохраняются в заданных пределах. Максимальная частота преобразования зависит от задержек сигналов в компараторах, шифраторе и выходных каскадах АЦП. Для режима работы, когда на вход АЦП подается не скачкообразный, а изменяющийся по амплитуде в цикле преобразования сигнал, используют, кроме того, параметры апертурного времени, апертурой неопределенности (апертурная «дрожь»), монотонности характеристики преобразования при максимально допустимой скорости изменения входного сигнала, соотношения сигнал/шум. Элементы АЦП обладают инерционностью срабатывания. Для срабатывания, например, триггера — защелки компаратора требуется определенный период времени, в течении которого уровень аналогового сигнала должен превышать пороговый уровень срабатывания. За счет этого возникает неопределенность между значением выборки сигнала и временем, к которому эта выборка относится. Апертурное время — интервал, в течение которого сохраняется указанная неопределенность. Для реальных АЦП характерны, кроме того, дополнительные задержки сигнала в структуре ИС. Это дает дополнительный временной сдвиг между тактовым сигналом и моментом стробирования. Момент стробирования задержан по отношению к тактовому импульсу. Задержка зависит от уровня аналогового сигнала, что обусловливается относительными погрешностями изготовления каналов преобразования, соответствующим различным уровням квантования входного сигнала. При уменьшении скорости изменения входного аналогового сигнала до 1 ЕМР на интервал апертурного времени влия-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 394 Часть V. Цифровое преобразование изображений в телевидении нием этого фактора на параметры АЦП можно пренебречь. В реальных АЦП имеет место и апертурная неопределенность, т. е. случайные изменения апертурного времени, соответствующего данному уровню входного сигнала, которые вызываются случайными изменениями времени задержки. Влияние апертурной неопределенности проявляется возникновением различных кодовых комбинаций в условиях кодирования быстроизменяющегося сигнала одной и той же величины. Как показано в [83], погрешность отсчета значения входного сигнала, связанная с апертурной неопределенностью, вычисляется как ∆U = 2∆tн (dU/dt), где ∆tн — среднеквадратическое значение апертурной неопределенности. С увеличением скорости изменения входного аналогового сигнала (dU/dt) возрастает погрешность отсчёта в АЦП. Таким образом, апертурная неопределенность, апертурное время, разброс апертурного времени в пределах диапазона изменения амплитуды входного сигнала обусловливают ограничение максимальной скорости изменения сигнала на входе АЦП. С увеличением частоты входного аналогового сигнала возникают относительное занижение на выходе АЦП оценки амплитуды входного сигнала и относительное падение амплитуды высокочастотных компонентов в восстановленном (на выходе АЦП) сигнале. Для АЦП параллельного типа обычно характерна значительная входная емкость C0 = C0к + C0п , достигающая 100 и более пикофарад. Составляющая емкости C0 — C0к учитывает емкость входных каскадов компараторов, C0п — емкость токоведущих дорожек корпуса и проводников металлизации кристалла. Обычно C0к ≫ C0п . Поэтому C0 ≈ C0к . Емкость C0к зависит от входного напряжения и, соответственно, определяется как динамическая емкость. Влияние значительной величины C0 чаще всего нейтрализуют за счет использования на входе АЦП специального каскада согласования с низким выходным сопротивлением. Соотношение сигнал/шум относят к динамическим параметрам АЦП, оценивающим вносимые преобразователем искажения. Указанный параметр обычно рассчитывается для идеального АЦП по формуле ζ0 = 6b + 1,8 дБ, где b — разрядность АЦП. Следовательно, уровень шумов, вносимых при АЦП ТВС, уменьшается с увеличением разрядности АЦП. Соотношение сигнал-шум реального АЦП обычно находят как отношение среднеквадратического значения напряжения гармоник восстановленного сигнала к среднеквадратическому значению полного напряжения восстановленного сигнала. Разность между расчетными соотношениями (для реального и идеального АЦП) отражает погрешность, вносимую неидеальностью реального АЦП.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 395 14.2.3. Построение и особенности работы схем АЦП Функциональный блок АЦП выполняет операции дискретизации, квантования и кодирования полученных дискретных отсчетов входного аналогового сигнала. Во входной части АЦП могут при этом использоваться устройства выборки и хранения (УВХ) [68]. Упрощенная схема одного из вариантов УВХ (ИС АЦП типа АD876) представлена на рис. 14.2. Когда уровень F (t) принимает нулевое значение, ЭК1, ЭК2 замыкаются, а ЭК3 размыкается, емкость Cн через малые сопротивления электронных ключей и выходное сопротивление ОУ заряжается в течение полупериода тактовых импульсов до напряжения входного сигнала. В момент переключения F (t) из 0 в 1 размыкается ЭК1. За счет боль- Ðèñ. 14.2. Вариант схемы усших сопротивлений разомкнутого клютройства выборки и хранения ча ЭК1 и входного ОУ резко увеличи- (УВХ): ЭК1, ЭК2, ЭК3 — элеквается постоянная составляющая вре- тронные ключи; ОУ — операционный усилитель; F (t) — послемени разряда емкости Cн , т. е. реализу- довательность импульсов дискется выборка накопленного уровня на- ретизации (тактовых импульсов) пряжения и перевод емкости в режим его хранения. Затем размыкается ЭК2. Далее замыкается ЭКЗ. За счёт этого ёмкость Cн включается в цепь обратной связи ОУ, на выходе которого повторяется выборка накопленного уровня напряжения. В момент переключения F (t) из 1 в 0 размыкается ЭКЗ, а затем последовательно замыкаются ЭК2 и ЭК1. В результате ёмкость Cн снова переводится в режим выборки входного сигнала. Общая ёмкость на входе УВХ, учитывающая действие ёмкости Cн и ёмкости вывода Cв обычно 65 пФ. Последнее следует учитывать при выборе предшествующего входу АЦП каскада. В результате действия УВХ Uвх (t) приближенно аппроксимируют ступенчатой функцией с периодом ступеней, равным периоду дискретизации. Квантование и кодирование осуществляется в каждом из периодов дискретизации за интервал хранения напряжения отсчета Uвх (t) на ёмкости Cн . Высокое значение граничной частоты спектра ТВС обусловило применение в ТВ технике быстродействующих АЦП, имеющих максимальную частоту преобразования ∼20...100 МГц и более. С высокой контрастной чувствительностью глаза связан выбор разрядности АЦП b > 8 битов. Необходимым требованиям по быстродействию и разрядности удовлетворяют АЦП параллельно-последовательного типов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 396 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 14.3. Обобщённая схема параллельного АЦП В современных АЦП параллельного типа находят применение два варианта реализации операций дискретизации во времени и квантования по амплитуде. В первом дискретизацию аналогового сигнала реализуют с помощью УВХ. Достоинством такого варианта является упрощение реализации компараторов. Недостатки — усреднение сигнала в УВХ, что может увеличивать апертурное время, и вносимые динамические погрешности перезарядов емкости, которые зависят от выбранного типа схемы УВХ. Применяется и второй вариант, когда процессы квантования к дискретизации выполняются в блоке компараторов. Обобщенная схема АЦП подобного типа представлена на рис. 14.3 [83]. Входной сигнал подается на аналоговый вход АЦП, который соединен с одним из входов компараторов Ki . На другие входы компараторов Ki подаются опорные напряжения с делителя опорных напряжений, составленного из сопротивлений Ri . В момент поступления на компараторы тактовых импульсов фиксируется состояние компараторов как результат сравнения уровней аналогового и опорного напряжений. Все компараторы, для которых опорный уровень оказался меньше входного, устанавливаются в единичное состояние, а остальные фиксируются в нулевом состоянии. Результат кодирования с выходов компараторов поступает в шифра-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 397 тор, который предназначен для преобразования кода компараторов в выходной код АЦП заданного типа. Выходные каскады преобразуют сформированный в шифраторе двоичный код параллельного по разрядам считывания в стандартные уровни ЭСЛ, ТТЛ или КМОП. Резисторный делитель АЦП обычно выполняется по схеме последовательного делителя напряжения из p = 2b + 2 (b — число разрядов) резисторов. Общее сопротивление делителя R0 выбирается небольшим (R0 6 100...150 Ом). Каждый компаратор прямым входом подключается к определенной точке делителя. На соответствующие делителю выводы АЦП поступают опорные напряжения Uref1 и Uref2 . Изменением опорного напряжения Uref1 компенсируют смещение нуля на входе АЦП, а изменением Uref2 — абсолютную погрешность ХП в конечной точке шкалы. Делитель может иметь отвод от середины, который соответствует выводу АЦП «корректировка нелинейности». При подключении к этому выводу АЦП напряжений Uref1 или Uref2 нелинейность ХП корректируется на ±0,25 МЗР (единицы младшего значащего разряда). Этот вывод, кроме того, используется в качестве «искусственной земли» при преобразовании биполярных сигналов. Компараторы реализуют на основе дифференциальных усилителей (ДУ) постоянного тока. Питание компараторов определяет диапазон входного аналогового напряжения. При отрицательном, например, питании компараторов диапазон входных напряжений является отрицательным. На входах компараторов обычно включают эмиттерные повторители, обеспечивающие согласование компараторов по входному току с предшествующим резистивным делителем и по режиму с последующим каскадом усиления. Минимизация входного тока отдельного компаратора (61 мкА) исключает, в частности, влияние изменений входных сопротивлений компараторов на резистивный делитель и способствует улучшению линейности ХП. Последнее может достигаться использованием в качестве нагрузки эмиттерных повторителей источников тока (ИT), так как при увеличении коэффициента усиления транзисторов, используемых в структуре ИТ, получают необходимые входные токи компаратора. Выходы эмиттерных повторителей в каждом из компараторов подключают ко входам ДУ. Выходами дифференциальных каскадов такого усилителя, обеспечивающих усиление опорного и аналогового напряжений, являются независимые выходные резисторы компаратора, которые одновременно с этим входят в схему триггера-защелки в качестве резисторов, включенных в цепи коллекторов 1-го и 2-го транзисторов. Так как триггер-защелка представляет собой ДУ, охваченный 100%-ной положительной обратной связью, то в момент его включения резко возрастает коэффициент усиления компаратора. Эмиттерные цепи транзисторов в каждом из дифференциальных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 398 Часть V. Цифровое преобразование изображений в телевидении каскадов усиления и в триггере-защелке попарно объединяют и через индивидуальные переключатели тока (ПT) соединяют с общим источником тока ИТ. В режиме сравнения ток ИТ замыкается переключением через каскады усилителя. Коэффициент усиления компаратора в этом режиме примерно 5...6. Разность входных напряжений на входах ДУ при этом усиливается и выделяется на выходных резисторах. В момент переключения тока ИТ на питание эмиттерной цепи триггера-защелки в последнем возникает лавинообразный процесс, в результате которого на выходных резисторах компаратора устанавливаются уровни, отражающие результат сравнения входного аналогового сигнала и опорного, сформированного делителем опорных напряжений. Надежное срабатывание триггера-защелки обеспечивается в том случае, когда в режиме сравнения имеет место перепад напряжения на выходных резисторах компаратора в несколько милливольт. Выходные резисторы компаратора обычно подключают к шине «аналоговая земля», а эмиттерные сопротивления ИТ — к источнику, например, отрицательного питания −6 В. В соответствии с этим изменяется уровень входного напряжения ТВ сигнала на входе ИС АЦП. Сигналы с выходных резисторов компаратора поступают на шифратор через эмиттерные повторители. Шифратор построен на схемах И, ИЛИ, исключающее ИЛИ, выполненных на основе применения дифференциальных переключателей тока и триггера-защелки. Первая ступень шифратора построена на k = 2b схемах И и служит для преобразования унитарного кода на выходах компаратора в позиционный код. Если от аналогового входного сигнала сработал ряд компараторов, то высокий уровень напряжения будет в данной ступени иметь место лишь на выходе схемы И последнего из сработавших компараторов. Другие схемы И будут иметь низкий уровень напряжения на выходах. Это происходит из-за того, что выходной сигнал последующего компаратора на схему И данного компаратора подается в противофазе с выходными сигналами, подаваемыми на эту же схему от предшествующего и данного компараторов. Схемы И и компараторы тактируются в противофазе. В интервале, когда в компараторах реализуется режим сравнения, шифратор на своем выходе сохраняет код прежней выборки. Вторая ступень шифратора состоит из шифратора позиционного кода в двоичный код. К каждому из 2c шифраторов подключено α = 2b /2c предшествующих схем И. Соответственно, на выходе каждого из шифраторов имеем (m = b − c)-разрядный двоичный код, который поступает на вход промежуточного регистра хранения, обеспечивающего хранение двоичных кодов, полученных в результате второй шифрации. В состав регистра входят переключатель режима работы, переключатель тока и триггер-защелка. Третья ступень шифрации
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 399 АЦП предназначена для объединения 2c m-разрядных двоичных кодов с выходов регистров в полный b-разрядный двоичный код. Вторая и третья ступени шифратора выполнены на элементах ИЛИ. С выходов третьей ступени шифратора сформированный двоичный код подается на входы схем исключающее ИЛИ, которые выполняются на дифференциальных переключателях тока и служат для выбора типа выходного кода. В момент смены тактового сигнала включается триггер-защелка и фиксирует информацию на выходе схемы исключающее ИЛИ, выполняя роль буферного регистра. Выходы схем исключающее ИЛИ соединены со входами преобразователя уровня ЭСЛ в стандартные ТТЛ уровни. В структуре варианта ИС АЦП последовательно-параллельного типа обычно используется несколько последовательно включенных схем АЦП параллельного типа. Например, в ИС АЦП производства фирмы Analog Devices типа AD9022 накопленное в первом УВХ значение выборки ТВС поступает на первый 5-разрядный (параллельного типа) АЦП. Соответствующий цифровой сигнал (5 битов) одновременно поступает на первый вход схемы цифровой коррекции и на вход первой схемы цифроаналогового преобразования (ЦАП). В 5-разрядном ЦАП этот сигнал преобразуют в аналоговую форму. Полученное при этом приближенное значение выборки вычитается из исходного значения выборки ТВС, накопленной в первом УВХ. Сигнал разности поступает на второе УВХ и далее через усилитель на второй 5-разрядный параллельный АЦП. Значение соответствующей выборки хранится во втором УВХ до тех пор, пока не преобразуется в цифровую форму во втором АЦП. Аналогичным образом цифровой сигнал с выхода второго АЦП параллельно поступает на второй вход схемы цифровой коррекции и на вход второй схемы ЦАП. В 5разрядном ЦАП этот сигнал преобразуют в аналоговую форму. Полученное при этом приближенное значение выборки вычитается из исходного значения выборки сигнала разности, накопленной во втором УВХ. Сигнал вторичной разности поступает на третье УВХ и далее через усилитель на третий 4-разрядный параллельный АЦП. Значение соответствующей выборки хранится в третьем УВХ до тех пор пока не преобразуется в цифровую форму в третьем АЦП. Цифровой сигнал с выхода третьего АЦП поступает на третий вход схемы цифровой коррекции, в которой и получают необходимый 12-разрядный результат преобразования. При этом последний АЦП даёт три младших бита оконечного результата и один бит для коррекции погрешностей. Выходной результат считывается на нарастающем фронте тактового сигнала. Рассмотренный принцип преобразования позволяет значительно снизить число компараторов, необходимых для реализации последо-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 400 Часть V. Цифровое преобразование изображений в телевидении вательно-параллельного АЦП по отношению к АЦП параллельного типа. Преимуществом данного варианта построения схемы АЦП является переход к последовательным преобразованиям сигнала разности и коррекциям результата, полученного при первичном использовании малого числа уровней квантования. При этом ошибки преобразования сигналов разности уменьшаются за счет усиления этих разностных сигналов, отражающих различную степень приближения к конечному результату преобразования данной выборки ТВС. 14.2.4. Типы микросхем АЦП В настоящее время промышленностью выпускаются микросхемы быстродействующих АЦП производства различных фирм. Приведем данные по некоторым из АЦП производства фирмы Analog Devices. AD876. Особенности: 10-разрядный КМОП АЦП с частотой дискретизации до 20 МГц; выпускается также 8-разрядная версия, совместимая по выводам с 10-разрядной; низкая потребляемая мощность — 160 мВт; работа от одного напряжения питания +5 В; дифференциальная нелинейность 0,5 МЗР; гарантируется отсутствие пропущенных кодов; имеется режим с пониженным энергопотреблением (дежурный режим); трёхстабильные выходы — логические входы/выходы совместимы как с +5Влогикой, так и с +3,3В-логикой; выходные линии AD 876 могут быть переведены в третье (высокоимпедансное) состояние; • регулируемый вход опорного напряжения; • выпускается в малогабаритных корпусах: 28-выводной SOIS или 48-выводной TQFP. AD876 работает от одного источника питания, имеет внутреннее устройство выборки-хранения (УВХ). В AD876 используется многокаскадная конвейерная архитектура с логикой коррекции ошибок результата преобразования, что увеличивает точность и снижает вероятность пропуска кодов в рабочем диапазоне температур. Подключение опорных напряжений через пары входов «уровень-коррекция» сводит к минимуму падения напряжений на внешних подводящих проводниках. В дежурном режиме работы энергопотребление AD876 снижается до менее чем 50 мВт. Логический интерфейс AD876 (входы и выходы) работает с логическими уровнями +5 В и +3,3 В; результат преобразования выводится в прямом двоичном коде. Применяется в системах вещательного и прикладного телевидения, мультимедийных схемах, в системах обработки изображений, связи, в быстродействующих системах регистрации данных и в приборах с маломощным батарейным питанием (электронные фотокамеры, видеокамеры, средства связи и измерения). Относительно низкое энергопотребление (160 мВт) и возможность работы от одного источника питания позволяют применять схему AD876 в быстродействующих малогабаритных приборах. Разрешение (число разрядов) и быстродействие AD876 согласовано с системами регистрации на ПЗС (приборы с зарядовой связью), которые применяются в цветных сканерах, цифровых копировальных аппаратах, электронных фотокамерах (с электронной записью изображения), видеокамерах и в другой видеотехнике. • • • • • • • •
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 401 AD876 выпускается в 28-выводном малогабаритном корпусе типа SOIC и в 48выводном корпусе типа TQFP с еще меньшими размерами; оба корпуса предназначены для поверхностного монтажа. Корпус TQFP идеально подходит для плат с очень высокой плотностью и малой высотой монтажа. Спецификации определяются для коммерческого (0. . . +70 ◦ C) температурного диапазона. Выпускается 8-разрядная версия AD876JR-8, совместимая по выводам с 10-разрядным AD876. Это позволяет разрабатывать схему с разрешением 8 разрядов, а потом перейти на 10 разрядов, если это оправдано результатами испытания прототипа. AD9220. Особенности: • монолитное исполнение; • 12-разрядный АЦП с частотой дискретизации 10 МГц; • энергопотребление 250 мВт; • работа от одного напряжения питания +5 В; • гарантируется отсутствие пропущенных кодов; • ошибка дифференциальной нелинейности 0,3 МЗР; • встроенные УВХ и источник опорного напряжения; • отношение сигнал/шум + искажения (S/N + D) 70 дБ; • свободный динамический диапазон (SFDR) 88 дБ; • индикация выхода аналогового сигнала за пределы диапазона; • прямой двоичный выходной код; • 28-выходной корпус типа SOIC. AD9220 работает от одного напряжения питания, имеет расположенное на кристалле УВХ и источник опорного напряжения (ИОН). В AD9220 используется КМОПтехнология и дифференциальная многоступенчатая конвейерная архитектура с логикой коррекции ошибок, что обеспечивает 12-разрядную точность при частотах дискретизации до 10 МГц и отсутствие пропущенных кодов во всем рабочем диапазоне температур. Входной диапазон AD9220 был выбран с позиций применения в системах обработки изображений и системах связи. Ширина входного диапазона равна двойному опорному напряжению, а сам входной диапазон может быть сдвинут по шкале напряжений. Входное УВХ удовлетворительно работает в системах с мультиплексированием, в которых при переключении каналов на вход АЦП могут последовательно подаваться напряжения верхнего и нижнего концов шкалы, а также при преобразовании исходного сигнала с частотными компонентами вплоть до (и даже выше) частоты Найквиста, т. е. AD9220 имеет широкополосный входной каскад. AD9220 имеет внутренний конфигурируемый источник опорного напряжения. Можно также использовать внешнее опорное напряжение, если предъявляются более высокие требования к статической точности и температурному дрейфу. Для управления всеми внутренними циклами преобразования используется один входной тактовый сигнал. Результат преобразования выводится в прямом двоичном коде на параллельном формате. Выходной сигнал (OTR) — указатель выхода уровня входного напряжения за пределы допустимого диапазона — определяет состояние переполнения и в комбинации со старшим разрядом результата может использоваться для контроля переполнения на верхнем или нижнем концах шкалы уровней. Область применения: разработка аппаратуры систем телевидения и связи, обработка изображения, измерительные приборы и др. AD9022. Особенности: • монолитное исполнение; • 12-разрядный АЦП с частотой отсчётов до 20 МГц; • энергопотребление 1,4 Вт; • расположенные на кристалле УВХ и ИОН;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 402 Часть V. Цифровое преобразование изображений в телевидении • значительный динамический диапазон, свободный от паразитных компонентов; • ТТЛ/МОП-совместимые логические сигналы. AD9022 работает от источников питания +5 В и +5,2 В. Все необходимые для работы АЦП схемы, включая УВХ и ИОН, расположены на кристалле. AD9022 практически является аналогом AD9023. Однако все логические сигналы ТТЛ-совместимы, а в AD9023 на логических входах и выходах использованы ЭСЛ-схемы. Число и расположение выводов у этих двух ИС практически одинаково. AD9022 имеет неплохие динамические характеристики. При дискретизации входного сигнала AIN = 1 МГц с частотой отсчетов 20 МГц имеет место динамический диапазон, свободный от паразитных компонентов (SFDR) около 80 дБ; для сигнала Ain = 9,6 МГц SFDR = 74 дБ. Отношение сигнал/шум (SNR), как правило, равно 65 дБ. Внутреннее УВХ имеет ширину полосы пропускания 100 МГц и обеспечивает удовлетворительные динамические характеристики для входных аналоговых сигналов с частотой выше Найквиста. Последнее является важным для многих применений, связанных с цифровой обработкой сигналов при дискретизации, например прямое преобразование сигнала (промежуточной частоты) в цифровую форму. Чтобы сохранить динамические характеристики на еще более высоких промежуточных частотах, можно использовать монолитные УВХ радиочастотного диапазона (такие, как AD9100) вместе со схемой AD9022 для обработки сигналов до частот 70 МГц и выше. Имея дифференциальную нелинейность DNL менее 0,5 МЗР и время установления 20 нс (при ступенчатом изменении входного сигнала), AD9022 дает хорошие результаты в схемах с передискретизацией низкочастотных аналоговых сигналов (например, оцифровка сигналов ПЗС). Входной диапазон равен ±1 В, а входное сопротивление 300 Ом. Аналоговый вход AD9022 может подключаться или непосредственно к источнику сигнала, или через малошумящие буферные усилители с низкими искажениями. Все управляющие тактовые сигналы генерируются внутри схемы AD9022 на основе входного тактового сигнала (ENCODE), который инициирует цикл преобразования. Чтобы АЦП работал наилучшим образом, сигнал ENCODE должен иметь как можно меньше фазовое дрожание. Кристалл AD9022 изготовлен по биполярной технологии с изолирующей канавкой. В AD9022 использована многокаскадная архитектура. AD9022 выпускается в 28-выводном корпусе типа DIP и в малогабаритном корпусе для поверхностного монтажа. Выпускаются модификации AD9022 для промышленного диапазона температур (−25. . . +85 ◦ C) и для военного (−55. . . +125 ◦ C). AD9200. Особенности: • КМОП, 10 битов, частота дискретизации до 20 МГц, АЦП выборок; • cовместим по выводам с AD876; • мощность рассеивания 80 мВт при Uпит = +3 В; • напряжение питания от 2,7 В до 5,5 В; • скоростные выборки до 135 МГц. Применяется в системах вещательного и прикладного телевидения, мультимедийных схемах, в системах обработки изображений, связи, в быстродействующих системах регистрации данных и приборах с маломощным батарейным питанием. Временную диаграмму работы АЦП рассмотрим на примере АЦП AD9200 (рис. 14.4). От фронта тактового импульса (спустя время tа = 10...25 нс — апертурное время, ∆tд ≈ 30 пс — апертурная неопределенность) компараторы переводятся в режим хранения, а схемы И первой ступени
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов Ðèñ. 14.4. 403 Временная диаграмма работы АЦП шифратора — в режим приема информации [83]. За время длительности импульса t1 на выходах схем И формируется код первой ступени (позиционный код). Срезом тактового импульса (Uт ) компараторы переводятся в режим сравнения, а схемы И шифратора — в режим хранения информации кода выборки n. Этим же фронтом промежуточные регистры устанавливаются в режим приема информации. За время t2 (интервал отсутствия тактового импульса) код выборки n проходит шифрацию во второй ступени и появляется на выходе промежуточного регистра хранения. С приходом переднего фронта второго тактового импульса в компараторах фиксируется значение выборки (n + 1), схемы И переводятся в режим приема информации кода выборки n+1, а выходной буферный регистр — приема информации кода выборки n. За интервал второго тактового импульса код выборки n проходит шифрацию в третьей ступени шифратора и устанавливается на триггере-защелке выходного буферного регистра. Срезом второго тактового импульса выходной буферный регистр устанавливается в режим фиксации на своем выходе кода выборки n, который с учетом задержки выходных преобразователей уровня появляется на выходе схемы АЦП. Время задержки буферного регистра tбр 6 50 нс. Таким образом, код каждой выборки на выходе АЦП формируется с задержкой tз в 100 нс. 14.2.5. Формирование ТВС на входе АЦП При разработке функциональной и принципиальной схем устройства формирования сигнала на входе АЦП необходимо учитывать следующие факторы:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 404 Часть V. Цифровое преобразование изображений в телевидении • тактовый сигнал (ТС) для АЦП должен иметь минимальное фазовое дрожание (единицы и даже доли нс); • в форме ТС должны отсутствовать выбросы; • длительности полупериодов («=0» и «=1») ТС и соотношение между ними должны попасть в диапазон рабочих значений для данного АЦП; • входной сигнал поступает на АЦП от выходного каскада с низким выходным сопротивлением (уменьшение влияние теплового шума и обеспечение необходимой скорости перезаряда емкости накопления в УВХ); • на входе АЦП необходимо использовать каскады формирования входного ТВС с низким уровнем собственных шумов и искажений, что обеспечивает сохранение динамического диапазона работы АЦП; • источник питания АЦП должен быть изолирован от питания других логических схем и, по возможности, не должен быть импульсным, что снижает уровень шумов, проникающих в АЦП; • на входе АЦП должен быть включен ФНЧ, требования к частотным характеристикам которого определяются заданной частотой ТС АЦП; • входное сопротивление АЦП с последовательно-параллельным преобразованием ТВС определяется типом и текущим режимом работы УВХ, а входное сопротивление АЦП параллельного типа (без УВХ) достигает значений в несколько сотен Ом; • работа АЦП на частотах ТС ниже рекомендуемого диапазона сопровождается спадом уровней сигнала (из-за утечек в УВХ) и, соответственно, значительными динамическими и статическими погрешностями при АЦП; • при формировании входного для АЦП ТВС целесообразно предусмотреть жесткое подавление составляющих исходного ТВС и помех, близких по частоте к значению основной и более высоких гармоник частоты ТС; • за счет автоматической регулировки уровня входного ТВС необходимо обеспечить постоянство его локализации в стандартизированных (для сигнала яркости и цветоразностных сигналов) участках полной шкалы квантования (см. раздел 14.2.1). В соответствии с изложенным в структуры схемы формирования аналогового ТВС на входе ИС АЦП могут включаться каскады автоматической регулировки уровня ТВС по амплитуде синхроимпульсов строк, усиления и согласования, фильтр нижних частот, ограничивающий протяженность спектра ТВС перед преобразованием в цифровую форму, схема фиксации диапазона уровней входного ТВС в пределах шкалы квантования, каскады селекции и формирования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов Ðèñ. 14.5. 405 Структурная схема формирования телевизионного сигнала на входе АЦП из входного ТВС строчных и кадровых импульсов синхронизации и импульсов управления схемой фиксации уровня ТВС, генератор ТС (ГТС) с автоматической подстройкой частоты и фазы последнего и другие элементы. На рис. 14.5 показана структурная схема возможного варианта построения схемы формирования ТВС на входе АЦП. Входной ТВС здесь параллельно поступает на каскады автоматической регулировки уровня (КАРУ), формирования сигнала управления уровнем (КФСУ) и на селектор сигналов синхронизации (ССС). Отрегулированный по уровню ТВС подвергается частотной коррекции в соответствующем каскаде (КК), где реализуют подъем уровня высокочастотных составляющих ТВС. В каскаде усиления (КУ) осуществляют усиление амплитуды ТВС до значения, обеспечивающего, с учетом всех потерь в амплитуде ТВС в последующих каскадах схемы формирования, стандартизированную фиксацию диапазона уровней входного ТВС в пределах полной шкалы квантования. Каскады согласования (КС1, КС2, КС3), имеющие низкое выходное и высокое входное сопротивления, упрощают решение задач согласования по волновому сопротивлению фильтра нижних частот (ФНЧ), реализующего необходимое усечение протяженности спектра ТВС на входе АЦП, и выполнение заданных соотношений между постоянными времени заряда (перезаряда) и разряда емкости фиксации в использованной далее схеме восстановления постоянной составляющей (СВПС). За счет фиксации (привязки) уровня гашения восстановление постоянной составляющей определяет заданное стандартом положение диапазона уровней входного ТВС в пределах полной шкалы квантования конкретного АЦП. Между КСЗ и аналоговым входом АЦП включена цепь обратной коррекции (ЦОК). Совместное и взаимообратное действие КК и ЦОК позволяет устранить возможность биений сигнала
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 406 Часть V. Цифровое преобразование изображений в телевидении тактовой частоты и его гармоник с высокочастотными помехами и наводками, возникающими в предшествующих каскадах формирования ТВС на входе АЦП. В результате на аналоговом входе АЦП в высокочастотной области спектра ТВС сохраняется практически исходное отношение сигнал/шум. На структурной схеме рис. 14.5 иллюстрационно показан вид частотных характеристик. С выхода ССС импульсы синхронизации поступают на формирователь сигналов синхронизации и управления (ФССиУ), строчные синхронизирующие импульсы (ССИ) с выхода которого подключены к ГТС. В составе ГТС обычно используют высокостабильные (кварцевые) генераторы с автоматической подстройкой частоты и фазы ТС к соответствующим параметрам сигнала импульсов синхронизации строк входного ТВС. При этом между частотами ТС и строк устанавливают кратное отношение, обеспечивающее реализацию ортогональной структуры дискретизации. В случае недостаточной стабильности параметров исходного сигнала синхронизации ТВС генераторы могут также использоваться и в режиме без кварцевой стабилизации, что обычно связано с необходимостью увеличения частотного диапазона и быстродействия автоматической подстройки частоты и фазы тактового сигнала. Недостатком такого варианта является возрастание при АЦП шумов фазового типа. В структуру ГТС также входят делители частоты, один или больше варикапов, каскад формирования тактового сигнала, фазовый детектор, элементы усиления и селекции сигнала автоподстройки частоты и фазы задающего генератора к параметрам сигнала импульсов синхронизации строк входного ТВС. При этом частоту задающего генератора делят до частоты сигнала строчных синхронизирующих импульсов (ССИ) и полученную последовательность импульсов подключают к сигнальному входу фазового детектора, на вход опорного сигнала которого подают последовательность самих ССИ. Составляющие сигнала результата сравнения указанных последовательностей на выходе фазового детектора усиливают, селектируют в пределах амплитудного и частотного диапазона и используют для корректирующего изменения смещения на варикапе (изменения реактивного сопротивления варикапа), вызывающего соответствующую подстройку частоты задающего генератора. Сформированный сигнал с выхода ГТС подают на вход тактового сигнала АЦП. Стробирующие и фиксирующие импульсы (СИ и ФИ) с выходов ФССиУ используют в КФСУ для фиксации уровня гашения ТВС. Ограничением в пределах амплитудного диапазона и стробированием затем отделяют от сигнала изображений сигнал синхронизации, из которого за счет интегрирования и формируют сигнал управления (СУ1) для КАРУ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 407 Фиксирующие импульсы (ФИ2) с выхода ФССиУ поступают также на СВПС, где управляют открыванием и запиранием ключей заряда (перезаряда) емкости фиксации (Cф ). В состав функциональных элементов схемы формирования ТВС на входе ИС АЦП может быть включен блок формирования опорных напряжений (БФОН), термостабилизированные напряжения с выходов которого подаются на входы «Уровень» и «Коррекция» и влияют на точностные параметры ХП АЦП. Полученные сигналы значащих разрядов (СЗР), восемь, десять или более, от сигнала старшего значащего разряда (ССЗР) до сигнала младшего значащего разряда (СМЗР) параллельно формируются в соответствии с временными диаграммами работы конкретного АЦП. 14.3. Основные параметры и характеристики ЦАП Зависимость между значениями входного кода αi и выходной аналоговой величины Ui называется характеристикой преобразования (ХП) ЦАП. Следовательно, ХП ЦАП отличается от ХП АЦП лишь обратной перестановкой осей абсцисс и ординат. Если Umin и Umax — конечная и начальная точки ХП, а N — число возможных значений кода, то ступень квантования определяется отношением δ = (Umax − Umin )/(N − 1). Номинальное значение ступени квантования определяет разрешающую способность преобразования. Реальная ХП ЦАП существенно отличается по виду от идеальной. Степень совпадения реальной ХП с идеальной (точность ХП) количественно определяется совокупностью параметров, которые фактически не отличаются от рассмотренных выше параметров, отражающих точность ХП АЦП [3]. Оценивают, например, нелинейность в данной точке ХП ЦАП, дифференциальную нелинейность, монотонность ХП, напряжение смещения нуля выходной аналоговой величины, отклонение аналоговой величины от номинального значения в конечной точке ХП. Из динамических параметров контролируются время установления выходного сигнала — интервал от момента изменения кода на входах ЦАП до момента, когда значение выходной аналоговой величины отличается от установившегося значения на заданную величину (±0,5 МЗР); время задержки распространения — время от момента достижения входным уровнем 0,5 амплитуды до момента достижения выходной аналоговой величины 0,5 установившегося значения; время нарастания — время tф изменения выходной аналоговой величины от 0,1 до 0,9 от установившегося значения Uуст ; скорость нарастания Uуст /tф ; время переключения — время от изменения входного кода
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 408 Часть V. Цифровое преобразование изображений в телевидении до нарастания выходной аналоговой величины к уровню 0,9 установившегося значения; выбросы выходного сигнала, возникающие при смене значений входного кода из-за несовпадения во времени моментов переключения отдельных разрядов. 14.3.1. Построение и особенности работы ЦАП Построение быстродействующих ЦАП на переключателях тока (ПT) реализуют на основе применения схем с суммированием двоично-взвешенных токов, с двоичным изменением токов на матрице R– 2R и схем комбинированного типа [83]. Варианты структур ЦАП со взвешенными резисторами в цепях эмиттеров показаны на рис. 14.6. Токи, соответствующие разрядам кода, задаются значениями резисторов при установленном опорном напряжении Uref смещения на общей базовой шине всех источников тока (ИT) на многоэмиттерных транзисторах в цепи эмиттера каждого ИТ. Указанные ИТ подключаются к выходному резистору Rн с помощью ПТ, управляемых разрядами цифрового кода, поступающего на ЦАП. Следовательно, изменения тока, возникающего в Rн , определяются изменениями параллельного двоичного кода на входе ЦАП. Данный вариант ЦАП (рис. 14.6,a) характеризуется малой рассеиваемой мощностью, отсутствием взаимного влияния токов разрядов и большим диапазоном сопротивлений резисторов. Взвешивающие резисторы могут включаться и в выходной цепи каждого ПТ, обеспечивая необходимое деление и суммирование токов в выходном резисторе. Это так называемые ЦАП со взвешивающими резисторами в цепях нагрузки Rн . Для такого варианта характерен относительно большой диапазон сопротивлений взвешивания. Ðèñ. 14.6. Варианты структур ЦАП: a — ЦАП со взвешенными резисторами в цепях эмиттеров; b — ЦАП с лестничной матрицей в эмиттерах источников токов
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 409 Диапазон используемых сопротивлений можно уменьшить при использовании структуры ЦАП с лестничной матрицей R-2R в цепях эмиттеров ИТ (рис. 14.6,b). Недостатком такого варианта является зависимость токов разрядов друг от друга. При изменении тока одного разряда изменяются токи соседних разрядов, что создаёт трудности в реализации прибора. Уменьшение диапазона сопротивлений достигается и использованием лестничной матрицы R–2R в цепях нагрузки Rн . Возможны на данной основе и варианты ЦАП комбинированного типа. 14.3.2. Типы ИС ЦАП На рис. 14.7 представлен вариант структурной схемы 12-разрядного ЦАП комбинированного типа [83]. Токи старших разрядов здесь формируются с помощью ИТ со взвешенными резисторами, а младших — с помощью ИТ с матрицей R–2R. Схема содержит в своей структуре встроенный формирователь, в который включен каскад автоматической коррекции напряжения смещения Uref на общей базовой шине ИТ, что осуществлено преобразованием исходного фиксированного опорного напряжения, поданного от входа 23 в усилителе, охваченном петлей отрицательной обратной связи. С этой целью в структуру ЦАП включен каскад на транзисторе VTд и резисторе Rд , идентичный ИТ второго старшего разряда (R2 , VT2). Указанный каскад по своей структуре, элементам и характеристикам полностью аналогичен ИТ ЦАП. Соответственно, напряжение отрицательной обратной связи отслеживает и компенсирует в ИТ ЦАП все изменения разрядных токов, обусловленные колебаниями температуры, напряжения источника питания, процессом старения элементов и влиянием других факторов. Основой построения рассматриваемой схемы является параллельное подключение к общему выходу трех элементарных ЦАП. Через токовые ключи 1–4 разрядов к общему выходу подключен первый элементарный ЦАП (ИТ на VT1–VT4, R1 –R4 ), преобразующий в выходной ток четыре старших разряда, а другие два элементарных ЦАП (ИТ на VT5–VT8, R5 –R8 и ИТ на VT9–VT13, R9 –R14 ) подключены к общему выходу через токовые ключи 5–8 разрядов и токовые ключи 9–12 разрядов. Взвешивание токов осуществляется в эмиттерных цепях транзисторов ИТ. Транзистор VT13 предназначен для реализации взвешивания (активный делитель) тока младшего разряда. Токи младших (5–12) разрядов также поступают на общий выход через пассивные делители. Схема с делителями на выходе позволяет резко уменьшить диапазон значений сопротивлений, применяемых в ИТ. Резисторы R19 , R20 , R21 используются для образования внешней отрицательной обратной связи при подключении к выходу ОУ (режим с выходом по напряжению) и получения на выходе биполярного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 410 Часть V. Цифровое преобразование изображений в телевидении
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 14. Основные элементы цифрового преобразования сигналов 411 сигнала. Схема сдвига уровней обеспечивает режим работы токовых ключей рассмотренного варианта ЦАП. Подавление продуктов дискретизации на выходе ЦАП может осуществляться интегрированием. Лучший результат дает включение специального фильтра нижних частот, обеспечивающего максимальное затухание на частоте преобразования и на гармониках частоты преобразования [84]. Относительная простота схем ЦАП позволила различным фирмам создать в настоящее время значительное количество приборов, обеспечивающих различные варианты быстродействия, числа разрядов и энергопотребления. Например, ИС ЦАП DAC 650 фирмы Bur Brown обеспечивает 12-разрядное преобразование с частотой тактирования до 500 МГц. Несколько менее быстродействующим при том же числе разрядов является прибор AD 9762 фирмы Analog Devices (∼100 МГц), отличаясь в то же время преимуществом по энергопотреблению ∼175 мВт (источник питания 5 В) или ∼45 мВт (источник питания 3 В). Контрольные вопросы 1. Приведите и поясните общее выражение для преобразованного в цифровой вид ТВ сигнала. 2. Какие основные операции реализуются при АЦП? 3. Укажите и дайте обоснование частот дискретизации для сигнала яркости и цветоразностных сигналов. 4. Какие требования предъявляются к амплитудно- и фазо-частотным характеристикам фильтра нижних частот (ФНЧ) на входе микросхемы АЦП? 5. Для чего на входе АЦП может быть использован фазовый корректор? 6. С какой целью увеличивают частоту дискретизации в современных микросхемах АЦП? 7. Чем определяется выбор числа уровней квантования при АЦП? 8. Определите скорость передачи и объём двоичных символов для архивирования составляющих (строк, полукадров и кадров) цифрового ТВ сигнала. 9. Определите требования к характеристикам преобразования микросхем АЦП. 10. Для чего на входе микросхемы АЦП включают устройство выборки и хранения отсчётов? 11. Поясните назначение элементов обобщённой схемы параллельного АЦП. 12. Определите типовые параметры реальных микросхем современных АЦП. 13. Какие факторы следует учитывать при разработке устройства формирования аналогового ТВ сигнала на входе АЦП? 14. Определите функциональную схему обработки аналогового ТВ сигнала на входе АЦП и назначение ее отдельных элементов. 15. Какие варианты, характеристики и параметры микросхем ЦАП Вы знаете? 16. Поясните назначение элементов структурной схемы для ЦАП комбинированного типа. 17. Сравните частотные характеристки ФНЧ на входе микросемы АЦП и на выходе микросемы ЦАП.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 15 ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ СЖАТИЯ ЦИФРОВОГО ПОТОКА СИГНАЛОВ ИЗОБРАЖЕНИЯ 15.1. Формирователи цифровых телевизионных сигналов Рассмотрим два варианта структурной схемы формирователя цифрового телевизионного сигнала в соответствии с Рекомендацией ITU-R ВТ 601 [62]. В устройстве, показанном на рис. 15.1,a, сигналы основных цветов ER , EG , EB с источника телевизионных сигналов (телекамеры) вначале поступают на гамма-корректоры (ГК), сфор′ ′ ′ мированные в сигналы ER , EG , EB в кодирующей матрице (КМ) по известным соотношениям преобразуются в сигнал яркости EY′ и цве′ ′ ′ торазностные сигналы ER−Y и EB−Y (штрихи в обозначениях ER , ′ ′ EG , EB говорят, что сигналы прошли гамма-коррекцию). Далее эти сигналы преобразуются в АЦП в цифровые сигналы Y , CR и CB соответственно. Число разрядов каждого АЦП, как правило, равно 8. Синхроимпульсы развертки источника телевизионных сигналов поступают на формирователь цифровых синхроимпульсов (ФЦСИ), вырабатывающий синхросигналы горизонтальной (НАС) и вертикальной (КАС) развёрток. Кроме того, синхроимпульсы используются для синхронизации генератора тактовых импульсов (ГТИ), который вырабатывает импульсы с частотами 27, 13,5 и 6,75 МГц, поступающие на другие узлы устройства. ГТИ содержит схему фазовой автоподстройки частоты (ФАПЧ), с помощью которой обеспечивается требуемое число периодов тактовых импульсов за период строчной развертки источника телевизионных сигналов. Видеосигналы Y , CR , CB с ИКМ перед мультиплексированием подвергаются кодированию (MPEG-1, -2, -4) — сжатию видеоданных с целью устранения избыточности. Звуковые данные перед мультиплексированием также сжимаются для уменьшения скорости передачи данных. Мультиплексор (MS) в заданной последовательности передает на выход цифровые сигналы Y , CR и CB , звуковые данные и цифровые
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения Ðèñ. 15.1. 413 Варианты структурной схемы формирователя цифрового видеосигнала синхросигналы НАС и КАС. В результате на выходе устройства оказывается сформированным цифровой телевизионный сигнал (ЦТС), называемый элементарным программным потоком (PES-1). В другом варианте устройства (рис. 15.1,b) сигналы основных цветов ER , EG , EB сразу преобразуются в цифровые сигналы Rd , Gd , Bd . При этом каждый АЦП должен иметь по меньшей мере 10, а лучше 12 двоичных разрядов. Далее цифровые сигналы Rd , Gd , Bd поступают на цифровые гамма-корректоры (ЦГК), в которых выполняются нелинейные преобразования. Число двоичных разрядов прошедших гамма-коррекцию цифровых сигналов Rd′ , G′d , Bd′ равно 8. Затем сигналы Rd′ , G′d , Bd′ в цифровой кодирующей матрице (ЦКМ) преобразуются в цифровой сигнал яркости Y и цифровые цветоразностные сигналы CR и CB . Формирование синхросигналов и тактовых импульсов и работа мультиплексора осуществляются аналогично первому варианту устройства.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 414 Часть V. Цифровое преобразование изображений в телевидении Выполнение гамма-коррекции цифровыми средствами обеспечивает более точное задание требуемой функции преобразования, но при этом требуются имеющие больше двоичных разрядов и, следовательно, более дорогие АЦП. 15.2. Структурная схема цифровой телевизионной системы В кодере видео (рис. 15.2) осуществляется эффективное кодирование видеоинформации с целью уменьшения скорости передачи данных (двоичных символов) в канале связи. Звуковая информация сжимается в кодере звука. Кодированные данные видео и звука объединяются в мультиплексоре Мп в единый поток данных. В кодере канала выполняется кодирование цифровых сигналов для повышения их помехоустойчивости. Далее цифровые сигналы модулируют несущую и передаются в канал связи. В приёмной части системы осуществляется обратная операция — демодуляция принятого сигнала и преобразование их в аналоговую форму. Для ТВ вещания высокого качества требуется битовая скорость на входе модулятора 15 Мбит/с [12]. Для вещания высокой чёткости требуется скорость 60 Мбит/с для 1440 пикселей на строку и 80 Мбит/с для 1920 пикселей на строку. Рассмотрим основные компоненты системы цифрового телевидения, осуществляющей вещание четырёх программ по одному ВЧ каналу. Программы, содержащие сжатую видеоинформацию и звук, вместе с пакетами служебных данных мультиплексируются (уплотняются) в один битовый поток, называемый элементарным программным Ðèñ. 15.2. Структурная схема цифровой ТВ системы
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения Ðèñ. 15.3. 415 Цифровое ТВ вещание: мультиплексирование потоком (PES — programme elementary stream). Элементарный поток каждой программы мультиплексируется еще раз в общий битовый поток, называемый транспортным потоком. Элементарный программный поток содержит идентификационные данные, временную метку и специфическую программную информацию; эти составляющие потока позволяют распаковывать пакеты данных на стороне приемника по программам и кадрам для восстановления исходного изображения. Транспортный поток поступает в модулятор и затем передается по одному ВЧ каналу 8 МГц (рис. 15.3). 15.3. Свойства телевизионного сигнала Эффективность сокращения цифрового потока в канале связи является в основном определяющим фактором жизнеспособности любой цифровой системы передачи изображений. Резервы для уменьшения цифрового потока без ущерба качеству воспроизводимого изображения заключены в специфике ТВ сигнала, которая обусловливает возможность предсказывать последующие его значения на основании предыдущих. Это свойство называют информационной избыточностью ТВ сигнала. Различают физиологическую (психофизическую), статистическую и структурную избыточности ТВ сигнала. Структурная избыточность определяется законом разложения ТВ изображения. Важнейшая ее часть образована гасящими интервалами. Физиологическая избыточность заключается в той части информации, приносимой ТВ сигналом, которая не воспринимается зрительным аппаратом человека. Примером сокращения физиологической избыточности может служить способ передачи градаций яркости от крупных и мелких деталей (внутрикадровая избыточность) и особенности восприятия движущихся объектов (межкадровая избыточность) и мелких цветных деталей: наш глаз мелкие детали в цвете не видит, а различает их только по яркостным оттенкам. Поэтому цветоразностные сигналы передаются в более узкой полосе частот, чем яркостный сигнал. Статистическая избыточность вызвана корреляционными связями между элементами в одной строке, в смежных строках и сосед-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 416 Часть V. Цифровое преобразование изображений в телевидении них кадрах. Следует отметить, что зрительный аппарат согласован со статистическими свойствами изображений, поэтому эти два вида избыточности тесно связаны между собой. Действительно, человек воспринимает окружающий мир во времени и пространстве и, соответственно этому, связи между яркостями отдельных элементов (статистика) проявляются также во времени и пространстве. То есть эти два основных вида избыточности ТВ изображения связаны через объективно существующие временную и пространственную избыточности: межэлементную, межстрочную, межкадровую и межполевую (при чересстрочной развертке). Временная избыточность изображения проявляется в относительно малом отличии двух последовательных кадров ТВ изображения. Здесь передаваемый массив информации можно сократить, если содержание одного кадра (поля), называемого опорным [33], не изменять, а в остальных передавать только информацию о переместившихся объектах в их новые положения. В некоторых случаях, например при смене сюжета, временная корреляция между ближайшими кадрами очень низка. В таких случаях решающую роль играет внутрикадровая корреляция элементов изображения. Однако, если корреляция между последовательными кадрами видеоданных высока, желательно устранить и межкадровую избыточность. Пространственная избыточность обусловлена наличием в изображении тесных связей (однотонных одинаково окрашенных участков). Отсчёты видеосигнала в соседних точках (элементах) на таких участках практически одинаковы или слабо изменяются в плоскости изображения, что позволяет заметно сократить число битов, необходимое для отображения кадра изображения. При этом в цифровом телевидении применяемые методы преобразования изображения основаны на том, что его цифровой эквивалент (сигнал ИКМ) приводится к виду, удобному для сокращения избыточной информации. Наиболее эффективным методом является преобразование видеоинформации из реальной области в спектральную (частотную). Результат преобразования представляет собой совокупность спектральных коэффициентов, которые характеризуют амплитуды пространственных частот сигнала изображения. Из различных ортогональных преобразований стандартом MPEG рекомендовано использовать дискретно-косинусное преобразование (ДКП), являющееся частным случаем двумерного преобразования Фурье. Таким образом, все современные цифровые системы передачи видеоинформации основаны в основном на сокращении этих двух видов избыточности: физиологической и статистической. Так, например, квантование сигнала от мелких деталей коэффициентов ДКП на меньшее число уровней, нелинейное квантование и определение
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 417 векторов движения устраняют физиологическую избыточность. А энтропийное кодирование устраняет статистическую избыточность. А вот сокращение числа передаваемых кадров (например, при чересстрочном разложении) устраняет как физиологическую избыточность (глаз не воспринимает весь объем информации в передаваемых кадрах), так и статистическую избыточность (корреляционные связи между кадрами значительно ослабевают). Аналогично, при дискретно-косинусном преобразовании (ДКП) устраняется статистическая избыточность (связи между соседними коэффициентами ослабевают) в пространстве. Применение ДИКМ в системах сжатия устраняет статистическую избыточность (ослабление связи между соседними кадрами) во времени. Совершенно очевидно, что чем выше корреляционные связи между элементами изображения, тем эффективнее работает система сжатия цифрового потока. Поэтому использование разности между I- и P-кадрами (∆t = 3T кадра) в системе MPEG следует считать оправданным. В отдельных случаях аналогичные результаты можно получить более простыми способами, не усложняя систему. Более подробно этот вопрос рассмотрен в главе 16. На рис. 15.4 наглядно представлены основные виды избыточности ТВ изображения, обусловленные трехмерностью функции видеосигнала Uвс = f (x, y, t). Аргумент t в формуле предполагает временную избыточность, а аргументы x и y — пространственную. Временная избыточность возникает в подвижных изображениях, в которых межкадровая (м/к) и межполевая (м/п) избыточности могут быть равны или отличны от нуля в зависимости от характера изображения. Пространственная избыточность рассматривает изображение в интервале кадра неподвижным. Здесь могут рассматриваться только внутрикадровая, внутриполевая, межстрочная и межэлементная (в/к, в/п, м/с и м/э) избыточности. При этом в/к и в/п разности обычно отличны от нуля, а м/с и м/э разности могут быть равны или отличны от нуля. Сигнал непосредственного вычитания смежных полей (м/п) может отражать пространственно-временную разность. Физиологическая избыточность ТВ сигнала обусловливается ограниченностью возможностей зрительного аппарата. Использовать физиологическую избыточность — значит не передавать ту информацию, которая не будет восприниматься нашим зрением. Статистическая избыточность определяется свойствами изображения, которое описывается законами, устанавливающими определенные связи между яркостями отдельных элементов в пространстве и времени.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 418 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 15.4. Видеосигнал (a) и виды избыточности ТВ изображения (b) Следует также отметить, что физиологическая и статистическая избыточности не обязательно должны быть связаны со временем (t) и пространством (рис. 15.4, выходы А и Б). Например, квантование видеосигнала на различное число уровней зависит только от размеров деталей (рис. 15.4, выход А), а энтропийное кодирование связано только с вероятностью появления информации (рис. 15.4, выход Б). Рисунок 15.4 и выражение uвс = f (x, y, t) наглядно иллюстрируют, что в большинстве случаев видеопоследовательности (ТВ изображение) содержат статистическую избыточность в двух направлениях — временном и пространственном. Главное статистическое свойство, на котором основана аппаратура сжатия — межэлементная корреляция, включающая предположение о коррелированности последовательных кадров видеоданных. Таким образом, значения отдельных элементов изображения могут быть предсказаны либо по значениям ближайших элементов внутри одного кадра (внутрикадровое кодирование), либо по значениям элементов, расположенных в ближайших кадрах (межкадровое кодирование и компенсация перемещения). Наиболее эффективным способом устранения временной избыточности является ДИКМ, рассмотренная в разд. 12.5. Для устранения пространственной избыточности используется преобразование Фурье — метод обработки, который анализирует изменение сигнала во времени, выражает их в виде частотного спектра. Любой сигнал можно представить совокупностью частотных гармонических составляющих и затем по известным значениям амплитуды и фазы этих составляющих линейным суммированием их восстановить исходный сигнал. Эту операцию называют обратным преобразованием Фурье. В цифровых системах сигнал выражается последовательностью во времени дискретных отсчетов   f0,0 ... f0,N −1  ..  .. (15.1)  . . f . (x,y) fN −1,0 ... fN −1,N −1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 419 При использовании преобразования Фурье для фрагмента цифрового сигнала из некоторого числа отсчетов (15.1), последний можно разложить на такое же число дискретных частот   F0,0 ... F0,N −1   .. .. (15.2)  . . F . (m,n) FN −1,0 ... FN −1,N −1 Это преобразование называют дискретным преобразованием Фурье. Поскольку любое изображение или его фрагмент в телевидении можно рассматривать как функцию изменения яркости (или цветности) как по оси x, так и по оси y, дискретное ортогональное преобразование Фурье заменяет массив этих отсчетов изображения (15.1) соответствующего фрагмента на массив коэффициентов (15.2), соответствующих амплитудам частотных составляющих Фурье. Его частный случай — ДКП — осуществляет перевод отдельных блоков изображения из пространственной области значений сигнала в область пространственных частот спектральной плоскости (15.2). В результате массиву исходных значений сигнала (15.1) соответствует массив из такого же числа коэффициентов, представляющих собой амплитуды этих косинусных составляющих (15.2) [5]. Так как объем машинных расчетов для нахождения этих коэффициентов весьма значителен, то ДКП Фурье чаще всего осуществляется над небольшими по размеру фрагментами изображения — 8×8 элементов. Для минимизации вычислений ДКП использует в качестве набора преобразующих функций (базисных) только косинусные составляющие, что оказалось возможным при использовании ортогональной структуры отсчётов телевизионного изображения [5, 18]. ДКП лежит в основе наиболее широко используемых методов кодирования JPEG, MPEG-1, MPEG-2, MPEG-4, описание которых дано в следующей главе. Двумерное ДКП реализуют по формуле [5] F(m,n) = N −1 N −1 ∑ ∑ πn(2y + 1) 2 πm(2x + 1) C(m) C(n) cos , f(x,y) cos N 2N − 1 2N − 1 x=0 y=0 где { C(m) = 1 √ 1/ 2 при m ̸= 1, при m = 0; { C(n) = 1 √ 1/ 2 при n ̸= 1, при n = 0. f(x,y) — отсчеты изображения с пространственными координатами x, y (от 0 до N − 1); N — размер блока изображения (N ×N элементов); F(m,n) — коэффициенты, характеризующие изображения в спектральной плоскости m, n (от 0 до N − 1).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 420 Часть V. Цифровое преобразование изображений в телевидении Таблица 15.1 Фазы преобразования сигналов блока изображения (8×8) при ДКП и их восстановление в декодере Выборки 139 144 144 151 150 155 159 161 159 160 161 161 162 162 162 162 оригинала 149 153 155 153 156 159 160 163 158 165 160 160 162 162 162 161 161 160 161 163 162 161 161 163 Таблица квантования 8 11 10 16 24 40 12 12 14 19 26 58 14 13 16 24 40 57 14 17 22 29 51 87 18 22 37 56 68 109 24 35 55 64 81 104 49 64 78 87 103 121 72 92 95 98 112 100 155 156 156 159 155 157 157 158 155 156 156 159 155 157 157 158 155 156 156 159 155 157 157 158 Погрешности восстановления 3 0 −2 −3 −3 −2 −1 5 −1 0 −1 −3 1 0 7 3 −1 −2 3 4 3 3 1 −2 3 2 1 −1 3 2 1 0 −1 3 1 −1 0 0 0 0 1 −1 −2 −2 0 −1 −1 3 1 −2 −1 2 3 1 5 3 ДКП (округлены) −6 2 −2 −2 2 −3 −3 0 1 −1 2 1 −1 −1 −1 2 1 0 0 0 1 −1 −1 1 2 −1 −1 2 2 0 −1 0 2 1 −1 −1 2 1 −1 −1 Коэффициенты после 158 0 −1 0 0 −2 −1 0 0 0 −1 −1 0 0 0 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 51 61 60 55 69 56 80 62 103 77 113 92 120 101 103 99 Коэффициенты после обратного квантования 1264 0 −10 0 0 0 0 24 −12 0 0 0 0 0 −14 −13 0 0 0 0 0 14 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Коэффициенты 1260 −1 −12 −22 −17 −6 −11 −10 −1 −7 −2 0 0 −1 1 2 0 1 −1 −1 0 −3 1 −3 квантования 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Восстановленные отсчеты 0 0 0 0 0 0 0 0 142 149 157 162 162 160 160 160 144 150 158 162 162 161 160 161 147 153 159 163 162 161 161 163 150 155 161 163 162 161 162 164 152 156 161 162 161 160 161 164 153 157 160 160 158 158 160 163 154 156 159 158 156 156 158 161 154 156 158 157 155 154 157 160 отсчетов −1 0 2 −2 0 −3 0 2 ДКП является обратимым: по распределению F(m,n) обратным преобразованием f(x,y) однозначно восстанавливается в декодирующем устройстве из имеющихся трансформант: f(x,y) = N −1 N −1 2 ∑ ∑ πm(2x + 1) πn(2y + 1) F(m,n) cos cos . N m=0 n=0 2N − 1 2N − 1 Квантование является звеном обработки сигнала, на котором происходят потери. Оно определяет точность отражения результа-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 421 тов ДКП и коэффициент сжатия. При квантовании каждое из значений ДКП делится на коэффициент квантования Q(m,n) , индивидуальный для каждой пространственной частоты, который берется из заранее определенной таблицы коэффициентов квантования размером 8×8 (естественно, она должна быть одинаковой для кодера и декодера). Эта таблица может быть взята по умолчанию или формируется кодером для конкретных изображений и передается декодеру вместе со сжатыми данными. Для сигнала цветного изображения таблицы могут различаться для разных компонентов (Y, CR , CB ). При декодировании исходные величины приближенно восстанавливаются умножением на фактор квантования. Сказанное поясняется табл. 15.1 [13]. Из таблицы видно, что восстановленное изображение отличается от оригинала незначительно. Рассмотренные виды избыточности ТВ сигнала и способы их устранения использованы в стандартах описания цифрового потока в канале связи JPEG, MPEG и других стандартах. 15.4. Теоретические основы кодирования и преобразования аналогового видеосигнала в цифровой Стандарты сжатия спектра статических (JPEG) и динамических (MPEG) изображений используют способ кодирования с преобразованием. Повышение эффективности кодирования в результате использования преобразования связано в основном с тремя факторами: • в процессе преобразования ряд коэффициентов становится настолько малыми, что их можно отбросить без заметного изменения качества восстановленных изображений; • в процессе преобразования осуществляется декорреляция данных, обеспечивающая повышение эффективности статистического кодирования; • различное нелинейное квантование коэффициентов преобразования позволяет существенно сократить объём передаваемой информации без заметного изменения качества изображения при его восстановлении. В качестве метода преобразования используется дискретное косинусное преобразование (ДКП), которое имеет сходство с дискретным преобразованием Фурье (ДПФ). Рассмотрим подробнее эти два преобразования. Как известно, ДПФ основано на разложении в ряд Фурье дискретного сигнала f (n∆T ), n ∈ {0, 1, 2, . . . , N − 1}, на интервале T = N ∆T , ограниченного по частоте так, что в нём не содержатся гармонические составляющие с номерами по модулю, превышающими N/2, и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 422 Часть V. Цифровое преобразование изображений в телевидении может быть записано в виде ряда [88] fд (t) = ∆T ∑ ∑ N/2 f (n∆T )δ(t − n∆T ) = ck exp(jkΩ0 t) (15.3) −N/2 с соответствующими коэффициентами разложения ck = N −1 1 ∑ f (n)W kn , N n=0 (15.4) где W = exp(−j2π/N ), f (n) = f (n∆T ), Ω0 = 2π/T . На основе этого одномерное ДПФ определяется следующим образом. Если {f (n)} — последовательность f (n) отсчётов сигнала (конечных действующих значений) для всех n ∈ {0, 1, . . . , N − 1}, то прямое ДПФ определяется выражением (15.4), где k ∈ {0, 1, . . . , N − 1} и комплексное ядро преобразования W kn = exp(−j2πkn/N ) удовлетворяет условию ортогональности { N −1 ∑ 0 при k ̸= l; kn −ln W W = N при k = l, n=0 т. е., используя это условие и выражение (15.4), получаем N −1 ∑ ck W −kn = k=0 = 1 N N −1 ∑ [f (0)+f (1)W k +. . .+f (n)W kn +. . .+f (N −1)W k(N −1) ]W −kn , 0 откуда можно выразить f (n) и определить обратное ДПФ f (n) = N −1 ∑ ck W −kn , n ∈ {0, 1, . . . , M − 1}. k=0 Константу нормирования 1/N из (15.4) можно пропорционально ввести в формулы для прямого и обратного ДПФ. Недостаток ДПФ с точки зрения кодирования с преобразованием заключается в том, что коэффициенты преобразования, общее количество которых составляет 2N , а период равен T = N ∆T , носят комплексный характер. Учитывая состав коэффициентов преобразования, целесообразнее осуществлять такое преобразование, в котором используется только реальная или мнимая часть ядра преобразования, т. е. только члены cos или sin. Однако в этом случае необходимо обеспечить полноту ортогональных систем преобразования, т. е. выполнение двух условий:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 423 • вне множества ортогональных функций не существует другой функции, удовлетворяющей условию ортогональности; • сходимость разложения к исходному сигналу f (n). Если перейти от ДПФ к ДКП, основанному на базисе ортогональных косинусных составляющих, то выбором соответствующего интервала T необходимо добиться того, чтобы множество ортогональных функций образовывало полную систему. В качестве ортогональных функций нельзя выбирать обычные косинусные функции cos(kΩ0 t), так как это связано с использованием функций sin(kΩ0 t). Удовлетворить условию ортогональности системы проще всего выбором ортогональных составляющих вида cos(kπ/T ), что в более полной форме можно записать как ) ( 2n + 1 kπ , k, n ∈ {0, 1, . . . , N − 1}. φk = cos 2N Таким образом, прямое ДКП будет определяться выражением ( ) N −1 ∑ 2 2n + 1 C(k) = c(k) f (n) cos kπ , k ∈ {0, 1, . . . , N − 1}, N 2N n=0 а обратное преобразование f (n) = N −1 ∑ ( c(k)C(k) cos k=0 где { c(k) = √ 1/ 2 1 ) 2n + 1 kπ , 2N n ∈ {0, 1, . . . , N − 1}, для k = 0; для k ∈ {1, . . . , N − 1}. Для преобразования двумерных фрагментов изображения определим понятие двумерного преобразования. Разделимое ядро ДКП (без учёта константы нормирования) имеет вид ( ) ( ) 2n + 1 2m + 1 φr (k, n, l, m) = cos kπ cos lπ , 2N 2M где k, n ∈ {0, 1, . . . , N − 1}, l, m ∈ {0, 1, . . . , N − 1}. Таким образом, прямое ДКП двумерного фрагмента размером (N × M ) может быть записано как [C(k, l)] = [φ(k, n)][f (n, m)][φ(l, m)]т , где [f (n, m)] — сигнальная матрица размером, в общем случае, (N × M ); [C(k, l)] — соответствующая матрица спектральных коэффициентов ДКП размером (N × M ); [φ(k, n)] — квадратная матрица ДКП
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 424 Часть V. Цифровое преобразование изображений в телевидении размером (N × M ): √ [φ(k, n)] =   1 √ 2  2 ( )  ; N cos 2n + 1 kπ 2N [φ(l, m)]т — квадратная матрица ДКП размером (M × M ), транспонированная по отношению к матрице [φ(k, n)]. Соответствующая матричная форма записи двумерного обратного ДКП имеет вид [f (n, m)] = [φ(k, n)]т [C(k, l)][φ(l, m)], где символом «т» обозначен оператор транспонирования. 15.4.1. Внутрикадровое кодирование Двумерное ДКП целесообразно применять к блокам изображения, поскольку небольшие блоки изображения имеют значительную пространственную избыточность. Это объясняется тем, что чем меньше размер блока, тем больше вероятность содержания в нём отсчётов с близкими по уровню значениями. Таким образом, после ДКП такого блока коэффициенты, соответствующие высокочастотным составляющим сигнала, будут иметь нулевую амплитуду и могут быть отброшены без внесения искажений в сигнал. Размер блока можно выбирать исходя из параметра эффективности G0 = E0 /ET , где E0 — энтропия исходного сигнала, ET — средняя энтропия коэффициентов преобразования. Зависимость функции G0 от размера блока (N × N ) приведена на рис. 15.5. Как видно из рис. 15.5, размер блока 8 × 8 Ðèñ. 15.5. Заявляется компромиссным между значением эфвисимость функфективности и стремлением уменьшить размер ции G0 от размеров блока (N × N ) блока. Рассмотрим двумерное ДКП на примере. Матрица блока отсчётов изображения имеет вид   154 123 123 123 123 123 123 136  192 180 136 154 154 154 136 110     254 198 154 154 180 154 123 123     239 180 136 180 180 166 123 123  I= .  180 154 136 167 166 149 136 136     128 136 123 136 154 180 198 154    123 105 110 149 136 136 180 166 110 136 123 123 123 136 154 136
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 425 Поскольку ДКП рассчитано на работу со значениями пикселей, лежащих в диапазоне от −128 до 127, вычитаем из каждого отсчёта исходного блока число 128. Получаем матрицу   26 −5 −5 −5 −5 −5 −5 8  64 52 8 26 26 26 8 −18     126 70  26 26 52 −5 −5    111 52 8 52 52 38 −5 −5    M = .  52 26 8 39 38 21 8 8     0 8 −5 8 26 52 70 26     −5 −23 −18 21 8 8 52 38  18 −5 8 −5 −5 8 26 8 Теперь к матрице M можно применить ДКП в соответствии с выражением (15.5). Таким образом, сначала будет выполнено преобразование по строкам матрицы M , затем по столбцам. В результате будет получена матрица коэффициентов преобразования   162,3 40,6 20,0 72,3 30,3 12,5 −19,7 −11,5  30,5 108,4 10,5 32,3 27,7 −15,5 18,4 −2,0     −94,1 −60,1 12,3 −43,4 −31,3 6,1 −3,3 7,1     −38,6 −83,4 −5,4 −22,2 −13,5 15,5 −1,3 3,5    D= .  −31,3 17,9 −5,5 −12,4 14,3 −6,0 11,5 −6,0     −0,9 −11,8 12,8 0,2 28,1 12,6 8,4 2,9     4,6 −2,4 12,2 6,6 −18,7 −12,8 7,7 12,0  −10,0 11,2 7,8 −16,3 21,5 0,0 5,9 10,7 Матрица D содержит 64 коэффициента cij , где i и j лежат в диапазоне от 0 до 7. Коэффициент в левом верхнем углу матрицы c00 (здесь 162,3) пропорционален постоянной составляющей, которая определяет среднюю яркость исходного блока изображения. Коэффициент матрицы c77 (10,7) соответствует самой высокой пространственной частоте. Коэффициенты квантования определяют коэффициент сжатия и качество реконструированного изображения. Матрица квантования JPEG выбрана экспериментально, основываясь на свойствах зрительной системы человека (ЗСЧ). Её специфика заключается в том, что на высоких пространственных частотах, особенно по диагонали, чувствительность ЗСЧ заметно ниже, чем на низких частотах. Поэтому квантовать ВЧ коэффициенты можно более грубо. Квантование реализуется делением каждого элемента матрицы преобразованного изображения D на соответствующий элемент мат-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 426 Часть V. Цифровое преобразование изображений в телевидении рицы квантования  16  12   14   14 Q50 =   18   24  49 72 Q: 11 12 13 17 22 35 64 92 10 14 16 22 37 55 78 95 16 19 24 29 56 64 87 98 24 26 40 51 68 81 103 112 40 58 57 87 109 104 121 100 и округления результата до ближайшего  10 4 9  3  −7 −5  ( )  Di,j  −3 −5 Ci,j = round ; C=  −2 1 Qi,j  0  0  0 0 0 0 51 60 69 80 103 113 120 103  61 55   56   62   77   92   101 99 (15.5) целого значения 2 1 1 0 0 0 0 0 5 2 −2 −1 0 0 0 0 1 1 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0  0 0  0  0 . 0  0  0 0 Квантованная матрица C содержит нулевые коэффициенты, число которых зависит от степени сжатия, причём число нулевых коэффициентов растёт с приближением к коэффициенту c77 , т. е. правому нижнему углу матрицы C. Это обстоятельство позволяет применить зигзагообразное сканирование коэффициентов, как показано на рис. 15.6, на примере блока размером 4×4 элемента. Ðèñ. 15.6. ЗигзагоПоследовательность отсчётов, сканирообразное сканироваванных таким образом, будет содержать в ние коэффициентов конце относительно длинную серию нулей, которая может быть эффективна сжата с использованием кодера длин серий. Вышеописанные операции, используемые в стандарте JPEG, являются аналогичными операциям, выполняемым при внутрикадровом кодировании в стандарте MPEG, в котором, кроме пространственной избыточности, также устраняется временная избыточность. 15.4.2. Межкадровое кодирование Временная избыточность изображения проявляется в относительно малом отличии двух смежных кадров ТВ изображения. Как правило, изображение представляет собой неподвижный задний план и относительно медленно перемещающиеся на переднем плане объекты.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 427 15.7. Упрощенная схема кодера MPEG-2: ДКП — блок дискретного косинусного преобразования; Q — блок квантования; Q−1 — блок деквантования; ОДКП — блок обратного ДКП; ОКД — блок оценки и компенсации движения; ЭК — энтропийный кодер Ðèñ. Можно сократить передаваемый объём информации, если содержание одного кадра, называемого опорным, передавать целиком, а вместо следующего кадра передавать только информацию о переместившихся объектах в их новых положениях. Этот способ был значительно усовершенствован, когда применили предсказание кадра на основе одного или нескольких предыдущих и последующих и стали передавать разницу между текущим и предсказанным кадрами [33, 73, 99]. Отметим, что для повышения точности предсказания в качестве опорного берут не оригинальный предыдущий кадр, а восстановленный в декодере, т. е. в кодере для этой цели эмулируется декодер. На рис. 15.7 показана упрощённая схема кодера MPEG-2. Отметим, что для квантования ошибки предсказания используется матрица коэффициентов квантования, все элементы которой равны 16. Для оценки движения, из-за своей простоты, наиболее широкое распространение получил метод сопряжения блоков, пояснённый на рис. 15.8. В этом методе текущий кадр (K) видеопоследовательности разделяется на блоки размером n×n пикселей. Для каждого блока Bm в текущем кадре производится поиск в заданной области поиска ′ в предыдущем кадре (K−1). (Rx , Ry ) наиболее подходящего блока Bm Ðèñ. 15.8. Оценка движения методом сопряжения блоков
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 428 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 15.9. Изображения, полученные при компенсации движения (a, b, v), и модуль сигнала ошибки предсказания (g) Критерием для определения подходящего блока является сумма абсолютных разностей (SAD) SAD(u, v) = n ∑ n ∑ |S(i + u, j + v) − I(i, j)|, −p 6 u, v 6 p, i=1 j=1 где I(i, j) — пиксель опорного блока в текущем кадре; S(i+u, j +v) — пиксель оцениваемого блока в заданной области поиска предыдущего кадра. Заметим, что область поиска содержит (n + 2p) × (n + 2p) пикселей, где p — максимальное смещение, а общее число возможных блоков (n + 2p)2 . Наиболее простым подходом для поиска блока является использование алгоритма полного поиска (FSA). Для каждого опорного блока (всего для поиска возможно (n + 2p)2 блоков) определяется наиболее подходящий блок, который используется как предсказанная оценка для опорного блока. Относительное смещение между опорным блоком и наиболее подходящим блоком является вектором движения dm , который передаётся в декодер. Заметим, что выполнение FSA является процедурой, требующей больших вычислительных затрат. Поэтому для ряда случаев разработаны быстрые алгоритмы поиска: логарифмический поиск, трёхшаговый поиск и т. д.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 429 На рис. 15.9,a,b,v,g показаны предыдущий кадр K − 1 с наложенным на него полем оцененных векторов движения, текущий кадр K, кадр с компенсированным движением K̃, модуль сигнала ошибки предсказания E = |K − K̃| соответственно. Как видно из рис. 15.9,g, ошибка предсказания имеет максимальное значение в пространственных областях, в которых находятся движущиеся объекты изображения. Энергия полученной ошибки предсказания значительно меньше, чем энергия кадра. Поэтому необходимое число битов, которым будут представлены квантованная ошибка предсказания и поле векторов движения, будет меньше числа битов, необходимых для представления квантованного кадра изображения. Этим объясняется снижение необходимой скорости передачи видеосигнала при использовании предсказания движения. 15.5. Структурная схема сжатия неподвижных изображений по стандарту JPEG Стандарт JPEG используется в основном для записи неподвижных изображений и позволяет уменьшить объем информации в 5...10 раз без заметного ухудшения визуального качества. Последовательность операций при кодировании (рис. 15.10,a): • разбиение изображения на блоки 8×8 пикселей; • выполнение быстрого ДКП в каждом блоке; • квантование полученных коэффициентов ДКП с использованием таблицы коэффициентов квантования (таблица Q); • энтропийное кодирование квантованных коэффициентов ДКП каждого блока изображения, которое выполняется кодером Хаффмена с использованием таблицы кодов (см. главу 17). Ðèñ. 15.10. Структурная схема JPEG
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 430 Часть V. Цифровое преобразование изображений в телевидении Последовательность операций в декодирующем устройстве является обратной: декодирование энтропийного кода, деквантование и обратное ДКП (рис. 15.10,b). 15.6. Кодирование видеоданных по стандарту MPEG Кратко рассмотрим последовательность операций в кодирующем устройстве MPEG (рис. 15.11). Ðèñ. 15.11. Кодирование видеоданных по стандарту MPEG По стандарту MPEG выполняются следующие основные операции сжатия: удаление временной (ДИКМ) и пространственной (ДКП) избыточностей и нахождение векторов движения. Удаление временной избыточности представляет собой межкадровое сжатие данных, при котором происходит сравнение двух последовательных видеокадров, удаление одинаковых областей и формирование разностей кадров для обработки. Удаление пространственной избыточности, называемое также внутрикадровым сжатием, исключает ненужные повторения и малозаметные изменения элементов содержимого конкретного видеокадра. Операции удаления выполняются на основе сложных математических выражений, называемых дискретным косинусным преобразованием (ДКП), отсюда происходит название этого способа: «сжатие данных на основе ДКП». За блоком сжатия данных стоит блок квантования, который обеспечивает дальнейшее битовое сжатие. 15.6.1. Подготовка видеоданных. Разбиение изображения на блоки в JPEG и MPEG Видеоинформация, поступающая на вход видеокодера, представлена последовательностью кодированных отсчётов сигнала яркости Y и сигналов цветности (СЦВ) CR и CB ; затем отсчёты (элементы изображения) перегруппировываются в блоки, макроблоки и вырезки (срезы, слайсы). Вырезки состоят из группы последовательных макроблоков в видеокадре, объединяемых общей шкалой квантования.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 431 Сначала кадры Y , CR и CB делятся на ряд блоков пикселей (отсчётов). Каждый блок представляет собой, например, матрицу 8×8 закодированных в цифровом виде отсчетов пикселей:   177 178 179 178 179 180 180 180  175 176 177 177 177 177 178 179     176 178 180 178 178 178 178 178     175 180 181 180 181 179 178 177  Y = ;  175 179 179 179 177 178 178 177     176 177 177 177 176 176 169 169    178 175 176 177 175 175 169 169 177 176 176 174 174 174 165 165   67 67 68 69 69 69 70 70  66 67 67 68 69 69 68 68     67 68 68 69 69 69 68 68     69 69 70 70 70 69 68 67  CR =  ;  68 69 69 70 69 67 65 64     66 67 67 67 66 64 62 60    65 65 66 66 64 62 59 57 65 66 66 66 64 61 58 56   77 77 78 79 79 79 80 80  76 77 77 78 79 79 78 78     77 78 78 79 79 79 78 78     79 79 80 80 80 79 78 77  CB =  .  78 79 79 80 79 77 75 74     76 77 77 77 76 74 72 70    75 75 76 76 74 72 69 67 75 76 76 76 74 71 68 66 Три компонента Y , CR и CB , представленных базовыми блоками, объединяются и образуют макроблок (рис. 15.12). Каждый макроблок состоит из четырех блоков яркости и четырех блоков цветности (по два блока каждой составляющей: CR и CB ). Это дает так называемый формат 4:2:2. Затем макроблоки выстраиваются в том порядке, в каком они появляются на изображении, чтобы получить вырезку. Вырезка может состоять из нескольких макроблоков. На этом этапе к каждой вырезке добавляются биты обнаружения ошибки. Если в ступени декодирования приемника обнаруживаются ошибки, то декодер игнорирует информацию, содержащуюся в данной вырезке, и переходит к следующей. Последовательность вырезок восстанавливает полный видеокадр (рис. 15.13), содержащий все три составляющие изображения (Y , CR , CB ) и готовый к следующему этапу кодирования видеоданных. Для цветного изображения в формате Y , CB , CR задаются зна-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 432 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 15.12. Разбивка изображения на блоки и макроблоки: a — скорость цифрового потока V = 108 + 54 = 162 Мбит/с; b — V = 108 + 108 = 216 Мбит/с Ðèñ. 15.13. Форматы представления телевизионного сигнала чения яркости и цветоразностных сигналов. Для формата 4:2:0 на каждые четыре блока элементов сигнала яркости Y будет приходиться один блок элементов сигнала CB и один блок элементов CR (рис. 15.12,a) в порядке, указанном в табл. 15.2,a. 4:2:2 — макроблок состоит из восьми блоков. Он содержит четыре блока Y , два CR и два CB (рис. 15.12,b) в порядке, указанном в табл. 15.2,b. 4:4:4 — макроблок из двенадцати блоков. Он содержит четыре блока Y , четыре CR и четыре CB в порядке, указанном в табл. 15.2,v. Таблица 15.2 Y 1 3 2 4 a) CB CR 5 – 6 – Y 1 3 2 4 b) CB CR 5 7 6 8 Y 1 3 CB 2 4 5 7 v) 9 11 CR 6 8 10 12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 433 Матрицы CR и CB равны по размеру матрице Y . Если изображение передается полями (с чересстрочной разверткой), то количество строк в изображении должно быть кратно двум. Каждому отсчету яркости соответствует по одному отсчету из матриц цветности. Внутренняя организация макроблоков различна при кодировании полей и кадров. При кодировании полей блоки яркости группируются по полям: верхние — из первого полукадра, нижние — из второго. Блоки цветности располагаются в порядке следования кадров для обоих типов кодирования (для кодирования 4:2:2 и 4:4:4 данные о цвете также могут располагаться по полям). Следующие друг за другом макроблоки объединяют в независимые друг от друга серии (Slice). Серия является основным элементом синхронизации для восстановления данных, составляющих изображение и обычно состоит из всех блоков в горизонтальном направлении изображения с интервалом 16 строк, т. е. имеет толщину в один макроблок. Порядок макроблоков в серии тот же, что и при обычном сканировании растра в телевидении: слева направо и сверху вниз (рис. 15.14). Представление информации сериями удобно для коррекции ошибок. Когда появляется ошибка в потоке данных, декодер может обратиться к началу следующей серии. Соответственно, число таких серий влияет на эффективность передачи. Поток кадров изображения разбивается по типам, для них находятся векторы движения, которые необходимы для повышения предсказуемости элементов изображения. Векторы движения обеспечивают компенсацию перемещений в прошедших и последующих кадрах. Компенсация движения применяется при предсказании текущего кадра на основе предыдущих и интерполяционного предсказания на основе прошедших и последующих изображений. Векторы движения определяются для каждой зоны изображения с размерами 16×16 пикселей, т. е. для макроблоков (рассмотрено ниже). Возможны два варианта кодирования блоков цветного изображения. По первому, последовательному, сначала кодируются все блоки элементов сигнала Y (см. рис. 15.12), затем все блоки элементов сигнала CR и далее все блоки сигнала CB . Второй вариант предусматривает перемежение блоков разных составляющих. Например, при формате 4:2:0 сначала кодируются четыре блока Y , образующие матрицу 2×2, затем один блок CR и далее — один блок GB , затем следующие четыре блока Y и т. д. При объединении блоков в декодированное изображение необходимое количество элементов CB , CR восстанавливается с помощью интерполяции. Макроблок 4:2:0 состоит из 6 блоков: четыре блока яркости Y (1–4) и два блока цветности CR (5) и CB (6) (см. рис. 15.12,a). Мат-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 434 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 15.14. Деление изображения на срезы и макроблоки для сигнала яркости Y рицы CR и CB в два раза меньше (как по горизонтали, так и по вертикали), чем матрица Y . Для повышения качества цветного изображения число отсчетов цветности в формате 4:2:0 можно довести интерполяцией до числа отсчетов формата 4:2:2, макроблок которого состоит из 8 блоков: четыре блока Y и по два блока GR и CB (рис. 15.12,b). 15.6.2. Удаление временно́й избыточности Решение данной задачи основано на том обстоятельстве, что различие между двумя последовательными кадрами ТВ изображений чаще всего очень мало. Соответственно, нет необходимости передавать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения Ðèñ. 15.15. 435 Группа изображений содержание каждого видеокадра полностью, поскольку большая часть текущего кадра просто повторяет предыдущий кадр. Временно́е сжатие выполняется на группе изображений (GOP — group of pictures), состоящей обычно из 12 кадров. Содержимое первого кадра группы, называемого кадром I, сохраняется в памяти и используется как эталонный кадр для последующих 11 кадров (рис. 15.15). Содержимое кадра, следующего сразу же за эталонным кадром I, сравнивается с кадром I для образования разностного кадра, называемого кадром Р (от predicted — предсказываемый), который используется для обработки. Затем с первым кадром после кадра I сравнивается второй кадр после кадра I, третий кадр со вторым и т. д. до конца группы из 12 видеокадров. Затем для следующей группы из 12 кадров образуется новый эталонный кадр I и т. д. Сжатие кадров I ограничено, максимальное битовое сжатие получается в кадрах Р. Повышенное сжатие можно получить, используя два других способа: прямое предсказание и предсказание с компенсацией движения. Прямое предсказание — это метод, который используется для создания кадров Р; он включает в себя предсказание ожидаемой разности между макроблоками последовательных кадров и передачу предсказанных кадров на обработку. Для этого требуется хранение более одного видеокадра. В прямом предсказании в качестве эталонного можно использовать кадр I или ранее восстановленный кадр Р. Недостатком этого способа является то, что возникающие в кадре Р ошибки будут передаваться в последующие кадры до поступления очередного кадра I. Предсказание с компенсацией движения заключается в сравнении содержимого предыдущего кадра и последующего кадра для конструирования текущего кадра. Конструируемый кадр называется кадром В (от backward-prediction — обратное предсказание или от bidirectional — двунаправленный, поскольку его содержимое зависит как от предыдущего кадра, так и от последующего). В отличие от кадров I и Р кадры В нельзя использовать как эталоны. Они также требуют хранения двух кадров в памяти изображения. На рис. 15.15 показана типовая последовательность из 12 кадров I, Р и В (0–11).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 436 Часть V. Цифровое преобразование изображений в телевидении Компенсация движения. Компенсация движения используется для того, чтобы корректировать ошибки, которые могут появиться в предсказываемых кадрах. Сравнивая положение объекта в последовательных кадрах, можно точно вычислить скорость и направление движения объекта. На основе этих вычислений можно предсказать положение объекта в последующих кадрах (обычно в кадрах яркости). Чтобы описать вектор скорости и направления движения, требуется относительно малый объем данных; эти данные поступают на генераторы кадров Р и В. Как только вектор движения определен, он используется для формирования трех составляющих изображения — Y , CR и CB . 15.6.3. Удаление пространственной избыточности на основе ДКП В большинстве случаев видеопоследовательности (ТВ изображение) содержат статистическую избыточность в двух направлениях — временно́м и пространственном. Главное, статистическая характеристика, на которой основана аппаратура сжатия, — межэлементная корреляция, включающая предположение о коррелированности элементов отдельных и последовательных во времени кадров видеоданных. Поэтому значения отдельных элементов изображения могут быть предсказаны и по значениям ближайших элементов внутри одного кадра (внутрикадровое кодирование), и по значениям элементов, расположенных в ближайших кадрах (межкадровое кодирование и компенсация перемещения) [33, 73]. В некоторых случаях, например при смене видеосцены и видеопоследовательности, временная корреляция между ближайшими кадрами очень низка. В таких случаях решающую в весовом отношении роль играет внутрикадровая корреляция, т. е. пространственная корреляция пикселей изображения. Однако, если корреляция между последовательными кадрами видеоданных высока, желательно использовать при сжатии спектра временное предсказание. На практике для достижения высокой степени сжатия видеоинформации используется комбинация из двух подходов. Пространственная избыточность изображения обычно обусловлена наличием в видеокадре групп однотипных смежных элементов. Отсчеты в соседних по координатам точках на таких участках практически одинаковы. В соответствующем двухмерном пространственном спектре присутствуют в основном НЧ составляющие. При использовании ДКП (рис. 15.16) получаемые в данном случае уровни большинства коэффициентов ДКП весьма малы (см. табл. 15.1), а последующее деление при квантовании приводит к их обнулению или к сильному уменьшению, что и определяет снижение скорости передаваемого цифрового потока.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 437 Глава 15. Системы сжатия цифровых сигналов изображения Ðèñ. 15.16. Удаление пространственной избыточности на основе ДКП После предварительной обработки разностные ошибки предсказания или же сами блоки подвергаются ДКП. В результате исходная матрица отсчётов независимых блоков, например   146  150   155   163   159  161   161 160 144 151 155 161 160 161 162 162 149 153 160 162 161 161 161 161 153 156 163 160 162 161 163 161 155 159 158 160 162 160 162 163 155 156 156 159 155 157 157 158 155 156 156 159 155 157 157 158 155 156   156   159  , 155   157  157  158 преобразуется в матрицу частотных коэффициентов  314, 91  −5, 65   −2, 74   −1, 77 D=  −0, 16  0, 44   −0, 32 −0, 65 −0, 26 −4, 32 −2, 32 −0, 48 −0, 21 −0, 05 −0, 09 0, 39 −3, 02 −1, 56 −0, 39 0, 06 0, 37 0, 41 −0, 08 −0, 94 −0, 53 −0, 79 0, 38 0, 36 0, 39 −0, 09 −0, 37 −0, 46 −0, 42 −0, 71 0, 05 0, 22 −0, 03 −0, 19 −0, 12 0, 47 −0, 42 −0, 02 −0, 24 −0, 02 −0, 17 0, 37 0, 43 0, 3 −0, 68 0, 11 −0, 14 −0, 01 0, 15 0, 26 0, 21 −0, 14  −0, 33 −0, 3   −0, 02   0, 08  . 0, 32   −0, 25  −0, 19  −0, 11 Каждый коэффициент характеризует амплитуду определенной частотной составляющей кадра, причем коэффициенты в матрице располагаются по возрастанию частот в вертикальном и горизонтальном направлениях. По существу, каждая ДКП-матрица определяет двумерный частотный спектр блока кадра изображения. При этом основная энергия чаще всего концентрируется около нулевых частот. Амплитуда высокочастотных составляющих, как правило, мала или равна нулю, поэтому их потеря при квантовании существенно не сказывается на визуальном качестве изображения. Коэффициенты, не превышающие некоторого порогового значения, не передаются, что и приводит к желаемой компрессии спектра. Основное устройство кодирования видеоинформации — процессор ДКП. На процессор ДКП поступают кадры изображения I, P и В в виде потока блоков 8×8, организованных в макроблоки и вырезки, образующие один видеокадр (рис. 15.16). Блоки могут являться частью кадра яркости (Y ) или кадра цветности (CR и CB ). Перед ДКП каждое число в блоке 8×8 представляет значение уровня соответствующего
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 438 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 15.17. Блок частотной области отсчета, например пикселя яркости, представленного этим отсчетом. Данные, определяющие уровни отсчетов в каждом текущем блоке, переводятся в процессоре ДКП в матрицу соответствующих коэффициентов 8×8 преобразования, представляющих видеообраз блока. Процессор ДКП формирует при этом пространственные частотные компоненты блока в целом, переводя общую матрицу значений сигнала временной области в матрицу коэффициентов ДКП частотной области. Эта операция связана с созданием набора коэффициентов в матрице 8×8, начиная с верхней левой ячейки, представляющей постоянную составляющую (с частотой 0 Гц). Коэффициент в этой ячейке соответствует средней яркости данного блока. Каждая из остальных ячеек представляет, с возрастанием пространственных частот, другие составляющие спектра блока (рис. 15.17). Коэффициенты в этих ячейках определяются количеством отличающихся деталей изображения в пределах блока. Следовательно, блок, отражающий
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 439 одинаковую яркость (или цвет), например представляющий участок чистого неба, будет иметь только постоянную составляющую; коэффициенты в других ячейках будут нулевыми. Блок, включающий и иную деталь изображения, будет иметь ненулевые коэффициенты в соответствующих ячейках. Крупной детали в изображении блока соответствуют коэффициенты с большими значениями модулей уровней (всего несколько ячеек могут содержать ненулевые коэффициенты); мелкая деталь изображения представляется малыми коэффициентами, распределёнными по большему числу ячеек матрицы. Тонкие вертикальные детали изображения отражаются расширением спектра по горизонтали вправо; более тонкие горизонтальные детали отражаются при ДКП — расширением по вертикали вниз (рис. 15.17). Самая высокая по модулю видеочастота представляется нижней диагональной ячейкой. Как можно заметить из матрицы D (см. с. 439), ДКП типичного блока, наибольшие коэффициенты и, следовательно, бо́льшая часть энергии сосредоточены в верхнем левом углу и вблизи него; в нижнем правом квадранте очень мало больших коэффициентов. Такое распределение коэффициентов не является неожиданным, поскольку низка вероятность варианта, когда в блок пикселей 8×8 попадает незначительный по размеру элемент пространственной структуры изображения. Коэффициенты ДКП округляются в сторону увеличения или уменьшения, что снижает диапазон их значений, упрощает (огрубляет) конечный набор коэффициентов и, соответственно, сокращает число передаваемых данных, например:   315 2 −1 −2 1 0 0 0 0 0 0 0 0  −4 −3 −2   −2 −3 0  0 0  0  0 0  2  0 0 0   0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0  0  0 . 0  0 0 0 Ðèñ. 15.18. Зигзагообразное сканиро- При квантовании матрица вание ДКП каждого блока переводится в последовательную форму сканированием по зигзагообразному пути, начиная с верхнего левого коэффициента (постоянная составляющая), как показано на рис. 15.18. 15.6.4. Квантование коэффициентов ДКП После ДКП коэффициенты могут принять не целые значения, а на вход кодера необходимо подавать дискретную последовательность.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 440 Часть V. Цифровое преобразование изображений в телевидении Она получается при квантовании коэффициентов и расстановке их в ряд для подачи на хаффмановский кодер с помощью зигзагообразного сканирования (см. рис. 15.18). Полученная после ДКП матрица коэффициентов спектра кодируется с учетом чувствительности глаза к различным пространственным частотам, причем при передаче более высокочастотных компонентов возможная погрешность может быть увеличена. Зрение человека, в частности, наиболее чувствительно к градациям яркости крупных деталей, поэтому для коэффициентов, соответствующих нулевым пространственным частотам, шаг квантования должен быть минимален. Для более высоких пространственных частот можно применить квантование на меньшее число уровней. Далее используется энтропийное кодирование. В процессе кодирования каждому коэффициенту присваивается индивидуальный уровень квантования в соответствии с его положением в матрице, который определяется весовым или масштабный множителем, учитывающим его относительную значимость для видеоконтроля. Самый высокий уровень квантования присваивается верхнему левому элементу матрицы, который представляет постоянную составляющую. Коэффициент постоянной составляющей кодируется с наивысшим уровнем точности, поскольку видимость шумов, обусловленных процедурой квантования, максимальна на низкочастотной видеоинформации. Высокочастотная информация может допускать более высокий уровень ошибок квантования, поэтому ей присваиваются более низкие уровни квантования. Весовые (масштабные) множители квантования затем модифицируются, чтобы учесть битовую скорость на выходе процессора ДКП. Если имеется грубая деталь изображения и большинство коэффициентов ДКП равны или близки к нулю, т. е. несущественны, то процессор ДКП формирует короткую строку коэффициентов, что приводит к минимальным требованиям к битовой скорости и полосе. Однако блок с более тонкими деталями изображения будет представляться длинной строкой коэффициентов и поэтому более высокими требованиями к битовой скорости и полосе, которые могут выйти за установленные границы. Чтобы избежать этого, используется кодирование с переменной длиной (рис. 15.19). Такое кодирование обеспечивает Ðèñ. 15.19. Квантование с переменной длиной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 441 динамическое изменение весовых коэффициентов квантования в зависимости от битовой скорости, возникающей в самом процессоре ДКП. Квантованные биты поступают сначала в буферную память, а затем передаются с постоянной скоростью в кодирующее устройство передачи. Если битовая скорость увеличивается и буфер начинает переполняться, то запускается блок управления битовой скоростью, уровень квантования уменьшается, точность передачи многомерной структуры изображения и битовая скорость снижаются. Другими словами, выходная битовая скорость цифрового потока поддерживается на выходе кодирующего блока постоянной. 15.7. Достижимые степени сжатия на основе ДКП Современные методы сжатия спектра сигналов как неподвижных изображений, так и видеоизображений, обеспечивают сжатие в десятки, а иногда в сотни раз, что обусловливает возникновение сопутствующих потерь качества при воспроизведении, т. е. восстановленное изображение не совпадает в точности с исходным. Потери эти связаны с отказом от передачи или некоторого «огрубления» тех компонентов изображения, чувствительность к точности воспроизведения которых у человеческого глаза невелика. Рассмотрим это на конкретных примерах. В основе ставших уже классическими стандартов сжатия JPEG (для статических изображений) и MPEG (для видеоданных), так же, как и в сравнительно новых методах сжатия на основе Wavelet-преобразования, лежит переход от пространственного представления изображения к спектральному. Это позволяет селективно и раздельно обрабатывать составляющие многомерной структуры изображений в различной степени влияющие на его качественные характеристики. В случае JPEG/MPEG для такого перехода используется ДКП на блоках 8×8, в случае Wavelet — система фильтров, примененных к изображению. На рис. 15.20 приведен фрагмент некоего блока (матрицы) пикселей размером 8×8 (разделенный по диагонали черно-белый квадрат). Применение к пиксельной матрице ДКП дает матрицу из 64 коэффициентов или спектральных составляющих. Нулевой коэффициент определяется усреднённой яркостью ис- Ðèñ. 15.20. Фрагмент блока ходного блока, поэтому, отбрасывая при матрицы 8×8 восстановлении коэффициенты с 1 по 63, мы получим просто серый квадрат (в верхнем ряду в центре). Добавление первого коэффици-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 442 Часть V. Цифровое преобразование изображений в телевидении ента позволяет достаточно грубо описать распределение яркостей в исходном блоке по горизонтали (вверху справа). Внизу слева и в центре приведены результаты восстановления исходного блока с использованием коэффициентов 6 и 15 соответственно. Очевидно, что число ненулевых спектральных составляющих тем выше, чем больше мелких деталей содержалось в исходном блоке. Эксперименты показывают, что на типичных полутоновых изображениях более половины всех блоков 8×8 могут быть описаны менее чем 20 спектральными составляющими. Чувствительность человеческого глаза к точности передачи наиболее высокочастотных спектральных составляющих невелика, что позволяет сократить число бит, используемых для их кодирования. Реализуется такое сокращение делением каждого частотного коэффициента на соответствующий ему элемент матрицы квантования, причем матрицы квантования для цветностных компонентов (CB и CR ) содержат, как правило, большие коэффициенты для одних и тех же, по местоположению, спектральных составляющих, чем для яркостной. Квадрат в нижнем ряду справа иллюстрирует реконструкцию исходного блока 8×8 при использовании матрицы квантования, обеспечивающей приблизительно восьмикратное сжатие типичного полутонового изображения. Достижение высоких степеней сжатия (порядка сотен [28]) при использовании методов, основанных на ДКП, приводит к существенной деградации изображений, поскольку минимальным кодируемым в них остается стандартный блок 8×8. Использование блоков большего размера возможно, например, на блоках 16×16, но практическая реализация таких схем сопряжена с серьезными вычислительными затратами. При повышении степени сжатия на основе ДКП в структуре изображении всё существенней проявляются сопутствующие искажения и эффект блочности. В системах охранного телевидения используется производная формата JPEG (motionJPEG — M-JPEG). JPEG разработан с учетом известных ограничений человеческого глаза, таких, как невосприятие цветности мелких деталей и ограниченное восприятие их градаций яркости. Степень потери мелких деталей в JPEG может варьироваться регулировкой параметров сжатия. С его применением достижимы степени сжатия до 100 раз [28], при этом следует помнить, что при высоких коэффициентах сжатия обычно проявляется блочная структура изображения. Гораздо более перспективным для получения больших коэффициентов сжатия представляется использование Wavelet-преобразования (wavelet — небольшая волна). Переход в частотную область в схемах
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 15. Системы сжатия цифровых сигналов изображения 443 на его основе достигается, как показано ниже, применением набора фильтров. Вейвлет-сжатие преобразует полное изображение, а не его секции 8×8, как это происходит в JPEG, и последнее является более естественным при высоких коэффициентах сжатия, так как в меньшей степени искажаются протяжённые границы объектов в структуре изображений. Основное преимущество вейвлет-сжатия над JPEG — это более высокие коэффициенты сжатия (до 200 и более). Вейвлет-анализ позволяет даже при предельном сжатии анализировать и отдельные детали, и общие информационные параметры изображений [28]. Контрольные вопросы 1. Виды избыточности ТВ сигнала. 2. Почему использование ДИКМ позволяет уменьшить скорость передачи цифрового потока? 3. На чем основан механизм устранения избыточности при использовании ДКП? 4. Как зависит скорость цифрового потока от форматов представления ТВ сигнала? 5. Что такое блоки, макроблоки и срезы (слайсы, вырезки) ТВ изображения? 6. Как происходит устранение временной и пространственной избыточности из ТВ сигнала в системах сжатия цифрового потока? 7. Механизм устранения избыточности в стандарте JPEG. 8. Каким образом в стандартах JPEG, MPEG осуществляется управление степенью сжатия?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 16 СОВРЕМЕННЫЕ СТАНДАРТЫ СЖАТИЯ ЦИФРОВОГО ПОТОКА 16.1. Стандарты сжатия спектра изображений MPEG Стандарты пространственно-временного сжатия спектра сигналов ТВ изображений MPEG с потерями (в качестве воспроизведения) постоянно совершенствуются. Процесс устранения внутрикадровой и межкадровой избыточности в современных его версиях, основанный на предсказаниях, декорреляции и преобразовании пространственной (внутрикадровой) и временной (в последовательности кадров) структуры сигналов ТВ изображений, является относительно эффективным. При этом точность реализации предсказаний по указанным направлениям во многом определяет объём передаваемых сигналов ошибки предсказаний (последние получают вычитанием текущих и предсказанных блоков пикселей в структуре ТВ сигналов) и, следовательно, достигаемую кодированием среднюю степень сжатия спектра, соответствующего ТВ сигналу, и, в конечном счете, эффективность использования частотного ресурса соответствующих каналов связи. Поэтому последующие версии стандарта MPEG по точности предсказаний обычно существенно превосходят предшествующие, но проигрывают в вычислительной сложности кодирования/декодирования. В связи с последним в современных версиях стандартов по сравнению, например, с первым (1993 г.) стандартом MPEG-1 возрастает инерционность процессов сжатия спектра сигналов ТВ изображений на передающей стороне канала связи и его реставрации. В стандартах MPEG-1,2 используются три вида кодирования: внутрикадровое, межкадровое вперёд с компенсацией движения, межкадровое двунаправленное также с компенсацией движения [8]. Полученные кадры объединяются в группы последовательных кадров (GOP). Каждая последовательность начинается с I-кадра и состоит из переменного числа P- и B-кадров (рис. 16.1). В начале отдельного сюжета обычно ставится I-кадр, в конце — P-кадр. Увеличивать долю B-кадров можно только в рамках одного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.1. 445 Группа изображений сюжета, иначе возникнут большие ошибки предсказания и компенсации движения. Поскольку типичная длительность группы кадров (во временном представлении ≈0,5 с — 12 кадров) значительно меньше характерного расстояния между границами сюжетов, в большинстве случаев жесткое задание структуры группы кадров не приводит к существенным визуальным ошибкам из-за того, что смена сюжета попадает внутрь группы кадров. Рассмотрим пример последовательности из 20 кадров [62]: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 I B B P B B P B B P B B P B B I B B P B Здесь кадры с 1 по 15 образуют группу кадров. Число кадров в группе может быть и другим, но они всегда начинаются с I-кадра. P-кадр 4 предсказывается по I-кадру 1, P-кадр 7 — по P-кадру 4, P-кадр 10 — по P-кадру 7 и т. д. I-кадр передаётся с внутрикадровым кодированием независимо от всех предшествующих ему кадров. B-кадры 2 и 3 предсказываются по I-кадру 1 и P-кадру 4, B-кадры 5 и 6 — по P-кадрам 4 и 7 и т. д. B-кадры 14 и 15 предсказываются по I-кадру 16 и P-кадру 13. Перед кодированием порядок следования кадров изменяется, так как каждый B-кадр должен следовать за двумя кадрами, по которым он предсказывается: 1 4 2 3 7 5 6 10 8 9 13 11 12 16 14 15 19 17 18 22 I P B B P B B P B B P B B I B B P B B P В таком порядке кадры кодируются и передаются, а в процессе декодирования восстанавливается исходный порядок кадров. Изменение порядка передачи кадров B, B, P объясняется тем, что при их декодировании на приёмном конце системы потребуются кадры I и P. Спектры изображений типа B компрессированы наиболее глубоко. Если P-кадры требуют для своей передачи в 3 раза меньше битов, чем I-кадры, то в B изображениях число битов для большинства сюжетов в 2...5 раз меньше, чем в P [5]. Как следствие, страдает качество B-кадров. Поэтому для защиты от возможных ошибок изображения B в этих стандартах не используются для предсказания других кадров.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 446 Часть V. Цифровое преобразование изображений в телевидении В стандарте MPEG-1 нет принципиальных ограничений на размеры (разрешение) кодируемых изображений и на использование чересстрочной развертки по сравнению с MPEG-2. Тем не менее MPEG1 предназначен для сжатия движущихся изображений с прогрессивной разверткой частотой кадров 25 и 30 Гц, количеством строк до 576 и количеством элементов в строке до 720. При этом получается цифровой поток со скоростью передачи данных символов до 1856000 бит/с. Однако чаще всего используется формат SIF (352×240 или 352×288 пикселей сигнала яркости, 4:2:0 при частоте кадров 30 Гц) и CIF (352×288 пикселей сигнала яркости, 4:2:0 при частоте кадров 25 Гц). Сжатие спектра ТВ сигнала MPEG-1 позволяет записывать видеопрограммы с некоторой потерей четкости на компакт-диски и воспроизводить их на ПК, выполняя декодирование в реальном времени чисто программными средствами. Стандарт MPEG-2 является развитием и расширением стандарта MPEG-1. Поток видеоданных MPEG-2 содержит составляющие, которых нет в MPEG-1. Стандарт MPEG-1, например, допускает кодирование ТВ сигналов с чересстрочной разверткой только в кадровом режиме, а в MPEG-2 имеется полевой режим, более эффективный при наличии существенных изменений изображения в последовательности смежных полей и кадров. Стандарт MPEG-2, в отличие от MPEG-1, дает возможность обработки чересстрочных изображений. В MPEG-1 для кодирования таких изображений приходилось предварительно объединить два поля в один кадр и только после этого подавать сигнал на вход кодера. Однако такой вариант может приводить к заметным искажениям. В этом случае отсчеты, принадлежащие однотипным элементам изображения от четного и нечетного полей сигналов изображений последовательных кадров, совмещаются в пределах прогрессивной структуры строк. При совмещении возникают искажения типа «расчёска» при движении объекта по горизонтали и «жалюзи» — при движении по вертикали, вызванные возникающим пространственным несовпадением в положении строк в пределах границ подвижного объекта в пространстве растра при совмещении чётных и нечётных полей. Указанные искажения создают мешающие высокочастотные пространственные составляющие на границах подвижных изображений, ортогональных направлению движения. При их преобразовании (подавлении интегрированием) квантованием резко снижается чёткость воспроизведения таких границ. Для уменьшения этих искажений в MPEG-2 введена концепция полевого и кадрового кодирования. Кадровое кодирование предполагает построчное объединение двух полей в один кадр и обработку его как обычного изображения с прогрессивным разложением (рис. 16.2,a). При полевом кодировании два поля
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.2. 447 Варианты кодирования при сжатии спектра ТВ сигнала: a — кадровое; b — полевое одного кадра кодируются раздельно как самостоятельные изображения (рис. 16.2,b). Каждое поле разбивается на непересекающиеся макроблоки (8×8 или 16×16 пикселей) и к ним применяется ДКП. Следовательно, стандарт MPEG-2 определяет два типа ДКП для макроблоков: кадровое и полевое. Кадровое ДКП действует аналогично MPEG-1: макроблок отсчетов яркости 16×16 пикселей разбивается на 4 блока 8×8 пикселей в соответствии с их расположением. Полевое ДКП использует 8 строк из нечетного поля для верхних двух блоков и 8 строк из четного поля для нижних блоков, образуя нечетные и четные поля макроблока, как показано на рис. 16.2,a, b. В этом режиме два поля кадра кодируются независимо. Например, I-кадр может кодироваться как два I-поля или как I-поле и P-поле. Эти возможности придают дополнительную гибкость кодированию, что позволяет достичь более высокой эффективности сжатия. Важным отличием двух стандартов является наличие в MPEG-2 масштабируемости и связанных с ней особенностей. Масштабируемость ТВ изображений позволяет предоставлять абоненту программы телевидения с качеством по разрешению в последовательности кадров во внутрикадровом пространстве или в части отношения сигнала к шуму (ОСШ), отвечающим скорости передачи в соответствующем канале связи и параметрам приёмного устройства. Стандарт MPEG-2 в этом отношении совместим со стандартом MPEG-1 «снизу-вверх», реализуя передачу, например, базового цифрового потока с низким пространственным (внутрикадровым) разрешением и до двух дополнительных потоков, обеспечивающих, при необходимости, увеличение, например, пространственного разрешения сигнала ТВ изображений программ вещательного телевидения. Другим вариантом является передача одинакового числа пикселей в пределах внутрикадрового пространства, но с изменением числа уровней шкалы квантования коэффициентов ДКП. В данном случае имеется базовый цифровой поток с грубой шкалой квантования и передача дополнительных потоков, позволяющих увеличивать при воспроизведении число уровней шкалы квантования. Огрублению шкалы квантования при этом соответствует подавление малоконтрастных вы-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 448 Часть V. Цифровое преобразование изображений в телевидении сокочастотных составляющих пространственного спектра сигнала ТВ изображений. Основная энергия составляющих сигнала шума (из-за действия коррекции) сосредоточена именно в области высоких пространственных частот (характеристика спектральной плотности сигнала шумовых составляющих приблизительно по квадратичному в горизонтальном направлении закону растёт в рабочей полосе частот ТВ сигнала). И в то же время спектральные составляющие шума чаще всего оказываются меньшими по уровню, например, локальных высокочастотных пространственных составляющих полезного сигнала ТВ изображения и, соответственно, ниже порога в процессе квантования коэффициентов ДКП. В результате с увеличением степени сжатия (увеличения порога при квантовании) имеет место падение внутрикадровой чёткости. Этому сопутствует устранение при сжатии спектра существенной в весовом отношении части пространственного спектра шумовой составляющей и соответствующее сокращение объёма её спектра и сопряжённое в связи с последним падение относительного уровня и заметности шумовой составляющей при воспроизведении декодированных ТВ изображений. Следует заметить, что стандарт MPEG-2 относительно широко представлен в современных системах цифрового ТВ вещания, а также применяется для записи кинофильмов и иной видеоинформации на диски стандарта DVD, обеспечивающие относительно высокое качество ТВ изображения и звука. 16.1.1. Структурная схема видеокодера MPEG-2 В видеокодере MPEG-2 (рис. 16.3) цифровой видеосигнал импульсно-кодовой модуляции ИКМ поступает на вход блока предварительной обработки БПО, с выхода которого сигнал разделяется по трем каналам: по первому (верхнему) сигнал I через электронный ключ K поступает на ДКП, по второму — на устройство вычитания и по третьему (нижнему) на определитель движения ОД. При этом основная энергия частотных составляющих (коэффициентов) получаемых с применением ДКП спектров независимых блоков чаще всего концентрируется в небольшой области около нулевых частот. Далее операции кодирования выполняются с использованием блоков: прямого и обратного квантования (Кв, Кв−1 ), обратного ДКП−1 , суммирования, энтропийного кодирования (ЭК), мультиплексирования (Мп), управления коэффициентом сжатия (УКС), буферного запоминающего устройства (БЗУ) [8]. В процессе кодирования БПО осуществляет: • удаление избыточной информации [47]; • преобразование разверток;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.3. 449 Структурная схема видеокодера MPEG-2 • преобразование формата цветности 4:4:4 в формат 4:2:2 (горизонтальная передискретизация) или в 4:2:0 (горизонтальная и вертикальная передискретизация); • разбиение изображения на ряд макроблоков, каждый из которых состоит из 6 блоков 8×8 пикселей: 4 блока образуют матрицу 16×16 и несут информацию о яркости, по одному — определяют ЦРС CB и CR , которые соответствуют области изображения — формату матрицы 4:2:0. Для 4:2:2 — макроблок: по 2 матрицы CB и CR и одну матрицу Y — итого 8 блоков. Причём матрицы CB и CR в два раза меньше матрицы Y по горизонтали и равны ей по вертикали. Синтаксис MPEG-2 поддерживает до двух слоев масштабирования. Принцип работы масштабирующего кодека показан на рис. 16.4. Из рисунка видно, что при передаче сигнала изображения (рис. 16.4,a) используют два потока данных, образующих так называемые базовый и расширенный слои. Базовый слой несет информацию об «ухудшенной» версии изображения, расширенный — об информации, дополняющей «базовое» изображение до полного качества по разрешению. Ðèñ. 16.4. Принцип работы масштабирующего кодека: a — кодер; b — декодер
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 450 Часть V. Цифровое преобразование изображений в телевидении В схеме, масштабирующей отношение сигнал-шум (SNR, Signalto-Noise Ratio), сигнал базового слоя передаётся с низкой скоростью с несколько пониженной точностью квантования коэффициентов, но увеличенной помехоустойчивостью сигнала передачи. Улучшающий слой кодирует и передает (без увеличения помехоустойчивости) разницу между неквантованными и грубо квантованными значениями коэффициентов, которую декодер SNR профиля использует для уточнения значений коэффициентов в случае приема с достаточно высоким качеством. Этот подход можно использовать и для изменения пространственного разложения, если в базовом слое передавать самые нижние M N (M < 8, N < 8) из коэффициентов ДКП, а в улучшающем слое — остальные из их числа (например, 64 − M N ). 16.1.2. Компенсация движения в динамических изображениях Для улучшения результатов предсказания применяют процесс, называемый компенсацией движения (с вычислительной оценкой сигнала вектора движения). При этом пиксели сигнала ТВ изображения в текущем кадре разбивают на независимые участки (блоки) и для каждого такого блока ищут его наиболее вероятное положение в предыдущем кадре, сопоставляя его со всеми возможными блоками такого же размера в заданной области поиска. Поиск ведется по критерию минимальной абсолютной ошибки. Этот процесс называется сопряжением блоков (рис. 16.5). Если сюжет содержит движение, в получившейся корелляционной поверхности появляются всплески, положение которых дает точную информацию о направлении и величине перемещения. Оценка движения в блоке ОД осуществляется сравнением текущего изображения, поступающего на вход кодера, с опорным изображением, находящемся в ЗУ. При сопряжении используются блоки размером 16×16 пикселей. Для маленьких блоков (8×8 пикселей) легче найти блоки со схожими параметрами, но степень сокращения данных окажется невысокой. Для объекта, пересекающего экран за 0,5 с, область поиска должна составлять не менее 60×60 пикселей. Найденный вектор перемещения (его величина и направление) передается далее в декодер. Ðèñ. 16.5. Сопряжение блоков при компенсации движения
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 451 Предсказатель в системе — не просто память для хранения предшествующих декодированных полей (кадров), но и устройство, которое при формировании предсказания отыскивает из массива задержанных кадров сигнала яркости, находящихся в его памяти, видеоинформационный блок, максимально согласованный по содержанию с блоком текущего кадра. Для этого в предсказатель вводятся данные о векторах движения. Сигнал вектора также подвергается энтропийному кодированию и мультиплексируется в общий цифровой поток с коэффициентами ДКП. 16.1.3. Квантование коэффициентов ДКП В кодере реализуются два режима кодирования: внутрикадровое и межкадровое с предсказанием и компенсацией движения. Все макроблоки I-полей кодируются в режиме внутриполевого кодирования [5]. В квантователе Kв происходит кодирование коэффициентов ДКП в соответствии с формулой ( ) C(m, n) F (m, n) = Cq (m, n) = Round , (16.1) ρQ(m, n) где Q(m, n) — коэффициенты квантования, задаваемые в виде таблицы из 8×8 целых чисел; ρ — параметр, определяющий (регулирующий в текущем режиме) степень сжатия изображения; Round — операция округления до ближайшего целого значения; Cq (m, n) — полученные в результате данной операции квантованные коэффициенты ДКП, которые могут быть как положительными, так и отрицательными. В результате выполнения операций деления и округления многие коэффициенты ДКП становятся равными нулю. Именно квантование создает возможность уменьшения числа двоичных символов, необходимых для представления информации о коэффициентах ДКП, т. е. сжатия изображения. В то же время квантование является источником необратимых потерь информации при сжатии. Информация о выборе конкретной таблицы квантования Q или сама таблица передаётся на приёмную сторону в общем потоке данных для декодирования. Разностный сигнал и сигнал опорного кадра после ДКП квантуются по разным алгоритмам. Для опорного кадра используется рассмотренная в п. 14.3 матрица квантования (см. табл. 14.1) для внутрикадрового кодирования, а для разностного сигнала применится другая, более однородная матрица. Это объясняется тем, что разностный сигнал в основном несет информацию о небольших изменениях в отдельных фрагментах изображения (в процессе их перемещения) и высокие частоты (коэффициенты ДКП правого нижнего угла), ответственные за детализацию изображения, здесь столь же важны, как
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 452 Часть V. Цифровое преобразование изображений в телевидении и низкие. Конкретный вид матрицы в зависимости от сюжета может меняться, но по умолчанию используется однородная матрица квантования с постоянным значением 16 для всех частот, включая нулевую [79]. Отметим также, что каждый коэффициент ДКП отражает информацию о весовом содержании данной составляющей во всех элементах изображения данного блока. Следовательно, количество передаваемой информации при помощи ДКП уменьшается за счет более грубого квантования части передаваемых коэффициентов Cq (m, n) спектра (см. табл. 15.1). При этом снижается соответствующее число двоичных разрядов, а многие из коэффициентов становятся равными 0. Отбрасываемые составляющие спектра обычно или малы по исходному уровню, или оказывают минимальное в весовом отношении влияние на визуальное качества изображения. Причём НЧ составляющие, расположенные в левом верхнем углу, квантуются на максимальное число уровней (128, 256), а ВЧ составляющие передаются с меньшей точностью — квантуются с увеличением значений координат на меньшее число уровней. 16.1.4. Сканирование коэффициентов ДКП Следующим шагом является преобразование матрицы коэффициентов ДКП в одномерную последовательность. Данное преобразование предусматривает объединение коэффициентов матрицы в определенные группы и применение затем так называемого энтропийного кодирования. Одним из вариантов такого алгоритма группирования является зигзагообразное сканирование (рис. 16.6), в результате которого временная последовательность двоичных чисел впоследствии подвергается энтропийному кодированию (код Хаффмана). Он основывается на том, что коды символов, обладающие большей вероятностью, Ðèñ. 16.6. Зигзагообразное сканирование коэффициентов ДКП
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 453 описываются меньшим числом битов. В матрице ДКП преобладают числа с малыми амплитудами (≈0), их кодируют короткими словами (в нашем случае это числа 0 и 1). Естественно, характер распределения по координатам и по уровням коэффициентов ДКП зависит от содержания изображения. Далее в блоке «Энтропийное кодирование» осуществляется кодирование с переменной длиной кодовых слов (см. главу 17). В петле обратной связи (деквантователь Kв−1 , блок обратного ДКП−1 и предсказатель) ЗУ может содержать несколько предыдущих полей (кадров). 16.1.5. Стабилизация скорости цифрового потока в канале связи Общий цифровой поток после мультиплексора Мп поступает на вход буферного запоминающего устройства БЗУ (см. рис. 16.3), работающего по принципу «первым вошел — первым вышел». Необходимость использования БЗУ объясняется следующим. В зависимости от детальности передаваемого движения и его специфики в существенной степени может меняться скорость цифрового потока на выходе блока кодирования с переменной длиной. При возрастании в изображении уровня ВЧ компонентов при быстроменяющихся сюжетах скорость потока данных на выходе компрессора возрастает. Это возрастание может приводить к превышению пропускной способности канала передачи. Стабилизация скорости кодированного цифрового потока осуществляется реализацией обратной связи (ОС), в которую включены КВ, УКС, БЗУ [8]. Для оптимизации работы системы желательно поддерживать уровень заполнения БЗУ приблизительно постоянным. Если БЗУ переполняется, то имеет место потеря данных и ухудшение качества изображения. Если БЗУ освобождается, то передаются «пустые» блоки, что приводит к снижению эффективности использования канала связи. Обратная связь позволяет поддерживать степень заполнения БЗУ постоянной. Сущность действия ОС заключается в следующем. Если передаются изображения с высокой степенью изменений пространственновременной структуры, существенно обогащающей структуру спектра, и степень заполнения БЗУ начинает увеличиваться (заполнение объёма памяти приближается к предельному уровню), то под воздействием ОС возрастает параметр квантования ρ коэффициентов ДКП (16.1). При этом число битов, определяющее каждый коэффициент, снижается и уровень скорости потока данных поддерживается примерно постоянным. Наоборот, при передаче «гладких» изображений квантование становится более точным (параметр ρ в формуле (16.1) уменьшается,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 454 Часть V. Цифровое преобразование изображений в телевидении а число передаваемых коэффициентов квантования Cq — табл. 15.1 — увеличивается). Такой метод соответствует свойствам человеческого зрения: на изображениях с высокой плотностью пространственновременных изменений менее заметны неточности в пределах уровней яркости. Конечно, относительно резкие изменения масштаба квантования в зависимости от содержания изображения негативно отражаются на интегральном качестве воспроизводимого изображения за счёт воздействия шумов нелинейного квантования. Включенное в цепь ОС устройство управления коэффициентом сжатия УКС повышает ее быстродействие. Информация от блока УКС также передаётся на приёмную сторону. 16.1.6. Уровни и профили стандарта MPEG-2 Для эффективного применения и обеспечения высокой степени эксплуатационной совместимости устройств в стандарте MPEG-2 выделено несколько подмножеств, называемых профилями. В каждом профиле определено несколько уровней в соответствии с ограничениями параметров цифрового потока. Профиль — подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии. Стандарт MPEG-2 охватывает широкий диапазон по сложности кодирования и качества изображения — от простых I-кадров до групп видеокодирования — GOP (ГВК), от низкого разрешения до ТВЧ. В ходе разработки стало ясно, что можно построить декодер, удовлетворяющий одновременно всем требованиям стандарта, но это неэкономично из-за сложности и дороговизны. В то же время такой декодер будет иметь большую избыточность по отношению к более простым приложениям. Поэтому все средства и инструменты обработки видеосигналов были разделены на несколько профилей (Profile), поддерживающих обратную совместимость и различающихся использованием тех или иных элементов синтаксиса. Как правило, каждый профиль добавляет один или несколько инструментов к имеющимся у нижележащего профиля. На сегодняшний день в стандарте приняты пять основных и один дополнительный профессиональный профиль «4:2:2», введенный позднее (табл. 16.1). Внутри каждого профиля выделены уровни (Level), определяющие допустимые пределы изменения основных параметров цифрового потока. Таких уровней четыре, и в табл. 16.2 приведены установленные для них пределы скорости потока и разрешающей способности. Уровень «Высокий-1440» был введен для планировавшейся европейской системы с разложением 1440×1152 пикселей и форматом кадра 4:3. Отметим, что в принятой Рекомендации ВТ.709 по ТВЧ форматам такой формат не предусмотрен. Не все профи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 455 Таблица 16.1 Уровни и профили стандарта MPEG-2 Профиль Уровень Параметр Типы кадров Дискретизация сигнала цветности I, P I, P, B I, P, B I, P, B 4:2:0 4:2:0 4:2:0 4:2:0 Число отсчетов на строку Высокий Число строк на кадр (High) Частота кадров, Гц Скорость потока, Мбит/с 1920 1152 60 80 Высокий -1440 (High1440) Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с 1440 1152 60 60 Основ ной (Main) Число отсчетов на строку 720 Число строк на кадр 576 Частота кадров, Гц 30 Скорость потока, Мбит/с 15 720 576 30 15 720 576 30 15 Число отсчетов на строку Число строк на кадр Частота кадров, Гц Скорость потока, Мбит/с 352 288 30 4 352 288 30 4 Низкий (low) I, P, B I, P, B 4:2:0 4:2:0 или 4:2:2 или 4:2:2 1920 1152 60 100 1440 1152 60 60 1920 1152 60 300 1440 1152 60 80 720 576 30 20 720 576 30 50 Примечание: режим 4:2:2P@ предлагаемым стандартом HL введен SMPTE-308M. ли определены при всех уровнях, допустимые сочетания указаны в табл. 16.1 [10]. Полужирным шрифтом в табл. 16.1 выделен режим 4:2:2P@HL, отсутствующий в стандарте MPEG-2 и предложенный позднее проекТаблица 16.2 Пределы изменения параметров цифрового потока для различных уровней основного профиля MPEG-2 Уровень Параметр Высокий MP@HL Высокий МР@Н1440 Основной MP@ML Низкий MP@LL Число отсчетов на строку Число строк на кадр Частота кадров, Гц Частота отсчетов сигнала яркости, отсч/с Скорость потока, Мбит/с Размер буфера, бит 1920 1152 60 62668800 1440 1152 60 47001600 720 576 30 10368000 352 288 30 3041280 80 9781248 60 7340032 15 1835008 4 475136
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 456 Часть V. Цифровое преобразование изображений в телевидении том стандарта SMPTE-308M по инициативе вещательных компаний. Этот режим используется при производстве программ. Он допускает максимальную скорость потока 300 Мбит/с со следующими ограничениями: на скорости от 230 до 300 Мбит/с допускаются только I-кадры, на скорости от 175 до 230 Мбит/с — I-, IP-, IB-кадры, на меньших скоростях — ГВК любой конфигурации, не противоречащей стандарту MPEG-2. Декодеры, поддерживающие определенный уровень данного профиля, должны работать также и при всех более низких уровнях и профилях. В англоязычной литературе принято обозначать сочетания профиля и уровня первыми буквами, разделенными знаком @. Например, сочетание «Основной профиль — Основной уровень» записывается как MP@ML (MainProfile@MainLevel). Режим MP@ML стал наиболее распространенным, он обеспечивает полную разрешающую способность 720×576 пикселей, предусмотренную Рекомендаций ВТ.601, и это сочетание признано наиболее подходящим для цифрового вещания. Максимальная скорость потока видеоданных 15 Мбит/с заведомо достаточна для достижения качества изображения, превышающего возможности аналоговых стандартов PAL, SECAM и NTSC. Простой профиль (SP — SimpleProfile), не поддерживающий двунаправленное предсказание и B-кадры, предназначался исходно для применений при обработке компьютерных изображений и в других приложениях, не требующих высокого качества изображения. Однако стоимость микросхем, разработанных для Основного профиля, оказалась относительно низкой и разработка специальных изделий для простого профиля была признана нецелесообразной. Он применяется лишь в простейших программных MPEG-кодерах. Масштабируемостью является, как было показано выше, способность кодека (кодера и декодера) формировать и обрабатывать упорядоченный набор из нескольких цифровых потоков, обеспечивающих возможность изменений качества ТВ изображений. Масштабируемые профили пока широко не используются [10], хотя в некоторых приложениях для них просматриваются области применения (например, в наземном цифровом ТВ вещании). Основные параметры кодирования для интерфейса формата 4:2:2 для систем цветного телевидения представлены в табл. 16.3. Профиль с пространственным масштабированием (Spatial Scalable Profile) был введен в стандарт для обеспечения доступа декодерам стандартной четкости к программам ТВЧ. Привязкой к ТВЧ объясняется большая скорость цифрового потока, предусмотренная в этом профиле. В базовом слое такой системы передается, после прореживания и сжатия спектра, видеоинформация стандартного разрешения, а в улучшающем слое — необходимые дополнительные
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 457 Таблица 16.3 Основные параметры кодирования для интерфейса формата 4:2:2 Параметр Система 525 строк 60 полей Система 625 строк 50 полей Данные сигналы получаются из основных сигналов Кодируемые сигналы Y , CR , RGB, подвергнутых предварительной коррекции CB Числа отсчетов на полную длину строки для сигналов: яркости (Y ) 858 864 каждого из цветоразностных 429 432 (CR , CB ) Ортогональная сетка из яркостных и цветоСтруктура дискретизации разностных отсчетов; цветоразностные отсчеты CR , CB в каждой строке совпадают с нечетными отсчетами (1, 3 и т. д.) сигнала яркости Y Частоты дискретизации, МГц, для сигналов: яркости (Y ) 13,5 каждого из цветоразностных 6,75 (CR , CB ) Импульсно-кодовая модуляция с однородным Форма кодирования квантованием (8 битов на отсчет) для сигналов яркости и каждого из цветоразностных сигналов Числа отсчетов на активную цифровую строку для сигналов: яркости (Y ) каждого из цветоразностных (CR , CB ) Соотношение временной синхронизации по горизонтали между цифровыми и аналоговым сигналом: от конца активной цифровой строки до 0н Соотношение между уровнями видеосигнала и квантования для сигналов: яркости (Y ) каждого из цветоразностных (CR , CB ) Использование кодовых слов, соответствующих уровням квантования 720 360 16 яркостных тактовых интервалов (NTSC) 12 яркостных тактовых интервалов (PAL, SEC AM) 0...225 220 уровней квантования, уровню черного соответствует 16-й уровень; пиковому уровню белого — 235-й уровень. Допускаются отдельные выбросы за уровень 235 225 уровней квантования в центральной части шкалы квантования; нуль сигнала соответствует 128 уровню 0 и 225 используются исключительно для синхронизации. С 1 по 254 доступны для видеосигналов отсчеты разностного сигнала, отфильтрованного при формировании сигнала базового слоя. Профиль «Высокий», предусматривающий все инструменты нижних профилей, в настоящее время пока не используется по нескольким
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 458 Часть V. Цифровое преобразование изображений в телевидении причинам, в том числе, по-видимому, из-за отсутствия интегральных микросхем с достаточными ресурсами производительности. Несколько особняком, вне иерархии, стоит профиль «Профессиональный 4:2:2», предназначенный для обеспечения совместимости с цифровым студийным оборудованием видеопроизводства. В этом формате работают, например, перевозимые комплекты цифровых систем сбора новостей, передающие сигнал через спутники для последующей записи и монтажа. Профиль «4:2:2» должен обеспечивать качество изображения, сравнимое с цифровой видеозаписью формата D1, и возможность многократного MPEG кодирования-декодирования сигнала. Его основными свойствами являются структура дискретизации «4:2:2» (в отличие от обычной в MPEG-2 «4:2:0»), увеличенное число строк — 608 в отличие от 576 и возможность работы с повышенными скоростями до 50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным профилем. Последнее требование связано с более короткими группами видеокадров, используемыми при видеомонтаже. Предложенный недавно Высокий уровень этого профиля позволит расширить область использования MPEG-2 при подготовке ТВЧ программ. Для профессиональных применений очень важна способность оборудования разных производителей работать совместно (по-английски это свойство называется interoperability, в русском языке наиболее близка «совместная работоспособность»). Хотя MPEG-2 должен обеспечивать полную совместимость во всех режимах работы, организация Pro-MPEG Forum, занимающаяся внедрением стандартов MPEG, предложила использовать в профессиональных системах для стыков аппаратуры ограниченное число режимов, в которых заведомо должны выполняться все требования к цифровому потоку. В качестве таких режимов выбраны: • 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, любая разрешенная структура ГВК; • 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, только I-кадры; • 4:2:2P@HL, ТВЧ, скорость до 80 Мбит/с, любая разрешенная структура ГВК; • 4:2:2P@HL, ТВЧ, скорость до 175 Мбит/с, любая разрешенная структура ГВК; • 4:2:2P@HL, ТВЧ, скорость до 300 Мбит/с, только I-кадры. 16.1.7. Декодирование видеоинформации в MPEG-2 Все операции в видеодекодере выполняются в обратном порядке: декодирование энтропийного кода, деквантование, обратное ДКП, компенсация движения и восстановление исходной последовательности кадров (рис. 16.7) [62].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.7. 459 Структурная схема видеодекодера MPEG-2 Рассмотрим работу декодера. Включённое на входе декодера БЗУ согласует скорость потока данных во входном потоке с процессами в декодере, при которых данные из БЗУ считываются неравномерно во времени. С выходов демультиплексора ДМп кодированные данные изображения и значения параметров квантования поступают на декодер энтропийного кода и далее на деквантователь, а векторы движения поступают на декодер энтропийного кода и предсказатель. При приёме I-кадров переключатель П находится в положении 1 и сигнал I с выхода ДКП−1 направляется на выход. При приёме P- и B-кадров переключатель П находится в положении 2. В этом случае формирование выходного сигнала происходит поэлементным сложением разностных значений сигналов Р и В с предсказанными (предшествующими) значениями с использованием векторов движения. 16.1.8. Классификация искажений, возникающих при сжатии видеосигнала по стандарту MPEG-2. Достижимые степени сжатия Искажения можно условно разделить на две группы: искажения, обусловленные внутрикадровым кодированием, и искажения, обусловленные межкадровым кодированием [10, 145, 146]. Искажения, создаваемые внутрикадровым кодированием Блокинг-эффект. Характеризуется заметностью в структуре ТВ изображений границ, например, квадратных блоков. Блокинг-эффект возникает вследствие деления изображения на блоки с последующим их независимым кодированием, в котором используется ДКП и квантование коэффициентов. Особенностью ДКП с учётом квантования коэффициентов является возникновение ненулевых ошибок на границах блоков, которые идентифицируются глазом как скачки яркости от одного блока к другому. В результате изображения в соседних блоках могут отличаться (с нарушением исходного сопряжения структурных составляющих) друг от друга по яркости, цвету, характеру деталей и текстуре. Мозаичный эффект. Мозаичный эффект выглядит подобно блокинг-эффекту, но обусловливается не резкими переходами между различными блоками, а заметным глазу различием всей информации в соседних блоках. Можно также определить мозаичный эффект как
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 460 Часть V. Цифровое преобразование изображений в телевидении остаточный блокинг-эффект после низкочастотной фильтрации изображения. Несмотря на то что переходы между блоками становятся плавными, глаз интегрально воспринимает дискретность изменения изображений в смежных блоках. Мозаичный эффект также возникает при слишком грубом квантовании коэффициентов ДКП, при котором изображения внутри соседних блоков заметно отличаются друг от друга. Размытие изображения. При большом коэффициенте сжатия наблюдается размытие изображения, обусловленное значительным ограничением либо полным обнулением высокочастотной части спектра ДКП. Мелкие детали становятся либо размытыми, либо полностью пропадают в изображении, сливаясь с фоном в пределах блоков. Окантовки на границах. Этот тип искажений проявляется как появление характерных окантовок на резких переходах яркости изображения, обусловленных резким ограничением высокочастотных компонентов спектра либо значительным их искажением. Поскольку ступенчатый по форме сигнал в пределах внутрикадрового пространства содержит большое количество спектральных компонентов (амплитуда которых убывает обратно пропорционально их номеру), изменения амплитуд ДКП вследствие квантования могут нарушить монотонность функции вблизи границ в пространственной структуре ТВ изображений, что визуально проявляется как колебания яркости на резких протяжённых переходах. Размытие цветов. Размытие цветов имеет такую же причину, что и эффект окантовки на границах, но проявляется на участках изображения с резкими скачками в сигнале яркости. Искажения типа «ступеньки». Такие искажения возникают как результат неправильного восстановления или передачи краёв изображений внутри блоков. При рассмотрении каждого блока в отдельности граница, проходящая по некоторому числу блоков, выглядит нормально. Иными словами, часть границы внутри блока визуально воспринимается правильно. Тем не менее на переходах от блока к смежному блоку граница объекта терпит скачок и, в целом, выглядит как «ступенька» с элементами, параллельными границам блоков. Причиной возникновения этого является использование в качестве базиса разложений функций ДКП, построенных в декартовых координатах. Каждая из базисных функций имеет строго выраженную вертикальную и горизонтальную ориентации. Поэтому при грубом квантовании коэффициентов ДКП на наклонной границе проявляется внутренняя ориентация базисных функций по осям координат. Следует отметить, что данный эффект проявляется, как правило, при воспроизведении восстановленного изображения в увеличенном масштабе.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 461 Искажения, создаваемые межкадровым кодированием Ложные границы. При компенсации движения с использованием опорного кадра, в котором заметны блокинг- и мозаичные эффекты, последние могут переноситься из опорного кадра в новый кадр. Если положение макроблока после компенсации движения не совпадает точно с положением макроблока в опорном кадре, при грубом квантовании количество границ между макроблоками может увеличиваться. Возникают характерные границы изображения внутри макроблоков, которые называются ложными границами. Ложные границы являются прямым следствием межкадрового сжатия изображения и отсутствуют при использовании только внутрикадровой компрессии, как, например, в JPEG. При больших коэффициентах квантования количество ложных границ увеличивается от кадра к кадру, что приводит к существенной деградации изображения. Эффект «комаров». Этот эффект проявляется как флуктуации яркости или цветности в блоке на границе между движущимся объектом и фоном. Обычно уровень флуктуаций не очень велик. Тем не менее, поскольку человеческий глаз достаточно чувствителен к изменениям, дрожание яркости или цветности может оказаться заметным. Этот эффект выглядит так, как будто много мелких комаров летает вокруг объекта, отсюда и происходит название эффекта. Он обусловлен межкадровым кодированием потока и возникает вследствие различной степени квантования ошибки предсказания от кадра к кадру. Часть блока, который подвергается компенсации движения, может передаваться правильно, но другая часть, соответствующая фону и ошибка предсказания которой не мала, может передаваться с искажениями вследствие грубого квантования коэффициентов ДКП. Зернистый шум в стационарной области. Данный вид искажений проявляется как медленно движущиеся дрожащие шумы низкой интенсивности в областях, в которых присутствует лишь малое движение либо движение полностью отсутствует. Этот вид искажений возникает по следующим причинам. Во-первых, если аналогично эффекту «комаров» коэффициенты преобразования разностей между текущим и опорным кадрами изменяются между соседними кадрами, восстановленный уровень в каждой точке может отличаться от уровней в той же точке соседнего кадра. Во-вторых, при очень малом изменении сигнала между соседними кадрами кодер может выбрать неправильный вектор движения блока. В результате квантования ошибки предсказания воспроизведение идентичных пространственно и по времени блоков может незначительно отличаться. В-третьих, данные ошибки могут быть обусловлены так называемыми ограниченными циклами низкоуровневого входа. Данные циклы существуют в рекурсивных нелинейных системах и при определённых условиях (квантование, наличие
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 462 Часть V. Цифровое преобразование изображений в телевидении ошибок округления при арифметике с конечной точностью вычислений) приводят к неустойчивости системы и нелинейным искажениям. Эффекты «приведения». В зависимости от скорости объектов, участвующих в движении, и алгоритма поиска пропущенных блоков за движущимися объектами возможно образование следов (как бы «приведений»), которые могут сохраняться в течение сравнительно большого промежутка времени. Какие же степени сжатия реально достижимы при использовании MPEG-2? В соответствии с Рекомендацией 601 при дискретизации 4:2:2 получается скорость передачи двоичных символов 216 Мбит/с. При переходе к формату 4:2:0, который используется для телевизионного вещания «MainProfile @ MainLevel», скорость передачи двоичных символов сокращается до величины 162 Мбит/с, относительно которой и будем определять степень сжатия. В технических журналах отмечалось, что на практике для получения студийного качества принятого изображения можно сжимать видеоинформацию до скорости передачи 9 Мбит/с, т. е. в 18 раз. Для получения качества изображения, сравнимого с обычным изображением по системе PAL, — до 4. . . 5 Мбит/с, т. е. в 30. . . 40 раз. Качество изображения, сопоставимое с получаемым при воспроизведении видеозаписей стандарта VHS, достигается при сжатии до уровня около 1,5 Мбит/с, т. е. более чем в 100 раз. 16.2. Основные особенности метода кодирования H.264/AVC Как и во всех стандартах видеокодирования, предложенных группами ITU-T и ISO/IEC, в данной версии стандартизирован декодер, для которого заданы ограничения на поток и его синтаксис. В структуре выходного кодированного цифрового потока должны быть выполнены все требования (ограничения) современной версии стандарта MPEG — H.264/AVC (MPEG-4 Part-10 AVC); другое название этого же стандарта 14496-10 или MPEG-4 Часть 10. При этом любой декодер, отвечающий конкретизированным ограничениям стандарта, создаёт необходимый при воспроизведении цифровой поток. В структуре стандарта H.264/AVC представлены: уровень кодирования видео (Video Coding Layer, VCL), предназначенный для эффективного кодирования видеоконтента, и уровень сетевого представления (Network Abstraction Layer, NAL), который преобразует данные VCL и предоставляет информацию заголовков в необходимом виде для передачи по большинству существующих транспортных методов или для сохранения медиаданных. В стандарте H.264/AVC нет единственного решения, с использованием которого обеспечивается значительное улучшение эффек-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 463 тивности сжатия по отношению к предыдущим видеостандартам кодирования. В новом стандарте осуществлено множество доработок, которые увеличивают эффективность передачи составляющих цифрового потока по каналу связи, снижают ошибки предсказаний и, соответственно, необходимую скорость передаваемого цифрового потока. В итоге имеет место значительный, интегрального типа, эффект улучшения качества или увеличения степени сжатия. Задача снижения уровня искажений при сжатии спектра видеоиформации, что, собственно, коррелированно с увеличением степени сжатия, решается в данном случае за счёт существенного увеличения адаптивности и, соответственно, вычислительной сложности алгоритмов, реализующих внутрикадровое и межкадровое сжатие спектра сигналов изображений. Можно, в частности, выделить следующие, по отношению к MPEG-2, из многих изменений алгоритмов сжатия в H.264/AVC в сторону возрастания их адаптивности к текущей структуре сигнала изображений: 1. Адаптивный (регулируемый) размер слайса, который определяется параметрами текущей пространственной структуры сигнала изображения, что увеличивает эффективность кодирования, снижает количество данных заголовка и увеличивает точность осуществления предсказаний. 2. Адаптивное (гибкое) упорядочивание (Flexible Macroblock Ordering — FMO) распределения (с использованием соответствующей таблицы) макроблоков по слайсовым группам, в пределах каждой из которых слайс является независимо декодируемым подмножеством группы слайсов. При эффективном использовании гибкий порядок макроблоков может значительно улучшить устойчивость к потерям данных за счет управления с учётом пространственной зависимости между группами, в которые включены закодированные слайсы. 3. Адресный (независимый) порядок кодирования и декодирования слайсов, так как H.264/AVC позволяет передавать и принимать слайсы изображения в любом порядке по отношению друг к другу. Эта возможность может уменьшить полную задержку в приложениях, работающих в режиме реального времени, в частности, когда для передачи используются сети с неупорядоченной передачей данных (сети с IP-протоколами). 4. Формирование дополнительных типов слайсов SP и SI, которые обеспечивают переключения между различными потоками, соответствующими кодированию данного сигнала изображения, например, с различной помехозащищённостью. Введение SP- и SI-слайсов связано с возможностью применения стандарта H.264 в потоковом видео. Например, видеоинформация может одновременно поступать от нескольких кодеров, но с разной степенью сжатия. При уменьшении про-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 464 Часть V. Цифровое преобразование изображений в телевидении пускной способности реализуется переключение на менее скоростные потоки. Незаметность переключения достигается с использованием указанных новых слайсов. 5. Избыточный закодированный кадр (кадры), содержащий, например, упрощённое изображение (с потерями) всего или части закодированного кадра и используемый в случаях утраты (ошибки при приёме) основного кадра. 6. Адаптивное, по отношению к пространственной локальной структуре изображения, преобразование формы и размеров блоков от 16×16 до 4×4 пикселей. 7. Направленное пространственное (внутрикадровое) предсказание пикселей текущих блоков 4×4 (8×8) с использованием девяти режимов его реализации. 8. Направленное пространственное (внутрикадровое) предсказание пикселей текущих блоков 16×16 с использованием четырёх режимов его реализации. 9. Передача пикселей сигнала изображения без предсказания и преобразования в случае, когда обычный процесс кодирования является менее эффективным. 10. Адаптивное к макроблокам кадровое/полевое (Macro BlocAdaptiv Frame/Field, MBAFF) кодирование. Пара вертикально ориентированных макроблоков (16×32 пикселя) кодируется в кадровом режиме, каждый макроблок содержит исходные строки кадра. При кодировании в полевом режиме верхний макроблок содержит строки верхнего (например, первого из двух сигналов полей отдельного кадра) поля, а нижний — нижнего (второго из сигналов полей кадра). Решение об использовании кадрового или полевого кодирования принимается по двум макроблокам, а не по одному. Это сохраняет нетронутой основную структуру обработки макроблока и возможность использования областей компенсации движения, равных размеру макроблока. 11. Древовидная (адаптивное изменение параметров формы и размера блока) компенсация (предсказание) движения с более высокой, по отношению к MPEG-2, предельной точностью в одну четвёртую пикселя (отсчёта) сигнала яркости и с адаптивными (к структуре сигнала изображения) изменениями параметров формы и размеров блоков от 16×16 до 4×4 пикселей. 12. Предсказание движения с более высокой, по отношению к MPEG-2, предельной точностью в одну восьмую пикселя (отсчёта) цветоразностных сигналов (вариант передачи 4:2:0) и с адаптивными (к структуре сигнала изображения) изменениями параметров формы и размеров блоков от 8×8 до 2×2 пикселей. 13. Использование более одного (несколько в соответствии со
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 465 списком «0») предшествующих кадров при кодировании и декодировании слайсов типа P с древовидной компенсацией движения. 14. Использование более одного (в соответствии со списками «0» и «1») предшествующих и последующих кадров при кодировании и декодировании слайсов типа B с древовидной компенсацией движения. 15. Возможность применения взвешенного (весового) предсказания движения (в соответствии со списками «0» и «1») при кодировании и декодировании слайсов типа P и B, например, при воспроизведении плавно сменяющих в ТВ сигнале одна другую сцен. 16. Учёт векторов движения с параметрами, указывающими за границы изображения и с экстраполяцией внутрикадровой структуры опорного кадра за пределы изображения. 17. Возможность использования (в зависимости от управления многокадровым буфером в случае кодирования/декодирования) при предсказании движения в качестве опорных изображений, представленных B-слайсами. 18. Реализация оценки сигналов векторов движения с использованием предварительного подавления (фильтр-деблокинга) блочности в структуре сигналов кодируемых и воспроизводимых ТВ изображений, что повышает точность такой оценки (или предсказания). При этом предсказание составляющих векторов движения (или другие формы предсказаний) не реализуются через границы слайсов. 19. Использование режима кодирования/декодирования P-Skip, когда не передаются ни квантованный сигнал ошибки предсказания, ни вектор движения или опорный индекс. Декодирование реализуют в данном случае с использованием ссылки на изображение списка «0» в многокадровом буфере. 20. Возможность регулировки (сдвига) уровня сигнала после компенсации движения на величину, указанную при кодировании сигналов ТВ изображений, что позволяет, например, учесть изменения освещённости сцен. 20. Передача пикселей изображения без предсказания и преобразования (режим I PCM). 21. Использование более эффективного арифметического энтропийного кодирования коэффициентов ДКП в блоках. Представленные выше особенности кодирования отражают лишь основную часть специфики изменения (по отношению к MPEG-2) алгоритмов сжатия в H.264/AVC в сторону возрастания их адаптивности к текущей структуре сигнала ТВ изображений. Конкретное описание реализации большинства указанных здесь и других алгоритмов можно найти в [146, 147]. В данном разделе рассмотрим характеристики и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 466 Часть V. Цифровое преобразование изображений в телевидении варианты реализации лишь отдельных из перечисленных в п.п. 1-21 операций обработки сигналов изображений при кодировании и декодировании. 16.2.1. Переходные процессы и подавление заметности блочной структуры при сжатии спектра сигналов телевизионных изображений по стандартам MPEG Практика цифрового ТВ вещания показывает, что при полосе частот ТВ радиоканала и отношении средней мощности сигнала к средней мощности шума, равном 100, пропускная способность канала связи составляет ≈ 50 · 106 бит/с. Это свидетельствует о возможностях существенного увеличения эффективности использования частотного ресурса современных систем связи в условиях разработки и внедрения качественно новых цифровых методов, обеспечивающих значительное, по отношению к настоящему времени, увеличение степени устранения избыточности ТВ сигналов, отражающих контролируемую многомерную видеоинформацию. Сложность и неоднозначность, а также практическая невозможность всеобъемлющего решения проблемы сжатия спектра сигналов ТВ изображений определяется относительно большим диапазоном изменений уровня соответствующей функции, её градиента в пределах (по направлениям) контролируемого многомерного пространства. Это значительно усложняет реализацию и увеличивает, за счёт возрастания объёма необходимых вычислений, инерционность адаптивных трансформаций режима сжатия в зависимости от текущей специфики изменений в многомерном пространстве сигнала ТВ изображений. С другой стороны, отсутствие или сокращение вариантов указанных адаптивных трансформаций снижает эффективность функционирования современных систем сжатия многомерных видеоинформационных сигналов. Соответственно, научная проблема адаптивного сжатия многомерного спектра сигналов изображений представляет в настоящее время значительный теоретический и практический интерес для разработчиков и производителей оборудования цифровых систем передачи видеоинформации. Сжатие спектра с фрагментацией пространственно-временной структуры сигнала изображения последовательностями независимых блоков в реальном пространстве определяет направление раздельного сжатия спектра каждого из независимых блоков, отражающих при воспроизведении в своей совокупности текущую пространственновременную структуру сигналов ТВ изображений. Как уже отмечалось ранее, в стандарте JPEG последовательностями независимых блоков представлена структура изображений в пре-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 467 делах каждого отдельного кадра. Далее отсчёты каждого блока накапливают и подвергают ДКП с последующим взвешиванием полученных при этом отсчетов в пределах матрицы коэффициентов спектра. Последующая селекция таких отсчётов по абсолютному значению уровня обеспечивает регулировку степени сжатия и сохранение (с учетом энтропийного кодирования) наиболее интенсивных составляющих спектра сигналов изображений при фиксированной скорости сформированного цифрового потока. Однако увеличение степени сжатия приводит к появлению искажений в текущей структуре сигнала изображения. Причиной является соответствующее снижение числа уровней («огрубление») шкалы квантования полученных коэффициентов ДКП. С учетом того, что наиболее высокочастотные коэффициенты делятся на относительно большие коэффициенты матрицы квантования, по мере увеличения степени сжатия высокочастотные составляющие спектра постепенно обнуляются. То есть в данном случае имеет место постепенное сужение (ступенчатое представление) эквивалентной пространственной АЧХ цифровой ТВ системы, особенно по отношению к высокочастотным составляющим пространственной структуры изображений малой интенсивности, которые имеют низкий уровень спектра. С другой стороны, из-за повышения шага квантования при текущем увеличении степени сжатия возрастает степень деградации (ступенчатого огрубления) всех частотных составляющих малой интенсивности в структуре пространственного спектра сигнала ТВ изображений. По мере дальнейшего увеличения шага квантования полностью исчезают пространственные частотные составляющие все большей амплитуды. Такое нелинейное стробирование пространственного спектра сигнала изображения определяет многообразие искажений, возникающих в пределах каждого отдельного блока. Искажения, характерные для межкадрового кодирования, являются следствием искажений во внутрикадрой области. Специфической операцией межкадрового кодирования является компенсация движения на основе вычисления сигнала вектора движения, конкретизирующего новое (изменённое) положение данного блока в пределах пространства текущего кадра. При межкадровом кодировании аналогичным образом возникают разнообразные специфические искажения, обусловленные неточностью предсказания положения блоков подвижного, в пределах поля зрения датчика ТВ сигнала, объекта и подавлением при квантовании спектральных компонентов малой интенсивности сигнала возникающей при этом ошибки. Благодаря введённым элементам (перечислены выше в п.п. 1– 21) адаптивности, стандарт H.264/AVC обеспечивает, по отношению
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 468 Часть V. Цифровое преобразование изображений в телевидении к более ранним версиям, меньшую заметность искажений изображения при относительно малых скоростях передачи соответствующего цифрового потока в каналах связи и, соответственно, при всех прочих равных условиях, большую (почти в два раза) степень сжатия по отношению к MPEG-2. Однако использованные элементы адаптивности не исчерпывают возможности дальнейшего увеличения эффективности сжатия спектра ТВ сигналов. Эффективность сжатия, собственно, определяется также возможностями минимизации заметности сопутствующих искажений при реставрационном декодировании. 16.2.2. Переходные процессы при сжатии спектра сигналов телевизионных изображений по стандартам MPEG На основе результатов разработки принципов и соотношений для анализа многомерной дискретизации видеоинформационных сигналов, представленных в [36, 49, 52, 63, 148], рассмотрим специфику искажений внутрикадровой структуры ТВ изображений, обусловленную подавлением высокочастотных составляющих пространственного спектра при его квантовании в процессе сжатия. С этой целью определим в области пространственных частот (ωx 0ωy ) идеализированные спектры составляющих сигнала изображения в виде последовательностей (матриц) дельта-функций:  ( n ) m ∑ ∑ S11 (ωx , ωy ) = δ(ωy − βωy1 ) ; δ(ωx − αωx1 )  α=−n  S21 (ωx , ωy ) =  n−1 ∑ β=−m  δ(ωx − αωx1 )  α=−(n−1)  S31 (ωx , ωy ) =  n−3 ∑  α=−(n−3) α=−(n−i) m−3 ∑  δ(ωy − βωy1 ) β=−(m−3)  m−i ∑ (16.2) δ(ωy − βωy1 ) ; β=−(m−i) .............................. S(n,m−(n,m−1)) (ωx , ωy ) =   n−(n−1) ∑ = δ(ωx − αωx1 )  α=−(n−(n−1)) δ(ω y − βωy1 ) ; β=−(m−1) δ(ωx − αωx1 )  .............................. S(n,m−i)1 (ωx , ωy ) =   n−i ∑ = δ(ωx − αωx1 )   m−1 ∑ ∑ m−(m−1) β=−(m−(m−1))  δ(ωy − βωy1 ) ;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 469 Глава 16. Современные стандарты сжатия цифрового потока S(n,m−(n,m)) (ωx , ωy ) = δ(ωx )δ(ωy ). С помощью обратного преобразования Фурье найдём реальные функции, соответствующие спектрам S(n,m−i) (ωx , ωy ), представленным выражениями (16.2). При этом первоначально получим реальную функцию, отражающую в реальном пространстве первую составляющую общего спектра: D11 (x, y, ωx1 , ωy1 ) = n m 1 ∑ ∑ exp(jxαωx1 + jxβωy1 ). 4π 2 α=−n (16.3) β=−m Полученное соотношение для функции D11 (x, y, ωx1 , ωy1 ) позволяет осуществить следующее преобразование:  ( ) 2n 2m ∑ ∑ 1 1+ 2 cos xαωx1 1 + 2 cos yβωy1 . D11 (x, y, ωx1 , ωy1 ) = 4π 2 α=1 β=1 (16.4) Соответственно последнему, представим соотношение (16.4) для D11 (x, y, ωx1 , ωy1 ) следующим образом: 2m+1 2n+1 1 sin 2 ωx1 x sin 2 ωy1 y D11 (x, y, ωx1 , ωy1 ) = D1 (x)D1 (y) = . ωx1 x ωy1 y 4π 2 sin sin 2 2 (16.5) По аналогии с функцией D11 (x, y, ωx1 , ωy1 ), полученной для первой составляющей спектра, конкретизируем функции, отражающие в реальной области вторую, i-ю и другие составляющие: D21 (x, y, ωx1 , ωy1 ) = D2 (x)D2 (y) = 2(m − 1) + 1 2(n − 1) + 1 ωx1 x sin ωy1 y 1 sin 2 2 ; = ω x ω y x1 y1 4π 2 sin sin 2 2 .............................. Di1 (x, y, ωx1 , ωy1 ) = Di (x)Di (y) = 2(n − i) + 1 2(m − i) + 1 ωx1 x sin ωy1 y 1 sin 2 2 = ; ω x ω y x1 y1 4π 2 sin sin 2 2 .............................. D(n,m−1)1 (x, y, ωx1 , ωy1 ) = D3 (x)D3 (y) = 1 sin = 4π 2 (16.6) 2(n − (n − 1)) + 1 2(m − (m − 1) + 1 ωx1 x sin ωy1 y 2 2 ; ωx1 x ωy1 y sin sin 2 2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 470 Часть V. Цифровое преобразование изображений в телевидении D(n,m)1 (x, y, ωx1 , ωy1 ) = D3 (x)D3 (y) = 2(n − n)) + 1 2(m − m) + 1 ωx1 x sin ωy1 y 2 2 . ωx1 x ωy1 y sin sin 2 2 Специфика искажений сигналов изображений, возникающих при передаче вертикальных и горизонтальных границ в пределах внутрикадрового пространства в системах с применением стандартов сжатия спектра на основе ДКП (JPEG, MPEG), целесообразно выявлять при использовании в пределах кодируемых блоков испытательных сигналов изображений, отличающихся ступенчато нарастающим (спадающим) по уровню спектром. Постепенное, пороговое устранение спектральных составляющих отдельных ступеней данного спектра, моделирующее результат квантования коэффициентов спектра, сопровождается сопутствующими искажениями пространственной структуры такого сигнала изображения. В частотном пространстве ступенчато нарастающий спектр изображения в пределах блока коэффициентов определим в виде суммы представленных в (16.2) составляющих: 1 sin = 4π 2 S0 (ωx , ωy ) = η1 S11 (ωx , ωy ) + η2 S21 (ωx , ωy ) + ... + ηi S0i (ωx , ωy ) + ... + ηn,m−1 Sn,m−(n,m−1) (ωx , ωy ) + ηn,m Sn,m−(n,m) (ωx , ωy ). (16.7) При этом коэффициенты ηi определяют относительный уровень данной составляющей. Составляющая (матрица) S11 (ωx , ωy ) имеет (2n+ + 1) × (2m + 1) отсчётов, составляющая S21 (ωx , ωy ) определяется таким же соотношением для случая, когда число отсчётов в горизонтальном и вертикальном сечениях данной прямоугольной функции спектра симметрично (справа и слева, сверху и снизу) снижается на фиксированное число v (v = 1) по отношению S21 (ωx , ωy ). Аналогичным образом изменяется число отсчётов составляющей S31 (ωx , ωy ) по отношению к S21 (ωx , ωy ) и т.д. Соответственно, при симметричном снижении числа отсчётов спектра на единицу получаем выражения для всех составляющих в соотношении (16.2). Будем, в частности, считать, что матрица S11 (ωx , ωy ) имеет n × ×m = 15 × 15 дискретных отсчётов, S21 (ωx , ωy ) — 13 × 13, S31 (ωx , ωy ) — 11 × 11, S41 (ωx , ωy ) — 9 × 9, S51 (ωx , ωy ) — 7 × 7, S61 (ωx , ωy ) — 5 × 5, S71 (ωx , ωy ) — 3 × 3, S81 (ωx , ωy ) — 1 × 1. Соответствующим образом определяются соотношения (16.5), (16.6) для составляющих, отражающих в реальном пространстве каждую из функций дискретного спектра. При этом исходная форма реального видеоинформационного сигнала, заданного в области пространственных частот суммой (16.7) ступенчатых составляющих спект-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 471 ра S0 (ωx , ωy ), соответствует вкладу каждой отдельной такой составляющей в общий реальный сигнал: D0 (x, y, ωx1 , ωy1 ) = η11 D11 (x, y, ωx1 , ωy1 ) + η12 D12 (x, y, ωx1 , ωy1 ) + +η13 D13 (x, y, ωx1 , ωy1 )+η14 D14 (x, y, ωx1 , ωy1 )+η15 D15 (x, y, ωx1 , ωy1 )+ + η16 D16 (x, y, ωx1 , ωy1 ) + η17 D17 (x, y, ωx1 , ωy1 ) + η18 D18 (x, y, ωx1 , ωy1 ). (16.8) Для варианта η11 = η12 = η13 = ... = η17 = η18 = 1 моделирование воздействия «огрубления» шкалы квантования при увеличении степени сжатия на передачу пространственной структуры сигнала изображения будем определять как последовательное обнуление в двумерном (ступенчатого вида) спектре и реальном сигнале ступеней и соответствующих составляющих, отражающих высокие пространственные частоты. Если, в частности, устранить из суммы составляющих спектра три наиболее высокочастотных ступени, получим для реального сигнала соотношение следующего вида: D1 (x, y, ωx1 , ωy1 ) = 4D14 (x, y, ωx1 , ωy1 ) + D15 (x, y, ωx1 , ωy1 ) + + D16 (x, y, ωx1 , ωy1 ) + η17 D17 (x, y, ωx1 , ωy1 ) + η18 D18 (x, y, ωx1 , ωy1 ). (16.9) По аналогии могут быть получены соотношения, отражающие форму реального сигнала для вариантов устранения, например, пяти, шести и семи ступеней спектра. На рис. 16.8,a представлен результат вычисления с использованием полученных соотношений (16.5)-(16.9) сигнала изображения D0 (x, y, ωx1 , ωy1 ), заданного в области пространственных частот сум- Заданный ступенчатым пространственным спектром сигнал изображения: a — сигнал, соответствующий исходному спектру; b — графики сечений сигналов: 1 — исходное число; 2 — четыре ступени исходного спектра сигнала изображения; 3 — три ступени; 4 — две ступени; 5 — одна ступень Ðèñ. 16.8.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 472 Часть V. Цифровое преобразование изображений в телевидении Заданный ступенчатым пространственным спектром сигнал изображения: a — сигнал, соответствующий четырём ступеням; b — нормированные графики сечений сигналов: 1 — исходное число; 2 — четыре ступени исходного спектра сигнала изображения; 3 — три ступени; 4 — две ступени; 5 — одна ступень Ðèñ. 16.9. мой всех восьми ступенчатых составляющих исходного спектра, т. е. для случая отсутствия обнуления его отдельных ступеней. На графике 1 рис. 16.8,b показано сечение D0 (x, 0) данного сигнала при выборе ωx1 = ωy1 ≈ 0,06 · 2π · 13,5 · 10−6 . Графиками 2, 3, 4, 5 на рис. 16.8,b показаны расчётные изменения формы и уровня сечений соответственно в случаях обнуления четырёх, пяти, шести и семи ступеней исходного спектра сигнала изображения. Полученные результаты свидетельствуют о существенном падении уровня, увеличении протяжённости главного лепестка (вплоть до фиксированного уровня) и возникновении выбросов в случае последовательного обнуления трёх, пяти, шести и семи ступеней высокочастотных составляющих исходного ступенчатого вида пространственного спектра сигнала изображения. На рис. 16.9 представлены вид импульсной характеристики сигнала при обнулении четырёх высокочастотных ступеней пространственного спектра (a) и нормированные импульсные характеристики (b), отражающие рассмотренные выше варианты (см. рис. 16.8) воздействия квантования на ступенчато нарастающий по уровню пространственный спектр сигнала изображения. Согласно относительным результатам вычислений, показанным на рис. 16.9,b, с возрастанием числа подавленных при сжатии высокочастотных составляющих пространственного спектра в пределах блоков значительно, практически линейно, возрастает относительная амплитуда и протяжённость сопутствующих выбросов в структуре соответствующей импульсной характеристики. Возрастает в её структуре также протяжённость главного лепестка. Последнее непосредственно влияет на внутрикадровые искажения тонких линий, например
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 473 вертикальных и горизонтальных малоконтрастных линий, в системах со сжатием спектра, а также на интегральные искажения (снижение крутизны) фронта и специфику оконтуриваний при передаче малоконтрастных границ аналогичной ориентации. Это связано с тем, что текущие изменения параметров импульсной характеристики практически полностью определяют (действие свёртки) передачу границ и других малоконтрастных составляющих внутрикадровой структуры ТВ изображений. Известно, что анизотропия усреднённой спектральной интенсивности реальных изображений имеет ромбовидную конфигурацию области граничных частот двумерного пространственного спектра [75]. При этом максимальная протяжённость указанного пространственного спектра ориентирована в горизонтальном и вертикальном направлениях внутрикадрового пространства. Интегральные искажения таких составляющих сигнала изображений, возникающие при сжатии, существенно влияют на субъективное качество при их восприятии. При этом, как показали исследования, проведённые на кафедре телевидения МТУСИ им. С.И. Катаева, очень важно положение, например, вертикально и горизонтально ориентированных составляющих внутрикадровой структуры по отношению к использованной последовательности блоков. Существенное влияние оказывают и изменения параметров формы последних. Учёт этого фактора, как показано в [149], может обеспечить увеличение эффективности алгоритма адаптивного сжатия спектра в системах цифрового ТВ вещания. Таким образом, из-за повышения шага квантования при текущем увеличении степени сжатия возрастает степень деградации (огрубления) частотных составляющих малой интенсивности в структуре пространственного спектра сигнала ТВ изображений. По мере дальнейшего увеличения шага квантования полностью исчезают пространственные частотные составляющие все большей амплитуды. Такое нелинейное стробирование составляющих спектра отдельных элементов структуры сигналов реальных изображений в пределах блоков пикселей определяет разнообразные сопутствующие искажения пространственно-временной структуры сигналов ТВ изображений. Максимальная протяжённость пространственного спектра сигнала ТВ изображений ориентирована в горизонтальном и вертикальном направлениях внутрикадрового пространства. Большое значение имеет положение внутрикадровой структуры ТВ изображений по отношению к использованной в процессе сжатия последовательности блоков. Учёт этого фактора может обеспечить заметное увеличение эффективности адаптивного сжатия спектра в современных системах цифрового ТВ вещания [149].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 474 Часть V. Цифровое преобразование изображений в телевидении 16.2.3. Подавление заметности блочной структуры при сжатии спектра сигналов телевизионных изображений по стандартам MPEG Независимое сжатие спектра сигнала ТВ изображения в смежных блоках определяет возникновение блокинг- и мозаичного эффектов. Низкоградиентные изменения фона в смежных блоках имеют малую относительную интенсивность сопутствующих таким изменениям составляющих спектра в области относительно низких пространственных частот. В условиях порогового (при квантовании коэффициентов спектра) подавления таких составляющих в смежных блоках возникают квазинезависимые деградации фоновых изменений в структуре изображений. Различия в смежных блоках проявляются возникновением заметных при видеоконтроле, различных по уровню и форме, ступенчатых в пределах и на границах блоков изменений, в том числе и постоянной составляющей. При этом также нарушается сопряжение смежных блоков (на границах) и более тонких в пределах блоков (по отношению к низкоградиентным изменениям) элементов пространственной структуры изображений. Блочное стробирование, в частности, текущей пространственной структуры сигналов ТВ изображений, чаще всего не является эквивалентным в смежных блоках по весовым параметрам в отражении общей (для смежных блоков) специфики и элементов тонкой пространственной структуры ТВ изображений. В связи с этим возникают сопутствующие различия в степени подавления высоких частот, соответствующих одному и тому же в смежных блоках элементу пространственной структуры изображений. Последнее может проявляться как в виде не совпадающих на границах и заметных изменениях формы такого элемента, так и возникновением фоновых изменений, обусловленных нарушением балансировки высокочастотных и низкочастотных составляющих спектра для совокупности пикселей, соответствующих исходным изображениям отдельных блоков. Заметность рассмотренных искажений (блокинг- и мозаичного эффектов) может быть снижена за счёт использования адаптивной сглаживающей низкочастотной фильтрации, обеспечивающей интерполяционное подавление заметности фоновых ступенчатого типа искажений в смежных блоках и более эффективное интерполяционное сопряжение их тонкой пространственной структуры. Применение сглаживающей фильтрации обеспечивает низкоградиентные переходы (подавление ступенчатости межблочных границ в интервале шести пикселей [147]) между смежными блоками. Однако приемлемый вариант решения указанной задачи может быть осуществлён лишь с использованием адаптивного варианта реализации подобной фильтрации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 475 Существенная степень сглаживания границ смежных блоков (сужение полосы пропускания фильтра) нежелательна, например, при передаче изменениями уровня пикселей отноосительно резких пространственных границ или мелкой пространственной структуры ТВ изображений, а с другой стороны, наряду с последним, необходимо реализовывать относительно высокую степень сглаживания возникшей блочности при воспроизведении низкоградационных изменений фона. Достаточно подробное рассмотрение варианта реализации адаптивной фильтрации представлено в [150], в которой имеет место вероятностная оценка типа искажений в пределах границ блоков с учётом параметра реализуемого квантования коэффициентов спектра с принятием логического решения и с соответствующим адаптивным изменением ширины полосы пропускания сглаживающего фильтра. Реализуется, в частности, относительное сравнение интенсивности перепада уровней между граничными пикселями смежных блоков и смежными, по отношению к положению указанного перепада, пикселями в каждом из смежных блоков. Интенсивности возникающих перепадов, согласно изложенному выше, зависят от степени огрубления шкалы квантования. Чем она грубее, тем более интенсивными и протяжёнными являются колебания уровней пикселей в пределах границ блоков. Если же колебания уровней не превышают при данной шкале квантования заданный порог, то осуществляется сглаживание границы. В случае превышений устанавливаемых пороговых значений, когда интенсивности перепадов велики и не соответствуют степени огрубления шкалы квантования, принимается решение о наличии реального изменения уровня в структуре сигнала ТВ изображений и сглаживание данной границы практически не осуществляется. При этом сохраняется чёткость воспроизведения идентифицированных границ или других элементов пространственной структуры сигнала ТВ изображений. 16.2.4. Предсказание в пределах кадров при сжатии спектра сигналов телевизионных изображений по стандарту H.264/AVC С уменьшением размера используемых блоков при сжатии спектра ТВ изображений по стандарту H.264/AVC возрастает точность экстраполяционных режимов предсказания пространственной структуры изображений в их пределах (Intra-предсказания), которые реализуют с учётом уровня примыкающих к границам этих блоков пикселей ранее кодированных блоков. При этом I-слайсы могут содержать блоки, кодированные в режимах Intra 4×4, Intra 8×8, Intra 16×16, P-слайсы — в режимах Intra 4×4, Intra 8×8, Intra 16×16, Skip-P 16×16, P 8×8, P 16×8, P 8×16. При этом блоки сигнала яркости с числом пикселей
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 476 Часть V. Цифровое преобразование изображений в телевидении 16×16 могут быть, в зависимости от специфики пространственной структуры сигнала ТВ изображений в их пределах, разделены на блоки с числом пикселей 8×8, каждый из которых, в свою очередь, может быть также поделён на блоки с числом пикселей 4×4. Обогащение участка сигнала ТВ изображения мелкими (относительно контрастными) пространственными структурными элементами, тонкими линиями и высокоградиентными границами определяет использование при его предсказании (из-за возрастания объёма сигнала сопутствующих ошибок) блоков с числом пикселей 4×4. Внутрикадровые участки сигнала яркости ТВ изображения, отличающиеся низкоградиентными изменениями уровня пикселей (фонового типа), предсказываются в пределах блоков с числом пикселей 16×16. И, наконец, предсказание участков сигнала ТВ изображения, которые по характеру пространственной структуры изображения, являются промежуточными по отношению к указанным (первым двум) предсказываются в пределах блоков с числом пикселей 8×8. Основные особенности реализации пространственно-временного предсказания структуры сигнала ТВ изображений были относительно подробно рассмотрены в [73]. Варианты экстраполяционного преобразования (нулевого порядка), используемые в стандарте сжатия H.264/AVC при предсказании пространственной структуры в блоках по вертикали и горизонтали, являются наиболее простыми. Их применение оправдано минимальной вычислительной сложностью. В [151] предложено повысить порядок экстраполяционного преобразования при предсказании блоков с числом пикселей 4×4 за счёт использования при предсказании полного объёма пикселей из соседних, ранее закодированных блоков. Используемые в стандарте сжатия H.264/AVC режимы пространственного предсказания для блоков сигнала яркости с числом пикселей 4×4 показаны на рис. 16.10. Как следует из рис. 16.10, в данном стандарте используют девять следующих режимов такого внутрикадрового предсказания [147]: 1.0. Режим «0» (вертикальное преобразование) — верхние пиксели A, B, C, D экстраполируются (повторяются) по вертикали; 2.0. Режим «1» (горизонтальное преобразование) — левые пиксели I, J, K, L экстраполируются (повторяются) по горизонтали; 3.0. Режим «2» (преобразование усреднением) — верхние пиксели и левые пиксели суммируют и нормируют с получением среднего значения для всего блока пикселей 4×4; 4.0. Режим «3» (диагональное преобразование) — пиксели B, C, D, E, F, G, H подвергаются экстраполяционно-интерполяционному преобразованию под углом в 45 градусов вниз и налево;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.10. 477 Режимы предсказания в пространстве кадра блоков 4×4 5.0. Режим «4» (диагональное преобразование) — пиксели K, J, I, M, A, B, C подвергаются экстраполяционно-интерполяционному преобразованию под углом в 45 градусов вниз и направо; 6.0. Режим «5» (наклонное преобразование) — пиксели J, I, M, A, B, С подвергают экстраполяционно-интерполяционному преобразованию вниз и направо под углом в ≈26,6 градусов по отношению к вертикальному направлению вниз; 7.0. Режим «6» (наклонное преобразование) — пиксели K, J, I, M, A, B подвергают экстраполяционно-интерполяционному преобразованию вниз и направо под углом в ≈26,6 градусов по отношению к горизонтальному направлению; 8.0. Режим «7» (наклонное преобразование) — пиксели B, C, D, E, F подвергают экстраполяционно-интерполяционному преобразованию вниз и налево под углом в ≈26,6 градусов по отношению к вертикальному направлению; 9.0. Режим «8» (наклонное преобразование) — пиксели L, K, J подвергают экстраполяционно-интерполяционному преобразованию вверх и направо под углом в ≈26,6 градусов по отношению к горизонтальному направлению. Следует отметить в связи с последним, что при использовании, например, чисто экстраполяционных режимов для решения данной
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 478 Часть V. Цифровое преобразование изображений в телевидении задачи обычно существенно возрастают (с учётом, в том числе, и действия помех) ошибки (особенно с увеличением протяжённости интервала, в пределах которого реализуют вычисления [73] (предсказания) уровня пикселя. Поэтому в стандарте сжатия H.264/AVC имеет место оправданное сочетание экстраполяционной и весовой интегральной (интерполяционного типа) обработки при предсказании уровня пикселей в блоках 4×4 в режимах «3»-«8». В частности, в [146] приведено следующее соотношение для вычисления (предсказания) уровня пикселя (d), коодинаты которого в анализируемом блоке 4×4 соответствуют пересечению столбца пикселей, в начале которого находится верхний пиксель D, и строки, в начале которой расположен боковой пиксель I: ( ) C D B + + d = round . (16.10) 4 2 4 Можно заметить, что в соотношение (16.10) входит пиксель C, зкстраполированный на один интервал, пиксель B, экстраполированный на два интервала, и верхний пиксель D. Ошибки экстраполяции снижаются в данном случае за счёт интерполяционной (весовой) обработки всех трёх пикселей. В случаях недоступности при декодировании отдельных пикселей при реализации предсказания могут использоваться экстраполированные значения уровня пикселей. В частности, в случаях, когда недоступны верхние пиксели E, F, G, H, в стандарте H.264/AVC их заменяют пикселем D. Режимы предсказания смежных блоков 4×4 в кодере и, соответственно, при декодировании чаще всего имеют высокий уровень корреляции. Последнее позволяет вычислять при кодировании и декодировании наиболее вероятный режим предсказания и при передаче идентифицировать отсутствие замены или наличие замены наиболее вероятного режима предсказания. Применение такого варианта обеспечивает снижение скорости передачи сигнала идентификации режимов предсказания блоков с числом пикселей 4×4 [146]. Для предсказания блоков с числом пикселей 8×8 сигнала яркости также используется девять режимов предсказания. Для предсказания блоков сигнала яркости с числом пикселей 16×16 используются четыре режима внутрикадрового предсказания: 1.0. Режим «0» (вертикальное преобразование) — верхние пиксели блока экстраполируются (повторяются) по вертикали; 2.0. Режим «1» (горизонтальное преобразование) — левые пиксели блока экстраполируются (повторяются) по горизонтали; 3.0. Режим «2» (преобразование усреднением) — верхние и левые пиксели суммируют и нормируют с получением среднего значения для всего блока пикселей 16×16;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 479 4.0. Режим «3» (плоскостное преобразование) — с учётом изменений уровней верхних и левых пикселей подбирается функция поверхности предсказания уровня пикселей в пределах блока. В случае, когда макроблок закодирован в режиме Intra 16×16 (блок 16×16 пикселей яркостной компоненты получен внутрикадровым предсказанием), блоки с числом пикселей 4×4 сигнала ошибки подвергают преобразованию, а DC коэффициенты полученных блоков, для которых характерна высокая степень корреляции, подвергают в связи с последним преобразованию Адамара 4×4 и последующему квантованию. Предсказание (Intra) блоков с числом пикселей 8×8 цветоразностных сигналов CR и CB осуществляется идентичным образом в стандарте H.264/AVC в режимах, сходных с предсказанием блоков сигнала яркости с числом пикселей 16×16, с использованием ранее закодированных пикселей, примыкающих к данным блокам слева и сверху. Определены в данном случае четыре режима предказания: режим «0» — преобразование усреднением; режим «1» — горизонтальное преобразование; режим «2» — вертикальное преобразование; режим «3» — плоскостное преобразование. Более развёрнутое изложение вопросов предсказания в пределах кадров при сжатии спектра сигналов телевизионных изображений по стандарту H.264/AVC можно найти в [146, 147, 152]. 16.2.5. Предсказание в последовательности кадров при сжатии спектра сигналов телевизионных изображений по стандарту H.264/AVC Как было отмечено ранее, в стандарте H.264/AVC сжатия спектра сигналов ТВ изображений используется древовидная (адаптивное изменение параметров формы и размера блока) компенсация (предсказание) движения с более высокой, по отношению к MPEG-2, предельной точностью в одну четвёртую исходного расстояния между смежными пикселями (отсчётами) и с адаптивными (к структуре сигнала изображения) изменениями параметров формы и размеров блоков сигнала яркости от 16×16 до 4×4 пикселей. Следует иметь в виду, что для сигналов телевизионного изображения характерным является эффект сглаживания границ, а также «размытия» тонких и мелких деталей в ортогональном движению направлении. С увеличением скорости движения и времени накопления (обычно последнее менее или равно длительности кадра) потенциального рельефа сигнала ТВ изображений в преобразователях «свет-сигнал» возрастает воздействие данного эффекта на качество (чёткость) передачи пространственной структуры подвижных объектов в указанном направлении. Поэтому требование предельной точности предсказания движения в одну четвёртую часть длительности пикселя связано с уменьшением ошибок
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 480 Часть V. Цифровое преобразование изображений в телевидении предсказания при передаче объектов, относительно медленно (в среднем) изменяющих координаты своего положения в последовательности кадров. Предсказание (Inter) сигналов вектора движения реализуется при сжатии спектра сигналов яркости ТВ изображений по стандарту H.264 (AVC) с адаптивными (к структуре сигнала изображения) изменениями параметров формы и размеров блоков от 16×16 до 8×8 пикселей. При этом отдельный блок в виде квадратной матрицы с числом пикселей 16×16 может быть разделён на блоки в виде двух прямоугольных матриц с числом пикселей 8×16, в виде двух прямоугольных матриц с числом пикселей 16×8, в виде четырёх квадратных матриц 8×8. В свою очередь, блоки 8×8, при необходимости, могут быть поделены на блоки в виде двух прямоугольных матриц с числом пикселей 4×8, в виде двух прямоугольных матриц с числом пикселей 8×4, в виде четырёх квадратных матриц 4×4. Пресказание векторов движения при сжатии спектра цветоразностных (вариант передачи 4:2:0) сигналов ТВ изображений реализуется с разделением (по аналогии) отдельных блоков в виде квадратных матриц с числом пикселей 8×8 на блоки прямоугольных и квадратных матриц с соответствующим числом пикселей: по два блока с числом пикселей 8×4 и 4×8; четыре блока с числом пикселей 4×4. Каждый из блоков 4×4, в свою очередь, может быть поделён на блоки в виде прямоугольных и квадратных матриц с соответствующим числом пикселей: по два блока с числом пикселей 4×2 и 2×4; четыре блока с числом пикселей 2×2. Для блоков с числом пикселей 8×8 сигнала яркости передаётся сигнал индексации (синтаксический элемент) для каждого блока с числом пикселей 8×8, который указывает, будет (или нет) данный блок делится на варианты блоков с числом пикселей 8×4, 4×8 или 4×4. Аналогичная передача синтаксического элемента осуществляется для каждого блока 4×4 и по направлению цветности. Указанные изменения формы и размера блоков позволяют обеспечивать адаптивное сохранение качества (чёткость, снижение заметности искажений) передачи пространственной структуры подвижных объектов и специфики изменений последней в локальных участках внутрикадрового пространства при сжатии спектра сигнала ТВ изображений по стандарту H.264/AVC. При этом сочетание в данном случае уменьшений предельных размеров блоков предсказания движения в сигнале яркости до числа пикселей 4×4 (цветности до числа пикселей 2×2) с увеличением точности интерполяционной оценки сигнала вектора движения до одной четвёртой пикселя (сигнал яркости) обеспечило заметное увеличение эффективности сжатия спектра по межкадровому направлению. При этом Inter-предсказание пикселей в так
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 481 называемых P-блоках (Predictive) реализуется с использованием необходимых участков ранее закодированных (reference) сигналов изображений кадров, которые накапливаются в буферной памяти и хранятся до момента реализации такого Inter-предсказания. Реализация Interпредсказания пикселей в B-блоках (Bi-Predictive), как было отмечено ранее, выполняется с использованием (в соответствии со списками «0» и «1») предшествующих и последующих сигналов изображений кадров. В декодер передаются синтаксические элементы, определяющие использование изображений из списков и значения их смещений (сигнал вектора движения). Соответственно, для P-блоков передаётся одно значение сигнала вектора движения, а для B-блоков передаются два значения указанных сигналов. С применением всех указанных сигналов осуществляется Inter-предсказание пикселей в P-блоках и взвешенное (линейного типа) Inter-предсказание пикселей B-блоков. Увеличение точности анализа сигналов вектора движения в сочетании с изменениями формы и размера блоков обеспечило заметное увеличение эффективности сжатия спектра по межкадровому направлению. При этом в случае дробной (по отношению к исходному периоду следования смежных пикселей в горизонтальном и вертикальном направлениях в пространстве кадра) позиции смещения пикселей анализируемого блока (по отношению к пикселям опорного блока) осуществляется интерполяционное формированием необходимых для реализации предсказания промежуточных пикселей. Уровни пикселей, интерполированных с точностью в одну вторую (половинную) часть исходного периода следования, вычисляются эквивалентным образом в горизонтальном и вертикальном направлениях с использованием одномерного фильтра низких пространственных частот, импульсная характеристика (ИХ) которого включает шесть отсчётов с весовыми коэффициентами (1, −5, 20, 20, −5, 1)/32. Специфика интерполяционного формирования (реставрации) необходимой совокупности блока таких пикселей, смещённых на дробную (или целую плюс дробную) часть исходных межпиксельных расстояний, иллюстрируется на рис. 16.11 [147]. Здесь заглавными буквами A–D, E–L, G–N, I–Q, R–U обозначены кратные исходному периоду следования позиции интерполируемых пикселей, прописными буквами aa, bb, b, s, gg, hh — на половинных (от периода следования) позициях по горизонтали, а буквами cc, dd, h, m, ee, ff — на половинных (от периода их следования) позициях по вертикали. Данные пиксели получают в стандарте H.264/AVC использованием указанной выше импульсной характеристики одномерного фильтра низких пространственных частот. В частности, реставрированный пиксель s = round(E − 5L + 20M + 20N − 5P + Q)/32), или s = round(E−5L+20M +20N −5P +Q)/32), или s = round(0,03125E−
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 482 Часть V. Цифровое преобразование изображений в телевидении Интерполяционное формирование необходимой совокупности пикселей блока, смещённых на дробную часть межпиксельных расстояний Ðèñ. 16.11. − 0,15625L+0,625M +0,625N −0,15625P +0,03125Q). Здесь round — операция округления. С учётом временных параметров реального ТВ сигнала установим половинный интервал следования пикселей как Tx = 0,36 · 10−6 с. В соответствии с этим идеализированный вариант ИХ используемого в стандарте H.264/AVC фильтра низких частот может быть для общего случая представлен следующим образом: g(tx ) = αδ(tx )+βδ(tx −Tx )+βδ(tx +Tx )+γδ(tx −3Tx )+ηδ(tx −7Tx )+ +γδ(tx + 3Tx ) + ξδ(tx − 5Tx ) + ξδ(tx + 5Tx ) + + ηδ(tx + 7Tx ) + θδ(tx − 9Tx ) + θδ(tx + 9Tx ). (16.11) Согласно соотношению (16.11), определим коэффициент передачи данного (идеализированного) варианта фильтра: K0 (fx ) = α + 2β cos(2πfx Tx ) + 2γ cos(2πfx 3Tx ) + 2ξ cos(2πfx 5Tx ) + + 2η cos(2πfx 7Tx ) + 2θ cos(2πfx 9Tx ). (16.12) В случае fx = 0 соотношение (16.12) имеет вид K0 (0) = α+2β +
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 483 + 2γ + 2ξ + 2η + 2θ. Соответственно, имеем нормированное значение коэффициента передачи K00 (fx ) = K0 (fx )/K0 (0). Приближённый учёт действия апертурных искажений, которые имеют место в преобразователях «свет-сигнал» при формировании сигнала ТВ изображений, реализуем на основе трёхкратной свёртки прямоугольной функции единичной амплитуды с преобразованием результата в частотное пространство и его нормированием [36, 63]. Соответственно, получим апертурную характеристику в виде ( )4 sin 2πfx φ2Tx K001 (fx ) = , (16.13) 2πfx φ2Tx где φ = 0,45. Результирующий коэффициент передачи фильтра, осуществляющего интерполяционное формирование необходимых для реализации предсказания промежуточных пикселей на половинных позициях, определяется в данном случае произведением K01 (fx ) = K00 (fx )K011 (fx ). (16.14) Согласно стандарту H.264/AVC, в соотношениях (16.11)–(16.14) значения α = 0, β = 0,625, γ = −0,15625, ξ = 0,03125, η = 0, θ = 0. Выбор значений η = 0, θ = 0 существенно снижает объём необходимых вычислений уровней промежуточных, на половинных позициях, пикселей. Недостатком же такого варианта является ухудшение параметров характеристики коэффициента передачи фильтра. Выбор, например, значений α = 0, β = 0,625, γ = −0,196, ξ = 0,0581, η = −0,0325θ = 0,01 определяет увеличение крутизны спада коэффициента передачи одномерного фильтра низких пространственных частот от полосы пропускания к полосе подавления и оптимизацию его формы K21 (fx ) в полосе пропускания. Значения предсказания уровня пикселей на позициях в одну четвертую начального периода следования получают в стандарте сжатия спектра H.264/AVC усреднением уровней пикселей на исходных позициях с результатами вычисления уровня промежуточных пикселей на половинных позициях. В связи с более низким, по отношению к сигналам яркости, разрешением уровни промежуточных пикселей в блоках цветоразностных составляющих вычисляют с точностью до одной восьмой от периода следования исходных пикселей. Вычисления уровней указанных пикселей реализуют с применением билинейной интерполяции, когда имеет место взвешенная оценка уровня промежуточных пикселей по уровням смежных четырёх (исходных) пикселей в зависимости от разностей координат в позиции данного промежуточного пикселя по отношению к исходным [73, 147].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 484 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 16.12. Результаты вычисления коэффициентов передачи интерполяционных низкочастотных фильтров и апертурной характеристики: 1 — расчётный коэффициент передачи стандарта H.264/AVC с протяжённостью ИХ в шесть отсчётов; 2 — вариант с увеличением протяжённости ИХ; 3 — расчётная апертурная характеристика Фильтры, используемые для осуществления аналогичной интерполяции сигнала яркости в китайском стандарте сжатия спектра цифрового телевидения, базирующемся на стандарте H.264/AVC, имеют незначительно отличающиеся ИХ [153, 154]. В частности, для вычисления уровня пикселей на половинных позициях в данном случае используется низкочастотный фильтр, имеющий ИХ (−1, 5, 5, −1)/8, а на позициях в одну четвертую начального периода следования используется фильтр с ИХ (1, 7, 7, 1)/16. Таким образом, степень сжатия спектра в стандарте H.264/AVC при фиксированном качестве сигналов ТВ изображений удалось существенно увеличить (практически в два раза) за счёт осуществления множества доработок, которые увеличивают эффективность передачи составляющих цифрового потока по каналу связи, снижают ошибки предсказаний и, соответственно, необходимую скорость передаваемого цифрового потока. Относительно подробную информацию о специфике функционирования использованных алгоритмов адаптивного типа, параметрах и характеристиках данного стандарта сжатия спектра сигналов ТВ изображений можно найти в [146, 147, 149–161]. 16.3. Стандарт представления медиаобъектов MPEG-4. Стандарт MPEG-4 является стандартом ISO/IEC, разработанным комитетом MPEG (Moving Picture Experts Group). Данный стандарт является результатом работы сотен исследователей и разработчиков всего мира. Полностью расширенный вариант MPEG-4 стал международным стандартом в 2000 г., хотя работы по его усовершенствованию продолжаются. Стандарт MPEG-4 охватывает следующие области: • цифровое телевидение;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 485 • интерактивные графические приложения; • интерактивные мультимедийные приложения. Стандарт MPEG-4 реализует следующее: • представляет блоки звуковой и аудиовизуальной информации, называемые «медийными объектами». Эти объекты могут быть естественного или искусственного происхождения. Это означает, что они могут быть записаны с помощью камеры или микрофона, а могут быть и сформированы посредством ЭВМ; • описывает комбинации этих объектов при создании составных медийных объектов, которые образуют аудиовизуальные сцены; • мультиплексирование и синхронизацию данных ассоциированных с медийными объектами, так чтобы они могли быть переданы через сетевые каналы, обеспечивая QoS (Quality of Service), приемлемое для природы специфических медийных объектов; • взаимодействие с аудиовизуальной сценой, сформированной на приемной стороне. В отличие от принципов покадрового кодирования в стандартах MPEG-1 и MPEG-2, концепция MPEG-4 принципиально изменена. Изображение и звук не комбинируются перед отправкой, а передаются посредством нескольких параллельных потоков. Большой объем работы переведен на принимающую и воспроизводящую часть процесса. Если в предыдущих форматах была обработка отдельных кадров и последовательное их воспроизведение, то теперь декодер должен провести полное воссоздание и микширование звука и изображения, т. е. то, что до сих пор обычно делало оборудование в ТВ студии. Байтовые потоки могут переносить любую информацию, имеющую отношение к окончательному изображению. Каждый вид информации далее можно распределить по кадрам наиболее подходящим методом. Отдельно кодируются текстовые данные, статистические изображения, последовательность движущихся изображений, общие звуки, речь и тому подобное. Следующий самостоятельный поток содержит описание сцены, т. е. способ, которым складываются элементарные блоки информации при окончательном воспроизведении. Аудиовизуальные сцены MPEG-4 формируются из нескольких медийных объектов, организованных иерархически: • статические изображения (например, фон изображения); • видеообъекты (например, говорящее лицо — без фона); • аудиообъекты (голос данного лица). Связанные видео- и аудиообъекты, например изображение говорящего человека, образуют аудиовизуальный объект (AVO — audiovisual object). Видео- и аудиообъекты составляют сцену. MPEG-4 содержит специальный язык для описания сцен-BIFS (Binary Format for Scene — двоичный формат для сцен).
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 486 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 16.13. Аудиовизуальная сцена Иллюстрация описанных выше функций MPEG-4 при помощи аудиовизуальной сцены показана на рис. 16.13. Аудиовизуальная сцена MPEG-4 имеет иерархическую организацию: • фиксированный 2-мерный задний план; • картинка говорящего человека (без заднего плана); • голос, соответствующий говорящему человеку и т. д. MPEG-4 стандартизирует количество таких примитивных объектов, которые в свою очередь могут быть как двух-, так и трехмерными, задает кодированное представление таких объектов, как: • текст и графика; • «говорящие головы» и ассоциирующийся с ними текст может быть использован на приемном конце для синтеза речи и анимации «головы»; • анимированные человеческие тела. Количество битов, используемых для кодирования этих объектов, является минимальным. Объект в кодированной форме может быть представлен независимо от окружения или заднего плана. Таким образом, основное отличие MPEG-4 от ранее принятых стандартов — объектно ориентированное представление медиаинфор-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 487 мации. В стандарте вводится ключевое понятие медиаобъекта — единицы звукового, визуального или аудиовизуального контента. Любая сцена разделяется на объекты, которые соотносятся в пространстве и времени и описываются отдельными элементарными потоками (ЭП). Объекты могут быть натуральными — записанными с видеокамеры или микрофона, и синтетическими — синтезированными в компьютере. Такой подход имеет ряд преимуществ: более экономично расходуются биты для описания сцены, отдельные объекты легко использовать в других сценах, упрощается построение масштабируемых сцен и взаимодействие с объектами, появляются широкие возможности взаимодействия пользователя с выбранным объектом, например, вывод дополнительной информации об объекте, изменение его параметров (цвета, текстуры, громкости звучания или языка), исключение объекта из сцены, создание пользователем новых сцен из объектов, полученных от разных источников или хранящихся в памяти терминала. Все эти операции требуют лишь изменить описание сцены, а это вполне под силу процессору абонентского терминала. Структура кодирования в MPEG-4 включает в себя кодирование формы, компенсацию движения и кодирование текстуры с привлечением ДКП (используя блоки 8×8 как в MPEG-2 или ДКП, адаптирующееся к содержанию изображения). Важным преимуществом кодирования MPEG-4 является то, что эффективность сжатия может быть для некоторых видеопоследовательностей существенно улучшена путем применения объективно-ориентированных средств предсказания каждого из объектов в пределах сцены. Для улучшения эффективности кодирования и гибкости представления объектов в стандарте MPEG-4 введены две методики для оценки и компенсации перемещения: • глобальная компенсация перемещения GMC (Global Motion Compensation) — для объекта, использующего малые числа параметров (например, статическое изображение панорамы фона); • пиксельная компенсация перемещения, базирующаяся на блоках 8×8 или 16×16 пикселей, — улучшает точность схемы компенсации, приводит к малым ошибкам предсказания и, следовательно, лучшему визуальному качеству. Субъективные оценочные тесты показывают, что комбинация этих методик дает экономию в полосе частот канала связи до 50 % в зависимости от типа содержимого и потока данных. Описание сцены на рис. 16.13 имеет иерархическую структуру. Верхним уровнем структуры является сцена в целом. Она содержит неподвижный фон, образованный изображением стены, стола, глобуса и т. п. В сцене присутствует один персонаж (чаще два и более),
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 488 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 16.14. Пример структуры описания сцены который является аудиовизуальным объектом (видеообъект — движущееся изображение персонажа, аудиообъект — голос этого персонажа). Кроме того, в сцене изображен стол и глобус, которые являются видеообъектами. Описание каждой сцены включает данные о координатах объектов в пространстве и об их привязке ко времени. Видеообъекты могут размещаться в разных плоскостях VOP (Video Object Plane), так что видеообъекты, находящиеся в более близких к зрителю плоскостях сцены, перекрывают при движении видеообъекты, находящиеся в более дальних плоскостях. В интерактивном режиме пользователь может влиять на развитие сцены, подавая соответствующие команды. MPEG-4 позволяет также передавать пользователю дополнительную информацию об объектах. Для реализации активных возможностей MPEG-4 обычно необходим ПК, подключенный к Интернету. Пример структуры описания сцены, в соответствии с вышеизложенным, приведен на рис. 16.14. Таким образом, разбиение аудиовизуальной сцены, подлежащей передаче, на ряд блоков (объектов), раздельное их кодирование и описание позволяют значительно сократить цифровой поток данных в канале связи. Так, отдельные неподвижные объекты можно передавать в пределах последовательности кадров с более низкой частотой с последующим восстановлением на приемной стороне в каждом кадре. Простые объекты можно вообще не передавать, а путем их описания воссоздавать на приемной стороне, имея соответствующие архивные материалы (стол, стулья, глобус, фон, содержащий падающие листья, хлопья снега, дождь и фоновый шум: пение птиц, шум автомашин и т.п.). То есть многие объекты можно синтезировать и анимировать. В процессе передачи пользователь может вступать во взаимодействие с AVO: • изменять точку обзора сцены; • изменять местоположение объектов на сцене; • инициировать каскад действий, например, старт или остановку видеопотока; • выбрать желаемый язык;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.15. 489 Структурная схема видеокодера MPEG-4 • инициировать дополнительные действия, например, виртуальные телефонные звонки, пользовательские ответы и др. MPEG-4 позволяет также передавать пользователю дополнительную информацию от объекта, которая может отображаться, например, в виде окна с текстом. Кодирование видеообъектов. Видеообъекты, составляющие сцену, кодируются по отдельности и объединяются в последовательность визуальных объектов (VOS — Visual Object Sequence). Видеообъект (VO) может иметь несколько уровней, каждому из которых соответствует элементарный поток видеоданных. Наличие нескольких уровней обеспечивает масштабируемость. Базовый уровень (слой) дает изображение с базовым качеством. Дополнительные или улучшающие (enhanced) слои позволяют получить изображение с улучшенным пространственным разрешением. В MPEG-4 используется набор методов кодирования, включая как алгоритмы MPEG-1, MPEG-2, так и принципиально новые, основанные на понятиях VO. Выбор метода кодирования определяется характером изображения и требуемым коэффициентом сжатия видеоинформации. Обобщенная структурная схема видеокодера MPEG-4 для натуральных изображений приведена на рис. 16.15. Обозначения в этой схеме соответствуют обозначениям схемы рис. 16.3. Данная схема является упрощенной и не показывает многие блоки и связи. На вход кодера поступают исходные видеоданные видеообъекта VO. На выходе кодера формируется элементарный поток видеоданных ES. Кратко рассмотрим основные методы кодирования. Видеообъекты, представляющие обычные ТВ кадры, кодируются с использованием гибридного кодирования (MPEG-2). Предсказание в этом случае выполняется, например, в блоке Пред1.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 490 Часть V. Цифровое преобразование изображений в телевидении Предусмотрено два уровня скорости передачи данных. Уровень очень низкой скорости передачи VLBV (Very Low Bitrate Video) предназначен для передачи изображений с низким разрешением (форматы QCIF и SQCIF) и пониженной частотой кадров (10. . . . . . 15 Гц) по узкополосным каналам связи (5. . . 64 кбит/с), например, видеотелефонной связи. Уровень высокой скорости (High Bitrate Video) предназначен для передачи изображений с высоким пространственным разрешением (со скоростями 64 кбит/с . . . 10 Мбит/с). Этот уровень предназначен для передачи ТВ программ. Кодирование, основанное на содержании (content-based coding), позволяет получить существенно большее сжатие изображений видеообъектов сложной формы, например область, отличающаяся от окружения яркостью или цветом. Эта область может перемещаться и деформироваться. При формировании предсказанного изображения с компенсацией движения смещаются не прямоугольные (как в MPEG2), а выделенные микроблоки области, которые к тому же могут изменять форму. При этом ошибки предсказания и объем информации, содержащейся в разности предсказанного и настоящего изображений очередного кадра, существенно уменьшаются. Такой вариант предсказаний выполняется в блоке Пред2. Форма видеообъекта описывается матрицей. При бинарном кодировании элементы матрицы, соответствующие элементам изображения, входящим в видеообъект, приравниваются единице, а элементы изображения, находящиеся вне объекта — нулю. Элементы указанной матрицы определяются и кодируются в кодере формы, после чего подаются через мультиплексор (Мп) в выходной поток данных. Неизменяющийся или почти неизменяющийся задний план изображения или часть видеообъекта, которая практически мало изменяется на протяжении длительного времени, может передаваться как так называемый спрайт (sprite). Такое почти статическое изображение может быть передано полностью один раз в начале трансляции, а затем корректироваться декодером по мере необходимости. Информация о форме и текстуре спрайта кодируется как I-VOP (независимое I-кодирование плоскости видеообъекта VOP). Существенное снижение скорости цифрового потока можно получить, если осуществить на приемной стороне анимации (синтезирование) лица и тела человека путем использования информации об изменениях изображения объекта на основе дополнительной информации: форма, текстура и выражение лица и тела в статике описываются параметрами FDP (Facial Definition Parameters) и BDP (Body Definition Parameters), а в динамике — параметрами FAP (Facial Animation Parameters) и BAP (Body Animation Parameters). Статические параметры
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока Ðèñ. 16.16. 491 Формирование передаваемых потоков данных MPEG-4 FDP и BDP передаются в начале сеанса связи. Для воспроизведения мимики лица и движений тела собеседника в процессе разговора передаются динамические параметры FAP и BAP. Стандартом MPEG-4 обеспечивается многоуровневая масштабируемость по времени и по качеству изображений. Масштабируемость в MPEG-4 обеспечивается передачей для видеообъекта VO нескольких цифровых потоков — VOL (соответственно, элементарных потоков ЭП), один из которых базовый, остальные — улучшающие. При пространственном масштабировании может быть достигнуто улучшенное разрешение, а при временном масштабировании имеет место сглаживание (полное устранение дискретности) при передаче движения. Алгоритм масштабирования в MPEG-4 заключается в следующем. Поступающие временные отсчеты VOP (плоскости видеообъекта) разделяются на базовый и улучшающий слои. Поток базового слоя передается обычным путем, а в канале улучшающего слоя передается только разность между сигналом, поступившим от базового процессора, и сигналом, восстановленным промежуточным процессором. На приеме восстановление изображений реализуется в обратном порядке. Передача данных. Для доставки элементарных потоков ЭП (Elementary Streams, ES) к декодеру в MPEG-4 прилагается двухуровневый механизм мультиплексирования (рис. 16.16). Кратко рассмотрим работу схемы. Элементарные потоки ES с видео- и аудиокодеров поступают на уровень синхронизации (Sync Layer, SL) и в блоках SL преобразуются в пакетированные SL-потоки (Рacketized Streams), в которые введены
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 492 Часть V. Цифровое преобразование изображений в телевидении метки времени и данные о тактовых частотах. Это позволяет привязать к единой шкале времени различные видео- и аудиообъекты. Далее PS-потоки поступают на уровень DMIF. DMIF (Delivery Multimedia Integration Framework — интегрированная система доставки мультимедиа) — это протокол, обеспечивающий управление потоками данных для мультимедиа. Протокол DMIF обеспечивает посылку запросов от пользователя к источнику информации и пересылку запрошенных данных пользователю. Кроме того, DMIF дает пользователю средства подачи команд для выбора информации (например, фильма) и формирует сообщения о получении доступа к этой информации. Протокол DMIF охватывает три основные сферы применения MPEG-4: передачу по интерактивным сетям (Интернет), передачу по обычным вещательным каналам и запись видеопрограмм на компактдиски. На уровне DMIF возможно объединение в блоках Flex Mux пакетированных SL-потоков во Flex Mux потоки (Flex Mux Streams). Эта операция является не обязательной, так как под управлением DMIF могут передаваться и пакетированные SL-потоки. Поэтому Flex Mux может быть пустым, если следующий уровень обеспечивает все необходимые функции. Второй уровень, Trans Mux (Transport Multiplexing) предлагает транспортные услуги по передаче потоков с заданным качеством обслуживания. Здесь Flex Mux — потоки или SL-потоки объединяются и преобразуются в транспортный поток — Trans Mux Stream (TS). В стандарте MPEG-4 этот поток не определен. В качестве его может использоваться, например, транспортный поток MPEG-2 или, как вариант Trans Mux потока, — запись в файл (см. рис. 16.10). Декодирование и воспроизведение в MPEG-4. В этом стандарте происходит раздельное декодирование и обработка данных о форме, движении и текстуре изображения и последующее их объединение для получения цифровых сигналов изображения и звука (рис. 16.17). Схема работает следующим образом. Ðèñ. 16.17. Декодирующая часть MPEG-4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 493 На вход поступает транспортный поток Trans Mux Stream, из которого в демультиплексоре ДМп выделяются элементарные потоки ES, данные каждого из которых записываются в соответствующее буферное запоминающее устройство БЗУ1. Назначение БЗУ1 — накапливать поступающие по каналу связи данные и по мере необходимости передавать их на декодер. Далее выполняется декодирование элементарных потоков в (ДКд). Элементарные потоки, относящиеся к одному объекту, могут декодироваться совместно. Полученные при этом данные видео- и аудиообъектов записываются в БЗУ2. При демультиплексировании из общего потока данных выделяются также описание сцены и метки времени, поступающие на блок объединения БОб, в котором формируется цифровой сигнал изображения и звука. При этом обеспечивается синхронизация всех видеои аудиообъектов. Типы объектов, уровни и профили MPEG-4. MPEG-4 представляет собой обширный набор средств и алгоритмов кодирования AVO. Чтобы сделать реализацию декодера экономически оправданной и облегчить проверку на соответствие стандарту введены профили (наборы инструментов). Для каждого из профилей установлены один или несколько уровней, ограничивающих требования к вычислительным способностям декодера. Понятие профиля введено для визуальных и аудиообъектов и описания сцены. В MPEG-2 видеокадр можно представить себе как один прямоугольный объект, занимающий всю сцену. В MPEG-4 объектов может быть несколько, поэтому введена дополнительная градация, промежуточная между уровнем и профилем, — тип объекта. Этот параметр определяет структуру цифрового потока для одиночного объекта. Профиль же определяет набор типов объектов, которые могут присутствовать в сцене. Для натуральных объектов, определены пять типов объектов: • простой — прямоугольный видеообъект, при кодировании которого используются VOPI и P-типов (кадров); • простой масштабируемый — прямоугольный объект с пространственным и временным масштабированием; • базовый — производный от простого, с добавлением B-VOP. Чересстрочная развертка не поддерживается; • основной — обеспечивает высшее качество, по сравнению с базовым типом дополнительно поддерживает градационное кодирование формы, спрайты, чересстрочное разложение; • N-битовый — аналогичен базовому, но допускает квантование плоскостей яркости и цветности с разрядностью от 4 до 12 бит. Для кодирования неподвижных натуральных визуальных объектов и синтетических объектов определены следующие типы объектов:
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 494 Часть V. Цифровое преобразование изображений в телевидении Таблица 16.4 Профили и типы объектов MPEG-4 видео Профиль Тип объекта Простой Простой масштабируемый Базовый Основной N-битовый Масштабируемая текстура Анимированная D-сетка Базовая анимированная структура Примитивное лицо Число уровней • • • • • • • • • • • • • • 3 2 2 3 • 1 3 • • 2 • • • • • 2 • 2 • неподвижная масштабируемая текстура — неподвижное изображение произвольной формы, кодируемая с использованием вейвлет-преобразования; • анимируемая двумерная сетка, с помощью которой может представляться натуральное изображение с последующим его изменением (анимацией) путем перемещения узлов сетки; • базовая анимированная текстура — анимация неподвижных изображений (таких, как в простом объекте); • примитивное лицо — средство анимации человеческого лица. Профили определяют, какие типы VO могут присутствовать в сцене. Простой профиль допускает присутствие только объектов простого типа и предназначен в основном для мобильных служб и Интернета. Простой масштабируемый профиль осуществляет кодирование с масштабированием. Базовый профиль воспринимает типы объектов (простые и базовый) и полезен для интерактивных приложений. Основной профиль — для вещательных служб, поддерживает до 32 объектов простого, базового или основного типа — полезен в специальных системах наблюдения и медицинского контроля, где требуется широкий динамический диапазон яркости и насыщенности. Из остальных профилей наибольший интерес представляет гибридный профиль, объединяющий натуральные и синтетические типы объектов. Он полезен при помещении реального объекта в синтетический и, наоборот, синтетического объекта в реальное окружение.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 495 Глава 16. Современные стандарты сжатия цифрового потока Таблица 16.5 Параметры профилей MPEG-4 Профиль Уровень Размер сцены Скорость передачи двоичных символов Типы объектов Максимальное число объектов Простой Z.1 L2 L3 QCIF CIF CIF 64 кбит/с 128 кбит/с 384 кбит/с Простой 4 4 4 Базовый L1 L2 QCIF CIF 384 кбит/с 2 Мбит/с Простой, базовый 4 16 Основной L2 L3 L4 CIF Рек. 601 1920×1088 2 Мбит/с 15 Мбит/с 38,4 Мбит/с Простой, базовый, основной 16 32 32 Сказанное выше наглядно поясняется табл. 16.4 и 16.5. Перспективы применения MPEG-4. Хотя MPEG-4 не предназначен на замену MPEG-2 в ТВ вещании, но перспективы его применения в телевидении весьма велики. При слиянии в будущем телевизора, телефона, компьютера, спутникового и кабельного терминалов в единое информационное устройство роль MPEG-4 в вещании и прикладном телевидении будет возрастать. В MPEG-4 дополнительная информация передается вместе с объектом, и ею можно управлять нажатием кнопки (вызвать ответ на вопрос викторины или убрать его и т. д.). Особенно велика роль MPEG-4 в проведении конференций, совещаний в масштабе области, регионов, республики. Здесь интерактивность MPEG-4 позволяет обсуждать острые проблемы, не теряя времени на поездки. Стандарт MPEG-4 позволяет организовать телемагазин, всю видеоинформацию о товарах можно получить, не выходя из дома, выслушать разъяснения и рекомендации, узнать цену и т. д. В прикладном телевидении MPEG-4 нашел широкое применение, особенно в охранном телевидении при регистрации изображений. Здесь, в отличие от вещания, имеются большие возможности получить хорошо скомпрессированный поток видеоданных с высоким качеством изображения. 16.4. Мультимедийный стандарт MPEG-7 Стандарт MPEG-7 предназначен для описания мультимедийных данных, не ориентирован на какое-либо конкретное приложение и поддерживает максимально широкий диапазон приложений. Аудиовизуальный материал MPEG-7 включает в себя статические изображения, графику, звук, голос, видео и композитную информацию о том, как эти элементы комбинируются при мультимедийной презентации. По существу, MPEG-7 обеспечивает стандартное представление аудиовизуальных данных, удовлетворяющих определенным требовани-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 496 Часть V. Цифровое преобразование изображений в телевидении ям. Описание MPEG-7 не зависит от кодового представления материала, может использовать преимущества, предоставляемые кодированным материалом MPEG-4. Например, нижним уровнем представления будет описание формы, размера, текстуры, цвета, движения (траектории) и позиции (где на сцене будет размещаться объект и др.). Высшим уровнем представления будет семантическая информация: «Эта сцена с лающей коричневой собакой слева и голубым мячом, падающим справа, с фоновым звуком проезжающих машин». Могут существовать и промежуточные уровни абстракции (представления). Уровень представления относится к способу выделения определенных характеристик: многие характеристики нижнего уровня могут быть выделены автоматически, а характеристики высокого уровня требуют большего взаимодействия с человеком. Описание MPEG-7 ассоциировано с самим материалом, чтобы осуществить быстрый поиск материала для пользователя. Область применения MPEG-7. Элементы MPEG-7 поддерживают широкий диапазон приложений (мультимедийные цифровые библиотеки, мультимедийное редактирование, домашние устройства для развлечений и т. д.). MPEG-7 сделает допустимым для широкой публики работу с архивами, придаст новый стимул для электронной торговли, так как покупатели смогут искать нужный товар по видеообразцам. Список возможных приложений MPEG-7: • выбор медийного канала (радио, телевидение); • услуги в сфере культуры (музеи, картинные галереи и т. д.); • цифровые библиотеки; • домашние развлечения; • исследовательские услуги; • журналистика; • осуществление покупок; • надзор (управление движением, транспортом, неразрушающий видеоконтроль в агрессивной среде, охранное телевидение и последующая архивация материала на носитель записи и т. д.). 16.5. Вейвлет-преобразование Вейвлет-преобразование используется в системах видеокомпрессии для сокращения избыточности ТВ изображения. Главное отличие его от БПФ-анализа (быстрого преобразования Фурье) заключается в том, что вейвлет-волны разлагают сигнал по разным частотам с различным разрешением, т. е. на множество малых, конечных по протяжённости групп волн, отсюда и название — вейвлет, элементарные волны. Алгоритмы вейвлет-преобразования обрабатывают данные в различных масштабах и с различным разрешением.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 497 Вейвлет-анализ позволяет анализировать и отдельные детали, глобальное изображение и подходит для аппроксимации данных с резкими границами, в то время как ДКП мало пригодно для очень резких черно-белых переходов. Вейвлет-сжатие преобразует полное изображение, а не его секции (блоки) 8×8, как это происходит в JPEG и является более гладким (естественным). Основное преимущество вейвлет-сжатия перед JPEG — это более высокие коэффициенты сжатия (уплотнения) при достаточно высоком качестве изображения. До настоящего времени вейвлет-преобразование использовалось как эффективный вариант для сжатия данных в таких областях науки, как астрономия и сейсмические исследования. В области систем охранного телевидения оно представляет собой относительно новый и очень привлекательный алгоритм сжатия. Идея вейвлет-сжатия изображений, как и других методов с преобразованием, довольно проста. Сначала к изображению применяется вейвлет-преобразование, а затем из данных преобразованного изображения удаляются относительно несущественные по влиянию на качество сигнала изображения, коэффициенты. К оставшимся коэффициентам применяется кодирование. Сжатое изображение восстанавливается путем декодирования коэффициентов, если это необходимо, и применением обратного преобразования к результату декодирования. Предполагается, что в процессе удаления части коэффициентов преобразования теряется не слишком много информации. Процесс сжатия изображения путем преобразования, а затем удаления малосущественных информационных составляющих — это основа для понимания вейвлет-анализа. Проще всего сжать изображение, если заменить это изображение ограниченной совокупностью усреднённых значений его пикселей. Этот подход дает очень большую степень сжатия (одно число представляет относительно большой фрагмент изображения), но проигрывает в плане качества (детальности) изображения. Чтобы восстановить исходное изображение фрагмента из этого среднего значения, необходимо знать, какие детали были удалены при получении среднего значения. Рассмотрим изображение, состоящее из двух точек {x1 , x2 }. Эти значения могут быть заменены средним значением a и полуразностью d [129]: a = (x1 + x2 )/2; d = (x1 − x2 )/2 (коэффициент 1/2 вводится в определение d для удобства обозначений). Заметим, что {x1 , x2 } можно выразить через {a, d}: x1 = a + d; x2 = a − d. Вейвлет-преобразование исходной последовательности {x1 , x2 } —
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 498 Часть V. Цифровое преобразование изображений в телевидении это {a, d}. В этом представлении информация не добавляется и не теряется. Тогда возникает вопрос, какая польза от замены {x1 , x2 } на {a, d}. Её и нет, если только два значения x1 и x2 не оказываются близкими друг к другу. В этом случае разность d мала, и изображение {x1 , x2 } можно заменить его приближением {a}. Заметим, что это новое «изображение» имеет меньше пикселей, чем исходное. Соответственно, осуществлено сжатие изображения. Восстановленным изображением будет изображение {a, a} с ошибкой восстановления (error image) {|x1 − a|, |x2 − a|} = {|d|, |d|}. Так как d мало, ошибка тоже не значительна. Основополагающей в вейвлет-анализе является идея о весовом выделении информации на различных уровнях детализации изображений. Указанные составляющие, в свою очередь, могут рассматриваться как информация о масштабе или о разрешении. Простой пример, рассмотренный выше, имеет ограниченную применимость к реальным изображениям, но он иллюстрирует идею, на которой основывается применение вейвлет-анализа к сжатию изображений: выделение информационных составляющих, которые конкретизируют детали, и удаление тех из них, которые малы и незначительно влияют на изображение в целом. Рассмотрим несколько большее изображение {x1 , x2 , x3 , x4 }. Вычислим средние значения a1,0 = (x1 + x2 )/2; a1,1 = (x3 + x4 )/2 и разностные составляющие d1,0 = (x1 − x2 )/2; d1,1 = (x3 − x4 )/2. Двойные нижние индексы здесь показывают, что имеет место многошаговый процесс и это его первый шаг. Как и раньше, получено новое представление {a1,0 , a1,1 , d1,0 , d1,1 } исходного изображения, которое содержит ровно столько же пикселей, сколько и исходное. Если желательно сжать это изображение, то необходимо обратить внимание на составляющие d1,0 и d1,1 и решить, могут ли они с допустимым ущербом быть удалены. Если ответ положительный, то будет получено сжатое изображение {a1,0 , a1,1 }. Предположим, однако, что степень сжатия не удовлетворительна и желательно сжать изображение сильнее. Тогда можно применить ту же процедуру к оставшемуся изображению {a1,0 , a1,1 } и снова вычислить среднее значение и разность: a0,0 = (a1,0 + a1,1 )/2; d0,0 = (a1,0 − a1,1 )/2. Если разность d0,0 достаточно мала, то можно заменить всё исходное изображение {x1 , x2 , x3 , x4 } изображением, состоящим из од-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 499 ного единственного пикселя {a0,0 }. Посмотрим, чем же является это a0,0 : ( ) a1,0 + a1,1 1 x1 + x2 x3 + x4 x1 + x2 + x3 + x4 a0,0 = = + = . 2 2 2 2 4 Величина a0,0 — это среднее значение суммы уровней всех пикселей исходного изображения. Если исходное изображение однородно серое (т. е. все xi равны одному и тому же значению), то можно сжать его, заменив единственным значением, равным этой градации серого. Значение a0,0 представляет самый приблизительный уровень информации об этом изображении, т. е. информацию при самом низком разрешении (детальности) или при самом грубом масштабе. Значения a1,0 и a1,1 , вместе взятые, представляют информацию на следующем, более высоком уровне разрешения, или при следующем, лучшем масштабе. Заметим, что можно восстановить {a1,0 , a1,1 } из {a0,0 , d0,0 }, используя приведенную выше процедуру. Исходные значения пикселей {x1 , x2 , x3 , x4 } представляют самое высокое разрешение или наилучший масштаб, возможный для этого изображения. Эти значения могут быть восстановлены из a1,0 , d1,0 , a1,1 и d1,1 . Но так как a1,0 и a1,1 могут быть получены из a0,0 и d0,0 , то, следовательно, можно восстановить пиксели исходного изображения из общего среднего значения a0,0 и разностей d0,0 , d1,0 и d1,1 . Таким образом, последовательность {a0,0 , d0,0 , d1,0 , d1,1 } (16.16) является альтернативным представлением исходного изображения и состоит из общего среднего и значений составляющих разностей, выражающих два различных уровня детализации. Последовательность (16.16) — это вейвлет-преобразование исходной последовательности {x1 , x2 , x3 , x4 }. Заметим, что при этом имеется больше вариантов для сжатия. Если d1,0 и d1,1 слишком велики, чтобы их игнорировать, то, по возможности, можно исключить следующий уровень детализации, а именно, d0,0 . В случаях, когда реализуется преобразование изображений большего размера, процесс усреднения и выделение разностных составляющих (деталей) может быть продолжен на более грубом уровне разрешения. Вейвлет-преобразование в общем случае сводится к совокупности процессов фильтрации и децимации (рис. 16.18,a) [48]. Преобразуемый сигнал подвергается фильтрации с помощью фильтров нижних и верхних частот, которые делят диапазон частот исходного сигнала на две половины: НЧ и ВЧ составляющие (компоненты) сигнала, полученные при фильтрации, имеют в два раза более узкую полосу частотных составляющих. Затем цифровой сигнал после НЧ и ВЧ фильтрации с помощью соответствующих цифровых фильтров подвергается
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 500 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 16.18. Структурная схема передачи сигналов с использованием вейвлетпреобразования: a — кодер; b — декодер прореживанию (децимации). Таким образом, частота дискретизации в каждом поддиапазоне уменьшается в два раза. Полученные сигналы проходят кодирующие устройства (кодеры) К1, К2 и К3, на выходах которых получаются кодированные сигналы частотных поддиапазонов. Количество двоичных символов, используемых для передачи сигналов таких поддиапазонов, сокращается с использованием выбранных алгоритмов снижения числа передаваемых коэффициентов. Затем сигналы объединяются в мультиплексоре в один кодированный цифровой сигнал, который передается по каналу связи (КС). Скорость передачи двоичных символов выходного сигнала y(n) по КС меньше, чем для передачи исходного цифрового сигнала с ИКМ. Вместо канала связи (КС) в системе может присутствовать носитель информации, на который осуществляется запись двоичных символов выходного сигнала y(n). Как показано на рис. 16.18,b, после прохождения канала связи кодированный сигнал y(n) в демультиплексоре ДМП разделяется на кодированные сигналы частотных поддиапазонов y1 (n), y2 (n), y3 (n) . . .. Каждый из этих сигналов декодируется в соответствующем блоке декодирования ДК1, ДК2, ДК3. . . В процессе декодирования восстанавливается количество двоичных разрядов в данных сигналах (деквантование). Так как при кодировании могли возникнуть необратимые потери информации, то декодированные сигналы поддиапазонов Z1 (n), Z2 (n), Z3 (n) . . . могут отличаться от исходных сигналов поддиапазонов x1 (n), x2 (n), x3 (n). Далее выполняется восстановление количества отсчетов в сигналах поддиапазонов (интерполяция ↑2, ↑2, ↑2), в результате которой между каждыми двумя отсчетами сигналов Z1 (n),
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 501 Z2 (n), Z3 (n) вставляется нулевой уровень. Растянутая компонента подвергается фильтрации и на место нулевых отсчетов помещаются интерполированные величины. После проведенной интерполяции сигналы частотных поддиапазонов объединяются в сумматоре. В результате формируется выходной сигнал Z(n), имеющий такую же частоту дискретизации и занимающий такую же полосу частот, как исходный сигнал x(n). Эффективным средством разделения исходных сигналов на частотные поддиапазоны и синтеза выходного сигнала и сигналов частотных поддиапазонов являются квадратурные зеркальные фильтры (КЗФ), работа которых описана в [8, 28, 48, 130]. Достоинством КЗФ является то, что при их использовании не возникает искажений, связанных с перекрытием частотных спектров сигналов смежных поддиапазонов из-за неидеальности АЧХ фильтров. Кроме того, на всех ступенях разложения на составляющие и синтеза сигнала используются фильтры с одинаковыми наборами коэффициентов, что позволяет упростить реализацию. Следовательно, другой подход к обработке и передаче сигналов основан на разложении сигнала на составляющие по параметру разрешающей способности. Такой подход оказывается особенно продуктивен для передачи изображений. Как известно, изображение состоит из крупных деталей, составляющих основу его содержания, и мелкой структуры. Во многих случаях полезно раздельно обрабатывать и передавать указанные составляющие, а на приёмной части системы объединить эти составляющие в полное изображение. Видеокомпрессия на базе вейвлет-преобразования во многом осуществляется так же, как и компрессия на базе ДКП. Компоненты видеосигнала, полученного после вейвлет-преобразования, так же подвергаются квантованию и энтропийному кодированию. Принципиальное отличие от компрессии на базе ДКП заключается в способе получения частотных компонентов изображения. При ДКП получают и обрабатывают частотные компоненты двумерного спектра независимых (в реальной области) и различных по размеру блоков пикселей. Вейвлет-преобразование дает компоненты (блоки частотных компонентов) всего кадра или его очень значительных по размеру блоков, полосы частот которых уменьшаются в два раза по мере уменьшения средней частоты (например, 1/2, 1/4, 1/8 от максимальной частоты сигнала и т. д.) Вейвлет-преобразование, следовательно, не требует разделения внутрикадровой области на значительное число независимых блоков, поэтому артефакты видеокомпрессии на его основе более «естественны», т. е. выглядят менее чужеродными на типичных изображениях,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 502 Часть V. Цифровое преобразование изображений в телевидении чем, например, блочная структура в виде просвечивающей через изображение шахматной доски. Однако надо отметить, что подобная, характерная для ДКП, картина наблюдается при очень большой степени компрессии, практически не используемой в ТВ вещании. При небольших степенях сжатия преимущества компрессии на базе вейвлетпреобразования не проявляются [48]. Весомый аргумент в пользу компрессии на базе ДКП — ее международная стандартизация в виде систем JPEG и MPEG. Нет сомнения, что вейвлет-преобразование и компрессия на его основе будут развиваться и найдут применение в прикладных, например, в охранных системах телевидения, так как в данном случае обеспечивается высокий коэффициент внутрикадрового сжатия спектра, по сравнению со стандартом JPEG, при сохранении приемлемого качества и контурной структуры изображений. Однако следует отметить, что варианты компрессии спектра сигналов изображений на базе вейвлет-преобразования обычно более сложны с точки зрения технической реализации по отношению к варианту JPEG. 16.6. Векторное квантование. Фрактальное кодирование При векторном квантовании одновременно кодируется группа из N отсчетов цифрового сигнала (N -мерный вектор). В случае одномерного сигнала векторами могут быть группы по N последовательных отсчетов. В случае изображения векторами могут быть блоки из нескольких смежных по горизонтали и по вертикали элементов изображения. На рис. 16.13 представлена структурная схема системы передачи информации, в котором используется векторное квантование [8]. Смысл векторного квантования заключается в следующем. Множество всех встречающихся в сигнале N -мерных векторов разбиваются на L подÐèñ. 16.13. Передача информации с множеств так, что входящие в использованием векторного кодирования каждое подмножества векторы мало отличаются друг от друга. В каждом подмножестве выбирается один эталонный вектор, представляющий все векторы этого подмножества. Все эталонные векторы записываются в кодовую книгу и каждому из них присваивается определенное кодовое слово. Входной цифровой сигнал x(n) поступает на вход кодера. Процедура кодирования заключается в том, что для каждого N -мерного вектора в кодовой книге находится наиболее близкий к нему эталонный вектор, код которого поступает на выход кодера. Таким образом,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 16. Современные стандарты сжатия цифрового потока 503 для каждой группы из N -отсчетов входного сигнала x(n) передается одно кодовое слово u(k). В декодере в соответствии с принятым кодовым словом u′ (k) (штрих показывает, что сигнал прошел канал связи) из кодовой книги считывается эталонный вектор, преобразуемый в группу из N отсчетов выходного сигнала y(n). Кодовая книга может изменяться в зависимости от свойств кодируемого сигнала. Векторное квантование относится к методам сжатия с потерями, так как реальные группы из N отсчетов входного сигнала x(n) в выходном сигнале y(n) заменяются эталонными N -мерными векторами. Достоинство векторного квантования — простота декодера, в котором выполняется только операция считывания эталонного вектора из кодовой книги. В то же время поиск в кодере эталонного вектора, наиболее близкого к кодируемому, требует большого объема вычислений. Наиболее близкий эталонный вектор считывается из кодовой книги, когда достигается минимальное значение квадратичной ошибки квантования E: ∑ E= (aj − bj )2 , где aj — элементы входного вектора; bj — элементы эталонного вектора. Подобным векторному квантованию является фрактальное кодирование изображений, при котором в качестве элементов кодовой книги используются блоки, вырезанные из самого исходного изображения [18]. Фрактальные методы сжатия можно рассматривать как модификацию векторного квантования, при которой в качестве элементов кодовой книги используют блоки, вырезанные всевозможными способами из самого исходного изображения. Допускается ограниченное число преобразований блоков кодируемого изображения, позволяющее добиться подобия этих блоков эталонным блокам (повороты, зеркальные отражения). Векторное квантование и фрактальное кодирование могут использоваться в телевидении, обеспечивая значительное сжатие информации. Однако большой объем вычислений при кодировании препятствует применению этих методов в системах цифрового телевидения [8]. Контрольные вопросы 1. Почему квантование коэффициентов ДКП создает менее заметные искажения, чем квантование самого изображения? 2. Каким образом в стандартах MPEG осуществляется управление степенью сжатия? 3. В чем сущность кодирования с переменной длиной кодовых слов?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 504 Часть V. Цифровое преобразование изображений в телевидении 4. Что означает термин «гибридное кодирование» применительно к стандартам MPEG-1, MPEG-2? 5. Зачем перед кодированием по MPEG-1, MPEG-2 выполняется перестановка кадров в GOP? 6. В чем различаются кадровый и полевой режимы кодирования? 7. Почему для B-кадров достигается наибольшая степень сжатия? 8. Каково назначение буферного ЗУ в кодере MPEG-2? 9. Что такое масштабируемость? 10. Что такое уровни и профили MPEG-2? 11. Дайте общую характеристику пространственному и временному сжатию сигнала изображений в стандарте MPEG-2. 12. Каковы форматы дискретизации в стандарте MPEG-2? 13. Объясните возникновение переходных процессов в пространственной структуре сигналов ТВ изображений 14. Какие Вы знаете основные различия в функционировании стандартов сжатия спектров сигналов ТВ изображений MPEG-2 и H.264/AVC? 15. Каким образом осуществляется подавление заметности блочной структуры при сжатии спектра сигналов ТВ изображений по стандарту H.264/AVC? 15. Как осуществляется предсказание структуры ТВ изображений в пределах кадров при сжатии их спектра по стандарту H.264/AVC? 16. Для чего нужен сигнал вектора движения (смещения блоков в последовательности кадров)? 17. Какие различия алгоритмов вычисления сигнала вектора движения при сжатии спектра сигналов ТВ изображений в стандартах MPEG-2 и H.264/AVC? 18. Определите понятие точности вычисления сигнала вектора движения? 19. Какая точность вычисления сигнала вектора движений в сигнале яркости и в цветоразностных сигналах в стандарте сжатия спектра сигнала ТВ изображений H.264/AVC? 20. Дайте краткую характеристику стандарта сжатия спектра MPEG-7. 21. Почему MPEG-4 является более эффективным, чем MPEG-2? 22. Какие перспективы применения стандарта MPEG-4? 23. Какие перспективы применения стандарта MPEG-7?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 17 ЭНТРОПИЙНОЕ КОДИРОВАНИЕ 17.1. Информация и энтропия Символы сообщений в цифровой системе связи — группы битов (двоичных цифр), кодирующих каждое из возможных сообщений, например, последовательностями восьмиричных (трёхразрядных) цифр. Цифровая система связи, использующая набор символов размера М называется М-арной. Алфавит — совокупность возможных символов сообщений (в двоичном представлении). Поток символов (bit stream) — поток групп двоичных символов — низкочастотный сигнал, так как его спектр распределён в области относительно низких частот. Коэффициент сжатия, реализованный при кодировании, определяется отношением размер входного файла, бит . K= размер выходного файла, бит Наиболее простым из известных вариантов, реализующих увеличение эффективности одномерного кодирования последовательностей исходных сообщений со сжатием числа битов, передаваемых (в среднем) на одно сообщение, является так называемое кодирование по длинам серий. Корректное применение данного метода, например, возможно в случаях наличия в источнике чередующихся серий одного и того же сообщения, которые могут прерываться другими сообщениями определённого и конечного, по числу элементов, алфавита. В таком случае передают последовательности пар «серия»-«сообщение», в которых серия отражает протяжённость одного и того же часто повторяющего сообщения, а новое сообщение определяется своим индивидуальным символом. Полученные пары подвергают последующему кодированию с учётом вероятности их появления. 17.1.1. Информация и совместная информация сообщений Информация в сообщении о каком-то событии, которое осуществляется в текущем времени с вероятностью p, определяется как I(p) = − log2 p бит. (17.1)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 506 Часть V. Цифровое преобразование изображений в телевидении Напомним, что loga x = logb x/ logb a = logb x loga b. Аксиомы об информации. 1. Информация, содержащаяся в одиночном событии, происходящем с вероятностью pi из числа событий определённого алфавита событий xi ∈ X, имеет положительное значение I(pi ) > 0. 2. Совместная информация, например, двух независимых событий xi , xj с вероятностями pi , pj и с совместной вероятностью pij (pi , pj ) = pi pj определяется суммой информаций I(pi,j ) = I(pi ) + I(pj ). 3. Информация является непрерывной функцией от вероятности события. Из соотношения (17.1) и аксиом следует, что несущественные изменения вероятности события приводят к несущественным изменениям её информации. В случаях, когда последовательно передаются символы алфавита, использование архивирования символов на приёмной стороне позволяет оценивать и уточнять вероятность их последующего поступления. Текущее увеличение протяжённости архивированной информации позволяет выявлять специфику изменения вероятностного распределения отдельных сообщений в зависимости от протяжённости процесса передачи. С другой стороны, известное вероятностное распределение отдельных сообщений позволяет сразу же вычислять средний объём информации на сообщение для данного их алфавита. Предположим, что существует идеализированный алфавит сообщений s, d, f, g, h, j, k, l с соответствующими вероятностями появления указанных сообщений pi равными 0,5; 0,125; 0,125; 0,0625; 0,0625; 0,0625; 0,03125; α 0,03125 соответственно, которые отражаются числами pα 0 = 0,5 , где α > 1 — целое число. Реализация архивированного набора сообщений в таком случае может, к примеру, иметь вид g, d, s, f, s, s, s, d, s, f, h, s, j,s, s, k, s, g, d, f, s, s, j, s, l, d, s, s, s, f, h, s. С приходом каждого следующего сообщения объём принятой (архивированной) информации возрастает в зависимости от соответствующей вероятности. При этом усреднённый объем полученной информации на одно сообщение может быть определён как частное от деления общего объёма на число полученных в данный момент сообщений. Весовой вклад в общий объём информации отдельных из независимых сообщений алфавита определяется произведением числа поступивших сообщений такого типа на соответствующее данному событию количество информации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 507 Если η1 , η2 , η3 , η4 , η5 , η6 , η7 , η8 определяют конкретные числа, отражающие количество появлений каждого сообщения (из восьми событий алфавита) в представленной выше реализации, которая состоит из 8 ∑ общего числа событий N = ηi , то общий объём информации данi=1 ной реализации может быть определён соотношением I0 (p) = η1 I1 (p1 ) + η2 I2 (p2 ) + η3 I3 (p3 ) + η4 I4 (p4 ) + η5 I5 (p5 ) + + η6 I6 (p6 ) + η7 I7 (p7 ) + η8 I8 (p8 ). Тогда средний объём информации, приходящийся на одно сообщение, определяется результатом деления: 8 I0 (p) 1 ∑ = ηi Ii (pi ). N N i=1 При возрастании протяженности рассмотренной реализации всё в большей степени может уточняться, в последнем из соотношений относительная частота появления каждого из возможных сообщений ni /N (1 6 i 6 8), значения которой определяют «вес» каждой их составляющих в соотношении для среднего объёма информации. В случаях, когда протяжённость реализации значительно (многократно) превышает число возможных сообщений алфавита и содержит не менее, например, 16 повторений каждого из отдельных сообщений, относительная частота фактически совпадает с вероятностью появления сообщений. Соответственно понятие среднего объёма реализации трансформируется в понятие энтропия [122, 123]. 17.1.2. Энтропия сообщений Таким образом, энтропия∗ определяется как средний объём информации на одно сообщение. Чем больше неопределённости в сообщении, тем больше оно содержит информации. При числе возможных сообщений n энтропия выражается следующим образом: H=− n ∑ pi log2 pi бит/сообщение. i=1 Здесь pi — вероятность i-го из возможного конечного числа n сообn ∑ щений и pi = 1. Если сообщение двоичное, т. е. источник сообщеi=1 ний имеет только два возможных значения, вероятность первого из ∗ Shannon S.E. Mathematical Theory of Communication // BSTJ. 1948. vol. 27. P. 379–423, 623–657.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 508 Часть V. Цифровое преобразование изображений в телевидении которых p1 , а второго p2 = 1 − p1 , то энтропия имеет следующий вид: H = −(p1 log2 p1 + p2 log2 p2 ) = = −p1 log2 p1 + (1 − p1 ) log2 (1 − p1 ) бит/сообщение. На рис. 17.1 представлена зависимость энтропии от вероятности одного из двух возможных значений сообщения (p = p1 ) [123]. При равновероятных (p1 = p2 = 0,5) событиях потенциальная неопределённость решения (рис. 17.1) увеличивается и энтропия достигает величины H = −[p1 log2 p1 + (1 − p1 ) log2 (1 − p1 )] = −2 · 0,5 log2 0,5 = = 1 бит/сообщение. Зависимость энтропии от вероятности одного из двух возможных значений сообщения (p = p1 ) Ðèñ. 17.1. H= В общем случае при равновероятных сообщениях энтропия максимальна и определяется логарифмом числа событий. Если, например, число равновероятных сообщений N = 2k , то H0 = log2 N = log2 2k = k. При, например, N = 2k = 256 необходимое число бит кода для передачи каждого сообщения H0 = log2 28 = k = 8, а при N = 2k = 7 энтропия H0 = 2,80735 бит. При резко отличающихся вероятностях сообщений существенно падает энтропия. Пусть, например, вероятности семи сообщений s1 , s2 , s3 , s4 , s5 , s6 , s7 имеют значения: p1 = 0,75; p2 = p3 = 0,05, p4 = p5 = p6 = p7 = = 0,0375. Тогда 7 ∑ −pi log2 pi = 1 = −0,75 log2 0,75 − 2 · 0,05 log2 0,05 − 4 · 0,0375 log2 0,0375 = 1,4538. Следовательно, среднее число битов на сообщение для данного примера составляет приблизительно 1,5 бита. Присвоим сообщению s1 кодовое слово 1; сообщению s2 — 01; сообщению s3 — 001; сообщению s4 —0001; сообщению s5 —00001; сообщению s6 — 000001; сообщению s6 — 0000001; сообщению s7 — 0000000. Перечисленные слова составляют префиксный код. Соответственно, последовательность событий может быть передана без специального разделения кодовых слов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 509 Рассмотрим сообщение в виде последовательности тридцати кодовых слов s2 s1 s1 s1 s1 s3 s1 s7 s1 s1 s4 s1 s1 s1 s5 s1 s1 s3 s1 s1 s1 s1 s1 s2 s6 s1 s1 s2 s1 s1 . Этому сообщению соответствует сигнал цифровой последовательности 01111100110000000110001111000011100111111010000001110111, которая состоит из 56 битов. Следовательно, при кодировании данного сообщения используется, в среднем, 1,8 бита на один элемент. Это не слишком существенно отличается от вычисленной ранее величины H = 1,4538. С увеличением протяжённости сообщений полученный средний результат может и понижаться. В идеале на сообщение s1 следует выделить кодовое слово протяжённостью l1 = − log2 p1 = − log2 0,75 ≈ 0,415 битов, на s2 и s3 соответственно по l2 = l3 ≈ 4,32 бита, на сообщения s4 –s7 по l4 = l5 = l6 = l7 ≈ 4,74 бита. 17.1.3. Избыточность источника сообщений Разность между энтропией источника равновероятных сообщений H0 и энтропией H данного, например, реального источника сообщений при фиксированном их числе часто определяется как избыточность R источника: R = H0 − H. Относительную избыточность находят делением избыточности на энтропию источника равновероятных сообщений H0 : R0 = 1 − H/H0 . Для рассмотренного примера из семи сообщений относительная избыточность сравнительно велика: R0 = 1 − 1,4363/2, 80735 = 0,48838. Достаточно высокую степень приближения к энтропии обеспечивает кодирование алфавита сообщений с использованием кодовых слов, изменение числа битов в которых согласовано с вероятностью появления в источнике соответствующего сообщения. Чем большая вероятность появления данного сообщения, тем более коротким должно быть кодовое слово, отражающее его появление в данной реализации. Методы реализации такого кодирования широко представлены в технической литературе [124–128]. Самым известным примером кодирования с кодовыми словами переменной длины является азбука Морзе. Здесь буква E имеет наибольшую вероятность в английских
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 510 Часть V. Цифровое преобразование изображений в телевидении текстах (0,1669) и кодируется элементом минимальной протяжённости «•», буква I имеет значение вероятности 0,0782 и кодируется как «• •», буква T имеет значение вероятности 0,0678 и кодируется одним «−», а буква X, например, имеет значение вероятности лишь 0,0002 и кодируется уже четырьмя элементами «− • • −». 17.2. Кодирование Хаффмана 17.2.1. Правила кодирования Д. Хаффман предложил в 1952 г. эффективную процедуру кодирования с использованием символов с переменным числом битов. Процедура включает следующие операции: 1. Распределение (упорядочивание) сообщений в порядке убывания их вероятностей. 2. Определенная последовательность этапов объединения сообщений с минимальными для каждого этапа значениями вероятностей (с получением соответствующих узлов на дереве кодирования) до полного её завершения (с получением последнего узла). 3. Кодирование, которое реализуют с узла последнего этапа, завершающего объединение. При этом верхней (по вероятности) упорядоченной компоненте последнего этапа объединения может быть присвоена двоичная цифра «1», а нижней «0». Аналогичным образом присвоения могут осуществляться в узлах, полученных на предшествующих этапах. С учетом префиксного (имеется возможность разделения комбинаций по первым двоичным цифрам) типа кода, соответственно, процесс кодирования сообщений реализуют в обратном (по отношению к этапам создания узлов объединений) порядке. В случаях, когда возникает вариант с более, чем двумя узлами, имеющими одинаковую вероятность, целесообразно объединять ветви тех из них, которые до этого имели меньшее число объединений. При этом выравниваются длины используемых кодовых слов. В случаях, когда при объединениях возникает вариант с более, чем двумя узлами, имеющими наименьшую вероятность, целесообразно иногда также объединять ветвь дерева кодирования, имеющей наименьшую вероятность, с ветвью, имеющей наибольшую вероятность. Для использованного ранее распределения вероятностей pi (0,5; 0,125; 0,125; 0,0625; 0,0625; 0,0625; 0,03125; 0,03125) восьми сообщений (s1 , s2 , s3 , s4 , s5 , s6 , s7 , s8 ) найдём H= 8 ∑ −pi log2 pi = −0,5 log2 0,5 − 2 · 0,125 log2 0,125 − 1 − 3 · 0,0625 log2 0,0625 − 2 · 0,03125 log2 0,03125 = 2,3125.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 511 Как было отмечено, относительную избыточность находят делением избыточности на энтропию источника равновероятных сообщений H0 (R0 = 1 − H/H0 ). Для варианта равновероятных восьми сообщений H0 = log2 8 = 3. При этом относительная избыточность R0 = 1 − 2,3125/3 = 1 − 0,77083 = 0,22917. 17.2.2. Относительная оценка вариантов кодирования и построение дерева по Хаффману На рис. 17.2 графически представлен вариант кодирования, где операция поэтапного объединения выполнена с нарушением требования последовательного получения узлов за счёт объединения ветвей дерева кодирования с наименьшими значениями вероятности сообщений. В табл. 17.1 приведены результаты, полученные после построения соответствующего дерева кодирования. Оценим с использованием результатов, представленных в этой таблице, среднее число битов на один символ: ns = 1 · 0,5 + 2 · 4 · 0,125 + 3 · 0,0625 + 2 · 4 · 0,0625 + 2 · 4 · 0,03125 = 0,5 + 1 + 0,1875 + 0,5 + 0,25 = 2,4375. Кодирование, как можно видеть, избыточность в данном случае уменьшает. Может быть построено несколько вариантов кодирования для данного алфавита. Однако наилучшим вариантом будет код с наименьшей дисперсией. Дисперсию кодирования d оценивают по отношению к ns : d= 7 ∑ pi (ni − ns )2 = i=1 = 0,5(1 − 2,4375) + 2 · 0,125(4 − 2,4375)2 + 1 · 0,0625(3 − 2,4375)2 + +2 · 0,0625(4 − 2,4375)2 + 2 · 0,03125(4 − 2,4375)2 = 2,121, 2 где ni — число битов на конкретный символ алфавита. Ðèñ. 17.2. Первый вариант кодирования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 512 Часть V. Цифровое преобразование изображений в телевидении Таблица 17.1 Результаты кодирования (вариант 1) Таблица 17.2 Результаты кодирования (вариант 2) Сообщение pi Код Бит/сообщ. Сообщение pi Код Бит/сообщ. s1 s2 s3 s4 s5 s6 s7 s8 0,5 0,125 0,125 0,0625 0,0625 0,0625 0,03125 0,03125 1 0111 0110 0101 0100 001 0001 0000 1 4 4 4 4 3 4 4 s1 s2 s3 s4 s5 s6 s7 s8 0,5 0,125 0,125 0,0625 0,0625 0,0625 0,03125 0,03125 1 011 010 0011 0010 0001 00001 00000 1 3 3 4 4 4 5 5 Ðèñ. 17.3. Второй вариант кодирования Можно заметить, что данный вариант кодирования имеет высокую дисперсию. На рис. 17.3 графически представлен второй вариант кодирования по Хаффману, где распределение вероятностей сообщений при формировании узлов выполнено (снизу вверх и слева направо) в соответствии с правилами, т. е. с соединением ветвей с наименьшими вероятностями. В табл. 17.2 представлены результаты, полученные после построения соответствующего дерева кодирования. Оценим с использованием этих результатов среднее число битов на одно сообщение для второго варианта кодирования: ns = 1 · 0,5 + 6 · 0,125 + 3 · 4 · 0, 0625 + 2 · 5 · 0, 03125 = = 0,5 + 0,75 + 0,75 + 0,3125 = 2,3125. С учётом полученного значения ns и полученного числа битов кода в каждом слове (табл. 17.2) оценим также дисперсию для второго варианта кодирования: d = 0,5(1 − 2,3125)2 + 2 · 0,125(3 − 2,3125)2 + 3 · 0,0625(4 − 2,3125)2 + +2 · 0,03125(5 − 2,3125)2 = 1,9148. По среднему числу битов на сообщение и дисперсии второй вари-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 513 ант кодирования, как и ожидалось, имеет преимущество перед первым. Для сравнения используют также эффективность кода, которая определяется отношением энтропии H данного, например реального, источника сообщений при фиксированном их числе к среднему числу битов на одно сообщение ξ = H/ns . Если относительные частоты сообщений неизвестны, то на передающей и приёмной сторонах они могут параллельно определяться и уточняться, например, по установленной процедуре контроля текущих изменений характеристик передаваемых сообщений и адаптивной перестройки структуры дерева кодирования. При этом процедура упорядочивания сообщений в порядке убывания их вероятностей и соответствующая перестройка структуры дерева реализуются в текущем режиме по ходу уточнения относительных частот алфавита сообщений. Структура дерева изменяется слева направо и, при необходимости, по уровням, т. е. снизу вверх. Изменения параллельно реализуют и на приёмной, и на передающей стороне. 17.2.3. Избыточность кодирования по Хаффману Недостатком кодирования Хаффмана считается избыточность кодирования, которая обусловлена использованием целого числа битов в каждом из выбранных для сообщений слов кода. Однако возможность использования целого числа битов на символ при кодировании по Хаффману не даёт избыточности только в случае, когда веα роятности сообщений отражаются числами pα 0 = (0,5) , где α > 1 – целое число. В противном случае степень сжатия существенно падает, как было показано в предыдущем разделе, из-за неэффективного кодирования символами и вероятности появления сообщений pi > 0,5. В идеале на каждое сообщение следует выделить кодовое слово протяжённостью l1= − log2 p1 < 1 бит. Однако согласно алгоритму кодирования Хаффмана приходится выделять больше 1 бита. Для простейшей совокупности, например, состоящей из двух сообщений s1 с вероятностью p1 = 0,7 и s2 с вероятностью p2 = 0,3, энтропия H = −[p1 log2 p1 + (1 − p1 ) log2 (1 − p1 )] = −0,7 log2 0,7 − 0,3 log2 0,3 = = 0,881 бит/сообщение. Соответственно, при посимвольном кодировании получим 1 бит/ сообщение, так как дробное количество бит/сообщение в данном случае не используется. Таким образом, при кодировании по Хаффману обычно не удаётся реализовать полное устранение избыточности. В связи с этим продолжается активный поиск более эффективных методов статистического кодирования для различного типа сообщений. Важно в данном случае не только увеличить степень подавления
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 514 Часть V. Цифровое преобразование изображений в телевидении избыточности, но и минимизировать объём необходимых для выполнения кодирования вычислений. Одним из предложенных вариантов кодирования, обеспечивающим более жесткое устранение избыточности, является арифметическое кодирование. 17.3. Арифметическое кодирование Особенностью арифметического кодирования со сжатием объёма передаваемых битов, отражающих заданную последовательность исходных сообщений, является относительно жёсткое сопряжение процедуры кодирования с вероятностями появления сообщений конкретного алфавита. Для данного варианта характерно присвоение кода не отдельным символам, отражающим появление сообщений в источнике, а их ансамблю (файлу), имеющему определённое число (объём) сообщений. Арифметическое кодирование может выполняться в два этапа. На первом этапе (проходе файла) оценивают относительные частоты сообщений в передаваемом файле, а на втором осуществляют собственно кодирование. Если же относительные частоты для данного файла известны, то арифметическое кодирование осуществляют с их использованием. При кодировании поступающие символы многократно отражаются согласно всей совокупности относительных частот данного алфавита сообщений в виде модифицируемого (с приходом каждого символа, которому соответствует определённая относительная частота) числа в интервалы позиционирования, идентифицирующие порядок их появления. Исходный интервал (позиционирования всей совокупности относительных частот данного алфавита сообщений) [0, 1] до начала кодирования имеет границы gn0 = 0 и gv0 = 1 (нижнюю и верхнюю). 17.3.1. Реализация арифметического кодирования на передающей стороне Первоначально этот интервал делится на локальные интервалы, отражающие вес относительной частоты каждого из сообщений алфавита. В упорядоченной табл. 17.3 показаны числа, относительные частоты (вероятности) символов сообщений алфавита и выбранное распределение границ интервалов их локализации. Таблица 17.3 Сообщение S1 S2 S3 S4 Число сообщений в последовательности Относительная частота Интервал локализации 6 2 1 1 6/10 2/10 1/10 1/10 0,4...1,0 0,2...0,4 0,1...0,2 0,0...0,1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 515 Глава 17. Энтропийное кодирование Будем считать, что кодируемым ансамблем сообщений является последовательность s1 s1 s1 s2 s3 s1 s4 s1 s1 s2 . Первый (j = 1) такт процесса кодирования определяется появлением первого (i = 1) сообщения si = s1 , которое фиксирует значения верхней и нижней границ интервала, которые на первом этапе кодирования указанного символа определяются, согласно табл. 17.3, j j 1 1 величинами gmni = gmn1 = gn1 = 0,4 и gmvi = gmv1 = gv1 = 1,0. Протяжённость данного интервала di = d1 = gv1 − gn1 = 1,0 − 0,4 = 0,6. Таким образом, первым сообщением число C, кодирующее сообщения данного ансамбля, позиционируется в пределы 0,4 < C < 1,0. С появлением каждого нового сообщения кодирующее число C, оставаясь в пределах этого интервала, изменяется. Распределим в пределах данного интервала граничные значения сообщений в соответствии с табл. 17.3. Получим новое распределение границ локализаj j ции сообщений (gmni и gmvi , где j, как отмечалось выше, определяет такт кодирования, а i — номер сообщения в алфавите, m — индекс модификации), модифицированное в соответствии с появлением на первом такте (1) кодирования сообщения s1 . Соответственно, имеем 1 1 1 1 gmn1 = 0,64, gmv1 = 1,0 (сообщение s1 ); gmn2 = 0,52, gmv2 = 0,64 1 1 1 (сообщение s2 ); gmn3 = 0,46, gmv3 = 0,52 (сообщение s3 ); gmn4 = 0,4, 1 gmv4 = 0,46 (сообщение s4 ). Появление на втором такте сообщения s1 определяет вторую модификацию распределения границ интервала 2 2 = 0,784, gmv1 = 1,0 (сообщелокализации кодирующего числа: gmn1 2 2 2 ние s1 ); gmn2 = 0,712, gmv2 = 0,784 (сообщение s2 ); gmn3 = 0,676, 2 2 2 gmv3 = 0,712 (сообщение s3 ); gmn4 = 0,64, gmv4 = 0,676 (сообщение s4 ). Появление на третьем такте снова сообщения s1 адресует 2 2 кодирующее число в интервал от gmn1 = 0,784 до gmv1 = 1,0. j j Обозначим djm = gmvi − gmni — протяжённость интервала локализации кодирующего числа на j-м этапе кодирования данной после3 3 довательности сообщений. Тогда d3m = gmvi − gmni = 0,216. Можно заметить, что модифицированные нижняя и верхняя границы позиционирования кодирующего числа для каждого следующего такта кодирования (с учётом табл. 17.3) определяются по формулам: j+1 j gmni = gmni + djm gni ; j+1 j gmvi = gmni + dmi gvi . Соответственно, с приходом четвёртого сообщения s2 получаем, согласно данным предшествующего этапа и табл. 17.3, следующую версию параметров интервала, в котором позиционировано число, кодирующее предшествующую последовательность сообщений: 4 3 gmn = gmn + d3m gn4 = 0,784 + 0,216 · 0,2 = 0,8272; 3 4 gmv = gmn + d3m gv2 = 0,784 + 0,216 · 0,4 = 0,8704; 4 4 = 0,8704 − 0,8272 = 0,0432. − gmn d4m = gmv
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 516 Часть V. Цифровое преобразование изображений в телевидении С приходом пятого сообщения s3 : 5 4 gmn = gmn + d4m gn3 = 0,8272 + 0,0432 · 0,1 = 0,83152; 5 4 gmv = gmn + d4m gv3 = 0,8272 + 0,0432 · 0,2 = 0,83584; 5 5 d5m = gmv − gmn = 0,83584 − 0,83152 = 0,00432. С приходом шестого сообщения s1 : 6 5 gmn = gmn + d5m gn1 = 0,83152 + 0,00432 · 0,4 = 0,833248; 6 5 gmv = gmn + d5m gv1 = 0,83152 + 0,00432 · 1,0 = 0,83584; 6 6 d6m = gmv − gmn = 0,83584 − 0,833248 = 0,002592. С приходом седьмого сообщения s4 : 7 6 gmn = gmn + d6m gn4 = 0,833248 + 0,002592 · 0,0 = 0,833248; 7 6 = gmn + d6m gv4 = 0,833248 + 0,002592 · 0,1 = 0,8335072; gmv 7 7 − gmn = 0,8335072 − 0,833248 = 0,0002592. d7m = gmv С приходом восьмого сообщения s1 : 8 7 gmn = gmn + d7m gn1 = 0,833248 + 0,0002592 · 0,4 = 0,83335168; 8 7 gmv = gmn + d7m gv1 = 0,833248 + 0,0002592 · 1,0 = 0,8335072; 8 8 d8m = gmv − gmn = 0,8335072 − 0,83335168 = 0,00015552. С приходом девятого сообщения s1 : 8 9 + d8m gn1 = 0,83335168 + 0,00015552 · 1, 0 = 0,8335072; = gmn gmn 8 9 + d8m gv1 = 0,83335168 + 0,00015552 · 0,4 = 0,833413888; = gmn gmv 9 9 = 0,8335072 − 0,833413888 = 0,000093312. − gmn d9m = gmv С приходом десятого сообщения s2 : 10 9 gmn = gmn +d9m gn2 = 0,833413888+0,000093312·0,2 = 0,8334325504; 10 9 gmv = gmn +d9m gv2 = 0,833413888+0,000093312·0,4 = 0,8334512128; 10 10 d8m = gmv − gmn = 0,8334512128 − 0,833413888 = 0,0000373248. Декодирование реализуется в обратном (кодированию) порядке. На приёмной стороне при этом известно содержание табл. 17.3, отражающей число, частоты и относительные частоты (вероятности) появления символов (сообщений) алфавита. Кодирующее число соответствует интервалу от 0 до 1. При этом часть полученного числа («0») не включают в передаваемую цифру. Полученное на последнем этапе кодирования число Ckj = Ck10 (кодирование определяется использованием в обозначении числа индексом k, а декодирова10 10 до gmn ние — d), значение которого находится в интервале от gmv
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 517 10 10 (gmn < Ck10 < gmv ) передают на приёмную сторону. Определим в качестве передаваемого числа 83345, т. е. Ck10 = Cd1 = 0,83345. 17.3.2. Декодирование на приёмной стороне На приемной стороне декодирование осуществляют в обратном порядке, начиная с первой (после запятой) составляющей полученной цифры Ck10 = 0,83345. Значение этой составляющей равно 0,8. Это сразу позволяет в соответствии с интервалами, отведённым сообщениям в табл. 17.3, идентифицировать по этой цифре появление на первом этапе декодирования сообщения s1 . Далее в декодере осуществляют вычитание из кодирующего числа нижнего значения интервала позиционирования сообщения s1 (в соответствии с таблицей gni = gn1 = 0,4). Полученный результат делят на протяжённость первого интервала d1 = 0,6. Тогда Cd2 = Ck10 − gn1 0,83345 − 0,4 = = 0,72241667. d1 0,6 Полученный результат свидетельствует, что второе сообщение попадает в интервал позиционирования сообщения s1 . Следуют заметить, что интервал позиционирования при идентификации сообщений определяется полученной на каждом этапе декодирования цифрой Cdj в соответствии с неравенством gni < Cdj < gvi . Далее находим: Cd3 = 0,72241667 − 0,4 Cd2 − gn1 = = 0,537361117 d1 0,6 соответствует идентификации третьего сообщения как s1 ; Cd4 = Cd3 − gn1 0,537361117 − 0,4 = = 0,228935195 D3 0,6 соответствует идентификации сообщения как s2 ; Cd5 = Cd4 − gn2 0,228935195 − 0,2 = = 0,144675935 d2 0,2 соответствует идентификации сообщения как s3 ; Cd6 = Cd5 − gn3 0,144675975 − 0,1 = = 0,44675975 d3 0,1 соответствует идентификации сообщения как s1 ; Cd7 = Cd6 − gn1 0,44675975 − 0,4 = = 0,077932917 d1 0,6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 518 Часть V. Цифровое преобразование изображений в телевидении соответствует идентификации сообщения как s4 ; Cd8 = Cd7 − gn4 0,077932917 − 0,0 = = 0,77932917 d4 0,1 соответствует идентификации сообщения как s1 ; Cd9 = Cd8 − gn1 0,77932917 − 0,4 = = 0,63221528 d1 0,6 соответствует идентификации сообщения как s1 ; Cd10 = Cd9 − gn1 0,63221528 − 0,4 = = 0,38702547 d1 0,6 соответствует идентификации сообщения как s2 . 17.3.3. Оценка эффективности арифметического кодирования Оценим эффективность сжатия. С этой целью найдём совместную вероятность кодированной последовательности сообщений s1 s1 s1 s2 s3 s1 s4 s1 s1 s2 p1...4 = p61 p22 p3 p4 = (0,6)6 (0,2)2 · 0,1 · 0,1 = 0,0000166624. В идеале, соответственно полученному значению вероятности, на сообщение в виде данной последовательности следует выделить кодовое слово протяжённостью l1...4 = − log2 p1...4 = − log2 0,0000186624 ≈ 15,709506 бит. Число C1 = 0,83345 поступает на декодер. В двоичном представлении оно имеет вид C1b = 0.1101010101011101 (с некоторым приближением), соответствующее десятичное число 0,8334503173828125. Таким образом, кодирующий рассмотренную последовательность код может иметь вид 1101010101011101 и имеет протяжённость 16 битов. Это достаточно неплохое приближение к полученному идеализированному значению l1...4 = − log2 p1...4 = − log2 0,0000186624 ≈ ≈ 15,709506 бит. Основным недостатком арифметического кодирования является значительный объём вычислений, обусловленный необходимостью использования при кодировании и декодировании операций умножения (деления). С другой стороны, в данном случае обычно имеет место более эффективное, по отношению к варианту кодирования по Хаффману, кодирование сообщений, вероятность появления которых pi > 0,5. При выполнении адаптивного арифметического кодирования реализуют, с учётом изменений показаний счётчиков, осуществляющих
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 519 текущую оценку относительных частот каждого из сообщений, параллельную (жёстко согласованную) коррекцию на приёмной и передающей сторонах интервалов локализации сообщений в соответствующих массивах данных. С поступлением и накоплением сообщений могут, например, иметь место такие изменения относительных частот сообщений, представленных в массиве (упрощённый его вариант показан в табл. 17.3), которые нарушают его упорядоченность. Соответственно, на последующих этапах кодирования целесообразно (согласованно при кодировании и декодировании) переходить к другому варианту интервалов локализации относительных частот сообщений в массиве. Процедура коррекции массива данных существенно упрощается при использовании специальной структуры в виде двоичного дерева кодирования, в узлах которого приведены, в том числе, и данные показаний счётчиков сообщений. 17.4. Кодирование текстовых сообщений Основным преимуществом словарных методов кодирования текстовых сообщений со сжатием соответствующего объёма передаваемых битов является отсутствие вычислений, так как в данном случае используются операции: декомпозиции последовательности сообщений исходного файла на независимые (законченного вида) сообщения (сочетания букв, слова, словосочетания, фразы), сравнительного анализа разделённых сообщений и содержания существующего (созданного) архива (словаря), присвоение содержащимся в словаре сообщениям заданных символов и прямое (по буквам) кодирование, например, кодом ASCII (American Standard Code for Information Interchange). При этом используется семь битов (семь разрядов) на одинарное (однозначно независимое) сообщение (пробел, буквы алфавита, знаки препинания и др.), восьмой бит используется для расширения числа одинарных сообщений (тех сообщений, которые не содержатся в словаре). Входное сообщение в ходе кодирования ищется в словаре. Если оно найдено, то передаётся соответствующее кодовое слово или соответствующие кодовые слова, определяющие на приёмной стороне его позицию в словаре. В начале кодового слова заданная двоичная цифра «0» (или «1») обычно идентифицирует начало передачи такого кодового слова, число битов в котором задаётся выбранным объёмом словаря. Если объём словаря содержит V позиций, то необходимое число битов в кодовом слове определяется величиной l = log2 V . При V = 1000000, например, получаем l = 20 битов, что задаёт полную (с учётом бита, фиксирующего начало передачи сообщения, которое содержится в словаре) протяжённость соответствующего кодового слова L = l + 1 = 21 бит.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 520 Часть V. Цифровое преобразование изображений в телевидении Когда необходимых сочетаний букв, частей слов, целых слов, словосочетаний, частей фраз и т. д. не содержится в словаре, то передаются коды последовательно следующих букв, пробелов и знаков препинания. При этом в начале такой последовательности, например восьмибитовых кодовых слов, передается двоичная цифра f («1» или «0»), идентифицирующая начало передачи кодовой последовательности сообщения, которое не было в ходе кодирования обнаружено в словаре. После этого может передаваться информация, отражающая протяжённость (число букв) последующего сообщения, и затем последовательность восьмибитовых символов, определяющих конкретные буквы (пробелы, знаки препинания) самого сообщения. Созданные словари должны содержать употребляемые с наибольшей вероятностью для данного типа текстов слова и словосочетания. Однако завышенный объём словаря может и снижать достижимую степень сжатия. Существуют различные разновидности реализации процедуры кодирования (сжатия без информационных потерь) текстовых сообщений. Достаточно эффективные варианты сжатия текстовых сообщений первоначально были разработаны в 70-х годах (методы LZ77 и LZ78, авторы A. Lampel, J. Ziv). Вариант кодирования LZ77. В этом варианте используется корреляция текущего (кодируемого в данный момент) фрагмента текста c его предшествующим (уже закодированным к данному моменту) фрагментом. Кодирование основано на сравнительной оценке последовательностей сообщений в кодируемом и закодированном фрагментах, общий объём которых чаще всего является фиксированным и ограниченным. При этом последовательность сообщений в кодируемом фрагменте является продолжением последовательности сообщений закодированного фрагмента, а объём сообщений, содержащихся в последнем из них, значительно превышает объём сообщений, содержащихся в кодируемом фрагменте текста. Кодируемое в данный период сообщение примыкает к сообщению, закодированному в предшествующий период, и переводится после выполнения кодирования из буфера текущего фрагмента в буфер предшествующего фрагмента. Весь объем текста в уже закодированном фрагменте, по сути дела, является непрерывной последовательностью букв, пробелов, знаков препинания, начало которой примыкает к началу кодируемого фрагмента, а конец определяется объёмом соответствующего буфера. Это позволяет определить положение любой буквы в этом фрагменте или их сочетаний по отношению к его началу. Процесс сравнительной оценки сообщений в указанных фрагментах фактически определяется
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 521 (в процессе кодирования) порядком следования букв текста в кодируемом фрагменте. Первоначально находят в объёме уже закодированного фрагмента совокупность позиций первой конкретной буквы (символа) кодируемого фрагмента. Затем последовательно определяют в этой совокупности лишь позиции двух его первых букв, трёх и т. д. букв (пробелов, знаков препинания). Данный процесс сравнительной оценки завершают на последнем этапе, когда выборка из непрерывной последовательности («цепочка») кодируемых в данный период букв (пробелов, знаков препинания) уже не имеет аналога в пределах текста, содержащегося на этот период кодирования в уже закодированном фрагменте. Если в уже закодированном фрагменте указанная «цепочка» кодируемых в данный период букв (пробелов, знаков препинания) обнаружена на последнем этапе кодирования в нескольких местах, то обычно передаётся координата l наиболее дальней (от начала уже закодированного фрагмента) из них. Кроме этого, в качестве информационных данных на данном этапе кодирования передаются на приёмную сторону число (n), содержащихся в обнаруженной «цепочке» букв, и следующая буква (пробел, знак препинания) кодируемой последовательности. В случае, когда уже закодированный фрагмент не содержит буквы, с которой, собственно, и начинается данный этап кодирования, то передают значение координаты «0» (l = 0), в качестве же числа n букв (символов) в закодированной «цепочке» передаётся также значение «0» (n = 0) и, наконец, в качестве следующей буквы передаётся сама первая буква. Если в кодируемой «цепочке» имеет место повторение одной и той же буквы, то передают в начале «0», которым фиксируется появление частного случая, затем передают «1», фиксирующую наличие повторений одной и той же буквы, и символ самой буквы. После этого передают число повторений и символ следующей буквы. Граница между уже закодированным и кодируемым фрагментом может смещаться при кодировании в сторону кодируемого фрагмента. При этом возможно увеличение числа букв в обнаруженной «цепочке» за счёт её продолжения в сторону кодируемого фрагмента. Соответственно, максимально возможное число букв в обнаруженной «цепочке» определяется числом независимых сообщений, содержащихся в кодируемом фрагменте, за исключением последнего из таких сообщений. Количество сообщений K0 , содержащихся в непрерывной последовательности кодируемого фрагмента, определяет при этом необходимое для передачи числа n количество (η = log2 (K0 − 1)) битов. Количество сообщений L0 , содержащихся в непрерывной последовательности закодированного фрагмента, определяет при этом необходимое для передачи координаты (l) число (r = log2 L0 ) битов.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 522 Часть V. Цифровое преобразование изображений в телевидении При этом на передачу следующей (за кодируемой «цепочкой» букв) буквы обычно расходуют g (восемь) битов. Если L0 = 216 = 65536, K0 = 26 = 64, тогда содержащееся в закодированном фрагменте слово из пяти букв может передаваться числом µ = r + η + g + f = = 16+6+8+1 = 31 бит, где f идентифицирует начало передачи сообщения, содержащегося в закодированном фрагменте. Такое же слово кодом ASCII может передаваться уже числом µ = 5·8+1 ≈ 40...41 бит. После завершения каждого этапа кодирования из буфера закодированного фрагмента выводят n + 1 закодированных на данном этапе букв, а в конец буфера кодирования, соответственно, вводят n + 1 новых букв. С указанным совмещённым сдвигом фрагментов закодированного и кодируемого по отношению к кодируемому тексту (или, наоборот, текста по отношению к фиксированному положению стробирующего «окна», определяющего размеры указанных фрагментов) связано часто используемое название данного метода — «скользящее окно». Эффективность кодирования с использованием метода LZ77 зависит от объёма закодированного, кодируемого фрагментов и кодируемого текста в целом. С возрастанием и оптимизацией указанных объёмов эффективность кодирования возрастает и среднее число бит на сообщение приближается к энтропии кодируемого текста. Достижимая степень в лучшем случае достигает здесь примерно 50 %. Недостатки метода LZ77 обусловлены спецификой его функционирования: данный метод рассчитан на использование корреляции в смежных фрагментах текста и эффективность его применения зависит от наличия соответствующей взаимозависимости в структуре текста. Кодирование одиночных сообщений (случай, когда закодированный фрагмент не содержит буквы, с которой начинается данный этап кодирования) реализуется относительно большим числом битов. Имеет место падение эффективности сжатия часто повторяющихся сочетаний («цепочек») сообщений из-за биений интервалов между ними и общей протяженностью стробирующего «окна». Уменьшение эффективности сжатия имеет место при сокращении размеров кодируемого и закодированного фрагментов, а увеличение размеров существенно замедляет процесс сравнительной оценки указанных фрагментов. Декодер на приёмной стороне с использованием переданной информации синтезирует в тексте необходимую для его содержания последовательность букв. Вариант кодирования LZ78. Развитием кодирования LZ77 является вариант LZ78, который обладает преимуществами по отношению к последнему варианту сжатия текстовых сообщений.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 17. Энтропийное кодирование 523 В таком случае используют определённого объёма словарь уже встретившихся на предшествующих этапах кодирования выборок («цепочек» различного объёма) из непрерывной последовательности кодируемых в данный период букв. Словарь может создаваться и пополняться (и на приёмной, и на передающей сторонах) в процессе кодирования данного текста. Если первая буква цепочки не обнаружена в словаре, то передаётся нулевая позиция словаря и данная буква текста. По результатам кодирования передаётся позиция текущего сообщения в словаре и следующая буква текста (код символа). Первоначально определяется и фиксируется буква, являющаяся началом кодируемой выборки («цепочки») из последовательности сообщений, затем осуществляется сравнение данного сообщения со словарём. В случае, когда данная буква содержится в словаре, определяется, фиксируется и ищется в словаре уже последовательность двух букв. Если такая двухзвенная цепочка букв (символов) обнаружена, то определяется, фиксируется и ищется в словаре уже последовательность трёх букв и т. д. Когда фиксированная таким образом n-звенная «цепочка» на последнем этапе кодирования не обнаружена в словаре, осуществляют её кодирование для передачи на приёмную сторону. Передают позицию (координаты) в словаре, обнаруженной части «цепочки», содержащей n−1 букву, и передают n-ю букву, присоединения которой к предшествующему варианту кодируемой цепочки обусловило её отсутствие в созданном словаре. При этом словарь расширяется за счёт включения в него закодированного и переданного на последнем этапе варианта n-звенной цепочки сообщений (букв). Закодируем на основе LZ78 следующую последовательность: «. громадная волна обрушилась на берег . её гребень вырвался за кромку пляжа . следующая волна была слабее . волны разрушили и смыли с берега , пляжа и прибрежной области легкие сооружения . поднялся ветер . под ногами заколыхалась земля ... .». Результаты кодирования представлены в табл. 17.4. Собственно степенью возрастания, в ходе реализации кодирования, числа позиций создаваемого архива определяется эффективность текущего кодирования методом LZ78. Чем быстрее заполняется архив (словарь), тем меньшей избыточностью характеризуется данный текст. Как следует из таблицы, первоначально заполнение архива реализуется в соответствии с поступлением отдельных букв (звеньев), затем (по ходу продолжения текста) в нём появились двухзвенные и трёхзвенные цепочки входных букв (пробелов, знаков препинания). На первом участке рассмотренного текста числа поступивших букв (Nт ) и заполненных позиций архива (Nа ) совпадают, т. е. η = Nт /Nа ≈ 1. Однако с увеличением объёма закодированного текста значение η возрастает. После кодирования первого предложения, например η ≈ 1,44,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 524 Часть V. Цифровое преобразование изображений в телевидении после кодирования второго — η ≈ 1,625, после кодирования третьего — η ≈ 1,74, после кодирования четвёртого — η ≈ 1,96. Для упрощения сравнительной оценки при кодировании словарь обычно реализуют в виде дерева, общим корнем (узлом) которого является нулевая позиция (0) в архиве (словаре). Первичными потомками данного корня являются сообщения (буквы, пробелы, знаки препинания), которые на исходном (по отношению к последующим) этапе кодирования имеют первоначально нулевую позицию в словаре. Такими в табл. 17.4 являются следующие сообщения (одинарного типа) архива: 1 (« »), 2 («.»), 4 («р»), 5 («о»), 6 («м»), 7 («а»), 8 («д»), 9 («н»), 15 («б»), 17 («ш»), 18 («и»), 19 («л»), 21 («ь»), 26 («г»), 29 («ё»), 34(«в»), 35(«ы»), 38(«с»), 39 («я»), 44 («у»), 47 («ж»), 52 («ю»), 53 («щ»), 84 («й»), 87 («т»), 106 («п»), 115 («х»). Потомками каждого из перечисленных (с нулевой позицией в словаре) являются сообщения, представляющие уже цепочку из двух одинарного типа сообщений. Каждое одинарного типа сообщение, таким образом, является корнем нового поддерева. Потомками, например, одинарного сообщения (узла) 7 («а») в структуре дерева являются, согласно таблице кодирования 17.4, позиции в архиве 10 («ая»), 20 («ас»), 23 («а »), 37 («ал»), 66 («аз»), 109 («ам»), 111 («ак»). В свою очередь, сообщения, представляющие цепочку из двух одинарного типа сообщений, являются корнями сообщений, имеющих вид цепочек из трёх одинарного типа сообщений. В частности, потомками позиции 10 («ая») является в табл. 17.4 позиция 54 («ая »); потомками позиции 23 («а ») являются 41 («а к»), 48 («а .»), 57 («а б»), 59 («а с»), 76 («а ,»), 79 («а и»); потомком позиции 37 («ал») является позиция 116(«ала»). С увеличением объёма словаря возрастает количество узлов и поддеревьев в общей структуре дерева. Использование такого дерева существенно сокращает при реализации кодирования продолжительность поиска в созданном словаре цепочек последовательно поступающих сообщений. В общем случае кодирование относительно протяжённых текстов может привести к переполнению заданного пользователем объёма словаря. Если текст при этом продолжает сохранять значительную степень корреляции с уже закодированным его фрагментом, то можно использовать уже созданный архив, т. е. зафиксировать и использовать неизменный вариант структуры дерева. В условиях же, когда контроль показывает снижение эффективности сжатия, целесообразно осуществлять модернизацию архива. Вариант кодирования LZW. Развитием кодирования текстов со сжатием объёма передаваемых бит LZ78 является вариант LZW, который был разработан в 1984 г. (автор Terry Welch). В начале кодировании по LZW используют исходный фрагмент (объёмом, например, в
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 525 Глава 17. Энтропийное кодирование Таблица 17.4 № сооб- Архив щения сообв щений архиве 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 «» «.» «г» «р» «о» «м» «а» «д» «н» «ая » « в» «ол» «на» « о» «б» «ру» «ш» «и» «л» «ас» «ь» « н» «а » «бе» «ре» «г» « .» « e» «ё» « гр» «е» «бен» «ь » «в» «ы» «рв» «ал» «с» «я» « з» Кодиро- № сооб- Архив ванное щения сообсообщев щений ние архиве (0, « ») (0, «.») (1, «г») (0, «р») (0, «о») (0, «м») (0, «а») (0, «д») (0, «н») (7, «я») (1, «в») (5, «л») (9, «а») (1, «о») (0, «б») (4, «у») (0, «ш») (0, «и») (0, «л») (7, «с») (0, «ь») (1, «н») (7, « ») (15, «е») (4, «е») (0, «г») (1, «.») (1, «е») (0, «ё») (3, «р») (0, «е») (24, «н») (21, « ») (0, «в») (0, «ы») (4, «в») (7, «л») (0, «с») (0, «я») (1, «з») 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 «а к» «ро» «мк» «у» « п» «ля» «ж» «а .» « с» «ле» «ду» «ю» «щ» «ая » «во» «лн» «а б» «ыл» «а с» «ла» «бее» «.» «вол» «ны» « р» «аз» «руш» «ил» «и » «и с» «мы» «ли » «с» «бер» «ег» «а ,» « пл» «яж» «а и» « пр» Кодированное сообщение (23, «к») (4, «о») (6, «к») (0, «у») (1, «п») (19, «я») (0, «ж») (23, «.») (1, «с») (19, «е») (8, «у») (0, «ю») (0, «щ») (10, « ») (34, «о») (19, «н») (23, «б») (35, «л») (23, «с») (19, «а») (24, «е») (27, « ») (55, «л») (9, «ы») (1, «р») (7, «з») (16, «ш») (18, «л») (18, « ») (69, «с») (6, «ы») (19, «и») (49, « ») (24, «р») (31, «г») (23, «,») (45, «л ») (39, «ж») (23, «и») (45, «р») № сооб- Архив щения сообв щений архиве 81 82 83 84 85 86 87 88 89 90 91 92 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 115 116 117 119 120 121 122 123 124 «иб» «реж» «но» «й» « об» «лас» «т» «и л» «ёг» «к» «ие» « со» «руж» «ен» «ия» « . п» «од» «ня» «лс» «я » «ве» «те» «р » «. » «п» «од » «ног» «ам» « и з» «ак» «олы» «х» «ала» «сь» «з» «е м» «ля» «..» «. .» «eot» Кодированное сообщение (18, «б») (25, «ж») (9, «о») (0, «й») (14, «б») (60, «с») (0, «т») (69, «л») (29, «г») (0, «к») (18, «е») (49, «о») (16, «ж») (31, «н») (18, «я») (62, «п») (5, «д») (9, «я») (19, «с») (39, « ») (34, «е») (87, «е») (4, « ») (2, « ») (0, «п») (98, « ») (83, «г») (7, «м») (69, «з») (7, «к») (12, «ы») (0, «х») (37, «а») (38, «ь») (1, «з») (31, «м») (19, « ») (2, «.») (105, «.») (0, «eot») eot — конец передачи. 256 сообщений одинарного типа) архива (словаря), который вводят в соответствующую память до поступления текста, подвергаемого сжатию. Поэтому кодирование текущей последовательности сообщений в данном случае реализуют на первом этапе только на основе этого
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 526 Часть V. Цифровое преобразование изображений в телевидении фрагмента. При этом по ходу текущего кодирования осуществляют последующее наращивание объёма указанного (исходного) фрагмента словаря. Соответственно, словарь заполняется всё более длинными цепочками сообщений, каждое из которых содержалось в исходном фрагменте архива или было добавлено в него на предшествующих этапах кодирования данного текста. Если, например, в ходе кодирования с использованием LZ78 одинарные сообщения получают свои позиции в архиве по ходу кодирования, то при использовании LZW позиции этих сообщений присутствуют в исходном фрагменте архива. В качестве примера осуществим LZW кодирование части следующей последовательности сообщений: «Падающий свет окутывал кусты сирени синим сиянием . ». Результат кодирования предствлен в табл. 17.5. Таким образом, на приёмную сторону поступает следующая последовательность сообщений: «П,а,д,а,ю,щ,и,й, ,с,в,е,т, ,о,к,у,т,ы,в,а, л, ,ку,с,ты, с,и,р,е,н,и, си,ни,м, си,я,ни,е,м,.„конец передачи», кодированная соответствующими числами: 143, 160, 164, 160, 238, 233, 168, 169, 32, 225, 162, 165, 226, 32, 174, 170, 227, 226, 235, 162, 160, 171, 32, 271, 225, 273, 264, 168, 224, 165, 173, 168, 289, 293, 172, 289, 239, 293, 165, 297, 46, 32, 4. Приведённый выше пример кодирования отражает адаптационные свойства метода LZW, для которого характерно постепенное выявление и увеличение в наращиваемой части объёма архива продолжительности цепочек наиболее часто встречающихся по тексту последовательностей одинарных сообщений. Соответственно, в условиях предельного заполнения фиксированного объёма архива сама продолжительность цепочек последовательностей сообщений может быть выбрана в качестве критерия при модернизации его части, введённой по ходу кодирования текста. В декодере LZW также имеется исходный фрагмент архива, объём которого наращивается после получения каждого последующего сообщения практически точно так, как наращивается объём архива при реализации кодирования. Аналогичным образом, например, в ходе последовательного поступления первых сообщений одинарного типа в виде цифр 143, 160, 164, 160 (соответственно, буквы П, а, д, а) объём архива на приёмной стороне последовательно наращивается отсутствующими в нём цепочками (Па, ад, да), каждая из которых состоит из двух одинарных сообщений, присутствующих в исходном фрагменте архива. Принцип кодирования LZW эффективно сочетается со структурой построения архива в виде дерева, так как на каждом следующем этапе кодирования имеет место увеличение протяжённости кодируемых цепочек сообщений на одно одинарное сообщение. При этом в уз-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 527 Глава 17. Энтропийное кодирование Таблица 17.5 СообПоиск № ввода Результат щение в архиве в архив кодирования Сообщение «П» «Па» «а» «ад» «д» «да» «а» «аю» «ю» «ющ» «щ» «щи» «и» «ий» «й» «й » «» « с» «с» «св» «в» «ве» «е» «ет» «т» «т » «» « о» «о» «ок» «к» «ку» «у» «ут» «т» «ты» «ы» «ыв» «в» «ва » «а» «ал» «л» «л » «» « к» «к» «ку» «кус» «с» «ст» «т» «ты» «ты» «» « с» « си» «и» «ир» «р» «ре» «е» «ен» «н» «ни» «и» «и » «» « с» « си» « син» «н» «ни» «ним» «м» «м » «» « с» « си» «сия» «я» «ян» «н» «ни» «ние» «е» «ем» «м» «м » «м .» «.» «. » «» «eot» «eot» есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть нет есть 256 143 (П) 257 160 (а) 258 164 (д) 259 160 (а) 260 238 (ю) 261 233 (щ) 262 168 (и) 263 169 (й) 264 32 ( ) 265 225 (с) 266 162 (в) 267 165 (е) 268 226 (т) 269 32 ( ) 270 174 (о) 271 170 (к) 272 227 (у) 273 226 (т) 274 235 (ы) 275 162 (в) 276 160 (а) 277 171 (л) 278 32 ( ) Поиск № ввода Результат в архиве в архив кодирования есть нет есть нет есть есть нет есть есть нет есть нет есть нет есть нет есть нет есть нет есть есть есть нет есть есть нет есть нет есть есть есть нет есть нет есть есть нет есть нет есть есть нет есть нет есть нет есть 279 271 (ку) 280 225 (с) 288 273 (ты) 289 264 (с) 290 168 (и) 291 224 (р) 292 165 (е) 293 173 (н) 294 168 (и) 295 289 ( си) 296 293 (ни) 297 172 (м) 298 289 ( си) 299 239 (я) 300 293 (ни) 301 165 (е) 302 297 (м ) 303 46 (.) 304 32 ( ) 4 (eot)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 528 Часть V. Цифровое преобразование изображений в телевидении лах дерева может содержаться цифра кода, указывающая на узел родителя (укороченную цепочку сообщений, соответствующую предшествующему этапу кодирования), и кода ASCII поступившего одинарного сообщения, увеличивающего протяжённость родительской цепочки на одинарное сообщение. Цифру, отражающего код потомка, получают в данном случае рандомизацией (перемешиванием, хешированием — в соответствии с некоторой функцией) указанных цифр кода родителя и кода ASCII, поступившего на данном этапе кодирования одинарного сообщения. Полученная хешированием цифра проверяется на отсутствие коллизий. Для упрощения задачи разрешения возникающих коллизий в узлах дерева на практике вводят также результат рандомизации, т. е. в узле дерева содержится информация о родительском узле, о результате хеширования и кода (ASCII) поступившего одинарного сообщения. Правильное использование LZW кодирования позволяет существенно снизить сжатием число битов, передаваемых (в среднем) на одно сообщение. При этом эффективность применения рассмотренного метода обычно возрастает при кодировании текстов, имеющих относительно большой объём или последовательности текстов, сохраняющих достаточно высокую степень корреляции. Контрольные вопросы 1. Поясните понятия символы сообщений, размер набора символов, алфавит, поток символов, коэффициент сжатия при кодировании. 2. Как реализуют сжатие по длинам серий? 3. Какие соотношения и аксиомы об информации Вы знаете? 4. Определите, с использованием соответствующих соотношений, энтропию сообщений и равновероятных сообщений. 5. Докажите, что при существенно отличающихся вероятностях сообщений падает энтропия. 6. Каким образом определяется избыточность источника сообщений? 7. Укажите правила кодирования сообщений по Хаффману. 8. Объясните принцип графического представления и относительной оценки вариантов кодирования по Хаффману. 9. Какой недостаток характерен для варианта кодирования по Хаффману? 10. Каким образом реализуется арифметическое кодирование? Укажите его преимущество по отношению к кодированию по Хаффману. 11. Какая последовательность операций реализуется при арифметическом декодировании? 12. Укажите основные особенности кодирования текстовых сообщений. 13. Проведите сопоставление вариантов кодирования текстовых сообщений LZ77 и LZ78. 14. Поясните принцип осуществления кодирования текстовых сообщений LZW и укажите его преимущество по отношению к кодированию по LZ77 и LZ78.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 18 ОТНОСИТЕЛЬНЫЕ ПРЕОБРАЗОВАНИЯ СТРУКТУРЫ МНОГОМЕРНОГО СПЕКТРА ИЗОБРАЖЕНИЙ В СИСТЕМАХ ЦИФРОВОГО ТЕЛЕВИДЕНИЯ Ближайшей перспективой для современных систем цифрового телевидения (СТВ) является разумное сочетание элементов обработки сигналов в оптическом и электрическом трактах. Соответственно, актуальной в данное время является задача разработки методов анализа характеристик и параметров основных существующих типов преобразования спектра видеоинформации при формирования ТВ сигнала. На первом этапе в СТВ фактически осуществляют детерминированное оптическое отображение пространства значений многомерной входной функции распределения света в некоторое подпространство значений выходной функции распределения света. Такое отображение обычно считают линейным, однородным и, соответственно, относят к классу линейных операторов. Выходная функция распределения света является при этом входной для преобразователя «свет-сигнал» (ПСС) и фактически во многом определяет результирующее качество работы СТВ в целом. Выходное распределение света синтезируют на выходе оптической системы (ОС) СТВ. Простейший вариант действия ОС — согласование пространственного масштаба выходного распределение света с пространственными размерами светочувствительной поверхности ПСС и ограничение протяжённости пространственного спектра видеоинформационнного воздействия перед последующей его дискретизацией совокупностью светочувствительных элементов в пределах соответствующей матрицы ПСС. Указанные преобразования являются операторами с фиксированными характеристиками, зависящими от координат информационного пространства, и часто отражаются деградациями в передаче характеристик объектов, фиксированных во времени и в пространстве. В условиях анализа видеоинформации с относительно большими углами поля зрения (ψ > 20◦ ) на периферии внутрикадрового пространства при оптическом проецировании возникают, в частности, реальные масштабно-пространственные преобразования структуры контролируемых объектов, проявляющиеся перераспределениями относительных размеров её элементов в пределах кадров и в некоторых случаях сопутствующими изменениями формы и, следовательно, характеристик
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 530 Часть V. Цифровое преобразование изображений в телевидении соответствующего спектра объектов. Здесь же, в том числе и в связи с последним, в большей степени из-за действия аберраций проявляются интегрально-пространственные преобразования при отражении детальности контролируемых сигналов изображений. Однако указанные нелинейные и линейные преобразования видеоинформации являются фиксированными во времени. Поэтому в большинстве работ, посвященных исследованию линейных операторов, реализуемых ОС, чаще всего рассматривают лишь действие последней в одномерном и лишь изредка в двумерном пространстве. Это обедняет представление о функциональных возможностях ОС в СТВ. В ОС СТВ с некоторым приближением реализуются дифферен5 цируемые гомеоморфные отображения Fi множества G ⊂ Rx,y,t,z,λ на 4 множество Gi ⊂ Rx,y,t,λ с якобианом, не равным нулю на G. Реальные ОС могут обеспечивать широкий набор различных по целевому назначению преобразований видеоинформации и, следовательно, её многомерного спектра на входе ПСС за счет, например, отображения пространства x, y, t, l в X, y, t, l, в X, Y, t, l, в X, Y, T, l, в X, Y, T, l0 и т. д. Учет всех функциональных возможностей действия ОС позволяет при проектировании и разработке систем телевидения различного назначения уже на входе ПСС обеспечить эффективное сопряжение характеристик многомерного спектра входного воздействия с характеристиками используемого ПСС с получением соответствующего выигрыша в качественных показателях работы системы телевидения в целом. Первичное преобразование видеоинформации при этом может реализовываться в ОС, а обратное — с использованием цифровой обработки сигналов изображений в электрическом тракте СТВ. Кроме упомянутых пространственных преобразований, к основным операторам, которые могут реализовываться в ОС, можно также отнести масштабно-временные и фазо-временные преобразования; спектральное, спектрально-пространственное и спектрально-временное разделение видеоинформации на составляющие; пространственная, временная и пространственно-временная дискретизация и модуляция видеоинформации и др. Тщательный анализ преобразований видеоинформации в ОС затруднен значительной сложностью математического моделирования соответствующих процессов. Поэтому целесообразно воспользоваться параметрическим описанием этого процесса. Чаще всего параметром целесообразно брать время. Однако параметром может быть и угол проецирования, расстояние между поверхностями в области объектов и изображений и т. д. Одним из распространенных вариантов работы систем телевидения (СТВ) является видеоконтроль объектов, относительное положение (фаза в пространстве растра) которых по определенному закону изменяется во времени (в последовательности
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 531 кадров). Проведем анализ характеристик такого варианта преобразования сигнала ТВ изображения. 18.1. Фазо-временные преобразования пространственного спектра сигналов изображений в системах телевидения Фактически не принципиально, за счет чего возникают при контроле видеоинформации фазовые преобразования: то ли это специфика перемещения контролируемых объектов по отношению к СТВ, то ли специфика перемещений датчика СТВ по отношению к контролируемым объектам. Сходные результаты может дать и вариант функционирования СТВ, когда между контролируемой зоной информационного пространства и датчиком сигнала есть среда, параметры которой изменяются во времени. С увеличением объема промежуточной среды (атмосферы) связано, например, возникновение турбулентности в ее структуре. Явление турбулентности отражается соответствующими относительными изменениями во времени положения контролируемых объектов на светочувствительной поверхности датчика сигнала СТВ. Это эквивалентно предварительному преобразованию многомерного спектра контролируемых объектов и должно учитываться при проектировании СТВ, предназначенных для функционирования в условиях действия турбулентности. Аналогичного типа преобразования временной составляющей многомерного спектра сигналов изображений возникают при размещении ПСС на подвижном носителе с наличием вибрационной составляющей при движении. Фактически аналогичные искажения могут возникать в СТВ с периодическими изменениями (переключениями) в оптическом тракте относительного положения плоскости фокусировки или оптической оси ОС. К тому же большинство современных СТB работает в условиях действия на датчик сигнала изображения хаотических микросмещений в направлении ортогональном поверхности земли. Соответствующие фазовые преобразования спектра видеоинформации отражаются при этом уменьшением разрешающей способности изображений в вертикальном по растру направлении, степень которого зависит от характеристик инероционности и параметров СТВ. Поэтому параметры и характеристики элементов обработки видеоинформации, включенных в СТВ, во всех подобных случаях должны быть выбраны с учетом структуры преобразованного многомерного спектра. Использование фазовых преобразований исходного воздействия, наряду с этим, позволяет осуществлять гребенчатую режекцию и анизотропные ограничения пространственного спектра в СТВ, что отражается, в конечном cчете, либо улучшением качества воспроизводи-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 532 Часть V. Цифровое преобразование изображений в телевидении мых изображений, либо упрощением требований к результирующим характеристикам операций обработки сигнала изображения в СТВ. Наличие фазовых преобразований визуальной информации весьма характерно, в частности, для функционирования зрительной системы человека. Это и скачкообразные движения глаз, и слежение, и тремор. С большой долей достоверности можно при этом предполагать, что именно тремор является причиной известной анизотропии в форме пространственной частотной характеристики глаза, отражением которого является снижение разрешающей способности под углом примерно 45◦ в пространстве визуального контроля. Не вызывает сомнения в связи с последним, что использование элементов фазового преобразования контролируемой видеоинформации позволяет обеспечить в отдельных вариантах применения радикальное увеличение эффективности функционирования современных СТВ специального назначения. Квазипериодические фазо-временные преобразования видеоинформации могут осуществляться как за счет соответствующих смещений самих объектов, так и за счет организации необходимых относительных смещений, например, в датчике сигнала СТВ. Сущностью подобного типа преобразований, собственно, и являются относительные периодические во времени смещения контролируемых объектов в пространстве растра на светочувствительной поверхности датчика сигнала. При этом характерны изменения положения объекта по отношению к оптической оси. Масштабные изменения координат затрагивают в таком случае и угол точки. Рассмотрим, например, оператор F смещения воздействия в ОС: X = x + ρ(t) cos φ(t); x = X − ρ(t) cos φ(t), Y = y + ρ(t) sin φ(t); y = Y − ρ(t) sin φ(t), t = t. (18.1) Исходное воздействие O(x, y, t) представим в виде O(x, y, t) = OI (x, y, t) + OII (−x, y, t) + OIII (x, −y, t) + OIV (−x, −y, t), 0 6 x < ∞; 0 6 y < ∞; 0 6 t < ∞. ∂(x, y, t) = 1. ∂(X, Y, t) Проанализируем частный вариант (частный оператор F0 ) соотношения (18.1), когда Найдем якобиан ℑc = X = x − a cos φ sin ω0 t; Y = y − a sin φ cos ω0 t; x = X + a cos φ sin ω0 t; y = Y + a sin φ sin ω0 t. (18.2) Здесь a = const; ω0 = const — фиксированное значение частоты. Будем считать, что исходному воздействию O(x, y), т. е. при a = 0
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 533 Глава 18. Преобразования структуры спектра изображения (в соотношении (18.2)) соответствует спектр S(ωx , ωy ). Тогда воздействию, преобразованному с использованием частного оператора F0 , соответствует спектр SP (ωx , ωy , ω) = ∫∫∫ O(X, Y, t) exp(−jωx a cos φ sin ω0 t − jωy a sin φ sin ω0 t)× = Gi × exp(−jωx X − jωy Y − jωt) dXdY dt (18.3) Известно, что exp(±iz sin t) = ± ∞ ∑ Jm (z) exp(±imt) = m=−∞ = J0 (z) + 2 ∞ ∑ [J2k (z) cos 2kt ± iJ2k−1 (z) sin(2k − 1)t]. (18.4) k=1 Принимая во внимание (18.4), представим выражение (18.3) следующим образом: ∫∫∫ × SP (ωx , ωy , ω) = J0 (ωx a cos φ + ωy a sin φ)× O(X, Y, t) exp(−jωx X − jωy Y ) exp(−jωt) dXdY dt+ Gi ∫∫∫ + { O(X, Y, t) 2 Gi ∞ ∑ [J2k (ωx a cos φ + ωy a sin φ) cos 2kω0 t− k=1 − jJ2k−1 (ωx a cos φ + ωy a sin φ) sin[(2k − 1)ω0 t)]} × × exp(−jωx X − jωy Y − jωt) dXdY dt. (18.5) Будем считать, что граничное значение частоты трёхмерного спектра воздействия по временному направлению отражается значением ωg < 0,5ω0 . При выполнении данного условия появляется возможность разделения слагаемых в соотношении для спектра (18.5). В частности, селекция первого слагаемого, т. е. низкочастотной составляющей спектра по временному направлению, может в данном случае практически осуществляться за счёт подавления временных составляющих спектра, превышающих значение 0,5ω0 . В реальных СТВ необходимое подавление второго слагаемого (высокочастотной составляющей спектра по временному направлению) обеспечивается за счёт использования накопления потенциального рельефа (обеспечивается подавление верхних частот временной составлящей исходного многомерного спектра) формируемого на выходе ПСС сигнала изображения во времени в пределах кадров ТВ сигнала. В общем случае
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 534 Часть V. Цифровое преобразование изображений в телевидении процессу накопления, например, с прямоугольной импульсной характеристикой (типа rect(t/0,5Tn )) соответствует ограничение протяжённости спектра по временному направлению, специфика которого определяется функцией sinc(ω0,5Tn ). При разработке конкретных решений по разделению рассмотренных составляющих следует учитывать возможности реализации в СТВ ограничений протяжённости временного спектра сигнала изображений как при накоплении потенциального рельефа в ПСС, так и с использованием специальных фильтров в электрическом тракте ПСС. Если, таким образом, частота среза (ωs ) фильтра низких частот по временному направлению, осуществляющего разделение указанных низкочастотной и высокочастотной составляющих, соответствует требованию ωg < ωs 6 0,5ω0 , то выделяют низкочастотную пространственную составляющую спектра преобразованной видеоинформации ∫∫∫ × SP (ωx , ωy , ω) = J0 (ωx a cos φ + ωy a sin φ)× O(X, Y, t) exp(−jωx X − jωy Y ) exp(−jωt)dXdY dt = Gi = J0 (ωx a cos φ + ωy a sin φ)S(ωx , ωy ). (18.6) В соответствии с соотношением (18.6) пространственный спектр выделенной низкочастотной (по временному направлению) составляющей отличается от спектра исходного воздействия умножением на функцию нулевого порядка J0 (ωx a cos φ + ωy a sin φ). Графики некоторых из функций Бесселя относительно низкого порядка представлены на Ðèñ. 18.1. Графики функций Бесселя рис. 18.1. Общий вид функции Бесселя J0 (z), представленной на рис. 18.1, свидетельствует о том, что её уровень существенно падает с увеличением аргумента z. За счёт этого имеет место уменьшение протяженности исходного пространственного спектра видеоиформационного воздействия (видеоинформации). Следовательно, заданные изменения во времени фазы трансформируются при использовании накопления (низкочастотной фильтрации по временному направлению) в ограничения пространственного спектра видеоинформации. На физическом уровне это объяснимо. Фактически в данном случае имеет место относительное падение энергии разностных (для из-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 535 менений во времени положений воздействия) пространственных составляющих видеоинформации, обусловленное наличием усреднения во времени. Наличие таких составляющих сопряжено, в первую очередь, с тонкой пространственной структурой поступающей видеоинформации. Проанализируем специфику возникающих ограничений протяжённости пространственного спектра видеоинформации. Амплитуда функции J0 (ωx a cos φ + ωy a sin φ), определяющей указанные изменения пространственного спектра, зависит от аргумента z = ωx a cos φ + + ωy a sin φ. В частотном пространстве определим местоположение максимальных значений аргумента z. Соответственно, находим: dz = −ωx a sin φ + ωy a cos φ = 0; dt ωy = ωx tg φ. (18.7) Местоположение нулевых значений аргумента z определим из уравнения: z = ωx a cos φ + ωy a sin φ = 0; (18.8) ωy = ωx ctg φ = ωx tg(φ + 0,5π). Следовательно, максимальная величина ограничения в частотном пространстве протяжённости пространственного спектра локализована в рассматриваемом случае в пределах линии ωy = ωx tg φ, т. е. совпадает с направлением изменения положения воздействия во времени. В ортогональном указанному направлении, т. е. согласно (18.8) по линии ωy = ωx tg(φ + 0, 5π), протяжённость пространственного спектра не затрагивается и остаётся эквивалентна исходной. Рассмотренная специфика действия фазо-временных преобразований выявляет возможность локальных в области пространственных частот ограничивающих преобразований структуры сечения (по фиксированному уровню) характеристики пространственного спектра сигналов изображений в СТВ. Изотропная форма структуры такого сечения может быть трансформирована в анизотропную. На рис. 18.2,a, в частности, показан идеализированный вариант изменения фазы проецируемого видеоинформационного воздействия (траектория движения отдельной фиксированной точки воздействия) во времени. Показанные изменения фазы периодически повторяются с достаточно высокой частотой. В режиме накопления сигнала изображения во времени возникают изменения в структуре сечения пространственного спектра сигнала изображения. Специфика действия данного частного варианта фазо-временных преобразований на форму такого сечения качественно представлены графиками рис. 18.2,b, первый из которых
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 536 Часть V. Цифровое преобразование изображений в телевидении Фазо-временные преобразования видеоинформационного сигнала: a — траектория изменения фазы анализа сигнала в ПСС; b — форма сечения, по фиксированному пороговому уровню, пространственного спектра исходного (1) и преобразованного (2) сигналов Ðèñ. 18.2. Варианты микросмещений видеоинформационного сигнала во времени по взаимоортогональным траекториям Ðèñ. 18.3. соответствует исходному, а второй — преобразованному видеоинформационному воздействию. Необходимые периодические во времени изменения относительной фазы видеоинформационного воздействия могут быть реализованы за счёт раздельного управления его относительным положением, например, по горизонтали и вертикали. Другой вариант реализации траектории относительных перемещений отличается тем, что последовательные микросмещения выполняют лишь в заданных направлениях. Причём относительные смещения воздействий по каждому из направлений могут осуществляться раздельно во времени и с возвратом в исходное (x = 0, y = 0) положение. В качестве иллюстрации на рис. 18.3,a показаны две взаимоортогональные траектории под углом в 45◦ и 135◦ к оси 0x. Динамические вариации параметрами относительных микросмещений (a, φ, ω0 ) позволяют адаптивно изменять характеристики СТВ. Одним из подобных вариантов является введение микросмещений в моментах передачи фрагментов изображений, провоцирующих появление перекрёстных искажений между составляющими спектра структуры дискретизации (матрицы светочувствительных элементов ПСС) и составляющими пространственного спектра видеоинформационного воздействия. Прототипом подобных решений является вариант, предложенный в [106]. Перспективным следует также признать использование относительных микросмещений для адаптивного увеличения разрешающей способности матричных ПСС за счёт увеличения частоты последовательных считываний во времени со смещением относительного положения и накопления всей результирующей совокупости последовательно во времени анализируемых отсчётов видеоинформации в цифровом запоминающем устройстве [117, 118].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 537 При реализации СТВ подобного типа несущее высокочастотное колебание частоты ω0 , входящее в структуру оператора F0 (соотношение (18.2)), может модулироваться во времени по амплитуде (показано на рис. 18.3,b) с сопутствующими изменениями характеристик преобразования пространственного спектра, соответствующего текущему сигналу изображения. Представленные в данном разделе результаты и соотношения обеспечивают основу для расчёта характеристик преобразования пространственного спектра в системах с реализацией микросмещений по конкретным траекториям и с конкретными частотами перемещений. Практическая реализация подобных решений может обеспечить существенное увеличение эффективности функционирования современных ПСС. 18.2. Амплитудные и амплитудно-частотные преобразования характеристик сигналов изображений в системах телевидения В ТВ системе входное видеоинформационное воздействие претерпевает многочисленные параллельно-последовательные преобразования. Схема формирования сигнала изображения в ПСС ТВ системы показана на рис. 18.4. Первоначально указанное воздействие попадает в оптическую систему (ОС), которая обладает определенной двумерной частотно-контрастной характеристикой и работает как пространственный фильтр низких частот. Из-за действия операторов на входное видеоинформационное воздействие, как было показано в предшествющем разделе, в ОС имеют место масштабные, амплитудно-пространственные и амплитудно-частотные преобразования в реальной и спектральной областях. Одними из важных операторов, действующих во входной части ОС, являются низкочастотные в пространстве операторы мультипликативного типа [90]. Рассмотрим влияние данных операторов на структуру оптического воздействия. Воздействие на входе ОС может быть представлено в виде суммы средней и переменной составляющих: O(x, y, t) = F0 + F (x, y, t), где F0 — средняя составляющая воздействия, а F (x, y, t) — переменная составляющая. Для случая статического во времени варианта работы общий коэффициент передачи ОС является функцией, которая зависит от аргументов x, y и пространственных частот ωx , ωy и может быть определён произведением KПОС (x, y, ωx , ωy ) = KОС (x, y)KПЧХ (x, y, ωx , ωy )e−jφ(ωx ,ωy ) , где KОС (x, y) — зависимость коэффициента передачи от координат x, y в плоскости изображений; KПЧХ (x, y, ωx , ωy ) — зависимость ко-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 538 Часть V. Цифровое преобразование изображений в телевидении Ðèñ. 18.4. Схема формирования сигнала изображения в преобразователе «светсигнал» эффициента передачи от пространственной частоты в точке плоскости изображения с координатами x, y; φ(ωx , ωy ) — фазовая характеристика ОС. При ωx → 0 и ωy → 0 величина KПОС практически определяется изменениями KОС (x, y) в плоскости изображения (в пределах внутрикадрового пространства), т. е. KПОС (x, y, ωx , ωy ) ≈ KОС (x, y). Тогда воздействие на выходе ОС описывается выражением OП (x, y, t) = O(x, y, t)KОС (x, y) = F0 KОС (x, y) + F (x, y, t)KОС (x, y). (18.9) Обозначим спектр функции (из соотношения (18.9)) KОС (x, y) → Sk (ωx , ωy ) как Sk (ωx , ωy ), а спектр функции F (x, y, t) как V (ωx , ωy , ω). Тогда результирующий спектр воздействия на выходе ОС отражается следующим образом: SП (ωx , ωy , ω) = F0 Sk (ωx , ωy ) + V (ωx , ωy , ω) ⊗ Sk (ωx , ωy ). (18.10) Таким образом, зависимость коэффициента передачи KОС (x, y) от координат x, y в плоскости изображения сопровождается появлением аддитивной и мультипликативной мешающих преобразований составляющих воздействий на выходе ОС, структура которых определяется видом KОС (x, y). Первая составляющая выражения (18.10) иллюстрирует появление низкочастотных искажений фона, а вторая — интегрального усреднения (искажений) тонкой структуры спектра видеоинформационного воздействия. Чем шире спектр пространственной неравномерности коэффициента передачи ОС, тем больше степень указанных интегральных искажений пространственного спектра видеоинформации, обусловленных влиянием ОС. Особенно существенно влияние неравномерности затрагивает форму таких составляющих изображений, как периодические структуры фиксированной пространственной час-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 539 тоты. Здесь возникают ассиметричные искажения формы и интенсивности соответствующих изображений. Искажения могут быть устранены коррекцией в электрическом тракте, но сохраняется сопутствующее данному фактору ухудшение отношения сигнал/шум, связанное с неэффективным использованием на краях внутрикадрового пространства амплитудного диапазона преобразователей «свет-сигнал». Из-за низкочастотных искажений ТВ изображения на совокупность смежных фоновых блоков накладываются низкоградиентные изменения сигнала фона по всем направлениям внутрикадрового пространства. Интенсивность соответствующих спектральных составляющих не является высокой и зависит от точности компенсации аддитивных искажений в ТВ камерах. К сожалению, высокая точность компенсации чаще всего достигается в современных преобразователях «свет-сигнал» лишь для фиксированной освещенности сцены. Изменения средней освещенности по отношению к данному уровню в реальных условиях обусловливает нарушение точности компенсации во внутрикадровом пространстве, что проявляется появлением участков фона с низкоградиентными изменениями уровня во внутрикадровом пространстве по отношению к среднему (интегральному) варианту компенсирующего сигнала. В результате появляются низкочастотные, по отношению к среднему уровню, изменения фона по фазе, т. е. колебательного типа при фиксированной освещенности сцены. Следовательно, в исходных изображениях во внутрикадровом пространстве существуют области смежных блоков, для которых характерны малоинтенсивные (колебательного типа) изменения фона, практически незаметные для зрительной системы человека. Составляющие пространственного спектра, отражающие эти изменения, отличаются по уровню в смежных блоках. Для фиксированной степени сжатия по стандарту JPEG будет характерно полное пороговое подавление аддитивных низкочастотных составляющих спектра в тех областях внутрикадрового пространства, для которых характерно наличие экстремумов функций остаточных аддитивных искажений. В пределах таких областей и может возникать ложная граница относительно большой протяжённости, связанная со спецификой кодирования по стандарту JPEG и обусловленная, в частности, полным подавлением второй, третьей и т. д. гармоник низкочастотных составляющих соотношения (18.10). Большая протяжённость во внутрикадровом пространстве определяет увеличение заметности подобного типа искажений. Таким образом, в системах цифрового вещательного телевидения остаточные аддитивные искажения преобразуются в более крупные (во внутрикадровом пространстве) области фоновых (ступенчатого типа) искажений исходного изображения. Соответственно, при-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 540 Часть V. Цифровое преобразование изображений в телевидении менение цифрового вещательного телевидения диктует ужесточение требований к ТВ камерам по точности компенсации фоновых искажений. При этом используемые методы компенсации не должны приводить к появлению ложных, протяженных или локальных экстремумов в структуре фона. С другой стороны, должны быть разработаны методы целенаправленной компенсации блочной структуры, возникающей в подобных участках внутрикадровой структуры текущих телевизионных изображений. Наряду с фоновыми искажениями в ОС возникают искажения, обусловленные изменением степени фокусировки с удалением координат точки от точки пересечения оптической оси ОС со светочувствительной поверхностью ТВ камеры. Ухудшение фокусировки на краях мишени отражено в коэффициенте передачи ОС зависимостью площади пространственной частотной составляющей KПЧХ (x, y, ωx , ωy ) от координат во внутрикадровом пространстве. На краях растра площадь KПЧХ (x, y, ωx , ωy ) и, следовательно, уровень мелкой структуры изображений снижаются. Это обусловливает при сжатии по стандарту JPEG возрастание в этой области искажений мелкой структуры изображений, которые проявляются сопутствующими снижениями контрастности и появлением «ложных» границ в смежных блоках. Апертурная коррекция в общем случае не спасает положение изза увеличения в пределах соответствующих блоков уровня шумовых составляющих. Её применение даёт эффект лишь в сочетании с предварительной противошумовой обработкой скорректированного сигнала изображения. Сигнал с выхода ОС подвергается в ТВ камере пространственной и цветовой дискретизации. В современных телевизионных системах различного назначения, как правило, применяются матричные преобразователи «свет-сигнал» на приборах с зарядовой связью (матрица ПЗС) и фоточувствительных КМОП-матрицах. Светочувствительная поверхность этих преобразователей представляет собой дискретную квазипериодическую структуру светочувствительных элементов, которые осуществляют преобразование входного воздействия в электрический сигнал. Уровень вносимых при этом нелинейных искажений определяется пространственно-частотной характеристикой распределения светочувствительных элементов растра матрицы ПЗС. Соответственно, в пределах растра реализуют дискретизацию с параллельной низкочастотной фильтрацией входного воздействия (формирование отсчётов воздействия) как во времени (межкадровое или временное направление), так и в пространстве (внутрикадровое) направление. Первая, по временному направлению, определяется постоянной времени и временем накопления заряда, а в пространстве —
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 541 относительными размерами элемента и изменением чувствительности в его пределах [63]. Из-за реализации светочувствительным элементом нескольких функций каждая из них выполняется неоптимальным образом, в частности пространственная частотная характеристика преобразователя далека от характеристики идеального пространственного ФНЧ с частотой среза, соответствующей теореме Котельникова. Аналогичным образом далека от идеальной, как было показано в предшествующем разделе, и низкочастотная фильтрация по временному направлению. В связи с этим, зачастую, на изображении можно наблюдать муаровые (нелинейного типа) эффекты, причиной которых является субдискретизация входного воздействия. В ТВ системах со сжатием спектра данное явление снижает эффективность видеокомпрессии, поскольку спектр на выходе датчика ТВ сигнала существенно обогащается. Указанные эффекты могут быть устранены, например, по пространственному направлению за счет установки перед светочувствительной матрицей пространственного фильтра с соответствующей характеристикой, взаимной обработкой отсчетов и др. Реализация перечисленных мер может быть осуществлена лишь с учётом аналитического выражения для пространственной характеристики структуры элементов светочувствительной матрицы. Анализ пространственно-частотных характеристик распределения светочувствительных элементов в пределах растра матрицы ПЗС осуществим с использованием элементов теории пространственной дискретизации сигналов изображений [49, 52, 63]. Число распределённых по растру светочувствительных элементов матрицы ПЗС определяется при стандартной четкости значением nr = nx ny = 768 × 576, (18.11) где nx , ny — число светочувствительных элементов в пределах растра, по каждой строке и каждому столбцу матрицы соответственно. Спецификой распределения элементов, соответствующего соотношению (18.11), являются ортогональная структура и чётное число светочувствительных элементов в пределах строк и столбцов. Это несколько затрудняет решение задачи анализа пространственно-частотных характеристик распределения светочувствительных элементов в пределах растра матрицы ПЗС. Поэтому первоначально в качестве опорной используем матрицу с нечётным числом элементов: nr0 = (2nx + 1) × (2nx + 1) = nx0 × ny0 = 1537 × 1153. (18.12) Получим выражение для опорной сетки отсчетов такого идеализированного варианта распределения светочувствительных элемен-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 542 Часть V. Цифровое преобразование изображений в телевидении тов: ∑ µ=nx0 d0 (x, y) = η=ny0 ∑ δ(x − µx0 )δ(y − ηy0 ), (18.13) µ=−nx0 η=−ny 0 где x0 = X0 /(2nx0 + 1), y0 = Y0 /(2ny0 + 1) —- периоды следования элементов пространственной дискретизации; X0 , Y0 — протяжённости растров в пределах светочувствительной поверхности матрицы ПЗС по горизонтальному и вертикальному направлениям соответственно. Характеристика спектра идеализированной структуры с нечётным числом элементов, удовлетворяющей выражениям (18.12) и (18.13), может быть представлена следующим образом: (2nx0 + 1) (2ny0 + 1) ωx x0 sin ωx y0 2 2 D0 (ωx ωy ) = . (18.14) ωx x0 ωy y0 sin sin 2 2 Матрицу дискретизации с числом элементов nr0 удобно определить в виде произведения двух одномерных структур дискретизации с чётным числом элементов. Одна из этих структур ориентирована в горизонтальном по растру направлении, а другая — в вертикальном. Чётное число элементов при этом получим вычитанием двух нечётных структур дискретизации: sin nx0 = 2nx1 = (2nx0 + 1) − (2nx1 + 1) = = (2768 + 1) − (2384 + 1) = 1537 − 769 = 768; ny0 = 2ny1 = (2ny0 + 1) − (2ny1 + 1) = (18.15) = (2576 + 1) − (2288 + 1) = 1153 − 577 = 576. Матрица светочувствительных элементов формально может быть представлена в виде свёртки функции отдельного элемента с рассматриваемой структурой дискретизации. Если считать, что светочувствительный элемент матрицы ПЗС имеет форму прямоугольника, а размер светочувствительного элемента по горизонтали и вертикали отражается соответственно величинами χ = x0 /α, φ = y0 /β, α > 1, β > 1, то указанная функция элемента может быть представлена соотношением ( ) ( ) ( ) ( ) 2x 2y 2αx 2βy H(x, y) = rect rect = rect rect . (18.16) χ φ x0 y0 Согласно структуре соотношений (18.14), (18.15) и (18.16) и в соответствии со свойствами преобразования Фурье получим общее выражение для относительной характеристики спектра идеализированной структуры распределения элементов в пределах растра мат-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 543 Пространственный спектр дискретизации структуры матрицы с учетом формы и размеров светочувствительного элемента (a) и его сечения плоскостями: b — горизонтальной; v — под углом 45◦ к горизонтали Ðèñ. 18.5. рицы ПЗС:  (2nx + 1) (2ny + 1) ωx x0 sin ω y y0 sin 1  2 2 Dr (ωx , ωy ) = −  ωx x0 ω y y0 768 · 576 sin sin 2 2 (2nx + 1) (2ny + 1) ωy y0 sin ωx x0 sin((nx + 1)ωx x0 ) sin 2 2 − − × ωy y0 ωx x0 sin ωx x0 sin sin 2 2 ] sin((ny + 1)ωy y0 ) sin((nx + 1)ωx x0 ) sin((ny + 1)ωy y0 ) × + × sin ωy y0 sin ωx x0 sin ωy y0 ωx x0 sin ωy y0 sin 2β 2α × ωx x (18.17) ω y y0 . 0 2α 2β Для варианта α = β = 2 на рис. 18.5 представлены двумерная функция характеристики Dr (ωx , ωy ) и варианты сечений данной функции под углами в пространстве растра φ0 = 0 и 45◦ к горизонтали. Как преимущество выбора чётной структуры дискретизации следует отметить изменение полярности гармоник её спектра. Можно также заметить, что в данном случае остается значительной величина второго лепестка спектра. В реальных камерах с величиной второго и более далёких лепестков спектра функции дискретизации сопряжено пересечение спектральных составляющих дискретизированной видеоинформации, локализованных в области смежных лепестков спектра. При недостаточной степени подавления высокочастотных составляющих пространственного спектра видеоинформации до дискретизации указанные пересечения составляющих при воспроизведении приводят к возникновению существенных нелинейных искажений разнообразных по протяжённости элементов пространственной структуры изображений, в том числе и фона.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 544 Часть V. Цифровое преобразование изображений в телевидении В современных системах цифрового телевидения сигнал изображения с выхода ТВ камеры (см. рис. 18.4) подвергают, как уже отмечалось, сжатию. Существующие методы сжатия спектра сигналов изображений обеспечивают сокращение психофизиологической и статистической избыточности. При реализации сжатия, в частности, по стандарту MPEG учитывается следующее. 1. В структуре пространственно-временного спектра независимых фрагментов текущих телевизионных изображений может быть существенно ограничена точность передачи высокочастотных составляющих (ВЧ) без заметного снижения визуального качества воспроизводимых изображений; 2, При переходу к пространственному спектру блоков пикселей (ДКП) получают упорядоченную матрицу распределения коэффициентов спектра в зависмости от значений соответсвующих частот по горизонтальному и вертикальному наравлениям. 3. Квантование коэффициентов пространственного спектра позволяет адаптивно снижать точность передачи малоинтенсивных и ВЧ составляющих в пределах соответствующих фрагментов, относительный вклад которых в субъективную оценку визуального качества соответствующего изображения не является существенным; 3. При переходе к пространственному спектру фрагментов (ДКП) эффективно решается вопрос декорреляции изображения и обеспечивается реализация статистического кодирования. Начальный этап процесса кодирования содержит преобразование матрицы отсчётов изображения X в матрицу коэффициентов Y = = F (X), где F — некоторое обратимое преобразование. Декодирование осуществляется применением обратного преобразования: X̂ = = F −1 (Ŷ ). Преобразование F выполняется наиболее часто линейным преобразованием вида Y = F (X) = AХ, где А — матрица, определяющая линейное преобразование F . Сами по себе унитарные дискретные преобразования определены над функциями, имеющими дискретную область определения, но непрерывную область значений, т. е. значения, характеризующие уровни пикселей (элемент изображения при дискретизации) и величины компонентов преобразования, могут быть и нецелочисленными. В самом общем случае процесс квантования – это осуществление нелинейного преобразования, характеристика которого имеет вид монотонной ступенчатой функции: Q = round(Y /k), где round(·) — операция округления результатa до ближайшего целого; k — коэффициент преобразования. Деквантование можно представить в виде Ŷ = kQ.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 545 После квантования компоненты преобразований группируются в определённой последовательности, а затем кодируются хаффмановским или арифметическим кодерами. В результате такого кодирования квантованная последовательность компонентов преобразования, являющаяся последовательностью двоичных символов Q = {q1 , q2 , . . . , qi }, трансформируется в кодированную последовательность Ck = = {c1 , c2 , ·, cj }, для которой i > j, т. е. Ck содержит меньшее число двоичных символов, например, для последующей передачи их по каналу связи. Таким образом, существенно устраняется статистическая избыточность в последовательности символов, получаемой после энтропийного кодирования. пределы независимых блоков (фрагментов) 8×8 отсчётов (пикселей), в общем случае представляют собой суперпозицию независимых структурных составляющих, функции распределения пространственных спектров которых могут существенно отличаться по уровню и протяжённости. Реализация преобразования общего спектра блока по стандарту MPEG-2 отражается в таком случае неэквивалентностью изменений параметров функций спектров отдельных составляющих. Весьма существенно деградирует спектр составляющих, имеющих в пространстве блока низкую интенсивность и протяжённость (площадь), что обусловливает ещё большее снижение относительного веса (доли) их спектра в общей его структуре. Сама операция квантования спектра таких составляющих сопровождается не только резким изменением (нелинейного типа) характера огибающей спектра, но и значительным уменьшением его объёма. Фактически их спектральные компаненты сохраняются (практически стробируются) лишь на тех частотах, где коэффициенты суммарного спектра превышают заданный порогом квантования уровень. В результате в пределах отдельных блоков имеют место перекрёстного типа искажения между спектрами независимых составляющих структуры изображения в блоке. К тому же относительно резкое ограничение общей протяженности спектра независимых блоков при увеличении степени сжатия трансформируется в падение чёткости и появление выбросов на границах в пространственной структуре ТВ изображений. В связи со всем этим резко расширяется набор возможных искажений и дефектов изображений в пределах блока при увеличении степени сжатия. При этом эквивалентность структуры изображений в смежных блоках может приводить к возрастанию во внутрикадровом пространстве протяженности однотипных искажений и, соответственно, к существенному возрастанию их заметности. Не менее заметны искажения (ступенчатого типа) при передаче низкоградиентных изменений фона. Эти изменения отражаются низкоуровневыми гармониками спектра, которые подавляются при реализации квантования.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 546 Часть V. Цифровое преобразование изображений в телевидении Характерными для сжатии по стандарту MPEG являются искажения изображений движущихся объектов, которые возникают на границах, ортогональных направлению движения. С изменением положения границы в смежных кадрах сопряжено последовательные (в межкадровом направлении) изменения искажений структуры изображения в пределах ансамбля блоков, отражающих передачу данной границы. Такие изменения качества передачи границы могут проявляться возникновением низкочастотных пульсаций составляющих её изображения, частота которых зависит также от скорости движения проекции объекта во внутрикадровом пространстве. Кроме того, для сжатия по стандарту MPEG свойственно появление ряда других искажений, обусловленных, например, неточностью оценки сигнала вектора движения, зависимостью их величины от положения деталей изображения по отношению к структуре блоков, пространственно-ступенчатой аппроксимацией деталей изображений, сопоставимых по размеру с блоком, укрупнением протяжённости помех по межкадровому направлению и т. д. Коррекция выявленных искажений сжатия, особенно на этапе декодирования, является существенным резервом для увеличения качественных характеристик и эффективности функционирования систем вещательного цифрового телевидения. Результаты данного раздела могут использоваться при конкретизировании отдельные направления коррекции искажений изображений, свяэанных со сжатием спектра по стандарту MPEG. Контрольные вопросы 1. Какие преобразования пространственного спектра видеоинформации реализуются в оптической системе современных систем телевидения? 2. Определите специфику масштабных искажений, характерных для современных систем телевидения. 3. Для какого диапазона углов поля зрения пребразователя «свет-сигнал» характерно существенное возрастание масштабных и интегрально-пространственных искаженний? 4. Как изменяется пространственный спектр объектов на периферийных участках внутрикадрового пространства при значительных углах поля зрения преобразователя «свет-сигнал»? 5. Конкретизируйте возможные типы фазо-временных пребразований спектра исходной видеоинформации при видеоконтроле и приведите примеры. 6. Как прослеживание влияет на пространственн-временную структуру спектра сигнала ТВ изображения контролируемого подвижного объекта и окружающего фона? 7. Поясните физические основы возникновения пространственной низкочастотной фильтрации исходного спектра сигнала изображений в режиме видеоконтроля с относительными микросмещениями, частота которых существенно превышает частоту кадров? 8. Рассмотрите возможные варианты реализации микросмещений в системах телевидения.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 18. Преобразования структуры спектра изображения 547 9. Как изменяется характеристика сечения пространственного спектра сигнала ТВ изображения по фиксированному уровню в режиме виеоконтроля с высокочастотными микрсмещениями? 10. Рассмотрите возможность увеличения пространственной разрешающей способности видеоконтроля с использванием относительных микросмещений и цифрового запоминающего устройства. 11. Конкретизируйте с математическим обоснованием причины возникновения амплитудных (неравномерности фона и уровня) искажений сигналов ТВ изображений. 12. Определите преобразования спектра сигналов ТВ изображений, которые реализуются при сжатии спектра по стандарту MPEG. 13. Какие искажения пространственного спектра независимых блоков зарактерны сжатию по стандарту MPEG? 14. Какими методами в современных системах цифрового телевидения снижают заметность искажений, возникающих при увеличении степени сжатия спектра сигналов ТВ изображений по стандарту MPEG?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» × à ñ ò ü VI ЦИФРОВЫЕ СИСТЕМЫ ТВ ВЕЩАНИЯ 19 ПЕРЕДАЧА ТЕЛЕВИЗИОННОГО СИГНАЛА В ЦИФРОВОЙ ФОРМЕ ПО КАНАЛУ СВЯЗИ 19.1. Формирование потоков цифрового ТВ сигнала В вещательном телевидении кодирование сигнала осуществляется по стандарту MPEG-2 или MPEG-4. Этот стандарт регламентирует также форму «упаковки» всех видов информации, которая должна быть передана в составе ТВ программы — изображение, звук и дополнительные данные. При формировании единого потока данных стандарт MPEG-2 предусматривает две формы такого потока — программный и транспортный. Оба потока состоят из элементарных пакетных потоков (PES), состоящих, в свою очередь, из отдельных пакетов. В начале заголовка каждого пакета (PES-пакета) содержатся информация идентификации потока, сведения о принадлежности его к определенной программе. В заголовок может быть также включена дополнительная информация — об авторских правах, о правах доступа, о приоритете и т. д. Кроме того, для синхронизации потоков в процессе декодирования в заголовок пакетов включаются метки времени представления (PTS) и метки времени декодирования (DTS). 19.2. Канальное кодирование Как известно, само по себе представление сигнала в цифровой форме еще не означает повышение помехоустойчивости передачи по сравнению с аналоговым сигналом. В свою очередь, последствия воздействия помех на цифровой сигнал зависят от того, какая его часть
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 549 поражена помехой. Ошибка, которая может появиться, например, при передаче старшего разряда кодового слова, может иметь более серьезные последствия для качества передаваемого изображения, чем ошибка при передаче одного элемента изображения в аналоговом телевидении. В процессе передачи информация подвергается кодированию. Существуют разные способы кодирования, предназначенные для решения требуемых задач. Например, есть способы кодирования для исключения несанкционированного получения информации, существуют и другие задачи кодирования. Следует отметить кодирование источника, которое имеет основной целью сокращение цифрового потока при передаче на основании свойств источника информации. Существует еще и так называемое канальное кодирование. Оно позволяет, зная статистические свойства помех, закодировать передаваемую информацию таким образом, чтобы отрицательные последствия от действия помех были минимальны. Канальное кодирование, таким образом, необходимо исключительно для повышения помехоустойчивости передачи информации на приемную сторону. Принцип канального кодирования заключается в использовании специальных кодов, предполагающих добавление к передаваемому сигналу избыточной информации. Простейший пример такого кодирования — добавление к передаваемому кодовому слову дополнительного разряда, позволяющего осуществить так называемую проверку на чётность. Однако эта проверка является достаточно примитивной — она позволяет лишь обнаружить наличие ошибки в передаваемой кодовой последовательности, но не скорректировать ее. Существуют коды, позволяющие не только обнаруживать ошибки при передаче, но и исправлять их (рис. 19.1). Коды, корректирующие ошибки передачи, применяются последовательно, с учетом их различных свойств и способности корректировать ошибки различного характера. При этом код, применяемый на передающей стороне первым, должен декодироваться на приемной стороне в последнею очередь. Такой код называется внешним. Возможная последовательность операций по отношению к передаваемому цифровому ТВ сигналу для коррекции ошибок передачи показана на рис. 19.2. Ðèñ. 19.1. Принцип канального кодирования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 550 Часть VI. Цифровые системы ТВ вещания Ðèñ. 19.2. Коррекция ошибок в цифровом ТВ сигнале Применение нескольких канальных кодеков позволяет повысить помехозащищенность передачи и, что очень важно, корректировать так называемые пакетные ошибки, которые представляют собой последовательность большого количества идущих друг за другом ошибочных посылок. Например, благодаря использованию буферной памяти между внешним и внутренним канальными кодеками и чередованию направлений записи в память и считывания из нее, достигается перемежение символов и возможность коррекции сравнительно большой пакетной ошибки. Биты передаваемой информации, которые перед передачей были смежными во времени, в результате такого перемежения удаляются в процессе передачи по каналу с помехами. На приемной стороне также имеется буферная память, осуществляющая обратное перемежение. В результате участки воздействия длительных помех, возникших в канале связи, перестают быть смежными и удаляются друг от друга. Это происходит до поступления сигнала на декодер внешнего кода и позволяет скорректировать такие сокращённые по длительности участки пакетной ошибки. В качестве внешнего кода обычно используется код Рида–Соломона (Reed–Solomon Code, RS), который требует двух проверочных символов на одну исправляемую ошибку [84]. В процессе кодирования кодом Рида–Соломона, используемым для передачи цифрового ТВ сигнала, на каждый пакет общего транспортного потока длиной 188 байт добавляется 16 проверочных байт. Получается новый пакет, содержащий необходимую избыточность и имеющий длину 204 байта. Это позволяет исправить 8 байт, искаженных помехой в процессе передачи. Такой код в литературе обозначают (204, 188, 8) [140]. Внутреннее кодирование также часто осуществляют с помощью сверточных кодов. Более подробную информацию о помехоустойчивом кодировании, использующем коды Рида–Соломона и сверточные коды, можно найти в [18, 84]. 19.3. Цифровые способы модуляции Свойства цифрового сигнала (с выхода АЦП) не позволяют передавать такой сигнал по каналу связи непосредственно, т. е. в первич-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 551 ной полосе частот из-за слишком высокой скорости передачи, оцениваемой в сотни мегабит в секунду. При модуляции несущей импульсами модулируемый параметр (амплитуда, фаза, частота) принимает ряд дискретных значений: A1 , A2 , . . ., φ1 , φ2 , φ3 , . . .; f1 , f2 , . . .. Такую модуляцию называют манипуляцией. Интервал времени, в течение которого эти параметры остаются постоянными, называется интервалом канального символа. В течение символьного интервала передается один бит или одновременно несколько битов, образующих канальный символ. Для повышения эффективности использования полосы частот канальный символ должен содержать по возможности больше битов передаваемой информации. Совершенно очевидно, при этом ухудшится помехоустойчивость системы, так как приемник должен одновременно различать не два, а больше значений сигнала. Рассмотрим основные способы модуляции. Амплитудная манипуляция (АМ) заключается в дискретном изменении уровня (амплитуды) несущей. В простейшем случае — наличие несущей соответствует 1 и ее отсутствие — 0. Недостатком АМ является резкий перепад излучаемой мощности. Частотная манипуляция (ЧМ) осуществляется дискретным изменением частоты несущей при постоянной амплитуде. Недостаток — переходные процессы при скачке частоты от одного значения к другому, возникающие из-за резкого расширения в такие моменты мгновенного спектра сигнала. Фазовая манипуляция (ФМ) заключается в дискретном изменении фазы несущей. В простейшем случае несущая принимает два значения фазы: 0◦ и 180◦ . В цифровом телевидении применяют относительную фазовую манипуляцию, при которой фаза несущей для каждого принятого символа сравнивается не с абсолютной начальной фазой (например, 0◦ ), а с фазой несущей частоты предыдущего символа. Для повышения эффективного использования полосы частот канала связи применяют многопозиционную манипуляцию (АМ, ФМ). Остановимся кратко на принципах построения систем цифрового телевидения. Существующие сети ТВ вещания (спутниковые, кабельные или наземные), как правило, построены по принципу частотного уплотнения. Поэтому сигнал, предназначенный для передачи по таким сетям, должен быть точно ориентирован в принятой системе организации частотных каналов. Следует также иметь в виду, что передаваемый сигнал должен быть энергетически сосредоточен в определенной ограниченной области спектра. Как правило, несущей (модулируемой)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 552 Часть VI. Цифровые системы ТВ вещания Ðèñ. 19.3. Виды модуляции при двухпозиционном модулирующем сигнале: a — исходный сигнал; b — АМ; v — ЧМ; g — ФМ частотой является гармонический сигнал. Изменяемыми параметрами в таком случае могут быть его амплитуда, частота и фаза. Если модулирующий сигнал имеет цифровую природу и изменяется дискретно, принимая фиксированные значения, то понятие «модуляция» иногда заменяется понятием «манипуляция». Передаваемый сигнал, таким образом, в результате модуляции можно представить в следующей форме: U (t) = (Амплитуда) cos[2π(Частота)t + (Фаза)]. Использование для передачи сигналов цифрового телевидения различных видов модуляции, как известных, так и относительно новых, позволяет одновременно увеличить количество передаваемой информации в единицу времени, сократить используемую полосу частот и повысить помехоустойчивость ТВ системы. В цифровом телевидении может применяться амплитудная модуляция (АМ), в иностранной литературе применительно к цифровому сигналу называемая ASK (Amplitude Shift Keying), частотная модуляция (ЧМ), ее обозначают также FSK (Frequency Shift Keying), и фазовая модуляция (ФМ), англоязычное обозначение PSK (Phase Shift Keying). На рис. 19.3 иллюстрируется принцип работы каждого из применяемых видов модуляции для двухпозиционного модулирующего сигнала, т. е. когда каждое состояние сигнала передает один бит информации. На рисунке также даны графики, поясняющие изменение сигнала во времени. Демодуляция рассмотренных сигналов достаточна проста в техническом отношении, и для ее осуществления известно много способов. Качество того или иного способа модуляции при передаче цифровых сигналов оценивается обычно по следующим критериям: • эффективности использования частотного спектра; • минимально необходимого отношения сигнал/помеха; • стойкости к ухудшению условий приема на отдельных частотах. Эффективность использования частотного спектра увеличивается с увеличением числа состояний, которые может принимать сигнал
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 553 при передаче одного символа. Если модулирующим сигналом является сигнал, в котором каждый символ передается не двумя, а большим количеством возможных его значений, то количество информации, передаваемое с каждым символом, возрастает. Такие значения цифрового сигнала обычно выбираются равными 2, 4, 16, 32, 64, 128 и т. д., т. е. как ряд 2n , где n — число возможных состояний передаваемого или модулирующего цифрового сигнала во время передачи одного символа. Эта эффективность оценивается величиной, измеряемой в битах в секунду на один герц (бит/с/Гц). Такая размерность показывает, что в данном случае оценивается скорость потока, приходящаяся на единицу частоты (2 бит/с = 1 Гц). Чем выше количество информации, переносимое одним символом (отсчетом), тем выше число возможных состояний, которое может принять изменяемый в процессе модуляции параметр модулированного сигнала (виды модуляции с большим числом таких состояний называют многопозиционными), и, соответственно, тем выше эффективность использования частотного спектра. Однако, чем большее число состояний может принимать модулирующий сигнал, тем меньше существует отличий в параметрах этих состояний, а значит, демодуляция такого сигнала в условиях помех может стать затруднительной. Поэтому эффективность использования частотного спектра обычно связана с возможно достижимым отношением сигнал/помеха, и при выборе этих параметров необходим компромисс [5]. Конечное уменьшение битовой скорости осуществляется с помощью современных способов модуляции. Обычная модуляция, при которой логический 0 и логическая 1 представляются двумя различными амплитудами, частотами, фазами, крайне неэффективна в отношении требований к битовой скорости и диапазону рабочих частот. В цифровом ТВ вещании используются три типа модуляции: относительная квадратурная фазовая модуляция (ОКФМн) для спутникового телевидения, квадратурная амплитудная модуляция (КАМ) для кабельного телевидения и кодированное ортогональное частотное уплотнение (COFDM — coded orthogonal frequency division multiplexing) для наземного цифрового телевидения. В спутниковом цифровом телевещании применяется тот же вид модуляции (ОКФМн), что и в системе NICAM. Четыре значения фазы: 45◦ , 135◦ , 225◦ , 315◦ , формируется двумя несущими с одинаковой частотой, расположенными под прямыми углами друг к другу. Каждая фаза используется для представления комбинации из двух битов. Для работы обычной КФМн требуется эталонный фазовый угол. В ОКФМн в качестве эталонного фазового угла используется
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 554 Часть VI. Цифровые системы ТВ вещания предыдущая фаза, причем каждое изменение фазы представляется 2-битовой комбинацией. 19.3.1. Квадратурная амплитудная модуляция КАМ (QAM) Данный способ модуляции является комбинированным и представляет собой сумму двух ортогональных несущих: косинусоидальной и синусоидальной. VQAM = Vс [c1 (t) cos ωс t + c2 (t) sin ωс t], (19.1) где Vс — амплитуда сигнала; ωс — частота несущей; c1 (t) и c2 (t) — модулирующие сигналы в квадратурных каналах. Если в (19.1) сигналы c1 (t) и c2 (t) принимают значения 1, то получаем QAM-4 (КАМ-4) четырехпозиционную QAM (рис. 19.4), где 00, 01, 10, 11 — сочетания поступающих пар битов передаваемого цифрового потока. При c1 (t), c2 (t) = ±1, ±3 поÐèñ. 19.4. Векторная диаграмма сослучаем 16-позиционную QAM тояний сигнала QAM-4 (a) и звездная (QAM-16) (рис. 19.5), которую карта (сигнальное созвездие) (b) можно описать следующим выражением: VQAM-16 (t) = 16 ∑ Ai cos(ωс t + Qi ), (19.2) i=1 где i1 = 0000; i2 = 0001; i3 = 0010; i4 = 0011;..., i14 = 1110; i15 = 1111. Такой вид модуляции можно пояснить с помощью векторной диаграммы, на которой в декартовой системе координат с вертикальной осью Q и горизонтальной осью I изображают положение конца вектора промодулированного сигнала. Векторная диаграмма сигнала для случая четырехпозиционной квадратурной амплитудной модуляции, или, как ее обозначают, 4-QAM, показана на рис. 19.4,b. Набор точек, показывающих возможное положение конца вектора сигнала на плоскости I0Q, часто называют созвездием. Каждая точка характеризуется своим сочетанием амплитуды и фазы сигнала, поэтому соответствующий каждой точке символ переносит информацию в количестве m = log2 N, где m — число битов информации, передаваемое каждым символом;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме Ðèñ. 19.5. 555 Векторная диаграмма состояния при QAM-16 (α = 1, код Грея) и QAM-64 (однородная модуляция) N — число возможных позиций вектора или точек на векторной диаграмме (рис. 19.5). На рис. 19.5,a точками показаны возможные положения концов вектора при различных значениях i. Оси координат соответствуют синфазной I и квадратурной Q составляющим сигнала. При формировании используется код Грея, в котором соседние импульсы отличаются только в одном разряде, что минимизирует вероятность ошибки. Ðèñ. 19.6. Неоднородная модуляция QAM-16: a — α = 2; b — α = 4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 556 Часть VI. Цифровые системы ТВ вещания Используются как обычные равномерные, так и неравномерные сигнальные созвездия с различными расстояниями между двумя ближайшими точками созвездия в смежных квадрантах, что количественно оценивается коэффициентом неравномерности созвездия (см. рис. 19.5 и 19.6). При очень сильном амплитудно-фазовом шуме, когда имеет место «размывание» точек сигнального созвездия, различить отдельные точки внутри квадратов становится невозможным, однако при α > 1 отношение сигнальных точек к соответствующим квадратам может быть и определено. На практике модуляция типа QAM-16 обеспечивает удельную скорость 3,9 бит/сек/Гц, а QAM-64 — 4,5 бит/сек/Гц. Пропускная способность кабельной сети с полосой канала 8 МГц составляет 38,5 Мбит/с при QAM-64. 19.3.2. Квадратурная фазовая манипуляция QPSK — дискретная фазовая манипуляция (модуляция), при которой вектор сигнала при постоянной амплитуде изменяет свою начальную фазу от символа к символу. Векторная диаграмма для QPSK-4 представлена на рис. 19.7. Обобщенная функциональная схема модулятора QPSK приведена на рис. 19.8. Ðèñ. 19.7. ВекторСхема работает следующим образом: ная диаграмма QPSK входной последовательный битовый поток поступает на преобразователь 1, на выходе которого получаем две параллельные последовательности битов X и Y , в соответствии с заданным алгоритмом работы (рис. 19.8) кодер 2 выдает сигналы Q и I, поступающие на модуляторы 3 и 4. На выходе сумматора 5 получаем модулированный сигнал QPSK, векторная диаграмма которого показана на рис. 19.7. Функциональная схема модулятора QPSK: x и y принимают значения: 1 — x = 0, y = 0: Q = 1, I = 1; 2 — x = 0, y = 1: Q = −1, I = 1; 3 — x = 1, y = 1: Q = −1, I = −1; 4 — x = 1, y = 0: Q = −1, I = −1 Ðèñ. 19.8.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 557 Нетрудно заметить, что при модуляции QAM-4 амплитуда сигнала не меняется (см. рис. 19.4), и такой случай полностью эквивалентен четырехпозиционной фазовой манипуляции QPSK-4 (рис. 19.7). Сравнение помехоустойчивости видов модуляции. Применение многопозиционной QAM способствует передаче большего количества информации, однако в реальных условиях, при наличии помех, на приемной стороне возможно ошибочное определение амплитуды и фазы передаваемого сигнала, зависящее и от специфики шума. Это обстоятельство и ограничивает количество информации передаваемого сигнала. Тем не менее, основное преимущество QAM перед другими видами модуляции — в ее относительно высокой помехозащищенности. Это видно из рис. 19.6 и 19.9, где для сравнения показаны векторные диаграммы для двух видов модуляции 16-PSK и 16-QAM. Как видно из рисунка (минимальное расстояние между смежными точками сигнального созвездия), способ модуляции QAM способен обеспечить более высокую помехоустойчивость (увеличивается указанное минимальное расстояние) передачи информации. Многопозиционная квадратурная амплитудная модуляция успешно применяется, например, в кабельных каналах, где можно значительно увеличить число позиций модуляции, так как при передаче по кабелю обеспечивается достаточно высокое отношение сигнал/помеха, минимизированы вносимые при передаче по кабельной сети амплитудные и частотные искажения группового радиосигнала. Как правило, при использовании многопозиционной QAM расстояние между соседними точками сигнального созвездия, обозначающими распределение совокупности возможных позиций векторного представления сигнала, выбирается одинаковым. Однако иной выбор расположения этих точек позволяет осуществить так называемую неоднородную квадратурную амплитудную модуляцию. С ее помощью реализуют «иерархичность» в передаче информации. На рис. 19.5,a и 19.6 показаны векторные диаграммы для способа квадратурной амплитудной модуляции 16-QAM: на рис. 19.5,a — обычная однородная модуляция 16-QAM, а на рис. 19.6 — неоднородная. Как видно из рисунка, при неоднородной модуляции допустимые положения вектора сигнала расположены на диаграмме неравномерно. При наличии помех затруднительно декодировать сигнал, у которого возможные положения вектора отделяются небольшими расстояниями на фазовой плоскости. Было найдено техническое решение — так изменять амплитуду и фазу несущей частоты в процессе модуляции, что возможные положения вектора сигнала оказываются расположенными на векторной диаграмме не равномерно, а на различных расстояниях друг от друга. При этом, очевидно, для одной части передаваемой информации при наличии помех условие декодирования улучшается, а для
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 558 Часть VI. Цифровые системы ТВ вещания Ðèñ. 19.9. Векторные диаграммы для модуляции типа PSK в отсутствие (слева) и в условиях помех (справа) другой части — осложняется, но появляется важное преимущество: часть информации, имеющая высший приоритет, декодируется без ошибок, а другая нет. Действительно, как было отмечено выше, при очень сильном шуме различить сигнальные точки внутри квадратов иногда становится невозможным. Увеличение возможных состояний для передаваемого сигнала реализуется в многопозиционной фазовой манипуляции, называемой 4(8)-QPSK (Quadrature Phase Shif Keying), или PSK. Например, при способе модуляции 8-PSK каждый символ (каждое возможное состояние передаваемого сигнала) несет уже три бита информации. Однако передача сигнала в реальных условиях связана с помехами, поэтому амплитуда и фаза передаваемого сигнала на приемной стороне может быть определена лишь с ошибкой. Если совокупности ошибок для серии последовательных измерений наносить на соответствующую векторную диаграмму (рис. 19.9), то станет ясно, что при определенной ошибке может произойти ошибочное декодирование составляющих сигнала на приемной стороне из-за возможных чрезмерных изменений (пересечений и наложений) положения смежных векторов. 19.3.3. Многоуровневая АМ (VSB) с частично подавленной боковой полосой и подавленной несущей частотой Пример АМ при передаче 8-позиционного цифрового сигнала (трехзначный двоичный код: 000, 001, 010,. . . , 111) представлен на рис. 19.10, где показана форма модулирующего и модулированного сигналов с подавленной несущей частотой.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 559 Амплитудная модуляция при передаче 8-позиционного цифрового сигнала (трехзначный двоичный код) при подавленной несущей частоте: a — модулирующий сигнал; b — модулированный сигнал с подавленной несущей Ðèñ. 19.10. При подаче на вход модулятора 8-уровневого цифрового сигнала (M = 8) обеспечивается передача log2 M = 3 бит данных одним уровнем, символом сигнала VSB: 000, 001, 010, 011, 100, 101, 110, 111. Многоуровневая АМ с кратностью М формирует сигнал с M возможными значениями амплитуды (рис. 19.10). Однако в примере, показанном на рис. 19.10, фаза может изменяться только на 180◦ , так как в спектре модулированного сигнала присутствуют обе боковые частоты, симметрично расположенные относительно несущей. При амплитудной модуляции обе эти симметричные части спектра (боковые полосы) несут одинаковую информацию, так как повторяют форму спектра модулирующего сигнала. Такая информационная избыточность в современном аналоговом телевидении
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 560 Часть VI. Цифровые системы ТВ вещания устраняется частичным подавлением одной боковой полосы частот. Этот способ передачи, называемый амплитудной модуляцией с одной боковой полосой (ОБП), в иностранной литературе обозначается аббревиатурой VSB-AM (Vestigial Sideband Modulation). Кроме того, для сокращения полосы частот радиосигнала VSBAM сокращают также полосу частот модулирующего сигнала. Делают это следующим образом. На рис. 19.10,a показан модулирующий сигнал, который представляет собой последовательность прямоугольных импульсов с длительностью tс , равной времени передачи одного цифрового символа. Такой сигнал имеет широкую полосу частот. Если эту полосу ограничить фильтром, то импульсы модулирующего сигнала потеряют прямоугольную форму и при декодировании будут создавать взаимные помехи. Если при этом, однако, воспользоваться фильтром нижних частот со специально выбранной частотой среза (фильтр Найквиста), то прямоугольные импульсы на выходе фильтра примут вид функции sinx x . При этом минимальные (нулевые) по уровню составляющие (лепестки) предыдущих, в идеальном случае, совмещёны с максимальными уровнями последующих импульсов (ортогональность). Уменьшение уровня несущей относительно боковых частот приближает этот вид модуляции к так называемой балансной модуляции, при которой энергия сигнала сосредоточена не в самой несущей, а в боковых частотах. Переворот фазы модулированного сигнала объясняется тем обстоятельством, что изменяется соотношение между амплитудами несущей и боковых частот. Подавление одной боковой полосы частот сигнала после амплитудной модуляции приводит к сокращению спектра передаваемого сигнала и, следовательно, к повышению эффективности передачи информации, хотя и несколько ухудшает помехоустойчивость передачи. Модуляция типа VSB разработана в нескольких вариантах: 2VSB, 4-VSB, 8-VSB, 16-VSB. Количество уровней сигнала меняется от 2 до 16. Такой способ модуляции использован в американской системе цифрового ТВ вещания ATSC. Необходимо учитывать, что чем больше количество уровней модулирующего сигнала, тем меньше его помехозащищенность из-за относительного увеличения степени их воздействия на составляющие вектора передаваемого сигнала. 19.3.4. Способ частотного уплотнения с ортогональными несущими (OFDM) Одним из современных методов передачи информации по радиоканалам является ортогональное частотное мультиплексирование OFDM (Ortogonal Frequency Division Multiplex). При использовании модуляции типа OFDM поток данных передается одновременно с помощью большого числа несущих, отстающих
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 561 друг от друга на равные частотные интервалы ∆f . В этом случае высокоскоростной поток разделяется на большое число параллельных низкоскоростных потоков N , передаваемых на отдельных несущих. Благодаря этому длительность символа в каждом потоке окажется в тысячи раз больше, чем в исходном последовательном потоке. Таким образом, в одном канале ТВ вещания получается N узкополосных подканалов. В результате достигается главное — на передачу одного символа на каждой отдельной несущей может быть отведено больше времени, чтобы сделать передачу каждого символа независимо от наличия отраженных сигналов, обусловленных многолучевым приемом. Увеличение длительности символа осуществляется «распараллеливанием» последовательного цифрового потока Uвх . Далее каждый из потоков U1 , U2 , U3 . . . с уменьшенной в k раз скоростью передачи символов модулирует каждую поднесущую. При этом допускается фазовая (PSK) или квадратурная амплитудная (QAM) модуляция каждой несущей. Число этих несущих выбирается таким, чтобы сделать передачу каждого символа независимой от наличия отраженных сигналов, обусловленных многолучевым распространением радиоволн, что характерно для городских условий. Способ OFDM использует ортогональные несущие, но в отличие от квадратурной модуляции частоты этих несущих не являются одинаковыми, они распределены в диапазоне частот, отведенном для передачи данных, за счет модуляции с использованием АМ, ФМ, QAM (KAM), OPSK, VSM-AM и т. д.: Un (t) = U0 cos[2π(f0 + n/Ts )t], (19.3) где f0 — начало интервала, в котором производится частотное уплотнение; n — номер несущей, находящейся в диапазоне от 0 до N − 1, т. е. всего несущих N ; Ts — длительность интервала передач отдельных символов. Несущие частоты в (19.3) должны выбираться из следующих соображений: • число несущих должно быть таким, чтобы при неизменной скорости потока данных на входе модулятора OFDM увеличить до требуемой величины время передачи одного символа на каждой несущей; • несущие должны быть достаточно близки по частоте друг к другу, чтобы сократить занимаемую полосу частоты канала связи; • частоты несущих должны быть выбраны так, чтобы они не создавали взаимных помех. Последнее условие выполняется, если частоты удовлетворяют требованию ортогональности. Физический смысл этого требования
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 562 Часть VI. Цифровые системы ТВ вещания заключается в следующем: спектр каждой несущей после модуляции должен иметь нули на частотах, на которых расположены остальные несущие. Выполнение этого условия обеспечивает отсутствие взаимных помех и независимую передачу информации на каждой несущей. На рис. 19.11 показан спектр одной несущей при модуляции её сигналом прямоугольной формы. Ðèñ. 19.11. Частотный спектр одной Поскольку цифровой сигнал несущей COFDM кодируется с применением прямой коррекции ошибок, этот процесс модуляции называют кодированным ортогональным частотным уплотнением (COFDM). Способ COFDM включает в себя распределение высокоскоростного последовательного битового потока по большому числу близко расположенных индивидуальных несущих, периодически распределённых в пределах заданной полосы частот; при этом каждая несущая передает только часть общего битового потока. Несущие обрабатываются (или модулируются) одновременно в течение регулярных интервалов времени. Набор несущих, обрабатываемых на каждом интервале, называют символом COFDM. Вследствие использования большого числа несущих длительность символа COFDM существенно больше, чем длительность одного бита в исходном битовом потоке. Пусть, например, число модулирующих битов равно 500, причем каждый из них имеет исходную длительность 0,1 мкс при параллельной обработки (модуляции) 500 несущих с целью формирования символа COFDM. Тогда длительность символа COFDM составит приблизительно 0,1·500 = 50 мкс. Форма сигнала отдельного символа определяется интегральной совокупностью всех модулированных несущих в данном интервале. Большая длительность символа позволяет приемнику ждать, пока не придут все отраженные сигналы, и только после этого произвести оценку и обработку сигнала. Таким образом, отраженные колебания, проходящие в этот период времени, дополняют прямую передачу (луч). Влияние отражений предшествующего по времени символа на текущий устраняется посредством введения перед символом защитного интервала (называемого также защитной полосой), во время которого приемник ждет перед тем, как начать оценку несущих. Исходя из условий ортогональности, частоты несущих должны располагаться на оси частот с шагом, обратным величине Ts — времени передачи одного символа. При этом значения каждой частоты
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме Ðèñ. 19.12. 563 Спектр передаваемого сигнала при модуляции OFDM определяются выражением fk = f0 + t/τs , где k = 0, 1, 2, . . . , n − 1, N . Расстояние между несущими выбирается равным 1/Ts , где Ts — продолжительность символа. На рис. 19.12 показан частотный спектр каждой несущей. При использовании всех несущих получается плоский частотный спектр с паразитными боковыми лепестками на каждом его крае (рис. 19.13). Введение защитного интервала улучшает частотный спектр, уменьшая протяжённость вторичных боковых лепестков. Таким образом, получается ряд частот, расположенных равномерно и образующих общий спектр OFDM (см. рис. 19.12), достаточно близко приближающийся к прямоугольной форме, что позволяет эффективно использовать частотный диапазон канала передачи (см. рис. 19.13). Анализ выражения (19.3) и рис. 19.11 подтверждает, что несущие действительно являются ортогональными. Взаимные помехи от соседних несущих будут равны нулю, несмотря на то что их соседние боковые полосы взаимно перекрываются. Это позволяет эффективно, близко к теоретическому пределу, использовать полосу частот ТВ канала. Ðèñ. 19.13. Частотный спектр набора несущих COFDM
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 564 Часть VI. Цифровые системы ТВ вещания Важным фактором при таком способе модуляции является так называемая межсимвольная интерференция (Intersymbol Interferenсу, ISI), или, по существу, перекрестные искажения. Модуляция OFDM позволяет применить простой прием для борьбы с этим явлением: при увеличении количества несущих частот время на передачу одного символа также увеличивается. Этого увеличения оказывается достаточно для того, чтобы ввести между передаваемыми символами так называемый защитный интервал (Guard Interval, GI). Введение защитного интервала позволяет уменьшить межсимвольные помехи и снизить влияние различных эхо-сигналов, возникающих из-за многолучевого распространения радиоволн. Главное назначение защитного интервала, таким образом, состоит в повышении помехоустойчивости передачи полезной информации. Чем больше используется поднесущих в символе, тем меньшим является относительная длительность защитного интервала, что обусловливает возрастание информационной эффективности передачи. Однако значительное увеличение числа поднесущих определяет сужение эквивалентной полосы частот, соответствующей каждой отдельной из них, что определяет ухудшение мобильного приёма из-за относительного возрастания влияния эффекта Допплера (нарушения принципа ортогональности). Таким образом, время, затрачиваемое на передачу одного символа OFDM, состоит из интервала передачи полезной информации и защитного интервала: Tgs = Tg + Ts , где Tgs — время, затрачиваемое на передачу одного символа; Tg — защитный интервал; Ts — время передачи полезной информации. Схема, иллюстрирующая принцип модуляции типа OFDM, приведена на рис. 19.14. На рис. 19.15 показан пример формирования сигнала OFDM с помощью обратного быстрого преобразования Фурье (ОБПФ), которому подвергается входной цифровой поток. Модуляция и демодуляция выполняются с помощью ДПФ. При модуляции берутся одновременно передаваемые символы всех N под- Ðèñ. 19.14. Формирование сигнала OFDM
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме Ðèñ. 19.15. 565 Формирование радиосигнала OFDM с помощью обратного быстрого преобразования Фурье каналов и производится обратное ДПФ полученного набора из N чисел (рис. 19.15). В результате получаются другие N чисел, которые последовательно преобразуются в аналоговую форму ЦАП. Эти другие N чисел эквивалентны отсчетам сигнала, содержащего N несущих частот (колебаний), промодулированных в соответствии с передаваемыми в этот момент времени в соответствующих подканалах символами. Полученный таким образом аналоговый сигнал может быть обычным способом перенесен в нужный частотный диапазон преобразователем частоты. При демодуляции принятый сигнал переносится на промежуточную частоту и преобразуется в цифровую форму (АЦП). Затем в группах по N отсчетов принятого сигнала выполняется прямое ДПФ, в результате которого получаются значения символов, одновременно передаваемых в N подканалах. Быстрое преобразование Фурье. Набор несущих, формируемых OFDM, очень напоминает то, что получается в алгоритме быстрого преобразования Фурье (БПФ), которое производит разложение непрерывного колебания на частотные составляющие. Для получения непрерывного колебания, которое можно применить для модуляции УВЧ-несущей, над несущими COFDM выполняется обратное быстрое преобразование Фурье (ОБПФ). На приемной стороне сигнал от УВЧ-демодулятора поступает на кристалл БПФ для получения исходных несущих COFDM (рис. 19.16). Краткая оценка способа OFDM. В системах широкополосного беспроводного доступа (ШБД) основным разрушающим фактором для цифрового канала являются помехи от многолучевого приема. Этот вид помех весьма характерен для эфирного приема в городах с разноэтажной застройкой из-за многократных отражений радиосигнала от зданий и других сооружений. Радикальным решением этой проблемы является применение технологии ортогонального частотного мультиплексирования OFDM, которая специально разработана для борьбы с помехами при многолучё-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 566 Ðèñ. 19.16. Часть VI. Цифровые системы ТВ вещания Функциональные схемы передатчика и приемника системы цифрового телевидения типа OFDM вом приеме. Разновидность технологии — метод COFDM (сочетание канального кодирования, аббревиатура C, и OFDM) — хорошо известен и широко используется в цифровых системах ТВ и радиовещания (DVB) в Европе, Канаде и Японии. При OFDM последовательный цифровой поток преобразуется в большое число параллельных потоков (субпотоков), каждый из которых передается на отдельной несущей (см. рис. 19.12). Частотный разнос ∆f между соседними несущими f1 , f2 , . . . , fn в групповом радиоспектре OFDM выбирается из условия возможности выделения в демодуляторе индивидуальных несущих. При этом возможно применение двух методов частотного разделения (демультиплексирования) несущих. Во-первых, с помощью полосовых фильтров и, во-вторых, с помощью ортогональных преобразований сигналов. В первом случае частотный разнос между модулированными несущими выбирается таким, чтобы их соседние боковые полосы взаимно не перекрывались. Это условие будет выполнено, если частотный разнос выбрать равным ∆f > 2/Tφ , где Tφ — рабочий интервал информационного символа. Однако при этом эффективность использования радиоспектра будет невысокой. Напротив, стандарт OFDM характеризуется перекрытием спектров соседних поднесущих, что позволяет уменьшить в два раза значение частотного разноса и во столько же раз повысить плотность передачи цифровой информации (бит/с/Гц). Благодаря ортогональному методу демодуляции поднесущих группового спектра происходит компенсация помех от соседних частот, несмотря на то что их боковые полосы взаимно перекрываются. Для выполнения условий ортогональности необходимо, чтобы частотный разнос между несущими был постоянен и точно равен ∆f > 2/Tφ , т. е. на интервале Tφ должно укладываться целое число периодов разностной частоты f2 − f1 . Выполнение этого соотношения достигается введением в модеме OFDM двух видов сигналов синхронизации: сигналов для синхронизации несущих частот группового
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 19. Передача телевизионного сигнала в цифровой форме 567 спектра и сигналов для синхронизации тактовых частот функциональных блоков демодулятора. Группа несущих частот, которая в данный момент времени переносит биты параллельных цифровых потоков, называется символом OFDM. Благодаря тому, что используется большое число параллельных потоков, длительность символа в параллельных потоках оказывается существенно больше, чем в последовательном потоке данных. Это позволяет в декодере задержать оценку принятых символов на время, в течение которого изменения параметров радиоканала из-за действия эхо-сигналов прекратятся и канал станет стабильным. Таким образом, при OFDM временной интервал символа субпотока Ts делится на две части — защитный интервал Tg , в течение которого оценка значения символа в декодере не производится, и рабочий интервал символа Tφ , за время которого принимается решение о значении принятого символа. Для правильной работы системы эхоподавления необходимо, чтобы защитные интервалы находились в начале символов субпотоков, т. е. в защитном интервале имеют место перекрёстные искажения с предшествующим символом. Технически метод OFDM реализуется с помощью инверсного (обратного) дискретного преобразования Фурье (Fast Fourier Transform, FFT) в модуляторе передатчика и прямого дискретного преобразования Фурье — в демодуляторе приемника приемо-передающего устройства. COFDM хорошо зарекомендовала себя среди вещателей ТВ программ как новый метод доставки цифровых сигналов потребителю. Главным преимуществом метода передачи COFDM является использование многократных отражений излучаемых сигналов от строений, стен и т. п. с коррекцией возникающих при приеме искажений и ошибок. Европейский проект DVB принял этот метод передачи в качестве базового стандарта для непосредственного эфирного вещания ТВ и мультимедийной продукции. Преимущества технологии COFDM: • высокое качество изображения из-за использования цифровых методов обработки, высокая помехоустойчивость; • обеспечение как устойчивого приема, так и проведения трансляций в движении и т. д. Все это послужило дополнительным импульсом для широкого внедрения новой технологии в различных областях производства телевизионной продукции. Данный метод передачи имеет следующие достоинства: • равномерное распределение энергии по полосе частот канала связи;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 568 Часть VI. Цифровые системы ТВ вещания • возможность передавать наиболее важную часть информации (синхронизацию, НЧ составляющие сигнала яркости) на тех участках полосы частот, где меньше всего уровень помех от соседних каналов; • благодаря тому, что каждый из подканалов является узкополосным, уменьшается влияние отраженных сигналов при многолучевом приеме. Последнее свойство особенно важно, так как многолучевой прием создает значительные сложности для цифрового ТВ вещания в городах. При использовании OFDM длительности интервалов времени, в течение которых передаются отдельные элементы, увеличиваются и становятся больше, чем времена задержек отраженных сигналов, в результате чего обеспечивается безошибочный прием. В современных системах цифрового телевещания модуляцию несущей совмещают с помехоустойчивым кодированием. При этом число возможных состояний несущей после модуляции превышает число символов, которые должны быть переданы, т. е. вводится дополнительная избыточность, обеспечивающая повышение помехоустойчивости. Такую модуляцию называют кодированной модуляцией (Coded Modulation). В сочетании с OFDM ее обозначают COFDM. Таким образом, при передаче сигналов цифровой системы телевидения по разночастотным каналам связи используются две ступени помехоустойчивого кодирования. На первой ступени, называемой внешней, осуществляется кодирование цифровой информации с помощью кодов Рида–Соломона. На второй ступени, называемой внутренней, используется канальное кодирование, совмещенное с модуляцией. В результате достигается требуемая помехоустойчивость (см. раздел 19.2 «Канальное кодирование», рис. 19.1 и 19.2). Контрольные вопросы 1. 2. 3. 4. 5. 6. 7. 8. В чем заключается принцип канального кодирования? Назовите цифровые способы модуляции. От чего зависит помехоустойчивость модуляции QAM? Где используется многоуровневая АМ (VSB)? Что делают для увеличения помехоустойчивости многоуровневой АМ? Векторные диаграммы для модуляции типа QAM и PSK в условиях помех. Требования к способам модуляции. Способы передаваемого сигнала при модуляции OFDM.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 20 ЦИФРОВОЕ ТВ ВЕЩАНИЕ 20.1. Развитие цифрового ТВ вещания Временем начала цифрового ТВ вещания в Европе и, практически сразу, в США следует считать ноябрь 1998 г. В Европе цифровое ТВ вещание развивалось в соответствии с проектом DVB (Digital Video Broadcasting). Учитывая разнообразие форм ТВ вещания, часть проекта была посвящена разработке технических решений применительно к спутниковому телевидению, она получила название DVB-S (...Satellite), часть — к кабельному (DVB-C — ...Cable), а часть — к наземному или эфирному вещанию (DVB-Т — ...Terrestrial, DVB-H — мобильное телевидение, MMDS — сотовое телевидение). Стандарт ISDB (Integrated Services Digital Broadcasting), разработанный в Японии, является в некотором смысле модификацией европейского стандарта ТВ вещания. В России пробные ТВ передачи в стандарте DVB были начаты несколько позже. Опытное цифровое ТВ вещание было начато в Нижнем Новгороде в 2000 г., в С.-Петербурге в 2001 г. В США работа над стандартом цифрового ТВ вещания началась в 1987 г., а в 1996 г. Федеральная комиссия США по связи (Federal Communications Commission, FCC) утвердила разработанный стандарт в качестве национального. Он получил название ATSC (Advanced Television Systems Committee). Уже в ноябре 1998 г. 26 станций в 10 регионах США приступили к цифровому ТВ вещанию. К цифровому вещанию в стандарте ATSC присоединились также Канада, Северная Корея, Тайвань и Аргентина. 20.2. Система ATSC В системе ATSC, предназначенной для передачи данных по стандарту MPEG-2, транспортный поток не должен превышать значения 80 Мбит/с. Разработчики системы ATSC предусмотрели применение для передачи ТВ сигнала многопозиционной амплитудной модуляции с подавленной нижней боковой полосой, что в какой-то степени соответ-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 570 Часть VI. Цифровые системы ТВ вещания Таблица 20.1 Параметры разверток Размер кадра Соотношение сторон Частота кадров 1920×1080 16:9 60 i, 30 р, 24 p 1280×720 16:9 60 p, 30 p, 24 p 704×480 16:9, 4:3 60 p, 60 i, 30 p, 24 p 640×480 4:3 60 p, 60 i, 30 p, 24 p Примечание: i — чересстрочная развертка; p — прогрессивная. ствует принципам построения существующих аналоговых систем ТВ вещания. Такой вид модуляции называется VSB-AM. Система VSB разработана в нескольких вариантах, в зависимости от вида модулирующего сигнала: 2-VSB, 4-VSB, 8-VSB, 8T-VSB, 16VSB. Количество уровней модулирующего сигнала меняется от двух до шестнадцати, при этом изменяется и скорость передачи данных, которая определяется как частота следования символов, умноженная на логарифм количества уровней. При использовании восьмипозиционного модулирующего сигнала (способ модуляции 8-VSB) в интервале одного символа передаются три двоичных разряда потока данных. В полосе 6 МГц (ширина частотного ТВ канала в США) система 8-VSB способна передавать поток данных 32,3 Мбит/с. Система ATSC стандартизовала 18 возможных параметров воспроизводимого изображения в системе цифрового ТВ вещания (табл. 20.1) Формат 704×480 сохранен, в основном, ради обеспечения совместимости с техникой и видеоматериалом, созданными применительно к стандарту NTSC. 20.3. Система DVB Из всех вариантов европейской системы ТВ вещания — для спутникового, кабельного и наземного (эфирного) ТВ вещания — наибольшие сложности в практической реализации сопутствовали системе наземного ТВ вещания DVB-T, что и задержало ее внедрение в практику. Именно эту систему следует рассмотреть подробнее, так как благодаря своим оригинальным техническим решениям, позволившим обеспечить помехоустойчивый прием сигнала в различных условиях, система DVB-T в ряде испытаний показала свои преимущества по сравнению с другими системами цифрового ТВ вещания. Структурная схема обработки сигнала показана на рис. 20.1. Одна из особенностей системы DVB-T — так называемая иерархическая передача и прием информации. Это техническое решение связано со специальным выбором способа модуляции и позволяет потребителю принять изображение в таком качестве, какое позволяют условия
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание Ðèñ. 20.1. 571 Алгоритм формирования радиосигнала в ТВ системе DVB-T приема и качество приемника. Транспортный поток, соответствующий стандарту MPEG-2, расщепляется на выходе мультиплексора на два независимых потока, отличающихся приоритетом. Поток высшего приоритета кодируется и передается при условии обеспечения высокой помехозащищенности, а поток низкого приоритета — с более низкой помехозащищенностью, но с более высокой скоростью передачи данных. На рисунке его путь обозначен штриховой линией. Рандомизация, а также внешнее и внутреннее перемежение предназначены для защиты от ошибок передачи. Все эти меры позволяют довести частоту ошибок на входе демультиплексора MPEG-2 примерно до 10−11 , что соответствует практически безошибочной работе. Особенностью системы DVB-T является принятый способ модуляции OFDM, предполагающий использование большого числа несущих частот. Это позволяет эффективно бороться с эхо-сигналами, так как время передачи каждого символа на отдельной несущей может быть увеличено. Особенности способа модуляции OFDM описаны в главе 19. Для формирования сигналов большого количества несущих частот используют хорошо отработанные алгоритмы быстрого преобразования Фурье (БПФ). В большинстве таких алгоритмов размер массива, подвергающегося преобразованию, кратен целой степени числа 2. Поэтому используется размер массива, равный 8192 = 8k или 2048 = 2k (здесь k = 210 = 1024). На практике число несущих оказывается меньше, часть несущих не используется, поскольку между частотными областями, занимаемыми соседними каналами, должен быть оставлен некоторый зазор. В двух существующих в настоящее время режимах используется 6817 и 1705 несущих, однако по размеру массива БПФ системы модуляции называются соответственно 8k-OFDM и 2kOFDM. Сигнал, получаемый в системе ТВ вещания при таком способе
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 572 Часть VI. Цифровые системы ТВ вещания модуляции, состоит из большого числа модулированных несущих. Количество информации, переносимое одной несущей за время передачи одного символа OFDM, зависит от способа модуляции — это 2 бита для квадратурной фазовой манипуляции, 4 бита для квадратурной амплитудной модуляции 16-QAM и 6 битов для модуляции вида 64-QAM. 20.3.1. Параметры стандарта DVB-T Основные параметры, характеризующие передачу данных в системе DVB-T приведены в табл. 20.2. Число несущих, передающих полезную информацию, зависит только от режима и равно 1512 для режима 2k и 6048 для режима 8k. Число полезных несущих в обоих режимах отличаются ровно в четыре раза. Если учесть, что и длительность полезного интервала при переходе от режима к режиму также меняется в четыре раза, то такой важный параметр, как частота следования символа данных RS, оказывается в двух режимах одинаковыми и равными 6,75 миллионам символов в секунду (RS = = 1512/224 мкс = 6048/896 мкс = 675 МГц = 6,75 Мегасимвол/с). В табл. 20.3 приведены также расчетные значения отношения сигнал/шум (C/N) на выходе канала связи с гауссовым шумом при неиерархической передаче (при других характеристиках шума канала требуемые значения C/N будут, конечно, другими). Этот показатель является пороговым, если отношение сигнал/шум выше приведенного в таблице значения, тогда внутренний декодер способен довести частоту ошибок до величины, меньшей чем 2 · 10−4 , а внешний — до 2 · 10−12 . При таких показателях наблюдается одна нескорректированная ошибка за час работы на входе демультиплексора MPEG-2 в приемнике. Как видно из табл. 20.3, в системе DVB-T скорость передачи полезных данных может меняться в значительных пределах: от 4,98 до 31,67 Мбит/с (это перекрывает весь диапазон потребностей, начиная с телевидения ограниченной четкости и заканчивая телевидением высокой четкости). Таблица 20.2 Основные параметры системы DVB-T Параметр Режим 8k Число несущих Длительность полезного интервала Tu, мкс Длительность защитного интервала Tg, мкс Интервал между несущими, Гц Интервал между крайними несущими, МГц Модуляция несущих Скорость внутреннего кода 2k 6817 1705 896 224 224, 112, 56, 28 56, 28, 14, 7 1116 4464 7,61 7,61 QPSK, 16-QAM, 64-QAM 1/2, 2/3, 3/4, 5/6, 7/8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 573 Глава 20. Цифровое ТВ вещание Таблица 20.3 Скорость передачи данных системой DVB-T Модуляция QPSK QPSK QPSK QPSK QPSK 16-QAM 16-QAM 16-QAM 16-QAM 16-QAM 64-QAM 64-QAM 64-QAM 64-QAM 64-QAM C/R 1/2 2/3 3/4 5/6 7/8 1/2 2/3 3/4 5/6 7/8 1/2 2/3 3/4 5/6 7/8 C/N, дБ (гауссов канал) 3,1 4,9 5,9 6,9 7,7 8,8 11,1 12,5 13,5 13,9 14,4 16,5 19,0 19,3 20,1 Скорость передачи данных, Tg /Tu 1/4 1/8 1/16 1/32 4,98 6,64 7,46 8,29 8,71 9,95 13,27 14,93 16,59 17,42 19,91 19,91 22,39 24,88 26,13 5,53 7,37 8,29 9,22 9,68 11,06 14,75 16,59 18,43 19,35 22,12 22,12 24,88 27,65 29,03 5,85 7,81 8,78 9,76 10,25 11,71 15,61 17,56 19,52 20,49 23,42 23,42 26,35 29,27 30,74 6,03 8,04 9,05 10,05 10,56 12,06 16,09 18,10 20,11 21,11 24,13 24,13 27,14 30,16 31,67 Самое малое значение скорости 4,98 Мбит/с, имеющее место при модуляции несущих типа QPSK и скорости внутреннего кода, равной 1/2, характеризуется самой высокой помехозащищенностью системы передачи (для практически безошибочной работы достаточно сигнал/шум в гауссовом канале 3,1 дБ). Но для достижения скорости 31,67 Мбит/с (модуляция несущих 64-QAM и скорость внутреннего кода 7/8) должно быть обеспечено отношение сигнал/шум не менее 20,1 дБ. Данные табл. 20.3 можно использовать также для определения скорости передачи данных в режиме иерархической передачи. Скорость для потока с высшим приоритетом соответствует модуляции несущих типа QPSK. При модуляции несущих 16-QAM скорость передачи данных для потока с низшим приоритетом находится в ячейках таблицы, где приведены данные для QPSK, а при модуляции 64QAM — в ячейках таблицы для 16-QAM. Таблицы 20.2 и 20.3 подтверждают чрезвычайную гибкость системы DVB-T — предоставляя широкий спектр средств, система способна с высокой надежностью передавать информацию о сигнале телевидения и стандартной, и высокой четкости в самых разнообразных условиях. 20.3.2. Система цифрового ТВ вещания DVD-Т2 В 2008–2009 годах была предложена новая спецификация наземного цифрового вещания DVB-T2, которая позволяет получить более высокую полезную скорость потока в полосе ТВ частот в среднем на 30. . . 60 % по сравнению с DVB-T [141]. В DVB-T2 есть несколько отличий от DVB-T: может применяться не только транспортный поток (ТП) MPEG-2, но и ТП с переменным потоком общего назначения MPEG-4. Это позволяет снизить
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 574 Часть VI. Цифровые системы ТВ вещания объем передаваемых служебных данных, могут также передаваться любые другие цифровые потоки с DVB-Т2, возможна одновременная передача нескольких транспортных потоков. В DVB-Т2 предлагается использование более эффективных кодов LDPC вместо сверхточных кодов и кодов BCH, вместо кодов Рида–Соломона (BCH — код Боуз– Чоудхури–Ходвингема используется в цифровом ТВ; LDPC — код с малой плотностью проверки на четность, используемый в DVB) [146]. Еще одно новшество состоит в ведении модуляции 256-QAM, которая позволяет передавать 8 битов на одной несущей. Это позволяет увеличить емкость канала на треть. Для повышения помехоустойчивости в DVB-T2 применили вращение созвездий и усложнили систему перемещения битов: информация перемещается не только внутри одного символа, но и внутри одного суперканала. В DVB-Т перемещение осуществлялось в пределах одного символа модуляции и, следовательно, в течение только периода времени символа. В DVB-T2 перемещение выполняется в течении более действительного времени, повышает помехоустойчивость DVB-Т2 [133]. Увеличение скорости передачи цифрового потока в DVB-T2 по сравнению с DVB-Т объясняется несколькими причинами: увеличение количество несущих COFDM, новые виды модуляций отдельных несущих, введение расширенного режима COFDM200, использование помехозащищенных кодов LDPC, применение «вращающихся созвездий», перемежения по времени и т. п. Рассмотрим кратко (и очень упрощенно) некоторые из этих технических дополнений для того, чтобы получить представление о том, как удалось добиться такой впечатляющей производительности. Сначала рассмотрим увеличение количества несущих. Как известно, в DVB-Т основным режимом модуляции является режим с примерно 8000 несущих. В DVB-T2 количество несущих увеличено до 32000. Спрашивается, почему не было сделано это раньше? Потому что в DVB-T использовались менее эффективные коды коррекции ошибок (конволюционный код и код Рида–Соломона), которые не смогли бы обеспечить хорошую помехоустойчивость для 32000 несущих. В DVB-T2 используются коды LDPC, которые настолько эффективны, что их применение позволяет обеспечить помехоустойчивость на уровне DVB-T, но добиться при этом передачи цифровых данных с увеличенной скоростью. Помимо использования 32000 несущих, в DVB-T2 вводятся дополнительные режимы модуляции каждой отдельной несущей. В DVBT2 можно модулировать каждую отдельную несущую модуляцией QPSK, 16-QAM или 64-QAM, что позволяло добиться передачи на одну несущую 2, 4 или 6 битов информации.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 575 Глава 20. Цифровое ТВ вещание Таблица 20.4 Некоторые характеристики DVB-T и DVB-Т2 Параметр Количество несущих Коды коррекции ошибок Расширенный режим Модуляция несущих Количество транспортных потоков «Вращающие созвездия» Перемещение по времени Интерфейс модулятора DVB-T DVB-T2 2000, 4000, 8000 Конволюционный + Рида–Соломона Нет QPSK, 16-QАM, 64-QAM 2000, 4000, 8000, 32000 LDPS Не более 4 есть QPSK, 16-QAM, 64-QAM, 256-QAM Много Нет Нет MPEG-2 TS через ASI или IP Есть Есть Т2-МI через ASI или IP В DVB-T2 вводится режим 256-QAM, что позволяет увеличить количество битов, передаваемых каждой несущей, до 8. Введение режима 256-QAM стало возможным также благодаря кодам LDPC. Если бы использовались старые коды DVB-T, то не удалось бы обеспечить хорошую помехоустойчивость передачи. Резко возросла адаптивность системы к условиям функционирования, например увеличено число вариантов передачи опорных пилот-сигналов в пределах последовательности символов. Итак, становится ясно, что коды LDPC — это одно из самых важных нововведений в DVB-T2. Таким образом, комбинация режима 32000 несущих и модуляция 256-QAM для каждой несущей с использованием кодов LDPC позволила значительно увеличить скорость цифрового потока DVBT2. Сравнительные характеристики DVB-T и DVB-T2 приведены в табл. 20.4 [133]. 20.4. Система ISDB Система цифрового ТВ вещания с интеграцией служб ISDB (Integrated Services Digital Broadcasting) была предложена японской компанией NHK. Это третья среди известных систем цифрового ТВ вещания после американской ATSC и европейской DVB. Большое внимание разработчики уделили средствам обеспечения интерактивности. Телевизионный приемник может быть интегрирован в систему дистанционного обучения, в систему связи с широкими возможностями интерактивного обмена информацией между зрителем и источником программ. Домашний приемник представляет собой многоцелевой терминал, способный предоставить владельцу широкий выбор возможностей его использования. Предполагается, что зритель сможет получать доступ к информации, поступившей из различных источников
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 576 Часть VI. Цифровые системы ТВ вещания Таблица 20.5 Варианты разрешения для ISDB Реальное разрешение Четкость 720×480 1280×720 1920×1080 SDTV HDTV Частота кадров 23,976p (24p) 29,97i (30i) 29,97p (30p) 59,94p (60p) + + + + + + + + + + + (Интернет, электронная почта, радиовещание), причем даже без знания используемого канала передачи. Технически передача сигнала в системе ISDB-T осуществляется с помощью большого числа несущих с использованием модуляции OFDM, как и в системе DVB. Однако организация передачи данных, ориентированная на возможность доставки информации из разных источников, имеет ряд особенностей. Ортогональные несущие, используемые для передачи информации, объединены в группы, которые называются сегментами (Band Segmented Transmission Segments, BST). Канал, таким образом, состоит из некоторого числа сегментов, и поэтому способ передачи данных, используемый в системе ISDB-T, получил название BST-OFDM. Иерархическая передача и прием сигнала в системе ISDB-T достигаются выбором способа модуляции несущих, изменения внутреннего кода и интервала перемежения. К достоинствам системы следует отнести ее направленность на использование сервисных функций современной ТВ техники. Варианты разрешения для стандарта ISDB приведены в табл. 20.5. Проведем краткий сравнительный анализ рассмотренных стандартов цифрового ТВ вещания. Сравним DVB-Т и ATSC. Параметры передаваемых изображений в обоих стандартах одинаковы, так как определяются стандартом MPEG-2. По качеству звукового сопровождения стандарты также эквивалентны, так как в DVB звук тоже может кодироваться с применением стандарта АС-3. Основное различие заключается в применяемых методах модуляции и проявляется в различной устойчивости к действию помех. В некоторых публикациях отмечалось, что DVB-Т имеет ряд преимуществ перед ATSC: • DVB-Т обеспечивает реальное уменьшение мощности ТВ передатчиков в условиях городской застройки; • при использовании DVB-Т прием на комнатные антенны переносных телевизоров не создает проблем, а при использовании ATSC — в большинстве случаев невозможен; • DVB-Т обладает высокой устойчивостью к помехам, создаваемым аналоговым ТВ вещанием, и может сосуществовать с ним;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 577 Глава 20. Цифровое ТВ вещание Таблица 20.6 Основные технические параметры стандартов ATSС и DVB-Т Характеристика Алгоритмы сжатия данных Вероятность ошибки бита Число несущих Модуляция несущих Помехоустойчивое кодирование Пороговое отношение сигнал/шум Скорость на выходе кодера MPEG-2 Телевидение высокой четкости (HDTV) Многолучевой прием Прием на мобильный приемник Влияние импульсных помех от бытовой техники Прием на комнатную антенну Версии на 50 и 60 Гц Работа в каналах с полосами 6, 7 и 8 МГц ATSC DVB-T MPEG-2 (видео), Dolby 5.1 MPEG-2 (видео), MPEG-2 AC-3 (аудио) Layer II (аудио) < 3 · 10−6 (на выходе < 10−11 (на выходе декодера декодера MPEG-2) MPEG-2) 1K 2К или 8К (К = 1024) АМ с частично подавленной Квадратурная АМ с 4, 16 или боковой полосой, 8 уровней 64 уровнями Код Рида–Соломона и код Код Рида–Соломона и Унгербоика с фиксированной сверточный код с пятью скоростью скоростями 14,9 дБ (теория); 15,1 дБ 16,5 дБ (теория); 19,2 дБ (практика) (практика) 19,39 Мбит/c 5...32 Мбит/с, большая скорость требует большего отношения с/ш Главное назначение Поддерживается стандарта Статический — допускает, Статический — допускает, динамический плохо динамический — плохо (имеет преимущество при мощных эхо-сигналах) Не допускает (обсуждается Только при режиме 2К с отдельный стандарт на низкоскростной модуляцией и основе COFDM) на скорости до 120 км/ч Низкое (наибольшее влияние Среднее (наибольшее в МВ- и ДМВ-диапазонах) влияние в МВ- и ДМВ-диапазонах) Затруднен Затруднен при HDТV (для уверенного приема воз- (для уверенного приема возможно использование одноможно использование одночастотных ретрансляторов частотных ретрансляторов) Поддерживаются Поддерживаются Поддерживаются Поддерживаются (в полосе 6 МГц высокая чувствительность к фазовому шуму) • DVB-Т дает возможность создания одночастотных сетей с перекрытием зон приема сигналов соседних передатчиков. В то же время в ряде публикаций предпочтение отдается ATSC. В США, в отличие от Европы, главным направлением работы было выбрано телевидение высокой четкости, один канал которого можно передать по современному аналоговому каналу. При этом улучшенное качество картинки, естественно, можно получить лишь на экране специального широкоформатного телевизора с 1080 активными строками, чересстрочной разверткой и соотношением ширины и высоты экрана 16:9, хотя наряду с ними выпускаются и аппараты подобные
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 578 Часть VI. Цифровые системы ТВ вещания Таблица 20.7 Сводные данные рассмотренных стандартов цифрового вещания Параметр Сжатие видео Сжатие звука Модуляция эфирного вещания Полоса эфирного канала, МГц Модуляция кабельного вещания Полоса кабельного канала, МГц Модуляция спутникового вещания ATSC DVB ISDB MPEG-2 (Main profile по ISO/IEC 13812) ATSCA/52 MPEG-2 Layer II, Dolby MPEG-2 AAC-LC (Dolby AC-3) AC-3 (Digital), DTS 8-VSB или QPSK, 16 QAM и 64 DQPSK, QPSK, 16 16-VSB QAM для COFDM QAM и 64 QAM для BST-OFDM 6 6, 7 или 8 6, 7 или 8 16-VSB3 QAM QAM 6 6, 7 или 8 6, 7 или 8 QPSK, 8PSK QPSK PSK европейским и рассчитанные на вывод 525 строк. Но так как функциональные возможности ATSC беднее, чем DVB, в США STB (Set top Box — ТВ приставка) пригодны только для приема цифры на нынешние ТВ приемники, да и то только в переходный период. Также выпускаются компьютерные платы (стоимостью примерно 800 долларов) для вывода цифровых программ на монитор компьютера с HDTVкачеством в режиме XGA (720 строк с построчной (non-interlaced) разверткой). Согласно ATSC-стандарту, каждый ТВ приемник должен декодировать любой из многочисленных (а всего их 18 разновидностей) ATSC форматов и выводить его точно в соответствии с возможностями конкретного подключенного приемника, и пока производители строго соблюдают этот принцип. Потенциально и ATSC и DVB позволяют осуществлять как многопрограммное стандартное SDTV, так и однопрограммное HDTVвещание. Другое дело, что в США многопрограммное SDTV-вещание не применяется вовсе. ATSC-система включает в себя также хорошую антенну (несколько сотен долларов), оплаты подписки нет принципиально, поскольку в США исповедуются политика полного перехода на ЦТВ. В любом случае ЦТВ оказывается недешевым удовольствием, однако его стоимость больше зависит от качества картинки и уровня сервиса, чем от стандарта. Основные технические параметры стандартов ATSC и DVB-T приведены в табл. 20.6, а сводные данные всех рассмотренных стандартов — в табл. 20.7. Таким образом, в настоящее время в мире работают различные системы цифрового телевидения. При этом, как это когда-то было и
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание 579 с аналоговым телевидением, единый для всех стандарт на цифровое ТВ вещание пока отсутствует. 20.5. IP-телевидение IP-телевидением принято называть цифровую технологию многопрограммного интерактивного ТВ вещания в IP-сети с помощью пакетной передачи видеоданных по IP-протоколу (Video over IP). На практике это выглядит так: головное IPTV оборудование передает, а абонентское оборудование принимает потоковое видео (streaming video). Этот термин обозначает технологии сжатия, сокращения и буферизации видеоданных, которые позволяют передавать видео в реальном времени через Интернет. Главная особенность потокового видео заключается в том, что при его передаче пользователь не должен ждать полной загрузки файла для того, чтобы его просмотреть. Потоковое видео пересылается непрерывным потоком в виде последовательности IP-пакетов и проигрывается по мере того, как передается на абонентское устройство. Для просмотра видеопотока на мониторе компьютера, достаточно иметь установленную программу Video LAN. Декодированием видео- и аудиопотоков занимается непосредственно компьютер. Для просмотра потокового видео на телевизоре используется специальная ТВ приставка, или, в современной терминологии, Set top Box (STB), которая, с одной стороны, подключена к сети, а с другой — имеет соединение с телевизором. Абонентское устройство STB декодирует видеоданные и выводит расшифрованное видео на экран телевизора. Абонент IPTV получает от оператора пакет услуг, важнейшим отличием которых от услуг, предоставляемых классическим кабельным телевидением, является интерактивность, т. е. возможность для абонента оперативно выбирать и менять состав услуг, на которые он подписан, и в любой момент заказать дополнительную услугу, например дополнительный платный просмотр фильма. Конечно, интерактивность может быть реализована и на базе кабельной DVB-C сети с обратным каналом, но такие решения не распространены скольконибудь широко. Рассмотрим подробнее состав возможных услуг, которые может предоставить IP-телевидение. Базовой услугой, прежде всего, является многопрограммная трансляция ТВ каналов, или собственно IP-телевидение. Здесь могут быть реализованы два варианта просмотра телепрограмм: первый — оператором формируется несколько пакетов телеканалов, из которых зрители могут выбирать желаемый набор, причём каждый пакет имеет свою абонентскую плату; второй — зрители формируют индивидуальные пакеты из каналов, транслируемых оператором; абонентская плата определяется стоимостью выбранных каналов, транслируемых
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 580 Часть VI. Цифровые системы ТВ вещания оператором и входящих в индивидуальный пакет. Интерактивность IP-телевидения позволяет предложить абоненту ряд дополнительных услуг. Данное решение предназначено для организации IPTV в формате Internet Video. Для организации классического IPTV к комплексу добавляются системы Middleware, Billing и CAS, а также могут дополнительно добавляться программно-аппаратные комплексы при внедрении интерактивных услуг (VoD, NVoD, PVR и т. д.). 20.5.1. Услуги IPTV Услуга «Почти видео по заказу» или, что намного лучше звучит с маркетинговой точки зрения, «виртуальный кинотеатр» (Near Video on Demand), — это трансляция фильмов с видеосервера c жестко определенным расписанием сеансов, когда абонент покупает удобный ему по времени сеанс для просмотра фильма. Неудобство для абонента состоит в том, что он не может начать просмотр фильма в любой произвольный момент времени. Преимуществом для оператора является использование обычной технологии IP-multicast, которая очень сильно экономит объем трафика в магистральной сети оператора. Для снижения объемов трафика оператор предоставляет возможность просмотра не очень большого количества фильмов, обычно количество фильмов в «виртуальном кинотеатре» не превышает двух–трех десятков, как правило, это новые фильмы, недавно вышедшие в прокат. Услуга «Видео на заказ» (Video on Demand) — фильм с видеосервера персонально транслируется абоненту в любой произвольно выбранный абонентом момент времени. В отличие от услуги «виртуальный кинотеатр» количество фильмов здесь намного больше и может достигать иногда несколько тысяч. Появляется ряд очень удобных пользовательских функций виртуального видеоплеера — перемотка назад, вперед, пауза. В данном случае объем трафика здесь зависит не от количества фильмов, а от количества пользователей этой услуги, так как используется персональная трансляция видеоданных абоненту по технологии IP-адресации unicast. Услуга «Персональный видеомагнитофон» (Personal Video Recorder) — на видеосервере абоненту выделяется определенный объем памяти и предоставляется интерфейс с аналогичными видеомагнитофону функциями для цифровой записи и воспроизведения телепередач. Абонент может по своему желанию записывать, стирать, воспроизводить, перематывать свои личные записи. Здесь также используется технология IP-unicast. Услуга «Платный просмотр» (Pay per View) — покупка и просмотр абонентом отдельно выбранных программ (например, финал
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание 581 чемпионата мира по футболу). Трансляция ведется в режиме реального времени и используется технология IP-multicast. Услуга «Телевидение со сдвигом по времени» (Time Shifted TV) — абонент покупает услугу просмотра заранее записанных на видеосервере программ. Услуга и реализуемые в ней сервисные функции близки к «видео по заказу». Также используется технология IP-unicast. Услуги «Сервисы по заказу» (Services on Demand, SoD) — это заказ товаров и услуг на дом, различная справочная информация, расписание транспорта, гостиничный сервис и т. п. Данные услуги близки к аналогичным сервисам в Интернете. Для передачи потокового видео используются различные сетевые протоколы. 20.5.2. Структура построения сети IPTV Рассмотрим технологию производства ТВ изображения и передачи его клиентам. Сформированный IPTV головной станцией поток ТВ каналов представляет собой поток IP-пакетов, передаваемых в сети по отдельному групповому IP-адресу, соответствующему данному телеканалу. Таким образом, вещание нескольких каналов представляет собой формирование нескольких потоков multicast-трафика, когда каждый из каналов однозначно определяется уникальным адресом групповой рассылки. При использовании MPEG-4 как наиболее распространенного формата цифрового сжатия видеоданных каждый ТВ канал занимает в IP-сети от 2,5 до 4 Мбит/с. Сеть оператора загружается ТВ каналом только в том случае, если имеется подписчик на этот канал, который выбрал его для просмотра, т. е. запросил его просмотр в данный момент. Передача выбранного абонентом IP-сети ТВ канала реализуется на базе технологии IP-multicast или для случая просмотра видео по заказу на базе IP-unicast. Рассмотрим методы передачи трафика в IP-сетях unicast, broadcast, multicast. Понимание разницы между этими методами является очень важным для понимания преимуществ IP-телевидения и для практической организации трансляции видео в IP-сети. Каждый из этих трех методов передачи использует различные типы назначения IP-адресов в соответствии с их задачами, и имеется большая разница в степени их влияния на объем потребляемого трафика. Трафик Unicast (одноцелевая передача пакетов) используется прежде всего для сервисов персонального характера. Каждый абонент может запросить персональный видеоконтент в произвольное, удобное ему время. Unicast-трафик направляется из одного источника
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 582 Часть VI. Цифровые системы ТВ вещания Ðèñ. 20.2. Передача трафика unicast к одному IP-адресу назначения (рис. 20.2). Этот адрес принадлежит в сети только одному компьютеру или абонентскому STB. Число абонентов, которые могут получать unicast-трафик одновременно, ограничено доступной в магистральной части сети шириной потока (скоростью потока). Для случая Gigabit Ethernet сети теоретическая максимальная ширина потока данных может приближаться к 1 Гб/с за вычетом полосы, необходимой для передачи служебной информации и технологических запасов оборудования. Предположим, что в магистральной части сети мы можем для примера выделить не более половины полосы для сервисов, которым требуется unicastтрафик. Легко подсчитать для случая 4 Мб/с на телевизионный канал MPEG-2, что число одновременно получающих unicast-трафик абонентов не может превышать 125. Трафик Broadcast (широковещательная передача пакетов) использует специальный IP-адрес, чтобы посылать один и тот же поток данных ко всем абонентам данной IP-сети. Например, такой IP-адрес может оканчиваться на 255, например 192.0.2.255, или иметь 255 во всех четырех полях (255.255.255.255). Важно знать, что broadcast-трафик принимается всеми включенными компьютерами (или STB) в сети независимо от желания пользователя. По этой причине этот вид передачи используется в основном для служебной информации сетевого уровня или для передачи другой исключительно узкополосной информации. Разумеется, для передачи видеоданных broadcast-трафик не используется. Пример передачи трафика broadcast показан на рис. 20.3. Трафик multicast (групповая передача пакетов) используется для передачи потокового видео, когда необходимо доставить видеоконтент неограниченному числу абонентов, не перегружая сеть (рис. 20.4). Это наиболее часто используемый тип передачи данных в IPTV-сетях, когда одну и ту же программу смотрят большое число абонентов. Multicast-трафик использует специальный класс IP-адресов назначения, например адреса в диапазоне от 224.0.0.0 до 239.255.255. 255. Это могут быть IP-адреса класса D.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание Ðèñ. 20.3. 583 Передача трафика broadcast В отличие от unicast-трафика, multicast-адреса не могут быть назначены индивидуальным компьютерам (или STB). Когда данные посылаются по одному из multicast IP-адресов, потенциальный приемник данных может принять решение принимать или не принимать их, т. е. будет абонент смотреть этот канал или нет. Такой способ передачи означает, что головное оборудование IPTV-оператора будет передавать один единственный поток данных по многим адресам назначения. В отличие от случая broadcast-передачи, за абонентом остается выбор — принимать данные или нет. Важно знать, что для реализации multicast-передачи в IP-сети должны быть маршрутизаторы, поддерживающие multicast. Маршрутизаторы используют протокол IGMP (Internet Group Management Protocol — протокол управления группами Интернета) для отслеживания текущего состояния групп рассылки (а именно, членство в той или иной группе того или иного конечного узла сети). Основные правила работы протокола IGMP следующие: • конечный узел сети посылает пакет IGMP типа report для обеспечения запуска процесса подключения к группе рассылки; • узел не посылает никаких дополнительных пакетов при отключении от группы рассылки; • маршрутизатор multicast через определенные временные интервалы посылает в сеть запросы IGMP. Эти запросы позволяют определить текущее состояние групп рассылки; Ðèñ. 20.4. Передача трафика multicast
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 584 Часть VI. Цифровые системы ТВ вещания • узел посылает ответный пакет IGMP для каждой группы рассылки до тех пор, пока имеется хотя бы один клиент данной группы. Загрузка магистральной части сети multicast-трафиком зависит только от числа транслируемых в сети каналов. В ситуации с Gigabit Ethernet сетью, предположив, что половину магистрального трафика мы можем выделить под multicast-передачу, мы получаем около 125 телевизионных MPEG-2 каналов, каждый имеющий скорость потока данных 4 Мб/с. Разумеется, в IPTV-сети присутствуют одновременно все три вида трафика: broadcast, multicast и unicast. Оператор, планируя оптимальную пропускную способность сети, должен учитывать разный механизм влияния разных технологий IP-адресации на объем трафика. Например, оператор должен ясно представлять себе, что предоставление услуги «видео на заказ» большому числу абонентов требует очень высокой пропускной способности магистральной сети. Одним из решений этой проблемы является децентрализация в сети видеосерверов. В этом случае центральный видеосервер заменяется на несколько локальных серверов, разнесенных между собой и приближенных к периферийным сегментам многоуровневой иерархической архитектуры IP-сети. Рассмотрим подробнее компоненты сети IPTV (рис. 20.5). На приведенной схеме мы видим следующие компоненты сети IPTV: Компоненты головной аппаратной системы IPTV: • головная станция; Ðèñ. 20.5. Компоненты сети IPTV
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание Ðèñ. 20.6. • • • • • 585 Уровень доступа сети IPTV система условного доступа; видеосерверы; серверы биллинговой системы; серверы системы менеджмента; серверы промежуточного программного обеспечения (middleware). Компоненты опорной (магистральной) транспортной сети, в том числе: • собственно опорная (backbone) оптическая сеть на базе IP-технологии или технологии ATM; • высокопроизводительные коммутаторы (маршрутизаторы) с оптическими интерфейсами. Компоненты уровня доступа (рис. 20.6), состоящие, например для случая xDSL сети, из устанавливаемого в помещении АТС головного DSL устройства DSLAM (DSL access multiplexor) и медной пары (телефонной линии), непосредственно заведенной в дом к абоненту. В случае сети Ethernet в этой части сети мы будем иметь управляемые Ethernet-коммутаторы уровня доступа. Функции большинства серверов системы аналогичны таким же функциям для цифрового кабельного телевидения (DVB-C) и в пояснениях не нуждаются. Функции сервера middleware и соответствующего программного обеспечения имеют исключительно большое значение для понимания работы IPTV систем, поэтому остановимся на них подробнее.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 586 Часть VI. Цифровые системы ТВ вещания В самом общем случае под middleware понимают промежуточное программное обеспечение для содействия процессам обмена информацией между приложениями и ресурсами. Фактически в контексте интерактивного телевидения middleware выполняет функции управления видеоуслугами и доступом к ним. С одной стороны, middleware может предоставлять графический интерфейс для всех транзакций со стороны абонента (например, подписка на тот или иной пакет каналов, покупка фильмов в соответствии с услугой «видео по заказу», управление персональным видеомагнитофоном (услуга PVR) и для всех других сервисов, предоставляемых абоненту). С другой стороны, middleware взаимодействует с другими серверами IPTV (например, это могут быть серверы системы биллинга, системы управления абонентами, системы условного доступа, сервер «видео по заказу», сервер PVR и т. п.). Серверы и абонентские STB обмениваются информацией, используя IP-протокол. Middleware предоставляют абоненту возможность самостоятельно управлять процессом трансляции выбранного им видеоконтента, получать и отправлять оперативную информацию. Middleware обеспечивают аутентификацию и авторизацию пользователей (абонентов и администраторов), сбор статистики о предоставленных абоненту услугах. Middleware предоставляет абоненту и оператору разнообразные интерфейсы для доступа к системе, например следующие: • биллинговый интерфейс для проведения транзакций по оплате для доступа к информации о счете абонента; • интерфейс управления подпиской на услуги и пакеты; интерфейс взаимодействия с серверами VoD, PVR и др.; • интерфейс Electronic Programme Guide (EPG хорошо известен в обычном цифровом кабельном телевидении — это электронная программа передач (ЭПП), выводимая на экран телевизора в виде меню, которое указывает номер и название принимаемых каналов, категорию программ, время передачи и т. п.). Как правило, middleware предоставляет абоненту и оператору разные уровни доступа к системе, и для каждого уровня доступа имеются интерфейсы с разными наборами возможностей, поэтому различают абонентский интерфейс для взаимодействия системы с пользователем и служебный (административный) интерфейс управления и конфигурирования сервисов. В действительности все функции и сервисы middleware трудно заранее определить во всех деталях, и, как правило, при доведении проекта IPTV до стадии коммерческой эксплуатации middleware приходится не один раз дорабатывать под конкретную ситуацию.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Глава 20. Цифровое ТВ вещание 587 Другим важнейшим компонентом сети IPTV является головная станция. Основная функция головной станции IPTV — это формирование видеоконтента и последующая трансляция выходного потока видеоданных в формате Video over IP (видео по IP-протоколу). Также для магистральной (опорной части сети) может использоваться формат IP-Video over ATM (IP-видео поверх ATM). Это связано с широким распространением магистральных ATM-сетей. Для трансляции видеоконтента через ATM/SDH-сети многие операторы используют, например, хорошо известную станцию цифрового телевидения Teleste ATMux. Рассмотрим подробнее требования к головной станции IPTV. Современная станция IPTV должна работать с широким диапазоном входных источников видеоконтента, в том числе: • спутниковые ТВ каналы в формате DVB-S, получаемые через DVB-ASI интерфейс приемников или потоковых дескремблеров в режиме однопрограммного транспортного потока (SPTS) или многопрограммного транспортного потока (MPTS); • аналоговое и цифровое некомпрессированное видео, получаемое от студийного ТВ оборудования в форматах SDI, S-video, композитный видеосигнал, а также можно предположить использование в будущем цифровых интерфейсов DVI (Digital video interface) и HDMI (High-Definition Multimedia Interface); • эфирные цифровые программы через DVB-ASI интерфейс DVBT-приемников и, с меньшей вероятностью, аналоговые эфирные каналы в формате композитного видео, полученные с выхода аналоговых эфирных демодуляторов; • видеоконтент, передаваемый через транспортные сети в форматах IPTV (MPEG over IP), Video over ATM, IP-video over ATM. Формирование видеоконтента в форматах DVB-ASI (SPTS/ MPTS) производится обычной цифровой головной станцией DVB, которая часто уже существует у оператора и уже некоторое время обслуживает его кабельную DVB-C сеть. В самом простейшем случае это комплект спутниковых цифровых приемников с ASI-выходом. 20.5.3. Проблемы IPTV Пока IP-телевидение является дорогой цифровой технологией, так как относительно высоки цена оборудования и абонентская плата за скоростной Интернет. Основной технической проблемой для IPTV является обеспечение высокой гарантированной скорости передачи данных с малыми задержками и приоритетом видеотрафика. Для этого оператор, обслуживающий большое количества абонентов, должен иметь опорную
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 588 Часть VI. Цифровые системы ТВ вещания магистральную сеть (backbone) с очень высокой пропускной способностью и возможностью обеспечения высокого качества обслуживания (QoS). Последняя миля в сети должна также обеспечивать каждому абоненту гарантированно высокую скорость, которая в MPEG-2 в стандартном разрешении составляет 4. . . 6 Мбит/с, а с учётом того, что в семье могут одновременно смотреть два разных телеканала и работать в Интернете, полная скорость, предоставляемая абоненту, может даже превышать 10 Мбит/с. При трансляции телевидения высокой четкости эту цифру следует удвоить. Несколько лет назад высокая стоимость реализации таких решений была серьезным препятствием для инвестиций в проекты IPTV. Применение более эффективных алгоритмов сжатия (таких, как MPEG-4) позволит снизить требования к пропускной способности сети. Однако высокая стоимость и низкая доступность на рынке как головного, так и абонентского оборудования MPEG-4 не позволяли закладывать такие решения в текущие телекоммуникационные проекты. В заключение следует отметить, что IP-телевидение является перспективной технологией. С течением времени следует ожидать снижение стоимости оборудования и абонентской платы, что создаст экономически выгодную ситуацию для создания новых сетей IPTV. Контрольные вопросы 1. Система цифрового ТВ вещания ATSC, применяемая модуляция. 2. Система цифрового вещания DVB-T. 3. От чего зависит скорость передачи информации в канале DVB-T? 4. Какие виды модуляции используются в DVB-C и DVB-S? 5. Что затрудняет развитие наземного цифрового ТВ вещания? 6. Почему в DVB-T используется способ модуляции OFDM? 7. Зачем вводится защитный интервал при модуляции OFDM? 8. Основные отличия системы вещания DVB-T2 от DVB-T? 9. Сущность системы ISDB. 10. Сравнительный анализ систем цифрового ТВ вещания. 11. Почему в системах цифрового ТВ вещания не используется простая импульсная манипуляция? 12. Структура IPTV. 13. Цели и задачи IP-телевидения. 14. Чем отличается IPTV от вещательного телевидения?
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» ЗАКЛЮЧЕНИЕ Телевизионное вещание и ПТВ являются одним из самых распространённых средств информационного обслуживания населения. Телевидение продолжает непрерывно развиваться, затрагивая все части тракта ТВ вещания и прикладного телевидения. Телевидение высокой чёткости и стереотелевидение на цифровой основе получают всё более широкое распространение в мире. Телевизионная техника прочно входит в народное хозяйство для управления и контроля различных производственных процессов, углубления и облегчения научных исследований (ТВ микроскопия, астрономическое и космическое телевидение, ядерная энергетика и др.) и количественной обработки зрительной информации. Мы являемся свидетелями бурного развития систем охранного телевидения, которое может стать надёжным инструментом защиты людей и материальных ценностей от посягательств криминальных элементов, эффективно использоваться в борьбе с авариями, катастрофами и стихийными бедствиями. В последнее время нашли широкое применение телевизионные системы с обратными цифровыми каналами передачи информации от пользователей к соответствующим приемникам цифровой информации. Интерактивные системы в будущем займут первостепенное значение не только в телевизионном вещании, но и в системах прикладного телевидения. Особенно большой импульс получит в своем развитии телемедицина, дистанционное обучение и системы видеонаблюдения, контроля и управления производственными процессами. Обратные каналы могут быть использованы для проведения аудио- и видеоконференций с двусторонней связью между участниками, для передачи сигналов тревоги по кабельным и спутниковым системам связи в системах охранного телевидения, необходимых для принятия оперативных мер по пресечению правонарушений, для дистанционного контроля производственными процессами. Информационный канал кабельной распределительной сети обладает широкими возможностями, среди которых следует отметить организацию телефонных, видеотелефонных каналов связи и создание специализированных систем передачи данных различного назна-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 590 Заключение чения, таких, как системы охранной сигнализации, системы обеспечения деятельности различных отраслей народного хозяйства, а также экстренные вызовы милиции и скорой медицинской помощи. Особую актуальность в прикладном телевидении приобретают вопросы повышения информативности ТВ изображений — цветовое контрастирование и построение стереосистем. Использование компьютерной технологии позволит более эффективно использовать методы цветового кодирования черно-белых изображений, не прибегая к физическим моделям, что значительно повышает эффективность научных исследований и снижает ошибки при диагностике. Прикладное и вещательное телевидение развиваются гигантскими шагами, взаимодействуя между собой, они проникают во все области народного хозяйства и сферы человеческого общества: электронная микроскопия, диагностика в медицине и технике, космические исследования, интроскопия, охрана объектов и контроль производственных процессов там, где присутствие человека нежелательно или невозможно, использование в военном деле и др. Весьма актуальной является задача построения широкополосных сетей интегрального обслуживания, имеющих мультимедийный, мультисервисный характер. В данном случае под системами мультимедиа понимаются службы, с помощью которых возможно интегральное использование двух и более средств связи, например одновременная передача речевой информации и данных, факсимильных и видеосообщений. Кроме того, системы мультимедиа обладают интерактивностью, т. е. обеспечивают двухстороннюю связь, влияющую на характер передаваемой абонентам информации в режиме реального времени. Интерактивность позволяет получателям сообщений влиять на характер и содержание предоставляемых услуг. Среди эффективных массовых применений интерактивных систем особое место занимает телемедицина и дистанционное обучение. Цифровые технологии все глубже проникают в различные сферы деятельности человека. Системы видеонаблюдения на базе персонального компьютера оказались весьма перспективным этапом прикладного телевидения. Вычислительная техника существенно облегчает работу с видеоизображением, повышает качество изображения и сокращает ресурсозатраты. Разработаны и внедряются в технику вещательного и прикладного телевидния новые стандарты сжатия: H.264/AVC, обеспечивающий примерно в 2 раза большую степень сжатия, чем MPEG-4, и H.265/HEVC с коффициентом сжатия примерно в 2 раза большим, чем H.264/AVC. Новые стандарты интегрируют множество решений, часть из которых представляют собой дальнейшее развитие хорошо известных, стандартизованных в MPEG-2 и MPEG-4 [142].
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Заключение 591 Стандарт H.264 имеет более узкие границы применения. Он разработан для эффективного кодирования и помехоустойчивой передачи видео прямоугольного формата. Рассмотренные стандарты компрессии MPEG-4, H.264 и H.265/ HEVC находят применение в системах телевизионного вещания DVBT2, DVB-S2 и DVB-C2, а опытная эксплуатация подтвердила технические параметры аппаратуры.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» ЛИТЕРАТУРА 1. Квиринг Г.Ю. Прикладное телевидение: Учебное пособие. — М.: Изд. МЭИС, 1989. — 88 с. 2. Лейтес Л.С. Развитие техники ТВ вещания в России. Справочник. — М.: ФГУП «ТТЦ «Останкино», 2012. — 606 с. 3. Грязин Г.Н. Системы прикладного телевидения. — С.-Пб.: Политехника. 2000. — 278 с. 4. Гедзберг Ю.М. Охранное телевидение. — М.: Горячая линия — Телеком, 2005. — 310 с. 5. Телевидение: Учебник для вузов / Под ред. В.Е. Джаконии. — М.: Радио и связь, 2004. — 615 с. 6. Зубарев Ю.Б., Глориозов Г.Л. Передача изображений: Учебник для вузов. — М.: Радио и связь, 1989. — 333 с. 7. Самойлов В.Ф., Хромой Б.П. Телевидение: Учебник для вузов. — М.: Связь, 1975. — 400 с. 8. Смирнов А.В., Пескин А.Е. Цифровое телевидение — от теории к практике. — М.: Горячая линия — Телеком, 2005. — 352 с. 9. Безруков В.Н., Власюк И.В., Комаров П.Ю. Цифровое ТВ: Специфические искажения // Мобильные системы. 2006. № 11. С. 28–33. 10. Локшин Б.А. Цифровое вещание — от студии к телезрителю. — М., 2001. — 446 с. 11. Быков Р.Е. Теоретические основы телевидения. Учебник для вузов. — СПб.: Лань, 1998. — 288 с. 12. Ибрагим К.Ф. Телевизионные приемники. — М.: Мир, 2000. — 432 с. 13. Цифровое преобразование изображений / Под ред. Р.Е. Быкова. — М.: Горячая линия — Телеком, 2003. — 230 с. 14. Гласман К.Ф. Цифровая видеотехника: кодирование, обнаруживающее и исправляющее ошибки // Журнал «625». 1997. № 8. 15. Мамаев Н.Г., Мамаев Ю.Н., Теряев В.Г. Системы цифрового телевидения и радиовещания. — М.: Горячая линия — Телеком, 2006. — 256 с. 16. Бубович С.С. Устройство формирования синхроимпульсов и символов в изображении для ТВ системы с микроконтроллером // Микропроцессорные средства и системы. 1989. № 4. С. 54–56. 17. Артюшенко В.М., Шелухин О.И., Афонин М.Ю. Цифровое сжатие видеоинформации и звука. — М., 2004. — 426 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Литература 593 18. Цифровая обработка телевизионных и компьютерных изображений / Под ред. Ю.Б. Зубарева и В.П. Дворковича. — М., 1997. — 255 с. 19. Гласман К.Ф. Методы передачи данных в цифровом телевидении. Стандарт цифрового наземного телевидения. DVB-T // «625». 1999. № 9. С. 72. 20. Зубарев Ю.Б., Кривошеев М.И., Красносельский И.Н. Цифровое телевизионное вещание. — М.: НИИР, 2001. — 550 с. 21. Гласман К.Ф. Методы передачи данных в цифровом телевидении. Системы цифрового наземного телевизионного вещания ISDB-T // «625». 2000. № 2. С. 78. 22. Гласман К.Ф. Методы передачи данных в цифровом телевидении. Стандарт цифрового телевидения ATSC // «625». 1999. № 7. С. 68. 23. Кривошеев М.И., Федунин В.Г. Интерактивное телевидение. — М.: Радио и связь, 2000. — 342 с. 24. Стивенсон Д. Спутниковое телевидение. Практическое руководство. 2003. — 496 с. 25. Волков С.В. Сети кабельного телевидения. — М.: Горячая линия — Телеком. 2004. — 616 с. 26. Виноградов В. Уроки телемастера. — С. Петербург.: Лань, Корона принт, 1997. — 412 с. 27. Безруков В.Н., Игнатов Ф.М. Телевидение. — М., 2001. — 402 с. 28. Дамьяновски B. CCTV. Библия охранного телевидения / Пер. с англ. — М.: ООО «Ай-Эс-Эс Пресс», 2003. — 334 с. 29. Кругль Г. Профессиональное.видеонаблюдение. Практика и технологии аналогового и цифрового CCTV. — М.: Секюрити Фокус, 2010. — 640 с. 30. ГОСТ 7845-92. Система вещательного телевидения. Основные параметры. Методы измерений. 31. Балобанов В.Г. Основные принципы формирования синхронизирующих и испытательных сигналов: Учебное пособие.— М., 1981. — 60 с. 32. Балобанов В.Г. Цветные телевизоры с аналого-цифровой обработкой сигналов и цифровым управлением: Учебное пособие.— Самара, 1999. — 63 с. 33. Безруков В.Н. А.с. 748903 СССР. Способ передачи и воспроизведения сигнала изображения. Заявл. 1976. Опубл. 1980, Бюлл. № 26. 34. Лукин Н., Карякин-Черняк С., Янковский С. Практическая схемотехника современных телевизоров. Вып. 8. — М.: Солон & Наука и техника, 1996. — 241 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 594 Литература 35. Чирков Л., Ивин Л. Устройства отображения для телевизионного производства // «625». 2002. № 2. С. 5–41. 36. Безруков В.Н. Разработка и применение элементов теории преобразования сигналов изображений в системах прикладного телевидения. Автореферат диссертации на соискание учёной степени доктора технических наук. — М., 1996. 37. Балобанов В.Г., Балобанов А.В., Кривозубов В.П. Выбор алгоритма цветового кодирования черно-белых изображений для прикладного телевидения // Инфокоммуникационные технологии. 2005. T. 3, № 2. С. 45–48. 38. Балобанов В.Г. Блок цветового кодирования черно-белых изображений для ТВ системы прикладного телевидения // Тезисы докладов республиканской НТК. «Современные технические средства вещательного и прикладного телевидения». — М., 1994. 39. Балобанов А.В., Кривозубов В.П., Балобанов В.Г. Цветовое кодирование черно-белых изображений с помощью персонального компьютера // Инфокоммуникационные технологии. 2003. T. 1, № 3. С. 51–55. 40. Ерганжиев Н.А. Цветное телевидение в измерительной технике. — М.: Связь, 1980. — 102 с. 41. Балобанов В.Г., Горчаков Б.М. Исследование вопросов цифровой обработки видеосигнала при цветовом контрастировании чернобелых изображений // Информация, радиотехника, связь. Сб. трудов ученых Поволжья. Вып. № 5, Самара, 2000. С. 24–27. 42. Новаковский С.В. Цветное телевидение. — М.: Связь, 1975. — 376 с. 43. Антипин М.В. Интегральная оценка качества изображения. — М.: Наука, 1970. — 154 с. 44. Кондратьев А.Г., Лукин М.И. Техника промышленного телевидения. — Лениздат, 1976. — 503 с. 45. Ложкин Л.Д., Неганов В.А. Цвет, его измерение, воспроизведение и восприятие в телевидении. Часть 1. — Самара, 2013. — 287 с. 46. Житомирский М., Авдеев Г. Маленький большой экран // «625». 2007. № 4. С. 7–40. 47. Левченко В.Н. Спутниковое телевидение. — М., С.-Петербург: DHV — Санкт-Петербург, 1998. — 288 с. 48. Гласман К.Ф. Видеокомпрессия // «625». 1997. № 7. С. 60. 49. Безруков В.Н. Анализ характеристик спектра ортоганальных структур квазипериодической дискретизации в системах телевидения // Радиотехника. 1989. № 12. C. 3–7. 50. Пескин А.Е., Труфанов В.Ф. Мировое вещательное телевидение. Стандарты и системы. Справочник. — М.: Горячая линия — Телеком, 2004. — 307 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Литература 595 51. Практика измерений в телевизионной технике. Выпуск 11. — M.: Солон, Наука и техника, 1996. — 192 с. 52. Безруков В.Н. Принципы построения и анализа спектра структур дискретизации телевизионных изображений // Журнал ТК и Т. 1990. № 7. C. 7–23. 53. Телевизионная техника. Справочник / Под ред. Ю.Б. Зубарева и Г.Л. Глориозова. — М.: Радио и связь, 1994. — 313 с. 54. Преобразование стандартов. Применение технических решений // «625». 2005. № 7. С. 79. 55. Геращенко А.В. Телевидение в вашем доме. — Ростов-наДону: Феникс, 2003. — 442 с. 56. Карякин В.Л. Цифровое телевидение: Учебное пособие. — М.: Солон-Пресс, 2008. — 270 с. 57. Кривошеев М.И. Основы телевизионных измерений. — М.: Радио и связь, 1989. — 608 с. 58. Гуглин И.Н. Электронный синтез телевизионных изображений. — М.: Советское радио, 1979. — 247 с. 59. Самарин А.В. Жидкокристаллические дисплеи. Схемотехника, конструкция и применение. — М.: Солон-Р, 2002. — 304 с. 60. Мамчев Г.В. Основы радиосвязи и телевидения. Учебное пособие для вузов. — М.: Горячая линяя — Телеком, 2007. — 416 с. 61. Петраков А.В., Лагутин В.С. Телеохрана. — М.: Солон-Пресс, 2007. — 404 с. 62. Смирнов А.В. Основы цифрового телевидения. — М.: Горячая линяя — Телеком, 2001. — 224 с. 63. Безруков В.Н. Разработка и применение элементов теории преобразования сигналов изображений в системах прикладного телевидения. Диссертация на соискание учёной степени доктора технических наук. — М.: 1996. — 229 с. 64. Безруков В.Н., Коженов А.П., Шауро А.В., Алешкин В.Н. Особенности пространственно-временного спектра подвижных объектов в условиях оптического контроля // Математические методы обработки географической информации. Сб. статей: АН СССР, Институт физики земли им. О.Ю. Шмидта. — М.: Наука, 1986. — С. 114–136. 65. Ярославский Л.П. Введение в цифровую обработку изображений. — М.: Сов. радио, 1979. — 312 с. 66. Хемминг Р.В. Цифровые фильтры. Пер. с англ. / Под ред. Трахтмана. — М.: Сов. радио. 1980. — 224 с. 67. Игнатьев Н.К. Дискретизация и её применение. — М.: Связь, 1964. — 235 с. 68. Цифровое кодирование телевизионных изображений / Под ред. И.И. Цуккермана. — М.: Радио и связь, 1981. — 240 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 596 Литература 69. Прэтт У. Цифровая обработка изображений. Пер. с англ. / Под ред. Д.С. Лебедева. — М.: Мир. 1982. Кн. 1. — 310 с.; Кн. 2. — 480 с. 70. Колмогоров А.Н., Фомин С.В. Элементы теории функции и функционального анализа. — М.: Наука, 1981. — 542 с. 71. Безруков В.Н. О некоторых особенностях характеристик зрительной системы наблюдателя телевизионных изображений // Труды уч. инст. связи. 1976. Вып. 74. С. 28–36. 72. Безруков В.Н., Жданов В.В. Методы передачи ТВ сигналов с дополнительной дискретизацией // Электросвязь. 1982. № 3. С. 11–15. 73. Безруков В.Н. Способ формирования телевизионного сигнала цветного изображения и устройство для его реализации. А.С. СССР № 1211892 МПК НО4 № 9/04 от 15.02.86 Бюл. № 6, заявлен 27.05.83 г. 74. Безруков В.Н., Кулагин П.А., Игнатов Ф.М., Кузенко В.П. Способ формирования телевизионного сигнала цветного изображения и устройство для реализации. А.с. 170460 СССР. Опубл. 1988. 75. Красильников Н.Н. Теория передачи и восприятия изображений. — М.: Радио и связь, 1986. — 248 с. 76. Брайс Р. Справочник по цифровому телевидению. Пер. с англ. — Жуковский: Эра, 2001. — 230 с. 77. Кривошеев М.И., Виленчик Л.С. и др. Цифровое телевидение. — М.: Связь, 1980. — 260 с. 78. Лебедев Д.С., Цуккерман И.И. Телевидение и теория информации. — М.: Энергия, 1965. — 219 с. 79. Ряхин А. Видеостандарт MPEG // «625». 1996. № 6. 80. Мамчев Г.В. Основы цифрового телевидения: Учебное пособие. — Новосибирск: Сибирский государственный университет телекоммуникаций и информатики, 2003. — 247 с. 81. Быков Р.Е. Основы телевидения и видеотехники. — М.: Горячая линия — Телеком, 2006. — 399 с. 82. Яне. Цифровая обработка изображений / Пер. с англ. — М.: Техносфера, 2007. — 583 с. 83. Быстродействующие интегральные микросхемы ЦАП и АЦП и измерение их параметров / Под ред А.-Й.К. Марцинкявичюса и Э.-А.К Багданскиса. — М.: Радио и связь, 1988. 84. Кривошеев М.И. Цифровое телевидение: Учебное пособие по курсу телевидения. — М.: ВЗЭИС, 1985. — С. 28–43. 85. Новаковский С.В., Котельников А.В. Новые системы телевидения. Цифровые методы обработки видеосигналов. — М.: Радио и связь, 1992. — 89 с. 86. Уоткинсон Д. Пособие для инженеров по сжатию цифровых потоков. Пер. с англ. — M.: ЗАО «Снелл и Уилкокс», 1994. — 64 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Литература 597 87. Птачек М. Цифровое телевидение. Теория и техника. Пер. с чешского / Под ред. Л.С. Виленчика. — М.: Радио и связь, 1990. — 528 с. 88. Безруков В.Н., Рабинович А.В. Методы сжатия ТВ информации на основе ДКП. Учебное пособие. — М.: МТУСИ, 2006. — 19 с. 89. Бабенко В.С. Оптика телевизионных устройств. — М.: Радио и связь, 1982. — 257 с. 90. Безруков В.Н., Власюк И.В., Комаров П.Ю. Мультипликативные амплитудные искажения оптического отображения видеоинформации в пространстве кадра при телевизионном контроле объектов // Метрология и измерительная техника в связи. 2005. № 5 (47). С. 24–30. 91. Кривошеев М.Н. Перспективы развития телевидения. — М.: Радио и связь, 1982. 92. Новаковский С.В. Перспективные пути и формы развития ТВ вещания // Техника кино и телевидения. 1983. № 11. C. 37–39. 93. Балобанов В.Г., Куляс О.Л., Камалягин А.А. Телевизионный сканирирующий комплекс для РЭМ // Тезисы докладов 4 Всесоюзного симпозиума по РЭМ и аналитическим методам исследования твёрдых тел. Звенигород, 1984. 94. Петухова Е. Телевидение высокой чёткости — обратный счёт // Телеспутник. 2007. № 9. C. 54–58. 95. Кривошеев М.И. Международная стандартизация цифрового телевизионного вещания. — М.: НИИР, 2006. — 928 с. 96. Безруков В.Н., Королёв А.В., Ляпунов В.Н., Новаковская О.С. Выбор параметров систем телевидения высокой визуальной чёткости и качества // Техника кино и телевидения. 1985. № 10. C. 22–28. 97. Никоноров С.И., Хлебородов В.А. Актуальные проблемы вещательного телевидения (по материалам 13 Международного симпозиума в Леонитре) // Техника кино и телевидения. 1984. № 1. C. 56–66. 98. Бытовая радиоэлектронная аппаратура // Электроника за рубежом. 1984. C. 470–476. 99. Безруков В.Н., Малочинская Н.Л. Способ приёма изображения в малокадровом телевидении. А.С. СССР № 832772. МПК НОЧ № 9/04. Опубл. 1981. Бюлл. № 19. 100. Kelly D.H. Visual Responses to Time — Depended Stimuli, 1. Amlitude Sensitivity Measurements // J. Opt. Soc. Am. 1961. 51, № 4, P. 422–429. 101. Robson J.G. Spatial and temporal contrast sensitivity Function of the visual // J. Opt. Soc. Am. 1966. 56. № 8. P. 1141–1142.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 598 Литература 102. Безруков В.Н., Ахметов Ж.К. О временной частотной характеристике оконечного устройства телевизионной системы // Технические науки (Алма-Ата) 1975. Bып. 19. C. 92–102. 103. Росаткевич Г. ТВЧ — аргумент в конкурентной борьбе // «625». 2002. № 2. C. 74–78. 104. Росселевич И. А., Лепунов В.Н., Борисов А.А. Королёв А.В., Новоковский С.В., Безруков В.Н., Полосин Л.Л. Перспективные параметры телевидения высокого разрешения // Техника кино и телевидения. 1987. № 1. C. 5–11. 105. Безруков В.Н. Анализ характеристик спектра ортогональных структур квазипериодической дискретизации в системах телевидения // Радиотехника. 1989. № 12. C. 3–7. 106. Безруков В.Н., Ваниев А.Г., Новаковский С.В. Способ развёртки ТВ изображения электронным лучом в ортотрубочных камерах цветного телевидения со штриховыми цветофильтрами и устройством для его осуществления. А.c. СССР № 1424138. МПК НОЧ № 9/07. 107. Твердотельная революция в телевидении / Под ред. А.А. Умбиталиева и А.К. Цицулина. — М.: Радио и связь. 2006. — 310 с. 108. Игнатов Ф.М. Джумая Хасан Алюсиф Мухиб. Твердотельные преобразователи «свет-сигнал> // Труды МТУСИ. 2008. T. 1. C. 451–458. 109. Малков А.В. IP-камеры для безопасности крупных городов // CCTV. 2005. Каталог продукции. C. 31–32. 110. www.foveon.com. 111. Тарасов В.В., Якушенков Ю.Г. Инфракрасные системы «смотрящего типа». — М.: Логос, 2004. — 444 с. 112. Гласман К.Ф. Телевидение высокой чёткости // «625». 2007, № 10. C. 71–74. 113. Davidson M.L. Perturbation Approach to Spatial Brightness Interaction in Human Vision // J. Opt. Soc. Am. 1968. 58, № 9. P. 1300–1308. 114. Авраменко А., Мухин И., Украинский О. Формирование растра в жидкокристаллических дисплеях с активной матрицей // «625». 2007, № 9. C. 90–94. 115. Данилов В.А., Мазуров А.И. Цветовое контрастирование изображений малоконтрастных объектов // Техника средств связи. Cерия «Телевидение», вып. 2. — М., 1985. 116. Безруков В.Н. Неортогональный телевизионный контроль видеоинформационного пространства в системах прикладного телевидения // Приборы и системы управления, контроль, диагностика. 2008. № 1. С. 48–52.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Литература 599 117. Безруков В.Н. Способ формирования телевизионного сигнала. А.С. СССР № 1100754. МПК НО4 № 9/04 от 30.06.84, заявлен 31.03.81 г. 118. Безруков В.Н. Фазо-временные преобразования структуры пространственного спектра сигналов изображения в системах телевидения // Труды МТУСИ. 2008. Том 1. C. 431–436. 119. Балобанов А.В., Басекеев А.А., Власюк И.В. Анализ пространственно-частотных характеристик распределения светочувствительных элементов в пределах растра матрицы ПЗС. // Метрология и измерительная техника в связи. 2006. № 3. C. 36–40. 120. Власюк И.В. Метод построения пространственных характеристик телевизионных камер // Метрология и измерительная техника в связи. 2005. № 6. C. 13–16. 121. Безруков В.Н., Беляев В.С., Дерибис Г.Т. и др. Проектирование и техническая эксплуатация телевизионной аппаратуры. Учебное пособие для вузов. Под ред. С.В. Новаковского. — М.: Радио и связь, 1994. 122. Методы передачи изображений. Сокращение избыточности / Под ред. У.К. Прэтта. Пер. с англ. под ред. Л.С. Виленчика. — М.: Радио и связь. 1983. — 264 с. 123. Скляр Б. Цифровая связь: Теоретические основы и практическое применение. 2-е издание, исправл. / Пер. с англ. под ред. А.В. Назаренко. — М.: СПб.-Киев: Изд. дом «Вильямс», 2003. — 1104 с. 124. Быков Р.Е., Фрайер Р., Иванов К.В., Манцветов А.А. Цифровое преобразование изображений: Учебное пособие для вузов / Под ред. Р.Е. Быкова. — М.: Горячая линия — Телеком, 2003. —228 с. 125. Вернер М. Основы кодирования: Учебник для вузов / Пер. с нем. — М.: Техносфера, 2004. — 288 с. 126. Сэломон Д. Сжатие данных, изображений и звука: Учебное пособие для вузов / Пер. с англ. — М.: Техносфера, 2004. — 368 с. 127. Ричардсон Ян. Видеокодирование. Н.264 и MPEG-4 — стандарты нового поколения / Пер. с англ. — М.: Техносфера, 2005. — 368 с. 128. Морелос-Сарогоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение / Пер. с англ. — М.: Техносфера, 2005. — 320 с. 129. Уэлстид С. Фракталы и вейвлеты для сжатия изображений в действии. Учебное пособие. — М.: Триумф, 2003. — 320 с. 130. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в МАТLAB: Учебное пособие. — М.: ДМК Пресс, 2005. — 304 с. 131. Урмахер Л.С. Оптика фотографических и аэрограмметрических приборов. — М.: Недра, 1965. — 240 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 600 Литература 132. Самохин В.П. Кинопроекторы // Техника и технология кино. 2008. № 6. С. 48–51. 133. Серов А.В. DVB-T2: второе поколение эфирной «цифры» // MediaVision. 2011. № 7. С. 29–31. 134. Балобанов А.В., Балобанов В.Г. Алгоритмы цветокодирования для получения максимальной информационной емкости чернобелых изображений // Материалы XVII Российской научной конференции профессорно-преподавательского состава, научных сотрудников и алгоритмов. — Самара, 2010. — C. 138–139. 135. Лебедев Д.С., Цукерман И.И. Телевидение и теория информации. — М.: Энергия, 1965. — 218 с. 136. Кривозубов В.П., Захарова Н.О., Николаева А.В. Дигитальная обработка рентгеновских снимков: интерпретация, распознавание, диагностика. — Самара, 2008. — 286 с. 137. Гонсалес Р., Вуде Р. Цифровая обработка изображений / Пер. с англ. — М.: Техносфера, 2005. — 1072 с. 138. Балобанов В.Г., Безруков В.Н., Балобанов А.В. Учет особенностей зрительного восприятия цветных изображений при выборе оптимального алгоритма цветокодирования черно-белых изображений // Материалы XVII Российской НК ППС, НС и аспирантов. — Самара, 2010. — C. 137–138. 139. Джад Д., Вышецки Г. Цвет в науке и технике / Пер. с англ. — М.: Мир, 1978. — 592 с. 140. Цуккерман И.И. Цифровое кодирование телевизионных изображений. — М.: Радио и связь, 1981. — 240 с. 141. Серов А.В. Эфирное цифровое телевидение DVB-T/H. — С.-Петербург: БХВ-Петербург, 2010. — 464 с. 142. Понаморёв О.Г., Шаробайко М.П., Поздняков А.А. Анализ эффективности методов и алгоритмов видеокомпрессии стандарта H.265/HEVC // Элекросвязь. 2013, № 3. С. 29. 143. Сергеенко В.С., Баринов В.В. Сжатие данных, речи, звука и изображений в телекоммуникационных системах. Ученое пособие. — М.: РадиоСофт, 2011. — 360 с. 144. Катаев С.И., Волков Ю.С. Способ приёма изображений на расстоянии. А.с. № 32005 от 30.09.1933 г., заявлен 20.09.1931 г. 145. Теория и практика цифровой обработки сигналов (по материалам международной конференции DSPA’98). Доклад А.В. Дворковича и др. 146. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы (Теория и практика). — М.: Техносфера, 2012. — 1007 с. 147. Ричардсон Я. Видеокодирование H.264 и MPEG-4 — стандарты нового поколения. — M: Техносфера, 2005. — 366 с.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Литература 601 148. Безруков В.Н., Медведев А.А., Седов М.О. Анализ характеристик спектра структур внутрикадровой дискретизации // TComm. Коммуникации и транспорт. 2009. № 5. С. 14–17. 149. Безруков В.Н., Романов С.Г., Седов М.О. Адаптивность при сжатии спектра сигналов изображений в системах цифового телевидения // Электросвязь. 2013. № 3. С. 22–26. 150. List P., Joch A., Lainema J., Bjontegaard G., Karczewicz M. Adaptive deblocking filter // IEEE Trans. on Circuits and Syst. for Video Tech. 2003. Vol. 13, № 7. P. 614–619. 151. Медведев А.А. Методы и устройства компенсации искажений спектров сигналов изображений цифрового вещательного телевидения. Автореферат диссертаии на соискание учёной степени кандидата технических наук. — М.: Инсвязьиздат, 2010. — 24 с. 152. ITU-T Recommendation H.263. Advanced video coding for generic audiovisual services, 2009. 153. AudioVideo Coding Standart Working Group of China. Video coding standart 1.0 Beijing, China. 2003. 154. Hu S., Zhang X., Yang Z. Efficient Implementation of Interpolation for AVS // Congress on image and signal processing, 2008. Vol 3. P. 133–138. 155. Sullivan G.J. Thomas Wiegand Video Compression — From Concepts to the H.264/AVC Standard // Proc. of the IEEE. 2004. Vol. 93. P. 18–31. 156. Sullivan G.J. Multi-hypothesis motion compensation for low bitrate video coding // IEEE Intl. Conf. on Acoust., Speech, Signal Proc. (ICASSP), Minneapolis, MN. 1993. P. 437–440. 157. Orchard M.T., Sullivan G.J. Overlapped block motion compensation: an estimation-theoretic approach // IEEE Trans. on Image Proc. 1994. Vol. 3, № 5. P. 693–699. 158. Flierl M., Wiegand T., Girod B. A locally optimal design algorithm for block-based multi-hypothesis motion compensated prediction // IEEE Data Compression Conference (DCC), Snowbird, UT, USA. 1998. P. 239–248. 159. Flierl M., Girod B. Generalized B pictures and the draft JVT/ H.264 video compression standard // IEEE Trans. On Circuits and Syst. for Video Tech. 2003. Vol. 13, № 7. P. 587–597. 160. Ribas-Corbera J., Chou P.A., Regunathan S.L. A generalized hypothetical reference decoder for H.264/AVC // IEEE Trans. on Circuits and Syst. for Video Tech. 2003. Vol. 13, № 7. P. 674–687. 161. ITU-T and ISO/IEC JTC 1. Advanced video coding for generic audiovisual services. ITU-T Rec. H.264 and ISO/IEC 14496-10.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Оглавление Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ЧАСТЬ I. ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ ПРИКЛАДНОГО И ВЕЩАТЕЛЬНОГО ТЕЛЕВИДЕНИЯ 3 4 Глава 1. Основные принципы телевидения . . . . . . . . . . . . . . . . . . . . . 1.1. Свет и телевидение. Световые единицы . . . . . . . . . . . . . . . 1.2. Вычисление количества света, падающего на фотоприёмник . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Согласование параметров оптического и ТВ изображений с характеристиками зрения . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 2. Прикладное телевидение как средство видеонаблюдения, технологического контроля и управления производственными процессами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1. Информационные свойства прикладных телевизионных систем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Задачи, решаемые телевизионными средствами в различных областях народного хозяйства . . . . . . . . . . . . . . . . 2.3. Технико-экономическая оценка использования системы промышленного телевидения как средства охраны контроля, управления и автоматизации . . . . . . . . . . . . . . . . . . . 2.4. Требования, предъявляемые к телевизионным промышленным системам . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Функциональная схема промышленной телевизионной системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6. Принципы построения телевизионных систем с цифровой обработкой сигналов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7. Системы телевизионного наблюдения для офисов и квартир . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Особенности построения систем охранного телевидения Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 3. Телевизионные системы охраны объектов и наблюдения за производственными процессами . . . . . . . . . . . . . . . . . . . . 3.1. Видеокамеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Среды передачи телевизионных сигналов . . . . . . . . . . . . . 3.3. Принцип работы оптического волокна . . . . . . . . . . . . . . . . . 3.4. Сжатие видеоданных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 15 20 25 44 45 45 52 55 58 60 63 65 68 70 71 74 84 85 86
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Оглавление 603 3.5. 3.6. 3.7. 3.8. 3.9. 3.10. 3.11. IP-видеокамеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Мультиплексор . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Детекторы движения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Устройства видеозаписи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Охранные видеомагнитофоны. . . . . . . . . . . . . . . . . . . . . . . . . . 99 Видеорегистраторы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Типовые примеры построения систем видеонаблюдения и охраны объектов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 3.12. Современные принципы построения систем охранного телевидения и регистрации изображений на примере VideoNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 3.13. Неортоганальный телевизионный контроль видеоинформационного пространства в системах прикладного телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.14. Специфика реализации цифровых систем эффективного видеоконтроля удаленных объектов . . . . . . . . . . . . . . . . . 125 Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Глава 4. Системы телевидения с высокой визуальной четкостью 136 4.1. Краткие сведения о системах телевидения высокой четкости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 4.2. Стандарты ТВЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 4.3. Телевидение сверхвысокой четкости . . . . . . . . . . . . . . . . . . . 144 4.4. Выбор параметров систем телевидения высокой визуальной четкости и качества . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 4.5. Цифровой кинематограф . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 ЧАСТЬ II. ПРИНЦИПЫ ПОСТРОЕНИЯ ТВЕРДОТЕЛЬНЫХ ПРЕОБРАЗОВАТЕЛЕЙ «СВЕТ-СИГНАЛ» И «СИГНАЛ-СВЕТ» Глава 5. Твердотельные фотоэлектрические преобразователи изображения «свет-сигнал» . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1. Приборы с зарядовой связью (ПЗС) . . . . . . . . . . . . . . . . . . . 5.2. Считывание потенциального рельефа с матрицы ПЗС . 5.3. Цветные ПЗС-камеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4. Электронный затвор — затвор с переменной экспозицией . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. ПЗС-матрица как устройство дискретизации . . . . . . . . . . 5.6. Видеокамеры на фоточувствительных КМОП-матрицах. Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 6. Преобразователи «сигнал-свет» . . . . . . . . . . . . . . . . . . . . . . 6.1. Жидкокристаллические экраны . . . . . . . . . . . . . . . . . . . . . . . 6.2. Плоские плазменные панели . . . . . . . . . . . . . . . . . . . . . . . . . . 160 160 164 171 172 174 176 189 190 190 197
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 604 Оглавление 6.3. Проекционные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4. Мониторы завтрашнего дня . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5. Мониторы с автоэлектронной эмиссией (технология FED) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 204 204 205 ЧАСТЬ III. РАЗВЁРТЫВАЮЩИЕ И СИНХРОНИЗИРУЮЩИЕ УСТРОЙСТВА В ТЕЛЕВИДЕНИИ Глава 7. 7.1. 7.2. 7.3. 7.4. Глава 8. 8.1. 8.2. 8.3. 8.4. 8.5. 8.6. 8.7. Глава 9. 9.1. 9.2. 9.3. 9.4. Виды развёрток в телевидении . . . . . . . . . . . . . . . . . . . . . . . . Построчная развёртка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Чересстрочная развёртка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Спиральная развёртка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Цифровая схема развёртки . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Синхронизация развёртывающих устройств в телевидении . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Принципы формирования сигналов синхронизации . . . . . Упрощенная схема синхрогенеретора. . . . . . . . . . . . . . . . . . . Метод цифрового формирования сигналов синхронизации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Формирование импульсов строчной развёртки . . . . . . . . Формирование импульсов кадровой частоты . . . . . . . . . . . Формирование СС и ГС . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Структурная схема синхрогенератора . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Принципы формирования сигналов телевизионных испытательных изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Назначение сигналов испытательных изображений . . . . Синтез испытательных изображений . . . . . . . . . . . . . . . . . . . Принципиальные схемы датчиков ИС . . . . . . . . . . . . . . . . . . Формирование телевизионной испытательной таблицы Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 207 209 212 217 220 221 221 225 226 227 231 235 237 240 242 242 245 248 254 265 ЧАСТЬ IV. ПОВЫШЕНИЕ ИНФОРМАЦИОННОЙ ЁМКОСТИ ТЕЛЕВИЗИОННЫХ ИЗОБРАЖЕНИЙ Глава 10. Повышение информативности чёрно-белых изображений в прикладном телевидении . . . . . . . . . . . . . . . . . . . . . . . . 266 10.1. Цветовое контрастирование — наиболее эффективный способ повышения информативности черно-белых изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 10.2. Характеристики сигналов цветовых составляющих в системах телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Оглавление 605 10.3. Принцип построения цветокодирующих устройств дискретного типа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4. Дополнительные способы повышения информативности чёрно-белых изображений при цветовом контрастировании . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 11. Объёмное телевидение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 314 315 11.1. Основы стереотелевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Многоракурсное телевидение . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3. Голография и телевидение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 316 317 319 283 ЧАСТЬ V. ЦИФРОВОЕ ПРЕОБРАЗОВАНИЕ ИЗОБРАЖЕНИЙ В ТЕЛЕВИДЕНИИ Глава 12. Общие принципы преобразования аналогового видеосигнала в цифровой . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1. Импульсно-кодовая модуляция . . . . . . . . . . . . . . . . . . . . . . . . 12.2. Обобщенная структурная схема тракта цифрового телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3. Дискретизация телевизионного сигнала . . . . . . . . . . . . . . . 12.4. Квантование телевизионного сигнала . . . . . . . . . . . . . . . . . 12.5. Цифровое кодирование телевизионного сигнала . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 13. Принципы построения и анализа структур дискретизации телевизионных изображения . . . . . . . . . . . . . . . . . . . . . . 13.1. Анализ характеристик спектра ортогональных структур квазипериодической дискретизации в системах телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2. Принципы построения и анализа характеристик спектра структур квазипериодической неравномерной дискретизации телевизионных изображений . . . . . . . . . . . . . . . . . . . . 13.3. Результаты анализа характеристик спектра структур внутрикадровой дискретизации сигналов телевизионных изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4. Характеристики и параметры квазипериодической дискретизации видеоинформации в ограниченной многомерной зоне . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 14. Основные элементы цифрового преобразования сигналов изображения в аппаратуре сжатия цифрового потока . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 322 327 329 334 337 343 344 345 352 363 374 381 383
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» 606 Оглавление 14.1. Применение элементов цифровой телевизионной аппаратуры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2. Формирование цифрового телевизионного сигнала . . . 14.3. Основные параметры и характеристики ЦАП . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 15. Принципы построения систем сжатия цифрового потока сигналов изображения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.1. Формирователи цифровых телевизионных потоков . . . . 15.2. Структурная схема цифровой телевизионной системы . 15.3. Свойства телевизионного сигнала. . . . . . . . . . . . . . . . . . . . . . 15.4. Теоретические основы преобразования аналогового видеосигнала в цифровой . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.5. Структурная схема сжатия неподвижных изображений по стандарту JPEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.6. Кодирование видеоданных по стандарту MPEG . . . . . . . . 15.7. Достижимые степени сжатия на основе ДKП . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 16. Современные стандарты сжатия цифрового потока . . . . 16.1. Стандарт сжатия движущихся изображений MPEG-2 . . 16.2. Основные особенности метода кодирования H.264/AVC 16.3. Стандарт представления медиаобъектов MPEG-4 . . . . . . 16.4. Мультимедийный стандарт MPEG-7. . . . . . . . . . . . . . . . . . . . 16.5. Вейвлет-преобразование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.6. Векторное квантование. Фрактальное кодирование . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 17. Энтропийное кодирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.1. Информация и энтропия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.2. Кодирование Хаффмана . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.3. Арифметическое кодирование . . . . . . . . . . . . . . . . . . . . . . . . . 17.4. Кодирование текстовых сообщений . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 18. Относительные преобразования структуры многомерного спектра изображения в системах цифрового телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.1. Фазо-временные преобразования пространственного спектра сигналов изображений в системах телевидения 18.2. Амплитудные и амплитудно-частотные преобразования характеристик сигналов изображений в системах телевидения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 384 407 411 412 412 414 415 421 429 430 441 443 444 444 462 494 495 496 502 503 505 505 510 514 519 528 529 531 537 546
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Оглавление 607 ЧАСТЬ VI. ЦИФРОВЫЕ СИСТЕМЫ ТВ ВЕЩАНИЯ Глава 19. Передача телевизионного сигнала в цифровой форме по каналу связи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19.1. Формирование потоков цифрового ТВ сигнала . . . . . . . . 19.2. Канальное кодирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19.3. Цифровые способы модуляции . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 20. Цифровое ТВ вещание . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.1. Развитие цифрового ТВ вещания . . . . . . . . . . . . . . . . . . . . . . 20.2. Система ATSC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.3. Система DVB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.4. Система ISDB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.5. IP-телевидение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Контрольные вопросы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548 548 548 550 568 569 569 569 570 575 579 588 589 592
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Ðèñ. 10.6. Диаграмма цветности МКО; D65 — точка белого для стандартного излучателя МКО D65 Ðèñ. 10.7. График цветностей xy МКО 1931 и границы цветовых охватов: (1) реальных цветов с практически максимальных цветовым охватом; (2) излучателей, использованных Райтом при нахождении кривых сложения для стандартного цветового наблюдателя; (3) основных аддитивных цветов, рекомендованных стандартом sRGB; (4) печатных красок, рекомендованных стандартом Euroscale для офсетной печати на мелованной бумаге Ðèñ. 10.9. Ðèñ. 10.8. Положения областей цветности различных цветов на спектральным локусе (графике МКО 1931 в обозначениях системы ISCC-NBS) Эллипсы Мак Адама нанесенные на график МКО 1931 г. (для наглядности представления эллипсы увеличены в 10 раз). Эти эллипсы приблизительно соответствуют пределам, границы которых для стандартного наблюдателя соответствуют области визуально одинаковой цветности
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Окно программы: цветное изображение Ðèñ. 10.24. Главное окно программы (вкладка 3) Ðèñ. 10.25. Изображение «челюсть», 8 цветовых участков Ðèñ. 10.26.