Текст
                    БИБЛИОТЕКА ПО АВТОМАТИКЕ
Выпуск 433
Н. Н. САВЕТА
ЧИТАЮЩИЕ АВТОМАТЫ
S
«ЭНЕРГИЯ»
Ленинградское отделение
1971


УДК 681.17:681.14 РЕДАКЦИОННАЯ КОЛЛЕГИЯ: И. В. Антик, А. И. Бертинов, А. А. Воронов, Д. А. Жучков, Л. М. Закс, В. С. Малов, В. Э. Низе, О. В. Слежановский, Б. С. Сотсков, Ф. Е. Темников, А. С. Шаталов Н. Н. Савета С 12 Читающие автоматы Л., «Энергия», 1971.  88 с. с рис. (Библиотека по автоматике.) В книге описываются устройство, принцип дейст- вия и основные особенности современного читающего автомата, а также специальные (кодированные, нор- мализованные и стилизованные) шрифты. На основе предлагаемой систематизации методов и средств автоматического чтения лисьменной инфор- мации рассматриваются оптические и магнитные чи- тающие устройства отечественного и зарубежного производства, приводятся тиСлицы их технико-эксплу- атационных характеристик. Высказываются некоторые соображения" об основных направлениях развития средств автоматического чтения алфавитно-цифровой информации. Книга рассчитана на широкий круг читателей, ин- тересующихся вычислительной техникой, и может быть полезной для студентов соответствующих спе- циальностей. 3-3-13 249-71 6П2.15
ПРЕДИСЛОВИЕ Широкое внедрение вычислительной техники в различные сферы челове- ческой деятельности предъявляет повышенные требования к средствам под- готовки, преобразования и ввода исходных данных в ЭЦВМ. При существующей технологии обработки информации на ЭЦВМ дан- ные с первичных документов вручную переносятся на перфорационные или магнитные носители информации, а затем с помощью считывающих устройств вводятся в машину. На первых этапах развития и использования средств вычислительной техники, когда объем информации, подлежащей обработке на ЭЦВМ, был сравнительно невелик, такая подготовка исходных данных не вызывала особых затруднений. Однако в настоящее время этот процесс становится одним из самых дорогих и ненадежных. Статистические данные свидетельствуют, что при решении ряда планово- экономических, торговых, финансовых, транспортных, производственно-техни- ческих, научно-исследовательских и других задач на подготовку промежу- точных носителей информации затрачивается около 80% времени, необходи- мого для решения самой задачи. Это происходит потому, что существующие документы непригодны для непосредственного использования в традицион- ных устройствах ввода информации ЭЦВМ. Несовершенство существующих методов подготовки промежуточных но- сителей информации (перфокарт, перфорационных и магнитных лент) и спо- собов ввода исходных данных в ЭЦВМ вызвало интенсивное развитие новых средств вычислительной техники — устройств автоматического чтения пись- менной информации. Новые средства вычислительной техники несмотря на их сложность, сравнительно большую стоимость и некоторое несовершенство начинают успешно использоваться в ряде областей человеческой деятельности. Эффек- тивность их внедрения подтверждается практикой эксплуатации как в нашей стране, так и за рубежом. Первые неудачи, связанные с техническим несовершенством ранних моделей читающих автоматов, вызвали у многих специалистов по обработке данных недоверие и скептическое отношение к ним. Последние достижения в области автоматического чтения письменной информации убеждают в не- сомненной перспективности средств автоматического чтения, с помощью ко- торых станет возможным быстрый и надежный ввод больших массивов алфавитно-цифровой информации непосредственно с первичных документов. Предполагается, что в самом ближайшем будущем читающие автоматы ста- нут неотъемлемой частью любой информационной системы. Современное состояние техники автоматического чтения характеризуется большим разнообразием решений. Десятки организаций в Советском Союзе 1* 3
и более сорока крупнейших фирм и учреждений за рубежом занимаются ис- следованием теоретических вопросов опознавания образов и созданием со- ответствующих устройств. В связи с этим возникла очевидная необходимость обобщить накопленный опыт по использованию методов и средств преобра- зования письменной информации, выявить общие тенденции их дальнейшего развития. На основе изучения ряда отечественных и зарубежных источников, посвященных проблеме автоматического чтения, автор сделал попытку в об- щем виде решить указанную задачу. Замечания и пожелания по книге просьба направлять по адресу: Ле- нинград, Д-41, Марсово поле, д. 1, Ленинградское отделение издательства «Энергия». Автор
1. ПРОЦЕСС АВТОМАТИЧЕСКОГО ЧТЕНИЯ ПИСЬМЕННОЙ ИНФОРМАЦИИ Под читающим автоматом понимается устройство, способное с большой скоростью опознавать предъявляемые ему буквы, цифры и другие знаки пе- чатного, машинописного или рукописного текста и преобразовывать их в форму, пригодную для использования в ЭЦВМ и средствах подготовки промежуточных носителей информации (перфораторах и системах магнит- ной записи). Независимо от вида автомата и характера информации весь процесс чтения можно разбить на три самостоятельных этапа. На первом этапе производится подготовка исходных данных с целью приспособить их для машинного чтения. Как правило, документы с исход- ным материалом не пригодны для использования в автоматах. В результате возникает необходимость внести в текст некоторые исправления редакцион- ного характера, расшить страницы, представленные в виде переплетенных книг, подготовить массив листов для ввода в автомат. Подготовительные операции, выполняемые человеком, требуют наибольших затрат труда. На втором этапе осуществляются ввод исходных данных в машину, их восприятие, преобразование и опознавание. Третьим, заключительным, этапом является вывод опознанной информа- ции, которая либо вводится в машины и системы обработки данных, либо переносится (записывается) на различные промежуточные носители инфор- мации. 2. ПРИНЦИП ДЕЙСТВИЯ ЧИТАЮЩЕГО АВТОМАТА Действие любого читающего автомата складывается из выполнения сле- дующих основных операций: 1) предъявлении и осмотра изображения опо- знаваемого знака; 2) составления его описания; 3) сравнения полученного описания с эталонными,, т. е. собственно опознавания. Рассмотрим более подробно эти операции и основные методы преоб- разования информации, применяемые в каждой из них. Предъявление и осмотр изображения письменного знака Сущность осмотра заключается в том, что предъявленное изображение воздействует на некоторый (обычно фотоэлектрический или магнитный) датчик, который вырабатывает соответствующий изображению электриче- ский сигнал. Осмотр может осуществляться оптическим или магнитным спо- собами. Знаки, подлежащие опознаванию, в большинстве случаев состоят из черных линий на светлом фоне. Почернения в такой же мере, как и светлые участки, количественно выражаются относительным коэффициентом отраже- ния. Отношение световых потоков, отраженных от образца и идеально белой поверхности, определяет безразмерную величину, называемую относительным коэффициентом отражения. Коэффициент отражения может быть однозначно определен лишь при учете спектральной характеристики источника света и фотопреобразователя. В тех случаях, когда в качестве источника света используются твердые тела, их спектральная характеристика может быть определена по цветовой температуре. Контрасты знаков на общем фоне могут быть созданы не только за счет разницы коэффициентов отражения, но и путем изменения электропро- водности, магнитных и других свойств. 5
Осмотр изображения может производиться параллельным, параллельно- последовательным и последовательным способами. Параллельный способ заключается в одновременном обзоре всех элемен- тов предъявленного изображения. Рис. 1 иллюстрирует принцип параллель- ного осмотра с помощью прямоугольной матрицы из фотоэлементов. Этот способ позволяет реализовать устройства, которые опознают алфа- витно-цифровую информацию со скоростью 2400 знаков в секунду (см. табл. 5). На рис. 2, а представлена схема осмотра письменного знака парал- лельно-последовательным способом посредством вертикальной линейки (ряда) из светочувствительных эле- ментов. В большинстве читающих авто- матов применяется последовательный метод осмотра с помощью разверт- ки (см. рис. 2,6). При этом читаю- щий луч движется по некоторой траектории, лежащей в плоскости изображения. Траектория может быть непрерывной или состоять из отдельных сегментов. Например, обычная строчная развертка, приме- няемая в телевизионной и фототеле- графной технике, представляет со- бой совокупность параллельных рав- ноотстоящих друг от друга отрезков прямых, покрывающих все поле изо- бражения. Системы с последовательным ос- мотром изображения, как правило., состоят из электроннолучевой труб- ки (ЭЛТ), объектива, фотоэлемента и блока управления. Генерируемый ЭЛТ луч через объектив проециру- ется на документ. Отраженный све- товой поток попадает на фотоэле- мент, на выходе которого образу- ются электрические сигналы. Их величина и значение находятся в за- висимости от интенсивности" свето- вого потока. Изображения могут осматри- ваться с движущегося и неподвиж- ного документа. Перемещение является одним из измерений осмотра. Однако при таком способе возникает трудность в случае необходимости повторного чтения, если документ частично разрушен или требуется повышенная точность считывания. Осмотр непрерывно перемещаю- щегося документа («на лету») посредством бегущего луча увеличивает ско- рость чтения, но при этом ограничивается область сканирования. Осмотр «на лету» может выполняться также с помощью стробированного освещения и запоминающих трубок, однако низкая разрешающая способность и ма- лая область обзора ограничивают применение этого экономически выгодного метода. Осмотр неподвижного документа может производиться синхронно или асинхронно. В синхронном режиме документ остается неподвижным в тече- ние строго фиксированного промежутка времени, что ограничивает возмож- ности повторного чтения. Такой способ можно использовать в случаях, когда заранее известно количество информации, которое будет извлечено из доку- мента. Рис. 1. Параллельный способ осмот- ра изображения письменного знака с помощью матрицы светочувстви- тельных элементов / — матрица светочувствительных элемен- тов; 2 — проекционная линза; 3 — поле с изображением письменного знака 6
В асинхронном режиме документ остается неподвижным столько вре- мени, сколько необходимо. Этот способ наиболее эффективен в системах, работающих с документами переменной длины. Различают пассивный и активный методы последовательного осмотра. Пассивный метод основан на принципе, используемом в телевизионных пере- датчиках. Он заключается в том, что осмотр совершается по заранее оп- ределенной и заданной траектории, которая не зависит от свойств и харак- элт Путь световой точки Рис. 2. Последовательно-параллельный (а) и последователь- ный (б) способы осмотра изображения письменного знака ЛФЭ — линейка фотоэлементов; Л —линза; О — осветители; ЩД — щелевая диафрагма; БЛ — движущаяся бумажная лента; ЭЛТ — электроннолучевая трубка; СП — световое пятно; К — конденсор; ФЭП — фотоэлектрический преобра- зователь тера изображения. Системы, осуществляющие активный осмотр, имеют самоустанавливающуюся программу развертки, оптимальную по какому-либо критерию. Описание изображения Под описанием понимается некоторый сигнал, однозначно представляю- щий изображение наиболее подходящим для целей опознавания образом. При параллельном методе осмотра используются электрические сигналы, полученные в результате проецирования изображения на оптическую маску или матрицу из светочувствительных элементов. Описанием изображения в первом случае является величина электрического сигнала фотоэлемента или фотоэлектрического усилителя, а во втором — комбинация электриче- ских сигналов на выходе матрицы. В устройствах с параллельно-последовательным и последовательным ме- тодами осмотра электрические сигналы по мере их возникновения записы- ваются в запоминающем устройстве (ЗУ) и хранятся там до тех пор, пока не накопится информация, соответствующая целому знаку. Описанием изо- бражения в данном случае является последовательность дискретных по уровню и времени сигналов. Каждый сигнал соответствует (с точностью до дискретности преобразования) коэффициенту отражения одного из элемен- тов знака. Элементом знака считается одна из ячеек воображаемой прямо- угольной сетки, наложенной на поле, зрения автомата. Если подлежащие опознаванию объекты характеризуются признаками, каждый из которых может быть либо налицо (1), либо отсутствовать (0), то описание каждого объекта можно выразить я-значным двоичным числом. 7
В более общем случае признак может принимать р различных дискрет- ных значений и тогда описание представляется дг-значным числом, записан- ным по системе с основанием р. Для наших целей достаточным оказывается простейший двоичный случай, когда описание представляет собой некото- рый двоичный код, причем изменение состояния любого разряда в общем случае меняет это двоичное изображение. Различные варианты представле- ния одного и того же знака называются кодами изображения (или просто кодами), при опознавании которых машина (автомат) вырабатывает оди- наковый сигнал, определяющий образ (класс), к которому принадлежит изо- бражение. Описание может быть абсолютным и относительным. Абсолютное позво- ляет воспроизвести объект с той степенью точности, которая заложена в са- мом описании. В отличие от абсолютного относительное описание содержит только отличительные черты данного объекта по отношению к остальным, входящим в набор. Для опознавания письменных знаков достаточно отно- сительного описания, так как задача в этом случае упрощается и сводится к опознаванию значения изображения, а не к его точному воспроизведению. К описанию предъявляются два основных требования: оно должно быть минимальным и инвариантным к тем или иным преобразованиям. Чем короче описание, тем, естественно, проще и надежнее получается конструкция читающего автомата. Задача минимизации представляет собой довольно сложную проблему, над которой в настоящее время работают ученые и исследователи различных специальностей. Содержание второго требования сводится к тому, чтобы описание изо- бражения меньше всего зависело от размеров, ориентации и других изоморф- ных преобразований. Для получения описания используется два основных способа: геометриче- ский и топологический. Сущность первого из них заключается в применении той или иной развертки, сигнал которой является описанием. Во втором случае описание состоит в перечислении определенных топологических при- знаков анализируемого очертания. К таким признакам относятся замкнутые контуры различной связности, узлы различной кратности и др. Ими могут являться также характеристики взаимных связей между отдельными эле- ментами изображения. Связанность контуров определяется числом взаимопересечений (напри- мер, 0 и 8); кратность узлов определяется числом лучей, выходящих из узла. Так, узел первой кратности есть конец, второй кратности — угол; при- мер узла третьей кратности — буква У, четвертой — X. Геометрический способ не позволяет получить описаний, которые не зависели бы о'т изоморфных изменений в начертании и представлении зна- ков. В действительности же, в результате изоморфных преобразований опо- знаваемого изображения могут произойти такие изменения формы и струк- туры сигнала на выходе развертывающего устройства, которые сделают практически невозможным опознавание объекта. Например, в случае строч- ной развертки при повороте на значительный угол опознаваемой буквы или цифры сигнал на выходе неузнаваемо изменится. То же произойдет с рас- стояниями между импульсами, соответствующими тем или иным элементам знака, и т. п. Все это значительно усложняет машинное опознавание, хотя не представляет почти никаких дополнительных трудностей при опознава- нии знаков человеком. Топологические способы описания более универсальны. Согласно тополо- гии основные признаки в начертании изображений не зависят от таких преобразований, как изменение размеров и ориентации, искажение формы в результате растяжения или сжатия изображения. Основные топологические признаки остаются постоянными, если изменения в начертании изображе- ний не сопровождаются их разрывом или склеиванием. Возьмем обычный круг. Если его растянуть, то с точки зрения геометрии может получиться другая фигура — овал, эллипс и т. п. Если же рассматривать круг с позиций топологии, то круг не претерпит изменений, так как останется его главное свойство — замкнутость.
Из сказанного следует, что под понятием инвариантного преобразования подразумеваются изменения в начертании изображения, оставляющие по- стоянными его топологические свойства. Один из таких методов, носящий название квазитопологического, может быть упрощенно описан следующим образом. Представим себе устройство, по- зволяющее совершать последовательный обход всех элементов буквы А и фиксировать на ней точки обрыва линии кодом 1 и точки, где сходятся три и более линий,— кодом 0. Примем далее следующий порядок обхода. Начав его, например, с ниж- ней левой точки а (рис. 3, а), будем двигаться дс точки разветвления б, от которой нужно продолжать обход по ближайшему справа пути до точки г и далее до точки д. При попадании в точку, где линия обрывается (в дан- ном случае точка д)у нужно повернуть обратно и по тем же правилам про- должать движение до возвращения в исходную позицию. Рис. 3. Получение кода буквы А с помощью квазитопологи- ческого метода осмотра изображения Таким образом, будут пройдены точки а, б, г, д, г, б, а, что в соот- ветствии с принятыми обозначениями дает код: 1001001 (точка в, в которой нет ни обрыва, ни разветвлений линий, не рассматривается как характер- ная). Такой же код будет получен и при ином начертании буквы А, изобра- женной на рис. 3, б. При поворотах или изменении масштаба изображения буквы описанный способ обхода будет давать один и тот же код, что значительно облегчит процесс опознавания. Тот же код (описание) может быть получен и при некоторых изменениях способа начертания буквы, как, например, закруглении острых углов, замене прямых линий кривыми и т. п. На основании рассмотрения свойств различных описаний можно сфор- мулировать следующие заключения: 1) геометрическое описание с помощью простой развертки изменяется при всех линейных (афинных) преобразованиях, таких, как перенос, растя- жение, сдвиг и поворот; 2) геометрическое описание с помощью следящей развертки в случае описания через наклон зависит от растяжения, сдвига и поворота и не за- висит от переноса. В случае же описания через кривизну перенос и поворот на него не влияют; 3) топологическое описание оказывается инвариантным не только по от- ношению ко всем афинным преобразованиям, но и при любых непрерывно- однозначных (топологических) преобразованиях, поскольку они не изменяют признаков описания. 9
Практически это означает, что следящая развертка дает описание, инва- риантное по отношению к преобразованиям, возникающим в реальных усло- виях. Что касается различий в шрифте, то они могут быть в принципе учтены определенными допусками на среднее описание. В некоторых моделях современных читающих автоматов используется топологическое описание изображения, которое обладает высокой степенью неизменяемости. Следует также упомянуть о недостаточности одного топологического ме- тода из-за того, что многие письменные знаки топологически тождественны. Так, например, цифры 6 и 9 отличаются друг от друга только поворотом на 180°. Следовательно, при пользовании топологическим описанием обязательно необходимо привлекать некоторые элементы геометрического метода, отне- сенные к заданной координатной системе. Сравнение полученного описания с эталоном Операция опознавания заключается в сравнении полученного описания изображения знака с эталонными описаниями, хранящимися в запоминаю- щем устройстве, и определении его принадлежности к одному из эталонов. Различают одновременный и ступенчатый методы опознавания. Сущность одновременного метода заключается в том, что при наличии т объектов производится столько же операций сравнения. Если число признаков (а сле- довательно, и двоичных цифр в описании) равно п, то при наивыгоднейшем описании т=2п. При этом следует подчеркнуть, что сравнению подлежат д-значные числа. Самым простым примером одновременного опознавания является изме- рение и сравнение результирующих световых потоков в устройствах с ис- пользованием оптических масок-трафаретов. Однако данный метод имеет ряд недостатков, основными из которых являются необходимость обеспечи- вать интенсивное освещение анализируемого поля и точно совмещать изо- бражение опознаваемого знака с оптическими масками. Ступенчатый метод опознавания предусматривает последовательное, по- очередное сравнение каждой позиции двоичных чисел полученного описания. Он позволяет сократить время опознавания, упростить конструкцию логиче- ской части читающего автомата, а также оперировать описаниями различной длины. К недостаткам ступенчатого метода следует отнести меньшую, по срав- нению с одновременным, помехоустойчивость, а следовательно, и надежность опознавания. 3. СТРУКТУРА ЧИТАЮЩЕГО АВТОМАТА На рис. 4 в самом общем виде представлена структурная схема чита- ющего автомата. Элементы схемы (воспринимающее устройство, блок па- мяти, устройство сравнения и решающее устройство) являются обязатель- ными частями любой читающей машины. На вход автомата поступает изображение опознаваемого знака. Функ- цией воспринимающего устройства является представление конкретных фи- зических характеристик опознаваемого изображения в виде определенной последовательности электрических сигналов. Воспринимающее устройство осуществляет преобразование, в результате которого происходит формиро- вание сигнального кода — описания изображения. При необходимости воспринимающее устройство может осуществлять фильтрацию, нормализацию и другие преобразования, способствующие эконо- мичности описания. В некоторых случаях функциями воспринимающего уст- ройства могут явиться очистка изображений от явных дефектов, ориенти- рование их и пр. В сущности воспринимающее устройство осуществляет функцию измере- ния значений признаков опознаваемого изображения. Следовательно, требо- вания, предъявляемые к этому устройству, ограничиваются необходимой точ- ностью, разрешающей способностью и быстродействием. 10
Механизм сравнения сличает полученное описание изображения с этало- нами. Основными показателями работы устройств сравнения являются точ- ность и быстродействие. Блок памяти предназначен для хранения описаний всех опознаваемых изображений и может быть выполнен в виде оптических масок-трафаретов, наборов сопротивлений, емкостей, линий задержек и т. п. Решающее устройство в соответствии с принятым в данной схеме пра- вилом решения (критерием опознавания) отождествляет предъявленное опи- сание с одним из эталонов. В результате работы решающего устройства на выходе появляется либо сигнал, соответствующий правильно опознанному письменному знаку, либо сигнал отказа. Конструкция устройства и требо- вания к нему определяются принятым правилом решения. Изложенные выше общие положения относительно структуры читающего автомата, назначения и функций отдельных его узлов, а также требований Изображения письменных знаков ВУ УС РУ Решение БП Рис. 4. Структурная схема читающего автомата ВУ — воспринимающее устройство; УС — устройство сравне- ния; РУ—решающее устройство; БП— блок памяти к ним имеют не только прикладное, но и теоретическое значение, так как дают возможность сформулировать основные принципы алгоритмизации про- цесса, оптимизации алгоритмов и оценки надежности опознавания. 4. СИСТЕМАТИЗАЦИЯ МЕТОДОВ И СРЕДСТВ АВТОМАТИЧЕСКОГО ЧТЕНИЯ ПИСЬМЕННЫХ ЗНАКОВ Методы опознавания письменных знаков Все известные методы автоматического чтения характеризуются следую- щими основными особенностями. Первая из них состоит в том, что главное внимание в процессе чтения уделяется опознаванию отдельных знаков. В соответствии с этим отсутст- вуют машины, способные опознавать слова, фразы или строки без предва- рительной расшифровки составляющих их букв. Время идентификации изо- бражения отдельного знака у современных устройств настолько мало, что их производительность достигает 30 строк в минуту, или 2400 знаков в секунду. Поэтому скорость машинного чтения значительно выше той, на которую спо- собен самый натренированный человек. Второй характерной особенностью большинства методов опознавания яв- ляется принцип опознавания, основанный на сравнении реальных графиче- ских или электронных образов с их «идеальными» эталонами. Третья особенность заключается в необходимости преобразования ана- логовой информации, возникающей на выходе светочувствительных блоков, в дискретную, цифровую форму, пригодную для ввода и использования в ЭВМ. Этот процесс осуществляется параллельно с чтением знаков. От того, насколько операция преобразования сдвинута во времени относительно опе- рации чтения, зависит не только сложность автомата, но и степень его уни- версальности, стоимость изготовления, быстродействие, а также способность к опознаванию некачественно нанесенных знаков. Существующие в настоящее время методы автоматического чтения письменной информации можно подразделить на две основные группы. 11
Первую группу образуют эвристические методы опознавания, основан- ные на искусственных аналитических построениях. Вторую составляют био- нические методы, опирающиеся на знания природных механизмов восприя- тия, преобразования и обработки зрительной информации. Рассмотрим более подробно обе эти группы. Эвристические методы основаны на использовании различных способов анализа распределения черно-белых участков поля изображения или взаим- ных связей между отдельными элементами контурной линии знака. Получен- ное описание сравнивается с эталоном методами перекрытия или по приз- накам. Известны методы непосредственного оптического и электрического срав- нения перекрытием. В случае применения первого из них происходит оптическое наложение изображения опознаваемого знака на эталонные маски-трафареты. Крите- рием опознавания является величина светового потока, прошедшего через маску при ее совмещении с изображением знака. Решение принимается в пользу той маски, через которую проникает минимальное количество света. В первых образцах читающих устройств, основанных на этом принципе, использовались только двухградационные негативные маски. Затем с целью повышения надежности опознавания было разработано еще несколько типов масок. В зависимости от типа масок различают следующие виды автоматов: 1) одноканальные с негативными масками; 2) двухканальные с вегетативными масками и масками постоянной оптической плотности; 3) с позитивными и негативными масками. В двухканальных автоматах исключается влияние коэффициентов про- пускания на критерий опознавания. Выходные сигналы фотоприемника ка- нала с маской постоянной оптической плотности суммируются с выходными сигналами основных каналов, после чего производится сравнение и опозна- вание. В автоматах третьего вида позитивная маска содержит все сущест- венные области, присущие данному знаку и отличающие его от других, а не- гативная — все существенные области, которых не должно быть в его изо- бражении. За каждой из масок устанавливается фотоприемник. Опознавание производится сравнением сигналов на выходе соответствующих пар масок. К основным недостаткам методов оптического сравнения перекрытием относятся: 1) зависимость результатов опознавания от контрастности изо- бражения; 2) отсутствие способов точной безынерционной центровки опозна- ваемого изображения относительно масок; 3) невозможность получить на фотоприемниках световые потоки достаточной мощности: 4) сложность раз- множения анализируемого изображения с целью одновременного его пред- ставления перед несколькими масками; 5) ограниченные возможности для опознавания знаков нескольких различных шрифтов. Методы непосредственного оптического сравнения перекрытием относятся к самым ранним. Большинство научно-технических решений, в которых они использовались, устарели и не представляют интереса. Вместе с тем послед- ние отечественные и зарубежные исследования показывают, что в настоящее время намечаются пути преодоления указанных недостатков. Это позволит применять маски при создании простых и экономичных читающих устройств. Методы электрического сравнения перекрытием реализуются с помощью взвешенного суммирования электрических сигналов от элементов изображе- ния знака на эталонных матрицах сопротивлений или ферритовых сердечни- ков. Эталон может представлять собой электрическую модель масок-трафа- ретов в виде одного или нескольких наборов активных сопротивлений, линий задержек, одной или нескольких шин, продетых через соответствующие под- матрицы «белых» и «черных» ферритовых сердечников, и т. д. Опознавание осуществляется аналоговыми способами посредством пороговых схем срав- нения и пр. Рассмотренные выше методы сравнения перекрытием в большинстве слу- чаев базируются на использовании всей информации, содержащейся в опо- знаваемом знаке. В то же время совершенно очевидно, что каждому контуру присущи отдельные признаки, которых достаточно для надежного опозна- 12
Ёания различных типографских, машинописных и даже рукописных знаков. Поэтому были разработаны методы сравнения по признакам, предусматри- вающие анализ: 1) распределения черно-белых участков поля изображения; 2) взаимных связей между отдельными элементами контурной линии знака (структурный анализ). В первом случае используются наиболее информативные области кон- турной линии знака и поля, которое его окружает. При этом производится сугубо геометрическое сравнение опознаваемых знаков с их эталонами. В силу сказанного возможности этих методов при опознавании письменных знаков разных шрифтов ограничены. В некоторых моделях читающих уст- ройств предусматривается оперативный переход от опознавания одних шриф- тов к другим, что достигается путем замены эталонов или оперативной пере- записи эталонных признаков в памяти блока опознавания. Указанные недостатки в случае необходимости расширения ансамбля опознаваемых знаков вынуждают значительно усложнять аппаратуру и тем самым повышать стоимость ее изготовления. В то же время анализ распре- деления черно-белых участков позволяет более эффективно обрабатывать сигналы об опознаваемом знаке '[1—4, 15, 24]. Эти методы успешно исполь- зуются для опознавания знаков, величина, форма и положение которых остаются постоянными (например, типографские и машинописные знаки). При необходимости опознавания рукописных знаков, а также несколь- ких типов типографских и машинописных шрифтов применяются методы структурного анализа, позволяющие выявлять, фиксировать ^ сравнивать взаимные связи между отдельными элементами контурной линии знака. Анализу подвергаются относительная длина, направление и кривизна линий,, наличие и количество начальных и конечных точек, точек пересече- ния, открытых дуг, замкнутых областей и др. Для выявления структурных признаков используются различные способы сканирования: следящая развертка по контурной линии знака, развертка прямоугольным растром и ряд иных (3, 4, 24, 32]. Эти методы обеспечивают большую помехоустойчивость к нелинейным искажениям знаков. Реализация методов структурного анализа связана с проведением более сложных исследований и экспериментов. Тем не менее эти методы начинают успешно применяться при создании ряда моделей читающих устройств оте- чественного и зарубежного производства [3, 4], так как они позволяют обес- печить весьма надежное опознавание письменных знаков, меняющих свои размеры, положение и форму. Эвристические методы опознавания, позволяющие конструировать читаю- щие автоматы с жесткими, заранее установленными алгоритмами опознава- ния, базируются в основном на искусственных аналитических построениях. Бионические методы опознавания в отличие от эвристических методов используют принцип действия биологических механизмов восприятия, пре- образования и обработки зрительной информации. Типичными устройствами этого вида являются перцептроны, представ- ляющие собой своеобразные упрощенные модели органов чувств. На рис. 5 представлена схема, иллюстрирующая принцип действия про- стейшего перцептрона. В упрощенном виде перцептрон состоит из совокупно- сти светочувствительных 5-элементов, на которые проецируются некоторые визуальные изображения. S-элементы случайным образом связываются с на- бором так называемых ассоциирующих Л-элементов. Появление сигналов на выходе Л-элементов возможно только при возбуждении достаточно большого количества S-элементов, воздействующих на один ассоциирующий элемент. Взвешенные комбинации выходов ассоциирующих элементов предопределяют реакцию системы, указывающую на принадлежность анализируемого изобра- жения к определенному классу. Каждому классу соответствует один /?-эле- мент, выходной сигнал которого представляет собой линейную комбинацию выходов Л-элементов. Коэффициенты линейной комбинации X являются варьи- руемыми переменными, значение которых можно изменять в процессе обучения или адаптации. 13
Пусть, например, человек, использующий такого типа машину, хочет обучить ее опознавать и отличать два класса визуальных изображений. Пред- положим, что первый класс представляет собой рукописные буквы Л, а вто- рой — рукописные буквы Б. В соответствии с этим из двух выходных элементов R элемент R\ пред- назначен для класса Л, a R2— для класса Б. Система будет вести себя пра- вильно, если выход Ri превышает выход R2, когда на вход системы подается любое изображение из класса Л, и, наоборот, выход R2 превышает Ri для входного изображения из класса Б. Машина обучается путем предъявления некоторых последовательностей изображений из обоих классов А и Б. Человек, наблюдающий поведение ма- шины после каждого показа обучаю- щего изображения, определяет, яв- ляется ли решение, принятое маши- ной, правильным или нет. Если ма- шина справилась с задачей (Ri> >R2 для входа из класса А или Rz>Ri для входа из класса Б), учи- тель «поощряет» машину, увеличивая веса Я, относящиеся к ячейке, выход которой характеризует правильную классификацию. Если решение ма- шины ошибочно, т. е. Ri<R2, когда входное изображение взято из клас- са А, то учитель «наказывает» ее, уменьшая весовые коэффициенты, которые связаны с выходной ячей- кой, определившей неверную клас- сификацию, в данном случае с R2. Продолжая этот процесс даль- ше, учитель в определенной после- довательности показывает машине совокупность изображений как из класса А, так и из класса Б и путем «поощрений» и «наказаний» обучает машину опознавать представителей класса А и класса Б с возможно меньшей ошибкой. Далее машина предоставляется самой себе и само- стоятельно устанавливает, к какому классу принадлежат новые изобра- жения, не использованные в про- цессе обучения. Это выполняется также путем сравнения выходов Ri и R2. Существует несколько модификаций указанной схемы, отличающихся в ос- новном способами соединения элементов и правилами «поощрения» и «нака- зания» [5, 7, 9, 21, 22, 23]. В табл. 1 представлены данные, характеризующие некоторые методы ав- томатического чтения письменной информации. Рис. 5. Схема принципа действия простейшего перцептрона Систематизация средств автоматического чтения письменных знаков Известные в настоящее время читающие устройства можно систематизи- ровать по следующим основным признакам: назначению, виду обрабатывае- мых документов, ансамблю читаемых знаков, принципу действия, методам осмотра, описания,, опознавания и по разновидности режимов работы. По назначению автоматы подразделяются на устройства ограниченного и расширенного чтения. К первым относятся устройства считывания кодирован- ных, нормализованных и стилизованных письменных знаков. Эти машины от- личаются простотой и повышенной надежностью чтения. Однако их примене- 14
ние ограничено по сравнению с автоматами расширенного чтения, которые обеспечивают возможность восприятия и преобразования письменной инфор- мации, напечатанной или написанной обычными способами. В группу средств расширенного чтения входят устройства, опознающие типографские, машинописные и рукописные знаки. При этом следует подчерк- нуть, что наиболее современные из автоматов способны также читать все или большинство используемых в настоящее время стилизованных шрифтов (см. табл. 5). В зависимости от вида обрабатываемых документов различают три типа устройств: 1) для чтения письменных знаков с малострочных и многострочных листовых документов; 2) для чтения письменной информации с лент кассовых или других регистрирующих аппаратов; 3) для обработки документов раз- личных форм и форматов. По ансамблю читаемых, знаков они подразделяются на устройства для чтения: 1) цифровых знаков с несколькими символами специального назначе- ния; 2) алфавитно-цифровой информации; 3) алфавитно-цифровой информации с возможностью считывания данных, представленных в виде графических от- меток. Различают устройства последовательного и параллельного принципа дей- ствия. Группу устройств последовательного принципа действия составляют авто- маты, способные воспринимать, преобразовывать и опознавать письменные знаки последовательно друг за другом. Эти устройства могут обрабатывать данные, представленные на документах различных размеров с произвольным размещением письменных знаков. Максимальная скорость автоматического чтения достигает 500 знаков в секунду при достоверности опознавания не бо- лее одной ошибки на 104—107 считанных знаков. Устройства параллельного принципа действия одновременно опознают не один, а несколько письменных знаков (строку, часть строки или несколько строк). Предполагается, что максимальная скорость автоматического чтения таких устройств может достигать 5000 и более знаков в секунду при досто- верности опознавания не более одной ошибки на 104—107 считанных зна- ков [3, 4]. В зависимости от метода осмотра читающие устройства можно подраз- делить на: 1) оптические и магнитные; 2) с параллельным (одновременным) и последовательным осмотром изображения письменного знака; 3) с пассив- ным и активным осмотрами изображения. В устройствах с параллельным методом осмотра письменный знак вос- принимается одновременно с помощью матрицы светочувствительных элемен- тов или оптических масок-трафаретов. Известны также системы, где осмотр осуществляется параллельно-после- довательным способом с помощью линейки светочувствительных элементов. В устройствах последовательного действия для осмотра применяется луч ЭЛТ. Здесь возможны два варианта восприятия знака: активный и пассив- ный. При пассивном используется принцип телевизионных передатчиков, которые действуют по жесткой, заранее определенной и заданной программе, не зависящей от свойств и характера поля изображения. Системы активного осмотра имеют самоустанавливающуюся программу, оптимальную по какому-либо критерию. Читающие автоматы подразделяются на устройства с получением геомет- рического и топологического описания изображения. Геометрическое описание получается в случае использования развертки прямоугольным растром. Сущ- ность топологического метода заключается в перечислении определенных то- пологических признаков, содержащихся в контуре изображения. Заключительным этапом действия читающего автомата является процесс опознавания. На рис. 6 представлена схема систематизации читающих устройств по их основным технико-эксплуатационным характеристикам. 16
Читающие автоматы и их подразделение По назначению Устройства ограниченного чтения Устройства расширенного чтения По виду обрабатываемых документов Устройства для чтения листовых малострочных документов Устройства для чтения листовых многострочных документов Устройства для чтения письменной информации с бумажных лент По методу осмотра Оптические устройства Магнитные устройства По методу опознавания По принципу действия Устройства последовательного принципа действия Устройства параллельного принципа действия По ансамблю читаемых знаков Устройства для чтения цифровых знаков Устройства для чтения алфавитно- цифровой информации Устройства для чтения письменной информации с возможностью считы- вания графических отметок По методу составления описания Устройства с получением геометри- ческого описания изображения Устройства с получением топологи- ческого описания изображения По разновидности режимов работы Устройства сравнения перекрытием Устройства непосредственного ввода информации в ЭЦВМ Устройства сравнения по признакам Устройства подготовки промежуточ- ных носителей информации Читающе-сортирующие устройства Рис. 6. Схема систематизации читающих автоматов по их основным тех- n«4eikUJM-U ЗЧсплуатационным характеристикам 17
5. СПЕЦИАЛЬНЫЕ ШРИФТЫ Человек опознает известные ему знаки, «е задумываясь над тем, как это происходит. Создание машины, способной безошибочно выполнять такую за- дачу, довольно сложная и трудная проблема. Для этого прежде всего необ- ходимо установить характерные особенности (признаки) изображения извест- ных нам письменных знаков. Каковы они? Ответить на этот вопрос нелегко. Практически письменные знаки представляют собой различные комбинации длинных, коротких, прямых и кривых линий. Далее можно сказать, что сами линии — это комбинации точек. Все известные методы опознавания сводятся, в основном, к попыткам ка- ким-либо образом произвести соответствующее выделение комбинаций, состоя- щих из линий и точек. i 2 3 4 5 В 7 8 9 0 lllll ||||| illll lllll Mill Hill lllll lllll lllll lllll Рис. 7. Шрифт Бройдо Большое разнообразие форм письменных знаков представляет определен- ные трудности на пути создания читающих автоматов. Это привело к возник- новению направления, сторонники которого стремятся решить проблему разви- тия читающей техники на базе использования специальных шрифтов. Такие шрифты призваны облегчить процесс опознавания. Основными требованиями, которые предъявляются к специальным шриф- там, являются: 1) простота нанесения знаков шрифта на носитель информа- 0 2 J 4 S 6 7 8 9 А / ■ • ~Т Л О 9 d 4 Л Ш 7 —•— —#— —• —•— Дополнение Рис. 8. Шрифт «Штейнометик» ции; 2) хорошая визуальная читабельность; 3) наличие в изображении знаков характерных признаков, облегчающих опознавание; 4) невысокая стоимость устройств для нанесения информации; 5) простота и надежность конструкции счиТьпГаТбщеТо "(опознающего) устройства. В настоящее время применяются кодированные, стилизованные и норма- лизованные шрифты. Кодированные шрифты. Знаки таких шрифтов представляют собой ряд точек различного диаметра или ряд штрихов различной длины и толщины, которые располагаются в определенном порядке относительно как друг друга, так и самого знака. Кодовые метки могут быть нанесены обычной типограф- ской или магнитной красками, что определяется методами их нанесения и считывания. При считывании устройство анализирует не изображение пись- менного знака, а кодовую серию его маркерных меток. Опознавание, таким образом, сводится к декодированию получаемых сигналов. Рассмотрим несколько примеров кодированных шрифтов. На рис. 7 показан один из шрифтов Бройдо. Кодирование знаков осу- ществляется с помощью пяти вертикальных штрихов различной длины. Штрихи располагаются внизу под цифрами. 18
Фирмой «Стандарт Реджистер» разработан кодированный шрифт <«Штэй- нометик» (см. рис. 8). Одновременно с регистрацией знака под ним печа- тается код в виде комбинации точек диаметром 2,2 мм. Точки располагаются на четырех параллельных горизонтальных линиях. Расположение точек на ли- ниях образует код соответствующего знака. Пятая, дополнительная линия предназначается для операции контроля. На рис. 9 представлен шрифт Сведа Е-3. Он позволяет кодировать цифры с помощью горизонтальных штрихов, располагаемых сверху или сбоку цифровых знаков. Знаки шифруются кодом 1—2—4—8. На рис. 9, в правой его части, дается пример кодирования цифры 6. Левая метка нижней строки предназначена для запуска, а правая — для контроля. Сведа £ -J О 1 3 4 5 6 7 8 Запуск Контроль Зимаг km ф ■ фи Ф ■ ii ■ it ■■ ф Hi ■ \ 1 j 2 \ 3 ; 4 \ 5 ! в if hi И ■■ ф и Mi ■ ф i i й i 8 ! 9 i iiii ф и Рис. 9. Кодированные шрифты «Сведа Е-3» и «Зимаг» Шрифт Зимаг (рис. 9) содержит 10 цифр, 26 букв и 12 специальных зна- ков. Поле каждого знака состоит из полос: средняя полоса--для визуального чтения знаков человеком, верхняя и нижняя полосы содержат магнитную мар- кировку в двоичном коде для машинного чтения. Считывание осуществляется одновременно двумя магнитными головками. Высота знаков 6,5 мм. К кодированным относятся также шрифты Эрма, фирмы: «Тод»- и др., которые по существу ничем не отличаются от вышерассмотренных. Стилизованные шрифты. Их знаки в своем изображении содержат эле- менты определенного кода. Знаки представляют собой совокупность харак- терных элементов, легко обнаруживаемых опознающими устройствами. Знаки при этом могут сильно отличаться от обычных шрифтов, однако сохраняют некоторые особенности, которые позволяют человеку их читать. Известные в настоящее время стилизованные шрифты можно подразде- лить на шрифты для оптического и магнитного считываний. Шрифты для оптического считывания. На рис. 10 пока- зан шрифт Диксона. Каждая цифра имеет свою метку-точку, располагаемую на одной из десяти горизонтальных линий. Считывание и опознавание осуще- ствляется при помощи бесконечной замкнутой ленты с отверстиями и фото- элементов, располагаемых на высоте меток?. 2* 19
На рис. 11 представлены шрифты 5x9 Матрикс, Фаррйнгтон, Зельф Чек, Хаслер, ЗЭЛ-ЦЗ-13, ОЦР-А и ОЦР-Б. Рис. 10. Шрифт Диксона ф 5x9 М а три нс D 1 2 3 < 5 ь 7 8 Ч ф Фаррйнгтон Зельф Чек 0 12 3 4 5 Ь 1 8 Я ф Хаслер В 9 D 1 Н 3 4 5 Б 7 ф СЭЛ-ЦЗ-13 о 1 г а н 5 Б? а 9 ОЦР-А ABCDEFGHIJKLMNOPdRSTUVUXYZ 0153ч-5ь7аЧ ОЦР-Б ABCDEFGHIJ KLMN0PQRSTUVWXYZ abcdefghi j kImnopqrstuvwxyz 0123456789 Рис. 11. Оптические стилизованные шрифты 5x9 Матрикс Фар- рйнгтон, Зельф Чек, Хаслер, ЦЗ-13, ОЦР-А и ОЦР-Б Из оптических стилизованных шрифтов наибольшее распространение полу- чили шрифты ЦЗ-13, ОЦР-А и ОЦР-Б. В настоящее время соперничающими 20
являются шрифты ОЦР-А (одобряемый, главным образом, в США) и ОЦР-Б (разработанный в Европе). Магнитные стилизованные шрифты. Среди них наибольшее распространение получили шрифты типа Е13Б и ЦМЦ-7. Шрифт Е13Б разработан в США и используется преимущественно для представления цифровой информации при автоматической обработке чеков. В Европе этот шрифт не получил распространения из-за наличия другого, бо- лее простого и совершенного стилизованного шрифта типа ЦМЦ-7, созданного французской фирмой «Бюль». Шрифт Е13Б представлен на рис. 12. Он включает в себя 10 цифр от 0 до 9 и четыре специальных знака. Номинальная высота знаков 2,97 мм. Считывание производится магнитной головкой, щель которой расположена параллельно вертикальным штрихам. Форма выходного напряжения считываю- щей головки зависит от высоты и положения элементов знака. На рис. 13 представлены формы сигналов, образую- щихся при считывании знаков шрифта Е13В. Знаки опознаются аналоговыми методами. На рис. 14 показан алфавитно-циф- ровой шрифт ЦМЦ-7, содержащий 41 письменный знак: 10 цифр от 0 до 9, 26 букв и пять специальных знаков. Каждый знак состоит из семи верти- кальных штрихов одинаковой ширины, но разной длины. Ширина штрихов 0,15±0,04 мм, длина не менее 0,8 мм. Высота знаков 3,17 мм, ширина 2,36 мм. Расстояние между знаками 0,67 мм. Штрихи отделяются друг от друга ше- стью интервалами: широкими (0,5± ±0,02 мм) и узкими (0,3±О,02 мм). Чередование штрихов и интервалов об- разует микрокод. Для кодирования десяти цифр и пяти специальных знаков используются комбинации из двух широких и четырех узких интервалов. Буквы представ- ляются кодами из 26 комбинаций с одним или тремя широкими интер- валами; этого достаточно для представления и кодирования всего латинского алфавита. Ниже приводятся цифровой и буквенный коды шрифта ЦМЦ-7 (узкие интервалы обозначены 0, а широкие — 1). I 2 3 U 5 E.7BRO п. •: ■ Рис. 12. Магнитный стилизован- ный шрифт Е13Б Цифровой код: Знак Коп Контрольный dHaK К°А знак Код 0 001100 1 100010 2 011000 3 101000 4 100100 5 000110 6 001010 7 110000 8 010010 9 010100 1 100001 2 010001 3 001001 4 000101 5 000011 21
■ HI in ИИ шш шш та Si ■ шш Рис. 13. Формы сигналов, образующихся при считывании зна- ков шрифта Е13Б In И"'|| 'I'" II III tin N !!::и I llll llll Ill III ii У! Ill i (Г 1 'llll 1 'llll III III III III Рис. 14. Магнитный стилизованный шрифт ЦМЦ-7 22
Буквенный код: Л 010000 N 011100 Б 101010 0 100000 С 000111 р 010110 д 100110 Q 111000 Е 101100 R 101001 F 001001 S 100101 Н 100011 и 010011 G 000100 т 110100 I 000001 V 110001 J 001000 W 010101 К 011010 X 110010 L 000010 У 011001 М ООП 10 Z 001101 Для опознавания знаков шрифта ЦМЦ-7 применяется цифровой метод. Автоматическое опознавание основано на выявлении и определении длин О 1 2 щ 3 ■ш Щ Щ Б 1 ■ -фг 1 8 -Щг 9 щ ш m ы щ 11 Рис. 15. Формы сигналов, образующихся при считывании знаков шрифта ЦМЦ-7 интервалов между соседними штрихами и их взаимного расположения в изо- бражении анализируемого знака. На рис. 15 представлены формы сигналов, образующихся при считывании цифр от 0 до 9. По сравнению с другими магнитными стилизованными шрифтами шрифт ЦМЦ-7 имеет следующие основные достоинства: 1) включает в себя полный алфавит, 10 цифр и 5 служебных знаков; 2) машинное чтение основано на использовании цифрового метода; начертание знаков приближается к обыч- ному печатному шрифту; 3) схема считывания отличается простотой и надеж- ностью. Шрифт ЦМЦ-7 широко используется во Франции, Италии, Дании, Шве- ции, ФРГ, США и других странах. Нормализованные шрифты. Под ними понимаются шрифты, знаки которых пишутся от руки в специальных нормализующих прямоугольни- ках. Прямоугольники печатаются красками, цвет которых не воспринимается 23
фотоэлементами или коэффициент отражения которых значительно меньше, чем у используемых для записи. На рис. 16 показан нормализованный шрифт, разработанный НИИ ЦСУ СССР [20]. В каждом прямоугольнике должны быть проведены вспомога- тельные диагональные, средние вертикальная и горизонтальная линии. Прямо- угольники и вспомогательные линии печатаются светло-голубой или другой невоспринимаемой фотоэлементами краской. Цифры вписываются черными чернилами по образцу, показанному на рисунке. шипи Рис. 16. Нормализованный шрифт, разработанный НИИ ЦСУ СССР Считывание производится с помощью матрицы, состоящей из 10 фото- диодов на каждую цифру. При считывании цифра должна проецироваться строго в матричный прямоугольник с соотношением высоты к ширине, рав- ным 3/4- ]B0[I]eia@@B0SSi КИШЕВ Рис. 17. Нормализованный шрифт СКВ Вильнюсского завода счетных машин На рис. 17 представлен нормализованный шрифт СКВ Вильнюсского за- вода счетных машин. Цифры и знаки вручную заносятся в нормализующие прямоугольники. Запись производится черными чернилами. 6. ОПТИЧЕСКИЕ ЧИТАЮЩИЕ АВТОМАТЫ Известные в настоящее время оптические читающие устройства можно подразделить по назначению на три больших класса: 1) устройства для считывания данных в виде графических отметок с ти- пизированных бланков; 2) устройства для считывания кодированных, нормализованных и стили- зованных письменных знаков; 3) устройства для автоматического чтения печатных, машинописных и ру- кописных знаков. Этот класс наиболее многочислен, многообразен, наиболее сложен и наиболее перспективен. Ниже рассматриваются в указанной последовательности некоторые мо- дели реально существующих оптических читающих устройств отечественного и зарубежного производства. 24
Устройства для считывания данных, представленных на типизированных бланках в виде графических отметок За последние 4—5 лет создан ряд моделей, способных считывать инфор- мацию в виде графических отметок с бумажных документов различной формы. Нанесение информации на документы производится вручную. Считанная ин- формация с большой скоростью вводится в машину. К. устройствам подоб- ного типа относятся системы «Бланк» (СССР), «Лектор» и «Автолектор» (Англия), ИБМ-1230, ИБМ-1231, 1232 (США) и др. Такой довольно простой способ условного кодирования и представления первичной информации обладает целым рядом достоинств, одним из которых является исключение процесса ручного переноса исходных данных на проме- Рис. 18. Внешний вид устройства «Автолектор: жуточные носители информации, что позволяет устранить главную причину появления ошибок. На рис. 18, 19 представлены внешний вид и разрез устройства «Автолек- тор» английской фирмы «ЛЕО». Устройство предназначено для автоматиче- ского считывания данных в виде графических отметок с типизированных бланков. Формат бланков можно легко изменять и приспосабливать для са- мых различных целей. Запись данных осуществляется с помощью пишущих и адресовальных машин или от руки. Допускается любая комбинация этих средств. Ручная запись в виде коротких горизонтальных штрихов может производиться простым карандашом. Устройство применяется для непосредственного ввода различных данных в ЭЦВМ и широко используется для расчета заработной платы, обработки за- казов, учета запасов различных материалов, сбора платежей, экономических .исследований и других целей. Система оснащена механизмом автоматической подачи документов. Бланки загружаются в портативные кассеты, которые по мере необходимости ставятся на конвейер, не прерывая работы устройства. Пневматический захватчик извлекает и подает отдельные бланки из кассеты через блок выравнивания на барабан, где они устанавливаются в строго оп- ределенное положение для считывания с них информации. После считывания бланки снимаются с барабана и следуют в выходной бункер. В случае, если ЭЦВМ отказывается принять информацию с какого- нибудь бланка, последний направляется в режектор для повторного считыва- ния или корректуры. В случае заторов движения бланков, специальные детек- торы останавливают машину. 25
Он о н О) о н И 3 «а а я с та S д о ев Н ч я и „ а. о £ о « л 2J о д д л ад a s ч о v о s t- 3*0,?! m ей CQ Н О о Он 2 к I со § Д^ О & К « Д R д Н Н I й ^ , J «82 3 « { рц * д ч s * § ° ^ * 5 д s * о с * о К * Д К о.л »д о а> g I * та£ о ~- я ... о « к I I 3 26
Для избежания двойной подачи имеется специальный блок, который сле- дит за тем, чтобы бланки проходили через устройство последовательно, один за другим, а не вместе. Скорость считывания составляет 240 бланков в минуту независимо от количества содержащейся на них информации. Основные характеристики ма- шины приведены в табл. 2. Устройство «Бланк», разработанное Минским заводом счетных машин, предназначено для автоматического ввода исходных данных в ЭЦВМ с типи- зированных бланков. Информация кодируется на типизированном бланке формата А4 (210X297 мм) карандашными метками в соответствующих позициях бланка. Позициям придается конкретное весовое значение в зависимости от вида и назначения первичного документа. Метки наносятся черным карандашом марки ТМ и М. Поле бланка, на котором размещается подлежащая считыва- нию информация, содержит до 984 позиций. Считываются метки при помощи фотоэлектрических преобразователей путем восприятия отраженного света узкой стороной бланка. Устройство обес- печивает автоматическое изменение количества одновременно считываемых колонок в пределах зоны считывания. Конструкторами предусмотрены старт-стопный и непрерывный режимы подачи бланков. В старт-стопном режиме каждый бланк подается по команде из ЭЦВМ или с местного пульта управления. При этом команда на подачу следующего бланка может поступить только после окончания считывания предыдущего. Максимальная скорость считывания в старт-стопном режиме составляет 50 бланков в минуту. Непрерывный режим подачи может быть задан командой из ЭЦВМ либо соответствующим переключением с пульта управления. Максимальная ско- рость работы в непрерывном режиме составляет 150 бланков в минуту. Для размещения документов предусмотрено три кармана: подающий и приемный на 700 и более бланков каждый и карман брака емкостью не менее 100 бланков. Информация из устройства в машину передается по четырем каналам. Имеется возможность передачи контрольного разряда по пятому каналу. Аппаратура «Бланк» включает в себя систему подачи и транспортировки документов, фотоэлектрический блок считывания, блок контроля правильности считывания и узел приема отработанных бланков. Документы поступают из подающего кармана на транспортер, считываются и попадают в один из двух приемных карманов. Слежение за уровнем документов в карманах произво- дится автоматически. Устройство позволяет отбраковывать неверно считанные документы. При смятии или повреждении документов, а также возникновении аварийных си- туаций система автоматически останавливается. Устройство предназначено для совместной работы с ЭЦВМ «Минск-22» и «Минск-23». Для совместного действия устройства с ЭЦВМ «Минск-23» не требует никакой их доработки. При агрегатировании с ЭЦВМ «Минск-22» или машинами других типов необ- ходима соответствующая переналадка устройств. Основные характеристики системы «Бланк» представлены в табл. 2. Устройства для считывания кодированных, нормализованных и стилизованных письменных знаков Считывание кодированных знаков отличается простотой, так как в про- цессе опознавания анализируется не собственно изображение знака, а кодо- вая серия сопровождающих его маркерных меток. В результате опознавание сводится к декодированию последовательностей сигналов. Рассмотрим не- сколько схем считывания кодированных и нормализованных знаков. На рис. 20 представлена схема, иллюстрирующая принцип считывания знаков кодированного шрифта Штейнометик. Точечный код воспринимается с помощью пяти расположенных в ряд фотодиодов. Во время движения доку- мента свет, отраженный от кодовых меток, попадает иа фотодиоды, формируя 27
О X 2 00 о X S о. н э CP в* S « S * S з£ sg 3-5 ев cl 2 s 2 w H S s с 3- я о н 09 etj Н Я О »я X о 2 о. я & ш S $ = * о о. ев X я о «к О со S Я та >»СХЯ Й s S О м С g 2 о ft, Я Н о Ж су 2 « со X £ О. со СО Я 4 S « со су о * * °3 >» = о — «с « и. v СУ л) £ 2 s 3 м 1-Ц у; д. я £ * 2 S 3 о Я со о. ер я я о я н 5 * ч ° со 1 К О, аз 2 л « as о О, со со СУ н со v§ о Я со о н * 2 н со ° I си g« со «ко Pi 3* 8- я £ су 2- ч 5 3 * СО CN SCN м СУ V S н о, су о 2-е- ^ся со С Я о 2- о 2^ I I 3- я^ а. сг о CQ ^ 53И S - ' ^ «о s ^ су Ж я S g S о* - е л я О о s я я н >»со s л та ^ • « О СУ о >>я a « * я я 2 с я IL л S щ я со * СО V о о S та£ in о. а в , су 2 £ S Я су су 0 Хс5 Scy^Stfo^S" SsOJOhSSco >, о я >» в* ft, М CN £н«суян = «и ё >.3 s fj >.о s as s ж 5 s о * , - - 8 О 0Q СМ 1 DQ СУ •I- о ш СУ с; Л О ft, Я н О та со Е- Ч < А а Я О н щ \4 с? S я ¥ 28
на выходе каждого из них различные по величине электрические импульсы. Комбинация выходных импульсов образует код, дешифрация которого позво- ляет опознать анализируемый знак. На рис. 21 приведена схема считывания знаков кодированного шрифта Диксона. Считывание осуществляется посредством десяти фотодиодов. Отра- женный от поверхности документа световой поток попадает на ряд фотодио- Рис. 20. Схема, илллюстрирующая принцип считывания знаков кодированного шрифта Штейнометик / — направление движения документа; 2 — источник света; 3 — матрица фотодиодов; 4 — номера фотодиодов; 5 — оптическая система дов. Каждый фотодиод ряда имеет определенный вес (см. рис. 21, справа). В процессе осмотра поверхности документа на фотодиоды попадает световой поток различной интенсивности. При этом значения отраженного светового потока от кодовой метки и контура знака будут различными, что позволяет Рис. 21. Принцип считывания знаков кодированного шрифта Диксона / — направление движения документа; 2 — оптическая система; 3 — матрица фотодиодов; 4 — номера фотодиодов; 5 — значение фотодиодов; 6 — диафрагма; 7 — источник света; 8 — освещенная зона с помощью амплитудного селектора произвести отделение импульсов кодовых меток от контурных импульсов. В результате определяется номер фотодиода, а с ним и значение анализируемого знака. Считывание нормализованных письменных знаков производится аналогич- ными способами. Так, для считывания нормализованного шрифта, разрабо- танного НИИ ЦСУ СССР (см. рис. 16), используется матрица из 10 фото- диодов. Путем проецирования изображения нормализованной цифры на 29
4 3 2 ФА матрицу часть фотодиодов затемняется. Комбинация электрических сигналов, возникающих на выходе затемненных фотодиодов, образует код, используя который, можно простыми способами опознать анализируемый знак. На примере оптического шрифта ЦЗ-13 рассмотрим основные принципы создания, кодирования и считывания оптических стилизованных знаков. В большинстве случаев стилизации сопутствует придание неодинаковой значимости различным элементам изображения знаков. Например, для оптиче- ского стилизованного шрифта ЦЗ-13 характерно, что вся информация, содер- жащаяся в знаке и позволяющая производить его автоматическое опознава- ние, заключена только в вертикальных элементах. Горизонтальные, наклонные и криволинейные элементы служат в ос- новном для восприятия и опознавания знаков человеком. Шрифт сконструиро- ван с возможно большим приближением к обычным формам знаков и с учетом требований помехозащищенности в про- цессе считывания. Все знаки шрифта строятся на кон- струкционной сетке (рис. 22). В кон- струкции знаков различаются верхний и нижний пояса (ВП и НП), где разме- щаются информативные элементы — вертикальные штрихи. В каждом из поя- сов имеется по пять фиксированных позиций, на которых, как на осях, рас- полагаются вертикальные штрихи. Ника- ких других позиций для вертикальных штрихов, кроме тех, которые удовлетво- ряют конструкционной сетке, в знаках нет. Каждой позиции в соответствии с направлением считывания присвоены номер и буква, указывающие, в каком поясе находится та или иная позиция. В соответствии с расположением вертикальных элементов в верхнем и нижнем поясах каждому знаку присваивается некоторая 10-разрядная ком- бинация. Пример кодирования десяти цифр рассматриваемого шрифта пред- ставлен в табл. 3 (единицы соответствуют наличию вертикальных кодовых штрихов, содержащихся в изображении анализируемого знака). НП г ФД Рис. 22. Конструкционная сетка Таблица 3 Кодирование десяти цифр оптического стилизованного шрифта ЦЗ-13 Цифра Штриховые элементы 0 0 0 1 1 0 0 0 0 1 1 1 0 0 0 0 1 1 0 0 0 1 2 0 1 0 0 0 0 0 0 1 0 3 0 0 0 1 0 0 1 0 0 1 4 0 0 0 0 1 0 0 0 1 1 5 0 0 1 0 0 0 0 0 0 1 6 1 1 0 0 0 0 0 0 0 1 7 1 0 0 0 0 1 0 0 1 0 8 0 1 1 0 0 0 1 0 0 1 9 1 0 0 0 0 0 0 0 1 1 30
Десятиразрядный код позволяет образовать 1024 комбинации. В то же время очевидно, что лишь немногие из них пригодны для построения пись- менных знаков. Кроме того, число возможных комбинаций ограничивается тем, что в процессе конструирования шрифта возникает необходимость вы- полнения ряда дополнительных условий, способствующих обеспечению на- дежного машинного считывания. К ним относятся: 1) необходимость нали- чия хотя бы одной «единицы» в каждом из поясов конструкционной сетки; 2) исключение из поясов конструкционной сетки комбинаций из двух рядом стоящих «единиц»; 3) необходимость наличия «единицы» на первой кодовой позиции хотя бы в одном из поясов конструкционной сетки. Первое условие возникает из требования к постоянству высоты знаков; второе позволяет снизить требования к качеству печати и приводит к устра- нению влияния фактора слияния соседних вертикальных штрихов на на- дежность опознавания. Для подтверждения необходимости соблюдения вто- рого условия целесообразно привести некоторые данные анализа двух ос- новных геометрических характеристик знаков рассматриваемого шрифта: толщины штриха и шага конструкционной сетки, которые соответственно составляют 0,3±0,1 и 0,425 мм. Согласно этим характеристикам толщина штрихов в изображении отпе- чатанных знаков может достигать 0,4 мм. При шаге конструкционной сетки 0,425 мм штрихи, расположенные на соседних позициях, приблизятся друг к другу настолько близко, что будут казаться слившимися. При выполне- нии второго условия расстояние между кромками соседних штрихов соста- вит не менее 0,45 мм и эффекта слияния наблюдаться не будет. Выполнение третьего условия позволяет значительно упростить про- цессы формирования кода и его опознавания. Так, при появлении знака в поле зрения головки считывания первым будет сигнал считывания от пер- вого штриха в верхнем или нижнем поясах конструкционной сетки. Этот сигнал запускает механизм, который начинает отсчет тактов от момента пуска, определяя тем самым кодовые позиции считываемых знаков. После отсчета пяти тактов устройство оказывается подготовленным к восприятию следующего знака. В результате выполнения указанных условий из 1024 комбинаций пред- ставляется возможным использовать только 95. Этого вполне достаточно для кодирования полного набора цифровых знаков со значительной инфор- мационной избыточностью. Наличие избыточности позволило построить шрифт с добавлением служебных знаков, надежно опознаваемый машиной. Считывать знаки рассматриваемого шрифта можно двумя фотодиодами, жестко «привязанными» к верхнему и нижнему поясам конструкционной сетки. Однако такой простой способ на практике оказывается недостаточно надежным из-за необходимости считывать документы с дефектами в виде частичных непропечаток или со смещенными в вертикальном направлении знаками. Смещения знаков по вертикали, возникающие вследствие неточно- стей установки бланков при нанесении на них информации, могут быть столь значительными, что фотодиоды будут считывать не вертикальные штрихи соответствующих поясов, а горизонтальные элементы или даже поля, расположенные за пределами знаков. Устраняются эти недостатки применением линейки, составленной из большого числа фотодиодов. Такая линейка располагается параллельно вер- тикальным штриховым элементам знаков и перекрывает по высоте всю область, в которой возможно их появление при любом допустимом верти- кальном смещении. Нечувствительность устройства к горизонтальным и другим неинфор- мативным элементам знаков, а также к посторонним незначительным черным включениям достигается за счет устранения возможности перекрытия неин- формативными элементами более одного фотодиода, в то время как даже поврежденный одиночный непропечатанный вертикальный штрих знака пе- рекрывает не менее двух фотодиодов. Соотношение 2 : 1 позволяет надежно отделить полезные сигналы от помех и сигналов, возникающих при счи- тывании неинформативных элементов. 31
Разделение кодовых сигналов считывания, необходимое для последую- щей дешифрации, осуществляется с помощью так называемого блока цент- ровки. Блок центровки получает с выходных каналов блока формиро- вания сигналы считывания и выдает параллельный код. Результат работы блока центровки таков, как если бы изображение целого знака проециро- валось на неподвижную модель конструкционной сетки, т. е. центрировалось относительно ее. Этим и объясняется применение термина «центровка» в на- звании блока. Выделенный и преобразованный в дешифраторе код может быть в даль- нейшем использован для ввода считанной информации в ЭЦВМ, перезаписи 2 Рис. 23. Графики зависимости отражательной спо- собности от длины световой волны / — германиевый фотодиод; 2 — лампа накаливания; 3 — промокающая почтовая бумага; 4 — шариковая и авторучка; 5 — темно-голубая краска печати; 6—зеле- ный карандаш; 7 — темная печать; 8 — карандаш; 9 — черная текстильная лента; 10 — типографская печать; копировальная лента; 11 — видимый свет на различные виды носителей, сортировки документов или передачи по ка- налам связи. Рассмотренным способом создан ряд шрифтов, в том числе таких, как НКР, Фаррингтон, Зельф Чек* ОЦР-А и др. Ознакомимся с устройством и принципом действия некоторых существующих систем автоматического чте- ния стилизованных знаков. В 1960 г. западногерманская фирма «СЭЛ» получила заказ на разра- ботку устройства для непосредственной обработки платежных документов с данными-, наносимыми обычными печатными красками с помощью простых и недорогих печатающих устройств (ПУ). Речь шла о разработке такого метода считывания письменной информации, который позволил бы избе- жать недостатков магнитного шрифта, основным из которых является не- обходимость применения специальных дорогосиящих ПУ, и сохранить до- стойна а магнитных способов считывания—невосприимчивость к помехам в виде ; ятен и помарок. От устройства требовалась высокая скорость счи- тывания фи незначительной стоимости '..о изготовления. 32
После ряда исследований был разработан метод, который позволил счи- тывать напечатанную информацию в инфракрасной области спектра [27]. Рассмотрим сущность этого метода. На рис. 23 представлены графики зависимости отражательной способ- ности от длины световой волны. Из приведенной диаграммы следует, что знаки, нанесенные на бумагу с помощью типографской краски или черной копировальной ленты (кривые 9 и 10), легко отделить от возможных помех (кривые 3—6), если в дополнение к видимой части спектра света исполь- зовать инфракрасную область. Такое дополнение позволяет надежно отли- чать помехи от знаков, поскольку в инфракрасной области спектра помехи и бумага имеют примерно одинаковую отражательную способность и черная краска хорошо контрастирует с ними. На рис. 23 над диаграммой приведены области спектра для лампы накаливания и германиевого фотодиода. Кривая 3, характеризующая отра- жательную способность промокающей почтовой бумаги, иллюстрирует ти- пичное поведение «плохой» бумаги. Серый цвет бумаги из-за незначитель- v=const / Ъ d f Ь К Рис. 24. Принципиальная схема читающего автомата /—фотодиоды; 2 — усилители; 3 — такт запоминающего уст- ройства (5 импульсов); 4 — черно-белая граница; 5 — регистр сдвига ной отражательной способности очень заметен в видимой области спектра. В инфракрасной области спектра эта бумага кажется такой же светлой, как и белая, что позволяет использовать ее для изготовления различных до- кументов. Рис. 23 иллюстрирует также некоторые особенности использования рас- сматриваемого метода. Кривая 8, характеризующая отражательную способ- ность карандаша, расположена в непосредственной близости от кривой ти- пографской краски. Такое соседство говорит о нежелательности карандаш- ных пометок на документах, обрабатываемых с помощью читающих уст- ройств, так как подобного рода пометки сбудут представлять собой грубые помехи. Использование инфракрасной области спектра позволяет надежно от- делить изображения знаков, нанесенных с помощью типографской краски или черной копировальной ленты, от таких помех, как следы шариковых ручек, пометки цветными чернилами и карандашами, оттиски печатей, штем- пелей и т. п. Указанный метод позволил реализовать ряд устройств, предназначен- ных для опознавания знаков оптических стилизованных шрифтов типа ЦЗ-13, ОЦР-А и др. Познакомимся с одним из них. На рис. 24 представлена принципиальная схема оптического читающего устройства производства фирмы «СЭЛ» (ФРГ). При перемещении злаков мимо блока считывания осуществляется их сканирование справа налево. Фотодиоды формируют импульсы напряжения, временная последователь- ность которых определяется положением черных элементов в конструкцион- ной сетке. Заполнение двух регистров сдвига импульсами «черного» осу- ществляется с помощью тактового генератора. В случае «1» разряды е, f 3 Н. Н. Савета .33
и k регистров сдвига маркируются «черными» в соответствии со схемой ко- дирования. Фотодиоды располагаются в виде вертикального ряда, параллельного вертикальным элементам письменных знаков (см. рис. 25). Изображение письменного знака увеличивается оптической системой так, чтобы один вер- тикальный штрих перекрывал, например, три расположенных рядом фото- диода, соединенных через сопротивления с узловой точкой D. В результате напряжение Ud окажется пропорциональным перекрытию трех фотодиодов черными элементами изображения знака. В случае проецирования на ряд 15 16 17 Рис. 25. Блок-схема устройства / — сканирование; 2 — ЗУ; 3 — анализ; 4 — опознавание; 5 — вы- ход; 6 — разряд; 7 — направление движения знаков; 8 — ряд фо- тодиодов; 9 — опознавание вида штрихов; 10 — вид штриха в столбце; 11 — схема «И»; 12 — неопознан; 13 — расположение по высоте; 14 — расположение штрихов по высоте; 15 — такт запоми- нающего устройства; 16 — такт регистра сдвига; 17 — счетчик фотодиодов вертикального штриха контура изображения письменного знака напряжение в точке D окажется минимум в три раза больше (см. столбец/), чем при проецировании горизонтального штриха (см. столбец 2 или 3). От- ношение напряжений 3 : 1 получается даже в самом неблагоприятном случае и, следовательно, является вполне достаточным для надежного отделения черных штрихов в следующем пороговом элементе. Нормальная работа обес- печивается также при наличии таких помех, как искажения (пропуски) в черном элементе или цветные пятна в белом элементе поля изображения. В описанном способе сканирования используются только вертикальные штрихи, а горизонтальные гасятся. Исключение горизонтальных штрихов при- водит к упрощению оборудования. Непосредственно со сканирующим блоком связаны логические схемы для запоминания и анализа считанной информации. Запоминающее устройство состоит только из одного регистра сдвига для приема и центрирования «чер- но-белых» элементов пяти столбцов. Процесс центрирования заключается 34
в выравнивании высоты расположения знаков. Для этой цели считанная ин- формация сдвигается в определенную область регистра сдвига, соединенную с блоком опознавания вида штрихов. Здесь каждый столбец в отдельности анализируется по следующим критериям (высказываниям): 1) короткий штрих; 2) длинный штрих; 2) нет штриха; 4) не обнаружен. Эти высказывания, записанные в двоичной системе для пяти столбцов, содержат 10 бит информации. В процессе центрирования регистр сдвига фиксирует положение штриха в первом столбце знака относительно нормаль- ного положения. Расположение по высоте штрихов в следующих столбцах знака определяется по отношению к штриху в первом столбце. При этом получаются следующие высказывания: штрих в столбце 2 (или в столбцах Зу 4, 5) лежит по сравнению со штрихом предшествующего столбца: выше, ниже, на одной высоте. Рис. 26. Внешний вид считывающе-сортировочного устрой ства ОДС-2 Эти высказывания, записанные в двоичной системе для четырех срав- нений столбцов, содержат 8 бит информации. Высказывание «нет штриха» обрабатывается при сравнении столбцов так же, как и высказывание «на од- ной высоте». В результате с помощью 18 бит информации однозначно описываются все знаки. Такое сокращение необходимой для обработки информации позво- ляет использовать промежуточное запоминающее устройство (регистр сдвига) с очень простыми схемами опознавания. Рассмотренный нами принцип построения был реализован фирмой «СЭЛ», которая в 1963 г. создала несколько считывающе-сортирующих устройств. Внешний вид одного из них показан на рис. 26. На рис. 27 представлена упрощенная блок-схема системы Фаррйнгтон [32], предназначенной для чтения алфавитно-цифровой информации стили- зованного шрифта с обычных документов, размеры которых могут изме- няться по ширине от ПО до 210 мм и по длине от 135 до 330 мм. Из входного накопителя документы / с помощью системы подачи по- ступают в блок считывания. В блоке считывания производится ориентация и установка печатных строк, восприятие и преобразование письменной ин- формации с помощью развертки 2 в электрические сигналы, которые затем передаются в блок опознавания 3. С блока опознавания сигнал поступает в систему «выделения формы» 4% которая выделяет заголовок, сумму и другие данные в считанной строке, 3* 35
а также группирует информацию в соответствии с заданной программой. Система 4 связана с буферным запоминающим устройством 5, где накапли- вается считанная и сгруппированная информация. По окончании цикла счи- тывания информация может быть перенесена устройством 6 на перфокарты, перфорационную или магнитную ленты. Познакомимся более подробно с устройством и принципом действия не- которых узлов и механизмов системы Фаррингтон. На рис. 28 представлена схема системы подачи документов. Доку- менты 1 помещаются в приемный лоток 2 лицевой стороной вверх, первой Рис. 27. Упрощенная блок-схема системы Фаррингтон строкой по направлению к блоку развертки 15. При пуске системы подачи документов сервомеханизм «установка строки» автоматически возвращается в исходное положение, что обеспечивает получение максимальной величины перемещения этого механизма. Одновременно через трубу 6 начинает отка- чиваться воздух из подхватывающей головки 8, в результате чего вблизи ее поверхности создается небольшое разрежение, под действием которого верхний документ притягивается к головке. Подхватывающая головка при 4 5 6 7 10 11 13 14 15 Рис. 28. Механизм подачи документов этом располагается в левом крайнем положении таким образом, чтобы сво- бодный конец документа мог беспрепятственно войти в криволинейную гор- ловину 17. Для предотвращения слипания отдельных листов в результате их слу- чайной электризации на торец пачки документов через специальный рассе- катель 3. по трубке 4 подается воздух. После подхвата очередного документа головкой 8 специальная электро- муфта .начинает вращать шестерню подачи 10, сцепленную с направляю- щими 7. К этим направляющим, двигающимся в суппорте //, прикреплена подхватывающая головка 8,. перемещение которой ограничивается концевыми выключателями 5 и 9. , При зажиме края листа ведущим колесом 16 и роликом 14 с помощью соленоида 12 и рычага 13 в головке устраняется разрежение, после чего она возвращается в исходное положение. Далее документ, находящийся в криво- линейной горловине, подается в блок развертки и перемещается до тех пор, пока первая строка не достигнет рабочего поля. Подача и выравнивание строки осуществляется сервомеханизмом (на рисунке не показан). 36
Механизм подачи документов имеет храповик, связанный с ведущим ко- лесом 16. Входной вал механизма вращается непрерывно и через фрикци- онную муфту передает крутящий момент храповику. Вращению храповика препятствует защелка, управляемая электромагнитом. Расстояния между зубьями храповика соответствуют возможным интервалам между строками документа. Электронная схема, регулирующая длительность импульса, пода- ваемого на электромагнит защелки, обеспечивает необходимую подачу доку- ментов в зависимости от интервалов между строками печатной информации. Вначале страница старт-стоп с шагом в один интервал подается до тех пор, пока в блоке считывания не появится первая печатная строка. Появле- ние строки в блоке считывания приводит к прекращению подачи импульсов в электромагнит защелки, вызывая остановку документа. Рис. 29. Система сканирования Теперь включается в работу оптическая система, которая отыскивает низ первой строки документа. При этом сигнал развертки сравнивается в электронной схеме с опорным сигналом. В результате вырабатывается не- прерывный сигнал, пропорциональный расстоянию между действительным и требуемым положением печатной строки. Полученный сигнал рассогласо- вания преобразуется затем в переменное напряжение, подаваемое в одну из обмоток сервомотора. В другую его обмотку подается напряжение с фик- сированной амплитудой и фазой; третья, демпфирующая, обмотка включена в анодную цепь демпфирующей лампы. Сервомотор приводит в действие колесо, на котором укреплены защелка храповика с электромагнитом. Такая система позволяет осуществлять пере- мещение страницы в любом направлении в пределах одного интервала до тех пор, пока страница не займет требуемого положения. После этого сер- вомотор затормаживается постоянным током анодной цепи демпфирующей лампы. Печатные строки осматриваются с помощью оптической системы, схе- матически представленной на рис. 29. Свет от лампы накаливания / мощно- стью 750 .07 проходит через конденсоры 2 и <?, пару зеркал и преобра- зуется в узкий пучок, который, отражаясь еще от одного зеркала, попадает на зеркало 4. Оно установлено на колеблющейся оси 6 и отбрасывают на 37
читаемую строку документа 5 яркое световое пятно, перемещающееся вдоль нее. Второе зеркало, укрепленное также на оси 6, воспринимает отраженный от поверхности документа световой поток. Увеличенное изображение печат- ного знака попадает через линзу 7 на призму 8, а затем с помощью си- стемы призм проецируется на быстро вращающийся развертывающий диск 9, по периметру которого имеется большое количество прямоугольных отвер- стий (щелей). Через эти щели свет от призм попадает на две фиксирован- ные вертикальные щели 10, а затем на пару фотоумножителей 11, сигналы которых используются для опознавания считываемых знаков. *Г Р I™ Н' ДВЛ кввп КВВЛ\ 'КВНП квнл Рис. 30. Основные штриховые элементы опознаваемых зна- ков: а — горизонтальные; б — вертикальные Использование двух систем призм позволяет осуществить опознавание знаков по двум независимым друг от друга каналам. Поскольку результи- рующие сигналы каждого фотоумножителя могут отличаться друг от друга, устройство в состоянии опознавать знаки с некоторыми дефектами печати. Опознавание знаков построено на принципе штрихового анализа, сущ- ность которого заключается в том, что каждая буква или цифра разбивается б) r*i+i-i+i+i-i+ ГС гн кввл~\ квнл кввп квнп Двл двп >789 . .iiiiniiiiiiiiniiiiiilll I 1Mb 15 2D 25 Г Рис. 31. Таблица кодиро- вания Рис. 32. Форма сигнала, получаемого в процессе раз- вертки на несколько отдельных штриховых элементов (например, на три горизон- тальных и шесть вертикальных элементов). На рис. 30 показаны эти эле- менты. Опознавание знаков основывается на установлении наличия или отсут- ствия основных штриховых элементов в изображении опознаваемого знака и производится с помощью логических схем. На рис. 31 показано, какие эле- менты должны присутствовать ( + ) или отсутствовать (—) при опознава- нии цифр от 0 до 9. При работе системы развертки на вертикальную щель попадает тон- кий луч от вертикального элемента изображения печатного знака. Так как качающееся зеркало движется по горизонтали вдоль знака, последний оказы- вается расчлененным на 30 и более тонких вертикальных долей (см. рис. 32). Когда щель развертывающего диска проходит мимо темного участка изо- бражения знака, на выходе фотоумножителя образуется высокий потенциал. 38
При прохождении щели развертывающего диска мимо светлого участка на выходе фотоумножителя образуется низкий потенциал. На рис. 32, б показана форма сигнала, получаемого при развертке 5, 15 и 25 долей изображения знака, представленного на рис. 32, а. Конструкция системы развертки позволяет производить непосредствен- ное измерение вертикальных элементов. Горизонтальные элементы опознаются путем подсчета долей, образованных этим элементом. По таким признакам блок оценки сигналов 1 (рис. 33), воздействует на соответствующий триг- гер (ГВ—ДВП). Эти сигналы вырабатывают выходной сигнал на схеме сов- падений, соответствующий считывающему знаку. На рис. 33 показано при- соединение к триггерам ГВ—ДВП схем совпадения для цифр 2, 5, 7 и 9. Буферный накопитель имеет емкость 80 печатных знаков. Как только он переполнится, сигналы подаются на выходной перфоратор и накопитель автоматически освобождается. 1 *—Сброс Рис. 33. Схема соединений триггеров ГВ-ДВП со схемами совпадения для цифр 2, 5, 7 и 9 После считывания всей информации со страницы документа лист уби- рается в карман «принято», если информация понята устройством, или в кар- ман «не прочитано», если в документе содержится непонятая информация. Затем подается второй документ, и весь процесс повторяется снова в ранее описанном порядке. Из всех известных в настоящее время оптических стилизованных штиф- тов наибольшее распространение получил шрифт ОЦР-А (штифт А, см. рис. 11). Институт автоматизации сберегательных касс и расчетных палат ФРГ уже длительное время исследует различные читающие и печатающие устройства. Опыты с устройствами для шрифта ОЦР-А показали, что раз- работанный институтом автомат работает с высокой скоростью и надежно- стью. В ходе экспериментов было прочитано около 4 млн. знаков, напечатан- ных различными способами. Ошибки при этом отсутствовали полностью. Для того чтобы установить, могут ли необученные люди безошибочно читать нормальный шрифт ОЦР-А, была создана машина для нанесения этим шрифтом надписей на корреспонденцию. За год с лишним не обнару- жено каких-либо ошибок или затруднений. Ниже кратко описываются некоторые модели читающих устройств для опознавания знаков шрифта ОЦР-А, серийно изготавливаемые зарубежными фирмами [33]. Американской фирмой «Контрол Дейта» производится читающее уст- ройство типа КД 915, предназначенное для работы с ЦВМ этой же фирмы. Оно может быть использовано для перезаписи данных на перфокарты или 39
магнитную ленту. Устройство позволяет считывать информацию как с от- дельных листов длиной 65,3—355,6 мм и шириной 101,6—304,6 мм, так и с бесконечной ленты, имеющей ширину в заданных пределах. При этом машина может считывать не только знаки шрифта А, но и буквы нормаль- ного американского алфавита, цифры и специальные знаки которого совпа- дают со шрифтом А. Документы подаются в устройство транспортером. Перед прочтением листы разглаживаются в вакуумной камере. Строки, в которых после вто- ричной попытки считывания остается неопознанный знак, отмечаются авто- матически. В процессе чтения документ ярко освещается, и зеркало, сканирующее по. строкам, переносит информацию через систему линз на второе зеркало, сканирующее в вертикальном направлении с частотой 3,75 кгц. При этом световой луч поочередно попадает на один из пяти фотоумножителей. Коле- бания яркости преобразуются в электрические сигналы, которые поступают в сдвигающий регистр. К регистру подключены 64 матрицы (по числу раз- личных знаков). Каждая матрица представляет собой электрический эта- лон изображения соответствующего знака. Информация, записанная в ре- гистре, поочередно сравнивается с эталонными описаниями, в результате чего происходит опознавание письменного знака. Устройство может работать в режиме считывания только цифр или букв, или цифр и букв одновре- менно. Максимальная скорость чтения составляет 370 знаков в секунду. Американской фирмой «ИБМ» выпускается многофункциональный чита- ющий автомат типа ИБМ-1287, предназначенный для работы с ЦВМ моде- лей от 30 до 50 системы ИБМ-360. Автомат способен опознавать знаки нор- мального шрифта А, а также знаки еще нескольких стилизованных шрифтов, содержащих полный алфавит письменных знаков. С помощью дополнитель- ного устройства возможно опознавание рукописных цифр и пяти заглавных букв. Созданию этого устройства предшествовало огромное количество экс- периментов по опознаванию цифр, написанных различными почерками. При написании знаков рекомендуется руководствоваться определенными весьма несложными правилами. Так, знак должен по возможности занимать все отведенное для него место. Линия одного знака проводится без разрыва; петли в цифрах 6, 8 и 9 замыкаются. Два соседних знака не имеют связей. Цифра / состоит только из одного штриха, а 7 не имеет поперечной па- лочки. Для письма предпочтителен карандаш. Стирание допускается. Руко- писные знаки могут быть перемешаны с печатными. В машину закладывается пачка листов толщиной до 300 мм. Все листы должны иметь одинаковый формат. Прочитанные документы направляются в три приемных кармана, один из которых предназначен для сбора листов с непрочитанными знаками. Для прочтения неразборчивого знака предприни- мается около десяти попыток. В случае неудачи производится коррекция одним из следующих методов. При «открытом» методе неразборчивый знак проецируется на экран светового индикатора и опознается оператором. При «закрытом» методе машина пропускает неопознанный знак и вводит в ре- гистр заменитель, одновременно отмечая строку. Неопознанные знаки затем вводятся вручную. Для опознавания знаков используется метод отслеживания контура. Сканирование изображения производится в темной камере световым лучом с экрана электроннолучевой трубки. Способы сканирования различны. Так, при чтении рукописных цифр луч совершает круговое сканирование вдоль контура знака. Управляющие напряжения на отклоняющие пластины трубки при этом вырабатываются в зависимости от конфигурации знака. При пер- вичном сканировании определяются размеры знака с помощью матрицы из 3X4 элементов (нормировка). При вторичном сканировании проводится анализ контура кривой и опознавание знака на основе результатов этого анализа и наличия затемненных элементов в матрице. При опознавании стилизованных печатных знаков вторичное сканирова- ние проводится только по трем горизонтальным и одной вертикальной ли- ниям. Производительность устройства зависит от следующих . основных 40
факторов: размеров документа, количества письменных знаков в документе и количества маркирующих строк. В табл. 4 представлены технические характеристики оптических уст- ройств считывания стилизованных письменных знаков производства неко- торых зарубежных фирм. Устройства опознавания печатных и машинописных знаков Известные в настоящее время устройства, предназначенные для автома- тического чтения печатных и машинописных знаков, записанных с помощью обычных красок и чернил, можно разбить на два больших класса: 1) устройства, в которых для хранения набора эталонов используются оптические маски-трафареты; 2) устройства, в которых для хранения набора эталонов применяются матрицы сопротивлений, фёрритовых сердечников и другие электрические модели эталонов. В устройствах первого класса изображение опознаваемого знака прое- цируется непосредственно на эталонные маски-трафареты. Опознавание осу- ществляется путем измерения или сравнения выходных сигналов светочув- ствительных элементов, возникающих в результате воздействия на них свето- вого потока от опознаваемого изображения, прошедшего через маски. В автоматах второго класса для опознавания письменных знаков ис- пользуются методы электрического сравнения перекрытием и сравнения по признакам. Сравнению подвергаются электрические описания знака, представляемые в виде определенной последовательности дискретных по уровню и времени сигналов. Сравнение осуществляется с помощью взвешенного суммирования сигналов от элементов знака на эталонных матрицах сопротивлений, фёрри- товых сердечников и др. Опознавание может осуществляться: 1) путем срав- нения или измерения электрических сигналов на выходе соответствующих эталонов; 2) сравнением электрических сигналов опознаваемых и эталонных изображений на основе подсчета взаимных коэффициентов корреляций, рас- стояний по Хеммингу, апостериорных вероятностей появления совокупности признаков опознаваемого знака на каждом из эталонов, путем вычисления автокорреляционных функций и сопоставления их с эталонными функциями и др.; 3) сравнением с таблицей истинности, содержащей данные о частоте появления или взаимных связях признаков в отдельных эталонных классах знаков; 4) различными комбинациями перечисленных способов. Для осмотра, восприятия и преобразования графических изображений письменных знаков в электрические сигналы в таких устройствах служат раз- личные методы и средства сканирования, из которых наибольшее распростра- нение получили системы с использованием светочувствительных элементов и «бегущего луча». Читающие устройства с оптическими масками-трафаретами. В первых машинах такого типа изображение проецировалось на маски, имевшие про- зрачные участки в форме знаков принятого алфавита. За каждой маской устанавливался фотоэлемент. В случае, если прозрачный участок перекры- вался оптическим изображением опознаваемого знака или составлял часть его, доступ света на фотоэлемент прекращался. При считывании знаков, меньших, чем на маске, освещение фотоэлементов сохранялось. Фотоэлементы электрически связывались с реле, которые выбирали одну определенную выходную шину, соответствующую опознанному знаку. Применение описанной схемы приводило к ошибкам, так как на выход- ных шинах появлялись ложные сигналы. Например, поскольку цифра 1 по своей форме представляет часть цифры 4, то при появлении оптического изображения последней свет перекрывался на обеих масках. В итоге полу- чались два несовместимых результата. Для исключения таких ошибок существуют различные способы. Наиболее простым из них является такое соединение контактов исполнительных реле, которое обеспечивает появление рабочего потенциала только на одной шине. 41
Так, при считывании цифры 4 будут полностью перекрыты маски цифр 4 и 1, что вызовет срабатывание реле обоих этих каналов.. Для предотвраще- ния этого контакты реле соединяются таким образом, чтобы выполнялась логическая операция «И», обеспечивающая возбуждение шины цифры 4. При считывании цифры 1 маска цифры 4 будет перекрыта частично и реле, соответствующее каналу 4, не сработает, а включится только реле канала 1. Контакты соединяются так, что происходит запрет шины 4 и выборка шины 1. В большинстве автоматов первого класса опознавание осуществляется путем сравнения оптического изображения знаков с набором стандартных отрицательных и положительных масок. В таких устройствах на каждый знак имеется две маски: отрицательная и положительная. Отрицательная маска представляет собой непрозрачный экран с прозрачной частью в форме определенного знака. Положительная маска прозрачна и имеет непрозрач- ный участок в виде того же знака. Каждой маске соответствует свой фото- элемент. При совпадении изображения знака с прозрачным участком отрицатель- ной маски происходит затемнение фотоэлемента и повышение его сопротив- ления. При совмещении изображения с непрозрачным участком положительной маски освещение соответствующего фотоэлемента возрастает и сопротив- ление его уменьшается. Остальная часть схемы автомата может быть выполнена следующим об- разом. Фотоэлементы включаются в разные плечи делителя, задающего на- пряжение на входе катодного повторителя. Характер изменения светового потока, проходящего через маску, соответствующую опознаваемому знаку, значительно отличается от характера изменения светового потока, получае- мого при чтении других знаков. Сигнал с выхода каждого катодного повторителя подается на эмиттер одного из выходных полупроводниковых триодов и на базу каждого выход- ного полупроводникового триода (ПТ), что и позволяет выделить наиболь- ший сигнал из сигналов, поступающих с катодных повторителей (число тран- зисторных схем равно количеству знаков в наборе). Изменится состояние того ПТ, на эмиттер которого поступил сигнал с катодного повторителя, принадлежащего каналу, где произошло наибольшее изменение светового по- тока, падающего на фотоэлементы. Наибольшее изменение произойдет в том канале, где оптическое изображение знака совпадает с отрицательной и по- ложительной масками. Рассмотренные нами принципы нашли свое воплощение в целом ряде реально существующих устройств, в частности, таких, как, многошрифтовой автомат фирмы «РКА» (США), автомат для перевода с русского языка на английский производства фирмы «Вэард-Атомик Корпорейшн» и др. На рис. 34 представлена блок-схема многошрифтового автомата фирмы «РКА» [11, 34]. Автомат предназначен для считывания и ввода в ЭЦВМ исходных данных со стандартного бланка размером 75X125 мм со скоро- стью 500 знаков в секунду. Осмотр знаков производится с помощью растровой развертки типа «бе- гущий луч». Изображение знака воспроизводится на экране двухлучевого кинескопа. Знак представляется одновременно в виде рядом расположенных позитивного и негативного изображений. Полученное изображение с помо- щью оптического размножителя проецируется на эталонные маски. Маски построены таким образом, что в каждом знаковом канале имеются высоко- контрастные позитивное и негативное изображения эталона. В процессе ра- боты происходит одновременное наложение изображения опознаваемого знака на негативное и позитивное изображения эталона. Величина результирующего светового потока каждого знакового канала определяет степень несовпадения опознаваемого знака с данным эталоном. Каждый знаковый канал имеет по одному фотоумножителю и интегратору, с помощью которых происходит преобразование величины световых потоков в соответствующие электрические импульсы (сигналы). Критерием опознавания 43
является минимальная величина сигнала на выходе интеграторов знако- вых каналов. Система управления определяет необходимый характер работы растро- вой развертки (поиск строки, знака, чтение знака). По опубликованным данным, надежность 16-канального макета рассмат- риваемого автомата сравнительно высокая и составляет одну ошибку на 200 ООО считанных знаков. Автомат-переводчик фирмы «Бэард-Атомик Корпорейшн», изготовленный по заказу ВВС США, предназначен для автоматического перевода различ- ной информации с русского языка на английский 1[11, 28]. Информация, под- лежащая автоматическому опознаванию, предварительно переснимается на Рис. 34. Блок-схема многошрифтового читающего автомата про- изводства фирмы «РКА» Д — документ; ФЭУ—фотоэлектронные умножители; БОВ — блок обра- ботки видеосигналов; ЛУПЦ — логическое устройство поиска и центров- ки; И — интегратор; УС — устройство сравнения; РУ — разпознающее устройство / — линза; 2 — конденсоры; 3 — оптический канал; 4 — двухлучевой ки- нескоп; 5 —линза; 6 — эталонные маски; 7 — фотоэлементы негативную высококонтрастную кинопленку. Затем пленка вводится в уст- ройство и изображение знаков с помощью оптической разделяющей системы проецируется на эталонную маску (рис. 35). Для каждого знакового канала имеется по две маски: маска негативного изображения самого эталонного знака и маска «белого поля», представляющая собой прозрачный прямо- угольник, в который вписывается данный эталон. Для каждой группы эта- лонов одинаковой ширины предназначается одна маска «белого поля». За каждой маской располагается светочувствительный элемент. Выходной сиг- нал каждого знакового канала представляет разность сигналов от эталон- ной маски и соответствующей маски «белого поля». Критерием опознавания является максимум сигнала на выходах знаковых каналов. Поиск печатной строки и центровка знака осуществляются с помощью дополнительной фото- электрической следящей системы, управляющей движением пленки относи- тельно головки считывания. Предварительный поиск строки производится по минимуму света, проходящего через специальную узкую щель, расположен- ную горизонтально поперек всей ширины пленки с текстом. Более точная коррекция положения строки осуществляется второй фотоэлектрической систе- мой, поле зрения которой представляет собой вид двух соприкасающихся 44
прямоугольных щелей, горизонтально расположенных вдоль строки. Коррек- ция производится сравнением сигналов от первой и второй щелей. Окон- чательная центровка опознаваемого знака осуществляется по совпадению левой крайней точки знака с левым краем квадратного поля зрения головки считывания. Рассматриваемая система может опознавать знаки различных шрифтов, для чего в ней предусмотрена автоматическая смена эталонных фотомасок! Скорость чтения при использовании одной маски достигает 1000 знаков Рис. 36. Функциональная блок-схема читающего автомата /—магазин документов; 2 — механизм сканирования с устройст- вом управления; 3 — распределитель документов; 4 — отметка вре- мени и даты; 5 — приемник с использованной информацией; 6 — приемник аннулированных документов; 7— управление перемещени- ем бумаги; 8 — оптическое изображение; 9 — матрица фотоэлемен- тов; 10 — цепи опознавания знаков; // — опознанный знак; 12 — кодирующая матрица; 13 — выходной усилитель; /4 — параллель- ный закодированный выход; 15 — неопознанный знак; 16 — опреде- литель ошибки; 17 — сигнал аннулирования ошибки; 18 — сигнал подачи ленты; 19 — сигнал окончания ленты; 20 — читающий ав- томат; 21 — вспомогательное оборудование; 22 — пробивка перфо- ленты; 23 — перфолента; 24 — считывающее устройство трансмит- тера; 25 — управление трансмиссией 26— линия передачи; 27 — запоминающее устройство на ленте и управление; 28 — автомати- ческая нумерация; 29 — проверочная печать / — нормальная работа; // — управление и обнаружение ошибок; /// — перемещение документов в секунду. При работе с различными типами шрифтов скорость чтения сни- жается. Читающие автоматы с электрическими моделями эталонов. Рассмотрен- ные выше устройства опознают в основном печатные буквы, цифры и знаки с весьма высокой степенью повторения формы. Знаки, нанесенные не типо- графским способом (например, пишущей машинкой) и довольно сильно от- личающиеся друг от друга, этими устройствами опознаны быть не могут. Для чтения таких знаков разработаны более универсальные автоматы. Описание изображения в них получается благодаря проецированию знака на матрицу фотоэлементов или его сканированию с помощью обычной или следящей развертки. В обоих случаях описание сравнивается с электриче- скими моделями эталонов, хранящимися в запоминающем устройстве. Примером читающих автоматов первого типа могут служить машины фирм «Вестерн Юнион», «Рэбинов Енджиниринг» и «Рикогнишн Эквипмент». 46
На рис. 36 представлена блок-схема автомата фирмы «Вестерн Юнион» [11, 26]. Автомат (модель 220) предназначен для чтения сообщений со специ- альных бланков, напечатанных на пишущей машинке, и для перезаписи считанной информации на перфорационную ленту со скоростью 172 слова в минуту. В процессе разработки автомат был приспособлен для чтения письмен- ных знаков нескольких различных шрифтов с документов формата 21,5X Х28 см и 21,5X35,5 см. Он может регистрировать считанные данные на пер- форационной и магнитной лентах. Рассмотрим его устройство и принцип действия. На рис. 36 (левая часть схемы) пунктирной линией показан путь про- хождения документа. После сканирования на нормально прочитанном доку- менте ставится время обработки, после чего он следует в приемный карман (приемник до- кументов с использованной информацией). Не- прочитанные по какой-либо причине листы отсортировываются определителем ошибок и распределителем документов. На рис. 37 приведена принципиальная схема действия механизма транспортировки документов из подающего кармана, в котором помещается до 25 документов размером 14,6Х Х21,6 см. Рис. 38 поясняет устройство и принцип действия системы сканирования. При скани- Рис. 37. Схема принципа ровании документы с текстом вращаются на действия механизма транс- барабане, движущемся со скоростью 12 об/мин. портировки Текст освещается двумя 110-ваттными йодо- / — вводный желоб; 2 —вво- кварцевыми лампами. Система линз увеличи- димый документ; з —пачка вает изображение в 25 раз. При этом высота Жен™агаз™ ВМдо^умм™; увеличенного знака составляет примерно 5—вводный барабан; 6 — ва- 6,35 СМ. По мере сканирования ОДНОЙ строки куумная щель; 7 —барабан за другой барабан скачками перемещается сканирования вдоль своей оси. В устройстве используется 170 кадмиево-селеновых фотосопротивлений. Характеристика фотоэлементов этого типа позволяет обрабатывать инфор- мацию со скоростью 17,2 знака в секунду. Чувствительность их очень ве- лика и составляет несколько ампер на 1 лм. Каждый фотоэлемент имеет форму цилиндра диаметром около 5 мм и высотой 3,8 мм с окошком в торце. Фотоэлементы образуют матрицу 8X11 ячеек. Два длинных горизонтальных ряда фотоэлементов предназначены для центровки строки текста по высоте с помощью подачи от них соответствующих сигналов на центрирующее зеркало. Напряжение на фотоэлементы читающей матрицы подается только в те моменты, когда на вертикальных граничных элементах матрицы нет ника- кого изображения знаков. Когда изображение центрировано на читающей матрице, то часть фотоэлементов оказывается затемненной, а часть — осве- щенной. Сопротивление затемненных фотоэлементов увеличивается, а осве- щенных — уменьшается. Разделение фотоэлементов на затемненные и неза- темненные характерно для каждого знака, и на их различении основана работа системы опознавания. На рис. 39 представлена упрощенная схема включения одного фото- элемента. Вывод фотоэлемента, ближайший к положительному электроду од- ной из батарей (левой по схеме рис. 39), определяет затемненность фото- элемента. Его потенциал положителен, когда на элемент попадает темная часть изображения, и близок к нулю, когда фотоэлемент оказывается неза- темненным. Другой вывод фотоэлемента определяет степень незатемненности. Здесь потенциал оказывается близким нулю, когда фотоэлемент незатемнен, и ста- новится отрицательным при затемненности. 47
Для каждого из опознаваемых знаков имеется плата с печатным мон- тажом набора из 12 различных сопротивлений. Сопротивления связаны с контрольной точкой данной платы, а также с 24 специально выбранными фотоэлементами из групп затемненных и незатемненных элементов (по 12 из каждой группы). Выбор этих элементов соответствует тому знаку, для опознавания которого предназначена данная плата. В процессе разработки конструкции было обнаружено, что 12 фотоэлементов каждой из групп до- статочно, чтобы получить информацию для надежного опознавания иссле- дуемого набора знаков. При правильном выборе элементов выходное на- пряжение в контрольной точке данной платы достигает максимума, когда Рис. 38. Схема принципа действия си- стемы сканирования / — увеличенное изображение знака; 2— гра- ничные фотоэлементы; 3, 8 — фотоэлементы; 4 — центрирующее зеркало; 5 — проекционные линзы; 6 — документ с текстом; 7—- источ- ник света на читающей матрице центрируется изображение соответствующего этой плате знака. Любой другой знак вырабатывает меньшее значение напряже- ния в контрольной точке данной платы, но на его собственной плате напря- жение будет максимальным. Максимальное напряжение в контрольной точке платы, соответствующей опознаваемому знаку, отличается от напряжений, вырабатываемых другими платами, на несколько вольт. При появлении максимального напряжения, фиксируемого специальной схемой, в кодирующую матрицу посылается сиг- нал для пробивки нужного кода на перфоленте. Устройство укомплектовано 60 различными платами для опознавания букв, цифр, знаков препинания и других символов. Оно обеспечивает точ- ность опознавания не хуже 1 ошибки на 10 тыс. считанных знаков. Ут- верждается, что возможна работа с точностью до 1 ошибки на 100 тыс. знаков при считывании текста, отпечатанного с помощью электрической пи- шущей машинки на писчей белой бумаге высшего качества. Вторым примером читающего автомата, в котором изображение пись- менного знака проецируется на матрицу фотоэлементов, является устройство фирмы «Рэбинов Энджиниринг» [11]. В нем вообще отсутствует система временного хранения информации об опознаваемом знаке. Изображение про- 48
ецируется на матрицу из 28 фотоэлементов. К каждому фотоэлементу не- посредственно подключаются матрицы сопротивлений. Для учета определен- ного числа возможных сдвигов знака по вертикали к фотоэлементам под- соединяется по нескольку наборов сопротивлений на каждый эталон. Сет- чатка делается несколько больше знака. Рис. 39. Упрощенная схема включения одного фотоэлемента / — фотоэлемент; 2 — точка определения «незатемнен- ности» фотоэлемента; 3— точка определения «затем- ненности» фотоэлемента Устройство отличается простотой конструкции; отсутствует необходи- мость в точной центровке знаков, квантовании элементов знака по уровню, исключаются сдвиги. По данным фирмы, его теоретическое быстродействие может достигать 50 ООО знаков в секунду. В рассматриваемом макете ско- рость опознавания составляет 1100 знаков в секунду. Рис. 40. Блок-схема читающей машины «Рикогнинш Эквипмент» УФД — устройство фиксации документа; УС — устройство счи- тывания (механическая часть); УПД — устройство подачи до- кументов в выходной бункер; ВхБСД — входной бункер для специальных документов; ОС оптическая система; МФ — матрица фотоэлементов; ВА — вертикальный анализатор; АК — амплитудный коррелятор; УНЗ — устрйство нормализа- ции знаков; КЗ — коррелятор знаков; ИФ — идентифицирую- щий фильтр; ГР — генератор решений; УПУ — устройство программного управления; ПУ — пульт управления; ЗУ— за- поминающее устройство на магнитной ленте; У ПУПА — уст- ройство программного управления периферийной аппаратуры / — блок подачи документов; // — система перемещения (по- дачи) документов; /// — система сканирования; IV — система опознавания; V— управление и вывод К числу наиболее современных быстродействующих матричных читающих автоматов можно отнести машину «Электроник Ретина Карэктор Ридер» американской фирмы «Рикогнишн Эквипмент» [37]. Она предназначена для ав- томатического чтения машинописной и печатной алфавитно-цифровой инфор- мации с многострочных документов. Скорость чтения не менее 200 знаков в секунду. На рис. 40 представлена ее блок-схема. Все блоки можно разбить на че- тыре функционально связанные между собой системы. 4 Н. Н. Савета 49
Первою из них, систему перемещения (подачи) документов, образуют уз- лы, основными функциями которых являются подача, транспортировка, вы- равнивание, маркировка и вывод документов. Система сканирования осуществляет подготовку считываемых письмен- ных знаков перед их подачей в устройство для опознавания. При сканирова- нии производится оптическое увеличение, ориентация, нормализация изобра- жения письменного знака, компенсация непропечаток и различной контраст- ности, а также восприятие и преобразование графического изображения в «электронный образ». В третьей системе опознаваемой письменный знак идентифицируется с одним из хранящихся в машине эталонов. Четвертая система производит уп- равление, контроль и вывод опознанной информации. Рассмотрим несколько подробнее назначение и характерные особенности каждого блока читающего автомата (название блоков соответствует схеме, представленной на рис. 40). Устройство фиксации (правильной установки) листа производит выборку листа из массива документов, подачу его на барабан, фиксацию на барабане и включение привода. Особенностями устройства являются: возможность по- дачи и фиксации следующего листа одновременно со считыванием письмен- ной информации с предыдущего; непрерывность действия, что позволяет опе- ратору пополнять входной бункер новыми массивами документов без оста- новки машины; наличие достаточного времени для осуществления правиль- ности фиксации листа; возможность легкого изъятия смятых документов без их повреждения. Устройство считывания (механическая часть) точно устанавливает каж- дую строку перед оптической системой, перемещает знаки в поле ее зрения, помечает строки, содержащие отказы. К особенностям этого устройства отно- сятся: возможность обеспечить непрерывное считывание без потерь времени на ввод и вывод документов; быстродействие; возможность осуществлять по- вторное считывание; незначительная вероятность смятия документов в пози- ции считывания. Устройство транспортирования документов в выходной карман снимает документы с барабана и укладывает их в выходной бункер. Документы рас- полагаются в том же порядке, в каком они находились в исходном массиве. Оператор имеет свободный доступ к выходному бункеру, из которого в слу- чае необходимости можно извлечь прочитанные или помятые документы без остановки машины. Устройства ВхБСД и УС, представленные на рис. 40, служат для транс- портировки (подачи специальных форм документов (авиабилетов, чеков и т. п.). Оптическая система увеличивает и проецирует изображение письменного знака на матрицу фотоэлементов. В системе отсутствуют слож- ные движущиеся детали и элементы электроники. Матрица фотоэлементов воспринимает графическое изображе- ние знака и преобразует его в электрический сигнал. К особенностям матрицы можно отнести: возможность одновременно воспринимать изображение знака целиком; чувствительность к любым оттенкам элементов поля изображения; возможность воспринимать и преобразовывать изображение знака, смещен- ного относительно нормального положения; отсутствие необходимости частой настройки; отсутствие буферной памяти между системами сканирования и опознавания. Вертикальный анализатор определяет высоту опознаваемого знака, пере- давая полученный результат в устройство нормализации, устанавливает от- клонение знака по вертикали и выдает сигнал механизму перемещения о мес- те расположения следующей строки обрабатываемого документа. Использование вертикального анализатора позволяет понизить чувстви- тельность системы сканирования к небольшим отклонениям знаков по высоте, а также к их смещению по вертикали относительно своего нормального поло- жения. 50
Амплитудный коррелятор изменяет выходные сигналы отдельных фото- элементов в зависимости от выходных сигналов соседних с ними светочув- ствительных элементов. Он позволяет увеличить контрастность изображения, способствуя тем самым повышению надежности опознавания. Его действия компенсируют разрывы в контуре знака, образовавшиеся в результате плохой печати, а также позволяют снизить влияние посторонних точек и линий, нахо- дящихся вблизи контура опознаваемого знака. Устройство нормализации производит доводку высоты и ширины знака до размеров, принятых в устройстве опознавания. Это дает возможность опо- знавать знаки различной величины. Коррелятор знаков сравнивает описание изображения реального знака со всеми эталонными описаниями, что производится без использования сложных электронных схем. Генератор решений определяет принадлежность полученного описания к одному из эталонов. В случае несовпадения описаний он выдает в блок вы- вода сигнал отказа. Генератор позволяет опознавать знаки, несколько отли- чающиеся от эталонных изображений, но только цифровая информация обес- печивает большую надежность чтения. Идентифицирующий фильтр в основном предназначен для минимизации количества вариантов идентифицируемых сигналов, направляемых в генера- тор решений. Пульт управления предоставляет возможность оператору следить за ра- ботой всей машины с одного места. Пульт прост в обслуживании, благодаря чему от оператора требуется минимальная подготовка. На пульте отобража- ется состояние всех элементов машины с возникающими в процессе работы нарушениями. Устройством программного управления служит малая цифровая вычисли- тельная машина, на которую возложены следующие основные функции: преоб- разование алфавитно-цифровой информации в двоичный или двоично-десятич- ный коды для последующей записи этой информации на магнитную ленту; хранение информации, подготовленной для записи на магнитную ленту; при- дание информации определенной последовательности перед записью на ленту; накопление информации; осуществление контроля; определение необходимой длины магнитной ленты для записи подготовленных данных; управление сор- тировкой и сравнением документов; управление магнитной лентой и перифе- рийным оборудованием; получение информации от блоков системы опознава- ния и выработка команд управления для блоков системы подачи документов. Основными достоинствами такого устройства управления являются: обес- печение независимой и одновременной работы блоков системы подачи доку- ментов и блоков вывода; возможность увеличения памяти на ферритовых сердечниках до 64 000 знаков; большое быстродействие (время одного такта составляет 8 мсек); устройство может одновременно с основной работой вы- полнять дополнительную совместно с большой ЭЦВМ; кроме своего основ- ного назначения, устройство программного управления может использоваться в качестве обычной ЭЦВМ. Устройство программного управления периферийной аппаратурой ведает соответствующими средствами ввода и вывода информации. Запоминающее устройство усиливает сигналы, поступающие от системы программного управления, и записывает информацию на магнитную ленту в форме, пригодной для использования в сопряженной с читающим автома- том ЭЦВМ. Основные достоинства устройства: возможность осуществления записи, образующейся в процессе автоматического чтения информации с меньшей скоростью и большей надежностью по сравнению с универсаль- ной ЭЦВМ; возможность записи информации с различной плотностью: 79, 219 и 315 бит/см\ В заключение следует подчеркнуть, что рассматриваемая модель матрич- ного читающего автомата способна опознавать письменные знаки пяти и бо- лее различных машинописных и печатных шрифтов. Механизм подачи позво- ляет обрабатывать обычные многострочные документы со скоростью до 30 страниц в минуту, а в случае чтения специальных документов скорость дости- 4* 51
гает 600—1200 документов в минуту. Допустимые размеры обычных листов лежат в пределах от 82x125 до 356X356 мм, а специальных — от 82x82 до 127X222 мм. Различные по размерам документы могут быть перемешаны внутри одного массива. Остальные технико-эксплуатационные характеристики автомата представлены в табл. 5. В большинстве моделей читающих устройств осмотр и восприятие графи- ческих изображений, а также преобразование воспринятой информации в электрические сигналы осуществляется с помощью ЭЛТ и одиночных свето- чувствительных элементов. На примере нескольких отечественных и зарубежных разработок ознако- мимся с устройством, принципом действия и характерными особенностями такого типа читающих автоматов. На рис. 41 представлена блок-схема отечественного устройства РУТА-701 для чтения цифровой машинописной информации с четырьмя служебными УВ JLtt СУ ПУ I ЛБ Л ЛБ \СхЛ- АВБ Выход Рис. 41. Блок-схема читающего устройства РУТА-701 У В — устройство ввода; СУ — считывающее уст- ройство; 1ЛБ — первый логический блок; ПЛБ — второй логический блок; СхС — схема сравнения; ВБ — выходной блок; ПУ — пульт управления символами. Система способна также читать десять нормализованных руко- писных цифр (3, 4, 6]. Документы поступают в устройство ввода (УВ), которое состоит из ме- ханизма протяжки и камеры считывания. С помощью механизма протяжки осуществляется подача документов на транспортер, продвижение их над ка- мерой считывания и укладка в приемные карманы. В камере считывания производятся осмотр и составление описания знаков. Конструкция УВ при- способлена для обработки документов шириной 210 и длиной 148—297 мм. Документы, используемые в аппарате РУТА-701, представляют собой форму, состоящую из двух зон: левой — вспомогательной и правой — рабочей. Считыванию подлежат данные, расположенные в рабочей зоне, максимальная ширина которой составляет 140 мм. Ограничение рабочей зоны вызвано от- сутствием кинескопов с необходимой разрешающей способностью. В случае, если форма бланков заполняется нормализованными рукописными знаками, в рабочей зоне печатаются нормализующие клетки, облегчающие запись. Сетка печатается краской, цвет которой не воспринимается читающим устрой- ством. Каждая клетка представляет прямоугольник размером 5X3,5 мм с двумя точками внутри. Схема механизма протяжки документов и камеры считывания представ- лена на рис. 42. Стопка документов (до 1000 шт.) записями вниз распола- гается на столике самонаклада 8. При отсутствии документов с помощью контакта 5 включается электромагнитная муфта //, приводящая в движение самонаклад. Очередной документ посредством штанги с присосами 6 подается на транспортер 3. Муфта // включается контактом 10. Автоматическим подъемом стола уп- равляет планка 7. После подачи последнего документа на транспортер 3 кон- 52
такт 9 выключает самонаклад. В случае подачи одновременно двух или более документов в контрольном узле 4 появляется сигнал. При подходе очередного документа к камере считывания 12 выключается электромагнитная муфта 2 и останавливается транспортер 3. После осмотра определенного участка включается муфта 2 и документ движется дальше до следующей остановки. Прочитанные листы переворачиваются выводным уз- лом 1 и укладываются в приемный карман 14. Контакт 13 предназначен для сигнализации о переполнении приемного кармана 14. Камера считывания 12 состоит из проекционного кинескопа, объектива и фотоэлектронных умножителей. Транспортер 3 останавливается только при наличии информации для счи- тывания на документах. Это способствует увеличению скорости обработки листов с малым коэффициентом заполнения. Максимальная скорость про- тяжки составляет 16 и 25 документов в минуту для листов формата А4 и А5 соответственно. Реальная скорость равна 6—10 листам формата А4 в минуту и зависит от качества и количества информации. В считывающем устройстве (СУ) располагаются узлы управления меха- низмом протяжки и камерой считывания, а также узлы формирования сигна- лов, необходимых для правильной работы логической части читающего устрой- ства. Считывающее устройство работает в двух режимах: в режиме поисковой развертки, во время которой осуществляется поиск информации на прохо- дящих документах и управление транспортным узлом механизма протяжки документов; и в режиме рабочей развертки,*когда происходит осмотр, вос- приятие информации и выдача описания изображения в логическую часть устройства. Функциональная схема считывающей части устройства РУТА-701 представлена на рис. 43. Участок документа, находящийся перед окном считывания, осматривается с помощью развертки. Отраженный свет попадает на фотоэлектронные умножители. С выхода ФЭУ1 электрические сигналы поступают в видеоблок ВБ, где они дискретизируются во времени и квантуются на два уровня. Образующиеся электрические импульсы от черных участков изображения следуют в другие блоки устройства и логическую часть читающего автомата. Считывающая часть работает по программе блока управления БУ. При отсутствии документа перед окном считывания механизм протяжки автома- тически подает очередной документ на транспортер. Как только документ появится перед окном считывания, транспортер останавливается, из БУ в ло- гическую часть автомата поступает сигнал «документ» и запускается генера- тор поисковой развертки ГПР блока развертки БР. Участок документа ос- матривается с помощью поисковой развертки через усилитель У\ и отклоняю- щую систему ОС. При обнаружении строки знаков БУ выдает команду пе- реключения блока разверток на работу от генератора рабочей развертки ГРР. 4 5 6 7 8 Рис. 42. Механизм протяжки документов 53
Рис. 44 иллюстрирует последовательность осмотра рабочей зоны доку- мента с помощью поисковой и рабочей разверток. Одновременно с ГРР включается фиксатор знака ФЗ, осуществляющий поиск знаков в строке. При обнаружении знака проверяется его положение по вертикали относительно развертывающего растра и производится его центрирование. В случае возникновения ошибок знак подвергается вторич- ному осмотру. После производства установленного количества операций ос- мотра ФЗ выдает сигнал о наличии знака и переходит к поиску следующего знака в строке. В такой последовательности производится осмотр всех знаков строки. В случае невозможности опознавания предъявленного знака в считываю- щую часть поступает сигнал «неопределенность». Производится вторичный Рис. 43. Функциональная схема считывающей части устрой- ства РУТА-701 осмотр и сравнение. Если после нескольких таких попыток знак не опознается, то включается блок ручного кодирования БРК, который сигнализирует опе- ратору об отказе в опознавании. Оператор вручную кодирует неопознанный знак и разрешает устройству продолжать работу. Считав всю информацию с части документа, расположенного перед ок- ном считывания, блок управления отключает блок развертки и выдает ме- ханизму протяжки сигнал для перемещения документа в следующую позицию. При появлении перед окном считывания новых неопознанных знаков меха- низм протяжки носителя информации останавливается и процесс опознавания повторяется. Так учитывается информация со всего документа. Поеяе считы- вания последней строки блок управления гасит сигнал «документ» и считан- ный лист следует в приемный карман. Полученное в результате осмотра описание изображения поступает в пер- вый логический блок 1ЛБ (рис. 41), где осуществляется линейная классифи- кация описаний непосредственно в пространстве признаков элементов рецеп- торного поля. Схема первого логического блока представлена на рис. 45. Сигнал элементов считываемого знака в виде бинарного кода и соответствую- щие ему сигналы с памяти констант, указывающие вероятностные интервалы появления черного цвета в элементах знака, последовательно поступают на дешифраторы знаков /—14. 54
поисковая развертка Рабочая развертка Счетчики знаков /—14 заполняются данными сравнения вышеуказанных сигналов. Первый логический блок опознает знаки одного, заранее установ- ленного начертания (машинописные или типографские знаки). Путем замены эталонных описаний изображений в памяти констант логического блока мож- но перейти к опознаванию знаков другого, отличного от ранее установлен- ного начертания. Работа второго логического бло- ка 2ЛБ (рис. 41) основывается на выделении из изображения знаков системы признаков квазитопологи- ческого характера (признаков зам- кнутости-разомкнутости контура зна- ков и некоторых геометрических при- знаков). Блок приспособлен для опозна- вания машинописных и типограф- ских знаков, а также для считыва- ния и опознавания нормализованных рукописных знаков, имеющих значи- тельные искажения в начертании. Читающее устройство РУТА-701 может работать в двух основных ре- жимах: 1) автономно, когда устрой- ство опознает исходные данные и фиксирует их на других видах носителей (перфокартах, перфоленте или магнитных носителях информации); 2) в каче- стве устройства ввода письменной информации в ЭЦВМ. Рис. 44. Схема, иллюстрирующая по- следовательность осмотра рабочей зоны документа с помощью поиско- вой и рабочей разверток Сигналы элементов - знака Сигналы дополнения г Сигнал „Конец знака" Ш ш щ та! S ш 2 , I Сигналы опознавания знаков Рис. 45. Блок-схема первого логического блока / — память констант; // — дешифратор; /// — счетчики знаков; IV — вы- ходная схема; V — управление дополнением; VI — счетчик 2; VII — счет- чик 1; VIII — дешифратор; IX — схема дополнения Максимальная скорость чтения знаков в пределах строки составляет около 200 знаков в секунду, а средняя скорость считывания данных с доку- ментов при полном их заполнении знаками хорошего качества не превышает 150 знаков в секунду. Вторым примером читающего автомата, в котором сканирование поля изображения производится с помощью ЭЛТ, является устройство, разработан- ное ЛЭМ ВИНИТИ АН СССР [1—4, 15]. 55
Автомат предназначен для опознавания письменных знаков русского и ла- тинского алфавитов. С этой целью используется метод сопоставления неиз- вестного знака с набором информативных областей в поле изображения. В результате сопоставления определяется степень зачерненности этих обла- стей изображением опознаваемого знака, которая затем кодируется и пред- ставляется в бинарной системе. Подобный метод известен под названием ме- тода фрагментов, а информативные области, получаемые в результате пред- варительных исследований знаков, названы фрагментами. Автомат осуществляет полный цикл процесса опознавания с выдачей информации в печатном виде. Его конструкция позволяет контролировать ра- боту всего устройства, а также любого блока. Такая возможность достигается за счет искусственного снижения скорости чтения из-за установки на выходе низкоскоростного печатающего устройства. При испытаниях эксперименталь- ного образца это позволило непрерывно печатать результаты чтения, пользо- ваться контрольным осциллографом для оценки качества считывания знаков, БЭЛТ УПД СС СУМ МФ УФ БЭМР I БЛА вдп БП Рис. 46. Упрощенная блок-схема читающего авто- мата ЛЭМ ВИНИТИ АН СССР БЭЛТ — блок ЭЛТ; УПД — устройство перемещения доку- мента; СС — схема согласования; БЭМР — блок электронно- механической развертки; СУМ — схема управления матри- цей; МФ — матрица фрагментов; УФ — усилители фрагмен- тов; БЛА — блок логического анализа; Деш — дешифратор; БП — блок печати; БДП — блок дешифратора и печати а также применять световую индикацию кода фрагментов в процессе наладки автомата. Все логические блоки устройства собраны на феррит-диодных модулях, разработанных в ЛЭМ ВИНИТИ, и транзисторах, применяемых в усилитель- ных схемах. На рис. 46 представлена упрощённая схема читающего автомата, кото- рый состоит из следующих основных блоков: электронно-механической раз- вертки, логического анализа, дешифратора и печати. Блок электронно-механической развертки предназначен для восприятия изображения письменного знака с документа и преобразования его в опре- деленную последовательность электрических импульсов. В качестве источника освещения в режиме однострочной развертки используется ЭЛТ типа 13 Л037А. Сканирование знака по вертикали осуществляется с помощью луча ЭЛТ. Развертка по горизонтали производится за счет механического пе- ремещения документа на барабане. Блок управления ЭЛТ выполнен на электронных лампах и позволяет по- лучать, кроме однострочной развертки, двухкоординатный растр для работы системы в статическом режиме (при неподвижном документе), а также команды для управления лучом контрольного осциллографа. В блоке логического анализа происходит преобразование воспринятой информации в код, пригодный для дешифрации. Блок дешифратора состоит из аналогового дешифратора, выполненного на ферритовых трансформаторах, и схемы, определяющей выход дешифра- тора, соответствующий минимальному различению кода опознаваемого знака с его эталоном. Для контроля за работой автомата, а также проведения статистических исследований предусмотрен блок печати^ где в качестве печатающего устрой- ства используется телеграфный аппарат СТ-2М. Преобразование кода, полу- 56
ченного на выходе дешифратора, в код аппарата СТ-2М осуществляется схе- мой диодного дешифратора. Импульсы тока для управления телеграфным аппаратом формируются многофазным ждущим мультивибратором на полу- проводниковых триодах. Шифратор и устройство управления аппарата СТ-2М синхронизируются командами, поступающими из программного устройства. Синхронизация и управление всеми узлами и блоками осуществляются с помощью устройства, в котором вырабатываются соответствующие команды. На рис. 47 представлена функциональная схема автомата. Документы укладываются в стопку и помещаются в подающую кассету, откуда последо- вательно друг за другом поступают в устройство развертки. Строка считы- вается за один оборот барабана. Благодаря его поступательному движению последовательно считываются все строки документа. Скорость вращения ба- рабана и частота развертки обеспечивают условия, необходимые для разбие- ния поля с изображением знака на 32x34 элементарных участка. На кассету с документом проецируется луч ЭЛТ, посредством которого производится сканирование расположенного под объективом знака. Отраженный от поверхности документа свет воспринимается фотоэлек- тронным умножителем, преобразуется в электрические сигналы, которые после усиления и формирования поступают в блок логического анализа. Получен- ное в результате развертки описание изображения заносится в ферритовую матрицу центрирования, где производится предварительный анализ положе- ния знака, его коррекция и запоминание. Код считываемого знака записы- вается по сигналу «начало знака» (наличие трех черных точек изображения). Совместная работа устройства развертки и матрицы центрирования обес- печивается блоком программного механизма. Блок управления центрирова- нием позволяет определить положение знака под растром. При выходе изо- бражения знака за границу растра вырабатывается сигнал, запрещающий пе- резапись знака с матрицы центрирования на матрицу фрагментов, который вместе с сигналом поправки поступает на шаговый двигатель, управляющий работой барабана. При этом нормализуется положение строки под растром, и данная строка считывается вновь. После правильной установки знака в поле изображения производится его перезапись с матрицы центрирования на основную матрицу фрагментов. Матрица фрагментов представляет собой кассету, выполненную на феррито- вых сердечниках марки К-272 размером 4X2,5 мм. Матрица работает в ре- жиме коммутатора по схеме совпадения полутоков с постоянным смещением. Управляющие сигналы формируются с помощью феррит-диодных элементов. Напряжение сигнала считывания с одного кольца достигает 500 мв, что поз- волило использовать однокаскадные усилители считывания. В соответствии с картой фрагментов, полученной в результате предвари- тельной обработки знаков, на матрице сделаны прошивки определенных групп колец сердечников. Каждая прошивка повторяет конфигурацию фрагмента и выводится на свой усилитель. Количество колец, образующих отдельные фрагменты, колеблется от 12 до 34. Для каждого фрагмента устанавливается свой уровень срабатывания, т. е. фрагмент будет кодироваться единицей только в том случае, если коли- чество перемагниченных колец превысит установленный для него порог сра- батывания. Это достигается подключением к выходу усилителя считывания фрагмента счетчика, порог срабатывания которого можно изменять как в большую, так и в меньшую сторону. Каждый счетчик заканчивается запоминающим триггером, по которому определяется разряд кода опознаваемого знака в кодовом описании по фраг- ментам. По сигналу «конец знака», вырабатываемому специальной схемой, полученной на триггерах, код поступает в устройство дешифрации. Знаки русского и латинского алфавитов анализируются с помощью раз- личных раздельных матриц, что позволяет избежать ошибок из-за подобия графических характеристик (графем) в изображении некоторых знаков рус- ского и латинского алфавитов. Устройство позволяет переходить от одного алфавита к другому путем переключения соответствующих матриц. Обе мат- рицы фрагментов работают от общих управляющих схем. 57
\w\ww я с о tt <v о s >>* о ч s се Л X 2 ю К л еа 3 2 щ о дО-Х о 2 о 1 S 5 J глй к * S Й*о £ I о о о,.. О Я О ^ . ев =5< * Я S5|&5S о к св л S» >. ев - g cd 2 j Б ь о а I « g О ~ H 2 ао я J* я к a* о. о, cc <-> «u я ев I >ь У S н н ю 2 g о ^ 1=3 .-5/., * I л и 3 я о£ъ са « н 2 * в я .► л ч о 3« Я 1 Й Си "п v 4Sg св 2 ° I --I Ss3 • ^ а-б- 2S I w Б 1 * ... w so о S o>Sgi<a> ^ Я сз ^ Я 5 я я" я 2*° 5 «к 5 is!** Sr^J в Ш i) к Гг!^5 св О о я "5>ь act я я Си 58
В процессе анализа изображения устанавливается степень зачерненности фрагментов и на выходе пороговых схем формируется кодовое описание ана- лизируемого знака. В рассматриваемой модели автомата используется два варианта порого- вых схем: с накопителями сигналов и двоичные счетчики. Совместное исполь- зование обоих вариантов позволит в ходе эксплуатации выявить преимуще- ства и недостатки каждого из них. Опознаваемый знак идентифицируется в устройстве дешифрации путем сравнения полученного кодового описания с набором всех эталонов, в резуль- тате чего на выходе одного из эталонов формируется сигнал опознавания. К отечественным моделям читающих устройств, в которых изображение знака осматривается с помощью «бегущего луча» ЭЛТ, относятся автоматы УСП ПО ИМ НПО ПК ИРР ИРЗ Рис. 48. Читающая машина фирмы «Сильвания» (вид спереди) УСП— устройство считывания с перфоленты; ПО — пульт оператора; ПМ — пишущая машинка для ручного ввода; ИПО — индикаторная па- нель оператора; ПК — пульт контроля с индикаторной панелью; ИРР — индикатор регистра решения; ИРЗ — индикатор регистра знака; БРЗ — блок распознавания знака; БВО—блок видеообработки; УВМ управ- ляющая вычислительная машина; ЗУ — запоминающее устройство на магнитной ленте / — устройство подачи листов и считывания; // — генератор сканирующей частоты и управляющая логика; /// — регистр и схемы принятия реше- ния; IV — регистр знака и блок соленоидов коррелятора типа ЧАРС, «Север-3» и др. Основные особенности и характеристики этих систем подробно описаны [3, 4, 24]. Их технико-эксплуатационные данные приведены в табл. 6. В качестве примера зарубежного аналога читающего автомата, в котором для осмотра поля изображения также используется ЭЛТ, опишем машину Юниверсал Пэйдж Ридер американской фирмы «Сильвания». Она [37] читает печатные и машинописные знаки со скоростью от 1000 до 2200 знаков в се- кунду. Ее быстродействие зависит от качества печати, размеров и плотности размещения знаков. Размеры знаков могут колебаться в пределах от 2,25 до 13,50 мм. Механизм перемещения (подачи) обрабатывает документы максимальных размеров (216X279 мм) со скоростью трех листов в секунду (без учета вре- мени на считывание). Машина может читать смешанные массивы документов различных раз- меров. Допускается бумага разных плотностей и цвета. На рис. 48, 49 представлены вид автомата спереди и схема, иллюстри- рующая принцип его действия. Система подачи (перемещения) устанавливает страницы перед ЭЛТ и после считывания транспортирует их в один из выходных карманов. В отличие 59
от других систем перемещения дно входного бункера здесь выполнено из стекла. Документы укладываются в бункер читаемой стороной вниз. В процессе чтения луч ЭЛТ направляется на страницу снизу, через стекло. Отраженный от поверхности документа световой поток также через стекло Управление отклонением луча Рис. 49. Схема принципа действия механизма переме- щения документов и системы сканирования читающей машины фирмы «Сильвания» / — кожух; 2 — крышка; 3 — входной бункер; 4 — прижимной груз; 5 — считывающие ФЭУ; 6 — видеосигнал; 7 — блок обра- ботки видеосигнала; 8 — зеркало; 9 — объектив; 10 — ФЭУ бло- ка контроля; // — сканирующая ЭЛТ; 12 — выходные бункеры; 13 — бункерный распределитель; 14 — выводной ролик; 15 — вакуумный съемник; 16 — прижимной ролик. Блок обработки видеосигнала осуществляет нормализацию размеров страниц и вводит коррекцию по сигналам блока контроля, позволяю- щую компенсировать изменения в качестве печати и отража- тельных свойствах бумаги поступает на вход ФЭУ. До окончания считывания лист остается во вход- ном бункере. По окончании считывания вакуумный съемник извлекает документ из массива и направляет его в один из выходных бункеров. С выхода ФЭУ электрические сигналы поступают на вход блока обработки видеосигнала, в котором решается вопрос о принадлежности сканируемого участка поля изображения к категориям «черный-белый». Из блока обработки электриче- ские сигналы следуют в блок опознавания. Он содержит 2000 эталонов, ис- 60
пользование которых позволяет опознавать знаки 20—30 различных шрифтов с надежностью не более одной ошибки на 10000 считанных знаков (для ма- шинописной печати среднего качества). С целью систематизации рассмотренного выше материала в табл. 5 и б представлены технико-эксплуатационные характеристики некоторых оптиче- ских читающих устройств зарубежного и отечественного производства. 7. УСТРОЙСТВА СЧИТЫВАНИЯ МАГНИТНЫХ СТИЛЛИЗОВАННЫХ ПИСЬМЕННЫХ ЗНАКОВ Принцип действия устройства для считывания магнитных письменных знаков заключается в следующем. Перед считыванием знаки, напечатанные магнитными красками или чернилами, намагничиваются. Проходя мимо го- ловки считывания, магнитное поле создает в ней напряжение определенной Рис. 50. Принцип считывания знаков шрифта ЦМЦ-7 / — документ; 2 — считывающая головка; 3 — усилитель; 4 — осциллограф; 5 — форма сигнала на экране осциллографа; 6 — форма сигнала в считывающей головке амплитуды и формы. Мгновенное значение выходного напряжения в считы- вающей головке пропорционально скорости изменения магнитного поля знака. Каждый знак имеет* свою собственную, характерную только ему форму сиг- нала. Полученный сигнал сравнивается с эталонными, в результате чего происходит опознавание считанного знака. Рис. 50 иллюстрирует принцип считывания знаков шрифта ЦМЦ-7. На рис. 51 приведена упрощенная блок-схема системы ЦМЦ-7-7500 итальянской фирмы «Оливетти», предназначенной для считывания магнит- ных стилизованных письменных знаков шрифта ЦМЦ-7. Эта система читает и обрабатывает информацию, записанную в коде ЦМЦ-7. Цикл работы складывается из выполнения четырех основных опера- ций (рис. 51): ввода документа, считывания информации, обработки считан- ных данных, их печати и перезаписи на перфоленту. Система работает сле- дующим образом. Документ, следуя через вводное устройство, проходит под двумя последовательно расположенными головками, первая из которых на- магничивает знаки, а вторая производит считывание сигналов, генерируемых этими знаками. Со считывающей головки сигналы поступают в считываю- щее устройство, усиливаются, опознаются, преобразуются в двоичный код и контролируются в соответствии с конфигурацией опознаваемого знака. Отсюда кодированные знаки следуют в устройство обработки данных, за- поминаются в нем и посредством коммутационной панели выводятся на печатающее устройство с перфорационной приставкой. Одновременно осуще- ствляется контроль считанной зоны. 61
Технико-эксплуатационные характеристики оптических Характеристика Фирма и «Контрол Дэйта Корп.» КДК 915 Фаррингтон модель 2030 модель ЗОЮ Обработка документа Формат документа: шири- на и длина (дюйм) 4,0x2,5-^-12,ОХ Х14.0 4,5х5.6ч-8,5х Х13.5 2,0х2,25-^6,0х Х8,5 Скорость 180 строк в минуту (ориентиро- вочно) 150—400 строк в минуту 440 докумен- тов в минуту Механизм транспортировки Ленточный транспортер Транспорти- рующие ролики Приводной Тип подачи документов Вакуум Тре Сортировка 2 кармана 3 кармана Характери- стика документа Максимальное кол-во зна- ков в строке Максимальное кол-во строк на дюйм 110 6 75 6 64 6 Чтение знаков Максимальное быстродей- ствие (зн/сек) 370 400 330 Шрифт ЮСАСИ Зельф Чек 12Ф, 12Л ЮСАСИ, Зельф Чек 12Ф, 12Л, 7Б, ИБМ 1428 Набор знаков Буквы и Опознавание Сканирование Матрица фотоэлементов Механический Метод опознании Матричный Штриховой Эксплуатационные возможности Чтение по машинной программе Управление форматом коммутационной со считыванием выбран 62
Таблица 5 модель Электронике «Дженерал Электрик», модель ДРД 200 модель 3020/3022 модель 3030 модель 3040 ИБМ-1282 ИБМ-1285 Формата 51- или 80-ко- л он ных перфокарт 4,5x5,6-^8,5 X Х13.5 Лента 2,5у5,5-=-3,75Х Х9,0 Стандартные 51- и 80-ко- лонные перфокарты Лента 550 докумен- тов в минуту 150—400 строк в минуту 400 строк в минуту 1200 докумен- тов в минуту 200 докумен- тов в минуту 2200 строк в минуту ремень Транспортирующие ролики Приводной ремень Муфта сцепления Ленточный транспортер ние Ваакуум Катушки Вакуум Трение Вакуум 2 кармана - Многокар- манная 1 карман - 65 75 32 50 32 32 6 6 6 6 10 6 600 400 1000 2400 267 540 ЮСАСИ, Зельф Чек 12Ф, 7Б, ИБМ 1428, 1428Е ЮСАСИ, Зельф Чек 12Ф, 12Л ЮСАСИ, Зельф Чек, 12Ф, 12Л, ИБМ 1428 НКР, НОФ ДЕ КОК-5 ИБМ 1428, Зельф Чек 7Б ИБМ 1428, НКР, НОФ цифры Цифры и несколько знаков кон- троля Цифры диск Бегущий луч Фотоэле- менты Механиче- ский диск Луч ЭЛТ анализ Анализ поля изображения Штриховой анализ Анализ изображения с помощью доски, ных полей Программа чтения задается оператором. Имеются возможности установки формата и его корректи- ровки Управление форматом с помощью коммутаци- онной доски или от ЭВМ Отсутствие возможности управления форматом; ограничен- ные возмож- ности выбора формата Управление форматом с помощью коммутаци- онной доски Управление форматом с помощью машины; ограничен- ные возмож- ности выбора формата 63 читающих автоматов некоторых зарубежных фирм
Характеристика Фирма и «Контрол Дэйта Корп.» КДК 915 Фаррингтон модель 2030 модель ЗОЮ Контроль ошибок Вывод на экран. Исправление вручную с помощью клавиатуры. Возможно повторение сканирования Возможность повторного сканирова- ния. Вьтод на экран Возможность повторного сканиро- вания Вывод и представление считанной инфор- мации В ЭВМ, а также на перфокарты, перфораци- онную и магнитную ленты На перфора- ционную и магнитную ленты В ЭВМ и на перфора- ционную и магнитную ленты Режим работы Совместно с ЭВМ Автономный Автономный или совместно с любой ЭВМ Стоимость (доллары) 84 ООО 99 500 99 500 Сроки поставки 4 мес. | От 6 до 9 мес. От 6 до 9 мес. | Месяц и год выпуска Ноябрь, 1965 | Апрель, 1967 Сентябрь, 1965J Рассмотрим структуру и принцип действия считывающего устройства, логическая схема которого представлена на рис. 52. Со считывающей головки сигналы поступают в усилитель, откуда сле- дуют в схему, состоящую из триггера Шмидта и одновибратора (элемента с одним устойчивым состоянием), в которой происходит их обработка. В результате на выходе одновибратора г—I j 1 г—1 I 1 формируется последовательность из семи Г~7 ]—*\ 2 \-*\ 3 \-А 4 —А 5 сигналов, нормализованных по форме и 1 1 LU l_J L_J L_J длительности, которая представляет и ха- рактеризует расположение штрихов и ин- Рис. 51. Упрощенная блок-схема тервалов в изображении опознаваемого системы ЦМЦ-7-7500 знака, т. е. получается нормализованное / - документ; 2 - устройство ввода; описание изображения 3 — считывающее устройство; 4 — уст- С ВЫХОДа ОДНОВИОратора НОрМЭЛИ- ройство обработки данных; 5 — уст- зованное описание поступает на входы ройство регистрации Трех следуЮщИХ схем: 1) запоминающего устройства, где определяются самые ши- рокие интервалы; 2) дискриминатора, с помощью которого определяется поло- жение широких интервалов внутри каждого знака; 3) счетчика, устанавли- вающего количество штрихов в каждом знаке. С этих систем сигналы следуют в блок статических регистров, где счи- танные знаки опознаются методом сравнения, а также на вход схемы кон- троля, которая проверяет правильность опознавания характерных призна- ков каждого знака. Из блока статических регистров сигналы поступают на вход кодирую- щего устройства, в котором опознанная информация (кода ЦМЦ-7) преоб- разуется в двоичный код, пригодный для использования в устройствах и си- стемах обработки информации. Разработкой и производством устройств считывания магнитных знаков 64
Продолжение табл. 5 модель Электронике «Дженерал Электрик>, модель ДРД 200 ИБМ-1282 ИБМ-1285 модель 3020/3022 модель 3030 модель 3040 Отсутствие возможности повторного сканиро- вания Вывод на экран. Исправление вручную с помощью клавиатуры. Возможно повторное сканирование Вывод на экран возможность повторного сканиро- вания Отсутствие возможности повторного сканиро- вания; индикатор ошибок Возможности повторного сканирова- ния; вывод на экран Возможности повторного сканирова- ния, вывод на экран с возможно- стью ручного ввода знаков На перфо- карты В ЭВМ и на перфокарты, перфора- ционную и магнитную ленты В ЭВМ или на магнит- ную ленту В ЭВМ, на перфокарты, перфораци- онную и магнитную ленты На перфо- карты Автономный Совместно с ЭВМ Автономный или сов- местно с ЭВМ Автономный Совместно с ЭВМ 100 500 143 000 107 000 20 000 72 000 8400 От 6 до 9 мес. От 6 до 9 мес. От 6 до 9 мес. | 6 мес. 12 мес. 6 мес. Декабрь, 1966 Январь, 1967 | Март, 1967 | Январь, 1967 Март, 1965 | Сентябрь, 1966 занимается ряд фирм, в том числе такие фирмы, как «Бюль» (Франция), «Оливетти» (Италия), «ИБМ» (США), «Берроуз» (США), «Дженерал Электрик» (США), «НКР» (США), «Зимаг» (ФРГ) и др. Фирмой «Бюль» (Франция) создано несколько машин для работы со шрифтом 'ЦМЦ-7. Первой среди них можно назвать устройство считывания, предназначенное для ввода данных в ЭЦВМ со скоростью 350—600 доку- ментов в минуту. В это устройство может быть вмонтирована вторая головка для считывания данных со второй, строки обрабатываемого документа. Един- ственное ограничение заключается в том, что знаки не могут быть считаны одновременно с обеих строк. Разработано также устройство для считывания и сортировки документов с 13 выводными карманами: по одному для каж- дой десятичной цифры (от 0 до 9), двух специальных карманов и одного кармана для отходов. Эта машина считывает и сортирует документы со ско- ростью до 1560 шт/мин. Так как документы проходят мимо электромагнит- ной считывающей головки с постоянной скоростью, число документов, обра- батываемых за 1 мин, зависит от их длины. Учет количества документов, сортируемых за один рабочий цикл, производится автоматически. Фирмой выпускается также устройство перезаписи данных с перфокарт на документы. Оно считывает данные с перфокарт и печатает информацию частично в коде ЦМЦ-7 и частично обычным шрифтом. Перфокарты обра- батываются со скоростью 300 шт/мин. Устройство перезаписи включает в себя три блока: считывания (скорость 300 карт в минуту); синхронизации и управления с буферным запоминающим устройством, записи (скорость 300 строк в минуту). Фирмой «Оливетти» (Италия) разработано несколько типов устройств для считывания и сортировки документов с информацией, представленной в коде ЦМЦ-7. Все устройства, предназначенные для считывания знаков шрифта ЦМЦ-7, объединены фирмой в серию ЦМЦ-7-7000. 5 Н. Н. Савета 65
Характеристика Фирма и ИБМ-1287 ИБМ-1418 ИБМ-1428 Обработка документа Формат документа: ши- рина и длина (дюйм) 2,25x3,0-5,91 х Х9,00 или лента 2,75X5,875^ -=-3,67X8,75 3,5X2,254- -=-8,75X4,25 Скорость 3200 строк в минуту 420 докумен- тов в минуту 400 докумен- тов в минуту Механизм транспорти- ровки Ленточный транспортер Вакуумный барабан/лен- точный транспортер Тип подачи документов Вакуум Трение Сортировка Многокарманная Характери- стика документа Максимальное кол-во знаков в строке Максимальное кол-во строк на дюйм 85 6 80 10 80 10 Чтение знаков Максимальное быстро- действие (зн/сек) 2000 500 500 Шрифт ИБМ 1428, 1428Е, Зельф Чек 7Б, 12Ф, 12Л, ЮСАСИ ИБМ 407-1, 407Е-1 ИБМ 1428 Набор знаков Цифры и 5 букв Цифры Буквы и цифры Опознавание Сканирование Бегущий луч Механический Метод опознавания Анализ изображения Эксплуатационные возможности Управление форматом с помощью машины Чтение только по программе ВМ Контроль ошибок Возможности повторного сканирования, вывод на экран с возможностью ручного ввода знаков Возможности повторного сканирования, вывод на экран 66
Таблица 5а модель НКР-420-2 «Оптикал Скэннинг корп.», модель 288 «Филко», модель 6000 «РКА», видеоскан III «Рикогниш Электро- ник Ретина Документ Карир н Эквипмент» Электроник Ретина Рапид Индекх Рэйдж Ридер 3,31 X10-3,25Х Х1200 (лента) 3,5X2,54-8,5x4,5 3x54-8,5x14,0 2,5x4,0 : 4-2,5x8,5 3,25x3,254- 4-4,25x8,50 3,25x3,254- 4-14,0x14,0 3120 строк в минуту 2004-600 доку- ментов в минуту 1804-360 до- кументов в минуту 1800 докумен- тов в минуту 1200 доку- ментов в минуту 24 докумен- та в минуту Бобины Приводной ремень Ленточный транспортер Вакуумный барабан Валики Трение и вакуум Вакуум - 2 кармана Многокарманная 32 4 80 машинописных 25 рукописных 3 машинописных 2 рукописных 90 6 80 6 90 8 150 8 1664 800 1250 1500 2400 2400 НКР (НОФ) ЮСАСИ, Е13Б, 1428, 407Е рукописные знаки Многошриф- товый РКА № 2 Многошрифтовый Цифры Цифры, буквы и знаки +, — Буквы и цифры Цифры Буквы и цифры диск Фотоэлементы «Бегущий луч» Видикон Матрица фотоэлементов Матричный Штриховой анализ Матричный Управление форматом, корректиров- ка и выбор полей с помощью коммута- ционной доски Чтение по программе от коммутацион- ной доски Чтение различных шрифтов с одного или нескольких документов, расширенные возможности управления форматом Ограничен- ные возможности выбора полей считывания Чтение различных шрифтов с одного или нескольких документов; расширенные возмож- ности управления форматом Вывод на экран с воз- можностью ручного вво- да знаков; возможности повторного сканирования Отсутствие возможности повторного сканирования Вывод на экран с возмож- ностью ручного вво- да знаков Возможности повтор- ного сканирования 5* 67
Характеристика Фирма и ИБМ-1287 ИБМ-1418 ИБМ-1428 Вывод и представление считанной ин- фррмации В ЭВМ Режим работы Совместно с системой ИБМ-360 Совместно с ЭВМ ИБМ 1400 или ИБМ 360 Стоимость (доллары) 144 ООО От 120 до 1420 тыс. 150 000 Сроки поставки 24 мес. 6 мес. 6 мес. Месяц и год выпуска Апрель — июнь 1968 Октябрь 1961 Американской фирмой «ИБМ» выпускается ряд устройств для считы- вания магнитных стилизованных письменных знаков. Для машин типа ИБМ 1210, 1412, 1419-1, 1419-31 используется шрифт Е-13Б; Знаки считы- ваются многодорожечной магнитной головкой, чем обеспечивается более высокая надежность по сравнению с однодорожечным считыванием. Указан- ные устройства применяются как для ввода данных в ЭЦВМ, так и для сортировки документов. Устройство ИБМ-1419-32 считывает знаки шрифта ЦМЦ-7 и Е-13Б. Мак- симальная скорость работы в первом случае составляет 57 000, а во втором 96 000 документов в час. Читается 10 цифр и 4 специальных служебных символа. В табл. 7 представлены характеристики устройств некоторых зарубеж- ных фирм для считывания магнитных стилизованных письменных знаков. 8. БЛОКИ, УЗЛЫ И ЭЛЕМЕНТЫ ЧИТАЮЩИХ АВТОМАТОВ Конструкция современного читающего автомата представляет собой сложный комплекс различных электромеханических, оптических и электрон- ных блоков, узлов и элементов. Значительные трудности при создании чи- тающих устройств возникают в процессе реализации высокоскоростных и на- дежных в эксплуатации систем перемещения (подачи) документов и оптиче- ских систем сканирования. Познакомимся с основными особенностями, принципом действия, кон- структивными и другими характеристиками некоторых из них. Система перемещения (подачи) документов. Первым механическим про- цессом, с которым приходится сталкиваться при автоматическом чтении письменных знаков, является подача и транспортировка носителя информа- ции (документа). Используемые для этой цели системы значительно отли- 68
Продолжение табл. 5а модель НКР-402-2 «Оптикал Скэннинг корп.», модель 288 «ФиЛКОЭ, модель 6000 «РКА», видеоскан III «РИКОГНИ! Электро- НИК Ретина Документ Карир нн Эквипмент» Электроник Ретина Рапид Индекх Рэйдж Ридер В ЭВМ, а также на перфокарты, перфораци- онную н магнитную ленты На магнитную ленту В ЭВМ, а также на перфокарты, перфораци- онную и магнитную ленты В ЭВМ На перфокарты, перфорационную и магнитную ленты Совместно с ЭВМ или автономно Автономный Совместно с ЭВМ Автономный 80 ООО 98 088 450 000 126 900 550 000 550 000 30 дней 9 мес. 12 мес. 24 мес. От 6 до 12 мес. От 6 до 12 мес. Февраль 1966 (420—2) Ноябрь 1961 (420-1) Январь — март 1968 Май 1965 Октябрь — декабрь 1966 Декабрь 1964 Ноябрь 1964 чаются от устройств и систем, разработанных для нужд полиграфии и бу- мажной промышленности. При разработке систем подачи конструкторы сталкиваются с некоторыми специфическими трудностями. Так, для того чтобы обеспечить высокую на- дежность в работе, система перемещения (подачи) должна быть хорошо управляемой и максимально гибкой. Часто оказывается, что обрабатываемый документ существует в единственном экземпляре. В результате возникает необходимость оснастить читающий автомат предохранительным устройст- вом, исключающим возможность повреждения документа или частичного стирания записанной на нем информации. Для предотвращения пропусков требуется предусмотреть максимально эффективные методы и средства отделения одних листов от других. Чтобы оптическое расстояние вдоль читаемой строки не менялось, в блоке считывания надо обеспечить постоянство кривизны поверхности документа. Кроме того, необходимо автоматически выравнивать строки в соответствии с ходом развертки и согласовать работу системы подачи документов с ра- ботой системы считывания. Далее, поскольку информация читается последо- вательно знак за знаком, нужно управлять движением документа намного более точно, чем в любых других машинах. Наконец, в связи с необходи- мостью рассортировки обработанных документов на несколько (от двух до двадцати) групп в зависимости от содержащейся в них информации появ- ляются специфические требования к системе механической транспортировки внутри автомата, отсутствующие при конструировании обычных печатных машин. В заключение следует упомянуть еще об одном факторе. На работу си- стемы не должны влиять изменения (в определенном диапазоне) ^размеров отдельных листов из входного массива документов, а также свойства бу- маги, использованной для их составления. 69
Сравнительные характеристики Фирма (страна) Модель Дата установки пер- вого образца Максимальная ско- рость чтения, док/мин Максимальная ско- рость чтения, зн/сек Вероятность ошибки распознавания ВИНИТИ АН СССР (СССР) ВИНИТИ-1 1964 - 15 10-2-Ю-З ВИНИТИ АН СССР (СССР) ВИНИТИ-2* 1971—1972 Ю-г-20 150 2-Ю-4 Конструкторское бюро автоматики (СССР) Север-3 * — 60 100 (300) 10-2-Ю-4 г. Ереван Читающее устройство 1967 17 50 10-2 Специальное кон- структорское бюро вычислительных машин (СКВ ВМ) (СССР) Читающее устройство Р711 * 1972 1000 800 Ю-4-Ю-5 СКВ ВМ** (СССР) РУТА-701 1967 20 180 Ю-4-Ю-6 Каунасский политехнический институт (СССР) ОУД-МС4 Распознаю- щий блок, работающий с устрой- ством Рута-701 1967 150 10-4 Каунасский политехнический институт (СССР) ОУ-М 1965 1000 10-4 Одесский электротехнический институт связи (СССР) ЦЧУ * 1970 240 кон- вертов 250 10-4 Институт Кибер- нетики Академии наук УССР (СССР) ЧАРС * 1969—1970 60 200 10-4-Ю-6 Примечание. * — устройства, находящиеся в стадии разработки; 70
Таблица 6 оптических читающих устройств :тво строк, IX за один про- сумента Ансамбль распознаваемых знаков Способ нанесения знаков (шрифт) Размеры документов, мм льное число в строке Количе< читаемь ход ДО! Максима знаков ] 40-7-60 Цифры, буквы, специальные символы (78 зн.) Машинописный 210X297 - 40-J-80 Цифры, буквы, специальные символы (87 зн.) Машинописные и отпечатанные на ЭЦВМ 210X297 — 60-180 Цифры, буквы, специальные символы (150 зн.) Разные типографические, машинописные, рукописные От 150X180 до 280X350, журналы 45 Цифры, буквы (84 зн.) Разные типогра- фические шрифты, рукописные знаки, латинская гарни- тура (кегль 10 и 9) 220X220 4 Цифры, буквы, специальные символы Машинописные, рукописные От 74x148 до 105X210 30 40 Цифры, 4 специаль- ные символа, гра- фические метки Разные машинописные, нормализованные, рукописные От 210X148 до 210x297 23 40 Цифры и 4 специ- альные символа (машинописные) Один машинопис- ный шрифт От 210x148 до 210X297 23 - Цифры (машинописные) Один машинопис- ный шрифт Лента - 1 Щифры Стилизованные, рукописные 160x115 (конверты) 30 Цифры, буквы, специальные символы (52 зн.) Машинописные знаки (шрифт «Оптима») 210x297 - ориентировочная стоимость 65—90 тыс. руб. (в зависимости от комплектации). 71
Продолжение табл. 6 Фирма (страна) Способ подачи докумен- тов Способ транспор- тировки документов Развертка Метод распознава- ния Вывод ВИНИТИ АН СССР (СССР) Ручной Вакуумный барабан Электронно- механиче- ская По фрагмен- там Перфолента, ЭВМ Урал-4 ВИНИТИ АН СССР (СССР) •Вакуум- ный Транспорт- ные ролики Бегущий луч Структурно- корреля- ционный Перфолента, ЭВМ Минск-22 Конструкторское бюро автома- тики (СССР) Ручной То же То же Анализ признаков знака и матричное сопоставле- ние Перфолента, магнитная лента, ЭВМ М-220 г. Ереван » » » Топологи- ческий 6-разрядный регистр Специальное конструктор- ское бюро вычислительных машин (СКВ ВМ) (СССР) > » Линейка фотодиодов Квазитопо- логический ЭВМ СКВ ВМ** (СССР) » > Бегущий луч Квазитопо- логический, матричное сопоставле- ние ЭВМ «Рута-110», перфолента и перфо- карта Каунасский политехнический институт (СССР) — > — Секционный анализ Каунасский политехнический институт (СССР) Ручной > Матрица фотоэлемен- тов Аналоговый корреля- ционный ЭВхМ Одесский электротехниче- ский институт сьязи (СССР) Вакуум- ный Транспорт- ные ролики и плоскопа- раллельная лента Бегущий луч Квазитопо- логический Управление письмосор- тировальной машиной Институт кибернетики Академии наук УССР (СССР) То же Вакуумный барабан Линейка фотоэлемен- тов Корреляци- онный ЭВМ Минск-32 и М-220, перфолента, печатающее устройство Примечание. ** — ориентировочная стоимость 65—90 тыс. руб. (в зави- симости от комплектации). 72
Считывающая головка Усиление и нормализация сигналов Усилитель Триггер Шмидта Одновибратор Запоминающее устройство Дискриминатор Счетчик штрихов Опознавание знаков Статические регистры ЦМЦ-7 Схема контроля Кодирование Кодирующие устройства К устройству обработки данных Рис. 52. Логическая схема устройства 73
Технико-эксплуатационные характеристики магнитных информации производства Фирма, модель Берроуз БВ 102/103 Дженерал Электрик МРС-200 ИБМ-1259 Формат документа: ши- рина и длина {дюйм) 2,69Х5,94-М, 06х Х9,06 2,5X5,25-=- 4,1X9,0 2,5X4,14-Т-5.5Х Х8,75 Скорость, документов в минуту 1565 1200 600 Обра- ботка до- кумента Механизм транспорти- ровки — Ленточный транспортер Ленточный транспортер и ролики Тип подачи документов Трение Вакуум - Сортировка 13 приемных карманов 12 приемных карманов 11 приемных карманов Характе- ристика документа Максимальное кол-во знаков в строке Максимальное кол-во строк на дюйм 59 1 64 1 66 1 Максимальное быстро- действие, зн/сек 1300 1800 1200 Чтение знаков Шрифт Е-13Б Е-13-Б Е-13Б, ЦМЦ-7 Набор знаков Цифры и Опозна- Сканирование Маг вание Метод опознавания Аналоговый Диск Эксплуатационные возможности С помощью контрольных символов произ- водится разделе- ние зон на документах С помощью Контроль ошибок Проверка коэффициента усиления — Проверка Вывод и представление считанной информации В электрон но- Режим работы Автономный или совместно с ЭВМ типа Б100, Б200, Б300 Автономный или совместно с ЭВМ типа ДЭ-400 Совместно с ЭВМ типа ИБМ 360/20, 360/30 или 360/40 и автономно только для сор- тировки Стоимость (доллары) 91 200 80 000 49 500 (модель 1) 63 000 (модель 2) Сроки поставки 12 мес. 6 мес. | Месяц и год выпуска Март, 1962 Июль,. 1968 74
Таблица 7 ИБМ 1412 ИБМ 1419 НКР 402 НКР 404 НКР 407 2,75X6,0-г-3,7бх Х8.75 2,75Х6,0-3,76Х X 8,75 2,5x5,25-f4,5x хю.о 2,5х5,8-г- 3,85X8,75 2,75x4,0-И,5Х Х8.75 1600 1515 750 600 1200 — Ленточный транспортер — Ролики Ленточный транспортер - Трение - ~ Вакуум 13 приемных карманов 12 приемных карманов 11 приемных карманов 18 приемных карманов 66 1 40 1 56 1 65 1 56 1 2112 2112 1200 1200 2400 Е-13Б, ЦМС-7 Е-13Б Е-13Б Е-13Б Е-13Б четыре контрольных символа ретный Аналоговый контрольных символов производится разделение зон на документах временных интервалов вычислительную машину Совместно с ЭВМ типа ИБМ 360/30, 40, 50 и 65 или автономно только для сортировки Совместно с ЭВМ типа ИБМ 360/30 360/40 или авто- номное Автономный или совместно с ЭВМ типа НКР 315 110 500 11 050 45 000 29 900 95 000 9 мес. | 14 мес. - - 6 мес. Октябрь, 1962 Апрель, 1962 Октябрь, 1966 75 устройств автоматического чтения письменной некоторых фирм США
В зависимости от типа обрабатываемых документов различают две раз^ иовидности систем перемещения: для продвижения бумажной ленты и от- дельных бланков или карт. Первая из них состоит из гнезда, куда помещается рулон бумажной ленты, суммирующих машин, лентоводителя и блока перемещения. В про- цессе чтения бумажная лента проходит мимо считывающей головки. Меха- низм перемещения конструируется так, чтобы при возникновении необхо- димости повторного считывания ленте можно было дать обратный ход. В большинстве моделей современных читающих автоматов скорость дви- жения ленты постоянна. Однако имеются машины, в которых она может изменяться. Например, в автомате Рикогнишн Эквипмент Джорнл Тэйп Ри- дер скорость подачи увеличивается при появлении больших промежутков между напечатанными строками. В устройствах дли обработки бланков или карт механизм транспорти- ровки состоит из двух узлов: подачи и транспортировки документа мимо головки считывания. Во всех конструкциях рассматриваемых устройств отделение, подача, перемещение и укладка документов производятся за счет использования механических сил трения или вакуума. В большинстве моделей документы подаются вакуумным способом при помощи присосок или барабанов. Иногда же устраиваются узлы отделения и подачи фрикционного типа. В этом случае используется ремень, касаю- щийся стопки документов. Он испытывает постоянное давление со стороны пачки листов. Перемещаясь над ней, ремень сталкивает несколько бланков в разделительное устройство, где с помощью роликов верхний документ от- деляется от всех остальных и подается в блок считывания. Существенным недостатком большинства конструкций рассматриваемых узлов является трудность обработки документов из тонкой бумаги, так как возможна случайная подача одновременно двух или более листов. Для устранения этого дефекта фирмой «Рэбинов Электронике» (субсидируется фирмой «КДК») разработано и используется оригинальное устройство отде- ления и подачи листов тонкой бумаги, которое состоит из двух конических роликов. Вращаясь, они захватывают угол верхнего документа и отделяют его от стопы, после чего он поступает в блок считывания. Для транспортировки документов широко используются ролики, барабаны и ленточные транспортеры. На примере механизма перемещения (подачи), разработанного ЛЭМ ВИНИТИ АН СССР [18], рассмотрим устройство и принцип действия по- добного рода систем. Подающий механизм представляет собой вакуумный барабан с самона- кладом. Самонаклад, выполненный в виде наклонного питателя, совершает колебательные движения. Очередной лист отделяется посредством специаль- ного механизма и встряхивания стопы документов. Система состоит из следующих основных узлов: станины, вакуумного барабана, питателя, электромагнита, съемника с приводом редуктора, привода, барабана, кулачка включения питателя, контактных групп и гребенки, ком- пенсационный втулки, механизма выравнивания бумаги и гребенки. Станина / (рис. 53) разборная. В подшипниках на щеках крепится ба- рабан. Вакуумный барабан выполнен в виде трубы, на поверхности которой в шахматном порядке расположены отверстия диаметром 0,8 мм. На обра- зующей барабана имеются три канавки, в которые входят лепестки съемника. Питатель 6 имеет форму короба, днище которого прикреплено к оси. Ось вращается в подшипниках, закрепленных на щеках станины. На днище расположен механизм выравнивания бумаги 13. К оси жестко крепится серьга с тягой электромагнита 8. На внутренней поверхности питателя рас- положен подвижный упор для ограничения положения бланков. К станине крепится стандартный электромагнит 8 типа ЭС-5101 напряжением 220 в. Съемник с приводом 10 представляет собой ось, на которой укреплены три лепестка из фосфористой бронзы. Они входят в пазы вакуумного бара- бана 3. К одному концу оси подходит тяга привода — соленоида. Редук- тор // — червячный с шарикоподшипниками на быстроходном валу. 76
Привод барабана 9 осуществляется шаговым двигателем ШД-4 и бло- ком управления. Скорость вращения барабана при частоте 600 гц составляет 30 об/мин. Кулачок включения питателя 2 расположен на реборде барабана и может перемещаться по пазу, что обеспечивает возможность правильной установки момента срабатывания питателя. Контактная гребенка 4 находится на ре- борде барабана и так же, как и кулачок, может занимать любое положение на окружности барабана. Контактная группа 5 выполнена на базе концевого выключателя типа 6 721 ООО. Компенсационная втулка 7 имеет растяжку, к которой крепится тяга от электромагнита 8. Механизм выравнивания бумаги 13 представляет собой соленоид, сердечник которого оканчивается регулируемой гребенкой 12. При 14 13 12 Рис. 53. Устройство транспортировки документов втянутом сердечнике расстояние от гребенки до подвижного упора устанав- ливается равным ширине бумаги. Стопа бумаги 14, закладываемая в питатель, формируется из документов формата А4, отпечатанных на обычной пишущей машинке. Выравненная стопа документов укладывается в питатель. Включается вакуумный отсос и блок управления шаговым двигателем, который приво- дит в движение барабан. При замыкании кулачка 2 с контактами привода питателя срабатывает электромагнит 8. Питатель, приближаясь к барабану, касается его в местах расположения отверстий для присоса. В месте касания переднего края листа отверстия на барабане расположены более густо, что обеспечивает надежный захват и отрыв одного листа из пачки. Лист прилипает к барабану, проходит мимо читающей головки и по лепесткам съемника сходит с барабана, Пита- тель возвращается в исходное положение пружиной, которая доводит его» до упора. Возвращение сопровождается ударом об упор, что способствует пра- вильной установке очередного листа. После считывания данных с 2/з документа контактная гребенка 4 вклю- чает механизм выравнивания бумаги и гребенки 12 этого механизма не- сколько раз ударяют по стопе бумаги, подбивая ее к неподвижному упору. Присос очередного листа происходит во время схода считанного листа с ба- барабана. Описанный цикл повторяется до тех пор, пока не будет подан и* считан последний лист пачки. Несмотря на то, что количество листов в пачке 77
непрерывно уменьшается и ход приводного магнита остается постоянным, компенсационная втулка 7 обеспечивает постоянное касание питателя к ба- рабану. Устройство позволяет производить повторное считывание нескольких строк документа и осуществлять многократный поворот одного и того же листа. Для поворота листа необходимо включить соленоид съемника 10 и вывести лепестки из пазов барабана. Вакуумный барабан с наклонным питателем обеспечивает возможность с большой точностью устанавливать строки под оптику читающего автомата. Опытная эксплуатация системы показала, что перекос листа при хоро- шей закладке не превышает 1 мм по длинной стороне листа. Скорость по- дачи документов может доходить до 120 листов в минуту. За счет использования переменного центра подвески питателя можно увеличить емкость стопы документов до 300 листов. Система сканирования. Предназначена для осмотра, восприятия и пре- образования графических изображений письменных знаков в электрические сигналы. Для производства указанных операций используются различные ме- тоды и средства. Рассмотрим сущность, характерные особенности, преиму- щества и недостатки некоторых из них. Сканирование с помощью «бегущего луча» ЭЛТ (пас- сивный метод сканирования). Сущность работы этой системы заключается в следующем. На экране ЭЛТ луч прочерчивает либо прямоугольный растр, либо параллельные линии. Изображение растра проецируется на документ, с которого должна быть считана письменная информация. Отраженный от поверхности документа световой поток воспринимается светочувствительными элементами. В результате на выходе светочувствительных элементов образу- ется электрический сигнал, представляющий собой аналогию изменений отра- жательной способности поверхности сканируемого документа. Использование электронного принципа сканирования позволяет упро- стить решение многих проблем, возникающих при совместной работе меха- нических и электронных устройств. Во время осмотра изображения документ может оставаться неподвижным. Это исключает необходимость синхрониза- ции действий каретки и оптической системы, а также значительно упрощает конструкцию устройства подачи бумаги. ЭЛТ позволяет направлять луч в любую точку обрабатываемого документа, а также производить регули- ровку высоты и ширины растра в зависимости от размеров и ориентации опознаваемых знаков. Вместе с тем указанный метод имеет и некоторые недостатки. К ним следует отнести необходимость хорошей светомаскировки поля зрения объ- ектива. Нарушение этого требования (даже любая самая слабая подсветка со стороны) может вызвать появление «шума», искажающего полезный сиг- нал. Поэтому- приходится усложнять конструкцию устройств ввода и вы- вода документов. Кроме того, технико-эксплуатационные характеристики ЭЛТ и фотоэлектронных усилителей зависят от влияния таких факторов, как тем- пература, вибрация, изменения напряжения в цепи питания, старение и т. п. Описанный метод сканирования используется в большинстве моделей читаю- щих автоматов. Показатели его эксплуатации можно считать своеобразным стандартом для сравнения с другими методами сканирования. Следящая развертка (активный метод сканирования). Применя- ется для анализа графических изображений знаков и существенно отличается от прочих способов сканирования. Обнаружив контурную линию знака, луч ЭЛТ «привязывается» к ней и с этого момента траектория его движе- ния зависит только от ее конфигурации. При этом изменения в направлении движения луча, их последовательность и относительные расстояния, прохо- димые лучом, фиксируются электронной схемой, в результате чего на вы- ходе сканирования получается электрическое описание изображения, исполь- зуемое затем в блоке опознавания. Слежение за контурной кривой изображения может осуществляться двумя способами. Сущность первого заключается в том, что в процессе развертки луч движется по краю контурной линии, т. е. по границе черного 78
и белого участков. Во втором случае он совершает колебательные движения, непрерывно пересекая линию в поперечном направлении. Следящая развертка обеспечивает относительную независимость резуль- татов сканирования от размеров и формы знаков. Эта особенность позво- ляет использовать ее для автоматического чтения печатных, машинописных и рукописных знаков. Она обладает большей по сравнению с другими методами надежностью восприятия знаков, изображения которых из-за давности или действия хими- ческих реагентов сильно выцвели и поблекли. Следящую развертку можно использовать не только с указанной выше целью, но также и для опознавания знаков самых различных начер- таний. К недостаткам следящей развертки надо отнести: 1) необходимость об- ходить (прослеживать) каждый знак полностью; 2) вынужденные остановки механизма при разрывах контурной линии; 3) трудность осуществления «обратного хода», т. е. изменения направления движения луча ЭЛТ на 180° и прохождения им той же линии, но уже в обратном направлении, как это, на- пример, требуется при чтении букв А, Е, Н, К, Т, X и некоторых других знаков; 4) существование проблемы оптимизации траектории сканирования с целью минимизации длины «обратных ходов»; 5) сложность технической реализации. Следящая развертка пока не может конкурировать с другими более простыми методами сканирования. В то же время она считается наилучшей для чтения машинописных и, особенно, рукописных знаков. Рассмотренные выше системы сканирования, как правило, имеют по од- ному светочувствительному элементу, на вход которого поступает последова- тельность отраженных от поверхности документа световых сигналов. Из- вестны и широко используются другие, более простые и надежные системы сканирования, основанные на применении нескольких светочувствительных элементов. Сканирование с помощью линейки светочувстви- тельных элементов (СЭ). Мимо такой линейки с постоянной ско- ростью проходит ярко освещенная строка печатного текста. Осмотр, восприя- тие и преобразование графических изображений производятся параллельно- последовательным способом. По мере перемещения документа на линейку СЭ через равные последо- вательные промежутки времени проецируются отдельные «ломтики» поля изображения. В результате на выходе СЭ образуются сигналы, характери- зующие отражательную способность сканируемого участка. Полученные дан- ные заносятся в запоминающее устройство или регистр сдвига и хранятся там до окончания процесса сканирования проходящего знака. После этого полученная информация (электронный образ) поступает в блок опознавания для ее идентификации. Основными преимуществами рассматриваемого метода сканирования являются экономичность, поскольку в линейке используются маленькие крем- ниевые фотодиоды и возможность увеличения чувствительности линейки СЭ до значения, позволяющего различать два оттенка серого цвета, благодаря чему удается получить более детальное и точное описание изображения. Трудности, связанные с решением задач управления, синхронизации и координации работы механической и электронной частей, возможность появ- ления ошибок за счет считывания знака по частям, невысокое быстродейст- вие, являются существенными недостатками метода. Сканирование посредством линейки СЭ нашло широкое применение в устройствах автоматического чтения стилизованных письменных знаков. Сканирование с помощью матрицы светочувстви- тельных элементов. Матрица составляется из светочувствительных элементов, размещенных с высокой плотностью. Сканирование происходит параллельным методом, что позволяет с большой скоростью (практически мгновенно) получать информацию, содержащуюся в анализируемом участке поля изображения. 79
Построчное перемещение документа перед объективом осуществляет осо- бая каретка. В большинстве существующих автоматов матричного типа лист подается на металлической барабан и удерживается на нем присосами. Барабан вра- щается с высокой скоростью и одновременно перемещается вдоль собственной оси. При каждом его обороте перед неподвижным объективом проходит новая строка. Матрица содержит дополнительные фотодатчики, определяю- щие положение очередной строки и выдающие в механизм управления бара- баном сигнал о величине очередного сдвига барабана вдоль оси. Для матричного метода, как и для других, важен относительный кон- траст между знаком и окружающим его белым фоном. Большое влияние на контрастность оказывают блики, возникающие при отражении света от бле- стящей бумаги и красок. Интенсивность этого влияния зависит в основном от чувствительности СЭ и той стадии, на которой производится квантование. Если СЭ достаточно чувствительны, то даже небольшое различие в интен- сивности светового потока обеспечивает необходимый контраст. Особое значение имеет время начала квантования. Когда квантование производится непосредственно после получения «снимка» анализируемого участка, то вследствие недостаточной контрастности выходных сигналов все поле зрения будет воспринято как белое и в блок опознавания не поступит никакой полезной информации. В случае более позднего квантования в блок опознавания поступят усиленные и очищенные аналоговые сигналы, в ре- зультате чего будут созданы более благоприятные условия для надежной работы. Линзы и зеркала для этого устройства подбираются из расчета обеспе- чения максимальной производительности. В некоторых системах зеркало делают подвижным, возлагая на него функции поиска очередной строки и компенсации ее перекоса. Совершенно очевидно, что объем информации определяется числом, свето- чувствительных элементов и расстоянием между ними. Известны экспери- менты [37] с небольшой шестиугольной матрицей из 28 достаточно удаленных друг от друга фотоэлементов и с квадратичной матрицей, насчитывающей 400 элементов (матрица 20x20). В оптической читающей системе фирмы «Рикогнишн Эквипмент», предназначенной для чтения знаков, отпечатанных типографским способом, используется матрица 16x15 элементов. В числе основных достоинств матричной системы сканирования следует назвать: отсутствие сложных и ненадежных механизмов синхронизации; воз- можность использования в процессе опознавания усиленных аналоговых сигналов, содержащих все оттенки цвета анализируемого участка; отсутст- вие информационных потерь, возникающих при квантовании; большое быстродействие при меньшей сложности компонентов системы; возможность чтения разнообразных по форме и размерам письменных знаков с докумен- тов различных форматов. Недостатками метода является высокая стоимость оборудования, обус- ловленная использованием большого числа светочувствительных элементов, и сложность электрических соединений элементов матрицы между собой и другими устройствами. Помимо рассмотренных, имеет довольно широкое применение метод ска- нирования с использованием оптических масок-трафаретов и одиночных светочувствительных элементов. Поскольку сущность его была описана ра- нее, останавливаться на нем нет необходимости. В заключение следует упомянуть о некоторых дополнительных функциях, которые выполняются системами сканирования в процессе опознавания. К их числу относятся операции, связанные с формированием и выдачей определенных команд .управления и сигнализации, а также с по- иском местоположения письменного знака на поле изображения. В зависимости от сложившейся в процессе автоматического чтения си- туации система сканирования принимает на себя управление теми или иными блоками, узлами и устройствами. Примером может служить операция по- вторного считывания. При нормальной работе после окончания считывания 80
одной строки перед объектом устанавливается следующая. Однако если при первом сканировании появился неопознанный знак, то оптическая система, прежде чем выдать сигнал отказа и вызвать новую строку, должна прервать нормальный ход операции чтения и выдать команду «пропустить данную строку перед объективом» второй и даже третий раз. Кроме того, до начала чтения и опознавания анализируемого знака си- стема сканирования должна его найти и установить в определенное поло- жение перед объективом. Реализация этой задачи включает в себя выполне- ние следующих основных операций: нахождение начальной точки первой строки документа, определение размеров и положения каждого знака, обна- ружение межзнаковых интервалов, определение конца строки, отыскание места расположения следующей строки и конца страницы. Рассмотрим содержание каждой из этих операций. Под начальной точкой понимается крайний левый знак первой (верхней) строки документа. Для его отыскания система сканирования должна прежде всего определить момент появления первой строки, а затем, управляя меха- низмами перемещения страницы или объектива, обнаружить нужный знак и выдать соответствующий сигнал. В некоторых моделях на оптическую систему возлагаются функции опре- деления размеров каждого знака (ширины и высоты), его перекоса, а также смещения вверх и вниз относительно средней линии строки. Получаемая информация используется для нормировки анализируемого знака, после чего производится его считывание. В большинстве читающих автоматов для обнаружения конца одного и начала другого знака используется небольшой пробел между знаками. Из-за дефектов печати или растекания краски рядом расположенные знаки часто сливаются, что приводит к «отказам». В последних современных моделях читающих автоматов, влияние растекания краски уменьшается за счет пони- жения чувствительности оптической системы к искажениям изображения. При чтении текста, напечатанного в одну колонку, конец строки опреде- ляется по тому факту, что в поле зрения объектива знаки больше не по- являются. Однако часто встречаются документы с двумя или несколькими колонками. При работе с документами, колонки в которых расположены близко друг от друга, возможен переход со строки одной колонки на рядом расположенную строку другой. В результате на выходе появится информа- ция, лишенная смысла. Чтобы этого не случилось, читающий автомат должен с абсолютной надежностью различать конец строки. В современных автоматах система сканирования совместно с механиз- мом перемещения должна уметь находить положение следующей строки, быстро и точно устанавливать ее первый знак перед объективом. Задача эта решается следующим образом. Зона чувствительности поискового устрой- ства расширяется настолько, чтобы, кроме считываемой строки, захватыва- лась еще и следующая. При этом производится оценка расстояния между строками, и результаты ее в виде определенной команды о величине необ- ходимого сдвига подаются в устройство. После считывания всей строки перед объективом в нормальном положении устанавливается следующая строка. Для определения конца страницы можно использовать принцип отыска- ния следующей строки. Однако в большинстве моделей конец страницы опре- деляется с помощью специальной программы. Она состоит из данных о коли- честве строк*, которые необходимо считать с одной страницы, прежде чем убрать ее из поля зрения объектива и заменить новой. Такой способ эффек- тивен при обработке самых различных документов. Рассмотренные выше особенности систем сканирования и перемещения (подачи) характерны для больших универсальных читающих автоматов. В малых и специализированных устройствах некоторые из них могут отсут- ствовать. Например, в системах для обработки специально подготовленных отпечатанных форм отпадает необходимость контроля изменяющегося меж- строчного интервала. Такой контроль не нужен и при однострочных доку- ментах, где положение строки строго фиксировано. 6 Н. Н. Савета 81
9. СОСТОЯНИЕ И НАПРАВЛЕНИЯ РАЗВИТИЯ СРЕДСТВ АВТОМАТИЧЕСКОГО ЧТЕНИЯ ПИСЬМЕННЫХ ЗНАКОВ Начало разработок читающих устройств за рубежом относится к сере- дине, а в Советском Союзе — к концу пятидесятых годов. Пути развития средств автоматического чтения в нашей стране и за рубежом несколько отличаются друг от друга. Трудности, возникшие на первых этапах создания техники автоматиче- ского чтения, явились одной из главных причин образования двух основных направлений в их конструировании. Первое характеризуется разработкой средств автоматического чтения обычных знаков (типографских, машинопис- ных и рукописных), а второе — знаков специального начертания (кодиро- ванных, нормализованных и стилизованных). Несомненные достоинства и перспективность обоих направлений привели к значительной интенсификации их развития. На сегодняшний день иссле- дованиями и производством читающих устройств занимаются почти все ведущие зарубежные фирмы, выпускающие ЭВМ. Наиболее динамично ра- боты ведутся такими из них, как. «ИБМ» «Дженерал Электрик», «КДК», «Фаррйнгтон Электронике Инк.,» «НКР», «Сильвания», «Оптикал Скэннинг Корп», «Филко», «Рикогнишн Эквипмент», «СЭЛ», «Токио Шибаира Электрик» и другими менее известными фирмами. Успехи первого направления побудили ряд зарубежных фирм начать с 1961 г. серийное производство нескольких моделей оптических и магнитных читающих устройств [3, 4]. По данным зарубежных источников [4, 37], к концу 1966 г. в мире эксплуа- тировалось около 500 читающих устройств, из которых более 300 было уста- новлено в США. Большинство мЪделей серийного производства (см. табл. 5) обрабаты- вают документы с цифровой и алфавитно-цифровой информацией, записан- ной в основном стилизованными знаками. Так, из шести моделей оптиче- ских устройств, серийно выпускаемых американской фирмой «ИБМ» (модели 1282, 1285, 1287, 1418, 1428, 1975), только одна последняя способна читать цифры и буквы обычного начертания. Все остальные модели читают знаки специального начертания. Аналогичного типа устройства выпускаются другими зарубежными фирмами. В то же время наряду с перечисленными и представленными в табл. 5 устройствами ограниченного чтения рядом зарубежных фирм начинают про- изводиться универсальные читающие автоматы, способные с большой ско- ростью и высокой надежностью опознавать стандартные машинописные, типо- графские, а также любые специальные (стилизованные) шрифты. К таким устройствам относятся американские автоматы: Электроник Карэктор Ридер фирмы «Рикогнишн Эквипмент», Юниверсал Пэйдж Ридер фирмы «Сильвания», Скан Дэйта 300 фирмы «Скан — Дэйта Корп», «ИБМ» модель 1975 и др. Если первые конструкции оптических читающих устройств (ОЧУ) были малопроизводительными и ненадежными в работе, то в настоящее время се- рийно выпускаются устройства, способные обрабатывать до 1000 докумен- тов в минуту со скоростью чтения 2400 знаков в секунду и надежностью опознавания не более одной ошибки на 100 000 знаков [3, 4]. Часть устройств может работать в соответствии с программой, зада- ваемой управляющей или вычислительной машинами, а также варьировать методы считывания в зависимости от формата и содержания вводимых до- кументов. Некоторые устройства опознают рукописные знаки, запись кото- рых произведена в соответствии с определенными требованиями. Ожидается, что в ближайшем пятилетии количество находящихся в эксплуатации оптиче- ских читающих машин резко возрастет. Создание современного ОЧУ требует решения как теоретических, так и организационных задач. Такие важные характеристики ОЧУ, как быстро- действие, надежность, универсальность, простота конструкции, стоимость 82
и др., зависят не только от используемых методов опознавания и техники их реализации, но и от таких, казалось бы, второстепенных факторов, как ка- чество бумаги, краски, печати, начертаний гарнитур типографских шрифтов, формат документов и т. п. Поэтому для более успешного развития техники оптических читающих устройств зарубежные фирмы проводят в государственном масштабе ряд организационно-производственных мероприятий. Например, в США разработаны и внедрены в практику следующие но- вые стандарты: 1) минимальные технические требования, которым должны удовлетворять все конструкции оптических читающих устройств; 2) техни- ческая спецификация на бумагу и краски, а также требования к качеству печати; 3) номенклатура шрифтов и типографских гарнитур; 4) алгоритмы опознавания письменной информации. Разработкой подобных стандартов в США занимаются многочисленные инициативные группы, в состав которых входят представители фирм, зани- мающихся производством и эксплуатацией оборудования для ОЧУ, а также информационной деятельностью. Для упорядочения положения со стандар- тами принято решение о разработке и введении официальных государствен- ных стандартов, которые в максимальной степени должны учитывать тре- бования фирм и объединений. Подготовительную работу выполняет научный центр по вычислительной технике США [35]. Он имеет представителей в комитете ОЧУ Ассоциации бумагоделатель- ной промышленности (для разработки требований к бумаге) в подкомитете Ф8 Американского общества по испытанию материалов (для разработки требований к копировальной бумаге, лентам для пишущих машин) и в не- скольких комитетах Американского института стандартов (для разработки требований к качеству печати, начертаниям шрифтов, а также специальным знакам и символам, клавиатуре пишущих машин и т. д.). В процессе своей деятельности сотрудники центра консультируются с правительственными и частными организациями, которые эксплуатируют или предполагают использовать ОЧУ, а также с фирмами, занимающимися разработкой и производством ОЧУ. Создана рабочая группа из представи- телей различных правительственных учреждений, заинтересованных в стан- дартизации ОЧУ. Контроль за разрабатываемыми и утвержденными стандартами и под- держание их на современном уровне возложен на Национальное бюро стан- дартов США. Рассматривается вопрос о создании при Научном центре спе- циальной службы, которая ведала бы оптическими читающими устройствами. В Советском Союзе пионерами в области разработки техники автома- тического чтения следует считать ВИНИТИ АН СССР, ИК АН УССР, СКВ ВМ (г. Вильнюс) и некоторые другие. В настоящее время наиболее успешные исследования ведутся в СКВ ВМ объединения «Сигма» (г. Вильнюс), в КБ автоматики (г. Москва), в ВИНИТИ АН СССР, ИК АН УССР и в ряде других более мелких организаций. В связи с тем, что в нашей стране стилизованные письменные знаки не получили распространения, развитие отечественных средств автоматического чтения идет по пути создания устройств для восприятия знаков обычного начертания, контуры которых совершенно не отвечают требованиям машин- ного чтения, Несмотря на трудности, связанные с решением такой задачи, в настоя- щее время отечественной промышленностью уже начато серийное производ- ство читающего автомата РУТА-701. Помимо этого, проходит опытно-лабо- раторную эксплуатацию ряд образцов читающих устройств, к числу которых относятся модель ЧАРС со сдвиговым регистром (разработка ИК АН. УССР), устройства ВИНИТИ АН СССР, универсальный автомат «Север-3», машина «Бланк-2» (разработка Минского КБ завода им. Г. К. Орджони- кидзе) и некоторые другие. При этом следует подчеркнуть, что читающие устройства «Бланк-2», РУТА-701 и «Север-3» по своим основным технико- 6* 83
эксплуатационным показателям не уступают лучшим зарубежным образцам данного типа (см. табл. 6). Анализ зарубежных источников позволяет определить основные тенден- ции развития средств автоматического чтения письменной информации, основ- ными из которых являются: 1. Большинства зарубежных фирм занимаются исследованиями и разра- ботками высокоскоростных и надежных читающих устройств, предназначен- ных для автоматического ввода исходных данных в ЭЦВМ с малострочных и многострочных документов. 2. Ряд ведущих фирм США (ИБМ, НКР, Фаррйнгтон и др.) занима- ются разработкой и производством устройств для чтения письменной инфор- мации с бумажных лент кассовых аппаратов, суммирующих машин и машин для выписывания счетов. Такие устройства начинают широко использоваться в розничной торговой сети и других коммерческих предприятиях. 3. Ряд фирм США (Филко и др.) занимаются разработкой и. производ- ством устройств, предназначенных для обработки почтовой корреспонден- ции. Выпускаемые устройства считывают знаки, отпечатанные на конвертах машинным способом. Опознаванию подлежат заглавные буквы наименова- ний штатов и больших городов США. В настоящее время восемь таких устройств эксплуатируются в почтамтах Лос-Анджелеса, Хьюстона, Дет- ройта, Бостона, Филадельфии, Сан-Франциско, Нью-Йорка и Чикаго. В бли- жайшее время будет изготовлено и установлено еще 14 комплектов устройств подобного типа. 4. Большое внимание уделяется исследованиям и разработкам читаю- щих устройств, способных опознавать не только типографские и машино- писные шрифты, но и письменные знаки, написанные от руки. Над этой проблемой успешно работают следующие американские фирмы: ИБМ, Рикогнишн Эквипмент, Скан Дэйта, Фаррйнгтон, Филко и др. 5. В результате снижения цен на малые ЦВМ становится возможным, вместо электронных логических схем, применяемых в ранних моделях читаю- щих устройств, использовать для целей опознавания эти машины, запрограм- мированные соответствующим образом. При таком подходе читающее устрой- ство может состоять из простого устройства сканирования с механизмом перемещения документов и связанной с ними малой ЦВМ. Первую часть устройства, называемую в некоторых источниках «сканером», можно рас- сматривать как периферийное оборудование, производящее все операции по опознаванию совместно с ЦВМ. Подобного типа системы, состоящие из сканера и малой универсальной ЦВМ, начали выпускать американские фирмы Скан Дэйта и Рикогнишн Эквипмент. Аналогичными разработками занимаются также фирмы ИБМ, Филко и др. Оборудование этих фирм способно опознавать большое коли- чество различных типографских и машинописных шрифтов. Так, например, читающее устройство ИБМ-1975 может читать машинописный текст, знаки, отпечатанные с помощью „машинки для выписки счетов, а также письменные знаки с анкет, заполняемых вручную. Оборудование фирмы Филко, уста- новленное на базе ВВС США в г. Риме, может опознавать 27 различных шрифтов. 6. Ряд фирм и исследователей считают, что наилучшие перспективы раз- вития оптических читающих устройств связаны с применением непосредст- венной оптической обработки изображений йа базе использования лазеров и голографии. Непосредственная обработка изображений позволит восста- навливать изображения с определенными дефектами, в результате чего ста- нет возможным получить лучшее соотношение сигнал/шум, а также упростить и облегчить процесс опознавания. Совместное использование оптической и электронной систем позволит создавать комбинированные системы, отличаю- щиеся высокой производительностью и относительно небольшой стоимостью. Подобными исследованиями и разработками в настоящее время занимаются фирмы Юнивак, Мергентален, Линотайп, Скан Оптике и Информацион Интернациональ. Некоторые из них планируют окончание разработок новых типов читающих устройств в 1970 г. 84
ЛИТЕРАТУРА 1. Аврух М. Л. Устройство для распознавания знаков методом фрагментов. Сб. «Читающие устройства», ВИНИТИ, 1962. 2. А в р у х М. Л. и др. Автомат для чтения машинописных текстов. Сб. «Автоматическое чтение текста». ВИНИТИ, 1967. 3. Автоматизация ввода письменных знаков в электронные вычисли- тельные машины. Сб. докладов научно-технического совещания в г. Виль- нюсе, 17—20 ноября 1965 г. Вильнюс, Республиканский институт НТИ и про- паганды, 1965. 4. Автоматизация ввода письменных знаков в электронные вычисли- тельные машины. Доклады II Всесоюзной научно-технической конференции, т. I, II. Вильнюс, Республиканский институт НТИ и пропаганды, 1969. 5. Аркадьев А. Г., Браверман Э. М. Обучение машины рас- познаванию образов. «Наука», 1964. 6. Б а г д он а с А., Ж л а б и с Р. и др. Читающее устройство РУТА-701. Сб. «Автоматизация ввода письменных знаков в электронные вычислительные машины», Вильнюс, 1965. 7. Барабаш Ю. Л. и др. Вопросы статистической теории распозна- вания. «Советское радио», 1967. 8. Б а р а ш к о А. С. и др. Корреляционный читающий автомат со сдвиговым регистром ЧАРС. Сб. «Читающие автоматы», «Наукова думка», 1965. 9. Бонгард М. М. Проблема узнавания. «Наука», 1967. 10. Гимельфарб Г. Л. О выборе усредненных эталонных изобра- жений. Сб. «Читающие автоматы», «Наукова думка», 1965. 11. Г и м е л ь ф а р б Г. Л. Некоторые работы зарубежных авторов в области распознавания стандартного шрифта. Сб. «Читающие автоматы», «Наукова думка», 1965. 12. Елисеев В. К. Читающий автомат, построенный на принципе оптической корреляции. Сб. «Читающие автоматы», «Наукова думка», 1965. 13. Каты с Г. П. Информационные сканирующие системы. «Машино- строение», 1965.. 14. Ковалевский В. А. О корреляционном методе распознавания. Сб. «Читающие автоматы и распознавание образов», «Наукова думка», 1965. 15. Магидсон Л. М., Сидорин Ю. М. Читающий автомат для распознавания знаков по методу фрагментов. Сб. «Читающие устройства», ВИНИТИ, 1965. 16. Надточий А. Е., Наш л юн ас Р. А. О перспективах внедре- ния и развития читающих устройств широкого применения. Труды III Все- союзной конференции по информационно-поисковым системам и автоматизи- рованной обработке научно-технической информации, т. III, Автоматические читающие устройства. ВИНИТИ, 1967. 17. Оптическая обработка информации. Сб. статей. Перевод с англ. Селиванова Ю. П. «Мир», 1966. 18. Писарский Ю. Устройство ввода документов в читающие ав- томаты. Автоматизация ввода письменных знаков в электронные вычислитель- ные машины. Сб. докладов научно-технического совещания в г. Вильнюсе, 17—20 ноября 1965 г., Вильнюс, Республиканский институт НТИ и пропа- ганды, 1965. 19. Рахманов М., Рудаков А. Технические носители информации и автоматизация процесса их обработки. Автоматизация ввода письменных знаков в электронные вычислительные машины. Сб. докладов научно-техни- 85
ческого совещания в г. Вильнюсе, 17—20 ноября 1965 г., Вильнюс, Республи- канский институт НТИ и пропаганды, 1965. 20. Рахманов М., Рудаков А. Технические носители информа- ции и автоматизация процесса их обработки. Сб. «Механизация учета, от- четности и вычислительных работ», вып. II. М., ЦСУ СССР, 1966. 21. Розенблат Ф. Принципы нейродинамики. «Мир», 1965. 22. С е б е с т и а н Г. С. Процессы принятия решений при распознава- нии образов. Киев. «Техника», 1965. 23. X а р к е в и ч А. А. О принципах построения читающих машин. «Ра- диотехника», т. 15, № 2. 1960. 24. Читающие автоматы. Киев, «Наукова думка», 1965. 25. Э й г е н б р о т В. М. Применение электроннолучевых трубок для многоточечного контроля. М., «Энергия», 1965. 26. Dei be г t С. R., Turner F. Т. Optical character reader. «West. Union Techn. Rew.», 1965, v. 19, N 4. 27. D i e t r i с h W. Ein optischer Zeichenleser fur schnelle automatische Belegverarbeitung. «Elektron. Rechenanlag.», 1964, v. 6, N 2. 28. «Elektronics.» 1962, 2/11, 5—11. 29. Feideiman Lawrece A., Katz Jacob L. Scanning the opti- cal scanners. «Data process. Mag.», 1967, v. 9, N 10. 30. Fiber optics State-of-the-art report. «Comput. Design». 1967, v. 6, N 7, 44—57. 31. Golovin Nicolas E. Reading printed data electronicalli «Auto- mation», 1961, v. 8, N 12. 32. Mahony Joseph B. Optical system reads printed data. «Automa- tion», 1963, v. 10, N 9. 33. Mierzowski K. Lesemaschinen fur die optischen Normalschrift A. «Elektron. Recheuanlag.», 1967, v. 9, N 2. 34. Optical Character Recognition. Spartan Books, Washington, 1962. 35. Standarts for optical character recognition. A review of the NBS pro- gram. «Nat. Bur. Standards Techn. News. Bulb, 1967, v. 51, N 8, 158—176. 36. T s u i F. Zeitsparende Abtastverfolgung in der Zeichenerkennungstech- nik, «Freguenz», 1966, v. 20, N 9. 37. W i 1 s о n R. A. Optical Page Reading. Devices. New Jork Reinhold, 1966.
ОГЛАВЛЕНИЕ Предисловие : . 1. Процесс автоматического чтения письменной информации 2. Принцип действия читающего автомата Предъявление и осмотр изображения письменного знака .... Описание изображения Сравнение полученного описания с эталоном 3. Структура читающего автомата 4. Систематизация методов и средств автоматического чтения письмен- ных знаков Методы опознавания письменных знаков Систематизация средств автоматического чтения письменных знаков 5. Специальные шрифты 6. Оптические читающие автоматы Устройства для считывания данных, представленных на типизиро- ванных бланках в виде графических отметок . Устройства дщя считывания кодированных, нормализованных и сти- лизованных письменных знаков Устройства опознавания печатных и машинописных знаков . . . 7. Устройства считывания магнитных стилизованных письменных знаков 8. Блоки, узлы и элементы читающих автоматов 9. Состояние и направления развития средств автоматического чтения письменных знаков Литература
Савета Николай Николаевич ЧИТАЮЩИЕ АВТОМАТЫ Редакторы К. А. Ермаков, М. Г. Литвинова Художественный редактор Г. А. Гудков Технический редактор В. И. Семенова Корректор М. Э. Орешенкова Сдано в производство 2/VI 1970 г. Подписано к печати 24/IX 1970 г. М-15586. Печ. л. 5,5. Уч.-изд. л. 6,87. Бум. л. 2,75. Бумага типографская № 1, формат 60Х90Ук$. Тираж 12 000 экз. Цена 36 коп. Заказ 1278. Ленинградское отделение издательства «Энергия», Марсово поле, 1. Ленинградская типография № 4 Главполиграф- прома Комитета по печати при Совете Министров СССР, Социалистическая, 14.