Текст
                    РОБОТОТЕХНИКА
И ГИБКИЕ
АВТОМАТИЗИРОВАННЫЕ
ПРОИЗВОДСТВА
Управление
робототехническими
системами и гибкими
В Д автоматизированными
производствами

Робототехника и гибкие автоматизированные производства 1 2 ©3 4 5 6 7 8 9 Системные принципы создания гибких автоматизированных производств Приводы робототехнических систем Управление робототехническими системами и гибкими автоматизированными производствами Вычислительная техника в робототехнических системах к гибких автоматизированных производствах Моделирование робототехничесиих систем и гибких автоматизированных производств Техническая имитация интеллекта Гибкие автоматизированные производства в отраслях промышленности Основы построения систем автоматизированного проектирования гибких производств Лабораторный практикум по робототехнике
Робототехника и гибкие автоматизированные производства В 9-ти книгах Под редакцией лауреата Государственной премии СССР члена-корреспондента АН СССР И М Макарова
Управление робототехническими системами и гибкими автоматизированными производствами Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов технических вузов Москва Высшая школа 1986
ББК 32.816 Р58 УДК 621.38(62—52) И. М. Макаров, В. 3. Рахманкулов. В. М. Назаретов, А. Блинов, А. М. Михайлов, С. В. Маиько, А. А. Ахрем Рецензенты: кафедра «Робототехнические системы» Московского высшего тех- нического училища им. Н. Э. Баумана (зав. кафедрой чл -кор. АН СССР Е П. Попов); акад. АН СССР С. В. Емельянов (Меж- дународный научно-исследовательский институт проблем управ- ления) Робототехника н гибкие автоматизированные про- Р58 изводства. В 9-ти кн. Кн. 3. Управление робототех- ническими системами и гибкими автоматизирован- ными производствами: Учеб, пособие для втузов/ И. М. Макаров, В. 3. Рахманкулов, В. М. Назаре- тов и др.; Под ред. И. М. Макарова. — М.: Высш, шк., 1986. — 159 с.: ил. В пособии рассмотрены методы анализа кинематических и динами- ческих характеристик манипуляционных и локомоцпоииых роботов, методы анализа и синтеза систем управления контурного, позиниои- i- .о типа, а также адаптивных систем; методы и алгоритмы управле- ния робототехническими комплексами (РТК), гибкими производствен- ными модулями, линиями и участками (П1С); алгоритмы оперативного планирования и группоного упраалеиия РТК и Г ПС 2404000000— 291 ---------------150—86 001(01)—86 ББК 32.816 6Ф0.1 С Издзтипсгво «Высшая школа», 1986
ВВЕДЕНИЕ Научно-технический прогресс в автоматике, радиоэлект- ронике и прежде всего в вычислительной технике позволил рассматривать комплексную автоматизацию производства на качественно новом уровне, когда авто- матизация распространяется на все производство — от проектирования нового продукта до его изготовления. Автоматизация производства неизменно связана с созданием различных систем управления, которые выпол- няют функции контроля и регулирования производствен- ных процессов, заменяя человека Поэтому полную авто- матизацию, относящуюся к оборудованию и процессам, называют машинным способом, а совместно реализуемую человеком и автоматом (либо ЭВМ) — человеко-машин- ным способом. Различают несколько уровней автоматизации произ- водства: — локальная автоматизация, т. е. автома- тизация технологических операции и отдельных единиц оборудования; — автоматизация совокупности техно- логических процессов, когда автоматизируются связанные между собой технологические операции (про- цессы) или несколько единиц оборудования. Это автома- тические линии станков с числовым программным управ- лением (ЧПУ), обрабатывающие центры, транспортно- загрузочные роботы и робокары; — автоматизация иижеиерно-технологи- ческои деятельности, когда автоматизируются проектирование, конструирование новых изделий и тех- нологическая подготовка производства. Важными сред- ствами такой автоматизации стали системы автоматизи- рованного проектирования (САПР); — автоматизация управления производ- ством, т. е. создание автоматизированных систем пла- нирования и управления производством на базе вычис- лительной техники. Такие системы позволяют автомати- зировать процессы планирования загрузки технологиче- ского оборудования, регулировать наилучшим образом
запасы материалов, поддерживать ритмичный ход произ- водства. На первых двух уровнях главным образом применя- ются автоматические системы управления, хотя возможно применение и человеко-машинных систем. На двух по- следних уровнях автоматизация осуществляется только человеко-машинными системами. Это объясняется тем, что с переходом к более высоким уровням автоматизации приходится все большее внимание уделять автоматиза- ции интеллектуальной, а не физической деятельности человека. Системы управления, применяемые в робототехнике и гибком производстве, можно разделить на три больших класса: локатьные системы управления, системы группо- вого управления, информационно-управляющие системы. Локальные системы управления роботами. Они харак- терны как для промышленных, так и непромышленных роботов (например, роботов для экстремальных сред) н автоматизированного технологического оборудования. В настоящее время наукой и промышленностью созда- ны разнообразные автоматические устройства для регу- лирования, контроля, управления процессами и оборудо- ванием. Это и узко специализированные по назначению автоматические регуляторы и широко универсальные си- стемы, как правило, использующие современные методы цифрового управления. Основные достижения в области локальных средств автоматизации получили наиболее яркое воплощение в быстро прогрессирующем направлении робототехнике. Функциональная гибкость локальных систем управтеиня роботами определяет их широкую универсальность и комплексность применения в различных сферах автома- тизации. Начало развитию промыт тенной робототехники было положено в 60-х годах. Первыми промышленными робо- тами за рубежом были «Версатран» и «Юнимеит-1900» (США), в СССР — УМ-1, «Универсал 50», УПК-1. Техническая база развития промышленных роботов заложена еще в девятой (1971 — 1975) и десятой (1976— 1980) пятилетках. Тогда было создано более ста моделей роботов, а около 7 тыс. внедрено в производство. Одиннадцатая пятилетка (1981 —1985) отразила но- вый этап развития робототехники, когда не .только про- изошел резкий подъем производства роботов, но и быт и созданы условия для роботизации ботьшннства отраслей
народного хозяйства. За годы пятилетки произведено свыше 40 тыс. промышленных роботов. Увеличение числа роботов сопровождается расшире- нием их функциональных возможностей главным образом за счет применения более совершенных систем и методов управления. Системы группового управления. Они обеспечивают автоматическую работу комплексов технологического оборудования, координированное функционирование боль- шого числа локальных систем управления. Необходи- мость в групповом управлении вызвана потребностями комплексной автоматизации многофункциональных уча- стков технологического оборудования или сложных мно- госвязных технологических циклов промышленного про- изводства. Принципы группового управления первоначально по- лучили развитие при создании универсальных автома- тических линий станков с числовым программным управ- лением (ЧПУ). Так, в конце 60-х годов английской фирмой «Molins Machine Tool» была разработана «Система-24» — автоматическая линия из семи специа- лизированных станков с программным управлением. Автоматическое управление этой группой станков осу- ществлялось от ЭВМ, а детали в процессе обработки перемещались от станка к станку с помощью приспо- соблении-спутников. Более комплексно вопросы группового программного управления решались в отечественных системах АУ-1 и АП-1 разработки ЭНИМС и завода «Станкоконструк- ция» и в таких системах, как OMN1CONTROL фирмы «Sandstrand» (США). В них обеспечивались непрерывный автоматический анализ технологического процесса, контроль оборудова- ния, автоматическая смена инструмента, оптимизация нагрузки оборудования. С появлением промышленных роботов проблемы груп- пового управления приобрели еще большее значение. Возникла необходимость обеспечения совместной работы оборудования с роботами или роботов с роботами. Наи- большая потребность в таком управлении выявилась при автоматизации сборочных процессов. Создание систем группового управления сборочными роботами является быстро развивающейся областью про- мышленной автоматизации. Ряд систем группового про- граммного управления технологическим оборудованием
сборки печатных плат, изделий микроэлектроники, из- мерительных приборов создай в СССР. За рубежом од- ной из первых применила принципы группового управле- ния фирма «Olivetti» (Италия) при автоматизации про- цесса сборки электрических пишущих машин с помощью группы роботов. Информационно-управляющие системы. Они исполь- зуются при управлении как технологическими объекта- ми, так и коллективами людей, осуществляющими трудо- вой процесс. При автоматизации производства большое значение придается организационному управлению, свя- занному преимущественно с решением задач экономи- ческого характера: разработкой планов и производствен- ных программ на заданные сроки, управлением мате- риальными потоками, запасами, учетом и статистическим анализом состояния производства. Для автоматизации обработки информации при решении указанных задач широко используется современная вычислительная и ор- ганизационная техника, создаются автоматизированные системы управления производством (АСУП). Первые АСУП были созданы еще в 60-е годы. В настоящее вре- мя в стране действуют свыше 3000 различных произ- водственных автоматизированных систем управления. В написании учебного пособия принимали участие: И. М. Макаров — введение, гл. 1—3; В. 3. Рахманкулов — введение, гл. 1,3; С. В. Маиько гл. 1, 3; А. А. Ахрем — гл. 2; А. М. Михайлов — гл. 3; С. А. Блинов — гл. В. М. Назаретов — гл. 5.
ГЛАВА РОБОТ КАК ОБЪЕКТ УПРАВЛЕНИЯ В теории регулирования под управлением понимается автоматическое осуществление совокупности воздейст- вий, направленных на поддержание или улучшение функционирования управляемого объекта в соответствии с целью управления. Робот как объект управления представляет собой сложную электромеханическую систему, состоящую из Рис 1.1 Функциональная схема исполнительной системы управления роботом: ’»'• q,n — входные сигналы. вырабатываемые системой управления: *......см — сигналы рассогласования, получаемые на выходе сравнивающих '•'ейств; о,. , Ом — управляющие сигналы; МЯ|. . . М,ч —силы и мо- мвмвы, развиваемые «вигателямн и поступающие на звенья манипулятора; 71.........те,.» »м.ен>* относительного положения звеньев манипу- лятор*. ................ . ^..44.,»у 1,а««тиым устройством заданных точек
многозвенной механической конструкции (рабочего меха- низма), исполнительного устройства и этектроиной си- стемы управления (рис. 1.1). Рабочий механизм непо- средственно воздействует на объект или среду. Исполни- тельное устройство включает совокупность приводов с соответствующими датчиками обратной связи, усили- тельными, преобразующими и корректирующими эле- ментами [3]. Задача управления роботом заключается в формиро- вании управляющих воздействий для исполнительных двигателей, отработка которых гарантировала бы про- хождение захватным устройством манипулятора задан- ной пространственной траектории с заданной точно- стью. Задача формирования управляющих воздействий сво- дится к построению программной траектории q^t), т. е. закона изменения вектора относительного положения звеньев манипулятора ц = [ф, q2..q,.....</у]т, и после- дующему синтезу собственно закона управления, обеспе- чивающего устойчивость движения относительно про- граммной траектории. 1.1. Классификация систем управления роботами Многообразие систем управления роботами можно группировать по разным признакам, например: по соста- ву и типу входящих устройств, показателям качества управления, виду траектории движения и т. п. Однако имеются достаточно общие признаки, которые принци- пиатьно характеризуют процесс управления роботом. Прежде всего это способ управления, опреде- тяемый в зависимости от степени участия оператора в управлении роботом. По этому признаку системы управ- ления делятся на два больших класса (рис. 1.2): - человеко-машинные, к которым относятся системы дистанционного и интерактивного управления, имею- щие оператора непосредственно в контуре управления; — автоматические, когда оператор остается вне кои- тура управления и взаимодействует с роботом только на этапе обучения. Другим столь же важным признаком является метод управлеиня, который можно применить для дальнейшей классификации выделенных классов о
Рис 1.2. Классификация систем управления роботами Человеко-машинные системы дистанционного и инте- рактивного управления роботами в соответствии с мето- дами управления делятся на шесть основных групп: — системы командного управления, в которых опера- тор включает по отдельности приводы каждого звена робота дистанционно путем нажатия на соответствую- щие кнопки (тумблеры) пульта управления; — системы копирующего управления, в которых опе- ратор дистанционно управляет роботом с помощью за- тлющего устройства, кинематически подобного исполни- ,с 1ьному устройству робота (движение каждого звена злдакивгго устройств/) передается на соответствующее
звено исполнительного устройства по принципу следящей системы); — системы полуавтоматического управления, в кото- рых оператор, нажимая иа многостепенную управляю- щую рукоятку, задает желаемое движение захватного устройства, а специализированный вычислитель (ЭВМ) по электрическим сигналам от датчиков рукоятки вычис- ляет и формирует соответствующие сигналы управления для приводов всех степеней подвижности; — автоматизированные интерактивные системы уп- равления, в которых только часть операций выполня- ется автоматически, а остальные предоставлены опера- тору; интерактивные системы супервизорного управле- ния, в которых оператор, наблюдающий по экрану (дисп- лею) обстановку в месте действия робота, подает от- дельные команды-целеуказания, по сигналам от них включаются те или иные программы автоматического действия робота; — интерактивные системы диалогового управления, отличающиеся от интерактивных систем супервизорного управления тем, что робот не только выполняет команды оператора, но и активно помогает ему в распознавании обстановки и принятии решений. Главная особенность систем автоматического управ- ления роботами отсутствие непосредственного участия человека в процессе управления. Функция оператора состоит лишь в обучении, запуске и последующем перио- дическом наблюдении за работой робота. Системы автоматического управления в соответствии с используемыми методами управления делятся на си- стемы: — программного управления, основой которых явля- ется синтез движения робота по заранее рассчитанной преимущественно жесткой программе. Программа сохра- няется в памяти вычислительного устройства и может быть изменена путем перепрограммирования в новом цикле обучения робота. В системах программного управ- ления не предусматривается отработка информации, устраняющая неопределенность характеристик внешней среды, хотя информация о внутреннем фазовом состоя- нии робота используется в законе управления В свою очередь, системы программного управления делятся иа цикловые, позиционные и контурные; — адаптивного управления, движение робота в кото- 12
пых организуется по гибко изменяемым или корректи- руемым программам. При этом перестройка программ происходит в ответ на изменения условий внешней среды. Для получения внешней информации адаптивные системы управления обеспечиваются разнообразными средствами очувствления; — интеллектного управления, в которых программа движения робота вообще не задается, а синтезируется системой управления на основе описания внешней среды, совокупности правил возможного поведения в среде н имеющейся целевой установки задачи. Основное отличие интеллектных систем управления от предыдущих — способность извлекать из данных не только информацию, а еще и знания. Для этой цели системы очувствления дополняются системами пони- мания (представления знаний). Несмотря на ряд имеющихся способов классифика- ции, именно методы управления положены в основу об- щепринятой классификации роботов по трем поколениям: первое — роботы с программным управлением; второе — роботы с адаптивным управлением; третье — роботы с элементами искусственного интеллекта. При этом поко- ления роботов различаются не по этапам развития техно- логии, как, например, поколения вычислительной техники (когда одно поколение вытесняет полностью другое), а по уровню гибкости управления. Наиболее «жестким» управлением обладают роботы первого поколения с программным управлением, а наи- более гибким — роботы третьего поколения с интеллект- ным управлением. Большая часть эксплуатируемых ро- ботов принадлежит к первому поколению программно- управляемых автоматов. Главное преимущество роботов с программным управлением состоит в том, что они име- ют широкое применение при достаточно простом кон- структивном исполнении. Наибольшая эффективность их проявляется в условиях монотонно-циклических опера- ций при сравнительно редких переналадках на новый вид работ. Объем подобных операций будет значитель- ным и в будущих производствах, поэтому с развити- ем последующих поколений промышленных роботов по- требность в простых программных роботах не умень- шится. Они будут успешно совершенствоваться н дальше. Вместе с тем применение роботов первого поколения всегда связано с необходимостью строгого упорядочения в
и специального приспосабливания технологической среды для работы робота. Эти дополнительные требования усложняют техноло- гический процесс и удорожают разработку, создание и эксплуатацию роботизированного производства. Развивая систему программного управления, удается преодолеть ограниченность роботов первого поколения, повысить гибкость управления и в значительной мере исключить необходимость приспосабливания технологиче- ской среды к роботу. Последующие поколения роботов имеют более широкие возможности благодаря разнооб- разным средствам очувствления, адаптации н техниче- ской имитации отдельных интеллектуальных функций, присущих чеювеку. 1.2. Система координат. Выбор и преобразования Сочлененные соседние звенья манипулятора образуют кинематическую пару, если возможно их относительное перемещение [2|. Класс кинематической пары опреде- ляется числом условий связи налагаемых на относительное движение звеньев, образующих пару. Кинематической паре k-ro класса соответствует Л=(6—k) независимых параметров, определяющих относительное положение звеньев, где h - число степеней свободы кинематической пары. Число степеней свободы манипуля- тора определяется числом независимых движений, в ко- торых могут участвовать его звенья: /7=6Л/-2*р*. (1.1) *=i где Н — число степеней свободы рабочего механизма (или число его степеней подвижности); N — число под- вижных звеньев; р* число кинематических пар Л-го класса. Для осуществления произвольного перемещения и ориентации захватного устройства в рабочем простран- стве манипулятора должно выполняться условие /7=6, так как число степеней подвижности рабочего механиз- ма И фактически определяет число степеней свободы захватного устройства. При /7>6 рабочий механизм называется механизмом с избыточностью. Для рассмотрения пространственного движения рабо- чего механизма, представленного последовательным со- 14
динением вращательных и поступательных кинематиче- ких пар 5-го класса (как наиболее часто применяемых робототехнике), необходимо осуществить выбор систем оордннат. Каждому звену манипулятора поставим в оответствие декартову систему координат O,x,i/,z, (/=0, , ...Л/). Если робот установлен на неподвижном осно- ании, то связанная с ним система координат 0(>jc<>i/oZo овпадает с абсолютной системой Oxyz Расстановка сп- тем координат проводится по следующему правилу: сь г, привязывается к оси сочленения звеньев i и /4-1, сь х, направляется вдоль общего перпендикуляра к осям очленений z,_t и г„ ось у, должна обеспечивать одина- овую направленность всех систем координат (например, равую). Система координат ObXvy\Zv ставится в соот- етствие захватному устройству манипулятора таким об- азом, чтобы ось совпадала с направлением послед- его звена. На рнс. 1.3 показана кинематическая схема |ромышленного робота «Универсал-15», для которой вы- даны связанные системы координат. Преобразование системы координат O,-tx,-\y, \z,—t систему координат О,хь,г может быть осуществлено оследовательным выполнением действий:
— поворотом вокруг осн Z/_| на угол 0 до установ- ления параллельности осей х,_| и х,; — переносом вдоль оси z,_i на величину s, до совме- щения на одной прямой осей х,_| и х,; — переносом вдоль оси х/ на величину в/ до совмеще- ния начал систем координат О,_| и О,; — поворотом вокруг оси х, на угол а до совмещения всех осей. Таким образом, преобразование (/—1)-й системы координат в 1-ю определяется четырьмя параметрами: О,, $„ а„ а,. В зависимости от типа сочленения один пара- метр из пары (0„ $,) является переменным. Введем для него обозначение ф: ф=аД+(1-а,>, (1.2) гле о = I 1 ДЛЯ вРашательной пары; д ' I 0 для поступательной пары. Оставшиеся три параметра постоянны и определяются конструкцией манипулятора. Положение манипулятора в пространстве однозначно определяется совокупностью q = [<7.. q„ , на- зываемой вектором обобщенных координат Если задан радиус-вектор г— [*', у', z']r некоторой точки в системе координат О'х'у’г’, то ее положение в системе Охуг определяется выражением y—hlX’+hiy'+htZ'+h', > (1-3) Z = t3lX,+t32y,+t33Z, + l3, J где /и, hi, /зь /»2. hi, hi. 6з, Ьз, hj — направляющие косинусы осей системы О'х'у'г' относительно системы Охуг, li, h. h — координаты точки О' в системе Охуг. Уравнения преобразования координат (1.3) в матрич- ной форме примут вид r = tr+1. (1.4) где г=[х, у, zf; Г<н tn 6з] г' = [х', у', г']т; t= I tzi hi Ьз I 1— [/i, h, /зГ; L/з! hi <зз J Если векторы гиг представить в однородных коорди- натах то уравнение (1 4) можно заменить уравнением R = TR . (1.5) 16
Однородными координатами некоторой точки про- странства с координатами (х, у, z) являются любые четы- ре числа (xi, Xi, гз. х4), одновременно не равные нулю, такие, что V— Х| Хз v 1 х—• , у— , z , I /, у?, Х4 Х4 Х4 И 1 О) [Х|, х2, Хз, X4]s[Ixt, kx2, кх3, kx4], Vk=#=O J Основные операции над векторами, заданными в однородных координатах, выполняются в соответствии со следующими правилами: 1. А±В С, с,=-2-±4-, / = 1.2.3: с4=1: <14 О» 2 д # в Oibi+Ojbi-bOjbj. 3. АХВ =С, Ci =а2/>з— озЬ2. с =азЬ| —О|Ьз, / =aife2— a2l>i, i ,=atbt; 4 кА £<j|, а2, аз, —J . 5. |А—(£l±£W_l. |а I Пусть R' —[х(, Xi, хз, xi]T — радиус-вектор некоторой точки, заданный в однородных координатах в системе О’х’у’х’, a R = [xi, х2, хз, х^! — радиус-вектор той же точки в системе Охуг. Считая x4=xj и подставляя одно- родные координаты в систему (1.3), согласно выраже- ниям (1.6) получим следующие преобразования: х = 11 ix 14- 6 2х2-Ь 11 зХз+11*4; X =/2|Х|4-^22Х2-Ь^23Хз-Ь/2Х4; .. „ X --/31X1 + 62X24-/33X34-/3X4, Х4 = Х4. В векторном виде преобразование (1.7) примет вид (1.5), где х4 = 1, [-ЯП (18)
Переход от i-й системы координат к (i —1)-й выпол- няемый по приведенным цей перехода: 1равилам, определяется матрн- 0 01 Г 1 0 0 0 ' 0 0 0 10 0 10 0 0 1 s, Х О 1J [о 0 О 1 О 0 0‘ > и, —sin и 0 a, cos cti 0 0 0 1 . sin 0,sm а, а,cos 0, ’ —cos 0,sin а a,sin 0, cos u $ ' ' 0 1 . перехода справедливо выра- ’cos0 sin 0,cos а, sin О «.os 0,cos а, О sin а . О О Для описания такого жение R l-T(</)R, (1.10) где R - радиус-вектор некоторой точки, заданный в системе координат i-ro звена. Последовательно применяя преобразования (1.10), можно осуществить переход от системы координат лю- бого звена к системе координат, связанной с основанием: R, Г0Т|1 TR. l^iCJV, (1.11) где Т матрица перехода к инерциальнои системе координат; в случае неподвижного основания То Е. Выражение (1.11) можно записать в виде Rfl TR (1.12) где Г, ТД Т (1 13) — матрица преобразования i-ro звена, описывающая его положение в системе координат OoxayoZo; определяет 12-мерный вектор-столбец X, называемый вектором по- ложения i-ro звена: X (ГиГ ,Г ,Г||Г ,Г Г, Г _Г,_ Г|4Г зГ.,). (1.14) 18
1.3. Основные кинематические соотношения. Прямая и обратная задачи кинематики —a, sin q' a,cos q, 0 0 (1.15) К числу основных кинематических соотношений, опре- деляющих характер движения звеньев манипулятора (без учета вызывающих это движение причин — сил и моментов), относятся выражения для линейных и угло- вых скоростей и ускорений. Пусть матрица перехода ?,(</,) соответствует враща- тельной кинематической паре, т. е. 9,=0,=var. С учетом зависимости (1.9) можно получить выражение для ее производной по времени: '—sin qt -cos q,cos a, cos q,s dT cosq, — sin 9,cos u, sin q,s ~dF~ 0 0 0 .0 0 0 in и т(=ет4„ где ’ 0 10 0 1 0 0 0 0 0 0 0 .0 0 0 0 Выражение (1.15) означает, что с цирования матрицы Т(9,) соответствует ее умножению иа матрицу 6. В случае поступательной кинематической пары, когда ?/=s,=var, матрица (116) 0 0 0 О' й_ 0 0 0 0 0 0 0 1 .0 0 0 0. При этом L =-^-=Т,Т Т;_,АТ Г„ 1</</, 1=1,2, ..,N; q> (117) L, =-^L=-^L_^rT T AT T ,AtT*...T » —1,2. , Л. (1 IB)
С учетом выражения (1.12) можно получить зависи- мости — линейной скорости v, и ускорения w, некоторой точки, неподвижной в i-й системе координат и опреде- ляемой радиусом-вектором R- v-f(U'R)-; (1.19) w,= 2 (U/R,)9 + 2 (U;*R )^»; (1.20) /-I /.*-• — угловой скорости и ускорения е, i-й системы координат (связанной со звеном): <0,= 2 (гД)^; (1.21) е.= Х(Г ё )£,+ £ (1.22) где для вращательной и поступательной кинематических пар соответственно ё, [0, 0, 1, 0]т; в, —[О, О, О, 1]т. Уравнение (1.13) позволяет получить решение так называемых прямой и обратной задач кинематики ро- бота. Прямая задача кинематики состоит в определении по заданным обобщенным координатам ма- нипулятора положения его некоторого звена. Необходи- мость решения прямой задачи возникает в связи с невоз- можностью определения положения захватного устрой- ства путем непосредственного измерения, в то время как текущие значения обобщенных координат манипулятора измеряются достаточно просто с помощью соответствую- щих датчиков. При подстановке вектора обобщенных координат q [91, 92, . 9<» выражение (1.13) примет вид CvW= Г|(9|)Тг(92). Т,<9). Ь(9м), (123) где матрица Гм определяет положение и ориентацию за- хватного устройства робота в системе координат, связан- ной с основанием. Четвертый столбец представляет собой вектор координат О начала отсчета системы OnXi^nZn, третий, второй и первый столбцы определяют соответст- венно направление осей zn, ун, х» и представляют собой 20
вектор подхода А, вектор ориентации В и вектор ВХА (рис. 1-4). При этом матрица Гм может быть записана в виде (ВХД)х В. Дх О/ (ВХА) Ву (ВХА)г Вг А» Аг О О, Ог 1 . (1.24) О О Обратная задача кинематики представ- ляет собой задачу отыскания обобщенных координат манипулятора по заданным значениям положения и ори- ентации его звеньев и сводится к решению уравнения (1.13) относительно вектора обобщенных координат q=[?i. 4i....?>]’. Нахождение последователь- ности таких векторов по заданным значениям положения и ориентации захватного устройства манипулятора вдоль некоторой пространственной траектории составляет пред- варительный этап процедуры построения соответствую- щей программной траектории qf (I) методом, основанным иа решении обратной задачи кинематики [4|. Известны точный и приближенный методы решения обратной заДачи. Получение точного решения в виде ана- литических зависимостей обобщенных координат от кон- структивных параметров и заданного вектора положе- ния манипулятора возможно не для всех кинематических схем роботов и является сложной задачей, так как связано с решением эквивалентной матричному уравне- нию (1.13) системы нелинейных уравнений связи вектора положения с вектором обобщенных координат вида с i неизвестными (1^ динат, имеют следую- Рцс 1.4. Система координат захват щие значения: ного устройства
ni =аз=а5=90о; а<=—90°; O2=ae=0; s •=Ss=0; 04=0; а 1=04=05=05=0, (О i=l, 3,5, 6; * " U <=2,4 Согласно выражению (1.9) с учетом значений пара- метров относительного положения систем координат со- ответствующие матрицы перехода примут вид: cos^i О sin 91 О' sin^i 0 —cos^i О 1 0 1 0 s, ' .0 0 0 1 COS0. — SinO2 О O2COS02 _ sin02 cosO. О ajsinOj “О 0 1 q> .0 0 0 1. cos qt 0 sin 93 а £059.3' sm^i 0 — COS 9.) о 0 t 0 0 .0 0 0 1 . ’1 000' 0 0 10 О -1 0 94 ’ .0 0 0 1. cos^j 0 sin 9s O' = sin 95 0 —cos 9s 0 0 1 0 0 : .0 0 0 1. cos96 —sin 9 0 O' - _ sin 95 cos 9, 0 0 e~ 0 0 I s6 .0 0 0 1. Тогда матрица преобразования Гб, как результат пе- ремножения матриц перехода, запишется следующим об- разом: 22
23
Обозначая элементы известной матрицы Гвм через Г, где i, /=1,2,3,4. и приравнивая соответствующие элементы матриц T6(q) и Гв,* получим уравнения отно- сительно обобщенных координат, совместное решение которых позволяет найти зависимости для их определе- ния. Так, система уравнений cos <7i[sin<7sCOs(02+<73)+cos<7ssin(e2 + q3)] = TIS; sin q । [sin q5cos (02+</3)+cos q5sin (02+ <73)] = Г23 путем простейших преобразований сводится к уравнению Tusinqi — r23cosqi=0, из которого находится зависимость для определения q\\ sin(qi—ф)=0, где со8ф=Г|з/^Г|з + г£з, sinq>= Г23//Г?3+Г^3 . Выражение для определения q2 может быть получено из системы уравнений: cosqi{s6[sin?sCos(O2+q3)+cos?ssin(02+?3)] + + 04sin(02+g3)+a3cos(02+q3)+e2cos 02} + q2sin q । = Ги: sinqi{s6[sinq8cos(O2+g3)+cos9sSin(02+q3)] + + 94sin(02+q3)+a3cos(02+q3)+o2cos02} — q^osqi = Г24. Для этого необходимо выполнить их сложение, пред- варительно умножив первое уравнение на sinq\, а второе уравнение на —cosqi: 92= Г14sin q\ — r24cos«i. Система уравнений sin 9i{s6 [sin <7scos(02+ </3)+cos </5sin(02+ <?3)] + +94sin(02+q3)+a3cos(02+93)+a2cos02}—q2cos?i=r24; se[sin qssin(02+g3)—cos g5cos(02+q3)] — — <74COS(02-H3)+a3sin(02+q3)+a2sin02+si=r34 позволяет отыскать зависимость для определения q3. Рассматриваемая пара уравнений может быть приве- дена к виду: Ser23+sin<7i[<74Sin(O2-H3)+a3cos(02-|-q3)]+ -|-a2sin q icos 02—q2cos q ।=r24; $вГн—q4cos(02-j-q j)-f-a3Sin(02 4-93)-|-a2sin02-|-$|=Г34 24
g4Sin(02+g3)+eiCOS(02+g3)=e; —д4СО5(02+дз)+аз51п(02+дз)=С, g _ Гц 4- ^2COS — O2Sin ^ICOS 0? — s,r23 . Sin fl i * C= Г34—Si—a2sin02—$вГ3з. Сложим уравнения, умножив первое уравнение на cos(02+?3). а второе — на sin(02+93): о3 = Bcos(02 + fl3) + С sin(02 + q3). откуда получим sin(Y4-024-93)=—т===. /С2+В2 rosv=7FFF' siny=- Считая 9з известным, найдем выражение для опреде- ления 94: _ В —c3cos(02+fl3) Ч* sm(02+fl3) Выражение для определения q6 может быть получено из системы уравнений: —cos q 1 sin q6 |cos 95cos(02-f- 93)—sin 9ssin (02+9з)]+ + sin9icos9e=ri2; —sin 91 sin 9e {cos 95cos(02-|- 93)—sin 9ssin (02-|- 93)]— — cos9icos9e=r22, если первое умножить на sin9i, а второе — на (—cos 9,) и результаты сложить: cos 9в=Г| 2sin 91 — Гггсов 91. Для отыскания 95 воспользуемся следующим уравне- нием: sin 9Ssin (02-Ь 93) — cos 95cos(02+93) = Г3э. Преобразование этого уравнения по теореме о коси- нусе суммы двух углов позволяет получить искомое выражение для определения 95: —cos(9s+02+93)= Гз» 25
Рис 1.5. Граф выбора допустимых решений обратной задачи кинематики Выведенные соотношения для определения обобщен- ных координат не позволяют получить однозначного ре шения. Поэтому выбор допустимых решений обратной задачи кинематики должен проводиться в соответствии с графом, представленным иа рис. 1.5. Одним из возможных приемов при точном решении обратной кинематической задачи является использова- ние соотношения Т,Т Т =Г Т ' Т 'i. i=1.2. N; /=1.2. . i-1, (1.26) которое в ряде случаев позволяет получить уравнения с числом неизвестных q*(*=l> 2, ... /), не превышаю- щим /. Это становится возможным в том случае, если среди элементов матрицы, стоящей в правой части ра- венства (1.26), за исключением элементов ее последней строки, удается найти элементы (или их линейные комби- нации), не зависящие от искомых величин. Приближенные методы в отличие от точных позво- ляют получить решение обратной задачи кинематики для любой кинематической схемы и сводятся к численному решению уравнений связи (1.25). Обратная задача кинематики может быть сведена к задаче минимизации функционала рассогласования / (q) векторов заданного Х1Д и текущего X(q) положений: 26
/2(Ч)= х — X(q)|2 (1.27) Как правило, задача минимизации функционала рас- согласования / (q) решается градиентными методами с конечным шагом, использование которых в данном слу- чае наиболее целесообразно. Очевидно, что применение аналитических методов для отыскания минимума функ- ционала /(q) вследствие многомерности аргумента функ- ционала q и громоздкости функционала I\q) затруднено. Метод возможных направлений позволяет решить задачу минимизации функционала /’(q) путем построения в об- ласти допустимых значений Q аргумента функционала q минимизирующей последовательности a q......... а\ ... q'M, такой, что /2(q°)>/2(q')>...>/\q*)>...>/\q^ В общем случае область допустимых значении Q ар- гумента функционала q определяется следующими огра инчеииями на значения обобщенных координат: конструктивными ограничениями по каждой из степеней подвижности манипулятора: qimmCq«Cq<m.M, /=1,2.... N', (1-28) ограничениями, обусловленными способом переме- щения захватного устройства манипулятора. Например, при поступательном (без вращения) перемещении за- хватного устройства должны учитываться ограничения в виде равенства, связывающие три произвольные на- правляющие косинуса матрицы Г : [rv(q),2]’ [1\„Ч12]т=0, (=1,2,3,4, (1.29) где [I\(q),2]T, [Гл ч г]1 текущее и начальное значения векторов, соответствующих второму столбцу матрицы Гл. Таким образом, соотношение (1.29) определяет мно- жество допустимых значений вектора обобщенных коор- динат при поступательном способе перемещения захват- ного устройства манипулятора; ограничениями, соответствующими условиям об- хода пространственных препятствий. Например, при ап- проксимации некоторого препятствия плоскостью условие нахождения какой либо точки, связанной с манипуля- тором, в допустимой области может быть записано следующим образом: (R - К )foCO. (130) где R - радиус-вектор рассматриваемой точки мани- пулятора в неподвижном системе координат; f0 — внеш- 27
няя нормаль к аппроксимирующей плоскости в точке Ко. выраженной также в неподвижной системе коорди нат. Если провести аппроксимацию звеньев манипулятора параллелепипедами, то условие нахождения рабочего механизма в допустимой области будет соответствовать выполнению (тХ^) неравенств вида: [Ro-KoVoCO; s=l,2, , m;i=l,2........N, (1.31) где R ‘ — радиус-вектор s-й вершины параллелепипеда, аппроксимирующего t-e звено манипулятора (рис. 1.6). Переход к явной зависимости от вектора обобщенных координат q в уравнениях системы (1.31) осуществля- ется подстановкой выражения (1.12) для определения в неподвижной системе координат некоторого вектора, за- данного в системе координат t-го звена Отыскание очередного члена минимизирующей после- довательности q 1 осуществляется в соответствии с вы- ражением Я* =q +p6q , (1.32) где р — длина шага; 6q* вектор подходящего возмож- ного направления. Начальный член последовательности q соответствует исходному положению манипулятора и считается извест- ным. Члены формируемой последовательности должны удовлетворять условию q eQ. (1.33) Выполнение этого условия позволяет рассматривать члены найденной таким образом минимизирующей после- довательности в качестве значений вектора обобщенных координат, соответствующих промежуточным состояниям манипулятора на пути к достижению заданного вектора положения X Решение обратной задачи кинематики на основе ме- тода Ньютона связано с представлением уравнений связи (1 25) в линейном приближении: X X(q°)=-^LL f>q. (134) где q° некоторое начальное приближение; —зна- 28
Рис 1.6. Геометрическое представление условий обхода пространствен* иого препятствия, аппроксимированного плоскостью чение функциональной матрицы уравнений связи при Ч=Ч°. На практике для приближенного решения обратной кинематической задачи обычно используют комбиниро- ванный метод. Это объясняется тем, что начиная с неко- торого значения q достаточно близкого к q Л метод Нью- тона обеспечивает более быструю, по сравнению с мето- дом градиента, сходимость вычислительного процесса. Однако в начальной фазе решения использование метода градиента является более целесообразным, так как цри значениях q, далеких от qJJb сходимость метода Ньютона не гарантируется. В некоторых случаях, например при малых измене- ниях положения захватного устройства dR0 манипуля- 29
тора, решение обратной задачи кинематики может быть сведено к расчету приращений обобщенных коорди- нат [5]: dR v U/d^R, <=1,2, ,tf; /=1,2....... i, (1.35) где U - ветчина, определяемая выражением (1.17) Матричное уравнение (1.35) эквивалентно системе линейных уравнений относительно приращений обобщен- ных координат </</,. Поэтому процесс решения обратной задачи кинематики, значительно облегчается, так как задача решения системы линейных уравнений является всегда разрешимой. 1.4. Динамика роботов Описание динамических свойств манипулятора, рас- сматриваемого в качестве механической системы, пред ставляющей собой совокупность звеньев с определенными массоннерцноннымн характеристиками, может быть полу- чено различными методами, в том числе на основе II за- кона Ньютона [3], принципа наименьшего принуждения Гаусса (6] и др. Один из возможных методов получения уравнений динамики манипулятора основан на исполь- зовании уравнений Лагранжа II рода (5, 6]. В общем случае уравнения Лагранжа II рода имеют вид: -тг#— *=1.2, ..N, (1.36) dt dqt dqt ' ' где L = K — П — функция Лагранжа, К кинетическая энергия системы; П - потенциачьная энергия системы; F* обобщенная сила, отнесенная к ft-му звену; - обобщенная координата ft-го звена. Кинетическая энергия манипулятора определяется кинетической энергией его звеньев и объекта манипули- рования: Л=£ К„ (137) где Ki — кинетическая энергия <-го звена. Обозначив через R радиус-вектор некоторой точки i-го звена, а через dm, ее массу, можно получить выра- 30
жение для кинетической энергии рассматриваемой точки: dK,— ' Rt|2d/H/, (138) где R величина, определяемая в соответствии с выра- жением (1.12). Воспользовавшись выражением (1.19) для скорости материальной точки звена и соотношением для двух век- торов (a,b)=aTb tr(ab)*. преобразуем уравнение (1.38): dK = X tr(U/R R4’(U')’)dm.4^. (I 39) Выражение для отыскания полной кинетической энер- гии звена может быть записано следующим образом: к =7-2 2|‘г(Ц'н,(и:)’)?/ф. (140) Величина Н R,R,d/n представляет собой матрицу инерции /-го звена: \x,dm, $у x,dm, xdmt ^х dm $xydm, ^‘dm, $г ydm $y,dm П p r r r ( 1.41 ! yxzdni yy zdmt у dm. ydm. \xdm, ^y,dm, fadin, tn, где (x„ y„ z„ 1)T= R ; m, масса /-го звена; \х$1т,—1‘жж, \уЫт,=11 y,\z, dm,=l‘tt — моменты инерции относитель- но координатных плоскостей: \x,y,dtn, — \y,xdm, = !',у = \x,z,dmi — \z,x,dm, = 1‘жг = $y,z,dm, = Sz,y,dm, = l‘„ = /i, центробежные моменты инерции. Формирование матрицы инерции последнего звена Ну, как правило, проводится с учетом массоинериионных параметров объекта манипулирования. * tr(A) = 2 e‘ ‘ Clt-i Л4Х V! матрицы А, равный сумме се дн ио- 11 1 П-ИЫХ Э.КМ111 IOB 31
Выражение для кинетической энергии манипулятора может быть представлено в следующем виде: к 2 Д МЦ'НДЯУ)^, (1.42) Потенциальная энергия манипулятора в поле сил тя- готения (действующих в отрицательном направлении оси zo) определяется соотношением П---f m,GT,R (1.43) где т,— масса j-го звена; G'=[0, 0, g, 0]т — вектор ускорения свободного падения; R = [x1Ut ytv, z«. 1]т — радиус-вектор центра масс i-ro звена в соответствующей ему системе координат. Подставив выражение (1.42) и (1.43) для кинетиче- ской и потенциальной энергии манипулятора в уравнение (1.36) и выполнив дифференцирование, получим уравне- ние Лагранжа в явном виде: -2 'n.GTU,*R1«=F*1*=l... N. (1.44) Таким образом, система (1.44) описывает движение манипулятора под действием обобщенных сил и может быть представлена в общем виде: A(q, Pi+B(q, q, E)=F. (1.45) где A (q, £) — матрица-функция NXN, зависящая от конфигурации манипулятора; £ — вектор геометрических н массоинерционных параметров манипулятора; B(q, q, Е) — вектор-функция размерности N. Обобщенная сила F*. действующая в Л-м сочленении, представляет собой совокупность момента силы или уси- лия на выходе Л-го привода М,* и отнесенного к k-fi координате внешнего возмущающего момента или уси- лия Mi* Ft-Mt+AU Л=1........ N. В курсе теоретической механики обобщенные силы Mtt определяются через виртуальную работу следующим образом: 32
М V (1.46) Это же выражение для работы внешних сил, дейст- вующих на манипулятор при бесконечно малом измене- нии его конфигурации, может быть записано в виде М=£ (147) где М, — df.bR > -= df 6(Г, R, )=df,6r, R, = = tr(df 017) = tr(df R, V (U,')TM= = V tr(df,R1T(U1)T) (1.48) — работа элемента силы df,(f, = (/h, /2., /з., О)1) по пере- мещению элемента dm, t-ro звена на величину 6R0. Подставив выражение (1.48) для элементарной рабо- ты в равенство (1.47) и выполнив интегрирование по объему г-го звена, получим соотношение М = £ S(rff.6R<,)— V 2 tr (($ R df,)) ;iJ)’69,= I I /—I/ — I = S(Ztr(($IUf.T(U) ’))«?, (1 49) Выражение для внешних возмущающих обобщенных сил может быть получено из уравнении (1 46), (1.49)‘ Л1 2 1г(Ф(Ц)) (150) Величина Ф—($Rdr)T представляет собой матрицу сил действующих иа г-е звено: $x.d/i. $t/,d/i, Jzdfi. Jdh, jx.d/2. \y.dh> Sdh- /L51) $x.d/3i \ytdf3. $z,dfa Jdfs. .0 0 0 0 . где (x„ y„ z,)'— R Матрица сил Ф может быть построена по главному 1-1000 33
вектору и главному моменту сил, действующих на i звено, следующим образом: Ф.=(2вГв()(П (152) где f, =(/,, /2<. - . М’; L«(/= 1.2,3) проекции главног вектора сил на оси абсолютной системы координат //((/=4,5,6) проекции главного момента сил на оси абсолютной системы координат; я _ (1/2 при / = 1, 2, 3; 6> — 11 при /' = 4,5,6, ©4 0 0 0 0 0 0-10 0 1 0 0 0 0 0 0 О 0 1 О' 0 0 0 0 -10 0 0 0 0 0 0 ©3 = 0-100 о .0 ООО г 0 0 0 0 0 0 0 0 0 0 0 0 ©5= Го 0 0 О' 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 О' 0 0 0 0 0 0 0 1 0 0 0 0 в = о о о о в - 0 0 0 0 0 0 0 0 0 Соответствие между вектором моментов (усилий) развиваемых приводами, и вектором управляющих воз действий, подаваемых на их входы, устанавливается hi основе уравнений, описывающих динамические свойств приводов. Вид уравнений привода, связывающих управляющее воздействие с развиваемым моментом (усилием), опреде ляется выбранным вариантом учета его нелинейностей В качестве примера может быть рассмотрена лннеаризо ванная модель привода, механическая часть которог считается абсолютно жесткой (6]. Динамика линеаризованного привода описывается системой уравнений, в которую входит: уравнение усилителя привода К *Лу*(р) ®„.(0=»*(<). ...(1.53 а) где К» коэффициент пропорциональности; Л.»(р) операторный многочлен, характеризующий инерциои ность усилителя, р — оператор дифференцирования п ’ времени; <ол,*(/)— угловая (или линейная) скорость [за висящая от управляющего воздействия o*(t)]; - уравнение двигателя привода К,.Вд*(р)Ч»(0=М) -<од»(/), Л= 1.N, (1.536) 34
где Kit — коэффициент пропорциональности; B,k(p) — операторный многочлен, характеризующий инерцион- ность двигателя; Л4Д»(1) — развиваемый двигателем мо- мент (усилие); ыд*=<?д» — угловые (или линей- ные) скорости перемещения объекта управления и двига- теля по координате <?*; — уравнение моментов (усилий) иа валу двигателя 4*Р<»д*(/)=Л1д*(/)+Л1м,*(/). Л=1.N, (1,53в) где — момент инерции (или масса) перемещающихся частей двигателя; M*t - создаваемый нагрузкой суммар- ный момент (усилие); Мид»(/) — приведенный к валу дви- гателя момент (усилие) нагрузки Л4Н(/); — уравнение приведенной скорости вала о>д*(/)=k = 1.........ЛГ, (1.53г) где ip* — передаточное число редуктора («р*> I); — уравнение приведенного момента (усилия) на- грузки ) М„*(/)=№д*^*Хп**. Л = 1..N. (1.53д) где к 2_ I 1/п* при Л4м*<о*<0; •'* I Т|* при Л1м*<о*>0; П* — коэффициент полезного действия редуктора. Уравнения системы (1.53а) —(1.53д) справедливы для приводов не только с угловым, но и с линейным перемещением (при замене моментов сил на усилия, а моментов инерции на массы). В общем случае момент нагрузки Л1,*, создаваемый на выходном валу привода рассматриваемого Л-го звена за счет действия последующих звеньев и объекта мани- пулирования, может быть представлен в следующем виде: Мн.(/)=№««*(/) + Мг.(/) + Мс,.(/) + М.*(0. (1 54) W Мдии* динамический момент, обусловленный инер- ционностью нагрузки; этот момент определяется первыми Двумя слагаемыми в уравнении (1.44); Л1т* — момент, создаваемый силами трения на валу нагрузки; Л1„* — статический момент, обусловленный весом нагрузки; оп- ределяется третьим слагаемым в уравнении (1.44); "^•* — момент, обусловленный действием внешних воз- 35
мущающих сил. определяется в соответствии с выра- жением (1.50). Динамический момент Л1„м* может быть представлен в упрощенном виде без учета кориолисовых и центро- бежных сил: М.ия*=—= (1.55) где Ум» — эффективный момент инерции нагрузки Выразив ijk из уравнения (1.55), получим выражение для определения эффективного момента инерции на- грузки: ли-tH-M-'. (IM) dF„ dF„ Полагая все элементы привода линейными, момент M,k, обусловпенный действием сил трения на валу на грузки, равным нулю, учтем влияние сил трения, рас- смотрев нелинейность релейного типа. Развиваемый двигателем момент, приведенный к валу нагрузки (т. е. момент на выходе привода), определя- ется в соответствии с выражением (157) где К — I 1 /*1* ПРИ Л,л»«>л*<0; “** In* при Мдко »>0 Структурная схема лннеаризоваиного привода, со- ответствующая системе уравнений (1.53), описывающих его динамику, представлена на рнс. 1 7 Дифференциальные уравнения привода, связывающие управляющее воздействие щ(/) со скоростью вала на- грузки ы*(0 и с приведенным к валу нагрузки моментом Л1 ,*(/), развиваемым двигателем, могут быть записаны в виде: С(р)и>к(0 - E(p)M^t). (1 58) где С(р)=1р»Х,*Л>*(р) [1 + К „1 kpB^P)}, E(p)=(ifkKn ,.) ’ K.kK^A >*(р)Вд*(р) pu*(/)=S(p)M „*(/)+ V\p)M^t), (1 59) 36
Рис. I 7. Структурная схема линеаризованного привода где $(р)=0’р* Хп Д*Л»)_ |^*/1>*(р)[1 4-Кд*/д*рВд»(р)]; lT(p)=(iP.Kn ,*/„)-' KykA М Для примера рассмотрим электропривод с двигателем постоянного тока с независимым возбуждением, обла- дающий обратной связью по скорости <о, вала двигателя. Тогда после эквивалентных преобразовании уравне- ния привода запишутся следующим образом V(O = W( 1 + (КзК7)- *р(ГлР + 1 )]<0(/) - (1.60) - (<₽Кп Л6К7)-' (Тдр + 1) AL0); pv(/)=K3(tpK'n,Ke)-'[l +(КзК7)-'р(7\р+ (1.61) + 1 )]ЛЦ/) + K/ifKa Jt6r 'ММ, где Kt = Kyk'; K2 = K7i; — Kt и /^ — коэффи- циенты обратной связи и обратной связи по скорости; KXKiKs + XJ-'; К7 = К,(К,К6+К& ЛУ4р)=1; ВМ= Тлр+ 1. При малых значениях постоянной времени двигателя Л, характеризующей его инерционность, уравнения (1.60), (1.61) принимают вид: ц(0= Txp^t) + Т2ш(/) - ТзМХ/); (1 -62) рф)= Т\рМ^) + Т’.М„ (/) + Г3ММ, (1.63) где Т' К K-.Kt ’ Ti Тз I'K.JWQ • •Ff Кз ft Ki -Г Г Кз 1 — «ркг д/сэмк. ’ 2 — «p/с дК» • 3 — «рК. дК» 37
Таким образом, динамика робота как электромехани- ческой системы описывается системой уравнений, вклю- чающей в себя уравнения динамики манипулятора и уравнения динамики его приводов. Для робота с приво- дами рассмотренного типа указанная система уравнении имеет следующий вид: А'(Ч. 6)Ч+В'(Ч. Ч. Е)=и, | < = Dou-F Dili + D.u + DiM„(q, 4, £). j (L64) где A'(q. £)=A(q, £) + J- J diagtfj,..... В (q, q, £)=B(q, q, £)-Mr-M„ M„ M — моменты, обусловленные действием сил трения и внешних возмущающих моментов на валах нагрузки; и = М W-мерный вектор развиваемых приводами мо- ментов, v JV-мерный вектор управляющих воздействий; M"(q.q. £) — W-мериый вектор нагрузок на выходных валах приводов* D = diag(dij.. du,) — диагональные матрицы определяемые параметрами приводов. Как правило, переходные процессы в приводах проте- кают во много раз быстрее переходного процесса в манипуляторе Поэтому возможно раздельное интегриро- вание дифференциальных уравнений системы (1.64).
ГЛАВА СИСТЕМЫ ДИСТАНЦИОННОГО И ИНТЕРАКТИВНОГО УПРАВЛЕНИЯ РОБОТАМИ Системами дистанционного и интерактивного управления называются системы, в которых оператор непрерывно участвует в процессе управления движением исполни- тельных устройств робота. По этой причине системы дис- танционного и интерактивного управления роботами от- носятся к классу человеко-машинных систем. 2.1. Основные виды систем дистанционного управления роботами Как отмечалось в $ 1.1, существует три основных ви- да человеко-машинных систем дистанционного управле- ния роботами. Рассмотрим подробно каждый из них. Простейшим видом систем дистанционного управле- ния роботами является система командного управления, когда нажатием на кнопку, тумблер или рукоятку пульта управления оператор пускает в ход непосредственно привод одной степени подвижности исполнительного устройства робота. Точность позициони- рования в таких системах невелика из-за отсутствия обратной связи по положению (ибо нет н задатчика положения). Для ограничения перемещения ставятся концевые выключатели. Системы командного управления часто применяются на обитаемых подводных аппаратах, когда человек управляет движением робота, следя за ним и окружаю- щей обстановкой через иллюминаторы (или с помощью телевизионной системы наблюдения). Командный способ управления применяется также и для дистанционного обучения движению промышленных роботов. Отметим, что командное управление используется и для обеспе- 39
чения движения робота в ряде критических (в особенно- сти аварийных) ситуаций. Еще один вид систем дистанционного управления — системы копирующего управления. Су- ществует большое разнообразие таких систем. Основная особенность их — использование задающего устрой- ства, имеющего кинематическое подобие с исполнитель- ным устройством робота. При этом упрощаются дей- ствия оператора, который, управляя движением задаю- щего устройства, совершает естественные движения ру- кой, свойственные рабочим процессам. Основным достоинством систем копирующего управ- ления является максимальная точность воспроизведения исполнительным устройством системы всех движений задающего устройства. Поэтому манипуляционные сис- темы копирующего управления являются наиболее уни- версальными устройствами, позволяющими выполнять разнообразные и наиболее сложные операции в изме- няющихся условиях рабочей зоны при наличии препят- ствий. В случае одностороннего управления движением исполнительного устройства копирующего манипулятора возможно лишь однонаправленное воздействие на мани- пулятор со стороны задающего устройства. При этом движение задающего устройства под действием усилий со стороны нагрузки невозможно. Манипуляционные сис- темы с односторонним управлением получили наименова- ние копирующих манипуляционных систем одно- стороннего действия [1]. Одним из основных недостатков копирующих мани- пуляционных систем одностороннего действия, оснащен- ных только системок исполнительных приводов по каж- дой степени подвижности, является отсутствие у опера- тора информации о силовом воздействии исполнительного устройства на объект работ, которая позволяет форми- ровать наиболее рациональные законы управления дви- жением при выполнении технологических операции. Дальнейшее совершенствование копирующем системы состоит в разработке системы двустороннего действия, когда для повышения эффективности дей- ствий оператора н манипулятора создается еще ощуще- ние рабочих усилий на задающем устройстве. Системы двустороннего действия называются также обратимыми следящими системами [1]. Оператор, работая с таким манипулятором, имеет 40
Рис 2.1. Структурная схема системы управления копирующим мани- пулятором двустороннего действия. Р (/*>. . Р> ) ₽• = (₽«!. . Р«,) — векторы усилия соответственно ив задающем н исполнительном устройствах (г — число степеней подвижно- сти), М, = (Л<,|. , Л<„); М„~(Л<....М„) — векторы моментов на задаю- щем и исполнительном устройствах, «, д, — обобщенные координаты пере мешения, а„ а — угловые обобщенные координаты возможность организовать наиболее рациональные дви- жения исполнительного устройства. Имея информацию о его взанмодеиствин с объектом, оператор способен быс- тро и эффективно реагировать иа изменяющиеся внешние условия, исключать соударения и поломки манипулятора. На рис. 2.1 приведена структурная схема дистанцион- ного управления копирующего манипулятора двусторон- него действия. Оператор с помощью рукоятки управле- ния воздействует на задающее устройство, имитирующее движение руки в пространстве Задавая положение и ориентацию рукоятки (координаты а,), оператор при- кладывает к ней в требуемом направлении необходимые усилия и моменты Р , М , что приводит к перемещению задающего устройства (по всем степеням его подвижно- сти) с координатами а»„ Мм (i= 1.... г, где г— число степеней подвижности). Система двустороннего действия обеспечивает двунаправленную передачу этих перемеще- нии и моментов по каждой степени подвижности от задающего устройства к исполнительному. Воздействие- объекта на исполнительное устройство передается через систему двустороннего действия и кинематику задающего устройства на рукоятку управления и, следовательно, воспринимается человеком. Таким образом обеспечива- 41
Рис. 2 2. Структурные схемы системы двустороннего действия: а - симметричного типа, б — несимметричного типа. Д1. Д2 — двигатели, У - усилитель; СУ — схема управления двигателем; ДС — датчик скорости. ДП — датчик положения. ДМ — датчик момеитв; Mai, M j — моменты, развиваемые двигателями; h, h — моменты инерции иа валу двигателей Д\, Д2, — момент инерции нагрузки; 7И — момент инерции иа валу оператора. *а — коэффициент усиления сигнала датчика момента ется эффект непосредственного выполнения рукой челове- ка производственных операций. По структуре обратимые следящие системы могут подразделяться на системы симметричного и несиммет- ричного типов. Обратимая следящая система симметрич- ного типа представляет собой систему двустороннего действия, состоящую из двух систем: одна из них управ- ляет положением вала нагрузки, другая — положением вала оператора. Совокупность систем обеспечивает пере- дачу угловых перемещений и передачу моментов, прило- женных к осям системы [I]. На рис. 2.2, а показана обобщенная структурная схема обратимой следящей системы симметричного типа, которая представляет собой сочетание двух взаимосвя- занных систем, замкнутых по положению. Входной ко- ординатой для системы, управляющей валом нагрузки, является координата вала оператора В то же время входной координатой системы, управляющей валом опе- ратора, является координата вала нагрузки. Управляю- щий сигнал, пропорциональный рассогласованию в угло- 42
вом положении вала оператора и вала нагрузки, посту- пает на вход усилителен исполнительной и задающей сторон. Обратимая следящая система несимметричного типа сочетает в себе исполнительную систему, управляющую положением вала нагрузки, и момеитиый загружатель, информирующий оператора о нагрузочных моментах на исполнительной стороне [1J. Структурная схема обратимой следящей системы несимметричного типа приведена иа рис. 2.2, б. Управ- ляющим сигналом системы иа задающем устройстве является суммарный сигнал моментных датчиков, рас- положенных в механических передачах задающего и исполнительного устройств. Еще одним видом систем дистанционного управления являются системы полуавтоматического управления. В таких системах оператор непрерывно участвует в процессе управления, но одновременно с ним работает и вычислительная машина или специализированный вычис- литель Эта система не обладает памятью в том смысле, что управляемое движение манипуляционной системы робота происходит лишь до тех пор, пока человек произ- водит управляющее воздействие. При полуавтоматиче- ском способе управления оператор, воздействуя на управляющую рукоятку, задает желаемое движение за- хватного устройства, а микроЭВМ или специализирован- ный вычислитель по сигналам от датчиков рукоятки фор- мирует управляющее воздействие, поступающее на при- воды степеней подвижности исполнительного устройства. Основным отличием систем полуавтоматического управ- ления от систем копирующего управления является от- сутствие кинематического подобия между задающим и исполнительным устройствами. Отметим также, что полуавтоматическое управление является менее утомительным Д1Я оператора, чем копи- рующее, так как при этом способе управления ему не нужно выписывать рукой сложные пространственные дви- жения манипуляционной системы. Он производит лишь небольшие нажимы на управляющую рукоятку. Однако для обеспечения полной управляемости в системах полуавтоматического управления число степе- ней подвижности задающего устройства должно соответ- ствовать чис1у степеней подвижности исполнительного устройства. 43
2.2. Системы управления манипуляторами двустороннего действии с активным отражением усилив (обратимые следящие системы] Широкое распространение в практике создания дис- танционно управляемых копирующих манипуляторов по- лучили системы управления двустороннего действия с активным отражением усилия (обратимые следящие сис- темы). Рассмотрим подробно физические основы, режимы работы таких систем, а также моментные соотношения в них. Физические основы и режимы работы обратимых следящих систем. На примере индикаторной синхронной передачи, представляющей собой простейшую обрати- мую систему симметричного типа (1], рассмотрим физи- ческие основы систем управления манипуляторами дву- стороннего действия. На рис. 2.3 изображена парная схема включения сель- синов в индикаторном режиме работы. Для нее при ма- лых углах рассогласования между осями статический синхронизирующий момент, развиваемый сельсином при неподвижном положении оси, M = ko, где k — удельный синхронизирующий момент, о— угол рассогласования между осями сельсинов. Рис. 23. Схема включения сельсинов в индикаторном режиме работы: ам. а, — координаты вала оператора и вала нагрузки. /(. 1г — моменты инерции роторов сельсинов и вращающихся частей кинематических передач соответственно на оси оператора и иа оси нагрузки, — момент инерции нагрузки; МДИЙ|. Мдндз — динамические синхронизирующие моменты, разви- ваемые сельсинами
Динамический синхронизирующий момент, развивае- мый сельсином при вращении, задается приближенной зависимостью: где kr — коэффициент скоростного трения, учитывающий уменьшение синхронизирующего момента сельсина при вращении его оси по сравнению со статическим момен- том; a^pa=da/dt — угловая скорость оси сельсина. Динамику работы такой обратимой следящей системы можно описать системой обыкновенных дифференциаль- ных уравнений [1|: Л11ИИ|(/)=Л1,(/)-*11ао4/)=/|аоп(/)-Л1О11(/); Мди„Х/)=Л1д/)-*,2м/)=(/2-|-/и)^й(/)+Л1й(/); Л1|(/) = Л|[аХ0-«о (01; (2.1) Л1г(0=*2[«Д0— “"(О)- В том случае, когда в индикаторной синхронной пере- даче используются одинаковые сельсины, М </)= - М ,(/)=Л[а„ {/) - ««(/)] Выведем основные соотношения между координатами обратимой следящей системы (аоп и ан) и внешними по отношению к системе моментными воздействиями. Для моментов, действующих на валу оператора и на валу нагрузки, получим следующие уравнения* ЛЦ/)=МЛО - (/2 + Л) сЦ/) - - Л2сф)•)' ’ Уравнения моментов (2 2) являются исходными для получения основных зависимостей, определяющих дина- мику работы обратимой следящей системы в различных режимах. Одним из наиболее сложных для понимания физики работы обратимых следящих систем вопросов является определение понятия зависимых и независимых перемен- ных величин. Обратимым следящим системам присуши четыре основные переменные величины: координата вала оператора а п; координата вала нагрузки а„; внешнее моментное воздействие со стороны оператора Моп и внеш- нее моментное воздействие со стороны нагрузки М„. Рассмотрим четыре возможных варианта зависимо- стей между этими переменными величинами [1]. 43
1. Движение вала оператора и вала нагрузки под дей- ствием внешних моментов: а 4/)=й,[Л1 „(/); МД/)]; ая(/)=/|[Л1 „(/). Мй(/)] Эти зависимости характеризуют основной режим ра- боты обратимой следящей системы. Очевидно, что дви- жение вала оператора и вала нагрузки всегда является следствием от воздействия внешних моментов М //) и Мн(0- При этом момент М„ (t) является управляющим, а момент М (/) — возмущающим воздействием на обрати- мую следящую систему. Величина ЛМО» в СВО|° оче- редь, определяется законом изменения аоп(/). так как мощность, развиваемая оператором по каждой степени свободы, ограничена: ^,,0)=Л1„п(/)а 40С^т«»< + «>- Однако при рассмотрении динамики работы обрати- мой следящей системы без учета оператора условно счи- тается, что оператор может развивать момент независимо от закона изменения а„п(/), т. е. оператор обладает неог- раниченно большой мощностью. Будем считать, что внешнее воздействие со стороны нагрузки также ие зави- сит от закона изменения a^t). Поведение коортинат обратимой следящей системы под действием внешних моментов наиболее полно характеризует динамические показатели ее работы. Особенно важно исследование устойчивости всего контура системы при свободном поло- жении валов, когда Мо„=0; Л1н=0. 2. Вынужденное движение вала оператора по задан- ному закону: AW)]; ЛМО=Ь[<МО. ШО] Эти зависимости характеризуют наиболее важный для практики режим работы обратимой следящей системы как системы, следящей по положению и обладающей свойством активного отражения усилия. В данном режи- ме движение вала оператора является вынужденным, определяемым заданным законом. Следовательно, коор- дината a d(Z) может рассматриваться как независимая (управляющая), а координата а„(/) — как управляемая Внешний момент со стороны нагрузки является возму- щающим воздействием. Переменная величина M.^t) рас- сматривается в данном режиме как момент, ощущаемый оператором при движении вала оператора по заданному закону. Однако величина Л1О„(/) является моментом, кото- 46
рый должен развивать оператор для движения (ЩГ) по заданному закону. Для обеспечения этого, так же как и в предыдущем случае, оператор должен обладать беско- нечно большой мощностью. Частными случаями вынуж- денного движения вала оператора по заданному закону являются: а) работа обратимой следящей системы при непо- движном положении управляющего вала ан(/)=Лз[Л1н(/)]; М Л0=Ь[ЛЧ0] при aon=const; б) режим холостого хода aXO=ft«[a 40]; М 4Г)=Ь[аО1А01 при М„-0. 3. Вынужденное движение вала нагрузки по заданно- му закону: aon(/)=hs[aX0; М 401; ЛЦО=ЪЫО; ЛМОЬ Эти зависимости характеризуют свойство обратимой системы, позволяющее управлять ее работой также и со стороны вала нагрузки 4 Вынужденное движение вала оператора и вала нагрузки по заданным законам: М 40=Лв[а 40; aXZ)]; М (/)=(.[а 40. «401- В данном режиме работы пропадает основной фактор, характеризующий обратимую систему как систему, сле- дящую по положению и обладающую свойством актив- ного отражения усилия Динамика работы системы исследуется в режиме короткого замыкаиня, при котором одна из координат (aon или а.) заторможена, а вторая движется по заданному закону. При этом определяются моменты на аалу оператора и на валу нагрузки, дей- ствующие со стороны системы. Моментные соотношения обратимых следящих сис- темах. Основным отличием обратимой следящей системы от обычных систем автоматического регулирования, замкнутых по положению, является способность отра- жать на валу оператора нагрузочные моменты, прило- женные к исполнительному устройству. Это свойство обратимой системы может быть проанализировано по общему уравнению динамики ее работы, полученному при совместном решении уравнений моментов (2.2), действующих на валу оператора и валу нагрузки: 47
м п(/)=л,лг,[Л1н(/)+/лй(/)+/2^хо + + *.2a^)] + /iao.<Z) + *ria „(/). (2 3) Из уравнения (2.3) следует, что при любых режимах работы системы оператор ощущает внешние нагрузочные моменты [Л1 (/)-F/н«х»|(/)] с масштабным коэффициентом л = Л|ЛГ' (коэффициент п называется коэффициентом масштабности ощущения оператором нагрузочного мо- мента [1|). Из уравнения (2 3) также видно, что помимо внешних моментов нагрузки оператор ощущает внутренние мо- менты М „„,(/) = /1 aon(/) 4- Л, । ao„(/); М.нХО — /2Яи(/) + Лг2«н(0. присущие обратимой системе Наличие в обратимой следящей системе внутренних моментов приводит к существенной ошибке в ощущении оператором внешних нагрузочных моментов: М ,.(/)= л [Af ХО + Ла..(01 +Af „,(/) + пМ = -л[ЩО+Лй(О] + е(О. где e(/)=M.Hi(/)4- лЛ1,иД/) ошибка в ощущении опера- тором внешних нагрузочных моментов. Для повышения точности ощущения применяются различные методы компенсации влияния внутренних моментов. Принципиально идея их основана на введении компенсирующих сигналов, пропорциональных внешним моментам, приложенным к системе со стороны задающем и исполнительной осей. Подобные сигналы обычно выде- ляются с помощью моментных датчиков, включенных в цепь задающей и исполнительной осей. 2.3. Основные способы полуавтоматического управления манипуляторами В промышленных роботах применяют несколько спо- собов полуавтоматического управления, реализующих тот или иной алгоритм управления. Основные из них три: скоростной (управление по вектору скорости), силовой (управление по вектору силы (момента)], позиционный (управление по положению). Рассмотрим подробно каж- дым из этих способов. 48
Скоростной способ Это один из наиболее распростра- ненных способов полуавтоматического управления, при котором оператор задает с помощью шестистепенной управляющей рукоятки вектор скорости и направление движения захватного устройства манипулятора. Следуя этому заданию, специализированный вычислитель (ЭВМ) рассчитывает скорости относительного движения звеньев исполнительного устройства манипулятора. При рассмотрении основных соотношений систем полуавтоматического управления по вектору скорости обозначим через х вектор параметров захватного устрой- ства манипулятора, а через q вектор обобщенных координат манипулятора, за которые обычно принимают угловые перемещения звеньев исполнительного устрой- ства Тогда [1], (2] x=f(q) Следовательно, обобщенные координаты однозначно определяют положение захватного устройства Скорость звеньев исполнительного устройства опре- деляется с помощью выражения [ 1 ], [2] * Ч« A '(q)xo, где A 1 (qj - матрица, обратная матрице A(q) =df/dq,i; х0 - формируемый с помощью рукоятки управления век- тор требуемой скорости захвата. Сигналы, соответствующие координатам q , поступают на замкнутые по скорости приводы отдельных степенен подвижности исполнительного устройства Обратная связь по скорости осуществляется с помощью сигналов датчика скорости, установленного на выходном валу привода, или предварительного дифференцирования сиг- налов датчика положения q путем подачи их на соответ- ствующие приводы исполнительного устройства. Основная трудность, возникающая при создании сис- тем полуавтоматического управления по вектору скоро- сти, — сложность реализации алгоритмов обращения матрицы A(q). Вычислительная машина, осуществляю- щая процедуру обращения в реальном масштабе вре- мени, должна иметь достаточно высокое быстродействие В литературе [2] приведены алгоритмы полуавтомати- ческого управления роботами по вектору скорости, в которых не применяется сложная процедура обращения матрицы A(q) (алгоритм транспонирования матрицы A(q), алгоритм чебышевского приближения). 49
Силовой способ. При полуавтоматическом управлении манипулятором по вектору силы обеспечивается прило- жение к объекту манипулирования воздействий, пропор- циональных силам и моментам, развиваемым оператором на рукоятке управления. Вычислительная машина, ис- пользуя информацию об усилиях, действующих на ру- коятке управления, определяет моменты, которые необ- ходимо воспроизвести приводами манипулятора по всем степеням подвижности. Вектор момента вычисляется по формуле Мо - A’(q)F где знак «т» означает транспонирование матрицы A(q). Координаты вектора М поступают на замкнутые по моменту исполнительные приводы манипулятора. Точность позиционирования при этом способе неве- лика, поэтому его целесообразно применять не в процессе управления свободным движением захватного устройства манипулятора, а в процессе его контакта с предметом работы. Тогда оператор может регулировать необходи- мые рабочие усилия, создавая их в определенном мас- штабе иа управляющей рукоятке и ощущая силовую реакцию. Позиционный способ. Он основан на копировании пе- ремещений рукоятки задающего устройства захватным устройством. Отметим, что рассмотренный ранее способ копирующего управления с кинематически подобными задающими н исполнительными устройствами является частным случаем позиционного полуавтоматического управлеиня. Позиционный способ управления состоит в том, что с помощью перемещения многостепенной управ- ляющей рукоятки задаются (в некотором масштабе) же- лаемая траектория движения концевой точки исполни- тельного устройства манипулятора и желаемые повороты захватного устройства. Задаваемая траектория и поворо- ты реализуются посредством специализированного вы- числителя, который непрерывно вырабатывает соответ- ствующие сигналы управления на приводы степеней под- вижности исполнительного устройства манипулятора. Способ позиционного управления предпочтителен при выполнении технологических операций, требующих точ- ной координации движении манипулятора, что важно, например, для операций сборки. Каждый из рассмотренных способов полуавтома- тического управления наиболее эффективен при выполне- 50
нни определенного класса операций. Поэтому при по- строении систем управления универсальными манипуля- торами рационально использовать комбинированные си- стемы управления, допускающие возможность работы в различных режимах полуавтоматического управления, которые оператор мог бы выбирать в зависимости от вида и усювий выпозияемои работы. 2.4. Интерактивные системы управления роботами Использование систем дистанционного управления связано с большой непрерывной загрузкой оператора, а значит, и малой продолжительностью работы вследствие быстрой утомляемости, и медленным выполнением опера- ции. Все это приводит к целесообразности создания интерактивных (человеко-машинных) систем. Существу- ют три основных типа интерактивных систем - автома- тизированные, супервизорные и диалоговые. Рассмотрим подробно каждым из них. Автоматизированные интерактивные системы. Автома- тизированные системы являются начальной разновидно- стью интерактивных систем В таких системах происхо- дит расчленение выполняемых роботом операций иа эле- ментарные составляющие, среди которых одна часть осуществляется роботом автоматически, а другая часть выполняется оператором. Для повышения эффективности выполняемых работ и разгрузки оператора желательно как можно большую часть элементов сложных операций выполнять автома- тически. Важным для практики видом автоматизированных интерактивных систем являются системы, в которых авто- матические режимы управления (программные или адап- тивные) чередуются с копирующими. В таких системах полностью сохраняются все автоматические режимы уп- равления роботом, а кроме того, когда необходимо, вклю- чается копирующая система. В такой комбинированной системе оператор выполняет две функции: 1) включает и переключает программы автоматических режимов уп- равления роботом, в том числе и любых адаптивных; 2) переключается на режим копирующего управления в экстремальных ситуациях. Интерактивные системы супервизорного управления. В таких системах оператор, наблюдая на экране обста- 51
новку в месте действия робота, подает в управляющую вычислительную машину команды целеуказания, предпи- сывающие роботу выполнить некоторую операцию. Робот выполняет эту операцию в автоматическом режиме. Пос- ле ее выполнения оператор снова подает команду в вы- числительную машину, например команду «перевести захватное устройство в такое-то место, обойдя при этом такое-то препятствие». Робот выполняет ее автоматиче- ски, допустим, в поисковом режиме с использованием тактильных датчиков, установленных на захватном уст- ройстве. Затем следует новая команда целеуказания оператора вычислительной машине и т. д Алгоритмы автоматического управления при этом мо- гут быть заложены в вычислительную машину такими же, как и при полуавтоматическом управлении (см. $ 2.3). Но могут быть и иными — типа самонаведения, поиско- вых режимов и т. п. Диалоговые интерактивные системы. Диалоговое уп- равление осуществляется в активном взаимодействии вычислительной машины с оператором на языках раз- личного уровня, в том числе и на естественном языке человека При этом все движения исполнительного уст- ройства робота осуществляются автоматически, ио пла- нирование этих действий производится вычислительной машиной совместно с оператором. Диалоговое управле- ние предполагает двустороннее общение человека с вы- числительной машиной, осуществляющей адаптивное управление или управление с использованием элементов искусственного интеллекта. При этом вычислительная машина совместно с человеком активно участвует в вы- работке программы дальнейших действий, а также в вы- боре наилучшего способа управления в сложных ситуа- циях.
ГЛАВА СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ РОБОТАМИ Главная особенность систем автоматического управления роботами — их автономная работа без непосредственно- го участия человека. Функции оператора состоят лишь в обучении, запуске и последующем периодическом наблю- дении за работой робота. Закон управления в системе автоматического управ- ления реализуется в виде программы управления. При этом возможны различные режимы отработки заданной программы: управление по жесткой программе без ее перестройки в процессе работы, адаптивное изменение программы в зависимости от условии работы, формиро- вание управления при отсутствии заданной в явном виде программы. Жесткая отработка программы характерна для ро- ботов первого поколения. Это наиболее простой вид управления, особенно при реализации его на базе разомкнутого цикла регулирования. В более сложных случаях применяют замкнутый принцип управления. Наличие системы очувствления, позволяющей роботу приспосабливаться к неполностью определенной обста- новке при выполнении программы, отличает автоматиче- ские роботы второго поколения, называемые адаптивными. Способность восприятия, распознавания окружающей среды, построения ее модели, принятия решения об изме- нении поведения при выполнении задания характерна для роботов третьего поколения Такие роботы при- нято называть интеллектными, так как оии технически воспроизводят отдельные достаточно сложные интеллек- туальные функции, свойственные человеку. Однако сле- дует отличать искусственный, или машинный, интеллект роботов от естественного интеллекта живых организмов. Обладая только внешним сходством проявлений, интел- лектные функции робота реализуются на иных физиче- $з
ских принципах и имеют ограниченные возможности. Вместе с тем даже ие столь совершенный технический интеллект значительно упрощает и автоматизирует ре- шение задачи синтеза управляющих программ робота, особенно в тех случаях, когда роботу приходится дейст- вовать самостоятельно, не прибегая к помощи человека как в работе, так и в процессе обучения. Таким образом, сложность решаемых системой авто- матического управления задач является основой для раз- депения роботов иа поколения. Роботы первого поколе- ния хорошо освоены промышленностью Найдены эконо- мически целесообразные способы их серийного изготов- ления Роботы второго и особенно третьего поколения пока еще уникальны и, как правило, дороги. Их исполь- зуют при работе в экстремальных условиях, где труд человека невозможен. Вместе с тем накоплен первый опыт промышленных применений таких роботов, успеш- ность которого позволит им быстро распространиться прежде всего в точном машиностроении, электронной промышленности, приборостроении и ряде других от- раслей. 3.1. Особенности систем автоматического управления Сравнение различных систем автоматического управ- теиия можно провести по следующим характеристикам: тип траектории движения робота, цикл управления, источники информации для синтеза закона управления, алгоритм управления, способ программирования системы управления (табл. 3.1). Тип траектории движения робота. Цикловые системы управтеиия обеспечивают лишь дискретную траекторию движения. Каждая ее дискретная точка соответствует одной комбинации из имеющегося общего числа сочета- ний крайних положений звеньев манипулятора Пози- ционирование в крайнем положении реализуется обычно механическим упором. Главный недостаток дискретности траектории неполная достижимость точек рабочей зо- ны робота. Позиционные системы управления обеспечивают ква- зииепрерывную траекторию. Это значит, что траектория, по существу, непрерывная, ио позиционирование возмож- но только в дискретных значениях непрерывной функции. Число дискретных значений зависит от возможностей
Таблица 3.1 Характери- стики Системы программного управления цикловые позиционные контурные Тип траекторий движения Дискретные Квазинепрерыв* ные Непрерывные Цикл упраале- иия Разомкнутый Разомкнуто- замкнутый Замкнутый по внутренней ин- формации Источники ин- формации Концевые вы- ключатели Датчики положе- ния и скорости в степенях по- движности Датчики положе- ния и скорости в степенях по- движности Алгоритм Циклограмма Циклограмма н закон интерпо- ляции Решение днффе ренииального уравнения Программирова- ние Физическая на- стройка, ма- шинный код ассемблер Обучение, машин- ный код Обучение, режи- мы ONLINE, OFF LINE Языки высоко- го уровня. Спе- циализирован- ные языки
Системы адаптив- ного управления Системы интеллект- кого управления Непрерывные Непрерывные Замкнутый по внут- ренней н внешней информации Замкнутый по внут- ренней и внешней информации, по внутренним и внеш- ним знаниям Датчики положения, скорости, силомо* меитные тактиль* иые, зрения, л ока- Системы оч> ветвле- ния с базами зна- ний Адаптивная коррек- ция Многоконтурная адап тация и самоорга- низация Минимальное пред- варительное обуче- ние, самообучение Языки высокого уровня и специа- лизированные язы- ки Автоматическое про- граммирование. Проблемно ориен- тированный язык искусственного ин- теллекта
управляющего устройства и составляет от нескольких сотен до нескольких тысяч точек. Контурные, адаптивные и иителлектиые системы уп- равления обеспечивают непрерывные траектории движе- ния, т. е. возможность позиционирования в любой точке рабочей зоны робота. Более того, параметры движения (скорость, ускорение, торможение) можно изменять в процессе перемещения по траектории. Цикл управления. Цикловые системы управления име- ют разомкнутый цикл управления, т. е. сигналы управ- ления поступают из программатора непосредственно иа привод робота. В позиционных системах цикл замкнут по точкам позиционирования и разомкнут для движения между точками позиционирования, которое происходит по заданному закону. В контурных системах цикл управ- ления замкнут по внутренней информации о динамиче- ском состоянии звеньев робота, а адаптивные системы имеют дополнительные контуры для организации замкну- того цикла по внешней информации о динамическом состоянии среды. Интеллектные системы, кроме того, обладают замкнутыми циклами по внутренним и внешним знаниям. Источники информации. В цикловых системах обычно не используются информационные датчики. Исключение составляют концевые выключатели, фиксирующие на- хождение звеньев в крайних положениях. В позиционно- контурных системах каждое звено снабжается обяза- тельно датчиком положения, сигнал которого поступает в устройство сравнения для формирования сигнала рас- согласования между задаваемыми и текущими положе- ниями звеньев В адаптивных системах к датчикам внут- ренней информации добавляются датчики внешнего очув- ствления, а в ннтеллектных системах средства очувств- ления объединяются с базами знаний. Алгоритм управления. В цикловых системах алгоритм управления формируется в виде логической последова- тельности срабатываний звеньев манипулятора. В пози- ционных системах наряду с логической последовательно- стью движения звеньев существует еще закон интерпо- ляции, определяющий движение между точками пози- ционирования. В контурных, адаптивных и ннтеллектных системах алгоритм управления синтезируется в резуль- тате решения дифференциального уравнения, описываю- щего динамику робота. 56
Способ программирования. Цикловые системы про- граммируются путем физической настройки механических упоров и ручного набора циклограммы на программа- торе. Позиционно-контурные системы программируются в режиме непосредственного обучения с использованием языка машинных кодов либо с применением языков программирования высокого уровня. Используются так- же специальные языки программирования, учитывающие специфику робота. Для адаптивных и интеллектиых си- стем характерны автоматизированные и автоматические способы программирования 3.2. Цикловые системы управления Основной принцип циклового управления автомати- ческими роботами, заключающийся в осуществлении по- зиционирования манипулятора по упорам, определяет ряд характерных особенностей цикловых систем управле- ния, главными из которых являются следующие: — программирование логической и технологической информации дискретного вида, определяющей последо- вательность движения звеньев манипулятора, длитель- ность позиционирования и т. д.; — выделение информации о перемещениях по от- дельным степеням подвижности, задаваемых с помощью регулируемых упоров или датчиков положения; — сравнение заданного и фактического положений звеньев манипулятора в естественном коде*; — управление по разомкнутому циклу. В общем случае состав устройства циклового про- граммного управления включает в себя управляюще- вычислительный модуль, программоноситель, блоки со- пряжения с роботом и технологическим оборудованием, панель управления и пульт ручного управления обуче- нием (рис. 3.1). Ядром системы является управляюще-вычислитель- ный модуль, основная функция которого заключается в формировании микроопераций (управляющих импуль- сов), соответствующих требуемому алгоритму, для выда- чи их в операционные узлы и другие функциональные блоки. В электронных устройствах циклового программ- ного управления в качестве управляюще-вычислитель- * Сравнивающим элементом является механический упор, или Датчик положения. 57
Программоноситель Рнс. 3.1. Общая структура системы циклового управления кого модуля, как правило, используются микропрограмм иые автоматы различных типов. Организация управляю- ще-вычислительных модулей микропроцессорных систем циклового управления реализуется на базе микропро цессориых наборов н микроЭВМ различных конфигу раций. Для запоминания и хранения информации о последо вательности выполнения команд в системах циклового управления в качестве программио-задающих модулей (программоносителей) могут быть использованы как электромеханические информационные носители — ште керные и коммутационные поля, программные барабаны, диодные перепрограммируемые матрицы, разъемы, пер фокарты и т. п., так и электронные, построенные иа осно- ве БИС полупостоянных запоминающих устройств с элек трической перезаписью информации. Блок сопряжения с роботом и технологическим оборудованием выполняет функции формирования команд управления приводами, опроса состояния датчиков, вырабатывающих сигналы подтверждения отработки, обмена информацией (дне кретиого вида) с обслуживаемым технологическим обо- рудованием. Панель управления предназначена для зада ния режимов работы, пуска и останова программы, индикации хода отработки программы, состояния и пра вильности функционирования узлов Сигналы ручного перемещения звеньев робота формируются с помощью пульта ручного управления (обучения). Процесс обучения заключается в ручной регулировке упоров, осуществляющих позиционирование робота, и за несении в программоноситель информации о последова тельиости смены положений его отдельных звеньев.
Программирование управляющей информации произво- дится по кадрам, состав и число которых определяются командами, выдаваемыми на приводы робота и техно- логическое оборудование. При автоматическом воспроиз- ведении программы ииформацня об очередности выпол- нения отдельных операций считывается по кадрам из программоносителя в управляюще-вычислительный мо- дуль, формирующий команды управления иа блок сопря- жения с роботом и технологическим оборудованием. В качестве примера цикловой системы управления с упрощенной реализацией основных функциональных уз- лов и блоков рассмотрим устройство ЭЦПУ-6030 (рис. 3.2), ориентированное на управление простейшими роботами типа МП-9С и сопутствующим технологиче- ским оборудованием. Оно построено на основе синхрон- ного управляющего автомата по принципу жесткой реа- лизации алгоритма управления Программоноситель реа- лизован в виде двух наборных полей из декадных пере- ключателей. Организация программоносителя и система команд позволяют обеспечить программирование одно- временного исполнения двух команд управления звень- ями манипулятора, а также технологических команд, команд опроса датчиков, выдержки времени, логических команд и т. д. В автоматическом режиме работы очередной номер отрабатываемого кадра программы из счетчика кадров поступает на дешифратор, адресующий программоноси- тель. Выбор кадра программы сопровождается поступле- нием и запоминанием на триггерах выходного регистра управляющих команд, выдаваемых на робот (до поступ- ления новых). Команды на технологическое оборудование сохра- няются на выходе устройства только в течение времени их исполнения. После получения всех сигналов об испол- нении соответствующего кадра программы с датчиков технологического оборудования н робота (или от блоков формирования временных выдержек технологических команд и команд на робот) происходит срабатывание счетчика кадров, и устройство переходит к выполнению очередного такта программы. Схема пропуска и перехода предназначена для реализации простейших операций ветвления программы Она инициируется схемой помехо- защиты, формирующей сигнал опроса условия пропуска кадра программы При наличии такого условия схема пропуска и перехода вырабатывает дополнительный сиг- 39
s Управляйте— вычислительный Блок формирования сигнала отработки Схема помехо- защиты Блок сопряжения с роботом и техно- логическим обо- рудованием Блок форми- рования программной Обмен информацией с технологическим оборудованием Блок выходных усилителе и техно- логических ком нд Обмен ин- формацией с роботом Блок выходных усилителей сигналов на приводы робота врем ни Блок форми- рования вре- Пульт управ । Л НИЯ рования вре- 'I менных вы- ll держек тех- |1 нологических I команд Счетчик ДР Схема пропуска и перехода Блок опроса датчиков технологиче- ского обо- рудования Блок фор- мирования временных выдержек команд на робот Выходной [ регистр состояния ! I Схема J. пуска - Т ост-нова Дешифратор выборки кадров Программоноситель состояния координат Блок опроса датчиков робота
нал для счетчика кадров, за счет которого и обеспечива- ется пропуск очередного кадра. Временные выдержки управляющих сигналов задаются блоком формирования программной выдержки времени Устройство циклового программного управления ЭЦПУ-6030 предназначается для управления роботами с двухпозиционнои фиксацией положения по отдельным степеням подвижности прн автоматизации операций с простым технологическим циклом. Унифицированные цикловые системы, предназначен- ные для управления роботами с промежуточным позицио- нированием отдельных звеньев манипулятора по выдвиж- ным упорам и различного рода технологическим обору- дованием со сложной логикой управления, характери- зуются рядом особенностей, из которых определяющими являются следующие: — осуществляется управление выдвижными упорами; — реализуются алгоритмы торможения звеньев робо- та при приближении к упору; - используется увеличенное число команд; — формируются технологические программы с пере- менной последовательностью кадров; - применяется развитая система аварийных блоки- ровок Типичным примером систем такого типа является унифицированное устройство циклового управления УЦМ-663, структурная схема которого приведена на рис. 3.3. Расширение логических возможностей, как одно из требований, предъявляемых к системам подобного типа, привело к необходимости построения упранляюще-вы- числнтельного модуля в виде набора функциональных узлов с общим управлением от центрального блока, реализованного иа базе микропрограммного автомата. В качестве программоносителя в системе используется онергонезависимое» оперативно-запоминающее устрой- ство на интегральных микросхемах, позвотяющее сохра- нять записанную информацию при отключении источ- ника питания Управляющая информация в процессе функциониро- вания устройства формируется блоком центрального управления в соответствии с программой, записанной н запоминающем устройстве. Система выдачи команд на робот, включающая в свой состав программируемые диодные матрицы, которые реализуют различные алго- 61
Рис. 3 3. Структурная схема унифицированного устройства цнк лового управления УЦМ-663 ритмы управления, обеспечивает сопряжение устройства с приводами всевозможных типов цикловых роботов Вырабатываемые блоками управления роботом и техно- логическим оборудованием сигналы управления непо- средственно поступают на соответствующие приводы че- рез блок выходных усилителей. Блок сопряжения с дат- чиками робота и специальная схема в блоке управления технологическим оборудованием формируют сигналы от- работки кадра. Для предотвращения аварийных ситуа- ций в устройстве предусмотрена программируемая с помощью специальной диодной матрицы система аварий- ной блокировки, выдающая на блок центрального управ- ления сигналы разрешения команд. Программирование устройства осуществляется путем покомандного набора 62
программы на пульте оператора. Переменный формат кадра, включающий одну или несколько одновременно выполняемых единичных команд, является одной из ха- рактерных особенностей системы. Устройство УЦМ-663 обладает достаточно развитым языком программирования (системой команд). Каждая команда представляет собой 8-разрядиое слово, состоя- щее из кода операции (старшие разряды), ие обяза- тельной в общем случае информационной части (млад- шие разряды) и контрольного разряда. Команды «Дви- жение» предназначены для осуществления ручного уп- равления звеньями манипулятора. Устройство пульта оператора позволяет закодировать код операции, номер управляемой координаты и направление ее движения. Программирование работы обслуживаемого техноло- гического оборудования осуществляется командами «Внешнее оборудование». Соответствующие циклограмме временные интервалы задаются командой «Выдержка времени». Команда «Совместная отработка» позволяет компоновать кадры различной длины, содержащие до восьми единичных операций, число которых задается в ее информационной части. Обращение к подпрограм- мам реализуется с помощью команд «Обращение к под- программе» и «Конец подпрограммы». Команда «Обра- щение к подпрограмме» в случае необходимости может быть использована и для организации условных н безус- ловных переходов Для расширения числа переходов в системе команд предусмотрена команда «Условный пере- ход». Команды «Начало цикла» и «Конец цикла», управ- ляющие работой двух аппаратных счетчиков циклов, предназначены для формирования в программе локаль- ных циклов. Программное прерывание работы устройства осуществляется командой «Останов». В информационной части команды «Конец программы», используемой для зацикливания программы, указывается номер одной из четырех программ, одновременно хранимых в памяти. Команда «Модификация» представляет собой компакт- ную запись программы раскладки деталей в упорядо- ченную двухмерную тару. На рис. 3.4 показано распределение памяти устрой- ства циклового управления УЦМ-663, а в табл. 3.2 при- ведена система его команд. Унифицированные устройства циклового управления благодаря достаточно развитым языкам программиро- вания, структурно-алгоритмическому построению, воз- 63
Рнс. 3.4. Структура распределения памяти в УЦМ-663 можности гибкой привязки к позиционируемым по упорам роботам различных типов широко применяются при по- строении локальных робототехнических комплексов со сложными циклограммами работы, большим числом еди- ниц управляемого технологического оборудования. Назначение микропроцессорных устройств циклового управления состоит в управлении цикловыми роботами в рамках сложных робототехнических комплексов, мо- дулей ГАП и т. д„ что связано с необходимостью обмена информацией с ЭВМ верхнего уровня. отличие от уни- фицированных устройств циклового управления, ориен- тированных на аппаратную реализацию большинства функций, цикловые системы управления, выполненные на микропроцессорной основе, представляют собой управ- ляющие устройства, построенные по блочно-модульному принципу, обладающие развитым математическим обес- печением и предназначенные для управления цикловыми манипуляторами при обслуживании различного техноло- гического оборудования. Общая структурная схема мик- 64
Команда 7 6 Is • 1 3 * Движение 0 Направ- ление движе- ния Номер коорди- наты Номер точки Захватное устройство 1 открыть закрыть 1 1 0 0 0 0 0 1 1 0 0 1 1 1 Захватное устройство 2 открыть закрыть 1 1 0 1 0 0 0 1 1 0 1 1 1 1 Внешнее оборудова- ние 1 1 1 0 0 Номер технологиче- ской команды Внешнее оборудова- ние 2 1 1 0 1 Номер технологиче- ской команды Выдержка времени 1 0 1 Выдержка времени Совместная отработка 1 1 1 1 Число команд в кадре Условный переход 1 0 0 1 Номер внешнего усло- вия Конец программы 1 0 0 0 0 Номер про- граммы Обращение к подпро- грамме 1 0 0 0 1 Номер подпро- граммы Конец подпрограммы 1 1 1 0 1 1 0 Начало цикла 1 1 1 0 0 1 Номер счет чика цик- ла Конец цикла 1 1 1 0 0 0 » Модификация 1 1 1 0 1 0 » Останов 1 1 1 0 1 1 1 Разряд контроля четности 3—1000 63
Модуль ввода - вывода Модуль дискретных команд ГЕ__ГЕ_3^ Внутрисистемный интерфейс Периферийные устройства =7— Интерф^с радиальный последовательный Процессор запоминающее устройство запоминающее устройство Полу постоянное э. поминающее устройство Р« ’5 Общая стр)«»урная схема микропроцессорного устройства илового управления ропроцессорного устройства циклового управления при- ведена на рис. 3.5 Процессор, осуществляющий логическую обработку информации в соответствии с записанной в памяти про- граммой по реазизацнн алгоритмов управления, явля- ется основным элементом управляюще-вычислительного модуля и создает возможность работы в реальном мас- штабе времени за счет развитой системы прерывания и программируемого таймера Специальный контроллер, входящий в состав управляюще-вычислительного модуля, вырабатывает сигналы внутрисистемного интерфейса. Система памяти устройства включает в свой состав сзедующие модули: — постоянного запоминающего устройства, предна- значенного для хранения функционального программного обеспечения (ПО); - оперативного запоминающего устройства, предна- значенного для хранения обрабатываемой информации; — полупостоянного запоминающего устройства, ис- пользуемого в качестве программоносителя для хранения управляющей программы, записываемой в процессе обучения Подключение к внутрисистемному интерфейсу перифе- рийных устройств, в число которых входят фотосчиты- вающие устройства, перфоратор, устройства внешней памяти, программатор (предназначенный для ввода и редактирования программы управления), других аппарат- ных модулей, а также осуществление связи с ЭВМ верх- 66
Рис 3 b структура программного обеспечения микропрощ сорного устройства циклового управления него уровня производится через модуль радиального последовательного интерфейса (ИРПС). Модуль ИРПС совместно с модулем дискретных команд образует сред- ства управления счаботочиой электроавтоматикой техно- логического оборудования и синхронизации работы дру- гих средств управления робототехническим комплексом. Модули ввода и вывода, число которых зависит от кон- кретного исполнения устройства, предназначены для со- пряжения с роботом и технологическим оборудованием, а пульт ручного управления обеспечивает возможность осуществления ручного управления. Программное обеспечение микропроцессорного уст- ройства циклового управления (назначение которого со- стоит в организации взаимосвязанной работы аппарат- ных модулей устройства и собственно модулей ПО) по- мимо модулей, реализующих заданные функции управле- ния цикловыми роботами и технологическим оборудова- нием, и драйверов микропроцессорных аппаратных моду- чей включает в свой состав системные программы, обес- печивающие функционирование ПО. На рис. 3.6 приве- дена структура ПО микропроцессорного устройства циклового управления Совокупность задач управления функционированием системы ПО, в число которых входят обеспечение мучьти- процессорного режима работы алгоритмической системы 67
(параллельного выполнения нескольких управляющих программ, хранящихся в памяти и загружаемых потре- бителем), обработка аппаратных н программных преры- ваний, распределение ресурса времени процессора на об- работку системных и управляющих программ и т. п., реализуется программой-диспетчером. Выбранная дис- петчером программа инициируется с помощью програм- мы-монитора, обеспечивающего выборку из памяти и пе- редачу интерпретатору команды управляющей програм- мы. Интерпретатор осуществляет идентификацию полу- ченной от монитора команды с последующей ее распаков- кой и выполнением предписанных кодом операций команд управления. Опрос состояния датчиков робота и организация вре- менных программных задержек осуществляется модулем опроса датчиков и программируемых таймеров. Драйвер настройки БИС аппаратной части выполняет функции выдачи инструкций, устанавливающих требуе- мый режим работы БИС устройства. Драйвер ИРПС осуществляет функции управления процессом обмена информацией с терминалами по последовательному ка- налу. Модуль связи с терминалами обеспечивает преобра- зование, идентификацию и передачу информации в мо- нитор, а также запись н редактирование Примером микропроцессорной системы управления цикловыми роботами, построенной по агрегатно-блочному принципу, является модульное устройство циклового управления УЦМ-100. 3.3. Позиционно-контурные системы управления В простейшем случае задача управления движением манипулятора по заданной пространственной траектории заключается в расчете и покомпонентной выдаче на при- воды робота значений программной траектории q(f*) в дискретные моменты времени to, t\.... tr с некоторым шагом дискретности управления. При этом система уп- равления охвачена внешней обратной связью по положе- нию. По способу выдачи уставок q(/*) иа входы приводов роботов системы управления делятся иа системы пози- ционные [когда очередная уставка q(f*) подается лишь после отработки приводами всех компонент •). i-= 1, ... N, ее предыдущего значения с требуемой точ- 68
иостью] и контурные [когда поступление уставок q(f*) организуется с определенной частотой, а точность отра- ботки задается только для конечного значения про- граммной траектории q(f)[. При управлении по множест- ву дискретных значений программной траектории как по- зиционные, так и контурные системы оказываются рабо- тоспособными Однако обеспечение требуемого качества переходных процессов связано с решением задачи ста- билизации программных траекторий, т. е. задачи синтеза алгоритмов управ чения, обеспечивающих асимптотиче- скую устойчивость программных траекторий. Построение каркаса программной траектории. В об- щем случае решение обратной кинематической задачи для многозвенных манипуляторов сводится к решению системы нелинейных уравнений (1.25), которые могут быть представлены в виде F(q)=S. (3.1) где q — вектор обобщенных координат, определяющих конфигурацию манипулятора; S — [$i.... $в]т— вектор, определяющий положение и ориентацию захватного уст- ройства в пространстве. Как правило, решение этой задачи не является однознач- ным, т. е. каждому состоянию захватного устройства от- вечает некоторое множество конфигураций G = {qj, q,eQ. Тогда заданной последовательности {$(*)} k = 1....М состояний захватного устройства в рабочем пространстве будет соответствовать последовательность {G*}, Л=1, .... М множеств допустимых конфигураций манипулятора, такая, что G*={q(*):S(*) = F(q(*J)}, /eg*. где gt — множество индексов / допустимых конфигура- ций q (Л) в Л-й узловой точке траектории. Таким образом, возникающая возможность выбора конфигураций манипулятора в узловых точках траектории обусловливает необходимость решения задачи построения каркаса программной траектории, оптимального в некото- ром смысле (т. е. задачиопределения оптимальной траекто- рии захватного устройства манипулятора в пространстве обобщенных координат). Обобщенный критерий качества для программной траектории, рассматриваемой как по- следовательность переходов из одной узловой конфнгу рации в другую, может быть представлен следующим образом: 69
K = ч(Л+1), q(*+s)]-.min, (3 2) где q(*)eG*, k= 1...M, При s= 1 целевая функция А представляет собой сумму потерь г» на участках между двумя последовательными состояниями: * —М-1 К = v Г, m(fe). (3 3) где/eg*, meg*+,. rim = r*[q(Л). q (*+!)]. Л = 1.M. Так, при минимизации общего времени в качестве меры расстояния г m(k) в выражении (3.3) может быть принята следующая величина: т (Л) = тах Af|q<X*)-M*+,)l где v, та, — максимальное значение скорости i-ro привода. Узловые конфигурации, соответствующие минимуму це- левой функции К (см. (3.2) J, могут быть иайдеиы методом динамического программирования из рек>рреитных соот- ношений: A'[q(*). q(*+s-i)]= min {<*(ч(*). q(*+*)]+ +A'*n[q(*+D, • q(*+*)]}. где k = M—s, M — s — 1, Задача построения оптимального каркаса програм- мной траектории по критерию (3.3), графическая интер- претация которой приведена на рис. 3.7, сводится к задаче отыскания иа графе допустимых конфнг) раций пути ми- нимальной в некотором смысле длины с началом в верши- не (1, т) (так как начальная конфигурация является, как правило, заданной). Обозначив через K(k, /) длину минимального пути от q;(l) в q (А), можно записать соотношение с граничным условием Л'(1, /) = 0: A(*+l,m)=mm(r; (Л) + А(Л./)]. Л—1, М-1 (3.4) В результате решения уравнения (3 4) получим значения функции Л(А+1, т), m^gk, fc=l ., М—1 и массив {u(k + I, m)}, элементы которого представляют собой иоме- 70
Рис 3 7 Граф допустимых конфигураций ра вершин, принадлежащих минимальному пути в верши- ну (А +1, т). Длина кратчайшего пути Л'(М) и индекс соот- ветствующей ему конечной вершины определяются из усло- вия Л'(Л1) = К(М, ЦМ)) = min К(М, /). Последовательное использование соотношения /(А) = «(*+!, /(*4-1)], k = M—l...2 позволяет провести отыскание номеров промежуточных вершин Решение задачи построения оптимального каркаса, являющейся предварительным этапом построения про- граммной траектории, осуществляется, как правило, на заключительной стадии планирования траекторий мани- пулятора, состоящей в построении в выборе оптимального пути на графе планов, описывающего структуру рабочей зоны. 71
Построение программных траекторий. Задача построе- ния программных траекторий заключается в построении закона изменения во времени вектора обобщенных коор- динат q = [q. , qjv] (т е вектор-фуикции q(/) = = (91(0 • . 9'0)) /г], обеспечивающей заданное пространственное перемещение захватного устройства ма иипулятора. Для решения этой задачи может быть исполь- зован ряд методов, одним из которых является метод построения программной траектории по ее дискретному приближению (или так называемому каркасу программной траектории), представленному последовательностью точек q\ q , qB пространстве обобщенных координат Диск- ретное приближение программной траектории можно полу чить как решение обратной кинематической задачи, на пример, методом возможных направлении. Алгоритм формирования программной траектории по дискретному множеству значений ее обобщенных коорди- нат предполагает решение двух задач задачи определения продолжительности интервала Т управления и его раз- биения иа необходимое число отрезков А/*, а также задачи интерполяции программной траектории, т. е задачи опре деления управления для любого текущего момента вре- мени Зная динамические характеристики приводов первое приближение для узлов интерполяции можно определить из соотношения /«+1 =/*+max (|q*+l —q*| v m x). k=0, I , M | tM = tT, 1(3 5) где v m„ = q m„ — максимальная допустимая скорость еле жения t-го привода Для интервала управления очевидно, будет справедли во выражение Г-ГГ-ГО = У |Д/ |, (3 6) где А/ [/ 1 t ] время отработки участка програм мной траектории от точки q*~l до точки q* Задачу интерполяции программной траектории можи решить иа о нове ее приближения с помощью сплайнов Сплайном S (q, /) порядка m называется функция являю щаяся многочленом степени m на каждом из отрезков А/*: 72
Sm(q, t) = Pm *(t) = 2 a J. U-t (3.7) удовлетворяющая условиям непрерывности и непрерыв- ности производных до (л—1)-го порядка в точках раз- биения tt, Л = 1..М— I: РЙ*(М = ^’*+.а*). *=1. . М-1: 1=0, , т-1. (3.8) Таким образом, выражение (3.7) включает в себя Л1(т-|-1) неизвестных at, а соотношения непрерывно- сти (3.8) образуют систему из (М — 1)т уравнений. Нало- жение дополнительных условий иа свойства программной траектории позволяет получить недостающее число уравне- ний Простейшей функцией, удовлетворяющей условиям не- прерывности (3.8), может быть линейный сплайн: S'(qj) = plk(t)= £a*t В этом случае общее число неизвестных равно 2М. а число условий непрерывности — (М — 1) Наложение требования совпадения значений сплайнов с в точ- их /», Л = 0, . М позволяет получить недостающие (* + I) условий: Р|.П.) = Ч Р1*(/*) = <7*. *=1, . М. При этом сплайн первого порядка может быть представ- . ей в следующем виде (рис. 3.8, а): q(t) a0* + «i»f. Л=1, М, (3.9) г. ’ «о* <7* 1—ai* = (.* — ?*~')/(/*— /*-i) в) 7J
Программную траекторию такого же вида можно по лучить в результате решения вариационной задачи по отыс- канию непрерывной функции q(t) с кусочно-непрерывной производной, проходящей через заданные точки ^(/*) = Я . 6 = 0, 1. .. М и минимизирующей ф)нкционал: (3.10) Функция ^(/) является линейной иа каждом участке, так как уравнение Эйлера для функционала (3.10) имеет вид: q(f) = O. Реализация построенной программной траектории не обеспечивает требуемого качества управления, поэтому целесообразно использование сплайнов более высоких (в частности, третьего) порядков (рис. 3.8, б). С этой целью задачу определения управляющего сигнала можно поста- вить как вариационную задачу отыскания функции <?(/) с непрерывной первой производной, удовлетворяющей усло- виям 9(/*) = qk, k = 0, 1.М и минимизирующей функцио- нал среднего квадрата ускорений функции на траектории: h-ty&ttfdt. (3 11) Для функционала (3.11) уравнение Эйлера имеет вид: ?п(/) = 0, а программная траектория определяется выра- жением q(t)= />з*(О = ао* + а1* + а2*/84-аз*/3, (3.12) В этом случае число неизвестных параметров а(*. оче- видно, равно 4М, а число условий составляет (ЗМ — 1): — 2М устовий непрерывности и приближения* Рз*(М = /’з*+1(/*). 6=1, ... М-1: 1 „ > (3 13) Рз1(М = <7°. = Л-1, • М; ] — (М — I) условий непрерывности первой производной: Аз*(М = Аз. »+.(/*), 6 = 1, . , М-1. (3.14) Условия непрерывности ускорений Рз*(Л) = Рз. *+ .(/»). k = I. М - 1 (3 15) 74
и требуемые граничные условия вытекают из необходи- мого условия минимума функционала (3.11). При отсут- ствии дополнительных ограничений иа концах траектории граничные условия имеют вид /М/о) = М'м) = О (3 16) Состояние покоя в начальной и конечной точках траек- тории как условие, выбираемое из практических сообра- жении, накладывает ограничения на соответствующие скорости: А (/о)=А,м(/м) = О. (3 17) Однако одновременное выполнение условий (3.16) и (3.17) невозможно при использовании сплайнов только третьего порядка. Для решения задачи с ограничениями вида (3.17) в качестве приближений начального и конеч- ного участков траектории могут быть использованы много- члены, например, пятого порядка (с целью компенсации возникающих ненулевых ускорений): Р51(/)= Pi3(/)-|-Ci(/-/o)2(/i-/)7(/i-ro)3; 1 (3.18) Р5 „(О- Рлй(О+М' м- 02(/~ 1м-.)7(/м- 1м -. )3. ] где с, = —P3t(to)/2; см = — Рзм(/м)/2. Функции вида (3.18) обеспечивают выполнение ограни- чений (3.16) без нарушения условий (3.13), (3.14), (3.15). Параметры сплайнов P^t), k = l.....М определяются из условий (3.13), (3.14), (3.15) и (3.17). Сплайны третьего порядка Рз*(0 на участке [/* /*] можно представить следующим образом: /МО = 4- о*AL-^-i)3 _|_ (3.19) где hk = tk — G-i. Л = 1. . М. Очевидно, что сплайн (3.19) удовлетворяет ограниче- ниям (3.13) и (3.15). При любых значениях D» его вторые производные непрерывны и изменяются по кусочно-линей- ному закону:
Условия непрерывности первой производной (3 14) позволяют получить следующие уравнения: D*_, 4- 1 = ht k=\...M-l. Граничные условия для скоростей (3.17) позволяют получить недостающие уравнения для определения вели- чин Do.. Dm: где Х.о = цм= Г do = б^'-^/Л?; d„ = 6(<7М '-q*)/hb, Н* = й*/(й*-|-й*+1); X» = 1—iu; dk = 6[(</+* -9*)/й*+1 -(^-^-*)/й»]/(й»+14-й*); й = 1...М-1. После определения величин D* сплайн S\q, t) = Pu(0 можно вычислить в соответствии с выражением (3.19). После вычисления сплайн-фуикций управляющих сигна- лов приводов для каждой системы подвижности, как правило, проверяется правильность установления интер- вала продолжительности управления и его разбиения на отрезки Д/*. Для этого подсчитывается максимальная скорость и ускорение каждой функции на каждом от- резке. Если скорость или ускорение функции на каком- либо отрезке времени превышает допустимое значение, то длина отрезка соответственно увеличивается. Затем процедура вычисления сплайн-фуикнии повторяется для нового интервала управления. 76
Стабилизация программных траекторий. Одним из методов преодоления недостатков управления манипуля- тором по значениям программной траектории q,(f) явля- ется управление по принципу обратной связи Рассмотрим задачу стабилизации программной тра- ектории, представляющую собой задачу синтеза алгорит- ма управления, обеспечивающего асимптотическую ус- тойчивость программной траектории чД/). /г] для манипуляторов, уравнения динамики которых описыва- ются системой (1.64) Учитывая малость коэффициента Do при второй про- изводной момента, развиваемого приводом, второе урав- нение можно представить в упрощенном виде: v - D(ii 4- D2u 4- DiM/q, q, g). (321) Используя обратную связь по q, q и и, определим закон управления приводами в следующей форме: < Dni4-D2(A'(q. r)[q₽4-r1(q-qp)4-ro(q-qp)4- 4-B'(q, 4, r)}4-D3M4q. q. О. (3 22) где q программная траектория, r0=diag(y|0,..., уЛ0), ri = diag(Y|1, ., yjvi) — диагональные матрицы раз- мерности JVXJV; i= I. N, 1 = 0, 1; 5' — оценка вектора { параметров манипулятора и перемещаемого груза; в условиях полной информированности £' = £ С учетом уравнений динамики (1.64), в которых уравнение приводов имеет вид (3.21), и уравнения, опи- сывающего закон управления (3.22), уравнение замкну- той системы «манипулятор — приводы — алгоритм уп- равления» можно представить следующим образом: D2A'(q, I )[Д(/)— Г,А(0 — ГоЛ(О] = 0, (3.23) где A(f) = q(O q(Q — вектор динамической ошибки. Так как|О2|=#=0 |А'|=#=0, то уравнение (3.23) может быть сведено к уравнению ^0-Г,4(П-ГоД/=0 (3.24) или для рассогласования по i-й обобщенной координате Д,(0-у„АО)-Т„А(/)=О. <=1.. .N. (3.25) В явной форме решения уравнения (3.25) имеют вид соответственно: Д( )=г,е’ -гСье* , (3 26)
Д(/)=с1.ех'+с^е* , (3 271 если характеристическое уравнение X-’ —у.|Х-уго=О (3 281 имеет простые корни Х„, )>, и кратный корень Хг„. Анализ решения показывает, что при отрицательных значениях y,i. у,о корни уравнения (3.28) имеют также отрицательные значения. Постоянные ct, и с2, в равенствах (3.26) и (3.27) определяются по начальным данным Л(/о). А (/о). Таким образом, закон управления (3.22) обеспечивает асимптотическую устойчивость программных траектории q£t) при любых начальных возмущениях Д(/о). Л(/о); при этом убывание динамических ошибок A(Z), i=l, , N. происходит по экспоненциальному закону: — в случае простых корней характеристического уравнения (3.28) Щ/)1<£»еЧ где К—maxCXi,, Х2,); — в случае кратных корней lAXOKtufe^, где Llt. L>, — постоянные, зависящие от начальных условий ДХ/о), A,(to) и параметров закона управления (3.22). Однако стабилизацию программных траекторий с по- мощью подобных законов управления можно обеспечить при наличии полной информации о массово-ииерциоиных параметрах манипулятора, груза и характеристиках приводов. Оптимальная стабилизация программных траекторий. Параметры алгоритмов управления Г Г существенно влияют на качество переходных процессов и на характер убывания вектора динамической ошибки Д(/). Рассмот- рим метод оптимизации этих параметров алгоритма управления. Пусть q//). /е[/0, /г] — заданная программ- ная траектория, Г = 6 Будем считать, что управление движением манипулятора непосредственно осуществляет- ся развиваемыми приводами моментами или усилиями (v=u М ). В этом случае уравнение.Лагранжа (1.45) с начальными условиями q(/o)=q°. q(/o) = qu является математической моделью манипулятора:
A(q 6)q+B(q.<i. £)=F M M. Уравнение (1 45) можно привести к нормальному виду y = f(y. u. М) (3 29) «де f=(fb f2)r=(q. А 1 (q, g)[F— B(q, q, g)]) вектор- функция размера 2N; y=(q, q) — вектор фазовых координат; u = Mn — вектор управлений. При этом начальные условия запишутся следующим образом: У(М=У =(q°, q°) (3 30) Введем обозначения: Лу=у — ур; Ли = и —и,. (331) где yp=(qp, q)’— вектор программных значений фазовых координат; uP=A(qp, g)qP+B(qp. qp, g) вектор прог- раммных моментов (усилий). Сделав замену переменных в (3.29) с учетом (3.31), получим уравнение в отклонениях от программной траек- тории: (Ay)=g(Ay, Au, М.), (3.32) 1де g(Xy, Ли, М.) =f(yP4-Ay, ир-|-Ли, Мв) -f(yp, и , М.). Так как g(0, 0, 0)=0, то Лу=0 при \и=0, М.=0, т. е. при осуществлении программного управления ир и отсутствии внешних возмущающих воздействий М. реа- лизуется программное движение ур. При этом начальные условия примут вид Ду(/о)=Ду° = у,-уХ де Ур=Ур(/о) — начальное программное значение век- тора фазовых координат. Таким образом, для оптимальной стабилизации дви- жения необходимо задать критерий оптимальности в функции параметров отклонений Лу. Лу, Ли и М. и огра- ничения. В качестве критериев оптимальности могут быть при- няты различные функционалы вида J= $Q(Ay. Ху, Ли. М \dt, где Q - функция, отражающая показатель качества; ХуеЛУ — ограничения на фазовые координаты, соот- 79
ветствующие неравенствам, задающим конструктивные ограничения на обобщенные координаты н обобщенные скорости, а также определяющим отсутствие столкнове- ний с препятствиями и самопересечений манипулятора; Xu^XU. Наиболее распространенные ограничения на управле- ния имеют следующий вид: |Ли-|-Up| = |ulCu (3 33) Таким образом, задача оптимальной стабилизации кратко может быть представлена как extr|/= $ Q(Ay, Au, M,)d//Ay=g(Ay. Au, Af.), Лу(/0)=Лу? ДуеДУ AueAt } Наиболее удобный подход к решению этой задачи, осуществление которого возможно в реальном масштабе времени, заключается в поиске оптимального управления в определенном классе алгоритмов управления заданной структуры, сводящемся к поиску параметров алгоритма управления. Рассмотрим стабилизирующие алгоритмы управления следующего вида: u = A(q, rMqp+Rq-qp)+r0(q-qP)]+B(q, q, 5 ). (3.34) Для простоты примем М.=0. Подстановка выраже- ния (3.34) в уравнение Лагранжа (1.45) дает линейное, стационарное уравнение движения манипулятора относи- тельно вектора динамической ошибки А(/): а-г.А-г \=о иди (3.35) Ау = ГАу, где г ] матрица параметров. Решение уравнения (3.35) можно представить сле- дующим образом: Ау = АуеГ('- (3 36) Если ограничения на фазовые переменные заведомо выполняются, то при решении задачи на экстремум в 80
выражение критерия оптимальности необходимо подста- вить уравнение (3 36) и решить задачу оптимизации при ограничениях иа управление (3.33). В итоге получим задачу нелинейного программирования, заключающуюся в минимизации функционала /(Г) по Г при ограничениях Ли^ЛО, результатом решения которой являются опти- мальные значения параметров Го н Г| в законе управ- ления. Устройства позиционно-контурного программного уп- равления. Применение устройств познционно-контурного управления значительно расширяет технологические воз- можности роботов и практически исключает ограничения, связанные с числом точек позиционирования захватного устройства манипулятора. Приведем обобщенные технические характеристики систем управления, относящихся к данному классу: число управляющих координат — 3—8; объем памяти программ (кадров) — 100—1500; число технологических команд обмена информацией с внешним оборудова- нием — 15—128; тип привода — следящий или дискрет- ный, тип используемых датчиков — аналоговые, кодо- вые, фазовые, датчики положения По способу обработки поступающей от робота гео- метрической информации (поспедовательная или парал- лельная обработка координатных перемещений) системы управления позиционио-контурного типа разделяются на системы с центральным вычислителем и системы с де- централизованной структурой, когда вычислитечь входит в состав каждого «коордннатиоп» блока. Как правило, построение по децентрализованной структуре характерно для систем целевого назначения, особенно с цифроана- логовым способом обработки геометрической информации и ограниченными функциональными возможностями. Реализация систем управления по структуре с цент- ральным вычислителем позволяет существенно повысить информационно-вычислительные возможности системы. Общая структура систем позиционно-контурного управления представлена на рис. 3 9 (в позиционном режиме интегратор не используется). В качестве примера систем с централизованной структурой рассмотрим унифицированное устройство по- зиционного числового программного управления типа УПМ-772 (рис. 3.10), предназначенное для управления роботами со следящими приводами замкнутого типа. Оно построено по принципу синхронного микропрограмм- 81
Общая а • . । ihuiioiiho контурного ного автомата (МПА) с конечным числом состояний и жестким циклом управления, который предназначен для формирования управляющих микрокоманд в соответ- ствии с алгоритмом управления устройством. Реализация функций центрального управления и логической обра- ботки информации осуществляется операционно-логиче- ским блоком. Обмен информацией между функциональ- ными блоками устройства выполняется через шины А, В и С. В качестве программоносителя в устройстве исполь- зуется кассетный накопитель на магнитной ленте 82
Сигналы син- Отдатчиков На технологическое хрониэации робота оборудование Рис 3.10 Структурная схема унифицированного управляющего >г<ройства числового программного управления УПМ-772 (КНМЛ), осуществляющий прием, хранение и выдачу требуемой программы по запросу из МПА. Буферное запоминающее устройство полупроводнико- вого типа предназначено для оперативного хранения рабочей программы. Формирование последовательностей импульсов, син- хронизирующих функционирование устройства, выдержек времени, а также частот, необходимых для работы изме- рительной системы, осуществляется блоком синхрониза- ции. Блок измерения обеспечивает цифровое измерение положений манипулятора и содержит канальные преоб- разователи сигнала датчиков в сдвиги фаз и преобразо- ватели типа «фаза — код>. В качестве блока управления приводом в системе УПМ-772 используется функциональный цифроаналого- вый преобразователь с элементами запоминания выход- ных напряжений, поступающих на привод. Управление скоростью движения манипулятора при работе устрой- ства по программе осуществляется путем изменения кода информации, поступающей иа вход блока Пульт S3
Обмен информа- От датчиков На привод циеи с роботом и робота робота технологическим Рис 3 11 Структурная схема микропроцессорного устройства пози- ционно-контурного управления УКМ 772 управления предназначен для задания режимов работы, организации ручного ввода информации и ее цифровой индикации. Рассмотренная система управления построена по жесткому циклу, при котором логическая взаимосвязь основных модулей оборудования и алгоритм управления реализованы преимущественно аппаратным способом. Использование микроЭВМ и БИС в структуре пози- ционно-контурных систем управления обеспечивают воз- можность программирования алгоритмов управления путем изменения состава программного обеспечения. На рис. 3.11 приведена структурная схема микро- процессорной позиционно-контурной системы управления УКМ-772, предназначенной для управления роботом со следящими приводами в которой в качестве централь- ного вычистителя, подключенного к периферийным функ- циональным модулям через систему унифицированных шин связи по стандартному каналу, используется микро- 84
ЭВМ «Электроиика-60». В качестве внешнего программо- носителя используется КНМЛ, взаимодействие которого обеспечивается через модуль управления КНМЛ. Хране- ние программного обеспечения системы отдельных стан- дартных подпрограмм управляющей программы и т. д. осуществляется модулем постоянного запоминающего устройства Модуль оперативной памяти предназначен для хранения управляющей программы, результатов про- межуточных вычислений и т. д. Формирование синхрони- зирующих сигналов и временных выдержек осуществля- ется модулем таймера. Функциональное назначение модулей управления при- водом, сопряжение с датчиками положения, ввода и вывода технологических команд остается прежним, изме- няется только организация внутренней связи с вычисли- телем. Обмен адресной, числовой н управляющей информа- цией с периферийными модулями производится по каналу микроЭВМ. Программное обеспечение системы построено по мо- дульному принципу. Его программные средства обеспе- чивают осуществление требуемых функций управления как в позиционном, так и в контурном режимах 3.4. Адаптивные системы управления Задача построения адаптивного управления роботом обычно включает в себя три важных раздела: создание сенсорных устройств, обработка информации с сенсорных датчиков и синтез адаптивных законов управления. Сенсорные устройства Чувствительные датчики ин- формации выполняют роль технических органов чувств робота н необходимы для успешного решения двух глав- ных задач: повышения точности работы робота; обеспечения автономности функционирования ро- бота в различных изменяющихся условиях Чтобы решить эти главные задачи, необходимо при- дать роботу ощущения двух типов: — во-первых, робот должен чувствовать «себя>, т. е. с помощью датчиков фиксировать результаты своих движений и оценивать их правильность; — во-вторых, робот должен чувствовать окружаю- щую обстановку, т. е. соотносить свое расположение и 85
свои перемещения с расположением внешних для него предметов и их движениями. Ощущение роботом «себя> создают с помощью дат- чиков, измеряющих положения отдельных звеньев робо- та, скорости перемещения по каждой степени подвижно- сти, ускорения либо торможения звеньев. Информация об окружающем пространстве создается с помощью приборов, регистрирующих геометрические, физические или химические свойства окружающей среды. С позиций адаптивного управления роботами наи- больший интерес представляют приборы, снабжающие робот информацией от внешнего по отношению к нем мира. Сенсоры геометрических свойств вы- полняют ряд функций: — ограничивают движения звеньев робота в резуль- тате соприкосновений или контактов робота с предметами во внешней среде (тактильные датчики в виде концевых выключателей или пьезоэлемеитов); — определяют расстояние до окружающих предметов или размеры и ориентацию предметов путем локационных измерений (оптические, ультразвуковые, радиотехниче- ские, телевизионные системы технического зрения и ло- кации). Сенсоры физических свойств выполняют функции: — измерения усилий и моментов; — измерения плотности и давления жидких, твердых, газообразных веществ; измерения температуры; определения цвета и запаха Сенсоры химических свойств определя- ют химический состав веществ с помощью анализаторов типовых химических реакций. Наиболее распространенными в робототехнике стали разнообразные устройства технического зрения, тактиль- ные и силомоментные датчики. С их помощью удается эффективно решать задачи адаптивного управления ро- ботами. Однако сенсоры обеспечивают только исходные данные в виде токов, напряжений, чисеп и т. п. Исполь- зовать эти данные для синтеза закона управления можно только после обработки сенсорной информации. Обработка информации в сенсорных системах. Рас- смотрим общую структчру вндеоанализа в робототехни- ке. К тарифицируем элементы стр\ктуры с точки зрения 86
этапов видеоанализа, способов распознавания и типов математических процедур. Решение видеосенсориых задач связано с возможно- стями вычислительных устройств робототехнических си- стем по восприятию информации в естественной фор- ме — в виде изображения рабочего пространства, изде- лии, чертежей и т. д. Восприятие видеоинформации в естественной форме требует анализа изображения с помощью ЭВМ. Цель видеоанализа — получение сжатого описания изображения. Требуемое описание должно быть инва- риантно в заданном отношении и должно отвечать на поставленные вопросы относительно изображенных объектов: количественные, качественные и геометриче- ские свойства, логические выводы и т. д Решение задач видеоанализа включает в себя пред- варительную обработку и построение интерпретации опи- сания (обучение, представление образа, распознавание). На этапе предварительной обработки реализуются различные формы фильтрации При этом исходное изображение, содержащее, например, N2 точек, преобразуется в новое с таким же числом точек. На этапе построения и интерпретации описания выделяется существенная информация, что резко снижает объем данных. Далее рассматриваются типовые математические про- цедуры, методы распознавания и некоторые вопросы синтеза адаптивных законов управления. Типовые математические процедуры. В видеоаиализе можно выделить два класса типовых математических процедур — локальные и нелокальные арифметико-логи- ческие процедуры (АЛП). Локальные А1П. Локальные АЛП применяются в основном на этапе предварительной обработки В общем случае локальные АЛП имеют вид Р' />—. n=IJV; m = ГМ, (3.37) где р'пт, р',т1 — элементы матрицы изображения форма- том NXM точек в моменты t и /4-1; / — арифметико- логическая функция локальной окрестности IV’; W — ло- кальная окрестност) точки изображения с координатами (и. т). Рассмотрим выражение (3.37). В результате примене- ния функции f к локальной окрестности всех точек исход- 87
иая матрица изображения Р«хм преобразуется в новую Р х'.м. Последовательность применения функции f опреде- ляется траекторией сканирования, проходимой центром локального окна. В частности, окно может быть единиц иым, т. е. сводится к одной центральной точке. Приме няются три типа сканирования: линейное, полярное, произвольное. При линейном сканировании окно последовательно проходит строчку за строчкой. При полярном сканировании окно последовательно проходит по системе концентрических окружностей, опи- санных вокруг некоторой заданной точки, например вокруг центра тяжести объекта. При произвольном сканировании траектория адапти- руется к виду изображенного объекта. Например, траек- торией сканирования может служить контур или его цепной код. Рассмотрим несколько примеров. Определим локальную свертку матрицы изображения с весовой функцией IV',,, заданной девятью коэффициен- тами, образующими окно форматом 3X3: л=1, Л'; ш=1,Л). (3 38) Локальная свертка применяется для предварительной обработки многоградационных изображений. В резуль- тате соответствующего выбора весового окна W4, i, /=1, 3 можно производить подавление помех, сглаживание, оконтуривание и другие операции препарирования изоб- ражений. Рассмотрим локальные АЛП, используемые для пред- варительной обработки бинарных изображений, т. е. в стучае, когда величина рпт принимает только два зна- чения: 1 при S т+/>2; О — в противоположном случае; (3 39) (1 при S Р*пЛ т+1<А\ (чн* (3.40) 0 — в противоположном случае. Выражения (3 39) и (3.40) определяют соответ- ственно сглаживающим и оконтуривающий фипьтры 88
Локальная область имеет в данном случае кресто- образную форму: Ц7= (0,-l)f(0.'b))(0, 1)1. (341) (1.0) Часто фильтрация проводится итеративно. Число ите- раций и тип фильтра, используемого при каждой итерации, зависят от конкретной задачи. Так, при окон- туривании над изображением сначала выполняется преобразование (3 39), позволяющее устранить изоли- рованные помехи и сгладить форму объекта, а затем — преобразование (3.40), реализующее собственно оконту- ривание. Данная последовательность аналогична про- пусканию сигнала через интегрирующее и дифферен- цирующее звенья Определим последовательность операций сжатия расширения, которые используются для разделения слип- шихся или частично перекрывающихся объектов иа изображении: • при 2 Р'о- Р™ 0 — в противоположном случае; 1 при p'„+i «,+/>!; (3 42) (3.43) 0 — в противоположном случае, изображения с помощью градиентных Фильтрация г___________ _ _________ .г________ локальных АЛП дает поле градиентов изображения G, Примером такой процедуры является система Dm — Pn. m+l — Р —I, Dn — Pn—I G„m=arctg(D„/Dni). '";|(3 44) Итеративная обработка изображения в соответствии с полями градиентов позволяет выделять осевые линии отдельных объектов изображения (алгоритм фронтов столкновения). Нелокальные АЛП. Нелокальные АЛП приме- няются в основном на этапе построения описаний В об- щем случае данные процедуры имеют вид !/ = ЯРлт](л «• где f арифметико-логическая функция, определенная иа множестве траекторий сканирования; рпт — элемент «9
матрицы изображения; S — множество точек изображе- ния, входящих в траектории линейного, полярного или произвольного сканирования. Простейшим примером нелокальной АЛП служит алгоритм вычисления координат центра тяжести (пи та ,) объекта на изображении форматом NXM: ИМ N М П«т = V У прпт 2 S Pnm. (з.45) ти v У трЯЯ)/2 v Рпт_ Естественной формой сканирования в данной про- цедуре является линейная. Важный подкласс нелокальных АЛП составляют линейные конечномерные преобразования: У = КЛР. (3 46) где Rs - линейный оператор при системе сканирова- ния 5; Р матрица изображения Методы распознавания. Для распознавания в видео- анализе используются две основные группы методов: интегральные и структурные (в том числе структурно- лингвистические) . Интегральные методы Интегральные мето- ды сводят задачу распознавания к анализу вектора интегральных признаков. С помощью нелокальных АЛП различного типа строятся интегральные признаки В качестве примера рассмотрим линейное распозна ванне X Рп kt=K. i=TT I 3 где {p'nm} изображение /-го объекта, /(fe) fe-й интег- ральный признак /-го объекта; К множество исполь- зуемых отсчетов линейного преобразования /?ЧЯ1(Л); / — множество распознаваемых объектов; S - траектория сканирования. Каждому объекту ставится в соответствие по одному (IAI —1) или нескольку (|К >1) чисел. Применяя к неизвестному входному объекту одно и то о выбранное на этапе обучения преобразование R, («,. получаем вектор /={/(*), k^K}. 90
Распознавание типа i объекта производится в соот- ветствии с минимумом критерия близости: /:[/ —f'] = min[f — f] Процедура обучения (построение распознающего опе- ратора) может строиться иа основе решения как прямой, так и обратной задачи. В случае прямой задачи задается распознаю- щий оператор. Обучение сводится к выбору размерности вектора f (величины IК) и множества К. Выбор произ- водится таким образом, чтобы векторные точки f, i=\,l отстояли в l/G-мериом пространстве возможно дальше одна от другой. Полная автоматизация этой процедуры является до- статочно сложной задачей, решаемой интерактивно. В случае обратной задачи задаются значе- ния векторов признаков f. i=\,l. Обучение сводится к отысканию весовых коэффициентов, таких, что S pfnmRnm=f‘. In Обычно число уравнении / иа порядки меньше числа неизвестных Rnm, (л, m)eS Поэтому необходимо исполь- зовать те или иные критерии для выбора единственного решения. В частности, от выбора критерия зависит по- мехоустойчивость распознавания. Экспериментальные результаты показывают, что использование критерия Че- бышева обеспечивает большую степень помехоустойчиво- сти, чем применение среднеквадратичных критериев Это можно объяснить следующим образом. Влияние помехи £л>п на величину признака f в каждой отдельной точке (п, т) изображения тем меньше, чем меньше величина Rnm. Чебышевские решения R'nm находятся в соответствии с критерием II х/?„т-»-П11П Для иих величина maxR'„'i, обычно меньше чем вели- чина max Rknm, находимая в соответствии со среднеквад ратичным критерием j v д’ ->П11П В качестве примера алгоритма, дающего квазиопти- мальное чебышевское решение, приведем след.•>».<>«> ите- рационною прош.л\р>: 91
st (n, m)eS; Zj (F.-r 0. If — Z Mt^e; le -nieS v *— f ~ Z Pn, mRnm, (n.n)aS где k — иомер итерации; e — допуск. Данный подход позволяет распознавать объекты произвольного вида Однако при линейной системе ска- нирования этот алгоритм не является простраиствеиио- инвариаитиым. Рассмотрим пример простраиственно- иивариаитиого алгоритма, в котором признаки образо- ваны следующим нелокальным линейным преобразова- нием при полярной системе сканирования: .v-i ____ А*. *= I Z P"(i'.»)."(i' т)е N I. Р=1.Я, где k - заданная частота; R — некоторое целое числе В качестве линейного распознающего оператора в примере используется оператор одномерного дискретного преобразования Фурье е N В рассматриваемой процедуре для каждого фикси- рованного значения полярного радиуса р = 1,R вычис ляется одни отсчет амплитуды АР > дискретного преобра- зования Фурье, отвечающий заданной частоте k. При выборе центра полярного сканирования в центре тяжести объекта /?-точечиое описание (Л|.», Лг*. .., Л« ) инвариантно относительно линейных и угловых сдвигов объекта в кадре. Структурные методы. На основе учета раз- личных топологических особенностей распознаваемых объектов и систем объектов строятся структурные при- знаки. В качестве простейших структурных признаков используются, например, число углов и отверстий объек- тов, их максимальный диаметр, площадь, периметр, отношение площади к периметру и др Примером структурного подхода служит построение и интерпретация контурного описания Рассмотрим алго- ритм, являющийся эффективным способом построения 92
контурного описания в случае бинарных изобра женин (рис. 3.12). Со гласно этому алгоритму контур определяется по следовательностью прира- щений координат точки (п, т), движущейся по правилу (Дп'+ , Ат' *)= = /(Дп', Ат', где функция f задана табл. 3.3; Р^т - яркость рис. з де Алгоритм описания кои изображения в месте на- тура хождения движущейся точки. Исходя из контурного описания, простраиственно- инвариаитное распознавание может быть реализовано с помощью выражения </. =1^4 е где расстояние от центра тяжести контура до точ- ки s контура; S — число точек в контуре. Более сложные структурные подходы связаны с пред- ставлением объекта в виде совокупности эчементарных. Синтез адаптивных законов управления роботами. Необходимость в адаптивном управлении возникает в 93
результате неопределенности начальных условий и пара- метрических возмущений В уравнении движения манипулятора A(q. 6)q+b(q q, J)=u, (3.47) где A(q J) — матрица n\n параметров манипулятора; b(q. q &) вектор-функция размерности n параметров манипулятора; q q. q — обобщенные координаты; u — управление; £ — параметры уравнения движения, неоп- ределенными являются начальные условия q(M q,(/<>)¥=0; | qUo) q(M¥=O.j где <7/Л>) — начальное значение заданной программной траектории q/t), и параметрические возмущения (3 49) (3 48) где £ оценка параметра £ Метод контурного управления не позволяет освобо- диться от втияния указанных возмущений. При этом управление и формируется с учетом скоростных и пози- ционных обратных связей: u(q. q. t 0 A(q. g>[q 4- Гt(q — qP) + + r,{q qP)] + b(q, q.fc), (3 50) где Г| и Го диагональные матрицы коэффициентов, определяющие устойчивость и качество движения. Выбором матриц Г| и Г из условии устойчивости матрицы где Е единичная матрица, обеспечивается асимптоти- ческая устойчивость движения в замкнутом контуре: A(q, £)q + b(q. q. £)=A(q, £)[qP T(q q )-r + r(q+qP)]+b(q.q.^). (3 52) Однако из-за отличия истинного значения параметра & от его оценки £ возникает динамическая ошибка Д при Д q(H q//) (3.53) Для устранения ошибки \ в «юю-му управлен-’я необходимо ввести юно иште и.нын контур a ianiaumi 94
который обеспечивает настройку алгоритма управления i учетом измеряемых значений возмещении и управле- II •* Управление в этом случае записывается в более удоб- ной для анализа форме: u —G|q, q, q тГ|(д qP) rRq—qP]r (3 54) где G| •] - матрица параметров стабнтизируюшего ал- горитма управления; т вектор-функция, зависящая от оценки неопределенных параметров £ Тогда алгоритм адаптации в общем виде может быть представлен так- т a(t. q, q) (3.55) где а функция оценки В цеюм управ зеине формируется из двух уравнений: u= G|q. q. qP-|-ri(q —qP) 4-Rq qP)]x. I т -«('.q. <i) I ' 7 Определение т производят для интервала движения [/», t ] в соответствии с решением специально вводимых вспомогательных неравенств вида |о(т, t)Kb, о(т. /)su—G(q. q. q)T. (3 57) где малый параметр адаптации На основе рекуррентных конечно-сходящихся алго- ритмов типа !т , если о(т . /) ^.6; а[т*. о(т», /*)], если 1о(т*. /»)!>о. (3 58) где /» первый момент времени нарушения неравен- ства (3 57); [/ . Г] интервал стабилизации; [/ / ] интервал адаптации За конечное число шагов алгоритма (3.58) близость программной и реальной траектории с точностью г обеспечивается после /> t где t время адаптации: iq(/)—q/Oi ' q(0 q</) где S ограниченный диапазон изменения парамет- ров Схема адаптивной стабилизации программного дви- жения представлена на рис. 3.13. В программаторе опре- деляется программная траектория движения, которая вводится в регулятор. Регулятор обеспечивает управляю- 95
Программатор Рис 313 Адаптивная стабилизация программного движения щее воздействие иа вход привода робота. Это воздейст- вие адаптивно корректируется в соответствии с рассмот- ренными алгоритмами в результате формирования вспо- могательных неравенств в эстнматоре и пошаговогс решения их с определением корректирующего значения оценки неопределенных параметров т 3.5. Интеллектные системы управления Необходимость в ннтеллектном управлении роботами возникает из практических требовании повышения точ- ности и автономности функционирования роботов в усло- виях не строго организованной технологической среды Наличие роботов с интеллектным управлением может повлиять иа значительное снижение затрат, расходуемых на подготовку и организацию рабочей среды При этом 96
производство таких роботов должно быть экономически целесообразным. В робототехнике имеется ряд задач, которые необ- ходимо решать с применением методов и теории искус- ственного интеллекта. К таковым относятся, например, задачи перегруппировки предметов внешней сцены, целе- направленного передвижения или навигации Традиционно эти задачи в случае простых роботов решал человек. Однако такой способ решения имеет ряд недостатков, связанных: — со сложностью целеуказания оператором; — удаленностью или автономностью работы робота; — быстрым динамическим изменением состояния среды. Существенным моментом для любого типа интеллект- иого управления является синтез программы, модели- рующей «разумное» поведение робота в изменяющихся условиях внешней сцены. Для встраивания программы моделирования в систему управления необходима разра- ботка специализированных языков программирования искусственного интеллекта. Первым языком программи- рования, примененным в иителлектном управлении робо- тами, был язык математической логики, основанный иа исчислении предикатов первого порядка. Этот язык был использован ученым Стенфордского исследовательского института (США) Н Нильсоном для разработки систе- мы интеллектного управления автономным роботом, на- званной им STRIPS. В дальнейшем для управления ро- ботами были применены и другие языки программиро- вания. В настоящее время во всем мире ведутся интенсив- ные исследования в области языков программирования искусственного интеллекта. Особенно быстрый подъем произошел в связи с подготовкой к созданию ЭВМ 5-го поколения, технический интеллект которых значи- тельно превзойдет по уровню возможности современных ЭВМ. Существует несколько направлений в разработке язы- ков программирования искусственного интеллекта: - обработка символьной информации (чаше всего в форме списков) с преобразованием ансамблей из сложных символьных структур Наиболее типичным пред- ставителем является широко распространенный язык LISP и его диалекты; - обработка логических отношений меж ту объекта- <—1000 97
ми или понятиями Типичным представителем является язык PROLOG. — обработка запросов характерна для объектно- ориентированных языков типа SMALLTALK; — представление знаний в виде фреймовых или сетевых структур. Представителями являются языки KRL; FRL, KL-ONE. Ф. В ЭВМ 5-го поколения предполагается широко ис- пользовать языки LISP и PROLOG. Для этой цели создаются специализированные процессоры, аппаратно реализующие многие функции указанных языков. Такие процессоры имеют иетраднцнонную архитектуру и назы- ваются LISP-машинами и PROLOG-машинами. Язык исчисления предикатов первого порядка для моделирования внешней среды. Основными компонента- ми программы для моделирования задач искусственного интеллекта являются: — исходные данные в форме описаний внешнего мира; — операции или действия над данными (правила продукции или правила вывода); — управление, необходимое для выбора определен- ных правил продукции или прекращения решения по достижению целевого условия Весьма эффективными для управления роботами ока- зались описания внешнего мира на языке исчисления предикатов первого порядка и правила продукции на основе метода резолюции. Любой язык обладает синтаксисом и семан- тикой. При использовании языка исчисления предика- тов первого порядка синтаксис представлен алфави- том символов и допустимыми сочетаниями симво- лов в виде правильно построенных формул (ППФ) (рис. 3.14), а семантика языка определена от ношениями между символами. Алфавит символов состоит из двух типов символов: предикатов (обычно обозначают действия) и термов (символы констант, переменных, функций) Термы обоз- начают объекты действия. Допустимые сочетания символов включают в себя: — атомные формулы, являющиеся композициями из предикатных символов и термов Примеры атомных формул: НА СТОЛЕ; ОПУСТИТЬ: КУБ А. — комбинации атомных формул, получаемые с по- мощью связок: 98
язык Правильно построенные формулы Отношения, приписываемые символам Рис 3 14. Язык исчисления предикатоа Л (и) — объединение или конъюнкция; V (или) — пересечение или дизъюнкция; => (если... то) — следование или импликация. Правильно построенные формулы являются комби- нациями атомных формул, элементы которых имеют свои названия: КОНЪЮНКТ Л конъюнкт ДИЗЪЮНКТ v дизъюнкт АНТЕЦЕДЕНТ *- КОНСЕКВЕНТ Важное значение отводится правилам истинности (Т—true) или ложности (F— false) формул, которые представлены в табл. 3.4. Таблица 3.4 формулы Правило истинности (Г) Правило ложно сти (F) Конъюнкция Конъюнкт (Г) Л конъюнкт (Г) конъюнкция (Г) В противоположном случае — конъюнк- ция (F) Дизъюнкция Дизъюнкт (Г) V дизъюнкт (Г) дизъюнкция (Г) Дизъюнкт (F) V дизъюнкт (Г) дизъюнкция (Г) В противоположном случае — дизъюнк- ция (F) Импликация Антецедент ( ) => консеквеит (Г) импликация (Г) Антецедент (Г) консеквеит ( ) импликация (Т) В противоположном случае — импли- кация (Г) 99
Отрицанием формулы ~ называется изменение зна- чения формулы с истинного Т на ложное F и наобо- рот. Для определения истинности формул по их перемен- ным используется квантификация формул с помощью кванторов: — общности (Vx) - для всех значений перемен- ной х; — существования (Эх) — существует значение пере- менной V, для которого... Квантифицированные переменные называются связан- ными, остальные — свободными В исчислении предика- тов первого порядка не разрешается использовать квантификацию по предикатным или функциональным символам. Правила продукции иа основе принципа ре- золюции используются для вывода новых правильно построенных формул из некоторых множеств исходных ППФ. Принцип резолюции применяется к ППФ класса предложений, представляемых в виде дизъюнкции литералов (дизъюнкция из атомной формулы и ее отрицания). В соответствии с принципом резолюции доказывается несовместность двух множеств — М и ~G, т. е. отыскивается противоречие в выражении {M(J~G}. Следовательно, вывод доказательства иа основе принципа резолюции строится с помощью опроверже- ния. Смысл опровержения заключается в следую- щем. Если целевая ППФ G логически следует из множе- ства ППФ М, то любая подстановка, удовлетворяю- щая М, также удовлетворяет и G. В то же время любая подстановка, удовлетворяющая М, не может удовлетво- рить отрицание ~ G и в конечном счете объединение {MU~G}. Последовательное применение проверки на несовместность объединения М и ~G приводит к пустому предложению, а это является свидетельством логичности вывода G из М. Выявление противоречия дает возможность приме- нить оператор действия для устранения отклонения от целевого условия. Действия оператора на среду отобра- жаются двумя списками — вычеркивании и дополнений При этом дизъюнкты вычеркивании соответствуют лож- ным утверждениям в новой модели, а дизъюнкты допол- нений — южным утверждениям в старой модели, ио истинным в новой. 100
Пример иителлектиой системы управления роботом «Шейки» с моделирующей программой. Робот «Шейки» создан в рамках проекта интегрального робота Стен- фордского исследовательского института (США) в конце 60-х — начале 70-х годов Робот представляет собой мобитьную тележку с манипулятором в форме толкателя. Управтеине роботом осуществляется по радиоканалу от ЭВМ. Средствами очувствления служат телевизионная камера и контактные датчики иа бамперах. Имеется речевое общение с роботом в виде голосовых команд иа упрощенном английском языке. Вся система управления построена по иерархическому принципу. В целом робот включает в себя следующие системы: — манипуляционное устройство воздействия на пред- меты внешнего мира; — колесную платформу передвижения; — систему восприятия зрительной, слуховой, тактиль- ной информации о внешнем мире; — систему целеполагания, планирования и решения задач; — систему общения и коммуникации робота с опера- тором. Уровень планирования движения робота реализован иа основе системы STRIPS. Знания о мире представ- лены в виде набора аксиом исчисления предикатов первого порядка. В качестве системы продукции исполь- зуется метод доказательства теорем с применением принципа резолюции. Задача перемещения кубиков робо- том «Ш е й к и». Описание исходной модели среды Л1о (рис. 3.15) Pm. 3 15. Исходная модель среды Мо 101
Робот — Поз (а) Поз (Куб 1,6) Поз (Куб 2, с) Поз (Куб 3, d) Робот находится в позиции а, кубики — в позициях Ь, с, d Целевое условие задачи: необходимо собрать все ку- бики в одно место. Заметим, что место сборки не названо и робот его может выбрать сам. Формально целевое условие записывается следующим образом: Go: (Зх)[Поз (Куб 1, х) Л Поз (Куб 2, к) Л Поз (Куб Зле)]. Для воздействия на среду можно использовать опе- раторы: — сдвиг (k, т, п) — робот передвигает объект k из позиции т в позицию л; — смещение (т, л) — робот перемещается из пози- ции т в позицию л. Вспомогательными условиями логики являются: — отрицание целевого условия Go: ~Поз(Куб 1, х) \/~Поз (Куб2, х) У~Поз (КубЗ, х); — таблица логических условий для операторов дей- ствия (табл. 3.5). Общая программа решения задачи системой STRIPS представлена иа рис. 3.16. Последовательность решения иа ос- нове принципа резолюции: 1. Рассматривается исходный узел M<{GO). 2. Делается попытка доказать противоречие для {Mi|J~Go} (неудачна, так как иет противоречия). 3. Определяются «различия» с целевым условием: Таблица 35 Оператор Условия применимости Отрицание условия при вычеркиваний дополнений СДВИГ (k, т, л) Поз (ft, m) Л Робот—Поз (т) Поз (Л, m)V ~ Робот—Поз (т) Робот —Поз (т) Поз (Л, т) Робот — Поз Поз (Л. л) СМЕЩЕ- НИЕ (т, л) Робот — Поз ("|) Робот — Поз (т) Робот —Поз (т) Робот — Поз (") 102
I M„ (Go) ~]Исходный узел Рис 3 16. Общая программа решения задачи системой Mo I Поз (Куб 1, Ь) Поз (Куб 2, с) Поз (Куб 3. d) —Go I —Поз (Куб 1. х) -J" v —Поз (Куб 2, х) V —Поз (Куб 3, х)Г -Поз (Куб 2. 6)V—Поз (Куб 3. Ь) -Поз (Куб 2. d)V~ —Поз (Куб 1. d) -Поз (Куб 1. с)\/—Поз (Куб 3, с) 4. Выбирается оператор ОП1 [оператор-кандидат СДВИГ (k, т, и)]: ОП1: СДВИГ (Куб 2, т, Ь), где *=Куб 2, п=Ь. 5. Записывается условие применимости оператора ОГИ (в форме отрицания): ~С,:~Поз (Куб2,т) V ~Робот—Поз(т). 6. Рассматривается производный узел Mo(Gi, Go). 7. Делается попытка доказать противоречие для {AJOU~G|} (неудачна, нет противоречия). юз
8. Определяются «различия» для производного узла: мп ! Поз (Куб 2. с) Робот Поз (и) ~Gi I —Поз (Куб 2, m)”| V —Робот — Поз (т) -РобоЛ- Поз (с) -Поз (Куб 2 в) 9. Выбирается оператор ОП2 [оператор-кандидат СМЕЩЕНИЕ (т, и)]: ОП2:СМЕЩЕНИЕ (т, с); л=с. 10. Записываются условия применимости оператора ОП2: ~бг: ~ Робот— Поз(т) 11. Рассматривается производным узел Mo(G>. G|, Go) 12. Делается попытка доказать противоречие для {M0U~G2}, противоречие выявляется для т—а в виде {Робот—Поз (a) U ~Робот— Поз (а)). 13. Применяется оператор действия ОП2 = СМЕЩЕ- НИЕ (а, с). Список вычеркиваний: Робот — Поз (а). Список дополнений: Робот—Поз (с) 14 В результате действий ОП2 формируется новая модель среды М| с роботом в позиции с: Робот — Поз (с) м Поз (Куб l.ft) ' Поз (Куб 2, с) Поз (Куб 3, d) 15. Рассматривается следующий узел Mi(G|, Go). 16. Делается попытка доказать противоречие для (MiU'~G|). противоречие выявляется при т=с в виде | Робот—Поз(с)и~Робот — Поз(с)| | Поз(Куб 2,с) U~Поз (Куб 2, с) 17^ Применяется оператор действия ОПЗ = СДВИГ Список вычеркиваний: Робот —Поз (с). Поз (Куб 2, с). Список дополнений: Робот—Поз(Ь). Поз (Куб 2, Ь). 104
18. В результате действия ОПЗ формируется новая модель среды М2 с роботом в позиции Ь и кубиком 2 в позиции Ь: Робот —Поз (ft) Поз (Куб l,ft) Поз (Куб 2, ft) Поз (Куб 3,d) 19. Рассматривается следующий узел MzfGo). 20. Делается попытка доказать противоречие для {M2U~Go} (иеудачиа, противоречия нет). 21. Определяются «различия» с целевым условием мг । Поз (Куб з. -Go | -Поз (Куб 3. жij” —Поз (Куб 2. d) \/ — Поз (Куб 1, d) 22. Выбирается оператор ОП4 [оператор-кандидат СМЕЩЕНИЕ (т, л)]: ОП4:СМЕЩЕНИЕ (т, d); n=d. 23. Записывается условие применимости оператора ОП4 (в форме отрицания): ~б3:~Робот—Поз (т). 24. Рассматривается производный узел M2(G3, Go). 25. Делается попытка доказать противоречие для {Л12и~Оз}, противоречие выявляется для т — Ь в виде {Робот—Поз (ft )U~ Робот— Поз(&)} 26. Применяется оператор действия ОП4 = СМЕЩЕ- НИЕ (ft, d). Список вычеркиваний: Робот—Поз (ft). Список дополнений: Робот—Поз (d). 27. В результате действия ОП4 формируется новая модель среды Мз с роботом в позиции d: Робот - Поз (d) м . Поз (Куб 1, ft) 3 Поз (Куб 2. ft) Поз (Куб 3, d) 28 Рассматривается следующий узел М (Go) 105
29. Делается попытка доказать противоречие для {M3U~Go} (неудачна, противоречия иет) 30. Определяются «различия» с целевым условием Мэ ! Поз (Куб 3. d) -Go । -Поз (КубЗ, х) -Поз (Куб 2. d) V ~ Поз (Куб 1. d) 31. Выбирается оператор ОП5 [оператор-кандидат СДВИГ (k, т, и)]: ОП5:СДВИГ(Куб 3, т, b); *=КубЗ; п=Ь. 32. Записываются условия применимости операто- ра ОП5: ~С<:~Поз (КубЗ, m) V~Po6ot—Поз (т). 33. Рассматривается производный узел Af3(Gt, Go). 34. Делается попытка доказать противоречие для {M3U~G4}, противоречие выявляется для m=d в виде | Поз (КубЗ, б/)1)~Поз (КубЗ, d) | [Робот—Поз (d)U~ Робот—Поз (d) j' 35. Применяется оператор действия ОП5 = СДВИГ (КубЗ, d, Ь). Список вычеркиваний: Робот—Поз (d). Поз (КубЗ, d). Список дополнений: Робот — Поз (ft). Поз (КубЗ, ft). 36. В результате действия ОП5 формируется новая модель среды М< с роботом и кубиками в позиции ft: Робот — Поз (ft) Поз (Куб l,ft) ъ Поз (Куб 2, ft) Поз (Куб 3, ft) 37. Рассматривается следующий узел: M(G0). 38 Делается попытка доказать противоречие для {М<и~Со} (выявляется окончательно пустое предложе- ние, т. е. задача решена и целевое условие удовлетво- рено) . 39. Проверяется список целевых условий (Go — по- следняя в списке цель). 40. Выводится заключение об успешном решении 106
3.6. Управление шагающими роботами Наиболее важным классом робототехнических средств являются шагающие роботы, представляющие собой сложную управляемую механическую систему с большим числом степеней свободы и разветвленной сенсорной сис- темой. Интерес к созданию шагающих роботов обуслов- лен рядом их преимуществ по сравнению с колесными и гусеничными аппаратами. Наиболее существенным из иих является широкая возможность адаптации к рельефу местности, что обеспечивает повышенную проходимость и высокую комфортабельность при движении по сильно пересеченной местности. Кроме того, шагающий робот существенно меньше повреждает почвенный покров. Эти качества определяются: — дискретностью колеи шагающего робота; — большим числом степеней свободы конечностей, активная работа которых позволяет преодолевать неров- ности дороги и перемещать корпус по гладкой кривой. Одной из первых попыток, направленных иа создание транспортного устройства шагающего типа, бы па пред- ложенная П. Л. Чебышевым машина, которая имела в своем составе четыре двухзвениых механизма [1] Эта машина положила начало конструированию шагающих устройств иа основе траекторного синтеза, при котором координация движения конечностей осуществляется ме- ханическим способом с помощью многозвенных кинема- тических цепей. Одиако траекторный синтез с жесткой программой движения иа механической основе не полу- чил дальнейшего развития, так как синтезируемые с его помощью системы оказывались громоздкими, многозвен- ными, со сложной структурой и кинематикой, с низкой приспособляемостью к непрерывно меняющимся внешним условиям. Более простым подходом стал такой способ конструи- рования шагающих устройств, при котором частично копируется структура конечностей живых организмов. Упрощение достигается за счет копирования только час- ти конечности с уменьшенным числом звеньев, другими типами пар и меиьшим числом степеней свободы системы. Но использование такого упрощения имеет одновременно и отрицательное влияние, так как неполная копия, как правило, ие позволяет получить идеальную траекторию опорных точек. Поэтому структурное копирование приме- 107
няется лишь для решения простейших задач передвиже- ния (шагающие экскаваторы). Копирующий способ управления также положен в ос- нову «педипуляторного» направления конструирования, при котором основные функции, необходимые для пере- движения, выполняются человеком, а шагающее устрой- ство реализует движение. Человек выбирает место поста- новки конечности устройства, задает траекторию и закон движения опорных точек относительно земли, обеспечи вает сохранение равновесия при движении Шагающее устройство усиливает с помощью приводов команды че- ловека и обеспечивает систему управления необходимой информацией. Одно из таких устройств грузовая шагающая платформа, созданная компанией «Джеиерал электрик» совместно с отделением наземного перемещения Лабо- ратории подвижных систем армии США [2]. Платформа имеет гидравлический привод, копирующий движения оператора Модель является достаточно совершенной и гибкой. Она может ходить вверх-вниз по лестнице, вы- таскивать застрявшие на дороге автомашины и прика саться к хрупким предметам, ие разрушая их. Таким образом, центральной задачей построения шагающих устройств является создание высокоэффектив- ных систем управления движением. Прогресс в области автоматического управления, по- явление малогабаритных ЦВМ и АВМ высокой точности создали базу для исследований н разработок совершен ных систем управления шагающими роботами. При этом к наиболее важным решаемым задачам стали относиться следующие: обзор и переработка информации об окру жающей среде, координация конечностей робота, пост- роение требуемого перемещения в пространстве и стаби- лизация движения Существующие алгоритмы решения данных задач основываются иа достаточно едином механико-математическом аппарате [3]. Модели походок шагающего робота. При передви- жении по местности шагающий робот поочередно опи- рается иа разные конечности, перенося остальные для создания достаточной опоры в новом месте. В движении каждой конечности выделим две основные фазы — опо- ры и переноса. В фазе опоры стопа конечности остается неподвижной на опорной поверхности, а в фазе переноса стопа не соприкасается с поверхностью и перемещается в направлении новой опорной точки- 108
Походка шагающего робота характеризуется порядком следования операций подъема и опускания конечно- стей. Состояние конечности с номером i можно описать ф)икциеи q(l), принимающей два значения 0 и 1. 10, если стопа опирается на поверхность, 1, если стопа не опирается на поверхность Состоянием jV-опорного шагающего робота называ- ется упорядоченная совокупность N чисел q Q (<Д <?*’. . такая, что первой компонентой служит состояние конеч иости с номером 1, второй — состояние конечности с номером 2 и т. д Состояния с/, возникающие в каждый момент смены значения функции q(t), нумеруются по порядку следова- ния таких моментов. Походка N опорного шагающего робота есть последо- вательность состояний q }. п 12,. Приведем прим р последоватетьиости состояний для четырехопорного шагающего робота <7i (0. 0, 0, 0). <7 —(1. 0, 0 0) <7 (0.0.0 0) <74 (0. 1.0. 0). <7 (0. 0, 0 0). <76 (0,0, 1,0). <7 (0. 0. 0 0) <78= (0. 0 0. 1). <7э=<7 Походка называется циклической, если последов-» тельиость <7 } повторяющаяся Совокупность состоя инн, реализуемых повторно, называется циклом походки. Матрицей циклической походки называется матрица G, каждая строка которой представляет с бои состояние робота, а последовательность строк последователь иость состояний. Расписанием t для матрицы G циклической походки, имеющей k строк, называется упорядоченная совокуп ность из k чисел, компоненты которой представляют собой длительности существования строк матрицы G в цикле с номером v. Походка называется периодической, если расписания Для любых двух соседних циклов совпадают. — t Величина Т= У tn Л—I называется периодом походки. 109
Пара {G, /} дает полную характеристику периодиче- ской походки, указывая, какая конечность и в какой момент времени должна находиться в фазе опоры или переноса. Характеристикой режима 0 для конечности с номе- ром / называется отношение суммарного времени опоры в пределах одного цикла к периоду походки Приведем примеры основных походок шагающих роботов. Регулярная походка - движение всех конечностей подчиняется стандартному циклу опоры и переноса, при этом относительные координаты точек опоры не меня- ются от шага к шагу. Такие походки применимы при движении по ровной поверхности. Вместе с тем они пригодны и при движении по поверхности с малыми неровностями, если допустить изменение относительных координат точек опор с целью адаптации к неровностям местности. Волновые походки — движение соответствует перио- дической походке с регулярной матрицей, характеристика режима 0 выбирается для всех конечностей одинаковой, точки подвеса конечностей симметричны относительно вертикальной плоскости, интервалы времени между мо- ментами опускания соседних конечностей одной стороны равны между собой и одинаковы для обеих сторон робота. Матрицы различных типов симметричных волновых походок для шестиопорного робота имеют следующий вид: последовательная походка 1 0 0 0 0 О' 000000 0 10 0 0 0 0 0 0 0 0 0 0 0 10 0 0 г 0 0 0 0 0 0 . U 000100 ’ 000000 0 0 0 0 10 000000 0 0 0 0 0 1 .0 0 0 0 0 0. по диагональная походка 1 0 0 0 0 Г 0 0 0 0 0 0 0 0 0 0 1 0 Г 0 0 0 0 0 0 . 001100 • 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
G = походка трешками ‘о 1 о 1 о Г 0 0 0 0 0 0 . " 10 10 10 • 0 0 0 0 0 0 галоп 0 0 10 0 1 0 0 0 0 0 0 0 10 0 10 0 0 0 0 0 0 10 0 10 0 000000. G = Статическая устойчивость шагающего аппарата. Одно из основных требований, предъявляемых к шагающему роботу, заключается в обеспечении устойчивости движе- ния. С этой точки зрения анализ произвольного движе- ния робота в общем случае представляется достаточно сложным. В случае медленного, квазистатического дви- жения возможно изучение статической устойчивости, которое основано иа понятии застывшей конфигурации шагающего робота — состояния, соответствующего жесткой фиксации конечностей относительно корпуса в рассматриваемый момент времени Шагающий робот называется статически устойчивым в момент времени t, если его застывшая конфигурация в этот момент находится в состоянии устойчивого ста- тического равновесия под действием собственного веса. Опорным многоугольником назовем двухмерную мини- мальную выпуклую область, включающую проекции всех точек опоры на горизонтальную плоскость. Из принципа Торричелли следует, что шагающий робот, опирающийся на горизонтальную поверхность, статически устойчив в некоторый момент времени тогда и только тогда, когда вертикальная проекция центра тяжести его застывшей конфигурации иа опорную поверхность лежит строго внутри опорного многоугольника, соответствующего это- му моменту. Запасом статической устойчивости шагающего робота в некоторый момент времени называется кратчайшее расстояние от проекции центра масс корпуса иа гори- зонтальную плоскость до границы опорного многоуголь- ника. Если робот статически устойчив, то запас стати- ческой устойчивости считается положительным. Понятие запаса статической устойчивости характе- ризует расположение корпуса робота над опорным мно- гоугольником независимо от направления его движения. Однако расстояния до различных сторон опорного мно- гоугольника при перемещении робота изменяются не оди- наково. Наиболее существенно изменяются расстояния, ill
вычисленные в направлении, параллельном вектору ско- рости центра масс корпуса. Расстояния, вычисленные в направлении, перпендикулярном вектору скорости, изме- няются значительно слабее. Поэтому опасность падения робота в направлении, продольном по отношению к движению центра масс, оказывается значительно выше, чем в поперечном. Для учета отмеченной особенности вводится понятие продольной статической устойчивости. Передним запасом статической устойчивости в момент времени t называется расстояние /„ (/) от вертикальной проекции центра масс робота до передней относительно движения границы опорного многоугольника, отсчитывае- мое вдоль прямой, содержащей проекцию скорости центра масс на горизонтальную опорную плоскость. Задним запасом статической устойчивости в момент времени t называется расстояние 14J) от проекции центра масс аппарата до задней относительно движения гра- ницы опорного многоугольника, отсчитываемое вдоль той же прямой. Продольный запас статической устойчивости в момент времени t есть функция /(О=тт{ЦО. характеризующая статическую устойчивость локально в любой заданный момент времени. Продольным запасом статической устойчивости по- ходки называется величина /=inf/(O. ter т. е. ннжняя граница функции /(/) иа всем рассматривае- мом интервале времени движения Т. Аналогично величины I =inf l^t), h=ini КТ t^T называются соответственно передним и задним запасами устойчивости походки Справедлива формула / —min(/Jt /п). Прокладка трассы на местности. В системе управле- ния автоматическим шагающим роботом должны быть предусмотрены алгоритмы прокладки трассы, назначение 112
которых состоит в формировании целесообразного пере- мещения робота во внешней среде. Внешней средой для шагающего аппарата является опорная поверхность, описываемая функцией 6 = С(5. П) в неподвижной системе координат OigrjC- Ось на- правлена вертикально вверх противоположно вектору си- лы тяжести. Препятствиями называются такие области в плоскости О|^г), в которые шагающий аппарат не должен попадать при перемещении. Существуют различные способы представления моде- ли местности. Один из способов — представление ее в виде графа путем задания дискретной сети точек на карте. Две точки соединяются ребром тогда и только тогда, когда выполнено некоторое условие проходимо- сти. В частности, это может быть требование, чтобы модуль изменения координаты между соединяемыми точ- ками не превышал некоторого порога. В итоге получа- ется граф допустимых перемещений. Другой способ пред- ставления модели местности — граф видимости, для построения которого контуры препятствий аппроксими- руются многоугольниками. Вершинами графа служат вершины многоугольников вместе с исходной точкой и точкой цели. Две вершины соединяются ребром, если они видны одна за другой, т е. между ними нет препят- ствий (3J. Оба отмеченных способа могут быть реализованы лишь для сравнительно простого рельефа, так как тре- буют большого объема вычислений и памяти ЭВМ. Загораживание одних предметов другими, ограниченные возможности измерительного устройства затрудняют про- ведение достаточно полного анализа окружающей обста- новки. Поэтому особый интерес представляют алгоритмы прокладки трассы в условиях неполной информации, ког- да сведения о поверхности поступают по мере продви- жения робота. Один из таких алгоритмов выбора трассы примени- тельно к модели рельефа с препятствиями в виде не- прозрачных непроходимых стен и ям, расположенных на горизонтальной плоскости, включает в себя два режима осмотра местности — обзор дальнего плана и обзор ближнего плана |3]. При сборе информации в режиме обзора дальнего плана возникает массив точек {Л*}, где k — номер точки, и массив их признаков {/»}. Каждый из
элемент массива {Л*} представляет собой три абсолютные координаты измеренной точки, а каждый соответствую- щий элемент массива признаков — целое число, прини- мающее значения 1,2,3, смысл которых состоит в следую- щем. Если /*=1, то местность в точке Л* непроходима из-за слишком крутого наклона; если /*=2, то в точке Л» имеет место скачок дальности (этот скачок может возникнуть из-за загораживания рельефа препятствиями, а также из-за наличия ям; если /* = 3, то местность счи- тается проходимой вплоть до точки Ak. Полученная в результате обзора дальнего плана ин- формация может быть использована для выбора пред- варительного направления движения к некоторой под- цели. Вместе с тем такой обзор не всегда позволяет выявить глубокие ямы и другие особенности местности. Поэтому возникает необходимость уточнения предвари- тельной трассы, найденной путем изучения дальнего плана. С этой целью производится обзор местности в режиме ближнего плана. В этом режиме выбираются критерии, оценивающие проходимость участков твердой поверхности и характеризующие несущую способность грунта. Модель местности, формируемую в результате обра- ботки измерений, можно представить двухуровневой структурой Одним из уровней служит локальная модель местности, представляющая собой список подцелей, полученных в результате обзора дальнего плана местно- сти, и характеризующая возможные направления дви- жения робота из его места нахождения. Второй уро- вень — глобальная модель местности, объединяющая информацию, накапливаемую в процессе движения. Глобальная модель определяет список подцелей и ката- лог препятствий, полученных в результате обзора ближ- него плана местности. Стабилизация движения. Проблема стабилизации движения возникает из-за того, что динамические харак- теристики корпуса и конечностей, а также характерис- тики двигателей и редукторов оказываются известными лишь приближенно. Под стабилизацией понимается выполнение с задан- ной точностью программного движения с учетом реаль- ных динамических характеристик двигателей и робота. Стабилизацию можно обеспечить с помощью пози- ционной следящей системы по всем степеням подвиж- ности шагающего робота, контролируя движение только 114
в дискретных точках траектории Недостатком этого метода является возникновение автоколебаний при дей- ствии возмущений, в результате чего затрудняется выполнение двигательной задачи. Для эффективного учета влияния возмущений целесообразно применять многошаговые алгоритмы дискретной коррекции управ- ляющего воздействия [3] В каждый момент коррекции управление формируется как непрерывная функция для последующего временнбго интервала. При этом прогно- зируется и учитывается влияние действующих возму- щений. В алгоритме стабилизации могут быть выделены три основных информационных уровня: логика стабили- зации, распределение реакций в опорах и расчет шарнир- ных моментов. Уровень логики стабилизации обеспечи- вает устойчивость заданного движения робота, опреде- ляет требуемые суммарный вектор сил реакции и момен- ты в точках опоры, корректирует темп движения в за- висимости от возможности его реализации. Уровень рас- пределения реакции обеспечивает расчет реакций по уравнениям кинетостатики и ограничениям, описываю- щим свойства контакта конечностей с поверхностью (например, условия попадания реакций в конус треиия). Уровень расчета шарнирных моментов использует ин- формацию о требуемой реакции для опорных точек и информацию об ускорении конечностей для неопорных точек. Алгоритм стабилизации реализует широкий класс движении, допускаемых кинематикой шагающего ро- бота. Примером шагающего робота является разработан- ный совместно коллективами Института прикладной математики им. М В. Келдыша АН СССР и Ленинград- ского механического института макет шестиопориого робота [3]. Этот аппарат снабжен системой техниче- ского зрения (лазерный дальномер) и способен переме- щаться по сложной трехмерной поверхности. Макет, управляемый с помощью стационарной миниЭВМ, может осуществлять оперативную перестройку походок в про- цессе движения, автономно обходить препятствия. На рис. 3.17 представлена структурная схема системы управления, в состав которой входят следующие устрой- ства: — задающий блок - определяет цели перемещения аппарата и формирует для него двигательную задачу; — система информационного обеспечения — получает и перерабатывает информацию о местности. из
Рис 3 17 Структурная схема системы управления шести- опорного робота - система построения движения — рассчитывает движение корпуса, выбирает точки опоры на поверхно- сти обеспечивает заданный запас статической устойчи- вости и формирует движения конечностей; — система исполнения движения - реализует синте- зированное движение с учетом информации от располо- женных на конечностях тактильных датчиков. При моде- лировании на ЭВМ функцией системы исполнения явля- ется также построение движущегося изображения ро- бота на экране дисплея, что позволяет отображать результаты моделирования в виде, удобном для опе- ратора. Взаимодействие систем информационного обеспечения и построения движения осуществляется с помощью спе- циального монитора, который загружает про|раммы в оперативную память и обеспечивает обмен информацией между системами. Комплекс управляющих алгоритмов системы построе- ния движения представляет собой многоуровневую ие- рархическую структуру (рис. 3.18): — низший уровень управления — для конечностей. Он обеспечивает синтез траектории движения в фазе опоры В фазе переноса исключаются задевания за пре- пятствия; — уровень координации конечностей. На этом более высоком уровне составляется расписание моментов опу- 116
Рис 3 18. Стр)ктурная схема управляющих алгоритмов системы построения движения скания н отрыва каждой конечности с учетом требова- ний устойчивости движения; — уровень следовых точек и положения корпуса. Алгоритмы этого уровня определяют положение корпуса и следовые точки контакта конечностей с поверхностью. В простейшем случае формируется регулярная следовая дорожка, которая характеризуется двумя параметрами — шириной колеи и длиной шага. В более сложных случаях (например, движение по пересеченной местности) фор- мируется нерегулярная следовая дорожка по специаль- ным правилам; — уровень возможных положений корпуса и конечно- стей. На этом уровне происходит грубое формирование движения корпуса по высоте и наклону к поверхности; — уровень прокладки трассы — служит для опреде- ления закона движения центра масс корпуса в горизон- тальной плоскости. Трассой робота называется проекция траектории центра масс корпуса на горизонтальную плоскость. 117
Задачей информационной системы является получение информации об окр>жающей среде и построение модели среды В качестве датчика информации о среде исполь- зуется дальномер, позволяющий определять координаты различных точек опорной поверхности. На основе прове- денных измерений информационная система формирует подчиненную целям организации движения модель окру- жающей среды, которая передается системе построения движения.
ГЛАВА ГРУППОВОЕ УПРАВЛЕНИЕ РОБОТАМИ И ОБОРУДОВАНИЕМ Рассмотрим проблему группового управления в двух аспектах. Первый аспект — системотехнический — вклю- чает в себя вопросы информациоино-техиического интер- фейса и вопросы синхронизации работы разнородного оборудования, входящего в состав робототехнического комплекса гибкой производственной ячейки, участка, цеха и т. п. Второй аспект включает в себя вопросы координации движений группы роботов, манипуляторов, многозвенных захватных устройств («пальцев рук») с целью уклонения от столкновений при выполнении той или иной технологической задачи. Под групповым управ- лением оборудованием понимается взаимодействие в группе оборудования иа уровне связи и синхронизации работы программ числового управления, под групповым управлением роботами — координированное управление движущимися объектами. При групповом управлении оборудованием проблема организации взаимосвязанного функционирования раз- личных устройств комплекса заключается в сложности программирования и синхронизации их работы. Слож- ность программирования и синхронизации определяется разнородностью обрабатываемых данных в системе груп- пового управления, что требует определенной стандарти- зации процедур передачи и обработки данных. Передача данных в производственной системе между управляемыми и ведущей ЭВМ осуществляется, как пра- вило, на основе протокола, определяющего структуру передачи, максимальные пределы времени, код и формат передаваемых данных. Помимо необходимости согласо- вания физических параметров интерфейса возникает не- обходимость согласования параметров на уровне инфор- мационного взаимодействия. С этой целью разрабаты- ваются устройства, выполняющие функции промежуточ- ного хранения данных, связи с оператором, регистрации 119
рабочих параметров, концентрации, т. е. подсоединения нескольких систем управления. Намечается тенденция к применению «открытых» систем группового управления, в которых могут использоваться приборы, оборудование и вычислительная техника различных заводов-изготови- телей. Простыми средствами связи и управления, обес- печивающими развитие структуры и высокие скорости обработки информации в неоднородных вычислительных системах, являются локальные сети ЭВМ 4.1. Групповое управление оборудованием Один из подходов к построению распределенной си- стемы группового управления (ГУ) оборудованием осно- ван на использовании контроллеров гибких производ- ственных модулей (ГПМ) и локальной вычислительной сети, связывающей контроллеры ГПМ между собой, а также объединяющей их с ЭВМ уровня предприятия и цеха (табл. 4.1). Выбор и синхронизация программ работы оборудова- ния в распределенной системе ГУ основаны на реализа- ции системой функций логического управления. При этом решаются задачи двух классов — синхронизация после- довательности работы оборудования и комбинаторное управление работой оборудования, связанное с анализом состояния системы, проверкой условий и выбором опти- мальных действий. Решение этих задач потребовало раз- работки и применения специальных проблемно-ориенти- рованных языков в виде языков имитационного модели- рования и искусственного интеллекта. Такой подход к построению системы управления позволяет достичь более высокой гибкости перепрограммирования системы управ- ления по сравнению с традиционным подходом построе- ния программного обеспечения на основе универсальных языков программирования. Задачи первого класса реализуются с помощью языка «КОНТРОЛЛЕР». Язык «КООРДИНАТОР» использует- ся для решения второго класса задач, связанных с вы- бором оптимального варианта взаимодействия оборудо- вания. Для решения данных задач логического управле- ния использованы математические модели на основе сети Петри и систем продукции (логического вывода). Рас- смотрим языки «КОНТРОЛЛЕР» и «КООРДИНАТОР». КОНТРОЛЛЕР. Сеть Петри содержит такие элемен- ты, как множество позиции, множество переходов и мар- 120
Таблица 41 Уровень Функции Структура системы Производство Орган изационное управление 1 ЭВМ предприятия 1 *1 и Предприятие Проектирование Планирование Обработка данных Мини ЭВМ ' i—L j САПР| Цех Линия Управление технологическим процессом Групповое управление технологическими линиями и модулями Человеко-машинный интерфейс ( Локальная вычис-Л лительная сеть J Контроллеры гибких производственных модулей -J 1 L- Г Локальная вычис^Х лительная сеть J Модуль Единица оборудования Индивидуальное управление оборудованием Числовое програм- мное управление | Дисплей! Единицы I борудования Ц I Единицы 1 оборудования 1 | Дисплеи | керы. При кодировании группового управления каждой позиции ставится в соответствие определенная операция, производимая отдельными единицами оборудования. Описание последовательности операций задается струк- турой сети Петри, а процессы синхронной параллельной работы оборудования моделируются движением марке- ров иа сети Петри* КООРДИНАТОР. В данном языке рассматриваются состояния элементов системы, называемые фактами * Более подробно описание сети Петри см в ки 5 настоящей серии
f.^F, состояния системы seS как множество фактов в данный момент времени, а также действия а(е<4. Стра- тегия управления системой D(S) состоит из набора ре- шающих правил г* следующего вида: r/r.tfA.fa.f }-*а, определяемых для каждого состояния системы seS. Ре- шающие правила задают отображение условий — выра- жении в скобках — во множество действий А. Эти пра- вила формулируются в виде конструкций если — то, где в левой части расположено условие, в правой части — действие. Как условия, так и действия могут иметь вид выражений «станция <z> свободна», «процесс <1> выполняется на станции <г>». Сформулировать решаю- щее правило можно следующим образом: «если стаи ция <z> свободна, то процесс <1> выполняется иа станции <г>», «если робот получил запрос и если деталь <у> находится на станции <z>, то подготовка к работе робота <.х> закончена». В скобках могут со- держаться символы трех типов: константы-имена или ин- дексы оборудования, переменные параметры, например. х, у, z и имена подпрограмм, например MINX — процеду- ра выбора оборудования с минимальным номером из множества X. Стратегия управления реализуется иа основе системы продукции, состоящей из продукционной памяти, базы данных и интерпретатора, которая автоматически опери- рует решающими правилами в зависимости от текущего состояния системы, хранимого в базе данных, и итера- ционно совершает процесс логического вывода действий, соответствующих состоянию системы. 4.2. Групповое управление роботами Под групповым управлением роботами понимается координированное управление движением, позволяющее роботам уклоняться от столкновений друг с другом или с препятствиями при выполнении ими функциональных задач. Необходимость координации действии промышлен- ных роботов возникает при непосредственной передаче деталей роботами друг другу, совместной работе над деталью или узлом (например, при механообработке или сборке), а также при взаимном уклонении от столкнове- ния в ходе выполнения роботами независимых задач Аналогичные задачи координации возникают при управ- лении захватным устройством с несколькими много- звенными пальцами. 122
Подходы к решению проблемы координации. Коор- динация роботов подразумевает две фазы: моделирова- ние движения роботов в динамической среде для прогно- зирования возможных столкновении и управление робо- тами, обеспечивающее упреждение столкновений и обход препятствий. Основой координации движений является выбор стра- тегии уклонения роботов. При этом используются эврис- тики различной сложности в зависимости от характера решаемой технической задачи. Рассмотрим типовые стра- тегии уклонения иа примере двух роботов. Стратегия Кг 1. Общие рабочие зоны блокируются для обоих роботов при их совместном движении. Стратегия № 2. Вход одного из роботов в общую рабочую зону блокирует вход в нее другого робота иа все время пребывания первого робота в общей рабочей зоне. Стратегия № 3. Вход в общую рабочую зону ие заблокирован. Робот с правом приоритета совершает свободное траекторное движение в общей рабочей зоне, другой робот уклоняется от столкновения, корректируя собственную траекторию движения. Сравнительный анализ рассмотренных стратегий по- казывает, что при первой стратегии имеются ограничения допустимого класса технологических операций. Так, опе- рации сборки или транспортировки деталей требуют при- сутствия роботов в общей рабочей зоне. При второй стратегии замедляется работа роботов, так как появля- ется дополнительное время ожидания свободного состоя- ния общей рабочей зоны. Третья стратегия требует быстрых вычислений коррекции траекторий роботов в реальном масштабе времени. Основным подходом, используемым для решения за- дач автоматического уклонения, служит геометрическое моделирование, которое позволяет визуализировать дви- жение каждого робота в трехмерном пространстве и ком- бинировать аналитическое программирование роботов с графическим программированием движений иа экране дисплея. Решение задачи автоматического управления уклоне- нием роботов связано с решением двух подзадач — пла- нирования траекторий и программирования движений ро- ботов. Различают методы глобального и локального планирования траекторий Глобальное планирование и связанное с ним прогнозирование столкновений осуществ- 123
ляются для всей рабочей зоны роботов. Локальное пла- нирование характерно для текущего положения каждого робота. Методы программирования движений роботов существенно зависят от выбираемых способов планиро- вания траектории и делятся иа два класса: программи- рование в режиме «OFF-LINE» и программирование в режиме реального масштаба времени Режим «OFF- LINE» позволяет выполнить програмироваиие до начала движения роботов, следовательно, время, затрачиваемое иа программирование в этом режиме, ие ограничива- ется. Скорость программирования в реальном масштабе времени должна быть соизмерима с темпом выполняемых роботами движений. Поэтому методы глобального пла- нирования траекторий преимущественно используются совместно с программированием в режиме «OFF—LINE», а методы локального планирования траекторий — с про- граммированием в режиме реального масштаба времени. Управление уклонением роботов с программированием движений в режиме «OFF—LINE». Существо методов управления, применяемых для решения задач уклонения в режиме «OFF-LINE», сводится к прогнозированию запретных для движения роботов зои и последующему глобальному планированию траекторий движения, ис- ключающих их попадание в запретные зоны. Прогнозирование столкновений в про- странстве состояний Метод пространства состоя- ний основан на геометрическом моделировании про- странственного движения нескольких роботов. В качестве примера возьмем робототехнический комплекс (РТК), включающий два двузвепных манипулятора (рис. 4.1). Каждой конфигурации двух манипуляторов, определяе- мой умами поворота звеньев qt. <72. <73 и линейным пере- мещением звена <74. соответствует точка р = (<71. <72, <73, <74) в четырехмериом пространстве состоянии Р. Одновремен- ному движению манипуляторов соответствует траектория в пространстве Р. Если РТК включает большее число роботов или звеньев, то пространство Р будет иметь соответственно большую размерность. В пространстве состояний Р зададим карту столкновений с помощью скалярной функции С(р) по следующему правилу: С(Р)=1. если столкновение (в двухмерном случае — наложение изображений манипуляторов) происходит; С(р) = О—я противоположном случае. На рис. 4.2 по- казан фрагмент карты столкновений для фиксированных значений qt и q3 (<71 = —180°, q3 = — 90°) и варьируемых 124
Рнс 4.1. Робототехнический комплекс Рнс. 4 2. Карта столкновений переменных <?з н в диапазонах их допустимых значе- нии. Области столкновении заштрихованы. Полная карта столкновений получается в результате перебора всех возможных конфигураций РТК. т. е. всех точек про- странства состояний Р. Время счета на ЭВМ типа VAX! 1/750 при моделировании карты для данного РТК составляет окаю 8 ч. Полученная карта занимает 131 К бант памяти ЭВМ. Основное преимущество применения метода простран- ства состоянии заключается в универсальности матема- тического обеспечения, используемого для генерации кар- ты столкновений и планирования траекторий роботов, по отношению к типам моделируемых объектов (возмо- жен анализ также мобильных роботов). Глобальное планирование траектории. Подходы к планированию траектории робота в среде с препятствиями основаны, как правило, иа оптимизацион- ных методах. При существенной размерности задачи оптимизационные методы связаны с большой вычисли- тельной трудоемкостью, что часто не позволяет решать задачу глобального планирования траектории в реальном масштабе времени. Полученная на основе моделирования в пространстве состояний карта столкновении позволяет решить задачу глобального планирования траектории, используя страте- гию уклонения К? 1. При этом необходимо найти путь, свободный от зон столкновения, из начальной точки в пространстве состояний Р в конечную точку. При поста- новке оптимизационной задачи необходимо иаити крат- 123
чайший путь. Возможные подходы к решению задачи представлены методом «натягивания струны» через об- ласти столкновений, методом проведения траектории через середины свободных областей с последующей ло- кальной оптимизацией в окрестности получаемых точек траектории, а также методами, основанными иа аналогии траекторного движения точки р и движения заряженных частиц или потока жидкости в силовом поле вокруг препятствий. Управление уклонением роботов с программировани- ем движений в реальном масштабе времени. Решение задачи уклонения в реальном масштабе времени услож- няется двумя причинами: во-первых, постановка задачи, как правило, становится динамической, так как прихо- дится рассматривать движение в окрестности препятст- вия с учетом неточностей, неопределенных воздействий, разброса во времени срабатывания роботов; во-вторых, из-за ограничений времени иа анализ движения трудно разделить этапы обнаружения препятствий и планирова- ния траектории по аналогии с решением задачи в режиме «OFF-LINE». Поэтому характерным для управления в реальном масштабе времени является совмещение процедур обна- ружения препятствий с локальным планированием траек- торий движения. На практике это означает, что коррек- ция траектории движения должна осуществляться в момент первого обнаружения ближайшего препятствия до распознавания всей карты столкновений. Метод иерархического нелинейного группового управления Позволяет управлять группой роботов иа основе стратегии уклонения К? 3 (без блокировки общей рабочей зоны). Структурная схема управления двумя роботами приведена иа рис. 4.3. Основным элементом структуры является координатор, который автоматически формирует уклонение одного из роботов при назначенном приоритете другому роботу На вход координатора поступают векторы Wi(/). w^/) и У|(0- УХО. задающие соответственно желаемые и те- кущие значения траекторий роботов. Блок детекции обла- сти столкновения выявляет существование области столк- новений для сегментов траекторий с координатами Wi(f+1). у,(/) и w2(f+l), уХО- Если область столкновений отсутствует, то желаемые значения векторов W|(/-F1). W2O+I) после преобразования координат непосредствен- но используются для управления приводами роботов. 126
Рнс 4.3 Структурная схема системы нелинейного группового управ- ления* / — координатор блок преобразования координат 127
В противном случае должны быть определены скоорек тированные желаемые значения векторов ’*i(/4-l). w2(/4-l) в прогнозируемый момент времени /4-1 в соответ ствии с выбранным маневром уклонения. Маневр укло- нения определяется по таблицам. Таблица выбора реше- ний состоит из условий Bi, /el, q, решающих правил Rk и действий А . se I, г. Если для множества входных данных выполняются условия В*. / е 1. q, соответствую щие правилу /?», Ле1. р, то выбирается действие А sei, г, состоящее в применении маневра 5», fee 1, d. В качестве примера рассмотрим РТК, состоящий из двух манипуляторов, работающих в цилиндрической си стеме координат (рис 4 4). Здесь а — расстояние между началами систем координат двух роботов, <j>oi и <402 - углы начальных положений. Движение происходит про- тив стрелки Пусть приоритет имеет промышленный манипулятор ПМ! Алгоритм выбора стратегии уклоне- ния включает в себя несколько шагов (см. рис. 4.3) На первом шаге вычисляются максимальные значения координат захватных устройств манипуляторов ;.n.4/4-l) = max[Y,(/). w (/4- 1)]4-S„. (4 1) где S„ — член, учитывающий размеры захватного устрой ства, груза и дистанцию безопасности. Если выполняется условие
йп.4/+1) + 72п,.^+1)>а (4 2) то существует область столкновений, изображенная иа рис. 4.5. Из геометрических построений получим выра- жеиия для максимальных углов прн i j (ie I, 2, /еЕ2); »...(«-)- •T.-areeos (4 3) «._(/+l)-<w + .,«0,Z±i=^==4!±!!. (4.4) На втором шаге на основе анализа размеров области столкновений определяется одна из таблиц вы- бора решений Так, для случая, изображенного на рис. 4.4, проверяется неравенство 0>«Pi(') + S,i. (4 5) где ф^/) — угол вектора у(/) в полярной системе коор- динат; S,i — угол безопасности для манипуля- тора ПМ1. Выбираемые по таблице действие и маневр обеспе- чивают коррекцию траектории манипулятора -ПМ2 в мо- менты времени t +1, /4-2, . М)О/7_1_П если (Ч’|(0<Ч’|*т1><<+1); ‘М<+1). если | ф2{/)<(рпп||1</+1). (4.6) I W'U 4- 1), если ф (О4-фг(О<фо1 4-фог4-5,|4-5,2; u»rX^+l) — в противоположном случае- » Х*+1) = t.X/4-l) = min / Фо,+Ф°2—Ф'(0 — 5т,_S*2. еслиГфХО4-фХ0<фо14-Ф024-5,t 4-S,2; I r2(t)>a-n(/)-5,2 (4.7) w г(/4-1)— в противоположном случае. Полученная по (4.6) и (4.7) коррекция позволяет манипуляторам ПМ1 и ПМ2 избежать столкновения. Результаты графо-аналитического моделирования уп- равляемого движения РТК в ситуациях уклонения при-
a) 2 Y, M Рис 4 5. Результаты моделирования 130
ведены на рис. 4.5. Из рис. 4.5, а видно, что приоритетом обладает манипулятор ПМ1, движущийся по желаемой траектории, в то время как манипулятор ПМ2 исполь- зует маневр уклонения При этом оба манипулятора достигают конечных точек желаемых траекторий. Из рис. 4.5, б видно, что приоритетом обладает манипуля- тор ПМ2 На вычисление параметров области столкнове- ний и на выбор соответствующей стратегии уклонения требуется около 7 мс машинного, времени для микро- ЭВМ Метод имитации силового поля Метод локального планирования основан на имитации силовых полей в пространстве состояний вокруг областей столк- новений. На точку р(, изображающую конфигурацию РТК действует движущая сила Ft, приложенная в на- правлении положения изображающей точки р(+| на же- лаемой траектории в последующий момент времени /+1. Силовое поле представлено вектором сил реакции F/?, действующим на точку р(, в виде потенциальной функ- ции, градиент которой возрастает по мере приближения точки р к области столкновений. На основе использова- ния значения градиента потенциальной функции форми- руется уклонение в сторону. Метод графического определения пе- ресечении. В составе программного обеспечения САПР имеются специальные средства для удаления неви- димых линий объемных тел при их геометрических преоб- разованиях. Аппарат удаления невидимых линии можно успешно применить для выявления столкновений и управ- чения уклонением роботов, так как в процессе модели- рования столкновении двух тел происходит загоражива- ние (пересечение) одного из них другим, что требует чдаления невидимых линий. Метод графического опреде- ения пересечений основан на проведении контрольных тестов с объектами-примитивами в виде сфер, много- гранников и т. п. Из совокупности примитивов состав- ляются приближенные изображения роботов и предметов окружающей среды. В качестве примера рассмотрены тесты для примитивов в виде вписанных и описанных относительно отдельных звеньев робота сфер, а также выпуклых многогранников (ВМ) Алгоритм определения факта пересечения объемов двух роботов состоит в про- ведении следующих возможных тестов для каждой пары примитивов из двух различных множеств примитивов соответствующих роботам. S* 131
Приведем указанные тесты в порядке увеличения точности определения факта пересечения и сложности вычислений: если примитивы в виде описанных сфер не пересе- каются, то пересечения нет; если примитивы в виде вписанных сфер пересекаются, то пересечение есть; если примитивы в виде вписанных ВМ пересекаются, то пересечение есть; если примитивы в виде описанных ВМ не пересека- ются, то пересечения нет; если препятствие (естественной формы) и примитив в виде описанного ВМ не пересекаются, то пересечения нет; если препятствие и примитив в виде вписанного ВМ пересекаются, то пересечение есть. В остальных случаях пересечение может существо- вать и необходимы дополнительные тесты, основанные на удалении невидимых линий Прогнозирование пересечений производится в режиме реального времени в окрестности текущей конфигура- ции РТК. Размеры окрестности определяются временем вычислений, а также необходимой дистанцией безопас- ности. Возможно распараллеливание процесса вычисле- ний путем поиска пересечений для различных пар при- митивов одновременно.
ГЛАВА ОПЕРАТИВНОЕ УПРАВЛЕНИЕ В ГИБКИХ АВТОМАТИЗИРОВАННЫХ ПРОИЗВОДСТВАХ Гмеративное управ пенне представляет собой процесс вре- мннби и пространственной организации производства Структурно оперативное управ пенне подразделяется на три группы задач, взаимосвязь между которыми образу- ет иерархическую трехуровневую структуру. На первом (нижнем) уровне решаются задачи управления отдельными технологическими операциями и их элементами, например: поддержание режимов резания металла (скорости, направления движения инструмента) г. механообработке, выполнение заданной траектории диижения робота (скорости движения, точности пози- ционирования и т. д.), обеспечение заданных параметров п.нжения транспортных средств, штабелера автомати- ч> ского склада, конвейерной ленты транспортера и т д. Как правило, в автоматическом режиме эти функции Еиполняются регуляторами, являющимися элементами остем управления оборудованием На втором уровне решаются задачи локального «правления оборудованием, основные функции которых включаются в выполнении последовательности техноло- I. ических операции в соответствии с заданной програм- мой (логическое управление) Содержание программы управления зависит от типа оборудования Для механо- обрабатывающих станков — это моменты включения и включения оборудования, смены инструмента, запуска определенного кадра программы резания, формирования и выдачи сигналов о начале или об окончании операции | вспомогательному оборудованию, например роботу-за- грузчику. Для сборочного центра программой задаются последовательность движений робота-сборщика, моменты смены рабочего инструмента и посылки команд на за- грузку и разгрузку сборочной позиции объектами сборки. Программа сотержит также информацию о значениях 133
технологических параметров операций, которые исполь- зуются регуляторами первого уровня На третьем (верхнем) уровне решаются задачи управчения материальными потоками, проходящими че- рез технологическое подразделение Можно выделить две основные задачи оперативного управления: оперативное (календарное) планирование; оперативный контроль и корректировка планов. Основнои характеристикой системы оперативного управления ГПС является скорость реакции на изменение условий функ- ционирования производства. Возмущениями, меняющими условия функционирования в производстве любого типа являются отказы (полные или частичные) оборудова ния, нестабильность поставок сырьи и материалов выпуск брака и ряд других. В ГПС дополнительно воз- никают возмущающие факторы — частая смена номенк- латуры продукции, непрогнозируемое появление дополни- тельных заказов Характерными для ГПС являются так- же частые изменения режимов функционирования систе- мы, связанные с переналадками оборудования или струк- турной перестройкой ГПС, например, при модульном принципе его построения. Таким образом, система опе- ративного управления ГПС должна быть «гибкойж, бы- стро приспосабливающейся к текущим изменениям S.I. Оперативное планирование Оперативное планирование представляет собой про- цесс программирования деятельности всех элементов тех- нологического подразделения в пределах заданного отно- сительно короткого интервала времени — планового пе- риода. В ГПС оперативный плановый период, как прави- ло не превышает месяца На этот период технологиче- скому подразделению системой планирования более вы- сокого уровня устанавливается план выпуска продукции по объему и номенклатуре. Результатом решения задачи календарного планирования является временное и про- странственное упорядочение комплекса запланированных работ. Временное упорядочение выражается в определе- нии сроков начала и окончания выполнения работ, а пространственное — в назначении работ на определен- ное технологическое оборудование. В механообработке, например, при оперативном планировании определяются сроки и порядок запуска в обработку отдельных детален или их партий, оборудование, на коюром они будут обра 134
батываться, а также комплекс вспомогательных операций (подготовительных, транспортных, контрольных и т. д.). Результаты процесса планирования оформляются в виде задания исполнителям основных и вспомогательных работ, которыми могут быть как автоматическое обору- дование, так и работники соответствующих профессий В автоматизированном варианте задание представляет собой комплекс программ, передаваемых в локальные системы управления либо непосредственно (прямое чис- ловое управление), либо иа программных носителях (перфолента, магнитным диск и т. д.). В неавтоматизи- рованном варианте задание исполнителю оформляется документально либо выдается на пульт дисплея, установ- ленного на рабочем месте. Формально задача календарного планирования ста- вится следующим образом. Пусть на технологическом участке требуется обработать п деталей (или их партий). Обозначим L. (дч, t,,) операцию с номером <(< = 1, т,), которая выполняется иад /-й деталью (/ = I, л); т, — число операций, которое необходимо выполнить над /-Й деталью; q4 - номер группы оборудования, настро- енного на выполнение операции L,(; t4 — номинальная продолжительность выполнения операций L,, Последовательность прохождения детали через груп- пы оборудования называется технологическим маршру- том и обозначается как G = (L„, L „Lu,,,). (5 1) Технологическим маршрут считается заданным и не может быть нарушен. Обозначим /°, — момент начала, /* — момент окончания операции L,,. Предположим, что каждая операция выполняется без перерыва, т. е. х ^овлстворяется соотношение 6* =/? + /., (5 2) Очевидным условием является также проведение в каждый момент времени на каждой единице оборудова- ния только одной операции, т. е. для любых двух опера- ции L, , L не может быть выполнено неравенство /? С'-,С Я (5 3) Совокупность чисел Р = {/“}, удовлетворяющая огра- ничениям (5.1) (5.3), называется календарным планом. Решение задачи календарного планирования заключает- ся в отыскании неизвестных величин {/,*}. При формаль 133
ной постановке задачи календарного планирования тре- буется задать целевую функцию планирования, которая каждому плану Р ставит в соответствие некоторое чис ло F(p), оценивающее эффективность плана. Целевую функцию часто называют критерием эффективности Задача оптимального планирования заключается в отыс кании такого плана Р*. который экстремизирует крите- рий эффективности F и удовлетворяет ограничениям. Критерии. Выбор критерия эффективности осуществ- ляется индивидуально для каждого конкретного произ- водственного подразделения по результатам анализа его экономических, организационных и технических особен- ностей. Наиболее часто используют следующие критерии эффективности. 1 Минимизация времени выпуска заданного объема продукции: Т = тах[Г 4-Г Г ] -► min, где / — множество единиц оборудования; Т. — суммар- ное время выполнения операции /-й единицы оборудова- ния; Т, р и Г/п₽ — суммарное время соответственно пере- наладок и простоя /-и единицы оборудования. Иногда используют частные случаи указанного крите- рия, например Т = тах[Г J -* min. 2 Максимизация загрузки оборудования: К = min^ т т—J -*тах. При этом объем выпуска продукции считается задан- ным 3 Минимизация суммарных производственных затрат: 5 = 2 (•$/• + 5/пер) 4- Stp 4- Spec —► min, где S„, S,nep — суммарные затраты соответственно на вы- полнение операций и переналадку /-го оборудования; Srp, Spec — суммарные затраты соответственно на транс- портно-складские операции и энергетические ресурсы. Часто в реальных производственных условиях целе- сообразно решать задачу календарного планирования с одновременным учетом нескольких критериев, т. е. как многокритериальную. Один из способов многокритериаль- 136
ной постановки задачи — составление компромиссного критерия. Пусть выбрано г локальных критериев (Ё1, Ег.... Ег), которые предполагается включить в компромиссный. Ими могут быть, например, перечислен- ные выше. Для каждого из локальных критериев реша- ется задача оптимизации и вычисляется его экстре- мальное значение E?(i= 1,г). На основе аналитического выражения каждого критерия записывается уравнение отклонений от оптимального значения Q, = E, — E?, < = Г7. Задаются также весовые коэффициенты к, для каж- дого критерия. Для построения компромиссного критерия используют различные выражения например либо аддитивную функ- цию свертки Q = £ min, либо функцию, обеспечивающую равномерность отклоне- ния каждого критерия от экстремального значения (с учетом веса) Q S К, min. Ограничения. Кроме очевидных ограничений (5 1) — (5 3) на практике при решении задач календарного пла- нирования приходится учитывать еще ряд других. Рас- смотрим некоторые из них, характерные для ГПС. 1 Структура сети транспортных маршрутов. Особен- ности этой структуры определяют возможности и время транспортировки деталей между оборудованием участка. Структура транспортной сети должна допускать выпол- нение всех технологических маршрутов, что является условием работоспособности участка. Характерной для некоторых ГПС является структура типа «передача через склад>. При ее использовании после обработки на опре- деленной единице оборудования деталь возвращается на склад и оттуда подается на дальнейшую обработку 2. Директивные сроки окончания обработки опреде- ленных деталей. Для ряда деталей внутри планового пе- риода могут быть заданы ограничения типа где 0( — директивный срок окончания обработки /-Й детали. 3. Ресурсные ограничения Выполнение заданного множества операций требует расхода определенных ма- 137
териалов, инструментов, энергии, которые в реальном производстве ограничены. Существенно успожняет зада- чу календарного планирования учет ресурсных ограни- чений, имеющих место не на всем интервале планирова- ния, а на его определенной части, что обусловливается временным дефицитом ресурсов опреде пенного вида. Кроме перечисленных ограничений приходится учиты- вать емкости накопителей и складов скорости работы штабелеров, наличие и готовность управляющих пре грамм и ряд других. Ограничения, как и критерии эфф тивиости, выбираются индивиду а пьно для каждого кон- кретного производственного подразделения Методы решения задач календарного планирования. Их можно условно разделить на три основных класса: аналитические, имитационные и аналитико-имитацион- ные. Аналитические методы основываются на ап- парате математического программирования, например динамического программирования, дискретной оптимиза- ции и т. д Эти методы принципиально позволяют полу- чить оптимальный план, однако они обладают сущест- венным недостатком — на практике эту возможность удается реализовать редко из-за высокой трудоемкости решения задач, учитывающих множество реальных фак- торов. Поиск решения несколько упрощается при исполь- зовании приближенных методов. Другой недостаток ана- литических методов — «жесткостьж модели. Структурно изменить однажды построенную аналитическую модель (например, дополнить систему ограничении, изменить форму критерия) может только математик достаточно высокой квалификации В условиях частых структурных изменений, характерных для ГПС, эксплуатация такой модели затруднительна и малоэффективна. Рассмотрим пример аналитического решения задачи календарного планирования. Пусть имеется два станка (т = 2) и п деталей, которые должны пройти обработку сначала на первом, а затем на втором станке. Трудоем- кость обработки описывается матрицей В = [/,,], где t4 — продолжительность обработки j-й детали на i-м станке 0=1, 2). Критерием эффективности будем считать сум- марную длительность обработки п деталей Оптимальным решением задачи является последовательность обработ- ки, минимизирующая критерий эффективности. Очевидно, что для получения оптимального решения требуется ми- нимизировать суммарное время простоя втор<по синк» । 138
min(/i*. /2/)<min(/w, f2>) На основе этого принципа строится следующий алго- ритм решения. 1. Из матрицы трудоемкости выбирается минималь- ное значение 2. Если i=l (первый станок), то /-я деталь распо- лагается первой, если / = 2 (второй станок), то /-я де- таль располагается последней. 3. Столбец, соответствующий /-й детали, в матрице трудоемкости вычеркивается 4 Повторяется п. 1, при этом порядок обработки, полученный на предыдущих шагах, сохраняется. Если число станков более трех, то алгоритм такого типа использовать не удается. Имитационные методы календарного плани- рования предусматривают проведение имитационного эксперимента на моделях, структурно подобных модели- руемому объекту. Структурное подобие модели и объекта моделирования существенно упрощает внесение текущих изменений в модель. Этот процесс в производственных условиях может быть организован в форме диалога с оператором, который ие имеет специальных математиче- ских знании. Имитационные методы строятся по схеме последова- тельного анализа вариантов на основе правил предпоч- тения. Эта схема связана с пошаговым конструирова- нием вариантов с помощью моделирования, в процессе которого имитируется прохождение материальных пото- ков через производственный участок. Алгоритм решения задачи строится следующим образом. Вычисляются мо- менты завершения операций на каждой единице оборудо- вания, формируется список всех операций, готовых к вы- полнению, и возможные варианты закрепления операций за оборудованием Полученные варианты сравниваются на основе принятых правил предпочтения и выбирается доминирующий вариант. Этот процесс последовательно повторяется до тех пор, пока все операции не будут рас- пределены по оборудованию. При построении имитаци- онной модели сравнительно просто учитываются такие грудноформализуемые в аналитических моделях ограни- 139
чения, как структура транспортной сети, временный де- фицит ресурсов, частичная и временная потеря работо- способности оборудования и ряд других. Рассмотрим основные наиболее часто используемые правила предпочтения. 1. Правило кратчайшей операции. Высший приоритет имеют операции с минимальной трудоемкостью t4. 2. Правило назначения в порядке поступления. Выс- ший приоритет имеет деталь, поступившая в очередь на обработку первой. 3. Правило назначения в порядке длительности ожи- дания Для каждой детали устанавливается время т, пребывания в очереди иа обработку, после которого она приобретает высший приоритет. Обычно это правило ис- пользуется в сочетании с другими, например с первым или вторым. 4. Правило последующей операции. Высшии приори- тет назначается деталям, которые в дальнейшем посту- пают на станки с длиной очереди ниже допустимой. Допустимой называется очередь, суммарная трудоем- кость обработки детален в которой не превышает вели- чины, определенной с учетом таких факторов, как произ- водительность и надежность оборудования. 5. Правило минимизации производственного цикла. Высшии приоритет получают детали с наибольшим сум- марным оставшимся временем обработки 2 где k - * последняя выполненная операция. Из приведенных правил предпочтения видно, что они имеют эвристический характер. В каждом конкретном случае выбору правила предпочтения должен предшест- вовать анализ специфики и условий функционирования данного производственного подразделения. Имитационные методы проще и с вычислительной точ- ки зрения, но с их помощью трудно или невозможно по- лучить оптимальное решение. Аналитико-имитационные методы строят- ся по схеме, включающей как аналитические, так и ими- тационные процедуры. Цель разработки таких схем - объединение достоинств обоих методов. Существуют два подхода к построению аналитико- имитационных процедур календарного планирования. Одни подход предусматривает двухэтапное реше- ние задачи. На первом этапе планируется обработка не- мо
большого числа укрупненных партий изделий на двух или трех группах технологического оборудования (на- пример. предметно-специализированных участках ГПС). При этом из-за небольшой размерности целесообразно использовать точные или приближенные аналитические методы решения (например, метод, описанный выше). На втором этапе строятся детальные календарные планы внутри каждой из выделенных групп оборудования с ис- пользованием имитационных методов. Декомпозиция за- дачи календарного планирования позволяет уменьшить размерности моделей и, как следствие, упростить и уско- рить решения. Недостатком такого подхода является сильная зависимость качества решения от точности оце- нок времени обработки укрупненных партий, используе- мых иа первом этапе Другой подход предполагает объединение анали- тических и имитационных процедур в рамках одной модели Рассмотрим постановку задачи календарного планирования участка ГПС и аналитико-имитационный метод ее решения. Пусть участок состоит из / единиц оборудования с накопителями емкостью Н„ /е/, центрального склада и транспортной системы, сеть маршрутов которой описыва- ется графом G(a, Р), где a — вершины графа, соответст- вующие конечным точкам маршрута; р — дуги, описы- вающие транспортные связи между ними. Будем считать, что иа участке требуется обработать N деталей / типов (l=l,L; Nr=i^Ni). Технологический маршрут детали /-го Типа задается графом операций G|. Вместо отдельных деталей можно рассматривать их партии, что не меняет математического содержания задачи. Каждая единица основного оборудования / может выполнять множество операций М,, причем переналадки с одной операции иа другую требуют затрат некоторых ресурсов. Эти затраты описываются матрицей Q/ = KJ. /е/, где cL. — затраты на переналадку /-го оборудования с h-й на «2-ю операцию. Затраты иа выполнение операции представляются матрицей С = [$,,] где s4 — затраты на выполнение /й операции ;-м оборудованием Начальные состояния оборудования заданы матрицей No = [г,,], где 141
II, если /-е оборудование настроено на выполнение t-и операции; О — в противоположном случае. В качестве критерия эффективности работы участка примем суммарные затраты на обработку заданного чис- ла деталей N. Задача календарного планирования со- стоит в распределении множества операций по оборудо- ванию и составлении оптимального расписания работы этого оборудования. Для формализации постановки задачи введем следую- щие переменные: (1, если t-я операция выполняется /-м оборудова- нием над Л-й деталью типа /; О — в противоположном случае. Пусть хч - число i-x операций, выполняемых на /-м оборудовании, тогда I. । Переменные х(/ определяют назначение множества операции на оборудование. Суммарные затраты на вы- полнение закрепленных операции для каждого оборудо- вания задаются выражением 2 SijX , jf=J. Ml Суммарные затраты иа переналадку /-го оборудова- ния рассчитываются с использованием вектора х, = {(гш, х?:,*'.xf:f-X е М„ I = 17L, Л = T7W/}, i е /. который является расписанием работы /-й единицы обо- рудования. Очевидно, что в векторе X,- часть компонент могут быть нулевыми. Обозначим через X, множество ненулевых координат вектора X,: X, = {х',*=ЛО; xtf^O}. Минимальное суммарное время переналадок /-го обо- рудования можно интерпретировать как минимальную длину пути в задаче коммивояжера. В рассматриваемой постановке задача коммивояжера интерпретируется сле- дующим образом. Множество городов есть множество X, а матрица переходов определяется следующим образом. 142
Дуге (xf*, xf*), /eL, k=i77lt, припишем затраты, рав- ные оо, если операция о предшествует операции / в гра- фе Gt, и затраты, равные с, .если операция ц предше- ствует операции ij. Дуге (х; ", х,'„‘) Л, IzeL; kt, kz = = I, Nt, для которой выполняются оба или хотя бы одно из неравенств Л =#=/2, Л|#=Л2. припишем затраты, равные с1,., а дуге (г ,,х!*)— затраты с1 . Минимальные суммар- ные затраты на переналадку /-го оборудования для дан- ного вектора X которые определяются решением соот- ветствующей задачи коммивояжера, обозначим через LXX,)- Задача коммивояжера является типовой задачей дискретной оптимизации, решаемой с использованием метода «ветвеи и границ» [1J. Задача минимизации затрат иа обработку заданного числа деталей N формально записывается следующим образом: S s х +£<(Х))— min I ! I . ,. при ограничениях, учитывающих: — заданное число деталей /-го типа Nt — технологические маршруты (графы G,) для каж- дого типа деталей; — множество операций Л/,. выполняемых /-м обору- дованием; — емкость накопителей и склада; - маршруты движения транспортных средств [граф G(a. ₽)]. Решение поставленной задачи ищется в простран- стве всевозможных расписаний работы оборудования, заданных совокупностью векторов {X,./е/}, с помощью аналитико-имитационнои процедуры, использующей схе- му «ветвей и границ». Расчет оценки построен на основе аналитической модели, а ветвление и пересчет рекор- да — на основе имитационного эксперимента. В качестве имитационной модели используются временные сети Пет- ри с разноцветными маркерами*. Пространство расписа- ний работы оборудования в терминах сети Петри пред- ставляется в виде дерева достижимости (ДД) Назначе- ние операции на оборудование определяется верши- ной ДД, а расписание их работы — последовательно- * См кн. 5 ..>и ории 4j\ iHiafeni 143
стью непосредственно достижимых вершин При этом ограничения задачи включаются в имитационную модель В алгоритме используется следующая схема ветвле- ния. Произвольная вершина у описывается совокупно- стью векторов (W } = {(г xtf'... I.eL,, kt—l.N. t= l.s), /<=/. где {W } является s-м частичным расписанием работы /-го оборудования. Множество дочерних вершин р(у) = = {у') вершины у есть множество вершин ДД, непо- средственно достижимых из у и получаемых в результате имитации. Каждая из дочерних вершин описывается совокупностью векторов {и }={('.,./*.....х,7.x, h^L, k,= ' — i. * +1 Для получения оценки находятся суммарные затраты, соответствующие вершине у: M{Wr¥})= 2 (2s х +RW )). I- .i.BM, где /?(W j затраты на переналадку, соответствующие вектору W Оценки g(y) вычисляются для тупиковой и нетупико- вой вершин ДД соответственно: = M{W })+min 2 (2 s 2 s х<;+ I /a/ J G le 4 I - i + 2 2 )‘e i-TT Во втором случае нахождение оценки сводится к ре- шению задачи целочисленного линейного программиро- вания при ограничениях (5.1) — (5.3): 2(2 2 2 + 2 2 2 Л*)-*1™- 144
Задача целочисленного линейного программирования решается методами отсечения. Для нахождения рекорда проводится имитационный эксперимент, в результате которого генерируется путь в ДД. Конечной вершиной пути является некоторая тупиковая вершина ут. Чтобы при пересчетах значений рекорда не получить просмотренные тупиковые верши- ны ДД, необходимо запомнить соответствующую сово- купность векторов {W/Tt). Для этого ведется список Sp(yT) тупиковых вершин, рассмотренных при пересчете значе- ний рекорда Пусть у — очередная, вновь построенная дочерняя вершина ДД. Проведем имитационный эксперимент, в ре- зультате которого получим тупиковую вершину у», до- стижимую из вершины у, которая отсутствует в списке ЗДут). Вершина ут описывается совокупностью векторов {w „} = {(г^х'7, ...гЛ ...,Х,'/-). /,€= L. k,= \,N , t= 1,л}. /е/. Найдем значение Если выполняется нера- венство h({Wni})<n*, где Q* — значение рекорда к дан- ному моменту, то значение рекорда изменяется и полага- ется равным fi*+i = M{W/T,}). Если f<({W/Tl})>Q*. то зна- чение рекорда остается прежним. Независимо от того, изменяется или нет значение рекорда, соответствующая тупиковая вершина заносится в список Sp(yt). Таким образом, алгоритм решения задачи календар- ного планирования состоит из следующих шагов. 1. Ветвится вершина у, ДД. 2. Если у, — тупиковая вершина, то осуществляется переход к п. 12. 3. Выбирается одна из дочерних вершин у,Е0(у,) и вычисляется оценка g(y,). 4. Если g(y,)>Q, то исключается вершина у, из даль- нейшего рассмотрения. Осуществляется переход к п. 11. 5. Проводится имитационный эксперимент для полу- чения тупиковой вершины у, ДД и соответствующих ей векторов {W/Tl} 6. Если в списке Sp(yT) представлена тупиковая вер- шина, которая описывается векторами {W/Tl}, то исклю- чается вершина у, из дальнейшего рассмотрения. Осуще- ствляется переход к п. 11. 7. Помещается вершина ут в список SP(yT). 8. Находится значение f.({WnJ). 145
9 Если M{W ,})>й, то значение рекорда остается прежним 10. Пересчитываются значения рекорда. 11. Если не все дочерние вершины раскрыты то осу- ществляется переход к п. 3. 12 Если все нераскрытые вершины являются тупико- выми, то {W,Vt} — оптимальное решение задачи. Останов. 13 Выбирается из множества всех неразветвлениых вершин {у} вершина yr: s(y3^c(y)VY^{y}- Осуществля- ется переход к п. 1. 5.2. Оперативная корректировка планов Оперативная корректировка заключается в разработ ке новых планов иа весь оперативный период или часть его, в изменении фрагментов плана при условии сопря гаемости с частями, оставшимися без изменения, в сме- щении времен запуска деталей в обработку в пределах допустимых интервалов. Необходимость корректировок возникает обычно из-за отказов оборудования; дефицита заготовок, инструмента, материалов; отсутствия управ- ляющих программ; изготовления брака. Возможности корректировки оперативного плана должны быть предусмотрены общей стратегиеи опера- тивного управления и методикой календарного планиро- вания. Одной из распространенных стратегии оперативного управления является выделение сверхоперативных интер- валов планирования. В соответствии с ней месячный оперативный плановый период делится на несколько ко- ротких сверхоперативных интервалов (СОИ), например текадных, недельных или суточных Пусть для опреде- ленности в качестве СОИ выбрана неделя. Задача ка- лендарного планирования решается для первых двух недель. По истечении первой недели составляется кален- дарный план для третьей, по истечении второй — для чет- вертой. Если система оперативного планирования более высокого уровня организована так, что план следующего месяца разрабатывается не позже третьей недели теку- щего месяца, то описанная стратегия позволяет осу- ществлять непрерывное оперативное планирование с «бе- гущим» горизонтом. Корректировки в такой системе осуществляются следующим образом. Пусть закончился некоторый Л-й СОИ и планируется (Л-|-2)-й На основе данных контроля выполнения плана Л-го СОИ определя- 146
ется множество Р\ невыполненных работ Затем опреде- ляется множество работ Рг, которые необходимо произ- вести для исправления брака или изготовления деталей взамен забракованных На основе дополнительной ин- формации диспетчером формируется множество допол- нительных работ Рз. появление которых может быть связано, например, с изменением приоритетов заказов иа готовую продукцию. Множество работ Р*+2 на (Л + 2)-м СОИ образуется объединением работ Р^ =PlUP2UP3UP4, где Pt - работы, запланированные заранее на Л+2-й СОИ. Очевидно, для выполнения множества работ Л, Рг и Р3 необходимо иметь определенный резерв производи- тельности, который должен быть предусмотрен на этапе разбиения месячной программы иа СОИ. Рассмотрим одни из способов обеспечения резерва. Все работы делятся на обязательные и фоновые. К обяза- тельным работам Роб относятся работы, критические сро- ки исполнения которых находятся в планируемом СОИ; к фоновым работы, критические сроки выполнения которых позже планируемого периода. Множество ра- бот Р*+2 анализируется с точки зрения обеспеченности ресурсами и производственными мощностями. Если суще- ствует возможность выполнения всего множества работ Р*+2, то оно используется как исходное для решения задачи календарного планирования. Если такой возмож- ности нет, то Р*+2 представляется как объединение F‘+’ = P^UP*+’ Календарный план составляется для работ Pot2. Про- изводственные мощности, оставшиеся свободными, загру- жаются работами из множества Рф+2. Гибкость системы оперативной корректировки во мно- гом определяется длительностью СОИ Очевидно, чем короче СОИ, тем большую скорость реакции на возму- щение можно обеспечить. Однако длительность СОИ существенно зависит от гибкости и оперативности других планирующих служб предприятия, в частности заготови- тельного и инструментального производства, материаль- но-технического снабжения, службы подготовки управ- ляющих программ и т д. При достаточной гибкости этих служб можно выбрать суточный СОИ и составить кален- 147
дарный план, например, иа 3 суток. По истечении k суток задача календарного планирования с учетом корректиро- вок решается иа (Л4-3)-е сутки. Описанная стратегия оперативной корректировки мо- жет быть расширена за счет изменения календарного плана внутри одного СОИ. Возможность такой коррек- тировки должна быть предусмотрена на этапе календар- ного планирования за счет введения локальных резервов времени по всем или наиболее важным единицам обору- дования. Локальный резерв — это интервал времени, иа который можно увеличить продолжительность операции, не сдвигая момент начала следующей операции. Локаль- ные резервы времени образуются как за счет невозмож- ности полной загрузки оборудования даже при оптималь- ном решении задачи календарного планирования, так и за счет целенаправленного введения их в расписание. Варьируя локальными резервами, диспетчер может ском- пенсировать временные отказы оборудования, включить в план дополнительные заказы, а также учесть ряд дру- гих требований, не нарушая основную структуру кален- дарного плана. Для того чтобы локальные резервы вре- мени не приводили к снижению загрузки оборудования, диспетчеру предоставляется множество фоновых работ, которыми могут быть заполнены локальные резервы вре- мени в том случае, если их не потребовалось использо- вать для компенсации возмущений. Маневрируя локальными резервами времени, удается скомпенсировать относительно слабые возмущения в про- изводственной системе, такие, как непродолжительная остановка одного или нескольких станков, кратковре- менные нарушения поставок заготовок, сырья, материа- лов и т. д. Возмущающие воздействия, связанные со значительными изменениями приоритетов заказов на из- делия, существенными нарушениями сроков поставок комплектующих изделий, материалов, сырья, длитель- ными отказами оборудования, как правило, не удается скомпенсировать за счет локальных резервов времени. При возникновении таких ситуаций требуется быстро рассчитать новый оперативный план для оставшейся час- ти СОИ. Новый план должен быть рассчитан за время, не превышающее интервал, в течение которого производ- ственное подразделение может работать в соответствии с прежним планом. На практике этого времени бывает недостаточно для поиска оптимального плана, поэтому приходится использовать приближенные методы, т. е 148
поступаться его качеством с целью ускорения расчета. Время, за которое требуется рассчитать новый план, в зависимости от производственных условий может из- меняться в широких пределах и в наиболее критических ситуациях составлять несколько десятков минут. Следо- вательно, в составе математического обеспечения систе- мы оперативного планирования ГПС необходимо иметь ряд алгоритмов, различающихся «степенью оперативно- сти», т е. ожидаемым максимальным временем поиска нового плана. Рассмотрим два приближенных алгоритма, представ- ляющих собой модификации описанного в $ 5 1 анали- тико-имитационного алгоритма расчета оптимального календарного плана. Как в первом, так и во втором алго- ритме ускорение расчета достигается за счет изменения стратегии поиска в пространстве состояний. «Ценой» ускорения поиска плана является уменьшение точности решения. В первом приближенном алгоритме используется метод «ветвей и границ» без возвратов [3], который заключается в следующем Для каждой вер- шины ветвления строятся все дочернин вершины и для каждой рассчитывается оценочная функция Для даль- нейшего ветвления выбирается дочерняя вершина с наименьшим значением оценочной функции. Все осталь- ные вершины исключаются из дальнейшего рассмотре- ния. Способ формализации, процедуры ветвления и рас- чета оценок в рассматриваемом приближенном алгоритме аналогичны использованным в оптимальном алгоритме. Опишем пошаговую схему алгоритма. 1. Ветвится вершина у,ДД и определяется множество дочерних вершин Р(у<)- 2. Если у, — тупиковая вершина, то ( U ,) решение задачи. Останов. 3. Вычисляется нижняя оценка . , ) для каждой вер- шины у,^р(уг) 4. Выбирается вершина у*-=р(у,), такая, что g(yj)s для Vb^P(Yr)- Осуществляется переход к шагу 1. Во втором приближенном алгоритме используется метод случайного поиска, который позволя- ет ускорить процесс решения по сравнению с решением предыдущего алгоритма. Стратегия ветвления в нем стро- ится следующим образом. Для каждой вершины ветвле- ния случайным образом порождается только одна дочер- няя вершина и вычисляется значение ее оценочной 149
функции. Вычисленное значение сравнивается с заранее заданным критическим значением оценочной функции 5*. которое определяется текущей производственной си- туацией. Например, если оценочная функция выражает время выполнения планового задания, то ее критическое значение определяется с учетом продолжительности вре- менного интервала, в течение которого желательно вы- полнить план. Если оценка рассматриваемой дочерней вершины превышает критическое значение, то случайным образом порождается следующая дочерняя вершина. В противоположном случае порожденная вершина ис- пользуется для дальнейших ветвлений Опишем пошаговую схему такого алгоритма 1 Рассматривается вершина у,. 2 Если у, — тупиковая вершина, то {— решение задачи Останов. 3. Случайным образом порождается одна из дочерних вершин у,. Вычисляется оценка g(y,). 4. Если g(ys)-^s*. то полагается r—s и осуществляет- ся переход к шагу 1. 5. Если не все дочерние вершины порождены, то осу- ществляется переход к шагу 3. 6. Выбирается из множества всех дочерних вершин такая вершина у;, что e(Yi)^s(Y«) Для Vy«ep(yr). Осу- ществляется переход к шагу 1. Трудоемкость алгоритма, а следовательно, его быст- родействие зависят от числа вершин, порождаемых в процессе поиска решения. Очевидно, лишь в том случае, если на всех уровнях ветвления g(y)>e*. описанный приближенный алгоритм породит такое же число вершин, как и предыдущий Во всех других случаях число порож- даемых им вершин будет намного меньше, чем в первом алгоритме. Рассмотрим способы оценки трудоемкости описан- ного в § 5.1 оптимального алгоритма календарного пла- нирования и первого приближенного алгоритма. Под трудоемкостью здесь понимается среднее число вершин ДД, порождаемых в процессе поиска. Трудоемкость оптимального алгоритма Ищется верх- няя оценка трудоемкости. Пусть Р,(у) - вероятность иеотсева дочерней вершины у на i-м уровне дерева дости- жимости. Вероятность Р,(у) определяется выражением 150
Обозначим через R,(y) среднюю трудоемкость вычис- пения нижней оценки вершины у иа /-м уровне дерева достижимости: Я(у) L(n)Z. (5 4) где Цп) - трудоемкость решения задачи целочисленного линейного программирования для вершины у иа i-м уров- не в зависимости от размерности п задачи; Z - число задач целочисленного линейного программирования. Тогда трудоемкость алгоритма Л.А(у). (5 5) 1де Л, среднее число вершин на i-м уровне; т число уровнен Для h, справедлива оценка /г цу). (5 6) где k максимально возможное число возбужденных переходов для любой маркировки ц дерева достижи- мости. Пусть задано число g'ma4, такое, что Й'<е’,,а»^п1ахе(у), где некоторое значение рекорда. Будем считать, что оценка g(y) является случайной величиной, равномерно распределенной иа отрезке (0, maxg(y)]. Тогда для лю- бого текущего значения рекорда й вероятность Р(у)— — P(t,(y) й) оценивается сверху числом й'/ё^.ж- С учетом (5.4) (5 6) оценка сверху трудоемкости алгоритма равна / S Z..(n)/(^)‘ (5 7) Трудоемкость первого приближенного алгоритма Ищется верхняя оценка трудоемкости При поиске решения с помощью данного алгоритма рассчитывается нижняя оценка не более чем для кт вершин дерева достижимо- сти, где k — максимально возможное количество воз- бужденных переходов для любой маркировки ц дерева достижимости; т — число уровней дерева достижимости. Тогда трудоемкость алгоритма оценивается величиной /<£ kL,(n)l. (5 8) Сравнение выражений (5 7) и (5.8) показывает, что трудоемкость приближенного алгоритма существенно меньше трудоемкости оптимального алгоритма. 151
S.3. Оперативным контроль Оперативный контроль осуществляется на всех трех уровнях системы оперативного управления. На первом и втором иерархическом уровнях контролируется работоспособность оборудо- вания, правильность исполнения программ системы чис- лового управления, точность отработки управляющих воздействий исполнительными механизмами. Важное зна- чение имеет диагностика состояния оборудования и ин- струмента, с помощью которой удается предотвратить аварии и отказы Для диагностирования состояния обо- рудования используется информация, получаемая от дат- чиков усилий и моментов, установленных на наиболее нагруженных кинематических элементах оборудования, а также от датчиков, измеряющих значения тока в элек- троприводах. Управляющая ЭВМ периодически «считывает» пока- зания этих датчиков, сравнивает их с заранее заданными критическими значениями и в случае превышения этих значений либо выдает сообщение оператору, либо ава- рийно останавливает работу оборудования. Для диагностирования состояния режущего инстру- мента чаще всего используется информация об измене- нии тока в приводе рабочего органа станка График изменения тока привода во времени имеет достаточно сложную форму, определяемую большим числом разно- образных факторов Поэтому задача диагностирования состояния режущеги инструмента часто ставится как задача распознавания иа графике изменений, вызванных износом или поломкой инструмента. В комплекс технических средств оперативного контро- ля входят также и измерительные (контрольные) робо- тизированные комплексы. На основе информации, полу- чаемой от этих комплексов, формируется множество работ Р2, которые необходимо произвести для исправле- ния брака или изготовления деталей взамен брако- ванных В связи с возрастанием сложности, интенсивности, энергонасыщеиности и уровня автоматизации совре- менных технологий уделяется большое внимание как опе- ративности информирования оператора о состоянии производственной системы, так и форме ее представле- ния, которая должна быть легко воспринимаемой, спо- собствующей быстрому анализу ситуации и своеврсмен- 152
иому принятию решений. С этой целью широко исполь- зуются цветные графические дисплеи, иа которых пред- ставляется мнемосхема контролируемого участка Инфор- мация о состоянии производственной системы поступает на экран дисплея в виде мнемонических символов, окраска которых может ассоциироваться со степенью важности данного сообщения для оператора. Обычно на мнемо- схему поступает сигнальная информация и несколько наиболее важных количественных показателей производ- ственного процесса. Если оператора интересует более подробная информация, он может вызвать ее на экран этого же или другого дисплея, передав соответствующий запрос ЭВМ. На третьем иерархическом уровне производится диспетчерский контроль хода выполнения оперативного плана Он характерен для любого типа дискретного производства, в том числе и для ГПС. В массовом про- изводстве диспетчерскому контролю подлежат в первую очередь ритмы работы технологических линий, а также уровни заделов деталей В условиях серийного производ- ства основными контролируемыми параметрами служат сроки запуска и выпуска партии деталей, сборочных единиц, готовых изделий и уровень запасов деталей, материалов, сырья. В единичном и мелкосерийном про- изводстве объектами диспетчерского контроля становятся этапы работ или даже отдельные технологические опе- рации, подготовка к выполнению работ, а также обеспе- ченность ресурсами всех видов. Диспетчерский контроль в ГПС имеет свою специфи- ку. Основная особенность — сложность получения ин- формации о состоянии оборудования, ходе выполнения технологических операций и отдельных этапов работ, вызванная «безлюдностью» таких производств. В усло- виях высокого уровня автоматизации, когда на участке присутствует только диспетчер и небольшое число опера- торов-наладчиков (что особенно характерно для второй и третьей смен работы), информация о состоянии произ- водства может быть получена только от соответствующих датчиков. Однако их число (как и надежность) огра- ничено, что приводит к определенному «дефициту» информации о процессе. Не намного лучше положение при прямом числовом управлении. Связь между цент- ральной управляющей ЭВМ и устройствами числового программного управления позволяет передавать в цент- ральную ЭВМ информацию о состоянии станка и выпол- 153
няемых в данный момент операциях. Однако и в случае прямого числового управления проблема информацион- ного дефицита не решается полностью. Существует ряд методов, позволяющих организовать диспетчерский контроль с применением компьютерной техники и методов математического моделирования. Один из них построен иа использовании синхронных имитационных моделей технологического процесса. Ос- новная идея этого метода — создать имитационную модель технологической подсистемы, процесс функциони- рования которой синхронизирован с процессом в реаль- ном объекте, средства анализа рассогласований реаль- ного и моделируемого процессов, а также аппарат, позволяющий фиксировать на модели и сообщать дис- петчеру о важных с точки зрения контроля событиях, которые не идентифицируются информационными сред- ствами иа реальном объекте. Структура системы диспет- черского контроля такого типа представлена на рис. 5.1. Ее центральным элементом является имитационная мо- дель синхронного типа. Рассмотрим некоторые принципы се построения. 1. Концептуальной основой модели является схема состояний, в соответствии с которой процесс представ- 1яется последовательной сменой состоянии seS во вре- мени, где S — множество состоянии, в которых может находиться моделируемый объект. Переход из состояния Рис 51. Структура системы оператианого контроля с синхронно* моделью 154
5, в состояние s,eS) называют событием е*еЕ, где Е - множество событий, возможных в моделируемой системе. 2. Выбор множества состояний для построения мо- дели осуществляется с учетом их значимости для диспет- черского контроля. Если состояние в моделируемом объекте имеет заранее известную временную продолжи- тельность. то в модели этому состоянию приписывается такая же продолжительность 3 Имитационная модель описывает только техноло- гический процесс (технологическую подсистему). Вхо- дами модели являются управляющие воздействия, по- ступающие от системы управления технологическим про- цессом одновременно как в объект управления, так и в его модель. 4. Функционирование имитационной модели осуществ- ляется под управлением монитора реального времени и сигналов системы управления технологическим процес- сом, причем темпы реального процесса и процесса в мо- дели должны совпадать 5. Любому состоянию seS в имитационной модели мо- гут быть присвоены метки. 6. В процессе функционирования имитационной мо- дели генерируются события е»еЕ Ес пи предшествующее нли последующее состояния некоторого события е* имеют метку, то эта же метка присваивается событию е*. Метка события состоит из двух частей: уникальный код события и код типа события. Модель такого типа может быть построена с использованием аппарата сетей Петри. События, происходящие в модели и объекте, делятся на три типа: синхронизирующие, контролируемые и идентифицируемые. Информация о синхронизирующих событиях используется для устранения временных рас- согласований между процессами в модели и в объекте из-за случайных отклонений реальной продолжительно- сти процесса от заданной В качестве синхронизирующих могут использоваться такие события, как отправка на обработку партии деталей, прибытие деталей на склад после обработки. Информация об этих событиях пере- дается в интерпретатор системой управления автомати- зированным складом, а затем обрабатывается анализа- тором. Результатом обработки информации является корректировка текущего состояния модели, а также пере- счет времени в календаре событий и состояний, который ведется в мониторе реального времени 155
К контролируемым относятся события, наступление которых требуется фиксировать и анализировать в ходе диспетчирования технологического процесса. Информа- ция об этих событиях поступает в анализатор из реаль- ного процесса и модели в виде двух пар: (е, /Р) и (е, /«), где е — код события; /Р и — соответственно время наступления реального события и время наступления этого же события в модели. В анализаторе содержится информация о допустимой величине рассогласования /р и Если рассогласование превышает допустимое, то фор- мируется и передается сообщение диспетчеру. Информа- ция о контролируемых событиях также используется для сиихронизации процессов в модели и объекте К идентифицируемым относятся события, которые не могут быть обнаружены информационной системой ГПС, однако они важны для контроля и регулирования техно- логического процесса Метки состоянии, связанные с эти- ми событиями, и алгоритмы их идентификации задаются при настройке модели и анализатора. После идентифика- ции события информация о нем передается диспетчеру, как правило, в виде запроса, требующего некоторого ответа, например подтверждения факта свершения дан- ного события. В зависимости от ответа анализатор корректирует состояние модели н календарь. Рассмотрим вариант состава программных и аппарат- ных средств реализации системы контроля, использую- щей описанные принципы (см. рис. 5.1). Информация от датчиков и системы управления ГПС через стандартный интерфейс поступает в интерпретатор, функциями которого являются анализ сигналов и перевод их иа язык имитационном модели. Например, если ими- тационная модель представляет собой сеть Петри, то интерпретатор на основе анализа входных сигналов управляет соответствующими переходами сети. Сигналы интерпретатора, несущие информацию о со- бытиях, воспринимаются также анализатором, в котором происходит распознавание типа события и занесение его в соответствующий список событий Монитор реального времени представляет собой «службу времени», состоящую из системы таймеров, программы управления таймерами, а также программных или аппаратных средств пересчета времени в соответ- ствии с синхронизирующей информацией Систему тай- мере*. можно рассматривать как календарь состояний И n>6willH И6
Анализатор — это комплекс, содержащий программы логической обработки информации, поступающей из реального объекта и модели, программы ведения спис- ков событий и программы, управляющей функциониро- ванием анализатора. Средства диалога с диспетчером осуществляет пере- вод сообщений с языка внутреннего представления (языка имитационной модели) на язык, воспринимаемый диспетчером (например, символы на мнемосхеме процес- са -или фразы на профессиональном диалекте диспет- чера). Эти же программные средства служат для обрат- ного перевода Сообщения, используемые в диалоге, делятся на три группы: первая — информация диспет- черу, не требующая от него ответа; вторая — запросы у диспетчера определенной информации; третья — за- просы диспетчером информации о состоянии системы. Средства корректировки модели и настройки анали- затора представляют собой совокупность редакторов диалогового типа, позволяющих вносить структурные и параметрические изменения в модель, соответствующие изменениям, происшедшим в объекте, расставлять или изменять метки состояний, а также корректировать алгоритмы логической обработки информации.
СПИСОК ЛИТЕРАТУРЫ К глаае I I . Автоматизация производства н промышленная электроника. Энцик- лопедия/Под ред А. И. Берга. В А Трапезникова М • Наука. 1962; 1965 2 Артоболевский И И Теория механизмов н машин - М Наука. 1975 3 Медведев В. С.. Лесков А Г. Ющенко А С Система управления манипуляционными роботами. М.: Наука. 1978 4 Куоков Ф М Супервнзорное управление манипуляционными робо- тами — М : Наука, 1980 5 Лол Р Моделирование, планирование траекторий и управление движением робота-манипулятора — М . Наука, 1976 6 Динамика управления роботами/Под ред Е. И. Юре<ича М Наука, 1984 К главе 2 1 Кулешов В С., Лакота И А Динамика систем управления манипу- ляторами. М.. Энергия, 1971 2 t^-рещагин А.Ф , Генерозов В 7., Куч ров В Б Алгоритмы управ- ления манипулятором по вектору скорости — Изв АН СССР, Техническая кибернетика, 1975. № 3, с. 66—71. К главе 3 1 Гурфинкель В. С., Гурфинкель Е. В.. Девянин £ А и др. Макет шестиногого шагающего аппарата с супервизориым управ- книем Ис едоваиие робототехнических систем. М Наука. 1982 2 В-кобратович М. Шагающие роботы и антроморфные механизмы — М . Мир, 1976 3 Охоцимский Д Е. Голуб ев Ю. Р. Механика и управление движени- ем автоматического шагающего аппарата М Наука. 1984 К главе 5 I Пападимитриу X Стайглиц К Комбинаторная оптимизация. М : Мир. 1985 2 Основы автоматизации управления производством / Под ред И М Макаро-а М : Высшая школа 1983 3 Те-^ия расписания и bnbhc.ihk иные машины / Пот р« i Э Г. Коффман । М Н.пю. 1' si
Введение 5 Глава 1 Робот как объект управления 9 1 I Классификация систем управления роботами 10 I 2. Система координат. Выбор и преобразования 14 I 3 Основные кинематические соотношения Пря- мая и обратная задачи кинематики 19 I 4. Динамика роботов........................... 30 / чва 2 Системы дистанционного и интерактивного управления роботами 9 2 * Основные виды систем дистанционного управ- ления роботами ... ... 39 2 Системы управления манипуляторами двусто роииего действия с активным отражением уси тия (о< I атимые следящие системы) 44 ' } Основные способы полуавтоматического управ ъния манипуляторами ...........48 2 4 Интерактивные системы управления роботами 51 / .о 3 Системы автоматического управленип роботами 3 I Особенности систем автоматического управле S! 3 .’ Цикловые системы управления 3 1 Позиционно-контурные системы управления 3 • Адапти ые системы управления 3 Иителлектные системы управления . 3 6. Управление шагающими роботами I Глава 4 Групповое управление роботами и оборудованием I 4 1 Групповое управление оборудованием I 4 2. Групповое управление роботами ... 122 Глава 5 Оперативное управление в гибких автоматизированных производствах ... ил I Оперативное планирование 134 "• ' Оперативная корректировка планов 146 > I О । п।•-чн • • • ч оль 152 Слвспк 1н*ер пуры 1 '
УЧЕБНОЕ ИЗДАНИЕ Игорь Михайлович Макаров Виль Закирович Рахманк Виктор Михай ович Н -~-~в Сгчгей Алексеевич Бги- • 1 • ксей Михайлович И ха О» гей Викторович Манько Ал^рей Афанасьевич Ахрем Робототехника и гибкие автоматизированные производства В 9-ти книгах Кн. 3. Управление робототехническими системами и гибкими автоматизированными производствами Заведующая редакцией Н И. Хрусталева Рьжжтор С М Оводова \' .-жиик В В. Гарбузов \. < зжествениый редактор М И Чурниов Ь нтческий редактор Т. Д Гарина Ь «уектор Р К Косинова ИБ № 6026 Изд № Стд-521. Сдано в набор 02 0186 Подл в печать 29 04 86 Т 07830 Формат 84x108'/,, Бум. тип N» 1. Гарнитура литературная. Печать высо- кая Объем 8,4 усл. печ. л , 8,71 усл. кр. отт, 8.0 уч изд л. Тираж 50 000 зкз. Зак № 1000 Цена 35 коп. Издатс зьство «Высшая школах. 101430, Москва, ГСП 4, Неглиниая у» д 29/14 Ярославский яолиграфкомбииат Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли 150014. Ярославль, ул. Свободы. 97