/
Теги: искусственный интеллект кибернетика
Год: 2026
Текст
ЭНЦИКЛОПЕДИЯ БЫСТРЫХ ЗНАНИЙ
ДЛЯ ТЕХ, КТО ХОЧЕТ ВСЕ УСПЕТЬ
11СКУССТВЕ1II1ЫЙ
I II1ТЕЛЛЕКТ
GPTjjalle
Grok Claude
Qwen DeepSeek
Mistral
DeepSeek Qwen
Midjourney
Gemini Dalle
GPT
LLaMA
ЧАТ-БОТЫ И НАВИГАТОРЫ
ПОЛЕЗНЫЕ ПРОМПТЫ
НОВЫЕ ВОЗМОЖНОСТИ ДЛЯ РАБОТЫ И САМОРАЗВИТИЯ
GPT, MISTRAL, DEEPSEEK
11СКУСС1 BEIII 11 >11 I
III1ТЕЛЛЕКТ
xDalle
Grok Claude
Qwen DeepSeek
Mistral
DeepSeek Qwen
Midjourney
Gemini Dalle
GPT
LLaMA
БОМБОРА
ИЗДАТЕЛЬСТВО
M jckb3
УДК 004.8
ББК 32.81
И86
И86 Искусственный интеллект. — Москва : Эксмо,
2026. — 128 с.: ил. — (Энциклопедия быстрых знаний.
Для тех, кто хочет все успеть).
ISBN 978-5 04-225558 8
С тех пор как искусственный интеллект стал частью нашей по-
вседневности, мы не перестаем рассуждать о его этике, мышлении,
об уместности его применения в той или иной области и о многом
другом. Эта книга поможет получить целостное представление об
ИИ: как устроено его мышление, как он обучается, как анализиру-
ет данные, строит прогнозы и почему ошибается. Вы разберетесь,
с какими задачами ИИ справляется хорошо, а в чем он ограничен,
и сможете использовать технологии эффективно и безопасно.
УДК 004.8
ББК 32.81
ISBN 978-5-04-225558-8
© ИП Москаленко Н.В., текст и оформление, 2025
© Оформление. ООО «Издательство «Эксмо», 2026
СОДЕРЖАНИЕ
На какие вопросы отвечает эта книга.........................4
Предисловие.................................................6
Глава I. Как все начиналось: от Лейбница до первых программ.8
Глава II. Взлеты и падения: 1960-1980-е....................22
Глава III. Наконец все заработало: 1990-2010-е.............34
Глава IV. ИИ в повседневности сегодня......................53
Глава V. Эпоха больших языковых моделей....................71
Глава VI. Современные направления и развилки в развитии ИИ.83
Глава VII. ИИ: помощник, а не конкурент...................100
Глава VIII. Взгляд в будущее ИИ ...........................117
Литература.................................................126
НА КАКИЕ ВОПРОСЫ
ОТВЕЧАЕТ ЭТА КНИГА
КАК ПОЯВИЛАСЬ ИДЕЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА?
Она возникла из попыток формализовать человеческое
мышление и представить рассуждение как последователь-
ность операций. Глава I
ПОЧЕМУ ПЕРВЫЕ УСПЕХИ ИИ БЫСТРО СМЕНЯЛИСЬ
РАЗОЧАРОВАНИЕМ?
Ранние системы хорошо справлялись с узкими задачами,
но теряли работоспособность за пределами заранее опи-
санных правил. Глава I
ЧТО ПОРОДИЛО ОПТИМИЗМ 1960-Х ГОДОВ ВОКРУГ ИИ?
Первые заметные успехи: программы для логических задач,
игр и машинного перевода, [лава II
КАКИЕ ИДЕИ ПЕРЕЖИЛИ СПАД И ОКАЗАЛИСЬ
РЕШАЮЩИМИ ПОЗЖЕ?
Ставка на обучение с помощью баз данных и постепенный от-
каз от попыток описать мир жестким набором правил. Глава II
ПОЧЕМУ РОСТ ОБЪЕМА ДАННЫХ СТАЛ ПЕРЕЛОМНЫМ
МОМЕНТОМ?
Он позволил моделям учиться на реальных примерах
и сравнивать подходы на схожих задачах. Глава III
ЧЕМ ГЛУБОКИЕ НЕЙРОСЕТИ ОТЛИЧАЮТСЯ ОТ ПРЕЖНИХ
ПОДХОДОВ?
Они сами формируют многоуровневые представления дан-
ных, не полагаясь на заданные разработчиком или пользо-
вателем признаки. Глава III
ПОЧЕМУ РАСПОЗНАВАНИЕ РЕЧИ И ИЗОБРАЖЕНИЙ СТАЛО
ВОЗМОЖНЫМ ПОЧТИ ОДНОВРЕМЕННО?
Для этих задач одновременно сошлись данные, вычисли-
тельные ресурсы и универсальные методы обучения. Глава IV
ЧТО ТАКОЕ БОЛЬШАЯ ЯЗЫКОВАЯ МОДЕЛЬ НА ПРАКТИКЕ?
Это система, обученная продолжать текст и используемая
как основа для диалога, анализа и помощи человеку. Глава I/
ПОЧЕМУ ТАКИЕ МОДЕЛИ КАЖУТСЯ УНИВЕРСАЛЬНЫМИ,
НО ВСЕ ЖЕ ОШИБАЮТСЯ?
Они хорошо создают связные ответы, но не всегда разли-
чают проверенное знание и правдоподобное предположе-
ние. Глава V
ЧТО ТАКОЕ АГЕНТСКИЕ СИСТЕМЫ?
Это ИИ, который не только отвечает на запросы, но и вы-
полняет цепочки действий с помощью инструментов. Глава VI
ПОЧЕМУ СПОРЯТ О РАЗМЕРАХ МОДЕЛЕЙ?
Рост качества все чаще упирается в стоимость вычисле-
ний, и параллельно развивается путь повышения эффек-
тивности. Глава VI
КАК ИИ РЕАЛЬНО ПОМОГАЕТ ЧЕЛОВЕКУ В РАБОТЕ?
Как инструмент для структурирования мыслей, создания
черновиков, поиска вариантов и анализа — при обязатель-
ной проверке результата. Глава VII
ПОЧЕМУ ИИ ИНОГДА УКЛОНЯЕТСЯ ОТ ОТВЕТА?
Из-за требований безопасности, правовых ограничений
и высокой цены возможной ошибки. Глава VII
КАК ИИ ВЛИЯЕТ НА ЗАНЯТОСТЬ И ЭКОНОМИКУ?
Он меняет содержание профессий и ценность навыков,
а не просто вытесняет людей. Глава VIII
ЧТО ПОНИМАЮТ ПОД ОБЩИМ ИИ И СВЕРХИНТЕЛЛЕКТОМ?
Это разные гипотезы о будущем, которые не стоит смеши-
вать с возможностями нынешних систем. Глава VIII
КАК ЧЕЛОВЕКУ ВЫСТРАИВАТЬ ОТНОШЕНИЯ С ИИ?
Понимать границы автоматизации, сохранять контроль
и брать ответственность за ключевые решения. Глава VIII
НЕ ПЕРВЫЙ
БУМ ИИ
Интерес к ис-
кусственному
интеллекту
уже переживал
волны подъ-
ема. В 1956 году
на Дартмутской
конференции
исследователи
полагали, что
ключевые задачи
ИИ будут решены
в течение одного
поколения. Ре-
альность оказа-
лась сложнее:
не хватило ни вы-
числительных
ресурсов, ни по-
нимания природы
мышления
ПРЕДИСЛОВИЕ
Искусственный интеллект за корот-
кое время стал частью повседневной
жизни. Он участвует в работе с инфор-
мацией, текстами и данными, исполь-
зуется в программировании, применя-
ется для создания изображений, дает
рекомендации и может помочь автома-
тизировать различные процессы. При
этом для многих он остается техноло-
гией с размытыми границами: не всегда
понятно, как именно он устроен, на что
реально способен и где проходят пре-
делы его применения.
На сегодняшний день ИИ все чаще
воспринимается как универсальный
помощник, но его поведение нередко
оказывается неоднозначным. Он мо-
жет быть полезным инструментом для
анализа данных и подготовки реше-
ний, но при этом уверенно ошибаться,
подменять проверяемую информацию
правдоподобными объяснениями и тре-
бовать внешнего контроля. По мере
того как такие системы встраиваются
в рабочие процессы, становится важ-
ным понимать, в каких режимах они ра-
ботают надежно, а где их использова-
ние связано с рисками.
К этому добавляется более широкий
контекст. ИИ влияет на рынок труда,
организацию работы и распределе-
ние ответственности. Он развивает-
ся внутри правовых и социальных ра-
мок, которые постепенно формируются
и начинают напрямую влиять на то, ка-
кие технологии появляются и как они
применяются, поэтому вопросы регули-
рования, прозрачности и контроля ста-
новятся не отвлеченной теорией, а ча-
стью его практического использования.
Эта книга поможет выстроить целост-
ное и трезвое представление об искус-
ственном интеллекте как о реальной
технологии, расскажет, как он разви-
вался, как работает сегодня и какие
ограничения в нем заложены, чтобы
читатель мог осознанно применять ИИ
в работе и жизни, понимая не только
его возможности, но и собственную от-
ветственность, связанную с его исполь-
зованием.
Уже в 1960-х
ИИ обсуждали
далеко за преде-
лами инженерных
лабораторий.
Герберт Саймон
и Норберт Винер
писали о том,
как автомати-
зация меняет
труд, управле-
ние и принятие
решений. С са-
мого начала ИИ
рассматривали
не только как
технологию,
но и как источ-
ник социальных
сдвигов
КАК ВСЕ НАЧИНАЛОСЬ:
ОТ ЛЕЙБНИЦА ДО ПЕРВЫХ
ПРОГРАММ
Мы видим лишь малую часть возможного,
неизменно переоценивая краткосрочные
последствия и недооценивая долгосрочные.
Алан Тьюринг
История искусственного интеллекта началась задолго
до появления компьютеров — с попыток понять, можно ли
описать человеческую мысль как строгий алгоритм, подоб-
ный математическому доказательству. Еще в XVII веке фи-
лософы и математики мечтали свести рассуждение к после-
довательности незыблемых правил. Из этой, казалось бы,
чисто теоретической идеи родилась мысль о машине, спо-
собной мыслить. Абстрактные искания тех лет заложили
фундамент для сегодняшнего ИИ.
ДВОИЧНЫЙ код
ЛЕЙБНИЦА
Значение Лейб-
ница не огра-
ничивается его
арифмометром
и философскими
работами. Уже
в XVII веке он
предложил дво-
ичную систему
счисления —
способ представ-
лять любые числа
с помощью нулей
и единиц
ИДЕЯ МАШИНЫ, КОТОРАЯ УМЕЕТ
ДУМАТЬ
Услышав фразу «искусственный ин-
теллект», легко решить, что речь идет
о явлении недавнего прошлого, возник-
шем на волне технологического подъе-
ма последних лет. Однако история этой
идеи гораздо старше. Еще в 1666 году
двадцатилетний немецкий философ
Готфрид Вильгельм Лейбниц предло-
жил концепцию «универсальной ха-
рактеристики» — системы символов
и правил, призванной выражать чело-
веческие рассуждения в виде последо-
вательности строгих логических шагов.
Он стремился создать универсальный
язык мышления, в котором любые выво-
ды получались бы по незыблемым пра-
вилам, подобно арифметическим опе-
рациям.
Чтобы продемонстрировать, что ум-
ственные операции действительно под-
даются разложению на механические
действия, Лейбниц сконструировал
свой арифмометр. Внутри аппарата на-
ходился так называемый ступенчатый
цилиндр, или «колесо Лейбница», —
вал с зубцами разной длины. Когда
оператор вращал ручку, цилиндр, за-
девая шестеренки, управлял их поло-
жением, заставляя машину выполнять
сложение, вычитание, умножение или
деление. Таким образом, вычисление
превращалось в набор чисто механиче-
ских движений, где каждое положение
цилиндра соответствовало конкретно-
му шагу рассуждения.
Для научной мысли XVII века это
было почти немыслимым прорывом.
Лейбниц наглядно показал, что опе-
рация, которую мы выполняем в уме,
может быть реализована устройством
из металла. Эта идея стала отправной
точкой на долгом пути к созданию бу-
дущих вычислительных машин.
Спустя почти три столетия, в 1936 году,
Алан Тьюринг совершил следующий
важнейший шаг. В своей фундамен-
тальной работе «О вычислимых чис-
лах» он представил абстрактную
модель вычисления — «машину Тью-
ринга». Это гипотетическое устройство
состояло из бесконечной ленты, счи-
тывающей головки, и набора правил,
«Колесо Лейб-
ница» важно
не столько
как конкрет-
ный механизм,
сколько как идея.
Один и тот же
узел выполнял
разные действия
в зависимости
от положения
деталей. По сути,
это ранний про-
образ принципа
программируе-
мости: поведе-
ние устройства
определяется
настройкой,
а не его физиче-
ской формой
Почему первые
ламповые
компьютеры
были крайне
ненадежны:
• электронные лам-
пы перегревались
и быстро выходи-
ли из строя;
• контакты и пай-
ка разрушались
из-за высокой
температуры;
• замена ламп часто
нарушала работу
всей схемы;
• питание и охлаж-
дение требовали
сложной и гро-
моздкой инфра-
структуры
определяющих действия на каждом
этапе: считать символ, изменить его,
передвинуть ленту. Конструкция была
намеренно простой, почти аскетичной,
но именно в этой простоте заключал-
ся ее глубокий смысл: Тьюринг стре-
мился свести идею вычисления к мак-
симально ясной схеме, чтобы понять,
что вообще можно считать алгоритмом.
Его модель позволила формально опи-
сать любой пошаговый процесс и дока-
зала, что машина, следующая строгим
правилам, способна выполнить любую
вычислительную процедуру вне зави-
симости от ее сложности или предмет-
ной области.
Примерно в те же годы в США аспи-
рант Клод Шеннон работал над диссер-
тацией, которой впоследствии суждено
было стать одной из самых влиятель-
ных работ XX века. В 1937 году он про-
демонстрировал, что булеву алгебру —
формальную логику с операциями «И»,
«ИЛИ», «НЕ» — можно воплотить в виде
обычных электрических цепей. Резуль-
таты этой работы были опубликованы
в 1938 году. Замкнутый контакт в та-
кой цепи соответствовал логической
«истине», а разомкнутый — «лжи». Не-
сколько контактов, соединенных опре-
деленным образом, могли выполнять
логические операции столь же строго,
как и математическое выражение. Ины-
ми словами, простая цепь из реле не-
ожиданно обрела способность делать
выводы — не в человеческом, разуме-
ется, смысле, но как безупречное сле-
дование формальным правилам логики.
До открытия Шеннона логика, схемо-
техника и электричество существова-
ли в разных, почти не пересекающихся
мирах. Математики оперировали сим-
волами, инженеры работали с прово-
дами, а компьютеры в современном
понимании еще не были изобретены.
Ученый же показал, что все эти обла-
сти можно объединить: построив схе-
му из реле, ее можно заставить авто-
матически решать логические задачи.
А если логические задачи можно вы-
разить в виде вычислений, значит, воз-
можно создать машину, выполняющую
любые операции над числами — тре-
буется лишь правильно соединить кон-
такты. По сути, Шеннон заложил теоре-
тический фундамент того, что сегодня
именуется цифровой схемотехникой.
Благодаря его прозрению стало по-
нятно, как конструировать универ-
сальные электронные «мозги» —
устройства, выполняющие операции
не потому, что их физически так на-
строили, а потому, что сама логика ра-
боты изначально ^строена в структуру
их схем. Без этой революционной ра-
боты невозможно представить ни одно
вычислительное устройство: от первых
транзисторных калькуляторов до мощ-
нейших чипов в смартфонах.
Во время Второй мировой войны те-
оретические построения наконец ма-
териализовались в работающих маши-
нах. Британский «Колосс» взламывал
немецкие шифры, созданные на маши-
не «Лоренц», а американский ENIAC
рассчитывал траектории снарядов. Эти
Когда Алан
Тьюринг говорил
об алгоритмах,
он подчеркивал
принципиаль-
ный момент:
это не догадка
и не интуиция,
а строгая после-
довательность
шагов, выполняе-
мых механически.
Алгоритм не тре-
бует понимания
смысла, поэтому
его может испол-
нять не человек,
а машина
Работы Клода
Шеннона сделали
логические опе-
рации удобными
для инженеров.
Он показал, что
логические «И»,
«ИЛИ», «НЕ»
можно реализо-
вать с помощью
стандартных
электрических
элементов и зара-
нее рассчитывать
поведение схем.
Проектирование
вычислитель-
ных устройств
перестало быть
экспериментом
и стало инженер-
ным расчетом
устройства занимали целые помеще-
ния: один только ENIAC весил 30 тонн,
потреблял 174 кВт электроэнергии
и содержал 17 468 ламп, которые по-
стоянно перегорали. Программирова-
ние напоминало тяжелую инженерную
работу: приходилось вручную пере-
ставлять сотни кабелей, менять пе-
реключатели и непрерывно следить,
чтобы оборудование выдерживало на-
грузку.
В этот момент возник вопрос, зву-
чавший в то время почти дерзко: если
машина умеет вычислять, способна ли
она к рассуждению? Если она работа-
ет со знаками по заданным правилам,
может ли ее поведение хотя бы внеш-
не напоминать мышление? На фоне
этих дискуссий Джон фон Нейман из-
ложил принципы архитектуры, кото-
рые впоследствии стали прочно ассо-
циироваться с его именем. Они были
зафиксированы в документе «Первый
проект отчета о EDVAC», опубликован-
ном 30 июня 1945 года. Главная идея
заключалась в следующем: программа
должна храниться в памяти машины,
так же как и данные, а не задаваться
путем ручной коммутации переклю-
чателей и кабелей. Такой подход оз-
начал, что машине можно было дать
новую задачу простым изменением
содержимого ее памяти, без физиче-
ской перестройки «железа». Это по-
зволило компьютеру выполнять лю-
бые алгоритмы, для которых хватало
ресурсов, и, по сути, заложило ос-
нову универсальной вычислительной
машины. Так компьютеры перестали
быть однозадачными устройствами
и превратились в гибкие инструмен-
ты, способные имитировать все бо-
лее сложные формы обработки ин-
формации.
К 1950 году основные элементы буду-
щего ИИ уже существовали в виде те-
орий и работающих прототипов: фор-
мальная теория вычислений (Тьюринг),
логическая основа (Шеннон), физиче-
ские машины (ENIAC) и революцион-
ная архитектура (фон Нейман). Фун-
дамент для искусственного интеллекта
был практически собран. Ученые уже
понимали, что вычисления можно
формализовать, логику — воплотить
в электрических схемах, а програм-
мы — хранить в памяти машины. Од-
нако все это по-прежнему вращалось
вокруг чисел, цепей и математических
моделей. Не хватало постановки глав-
ного вопроса: если машина способна
выполнять любые инструкции, насколь-
ко далеко может простираться ее по-
ведение? Может ли машина не просто
считывать, а вести себя таким обра-
зом, чтобы хотя бы отдаленно напоми-
нать человека?
Этот вопрос впервые четко сформули-
ровал все тот же Алан Тьюринг, на сеи
раз выступив не как математик, иссле-
дующий пределы алгоритмов, а как
мыслитель, пытающийся определить
границы самого понятия «мышление».
Его идея, удивительно простая и одно-
временно радикальная, стала отправ-
ной точкой в истории ИИ.
Идея хране-
ния программы
в памяти сделала
вычислительные
машины уни-
версальными,
но принесла и но-
вые уязвимости.
Программа стала
таким же объек-
том, как данные:
ее можно копи-
ровать, изменять
и повреждать.
Из этой особен-
ности позже
выросли многие
проблемы безо-
пасности, с кото-
рыми цифровой
мир сталкивается
до сих пор
Когда Алан
Тьюринг пред-
ложил свой тест
в 1950 году, его
меньше всего
интересовало,
думает ли маши-
на на самом деле.
Он сознательно
уводил разговор
от философских
определений со-
знания и предла-
гал практический
критерий:если
в ограниченном
диалоге человек
не может отли-
чить ответы ма-
шины от ответов
другого человека,
вопрос о мыш-
лении теряет
прежний смысл
ТЕСТ ТЬЮРИНГА: МАШИНА
ПРИТВОРЯЕТСЯ ЧЕЛОВЕКОМ
В 1950 году в философском журна-
ле Mind вышла статья Алана Тьюринга
под названием «Вычислительные маши-
ны и разум». В ней он поставил вопрос,
который в то время звучал вызывающе:
может ли машина думать? Однако вме-
сто того чтобы увязнуть в бесконечных
спорах о значении слова «думать», Тью-
ринг предложил заменить этот фило-
софский диспут наглядным практиче-
ским испытанием.
В его основе лежала простая игровая
ситуация. Представим, писал Тьюринг,
что человек ведет переписку с двумя
собеседниками, один из которых явля-
ется машиной, а другой — человеком.
Оба отвечают текстовыми сообщения-
ми, и по внешним признакам их невоз-
можно отличить. Если в ходе такого ди-
алога машина сможет вести беседу так
убедительно, что наблюдатель не смо-
жет определить, кто из участников яв-
ляется человеком, значит, с точки зре-
ния поведения она успешно имитирует
разум. Неважно, какие процессы про-
исходят внутри ее схем, — зажно лишь
то, как это выглядит снаружи.
Эта концепция получила название те-
ста Тьюринга. Она кардинально перевер-
нула представления об интеллекте. Если
поведение машины становится неотличи-
мым от поведения человека, то в практи-
ческом смысле спор о настоящем мышле-
нии теряет содержательность.
Критики немедленно возразили: а что,
если машина лишь искусно имитирует
ответы, не понимая их смысла? Тьюринг
отвечал на это спокойно и метко: «А от-
куда мы вообще знаем, что другой чело-
век что-либо понимает? Мы также можем
судить об этом лишь по его внешнему по-
ведению». Его подход не отрицал мыш-
ление как внутренний процесс, но на-
стойчиво указывал на то, что для науки
и инженерии наблюдаемое поведение
имеет приоритет над неуловимой скры-
той сущностью.
ТестТьюринга стал первым формаль-
ным критерием того, что позднее на-
зовут искусственным интеллектом. Он
дал исследователям ясную и конкрет-
ную цель — создать программу, спо-
собную поддерживать осмысленный
человеческий диалог. И хотя сегод-
ня очевидно, что тест не охватывает
всех аспектов разума, он на десятиле-
тия нперед определил магистральное
направление исследований — от ран-
них примитивных чат-ботов до совре-
менных сложных языковых моделей.
Статья Тьюринга сделала обсуждение
мыслящих машин предметом серьез-
ного научного и инженерного разго-
вора, а не просто философским пара-
доксом. Исследователи увидели, что
интеллектуальное поведение можно
декомпозировать и рассматривать как
совокупность технических задач. Од-
нако у каждого из пионеров области
было свое собственное представление
о том, что именно следует считать раз-
умом и каким путем к нему следовать.
Чтобы прийти к взаимопониманию
и определить контуры новой дисциплины,
Любопытно, что
сам Тьюринг
считал обман
не недостатком,
а естест венной
частью теста. Ма-
шина не обязана
быть честной или
глубокомыслен-
ной — она долж-
на быть убеди-
тельной. В этом
смысле тест
Тьюринга с само-
го начала прове-
рял не интеллект
как таковой,
а способность
воспроизводить
человеческий
стиль общения
ПОЧЕМУ
ЗАКРЕПИЛОСЬ
НАЗВАНИЕ «ИС-
КУССТВЕННЫЙ
ИНТЕЛЛЕКТ»
В середине
1950-х новую
область пытались
обозначить раз-
ными словами:
«кибернетика»,
«теория автома-
тов», «обработка
информации».
Название «искус-
ственный интел-
лект» оказалось
наиболее удоб-
ным: под него
помещались и ло-
гические модели
мышления, и ин-
женерные идеи
про обучение,
и эксперименты
с языком.Термин
был достаточно
широким, чтобы
не связывать
направление
с одной конкрет-
ной школой или
методом
ведущим исследователям необходимо
было собраться вместе и договориться
об общих целях. Такой возможностью
и стала знаковая конференция в Дарт-
муте летом 1956 года. Именно там роди-
лось название новой науки — «искус-
ственный интеллект».
НОВАЯ НАУКА ПОЛУЧАЕТ ИМЯ
Летом 1956 года в Дартмутском кол-
ледже, в тихом университетском кам-
пусе на северо-востоке США, собра-
лась небольшая группа ученых, которые
прежде работали порознь, хотя и инте-
ресовались смежными вопросами. Ини-
циатором этой встречи выступил мо-
лодой математик Джон Маккарти. Он
полагал, что настал подходящий мо-
мент обсудить идеи о мыслящих маши-
нах не в отдельных статьях и перепи-
ске, а в ходе личного общения за одним
столом. Заодно он предложил назва-
ние, которое закрепилось мгновенно
и навсегда: artificial intelligence — «ис-
кусственный интеллект». Организато-
рами этого семинара, помимо Маккар-
ти, были также Марвин Минский, Клод
Шеннон и Натаниэль Рочестер.
Эти исследователи верили, что за два
летних месяца интенсивной совместной
работы можно добиться значимых ре-
зультатов. В середине 1950-х годон та-
кой оптимизм не казался чрезмерным:
компьютеры развивались стремитель-
ными темпами, и представлялось, что,
если собрать вместе людей с различ-
ным опытом, они смогут выработать
общее видение того, как научить ма-
шину рассуждать или хотя бы учиться
на конкретных примерах.
В Дартмут приехали ученые, придер-
живающиеся разных подходов. Клод
Шеннон, автор теории информации,
интересовался тем, как машины могут
манипулировать логическими струк-
турами. Аллен Ньюэлл и Герберт Сай-
мон были создателями одной из первых
программ, умеющих выводить матема-
тические доказательства. Сам Джон
Маккарти в будущем станет автором
языка LISP, который превратится в ос-
новной инструмент символического ИИ.
Дискуссии оказались напряженными,
но продуктивными: участникам при-
ходилось заново формулировать, что
именно следует считать мышлением
и какая часть этого процесса подда-
ется формализации. Одни видели раз-
ум как последовательность логических
выводов. Другие — как поиск решений
в сложных, неоднозначных ситуациях.
Третьи — как способность к обучению
и адаптации. К единому ответу тогда
так и не пришли, однако стало очевид-
но, что рассуждения можно описывать
с помощью символов и операций над
ними, а значит, есть теоретическая воз-
можность передать эту функцию ма-
шине.
За то лето никто, разумеется, не со-
здал «интеллект» в готовом виде,
но произошло нечто более фундамен-
тальное: оформилось научное сооб-
щество и родилась новая область зна-
ния, у которой появились собственные
Дартмутскую
встречу заду-
мывали не как
конференцию
с докладами,
а как рабочую
сессию. Участ-
ники собирались
не выступать,
а вместе разби-
рать конкретные
задачи: как
научить машину
решать голово-
ломки, строить
планы,учиться
на примерах,
объяснять соб-
ственные шаги.
Такой формат
был важен: он
сразу задавал
ИИ как область
практического
исследования,
а не как набор
абстрактных
рассуждений
Дартмут дал
области еще
одну важную
вещь — внешнюю
оформленность.
Когда у направ-
ления появля-
ется устойчивое
название и круг
исследователей,
с ним проще
работать инсти-
туционально:
открывать лабо-
ратории, полу-
чать финансиро-
вание, запускать
курсы,собирать
команды. Ис-
кусственный
интеллект стал
восприниматься
не как разроз-
ненные идеи,
а как целостное
научное поле,
с которым можно
иметь дело
исследовательские вопросы, методы
и, что важно, имя. Участники разъеха-
лись по своим университетам, но уже
со знанием того, что они работают над
единой грандиозной задачей — понять,
что именно делает поведение разум-
ным и как можно приблизить к этому
машину.
Дело сдвинулось с мертвой точки.
И чтобы проверить на практике, на что
способны существующие компьютеры,
исследователи начали активно соз-
давать программы, которые должны
были имитировать хотя бы простейшие
формы рассуждения — играть в шаш-
ки, решать логические головоломки,
искать решения, перебирая возмож-
ные шаги.
ПЕРВЫЕ ПРОГРАММЫ ПРОБУЮТ
РАССУЖДАТЬ
После Дартмутской конференции
разговоры о возможностях ИИ окон-
чательно вышли за рамки чистой тео-
рии. Чтобы понять реальные границы
возможного, требовались наглядные
примеры, пусть небольшие, но такие,
которые хотя бы отдаленно напомина-
ли человеческое рассуждение.
Одной из самых первых и знаковых
программ стала Logic Theorist («Логи-
ческий теоретик»), созданная Алле-
ном Ньюэллом и Гербертом Саймоном
в 1956 году. Она автоматически выво-
дила доказательства некоторых тео-
рем из Principia Mathematica — мону-
ментального труда Альфреда Норта
Уайтхеда и Бертрана Рассела. Програм-
ма методом перебора подбирала цепоч-
ки логических шагов и тем самым де-
монстрировала способность не просто
выполнять вычисления по заданному
алгоритму, а активно искать путь к ре-
шению. Ньюэлл и Саймон даже утвер-
ждали, что в одном из случаев програм-
ма нашла более изящное и лаконичное
доказательство, чем приведенное у ав-
торов оригинала. Этот случай вызвал
споры, однако наглядно показал глав-
ное: формальную, дедуктивную часть
рассуждения действительно можно по-
ручить машине.
Позже те же исследователи создали
программу General Problem Solver (GPS,
«Универсальный решатель задач»), ко-
торую представили в 1957 году. Она
решала задачи, описанные в терми-
нах перехода от начального состоя-
ния к целевому. Задавались исходная
ситуация, желаемая цель и набор до-
пустимых действий; программа иска-
ла последовательность шагов, которая
связывала бы одно с другим. Работа-
ла она медленно и лишь на предельно
упрощенных моделях, но сам подход —
представление решения как движения
по «пространству состояний» — лег
в основу множества будущих методов
искусственного интеллекта.
Параллельно начали появляться пер-
вые игровые программы. Наиболее за-
метной среди них стала программа для
игры в шашки, разработанная Артуром
Сэмюэлом. Изначально она использо-
вала набор четко заданных правил для
ЭВРИСТИКИ:
КАК МАШИНЫ
НАУЧИЛИСЬ
СОКРАЩАТЬ
ПОИСК
Первые про-
граммы быстро
столкнулись
с тем, что прямой
перебор вариан-
тов не работает:
даже в шашках
или при доказа-
тельстве теорем
число возможных
ходов растет
лавинообразно.
Выходом стали
эвристики —
приближенные
правила, которые
не гарантируют
лучший ответ,
но позволяют
отбрасывать явно
бесперспектив-
ные пути и дви-
гаться к решению
осмысленнее
Logic Theorist
был устроен
не как обычный
вычислительный
алгоритм. Он
строил рас-
суждение шаг
за шагом, про-
веряя, ведет ли
выбранный путь
к цели или захо-
дит в тупик. Для
своего времени
это был важный
сдвиг: программа
не просто испол-
няла инструк-
ции, а ьыбирала
следующий ход
в рамках фор-
мальных правил
логики
оценки позиций на доске. Затем Сэмю-
эл усовершенствовал ее, добавив воз-
можность корректировать оценочные
параметры на основе анализа сыгран-
ных партий. Программа перестала быть
статичной: она действительно начала
подстраиваться под стиль противника
и улучшала свою игру от партии к пар-
тии. По сути, это был один из первых
в истории работающих примеров ма-
шинного обучения на реальных данных.
Разумеется, возможности всех этих
программ были крайне ограниченны-
ми. Они справлялись только с узкими,
специально подготовленными задача-
ми, требовали тщательной настройки
и давали сбой при малейшем отклоне-
нии от ожидаемых условий. Однако ка-
ждая из них демонстрировала отдель-
ную грань будущего ИИ. Logic Theorist
показывала, что рассуждение можно
представить как цепочку формальных
преобразований. GPS иллюстрировала,
что поиск решения аналогичен прокла-
дыванию маршрута на карте. Програм-
ма Сэмюэла доказывала, что машина мо-
жетулучшать свои стратегии, опираясь
на накопленный опыт.
Исследователям той эпохи даже та-
кие скромные результаты казались
невероятными и создавали ощущение
стремительного, неудержимого про-
гресса. Возникала уверенность, что
если машины уже умеют хоть немно-
го рассуждать, планировать и учиться,
то дальше — лишь дело техники: уве-
личить объем памяти, повысить быст-
родействие процессоров, и ключевая
проблема будет решена. Делались сме-
лые, почти футуристические прогнозы
о скором появлении автоматического
перевода, полноценного диалога с ма-
шиной и автоматического доказатель-
ства сложнейших теорем.
Но через несколько лет стало ясно,
что эти ожидания были чрезмерно оп-
тимистичными. Реальные, «простые»
на первый взгляд задачи оказывались
на порядки сложнее лабораторных
демонстраций, а первые успехи были
не рывком к универсальным мыслящим
машинам, а лишь робкими эксперимен-
тами, обозначившими начало долгого
и тернистого пути.
Работы Артура
Сэмюэла с ша-
шечной програм-
мой добавили
еще одну ключе-
вую идею. Он по-
казал, что часть
знаний можно
не задавать за-
ранее, а получать
из опыта. Про-
грамма коррек-
тировала оценку
позиций на ос-
нове сыгранных
партий, постепен-
но улучшая ка-
чество решений.
Это был ранний
пример подхо-
да, в котором
система учится
на собственных
результатах,
а не только сле-
дует заданным
разработчиком
или пользовате-
лем правилам
ВЗЛЕТЫ И ПАДЕНИЯ: 1960-1980-е
В любой новой технологии мы поначалу
переоцениваем ее возможности, а затем
болезненно натыкаемся на ее пределы.
Герберт Саймон
Первые десятилетия активного развития ИИ стали эпохой
головокружительных взлетое< и горьких разочарований. Каж-
дый успех порождал уверенность, что разумные машины —
вопрос ближайших лет, но за эйфорией следовала «зима» —
спад интереса и финансирования.
К концу 1950-х
и в 1960-е годы
развитие вы-
числительной
техники шло
столь стреми-
тельно, что это
воспринималось
как прямой путь
к решению любых
задач. Компьюте-
ры становились
быстрее и до-
ступнее, и каза-
лось: если вычис-
ления ускоряются
такими темпами,
то и задачи
мышления под-
дадутся тому же
подходу — шаг
за шагом
ЭПОХА БОЛЬШИХ ОЖИДАНИЙ:
ПОЧЕМУ В 1960-е КАЗАЛОСЬ, ЧТО
РАЗУМНЫЕ МАШИНЫ УЖЕ БЛИЗКО
В начале 1960-х годов у исследовате-
лей ИИ впервые появились программы,
которые можно было демонстрировать
не только узкому кругу коллег, но и ши-
рокой публике. Эти впечатляющие по-
казы создавали ощущение, что разум-
ные машины — не отдаленная фантазия,
а вопрос ближайшего будущего. Компью-
тер, отвечающий на ^опросы или пони-
мающий текстовые команды, восприни-
мался уже не как простой вычислитель,
а как нечто принципиально новое.
Одним из самых знаковых проектов ста-
ла программа SHRDLU, созданная в MIT
Терри Виноградом в конце 1960-х. Она су-
ществовала в крошечном искусственном
мире, населенном кубиками, пирамидами
и другими простыми объектами. Пользо-
ватель мог написать команду вроде «пе-
редвинь зеленый кубик», и программа,
разобрав фразу, выполняла действие.
Если формулировка оказывалась дву-
смысленной, SHRDLU задавала уточняю-
щий вопрос. В границах этой минимали-
стичной вселенной программа выглядела
поразительно «сообразительной», по-
рождая надежды, что достаточно лишь
расширить ее мир, и она станет столь же
уверенной в реальных условиях.
Не меньший резонанс вызвала ELIZA
Джозефа Вейценбаума, представлен-
ная в 1966 году. Эта программа вела
диалог в манере психотерапевта, ма-
стерски перефразируя и уточняя ре-
плики собеседника. За видимой глу-
биной не стояло никакого настоящего
понимания — лишь ловкая работа с ша-
блонами. Однако людям, впервые уви-
девшим интерактивный диалог с ма-
шиной, это казалось ошеломляющим
шагом к имитации настоящего общения.
Параллельно развивались системы
машинного перевода. Символическим
рубежом стал Джорджтаунский экспе-
римент 7 января 1954 года, где публи-
ке продемонстрировали перевод более
шестидесяти предложений с русского
на английский. Сегодня очевидно, что
примеры были тщательно подобраны,
а сама система работала лишь в идеали-
зированных условиях. Но тогда эффект
был оглушительным: казалось, что если
компьютеры уже справляются с просты-
ми текстами, то путь к сложным открыт.
Прогресс наблюдался и в создании
программ, ищущих решения задач: они
перебирали варианты, решали голо-
воломки, выводили доказательства.
У исследователей крепла уверенность:
Оптимизм подпи-
тывали нагляд-
ные демонстра-
ции: короткий
диалог, аккурат-
но подобранная
задача, уверен-
ный результат.
В таком формате
система произво-
дила впечатление
разумной,хотя
за пределами
подготовленного
примера часто
терялась. Возни-
кало ощущение
близкой побе-
ды, тогда как
речь шла лишь
об удачной по-
становке задачи
Важную роль
играли и заказ-
чики. Военные
и государствен-
ные структуры
вкладывались
в ИИ не из ака-
демического
интереса: им
требовались пе-
ревод, анализ со-
общений, помощь
в планировании.
Когда ожидания
по срокам и каче-
ству не оправды-
вались, разоча-
рование быстро
отражалось
на приоритетах
и финансирова-
нии
если алгоритм работает в лаборатор-
ных условиях,то с ростом вычислитель-
ной мощности его можно будет масшта-
бировать на задачи любой сложности.
Этому оптимизму способствовал
и стремительный прогресс в «желе-
зе». Компьютеры становились быстрее
и доступнее, университеты получали
оборудование, еще недавно стоившее
миллионы. Возникало ощущение, что
технические ограничения вот-вот па-
дут. Раз развитие идет такими темпа-
ми, значит, и интеллектуальные зада-
чи вскоре будут решены.
Однако и теперь у большинства про-
грамм сохранялся общий фатальный
изъян: они работали исключительно
в заранее подготовленных, «стериль-
ных» условиях. Мир SHRDLU был вы-
строен и описан человеком до мело-
чей. ELIZA действовала только в рамках
своего сценария, а системы перевода
не выдерживали малейшего отклоне-
ния от учебных примеров.
Проблема была не в плохих програм-
мах, а в принципиальной невозможности
свести бесконечное разнообразие реаль-
ного мира к конечному набору правил.
В 1960-е это понимали далеко не все.
Казалось, стоит лишь подробнее описать
мир — пополнить базы знаний, расши-
рить словари, прописать связи — и си-
стема начнет в нем ориентироваться. Ла-
боратории активно занимались именно
этим: создавали сложные онтологии
и базы данных, которые должны были
наделить машину пониманием в ограни-
ченных предметных областях.
К концу десятилетия в научных отчетах
и публичных выступлениях звучали сме-
лые прогнозы. Будущее виделось ясным
и близким. Но уже в начале 1970-х ста-
ло очевидно, что ожидания были не со-
размерны реальности. В неидеальных
условиях программы мгновенно стал-
кивались с тем, к чему их не готовили.
Они терялись перед неоднозначностью,
не справлялись с непредусмотренными
ситуациями, зависали там, где человек
действовал бы интуитивно. Проблему
нельзя было решить простым наращи-
ванием памяти или скорости: дело было
не в мощности, а в том, что повседнев-
ный мир оказался невыразимо сложнее
любой формальной схемы.
Именно в этот момент родилась идея
кардинально сузить амбиции. Вместо
погони за «общим» интеллектом было
решено сосредоточиться на системах,
глубоко разбирающихся в одной кон-
кретной узкой области — медицине,
геологии, диагностике неисправно-
стей. Так началась эпоха экспертных
систем, которым суждено было на не-
сколько лет стать основным символом
прогресса в ИИ.
ЭКСПЕРТНЫЕ СИСТЕМЫ: ПЕРВЫЕ
УСПЕШНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ
ПРОГРАММЫ
В середине 1970-х наиболее влиятель-
ной системой стала MYCIN, разработан-
ная в Стэнфорде. Эта программа помо-
гала врачам диагностировать тяжелые
бактериальные инфекции (бактериемию,
Что в то время
считалось дости-
жимым в ближай-
шем будущем:
• машинный пере-
вод для практи-
ческого примене-
ния;
• программы-по-
мощники для
инженеров и вра-
чей;
• универсальные
системы рассуж-
дения;
• быстрый переход
от лабораторных
прототипов к ра-
бочим решениям
Экспертные си-
стемы строились
на правилах вида
«ЕСЛИ... ТО...».
Так специалисты
формализовали
типичные при-
знаки и решения
в своей области.
В узких зада-
чах этот подход
работал: опыт
удавалось зафик-
сировать и вос-
производить.
Поэтому такие
системы долго
воспринимались
как первый шаг
к практическому
искусственному
интеллекту
менингит) и подбирать антибиотики.
MYCIN задавала врачу серию вопро-
сов о симптомах, результатах анализов
и факторах риска, после чего, используя
базу из нескольких сотен правил, выдви-
гала гипотезу о возбудителе и предлага-
ла схему лечения. В испытаниях ее реко-
мендации часто не уступали по качеству
заключениям опытных специалистоЕ1. —
для 1970-х это было настоящим чудом.
Подход быстро распространился.
Появились системы для диагности-
ки неисправностей в механическом
и электронном оборудовании, оценки
перспективности геологических участ-
ков, планирования химического синте-
за. Экспертная система тех времен пред-
ставляла собой базу знаний, состоящую
из правил вида «ЕСЛИ (условие), ТО (за-
ключение)». Считалось, что чем больше
таких правил удастся «извлечь» из экс-
пертов и формализовать, тем умнее и по-
лезнее станет программа.
Оптимизм был понятен: впервые
в истории компьютеры давали сове-
ты, имеющие реальную практическую
ценность. Компании начали инвестиро-
вать в разработку, в университетах рос-
ли профильные лаборатории, а пресса
говорила о «втором дыхании» искус-
ственного интеллекта.
Однако у этого подхода быстро проя-
вились серьезные недостатки. Во-пер-
вых, процесс сбора знаний оказался
мучительно трудоемким. Программи-
сты и инженеры часами интервьюиро-
вали специалистов, пытаясь перенести
их интуицию и опыт в тонкие цепочки
формальных правил. Любая ошибка
или пропуск могли привести к сбою.
Во-вторых, системы были чрезвычай-
но хрупкими. Если ситуация хоть не-
много выходила за рамки прописан-
ных сценариев, программа терялась.
Самое же главное — по мере роста базы
правил система становилась все более
громоздкой, противоречивой и требо-
вала постоянного дорогостоящего об-
служивания. Она прекрасно работала
в узкой стабильной среде, но стоило
лишь слегка сдвинуть границы — и ее
полезность резко падала.
Экспертные системы все же сыгра-
ли ключевую роль в становлении ИИ:
они доказали, что в четко определен-
ных областях машина может быть очень
эффективным помощником. Но они же
с предельной ясностью указали на не-
преодолимый предел подхода, основан-
ного на составлении формальных правил.
«ЗИМА» ИИ: СЕРЬЕЗНЫЕ
РАЗОЧАРОВАНИЯ
Проблемы стали явными, когда экс-
пертные системы попытались интегри-
ровать в реальные бизнес-процессы.
В лабораторных условиях они функци-
онировали безупречно, но в хаосе ре-
альной работы любой неучтенный па-
раметр мог вывести их из строя. Чем
сложнее становились базы знаний, тем
чаще возникали конфликты между пра-
вилами, и инженеры тратили непро-
порционально много времени на отлад-
ку и поддержку. Стоимость владения
Проблемы прояв-
лялись довольно
быстро. Знания
приходилось
извлекать у экс-
пертов и вруч-
ную переводить
с набор правил.
Любое уточнение
усложняло систе-
му, а поддержка
со временем
становилась все
более трудоем-
кой. Масшта-
бировать такой
подход оказалось
значительно
сложнее, чем
предполагалось
УДАР ПО ФИНАН-
СИРОВАНИЮ
Отчет ALPAC
1966 года стал
переломным
моментом для
машинного пере-
вода. Комиссия
пришла к выводу,
что качество
не растет, а за-
траты и сроки
не оправдывают
ожиданий. После
этого финанси-
рование в США
было заметно
сокращено. Стало
ясно: эффектные
демонстрации
еще не означают
работоспособную
технологию
такими системами росла, а отдача сни-
жалась, что привело к закрытию ряда
громких и дорогих проектов. Это рез-
ко охладило пыл инвесторов.
Параллельно случился крах в другой
многообещающей области — машинном
переводе. После впечатляющей демон-
страции 1954 года энтузиазм был высок,
но стоило выйти за пределы учебных
фраз, как системы начинали выдавать
бессмысленные или комичные перево-
ды. Они не справлялись с многозначно-
стью слов, идиомами, грамматическими
нюансами. Разрыв между рекламными
обещаниями и жалкой реальностью стал
настолько вопиющим, что в 1966 году
специальный комитет ALPAC (Automatic
Language Processing Advisory Committee)
пришел к выводу: автоматический пере-
вод ненадежен, непрактичен и не стоит
государственного финансирования. По-
следовало резкое сокращение поддерж-
ки таких исследований в США.
Похожая участь постигла и диало-
говые системы. Пока разговор велся
по заданному сценарию, все было хоро-
шо. Но стоило пользователю отклонить-
ся от темы или использовать неожи-
данную формулировку, как программа
выдавала абсурд. Спало окончательно
ясно, что человеческий язык — это жи-
вой, контекстно-зависимый организм,
а не набор статичных шаблонов.
В профессиональном сообществе на-
растало разочарование. Если в 1960-е
казалось, что до цели не хватает лишь
нескольких деталей, то теперь прихо-
дилось признать: выбранный путь ведет
в тупик. Чем сложнее и «человечнее»
была задача, тем быстрее подход, ос-
нованный на формальных правилах, ис-
черпывал себя.
Так наступила эпоха, известная как
«зима искусственного интеллекта»,—
период, когда рухнули ожидания, ис-
сякло финансирование, лаборатории
закрывались, а исследователи массо-
во уходили в другие области. Истори-
ки обычно выделяют две такие «зимы»:
первую — в 1974-1980 годах, вто-
рую — около 1987-1993 годов.
Ранним предвестником холодов можно
считать как раз отчет ALPAC 1966 года.
В Великобритании сильным ударом
стал пессимистический отчет Лайтхил-
ла (1973). Для ИИ это было болезненно,
потому что кризис ударил одновремен-
но по всем основным фронтам.
Однако работа не остановилась пол-
ностью. Она просто ушла вглубь, сме-
стившись от громких прикладных
проектов к тихим фундаментальным
исследованиям, не сулящим быстрой
славы. В этой интеллектуальной тени
вызревали идеи, которым через два де-
сятилетия было суждено вывести ИИ
на новый, на этот раз куда более устой-
чивый, виток развития.
ТИХАЯ РАБОТА В ТЕНИ: ИДЕИ,
СТАВШИЕ ФУНДАМЕНТОМ БУДУЩЕГО
Пока одни ученые хоронили большие
проекты, другие упорно продолжали
работу над теориями, казавшимися бес-
перспективными в практическом плане.
«Зима» ИИ была
следствием нако-
пившихся ограни-
чений. Програм-
мы машинного
перевода плохо
справлялись
с реальными
текстами, диало-
говые системы
ломались при
отклонении
от сценариев.
Выяснилось,
что пробле-
ма не только
в вычислитель-
ной мощности:
действительность
слишком сложна
для простых фор-
мальных схем
ПЕРЕМЕНЧИВАЯ
МОДА
В 1970-1980-е
годы нейросети
вышли из моды,
но не исчезли.
Исследователи
продолжали
искать способы
обучать много-
слойные модели,
хотя прогресс
был медленным:
не хватало дан-
ных и вычисли-
тельных ресур-
сов. Эти работы
редко привле-
кали внимание,
но сохраняли
ключевые идеи
Их исследования не попадали на пер-
вые полосы, но именно они заложили
основу для революции конца XX века.
Одним из таких направлений были
нейронные сети. В 1969 году Мар-
вин Минский и Сеймур Паперт в книге
«Перцептроны» математически дока-
зали ключевые ограничения простей-
шей однослойной сети (перцептрона).
Такая сеть могла решать лишь задачи,
где классы объектов линейно раздели-
мы. Поскольку большинство реальных
проблем требовало проведения слож-
ных, нелинейных границ,многие сдела-
ли вывод, что нейронные сети — тупи-
ковая ветвь. Интерес к ним почти угас.
Но небольшая группа энтузиастов
продолжала верить в потенциал мно-
гослойных сетей. Они интуитивно по-
нимали, что каждый новый слой может
выявить все более абстрактные и слож-
ные закономерности в данных. Главной
нерешенной проблемой оставалось об-
учение таких структур. Прорывом стал
алгоритм обратного распространения
ошибки (backpropogatiori), детально опи-
санный в 1986 году. Его идея была гени-
альна в своей простоте: если сеть ошиб-
лась, можно вычислить вклад каждого
нейрона и каждой связи в эту ошибку
и скорректировать их ровно настоль-
ко, чтобы в следующий раз вероятность
ошибки уменьшилась. Сегодня это осно-
ва любого глубинного обучения (deep
learning), но тогда метод казался вы-
числительно неподъемным. Тем не ме-
нее так был заложен краеугольный ка-
мень для будущего развития.
Параллельно развивались вероят-
ностные методы и байесовские модели.
В отличие от жесткой логики эксперт-
ных систем, эти подходы признавали
мир неопределенным и учились рабо-
тать с вероятностями, а не с бинарны-
ми истинами. Это стало фундаментом
статистического машинного обучения,
способного извлекать знания из «за-
шумленных» реальных данных.
Не стояли на месте и алгоритмы по-
иска, оптимизации и планирования.
Разрабатывались более эффективные
методы нахождения маршрутов, опти-
мальных решений и последовательно-
стей действий в сложных средах. Эта,
казалось бы, сугубо техническая рабо-
та позже легла в основу навигации ав-
тономных роботов и интеллектуальных
систем управления.
Объединяющей чертой всех этих
«теневых» направлений был отказ
от парадигмы явного программирова-
ния знаний. Вместо того чтобы вруч-
ную прописывать правила, исследо-
ватели искали способы, позволяющие
системе самостоятельно находить за-
кономерности через статистический
анализ данных и итеративную кор-
рекцию.
Со стороны могло показаться, что ИИ
погрузился в спячку. Но в тишине ла-
бораторий формировался новый науч-
ный и инженерный фундамент, который
оказался достаточно прочным, чтобы
через два десятилетия выдержать вес
новой, уже не виртуальной, а самой что
ни на есть реальной революции.
Когда в 2000-х
и 2010-х появи-
лись большие
наборы данных
и выросли вычис-
лительные воз-
можности, преж-
ние наработки
сразу оказались
востребованы.
Вместо пред-
варительного
задания правил
стало возможно
обучать системы
на примерах.
Прорыв выгля-
дел внезапным,
но на самом деле
опирался на дол-
гую незаметную
подготовку
К. Б. Франке. Портрет Готфрида Вильгельма Лейбница. Ок. 1695 г.
Музей герцога Антона Ульриха, Брауншвейг.
Г. В. Лейбниц (1646-1716) — немецкий ученый и философ, зало-
живший основы формальной логики и двоичной системы счисле-
ния, важных для вычислений и искусственного интеллекта
Чарльз Бэббидж (1791-1871). Фото ок. I860 г.
Английский математик и изобретатель, автор проекта анали-
тической машины, ставшей концептуальной предшественни-
цей программируемых компьютеров и современных идей ис-
кусственного интеллекта
НАКОНЕЦ ВСЕ ЗАРАБОТАЛО:
1990-2010-е
Когда метод наконец начинает работать,
он кажется очевидным. До этого момента
он выглядит невозможным.
Джеффри Хинтон
Долгое время ИИ оставался прекрасной теорией с блестя-
щим будущим и весьма скромными практическими достиже-
ниями. Ситуация изменилась кардинально, когда сошлисьтри
ключевых фактора: появились огромные массивы данных,
вычислительная мощность стала доступной, а ученые раз-
работали эффективные инженерные методы обучения мо-
делей. Тогда ИИ превратился из академической дисципли-
ны в технологию, приносящую осязаемую пользу.
ДАННЫЕ КАК
ОГРАНИЧЕНИЕ
К концу 1990-х
стало ясно, что
трудности ИИ
связаны не толь-
ко с алгорит-
мами. Даже
простые методы
показывали
лучший резуль-
тат, если обуча-
лись на большем
объеме данных.
И вместо вопроса
«как рассуждать»
на первый план
вышел вопрос
«на чем учиться»
КОГДА ДАННЫХ СТАЛО СЛИШКОМ
МНОГО
До 1990-х годов данные были скорее
дефицитным ресурсом, чем доступным
сырьем. Компьютеры работали с не-
большими наборами текстов и изобра-
жений, которые исследователи зачастую
собирали и подготавливали вручную.
Примеры в учебниках по ИИ той поры
нередко казались слишком упрощен-
ными — не потому, что ученым нрави-
лись «игрушечные» задачи, а потому что
других вариантов просто не существо-
вало. Для нейросетей же отсутствие
больших размеченных наборов приме-
ров становилось почти приговором: что-
бы чему-то по-настоящему научиться,
им были необходимы тысячи, а в идеа-
ле — миллионы разнообразных случаев.
Интернет изменил все. Если в начале
он напоминал некую цифровую библио-
теку — коллекцию страниц, которые кто-
то публиковал, а кто-то просматривал,
то в начале 2000-х он стремительно пре-
вратился в гигантское пространство, где
фиксировалось почти каждое действие
человека. Поисковые системы начали со-
бирать и хранить миллиарды запросов.
Электронная почта, форумы и блоги ста-
ли копить живую, естественную речь. Со-
циальные сети принесли с собой лавину
фотографий, коротких сообщений, лай-
ков и репостов. А смартфоны добавили
к этому потоку данные о передвижении,
координаты, временные метки и бесчис-
ленные снимки всего подряд — от до-
машних питомцев до уличных сцен. Каж-
дое действие, которое раньше исчезало
без следа, теперь стало оставлять чет-
кий цифровой отпечаток: что человек
написал, что увидел, что сфотографи-
ровал, какой выбор сделал, куда пошел,
на что кликнул.
Для языковых моделей ценным ока-
залось не столько содержание частных
переписок, а то, как люди в массе сво-
ей формулируют собственные мысли:
какие слова ставят рядом, как строят
фразы, как переключаются между тема-
ми. Для рекомендательных алгоритмов
ключевой стала история персонального
выбора: что пользователь посмотрел,
что пролистал, на чем остановился.
Для компьютерного зрения — милли-
оны разномастных «сырых» снимков,
сделанных в самых разных, далеких
от идеала условиях: в темноте, на ярком
Рост объемов
данных был
вызван не разви-
тием ИИ, а рас-
пространением
интернета. Поис-
ковые системы,
электронная
почта, цифровые
архивы и корпо-
ративные базы
создали массивы
текстов, изобра-
жений и логов,
которые раньше
не существовали
как единый мате-
риал для анализа
Что изменилось
с приходом боль-
ших данных:
• модели стали
обучаться на
больших массивах
реальных данных,
а не на вручную
прописанных
знаниях и исклю-
чениях;
• отдельные ошиб-
ки перестали
быть критичными
при большом объ-
еме данных;
• улучшение каче-
ства стало посте-
пенным процес-
сом, а не редкими
прорывами
солнце, на ходу, под случайным углом,
с помехами.
Важно было не только беспрецедент-
ное количество, но и принципиаль-
но новое разнообразие данных. Если
раньше набор для обучения компьютер-
ного зрения мог состоять из нескольких
сотен аккуратных фотографий объек-
та на однотонном фоне, то теперь по-
явилась возможность собрать десятки
миллионов реальных снимков — с ви-
зуальным шумом, пальцем, попавшим
в кадр, бликами, случайными прохожи-
ми на заднем плане. Такая неидеальная,
хаотичная среда оказалась для обуче-
ния неизмеримо полезнее стерильных
лабораторных условий: сеть училась
распознавать объекты не по тому, как
они выглядят в учебнике, а так, как они
существуют в реальной жизни.
Параллельно этому стихийному про-
цессу стали появляться и большие от-
крытые наборы данных, созданные
специально для исследовательских
целей. Самый известный и значимый
из них — ImageNet, гигантская коллек-
ция фотографий, размеченных по де-
сяткам тысяч категорий. Его значение
заключалось не только в огромном объ-
еме, но и в создании общего стандар-
та, возможности честно и объективно
сравнивать методы разных научных
групп. Теперь любой исследователь
в любой точке мира мог проверить,
как его модель справляется с одним
и тем же, неизменным массивом реаль-
ных изображений, а не с тщательно по-
добранными примерами.
К середине 2000-х стало очевидно:
объем и разнообразие доступных дан-
ных выросли настолько, что прежние
фундаментальные ограничения ИИ пе-
рестали быть абсолютными. Нейросе-
ти, которые еще десять лет назад не де-
монстрировали ничего впечатляющего,
теперь получили возможность учиться,
причем очень быстро. Ежесекундно за-
гружаемая в сеть информация служила
отличным сырьем, на котором модели
могли расти, усложняться и постепен-
но приближаться к тому, что мы услов-
но называем «пониманием».
КАК ВИДЕОКАРТЫ ДЛЯ ИГР СТАЛИ
«ДВИГАТЕЛЕМ» ИИ
Во второй половине 2000-х годов
у нейросетей появилась мощная тех-
нологическая опора — практически
неограниченные вычислительные ре-
сурсы. И источник этой мощи оказал-
ся неожиданным: им стали игровые ви-
деокарты, созданные для рендеринга
красивой трехмерной графики в играх,
а не для сложных научных расчетов.
Чтобы понять, почему они так иде-
ально подошли для задач ИИ, необхо-
димо взглянуть на механизм их функ-
ционирования. Графический процессор
(GPU) — это специализированный чип,
состоящий из множества (сотен и ты-
сяч) относительно простых вычисли-
тельных ядер, способных одновременно
и массово выполнять простые ариф-
метические операции. Такая парал-
лельная архитектура была необходима
Видеокарты
создавались
для обработки
графики в ком-
пьютерных играх,
но их архитекту-
ра неожиданно
подошла для
обучения нейро-
сетей. Возмож-
ность выполнять
тысячи однотип-
ных операций
параллельно
оказалась именно
тем, что нужно
для работы с ма-
трицами и пара-
метрами моделей
В середине
2000-х годов
исследователи
начали исполь-
зовать GPU для
научных расче-
тов. Это не было
заранее сплани-
рованным шагом:
индустрия раз-
влечений факти-
чески заложила
вычислительную
основу будущего
прогресса в ИИ
в играх: чтобы рассчитать цвет, свет,
тень и текстуру для каждого из мил-
лионов пикселей на экране, требуются
колоссальные объемы однотипных вы-
числений, выполняемых одновременно.
Оказалось, что процесс обучения ней-
росетей устроен очень похожим обра-
зом. Он представляет собой выполне-
ние гигантского объема однотипных
математических действий: перемно-
жения и сложения матриц, вычисле-
ния производных. Это не интеллекту-
альная, а чисто механическая работа,
которую крайне выгодно выполнять па-
раллельно, задействуя тысячи ядер од-
новременно.
Центральные процессоры (CPU), яв-
ляющиеся основой обычных компью-
теров, прекрасно справляются с раз-
нообразными последовательными
задачами, требующими сложного вет-
вления логики, но для массовых па-
раллельных вычислений они слишком
медлительны и неэффективны. GPU же
выполняли такие операции на порядок
быстрее, и, что критически важно, не-
сколько видеокарт можно было относи-
тельно легко объединить в общую вы-
числительную систему.
Ситуация качественно изменилась,
когда компания Nvidia представила
программно-аппаратную архитектуру
параллельных вычислений CUDA, кото-
рая существенно упростила использо-
вание вычислительных мощностей ви-
деокарт для задач общего назначения.
Теперь программист мог написать про-
грамму, которая заставляла видеокарту
считывать не игровую графику, а мате-
матические матрицы и градиенты, не-
обходимые для обучения нейросети.
Этот технологический прорыв со-
впал по времени со взрывным ростом
объемов данных. У ученых впервые
в истории появилась реальная воз-
можность обучать сложные модели
не на сотнях или тысячах, а на милли-
онах и миллиардах примеров — и де-
лать это не за месяцы, а за дни или
даже часы. Там, где кластеру из тра-
диционных CPU требовалась неделя,
система из нескольких GPU справля-
лась за несколько часов.
Позже появились и специализирован-
ные ускорители для ИИ, и серверные
решения с десятками GPU, и облачные
платформы для их аренды. Однако пе-
реломным моментом стал сам переход
от парадигмы последовательной обра-
ботки к массовому параллелизму, реа-
лизованному в доступном потребитель-
ском «железе».
Существенную роль сыграла и про-
стая рыночная логика: суперкомпью-
теры строят редко и стоят они дорого,
а мощные игровые видеокарты выпу-
скаются миллионами штук ежегодно,
и с каждым новым поколением они
становятся доступнее и мощнее. Бла-
годаря этому исследователи по все-
му миру получили в свое распоряже-
ние огромную вычислительную мощь,
не дожидаясь очереди на уникальное
оборудование в национальных центрах
и не выпрашивая отдельные многомил-
лионные гранты на вычисления.
Переход на ви-
деокарты резко
сократил время
экспериментов.
Задачи, которые
раньше счита-
лись слишком
дорогими или
медленными,
стали выпол-
няться в рабочем
режиме. Это из-
менило сам стиль
исследований:
вместо долгих
теоретических
споров пояьились
быстрые итера-
ции и проверка
идей на практике
Рост вычисли-
тельной мощно-
сти сам по себе
не сделал ИИ
умнее. Он лишь
позволил ис-
пользовать более
крупные модели
и больше данных.
Повышение каче-
ства стало след-
ствием масштаба,
а не появления
принципиально
новых концепций
Такое уникальное сочетание — мас-
совая доступность, архитектура,зато-
ченная под параллельные операции,
и относительно простая среда програм-
мирования — сделало видеокарты иде-
альным, хотя и неожиданным, двигате-
лем для революции в ИИ. Созданные
для развлечений, они оказались на-
много полезнее — быстрым, эффек-
тивным и экономичным способом об-
работки гигантских объемов простых
вычислений.
Когда данные стали измеряться в тера-
байтах и петабайтах,а вычислительная
мощность видеокарт — в терафлопсах,
нейросети наконец получили ту сре-
ду, где их можно было обучать по-на-
стоящему, на полную мощность. Оста-
вался последний, но столь же важный
элемент — алгоритмические идеи и ар-
хитектуры, способные эффективно ис-
пользовать эти новые возможности.
ГЛУБОКИЕ СЕТИ: ЧТО ИЗМЕНИЛОСЬ
ПО СРАВНЕНИЮ СО СТАРЫМИ
МОДЕЛЯМИ
Первые нейросетевые модели сере-
дины XX века, такие как перцептрон,
были устроены предельно просто: один
входной слои, принимающий данные,
и один выходной, выдающий ответ. Та-
кая модель могла решать лишь элемен-
тарные, линейно разделимые задачи.
Однако для решения реальных про-
блем, например распознавания руко-
писной цифры на фото, идентифика-
ции животного или понимания смысла
фразы, требуются гораздо более слож-
ные, нелинейные и многоуровневые за-
висимости.
Идея многослойных, или глубоких се-
тей, где несколько последовательных
слоев нейронов преобразуют информа-
цию шаг за шагом, возникла в научном
сообществе довольно рано. Исследова-
тели понимали интуитивно: если пер-
вый слой может выделять простейшие
признаки (например, границы или углы
на изображении), то следующий слой
может собрать из этих признаков бо-
лее сложные формы (линии, дуги, тек-
стуры), а последующие слои — соста-
вить из этих форм целые объекты или
даже сцены. С каждым таким слоем мо-
дель переводила исходные сырые дан-
ные на новый, более высокий уровень
абстракции.
Однако долгое время эта идея оста-
валась преимущественно теоретиче-
ской возможностью. Главной практи-
ческой проблемой было эффективное
обучение таких глубоких сетей. Мно-
гослойная модель содержит огромное,
подчас астрономическое количество
внутренних параметров — небольших
числовых коэффициентов (весов), ко-
торые и определяют ее поведение.
Если хотя бы часть этих параметров
настроена неправильно, итоговый ре-
зультат работы всей сети оказывается
бессмысленным. Подобрать удачную
комбинацию вручную, методом проб
и ошибок, было совершенно невозмож-
но — слишком велико пространство
возможных вариантов.
ПОЧЕМУ ГЛУ-
БОКИЕ СЕТИ
ОКАЗАЛИСЬ
РЕШАЮЩИМИ
Ранние нейросе-
ти существовали
уже несколько
десятилетий,
но обычно
состояли из од-
ного-двух слоев
и быстро упи-
рались в предел
своих возмож-
ностей. Перелом
произошел, когда
стало ясно: не-
сколько уровней
обработки под-
ряд позволяют
модели посте-
пенно перехо-
дить от простых
деталей к слож-
ным структурам,
не опираясь
на заранее за-
данные правила
и признаки
Идея многослой-
ных нейросетей
не была новой.
О них писали еще
в 1980-х, но тог-
дашние ком-
пьютеры просто
не справлялись
с объемом вы-
числений. Такие
модели считались
теоретически
интересными,
но практически
бесполезны-
ми. Их «второе
рождение» стало
возможным толь-
ко спустя деся-
тилетия, когда
вычислительные
мощности вырос-
ли многократно
Метод послойного исправления оши-
бок, известный как обратное распро-
странение ошибки (JjackpropagatiorT),
был впервые описан еще в 1974 году
(и позже, в середине 1980-х, получил
широкую известность и развитие). Он
работает по следующему логическому
принципу:
1. Сеть делает предсказание на осно-
ве входных данных.
2. Это предсказание сравнивается
с известным верным ответом, и вы-
числяется величина ошибки.
3. Затем эта ошибка «распространяет-
ся» назад по сети, от выходного слоя
к входному, при этом вычисляется,
насколько каждый конкретный па-
раметр (вес) каждого нейрона по-
влиял на итоговую ошибку.
4. Наконец все параметры корректиру-
ются ровно настолько, чтобы в сле-
дующий раз при тех же входных дан-
ных результат стал чуть точнее.
Таким образом, сеть учится постепен-
но — через бесчисленные повторения
и мелкие исправления.
Идея была чрезвычайно перспектив-
ной, но вычислительные мощности того
времени не позволяли реализовать ее
в полной мере для действительно глу-
боких архитектур. Сеть с парой слоев
и сотнями параметров — возможно.
Но для глубоких архитектур с десят-
ками слоев требовались уже миллио-
ны параметров. На компьютерах 1980-х
и 1990-х годов обучение таких моделей
превращалось в практически бесконеч-
ный процесс: модель могла неделями
работать на одном наборе данных,
не достигая сколько-нибудь значимо-
го или полезного результата.
Все изменилось с появлением двух
внешних факторов — мощных парал-
лельных видеокарт (GPU) и большо-
го объема разнообразных данных.
Как уже было сказано ранее, GPU по-
зволяли выполнять миллионы и милли-
арды однотипных операций, необходи-
мых для обратного распространения,
параллельно, что идеально подходи-
ло для математики глубоких сетей,
а огромное количество разнородных
данных предоставляли не синтетиче-
ские, а реалистичные примеры, на ко-
торых сеть могла учиться распознавать
сложные образы и связи.
И то, что еще недавно считалось ту-
пиковым направлением, неожиданно
заработало с ошеломляющей эффек-
тивностью. Глубокие сети начали де-
монстрировать возможности, абсолютно
недоступные прежним «мелким» моде-
лям. Главное принципиальное отличие
заключалось в том, что они перестали
зависеть от признаков, заранее приду-
манных и выделенных человеком. Рань-
ше разработчик или исследователь сам
должен был решить, что является важ-
ным признаком для задачи: например,
угол наклона линий для распознавания
цифр или расстояние между глазами для
детекции лиц. Машина получала эти го-
товые «инженерные» признаки на вход
и могла лишь их комбинировать.
Глубокие сети поступили принци-
пиально иначе. Они научились самосто-
Долгое время
главной пробле-
мой оставалось
обучение. При
увеличении
числа слоев сеть
переставала кор-
ректно обновлять
свои параме-
тры, и обучение
фактически
ломалось. Новые
методы настрой-
ки и обучения
позволили ста-
бильно работать
с моделями,
состоящими
из десятков уров-
ней, что ранее
считалось почти
недостижимым
Глубокие сети
изменили и роль
человека в раз-
работке. Вме-
сто того чтобы
описывать, какие
именно признаки
важны, иссле-
дователь задает
общую структуру,
а модель сама
выстраивает
внутренние
представле-
ния — от про-
стых элементов
к более сложным
и абстрактным
уровням описа-
ния
ятельно вычислять иерархию призна-
ков, наиболее полезных для решения
конкретной задачи. Например, в слу-
чае сверточной сети для распознава-
ния изображений:
• первый слой отмечает простейшие
перепады яркости, то есть контуры
и края;
• второй слой, анализируя комбина-
ции этих контуров, выделяет более
сложные формы: линии, углы, изги-
бы, пятна;
• третий слой комбинирует эти формы
в части узнаваемых объектов: ухо, ко-
лесо, крыло, окно;
• четвертый и последующие слои со-
бирают части в целые объекты: кош-
ку, автомобиль, здание;
• самые глубокие слои могут анализи-
ровать контекст, в котором эти объ-
екты встречаются.
Это не умозрительная теория — имен-
но так и работают современные сети,
что неоднократно подтверждалось экс-
периментами по визуализации их вну-
тренних, скрытых слоев. Глубина при-
дала моделям принципиально новую
способность к постепенному понима-
нию — не в философском, а в сугубо
практическом статистическом смысле:
каждый слой добавляет свой уровень
абстракции, и в итоге сеть начинает
улавливать сложные закономерности,
которые человек-наблюдатель может
даже не осознавать или не замечать.
Еще одно важнейшее отличие —
практически неограниченная мас-
штабируемость. Если ранние методы
машинного обучения хорошо работа-
ли на сотнях или тысячах примеров,
то глубокие сети не только справляют-
ся с миллионами и миллиардами при-
меров, но и их качество продолжает
расти по мере увеличения объема дан-
ных и вычислительных ресурсов. Чем
богаче и разнообразнее опыт, тем точ-
нее и устойчивее становится модель.
Это резко контрастирует с парадигмой
экспертных систем 1970-1980-х годов,
когда добавление каждого нового пра-
вила лишь усложняло систему, замед-
ляло ее работу и увеличивало число
внутренних противоречий.
В итоге глубокие сети стали тем не-
достающим звеном, которое позволи-
ло эффективно и с синергией исполь-
зовать оба компонента: большой объем
данных и мощные параллельные вычис-
ления. Данные предоставили возмож-
ность собрать достаточный опыт, GPU
сделали обработку этого опыта воз-
можной за разумное время, а глубина
архитектуры позволила машине извле-
кать из данных сложные иерархиче-
ские закономерности, а не просто за-
поминать поверхностные шаблоны. Без
этой триады — данных, GPU и глубоких
сетей — современный ИИ в том виде,
в каком мы его знаем, не смог бы воз-
никнуть.
НЕЙРОСЕТИ НАУЧИЛИСЬ ВИДЕТЬ,
СЛЫШАТЬ И РАЗБИРАТЬ ТЕКСТ
Когда глубокие сети в целом до-
казали свою эффективность, перед
Глубокие сети
не понимают
мир в челове-
ческом смысле.
Они научились
лучше улавливать
сложные связи
в данных и делать
более точные
прогнозы.Это
не философский
прорыв, а ин-
женерный, и он
сделал современ-
ные ИИ-системы
практичными
и массово приме-
нимыми
Компьютерное
зрение долго
считалось почти
недостижимой
задачей. Про-
рыв произошел,
когда изображе-
ния перестали
воспринимать как
сцены с объек-
тами, а начали
обрабатывать
как числовые
массивы. Нейро-
сеть шаг за шагом
училась выделять
контуры, формы
и устойчивые ви-
зуальные струк-
туры без явных
инструкций
исследователями встала новая мас-
штабная задача — адаптировать общую
идею глубины и обучения к радикально
разным типам данных. Изображение —
это двумерная сетка пикселей, облада-
ющая пространственной локальностью
(близкие пиксели связаны). Речь — это
одномерная волна, превращенная в по-
следовательность чисел, где важен вре-
менной контекст. Текст — это цепочка
слов или символов, где смысл зачастую
зависит от связей между элементами,
иногда отстоящими далеко друг от дру-
га в предложении. Для эффективной
работы с таким разнообразием стали
появляться и бурно развиваться специ-
ализированные архитектуры нейрон-
ных сетей. Хотя внешне и математиче-
ски они различаются, все они следуют
одному общему принципу глубокого
обучения: шаг за шагом, слой за сло-
ем извлекать из данных иерархиче-
ские закономерности, которые чело-
век схватывает интуитивно.
Прорыв в анализе изображений со-
вершили сверточные нейронные сети
(Convolutional Neural Networks, CNN).
Их ключевая архитектурная идея —
использование небольших одинако-
вых фильтров (ядер свертки), которые
«скользят» по всему входному изобра-
жению и локально выделяют повторя-
ющиеся паттерны. Сначала такие филь-
тры в процессе обучения сами учатся
замечать простейшие элементы: грани-
цы, углы, цветные пятна. Затем из ак-
тиваций простых элементов на следую-
щем слое составляются более сложные
формы — линии, дуги, простые тексту-
ры. На следующих уровнях сеть уже
распознает части объектов: глаз жи-
вотного, колесо автомобиля, дверную
ручку. В конце концов на самых глубо-
ких слоях формируется целостный, ос-
мысленный образ: кошка, машина, че-
ловеческое лицо. Такая иерархическая
обработка позволила машине вперЕ-ые
видеть не просто как набор отдельных
пикселей, а как структурированную
сцену со смыслом, и сделала возмож-
ным надежное распознавание объектов
на реальных, зашумленных фотографи-
ях, с плохим освещением, сложным фо-
ном и артефактами.
Обработка речи и других времен-
ных последовательностей долгое вре-
мя требовала другого подхода. Здесь
ключевым был учет порядка и контек-
ста. Для таких задач изначально ши-
роко применялись рекуррентные ней-
ронные сети (Recurrent Neural Networks,
RNN), в частности их усовершенство-
ванные варианты вроде LSTM (Long
Short-Term Memory). Они обрабатыва-
ли сигнал строго по порядку, шаг за ша-
гом, сохраняя в своей внутренней памя-
ти информацию о предыдущих шагах.
Это позволяло улавливать зависимости
во времени: например, согласовывать
слова в предложении, учитывать инто-
национный контур речи или предска-
зывать следующее значение в финан-
совом ряде. Однако у таких сетей был
серьезный недостаток: с ростом длины
анализируемой последовательности им
становилось все сложнее удерживать
Речь и музыка
перестали рас-
сматриваться как
особые сигналы,
требующие уни-
кальных мето-
дов. Их начали
представлять
в виде чисел
и обрабатывать
теми же алгорит-
мами, что и изо-
бражения. Это
резко упростило
распознавание
речи и анализ
аудиопотоком
Ключевым вы-
водом стало то,
что текст, звук
и изображение
можно описывать
единым матема-
тическим языком.
Различие между
ними оказалось
не принципи-
альным, а тех-
ническим. Это
понимание подго-
товило почву для
систем, которые
работают сразу
с несколькими
типами данных
и корректно использовать контекст
из далекого прошлого — они начина-
ли «забывать» то, что было в начале.
Это ограничивало качество распозна-
вания длинной связной речи и созда-
вало проблемы в машинном переводе
больших текстов.
Подлинный перелом произошел с по-
явлением в 2017 году архитектуры
«трансформер» (Transformer). Ее глав-
ное и революционное новшество — ме-
ханизм внимания (attention), в част-
ности самовнимания (self-attention).
В отличие от рекуррентных сетей,
трансформер не обязан идти по тек-
сту или последовательности строго
по порядку. Вместо этого он имеет воз-
можность одновременно (параллель-
но) анализировать все элементы по-
следовательности (например, все слова
в предложении) и вычислять, насколь-
ко определенный элемент важен для
понимания каждого следующего эле-
мента.
Трансформеры решили сразу две
ключевые проблемы предыдущих архи-
тектур. Во-первых, они оказались иде-
ально масштабируемыми на гигантских
объемах текстовых данных: чем боль-
ше и разнообразнее текстовая база для
обучения, тем более тонкие и точные
семантические связи они могут выяв-
лять. Во-вторых, их архитектура лег-
ко масштабируется технически: можно
практически безгранично увеличивать
число слоев (глубину) и параметров
(ширину) модели, и ее качество при
этом продолжает предсказуемо расти.
Трансформеры легли в основу всех со-
временных гигантских языковых моде-
лей, таких как GPT и BERT.
ПЕРВЫЕ НАСТОЯЩИЕ УСПЕХИ
Когда глубокие сети и их специализи-
рованные архитектуры освоили рабо-
ту с разными типами данных, их первые
серьезные достижения начали прояв-
ляться не столько на страницах науч-
ных журналов, сколько в повседневной
цифровой практике миллионов пользо-
вателей. Многие люди даже не догады-
вались, что в их карманных телефонах,
веб-браузерах и домашних устройствах
работают сложные нейросетевые моде-
ли. Так ИИ окончательно перестал быть
академическим экспериментом и пре-
вратился в массовый рабочий инстру-
мент.
Одной из первых и самых заметных
областей, где этот переход стал очеви-
ден для всех, был машинный перевод.
До начала 2010-х годов он в основном
строился на комбинации ручных линг-
вистических правил и статистических
методов: системы сопоставляли слова
и фразы по заранее составленным сло-
варям и сложным статистическим алго-
ритмам, но результат часто распадался,
как только исходный текст хоть немно-
го отклонялся от привычных шаблонов.
Переводы получались механическими,
неприменимыми в повседневной жизни,
а иногда и просто курьезными.
Ситуация изменилась радикально, ког-
да крупные технологические компании,
Глаьным отли-
чием глубоких
сетей стало
количество
уровней обра-
ботки. Каждый
следующий слой
работает не с сы-
рыми данными,
а с результатами
предыдущего
анализа.Это по-
зволяет системе
постепенно пе-
реходить от про-
стых элементов
к более слож-
ным — от линий
к формам, от зву-
ков к словам
Ранние ней-
росети часто
ломались при
малейших изме-
нениях входных
данных. Глубокие
архитектуры
оказались устой-
чивее: они лучше
справляются
с шумом, иска-
жениями и вари-
ативностью, что
особенно важно
для работы с ре-
альными, а не ла-
бораторными
данными
и в первую очередь Google, начали вне-
дрять нейросетевые модели перевода
в своих публичных сервисах. В 2016 году
IT-гигант представил систему Google
Neural Machine Translation (GNMT) и ини-
циировал поэтапный, но быстрый пе-
реход всего сервиса «Google Перевод-
чик» с прежних статистических методов
на новую нейросетевую архитектуру.
Разница для пользователей стала за-
метна практически сразу: перевод це-
лых предложений и абзацев зазвучал
гораздо естественнее и грамотнее, мно-
гозначные слова стали намного точнее
попадать в контекст, практически исчез-
ли грубые грамматические ошибки, ха-
рактерные для старых систем.
Параллельно, примерно в те же годы,
произошел качественный прорыв в об-
ласти распознавания речи. Ранние го-
лосовые интерфейсы, .строенные
в телефоны или автоответчики, были
вежливыми, но на практике почти бес-
полезными. Они понимали только уз-
кий, заранее заученный набор жестких
команд и «ломались» на любом неожи-
данном слове или акценте. Глубокие
сети, обученные на огромных архивах
реальных аудиозаписей человеческой
речи, впервые позволили системе вос-
принимать речь не как набор изоли-
рованных команд,а как непрерывный
поток живых, вариативных звуков,
из которого нужно в реальном време-
ни извлекать смысл.
Когда компании вроде Apple (Siri),
Google (Google Assistant) и Amazon
(Alexa) внедрили такие модели в свои
голосовые помощники, последние пе-
рестали быть просто технологической
игрушкой. Они научились с приемлемой
точностью распознавать разные акцен-
ты и диалекты, различать созвучные
слова, понимать смысл относительно
длинных и свободных фраз-запросов.
До идеала, разумеется, было еще да-
леко, но впервые в истории появилась
возможность общаться с электронным
устройством почти так же, как с чело-
веком, — пусть и на самом простом, бы-
товом уровне.
В компьютерном зрении перелом-
ный момент наступил после знако-
вого конкурса ImageNet Large Scale
Visual Recognition Challenge (ILSVRC).
В 2012 году победу в этом соревнова-
нии с огромным отрывом одержала глу-
бокая сверточная сеть AlexNet, разра-
ботанная Алексом Крижевским, Ильей
Суцкевером и их коллегами под руко-
водством Джеффри Хинтона. Это был
не просто новый рекорд точности, а на-
стоящий сдвиг парадигмы в научном со-
обществе: стало окончательно ясно, что
глубокие нейросетевые архитектуры
способны решать задачи распознава-
ния объектов на фотографиях с точно-
стью, которая прежде считалась недо-
стижимой для машин в принципе.
Практическое применение таких мо-
делей нашлось почти мгновенно. Ал-
горитмы автоматической сортировки
фотографий в галереях смартфонов
по лицам друзей и членов семьи, функ-
ции «умного» поиска по фото, систе-
мы автоматической фокусировки камер
Распростра-
ненный упрек
в адрес глубо-
ких сетей — их
«непрозрач-
ность». Однако
на практике эго
означало не от-
сутствие логики,
а сложность ее
описания просты-
ми правилами.
Вместо цепочек
условий систе-
ма использует
распределенные
представления,
которые трудно
перевести на че-
ловеческий язык
Глубокие сети
не были одним
открытием.
Это результат
накопления идей,
экспериментов
и инженерных
решений, кото-
рые по отдель-
ности выглядели
скромно, но вме-
сте радикально
изменили воз-
можности машин-
ного обучения
на главном объекте в кадре, технологии
распознавания предметов на снимках
в социальных сетях для предложения
тегов — все это стало доступным и мас-
совым. В некоторых узких, но показа-
тельных задачах, например в точном
определении пород собак по фотогра-
фии, некоторые модели стали справ-
ляться даже лучше, чем среднестати-
стический человек-неспециалист.
Одновременно с этим незаметно для
многих происходила и тихая револю-
ция в рекомендательных системах.
Они не всегда были «чистыми» глубо-
кими нейросетями в современном по-
нимании, но с середины 2010-х нача-
ли активно впитывать идеи и методы
глубокого обучения. Персонализиро-
ванные потоки видео на YouTube, филь-
мов на Netflix, музыки на Spotify, то-
варов в интернет-магазинах и статей
в новостных лентах стали настраивать-
ся под вкусы конкретного пользователя
с невиданной ранее точностью. Люди
начали замечать, что сервис будто бы
«понимает» их скрытые предпочтения
и интересы. На деле, конечно, алгоритм
просто научился на гигантском масси-
ве данных (выборах, кликах, времени
просмотра, отказах) выявлять сложные,
неочевидные паттерны и корреляции.
Но потребительский эффект был впе-
чатляющим: впервые ИИ начал напря-
мую и ежедневно влиять на то, что мы
смотрим, читаем, слушаем и покупаем.
ИИ В ПОВСЕДНЕВНОСТИ СЕГОДНЯ
Технологии обретают подлинную
значимость, лишь когда растворяются
в повседневности, становясь невидимыми.
Марк Вейзер
Современный искусственный интеллект редко предстает
в образе футуристического робота. Чаще он невидим, встро-
ен в привычные сервисы: незаметно фильтрует спам, реко-
мендует фильмы, распознает речь, оптимизирует маршруты.
Его сила — в этой повсеместной и неприметной работе. Ме-
няя обыденные процессы шаг за шагом, ИИ становится циф-
ровой инфраструктурой нашей жизни.
ОН ВАС ПОНИМАЕТ: КАК
КОМПЬЮТЕР НАУЧИЛСЯ СЛЫШАТЬ
И РАЗГОВАРИВАТЬ
В начале 2000-х возможность пого-
ворить с компьютером выглядела ско-
рее забавной диковинкой. Системы
распознавания речи существовали,
но работали лишь в идеальных усло-
виях: требовали четких команд, огра-
ниченного словаря и полной тишины.
Любое отклонение — акцент, фоно-
вый шум, пауза — приводило к сбою.
Поэтому голосовое управление дол-
го оставалось лабораторным экспе-
риментом и почти не проникало в по-
вседневность.
Перелом наступил, когда распоз-
навание речи перестали строить
по жестким правилам и позволили ИИ
учиться на огромных массивах реаль-
ных записей. Вместо того чтобы про-
граммировать, как должно звучать
Качество распозна-
вания речи обычно
измеряют показа-
телем WER — долей
ошибок в расшиф-
рованном тексте.
Он показывает,
сколько слов си-
стема перепугала,
пропустила или
вставила лишними.
Такой способ оцен-
ки удобен тем, что
позволяет срав-
нивать разные ал-
горитмы на одном
и том же наборе
записей и видеть
реальный прогресс,
а не субъективное
ощущение «вроде
стало лучше»
Одной из самых
сложных за-
дач для систем
распознавания
речи долгое
время оставалась
работа в шумной
обстановке. Ког-
да вокруг говорят
сразу несколько
человек, слышны
музыка или эхо,
алгоритму трудно
отделить нужный
голос от фона.
На практике это
означает, что
качество микро-
фона и условия
записи иногда
влияют на ре-
зультат сильнее,
чем сложность
самой модели
слово, машине стали показывать мил-
лионы примеров живой речи: быстрой
и медленной, с запинками, по телефону,
в машине, на улице. Нейросеть училась
находить устойчивые закономерности
в этом хаосе — не в идеализированной,
а реальной человеческой речи.
Современные системы не «слышат»
слова напрямую. Они работают с не-
прерывным звуковым потоком, который
разбивается на миллисекундные фраг-
менты. Сеть анализирует, как меняют-
ся характеристики звука во времени,
и сопоставляет эти паттерны с вероят-
ными фонемами. Затем другая модель
превращает последовательность зву-
ков в слова, учитывая контекст. Если
фразу можно понять двояко, систе-
ма выбирает вариант, который лучше
вписывается в смысл целого предло-
жения. Качество распознавания резко
выросло, когда к акустическим моде-
лям добавились языковые — те, кото-
рые знают, какие слова обычно сто-
ят рядом.
На практике это знакомо каждому,
кто пользовался Siri или «Алисой». Ког-
да вы говорите «поставь будильник
на семь», система сначала превраща-
ет звук в текст, затем распознает наме-
рение и только после этого выполняет
действие. Сам разговор здесь вторичен:
машине не нужно понимать фразу как
человек, ей достаточно правильно ин-
терпретировать команду.
Сегодня распознавание речи ста-
ло вездесущей инфраструктурой. Оно
работает в автоматических субтитрах,
в голосовой диктовке на смартфонах,
в расшифровке интервью и подкастов.
В кол-центрах система анализирует
звонок, чтобы направить его нужному
оператору; в медицине — превращает
речь врача в текстовую запись; в юрис-
пруденции — автоматически фиксиру-
ет судебные заседания. Во всех этих
случаях ИИ не ведет диалог, а выпол-
няет за кадром рутинную работу, эко-
номя людям время и силы.
Следующим шагом стало поддержа-
ние связного диалога. Ранние чат-бо-
ты выглядели убедительно лишь в ко-
ротких демонстрациях: они отвечали
на отдельные реплики, но теряли нить
разговора при первом же уточняющем
вопросе.
Современные системы устроены ина-
че. Например, боты поддержки банков
или магазинов ведут многошаговый диа-
лог. Если пользователь пишет «Не могу
войти в аккаунт», бот уточняет пробле-
му — пароль или код подтверждения, —
запоминает ответ и на следующем шаге
предлагает подходящую инструкцию.
Более универсальные диалоговые си-
стемы также учитывают контекст бесе-
ды, что создает ощущение живого раз-
говора, а не обмена командами.
Важно, однако, не путать связность
с подлинным пониманием. Чат-бот
не осознает существования обсуж-
даемых объектов в реальном мире
и не проверяет факты так, как это де-
лает человек. Он лишь выбирает ответ,
который статистически лучше всего со-
ответствует контексту. Поэтому такие
Многие по при-
вычке обращают-
ся к голосовым
помощникам
короткими, те-
леграфными
фразами: «погода
завтра Москва»,
«таймер две
минуты». Это
наследие ранних
систем, которые
понимали только
жестко заданные
команды. Даже
когда технологии
стали гибче, эта
манера общения
у пользователей
сохранилась
и до сих пор
влияет на то, как
люди разговари-
вают с машинами
Автоматические
субтитры стали
одной из самых
незаметных,
но значимых
областей приме-
нения распозна-
гания речи. Они
помогают людям
с нарушениями
слуха, тем, кто
изучает язык,
и всем, кто смо-
трит видео без
звука. При этом
задача не сво-
дится к простому
распознаванию
слов:системе
важно правильно
передавать пау-
зы, имена и гра-
ницы смысловых
блоков, иначе
текст становится
трудночитаемым
системы могут звучать убедительно,
но при этом ошибаться или «додумы-
вать» детали, особенно в областях, где
обучающие данные были неполными
или противоречивыми.
Тем не менее этого уровня понима-
ния оказалось достаточно для мно-
жества практических задач. Там, где
раньше требовался человек, теперь
часто хватает системы, которая умеет
слушать, распознавать и реагировать.
И хотя диалог с машиной все еще от-
личается от человеческого общения,
для многих бытовых и деловых сце-
нариев его возможностей более чем
достаточно.
ОН ВАС ЗНАЕТ: КАК ИИ УЧИТСЯ
ПОНИМАТЬ ВАШИ ИНТЕРЕСЫ
Многим знакомо ощущение, что ин-
тернет «вас знает». Музыкальный сер-
вис предлагает песню, которую хочется
дослушать до конца. Стриминговый сер-
вис подсказывает сериал, на который
не жаль потратить вечер. Интернет-ма-
газин показывает товар, который вы
как раз собирались искать. За этим эф-
фектом стоит не интуиция и не умение
подслушивать мысли, а точная и праг-
матичная математика.
Современные рекомендательные си-
стемы почти никогда не работают с лич-
ностью человека напрямую. Им необя-
зательно знать наш возраст, профессию
или убеждения. Вместо этого они вни-
мательно наблюдают за поведением:
что вы выбираете, что игнорируете,
на чем задерживаете взгляд, к чему воз-
вращаетесь. Каждое такое действие —
небольшой сигнал. Сам по себе он поч-
ти ничего не значит, но в массе эти
сигналы складываются в устойчивый
паттерн.
На языке данных это описывают как
вектор интересов — условный цифро-
вой профиль пользователя, представ-
ленный набором чисел. Каждое число
отражает склонность к определенно-
му типу контента или поведению. Сам
человек этот вектор не видит, но имен-
но с ним работают алгоритмы. Пока вы
слушаете музыку, смотрите фильм или
листаете ленту, система постоянно его
корректирует: одни значения усилива-
ются, другие ослабевают.
Хороший пример — «Яндекс Музы-
ка». Сервис не пытается понять вкус
через жанры или ярлыки вроде «рок»
или «поп». Он анализирует последо-
вательности: какие треки люди слу-
шают подряд, какие пропускают, какие
добавляют в избранное. Если поведе-
ние многих пользователей статистиче-
ски схоже, система делает вывод, что
их вкусы близки, даже если сами они
описали бы их совершенно по-разному.
Благодаря этому рекомендации часто
кажутся неожиданными, но при этом
точно попадают в настроение.
Похожий принцип работает в он-
лайн-кинотеатрах. Алгоритм учиты-
вает не только то, что вы включили,
но и как вы смотрите: досмотрели ли
серию до конца, поставили ли на па-
узу, вернулись ли позже. Эти детали
В основе боль-
шинства реко-
мендательных
систем лежит ме-
тод, называемый
коллаборативной
фильтрацией. Его
логика проста:
система не пыта-
ется понять чело-
века напрямую,
а сравнивает его
поведение с по-
ведением других
пользователей.
Если в прошлом
их выборы совпа-
дали, с высокой
вероятностью со-
впадут и будущие
предпочтения
Чтобы выявить
интересы пользо-
вателя, система
анализирует
не отдельное
действие, а их
совокупность.
Обычно учитыва-
ются:
• что пользователь
досматривает
или дочитывает
до конца;
• где он прекраща-
ет просмотр;
• к каким материа-
лам возвращается
повторно;
• по каким эле-
ментам кликает,
но быстро уходит;
• что сохраняет «на
потом», но так
и не открывает.
Из этих сигна-
лов со временем
складывается
устойчивая
модель предпо-
чтений
часто важнее явных оценок. В резуль-
тате система учится различать не про-
сто «нравится / не нравится», а более
тонкие предпочтения: любите ли вы не-
торопливые сюжеты, терпите ли длин-
ные диалоги, бросаете ли сериалы по-
сле первой серии.
В социальных сетях, например «ВКон-
такте», механика рекомендаций строит-
ся на схожей логике. В «умном» режиме
лента формируется не в хронологи-
ческом порядке, а на основе вероят-
ности, что конкретный пост удержит
наше внимание. Алгоритм оценивает
реакцию на первые несколько запи-
сей и на лету корректирует дальней-
шую выдачу. Поэтому лента постоянно
обновляется и никогда не бывает оди-
наковой у двух разных людей.
Интересно, что те же подходы при-
меняются и в сервисных чатах. Чат-бот
поддержки в банке или магазине может
учитывать историю обращений. Если
пользователь часто спрашивает о до-
ставке или платежах, система начина-
ет предлагать соответствующие сце-
нарии в первую очередь. По сути, это
тоже рекомендация — только не кон-
тента, а следующего шага в диалоге.
Важно понимать границы таких си-
стем. Они не понимают интересы в че-
ловеческом смысле и не делают вы-
водов вроде «этому человеку важно
то-то». Алгоритм работает проще: он
оценивает вероятность, что следую-
щий объект — будь то песня, фильм
или товар — окажется релевантным,
основываясь на прошлых действиях.
Если поведение меняется, меняется
и модель. Поэтому рекомендации мо-
гут быть как удивительно точными, так
и ошибочными.
Именно это делает их одновремен-
но эффективными и неоднозначными.
С одной стороны, они экономят вре-
мя и предлагают действительно инте-
ресное. С другой — могут усиливать
случайные интересы или постепен-
но сужать «информационную диету»
пользователя. В научной литературе
это называют эффектом обратной свя-
зи: модель влияет на поведение чело-
века, а поведение человека укрепля-
ет модель.
Тем не менее с технологической точки
зрения это был огромный шаг вперед.
Вместо жестких правил и категорий ИИ
научился работать с вероятностями, на-
блюдениями и постоянной адаптаци-
ей. Он не знает человека как личность,
но умеет достаточно точно предсказы-
вать его следующий выбор. И этого по-
зволило рекомендательным алгоритмам
стать одной из самых массовых и вли-
ятельных форм искусственного интел-
лекта в нашей повседневной жизни.
ОН ВАС ВИДИТ: КАК ИИ РАСПОЗНАЕТ
ИЗОБРАЖЕНИЕ
Когда говорят, что компьютер «узнает
лицо» или «видит объект», легко прове-
сти аналогию с человеческим зрением.
На деле процесс устроен принципиаль-
но иначе — ив этом различии заключа-
ется суть компьютерного зрения.
В 2006 году ком-
пания Netflix объ-
явила открытый
конкурс Netflix
Prize для инже-
неров и исследо-
вателей со всего
мира. Участникам
предложили
улучшить алго-
ритм рекомен-
даций на основе
обезличенных
данных о про-
смотрах. Конкурс
показал: замет-
ный рост каче-
ства достигается
не отдельным
приемом, а соче-
танием несколь-
ких моделей
и подходов
В компьютерном
зрении известна
проблема так
называемых
состязательных
примеров. Это
изображения,
б которые внесе-
ны едва заметные
для человека
изменения,
заставляющие
систему ошибать-
ся. Такие случаи
показывают, что
модель опирает-
ся на признаки,
не совпадающие
с человеческим
восприятием
Для человека изображение поч-
ти мгновенно наполняется смыслом:
«лицо», «автомобиль», «дерево». Для
машины картинка — изначально просто
таблица чисел, где каждая ячейка хра-
нит значение яркости и цвета. Ни пред-
метов, ни сцен, ни смысла в этих цифрах
нет. Задача системы — научиться пре-
вращать этот числовой массив в струк-
турированное описание.
Ключевое понятие здесь — вектор
признаков (векторное представление,
embedding). Это длинный набор чисел,
который нейросеть вычисляет для каж-
дого изображения. В нем закодирова-
ны визуальные характеристики: формы,
текстуры, пропорции, взаимное рас-
положение элементов. Это не словес-
ное описание и не мысленный образ,
а уникальный математический отпеча-
ток картинки.
Векторы признаков система и срав-
нивает. Когда смартфон разблокиру-
ется по лицу, он не решает логическую
задачу «вы это или нет». Он вычисля-
ет, насколько вектор текущего изобра-
жения близок к вектору, сохраненному
при настройке. Если они достаточно
похожи — доступ открывается. Поэто-
му распознавание всегда работает как
оценка сходства, а не как точное иден-
тифицирование.
Отсюда следует важный вывод: си-
стема никогда не бывает абсолютно
уверена. Она оперирует вероятностя-
ми. В любой такой технологии зада-
ется порог — насколько похожими
должны быть векторы, чтобы считать
их совпадением. Слишком строгий по-
рог — и система будет часто не узна-
вать владельца. Слишком мягкий —
начнет принимать чужих за своих. Это
не ошибка, а фундаментальный компро-
мисс, и настройка порога зависит от за-
дачи: разный баланс требуется для раз-
блокировки телефона, прохода в офис
или контроля в аэропорту.
Другая ключевая идея — инвариант-
ность, то есть устойчивость к измене-
ниям. Хорошая система должна узна-
вать объект независимо от ракурса,
освещения, мимики или частичного пе-
рекрытия. Для человека это естествен-
но; для машины — сложная проблема.
Нейросети решают ее не через прави-
ла, а через обучение на разнообразных
примерах. Если в имеющихся данных
объект встречался в разных условиях,
сеть учится игнорировать несуществен-
ные изменения и выделять устойчивые
признаки. Но если каких-то ситуаций
в обучающей выборке не было, имен-
но в них система и будет ошибаться.
Отсюда возникает важное ограниче-
ние: компьютер видит не мир как таковой,
а те паттерны, которые извлек из загру-
женных для обучения материалов. Если
модель училась на определенном типе
изображений, она переносит эти шабло-
ны на реальность. Это не предвзятость
в человеческом смысле, а прямое след-
ствие статистического подхода.
Существуют и более тонкие эффек-
ты. Например, системы могут реагиро-
вать на изменения, почти незаметные
для человека: легкий сдвиг пикселей,
Большинство
систем компью-
терного зрения
обучаются
на размеченных
наборах данных.
Люди заранее
просматривают
изображения
и указывают,
где находится
нужный объект.
Создание таких
наборов — тру-
доемкий и до-
рогой процесс,
а ошибки в раз-
метке напрямую
влияют на то,
чему именно нау-
чится модель
На практике
компьютерное
зрение чаще
всего применяют
в задачах контро-
ля: поиск дефек-
тов, проверка
качества сборки,
анализ повторяю-
щихся операций.
Здесь важна
не универсаль-
ность, а надеж-
ность — способ-
ность стабильно
работать в строго
заданных усло-
виях и давать
воспроизводи-
мый результат
добавление шума или едва уловимые
искажения способны значительно из-
менить вектор признаков и привести
к ошибке. Это показывает, что нейро-
сеть воспринимает не целостный образ,
а те структуры, которые значимы для ее
внутренней математической модели.
При этом было бы неверно считать
компьютерное зрение в целом несо-
вершенным. В четко заданных услови-
ях такие системы превосходят челове-
ка: они могут без устали анализировать
видео, замечать минимальные отклоне-
ния, сравнивать тысячи изображений
одновременно. Поэтому технологии ши-
роко используются в промышленности,
медицине, логистике и безопасности —
там, где важны масштаб, скорость и не-
изменность критериев.
Главное — понимать, что компьютер
не видит мир так, как мы. Он опериру-
ет абстрактными числовыми представ-
лениями, лишь косвенно связанными
с тем, что человек называет объекта-
ми или лицами. Поэтому компьютерное
зрение одновременно поражает свои-
ми возможностями и иногда допускает
неожиданные, почти непредсказуемые
ошибки. Эта двойственность — не вре-
менный недостаток, а фундаментальная
особенность подхода.
ОН ВАС ВЕДЕТ: КАК ИИ
ОРИЕНТИРУЕТСЯ В ПРОСТРАНСТВЕ
Когда навигатор прокладывает марш-
рут или автомобиль автоматически дер-
жит полосу, кажется, будто машина
просто следует заложенным инструк-
циям. На самом деле за этим стоит одна
из сложнейших задач для искусствен-
ного интеллекта — принятие решений
в физическом мире, где информация
всегда неполна, а любая ошибка может
иметь серьезные последствия.
В отличие от распознавания речи или
изображений, здесь недостаточно пра-
вильно интерпретировать данные. Си-
стема должна выбрать действие и сде-
лать это своевременно. Ошибка в слове
приводит к неверному ответу, ошибка
в движении — к аварии. Поэтому зада-
чи навигации и управления считаются
одними из самых требовательных к на-
дежности ИИ.
С научной точки зрения это область
планирования и управления. Система
должна постоянно отвечать на три клю-
чевых вопроса: где я нахожусь, что про-
исходит вокруг и какое действие сей-
час наиболее безопасно и эффективно.
Ни на один из них нетточного ответа —
все решается на основе вероятностных
оценок и приближений.
Возьмем нагигаторы. Современные
программы давно перестали быть про-
сто электронными картами. Они стро-
ят прогнозы движения, анализируя
скорость потока, пробки, время су-
ток, день недели и множество других
факторов. Для каждого участка до-
роги оценивается не одно значение
времени, а диапазон возможных вари-
антов. В результате маршрут выбира-
ется не самый короткий, а тот, который
с наибольшей вероятностью приведет
КАК МАШИНА
ОРИЕНТИРУЕТСЯ
БЕЗ КАРТЫ
В робототех-
нике широко
используется
подход SLAM —
одновременные
локализация
и построение
карты.Система
определяет свое
положение и по-
степенно строит
карту окружаю-
щего простран-
ства. Это необ-
ходимо там, где
невозможно по-
лагаться на GPS'.
внутри зданий,
в тоннелях или
плотной город-
ской застройке
При построении
маршрута си-
стема учитывает
не только рассто-
яние, но и допол-
нительные факто-
ры: вероятность
задержек, слож-
ные перекрестки,
резкие маневры.
Каждому участку
пути присваива-
ется «стоимость»,
и итоговый марш-
рут выбирается
наиболее надеж-
ный, а не просто
самый короткий
к цели быстрее и без непредвиденных
задержек.
При этом прогноз постоянно обнов-
ляется. Как только ситуация меняет-
ся — авария, резкое замедление потока
движения, перекрытие, — система пере-
сматривает свою модель дороги и пред-
лагает новое решение. Это непрерывный
процесс принятия решений в условиях
неполной и изменчивой информации.
В беспилотных автомобилях та же ло-
гика работает на гораздо более слож-
ном уровне. Машина получает данные
от нескольких типов датчиков: камер,
радаров и лидаров. Каждый из них
по-своему несовершенен: камеры чув-
ствительны к освещению, радары дают
грубую информацию о форме, а ли-
дары — приборы, которые сканиру-
ют пространство с помощью лазерных
импульсов и строят точную трехмерную
картину окружения, — точны, но до-
роги и требовательны к вычислениям.
Чтобы получить целостную картину,
система объединяет показания разных
сенсоров — этот процесс называется
слиянием данных. Но даже после это-
го остается неопределенность: объ-
ект может быть пешеходом, велосипе-
дистом или просто тенью, а расстояние
до него известно лишь с погрешностью.
Затем начинается этап принятия ре-
шений. Алгоритм рассматривает воз-
можные действия: ускориться, замед-
литься, перестроиться, остановиться.
Для каждого варианта оценивается ве-
роятность различных исходов и свя-
занный с ними риск. Цель — выбрать
действие, которое минимизирует ве-
роятность опасных последствий. Это
не интуиция и не набор жестких пра-
вил, а расчет ожидаемого результата.
Здесь проявляется фундаментальное
ограничение подобных систем. Они хо-
рошо работают в типичных ситуаци-
ях — движение по полосе, остановка
на светофоре, стандартные маненры.
Но реальный мир полон редких собы-
тий: неожиданное поведение пешехо-
да, нестандартная разметка, времен-
ные дорожные работы.Такие ситуации
труднее всего описать данными и ал-
горитмами. Если система не сталкива-
лась с подобным сценарием при обу-
чении, ее реакция становится менее
предсказуемой.
Поэтому современные решения в об-
ласти автономного вождения — это
не полноценные автопилоты, а асси-
стенты. Они берут на себя часть на-
грузки, но требуют постоянного кон-
троля со стороны человека. И это
не временный недостаток технологии,
а следствие того, что неопределенность
в физическом мире принципиально не-
устранима.
Похожие подходы применяются
и в других областях. Дроны достав-
ки, складские роботы, автоматические
погрузчики — все они решают одну
и ту же задачу: двигаться в простран-
стве, избегать столкновений и дости-
гать цели. И везде применяется один
и тот же принцип — вероятностное
представление мира и осторожное пла-
нирование действий.
Даже базовые на-
вигационные за-
дачи разбивают-
ся на множество
этапов: распозна-
вание разметки,
отделение теней
от линий,учет по-
годных условий,
сопоставление
данных с разных
датчиков. Поэто-
му такие системы
проектируются
с резервирова-
нием: если один
источник инфор-
мации дает сбой,
управление опи-
рается на другие
Во многих при-
кладных задачах
ИИ не принимает
окончательное
решение, а по-
могает сосредо-
точить внимание
специалистов.
Например, ан-
тифрод-система
может не блоки-
ровать платеж
автоматически,
а отправлять
его на ручную
проверку. В этом
случае алго-
ритм сортирует
поток операций
по степени риска,
чтобы специа-
листы тратили
время прежде
всего на самые
подозрительные
случаи
ОН РАБОТАЕТ ЗА КУЛИСАМИ:
ИИ КАК СИСТЕМА ОТБОРА
И ПРИОРИТИЗАЦИИ
Далеко не весь искусственный ин-
теллект создан для прямого взаимо-
действия с человеком. Значительная
часть ИИ действует там, где нет ни ди-
алога, ни изображений, ни «умного по-
ведения» в привычном понимании.Его
задача — не понимать пользователя,
а помогать сложным системам справ-
ляться с огромными потоками событий,
данных и решений.
Современные цифровые сервисы по-
стоянно сталкиваются с одной пробле-
мой: информации и операций слишком
много, чтобы обрабатывать их вруч-
ную. Поэтому ИИ все чаще используется
как инструмент отбора и упорядочива-
ния. Поисковые системы решают, какие
страницы показать первыми. Почто-
вые сервисы определяют, какое пись-
мо важно, а какое — спам. Финансовые
платформы оценивают, какую транзак-
цию провести автоматически, а какую
проверить дополнительно. Во всех этих
случаях ИИ не понимает смысл, а оце-
нивает приоритет.
С научной точки зрения такие задачи
относятся к классификации и ранжи-
рованию. Система получает объект —
будь то письмо, запрос, транзакция или
сообщение — и должна либо отнести
его к определенной категории, либо
определить его место в очереди. Гра-
ницы между категориями почти всегда
размыты: письмо может быть похоже
на спам, но не быть им; операция может
выглядеть необычно, но оказаться за-
конной. Поэтому решения принимают-
ся не по жестким правилам, а на осно-
ве вероятностей.
Здесь действует тот же принцип ком-
промисса между разными типами оши-
бок, о котором уже говорилось рань-
ше: любая система отбора вынуждена
выбирать между излишней строгостью
и чрезмерной мягкостью, и потому ее
пороги всегда настраиваются под кон-
кретные риски и задачи — будь то по-
чта, финансовый мониторинг или мо-
дерация контента.
Особое место занимает задача об-
наружения аномалий. Здесь ИИ ищет
не конкретный шаблон, а то, что вы-
бивается из обычной картины. В бан-
ковских системах это могут быть
нетипичные транзакции, в промышлен-
ности — нестандартные показания дат-
чиков, в сетях — подозрительная ак-
тивность. Системе не нужно знать, что
именно произошло. Ее цель — указать
на отклонение и привлечь внимание
человека.
Важно, что в таких системах ИИ ча-
сто работаете крайне редкими событи-
ями. Большинство операций нормаль-
ны, а интерес представляют единичные
исключения. Это делает задачу особен-
но сложной: система должна быть чув-
ствительна к отклонениям, но не реаги-
ровать на обычные колебания. Поэтому
подобные решения требуют постоянной
тонкой настройки и контроля.
Еще одна особенность «закулисно-
го» ИИ — трудность объяснения его
Системы отбора
сталкиваются
с проблемой
редких событий.
Мошеннические
операции или
опасные ошиб-
ки составляют
малую долю
данных, и модель
может выгля-
деть успешной
по формальным
метрикам,но при
этом пропускать
именно то, ради
чего она создана.
Поэтому на прак-
тике отдельно
анализируют
пропуски и лож-
ные срабатыва-
ния, а не только
общую точность
Даже хорошо на-
строенная систе-
ма со временем
теряет качество.
Поведение поль-
зователей меня-
ется, появляются
новые схемы
злоупотреблений,
язык и контексты
обновляются. Это
явление назы-
вают дрейфом
данных. Чтобы
ИИ оставался
полезным, его
регулярно про-
веряют на но-
вых примерах
и переобучают
с учетом свежей
информации
решений. Модель может уверенно
пометить событие как рискованное,
но не дать понятное человеку обосно-
вание. Это называют проблемой интер-
претируемости: чем сложнее модель,
тем труднее понять, какие именно при-
знаки повлияли на результат.
Из-за этого во многих областях со-
знательно используют более простые
алгоритмы, даже если они несколько
менее точны. Это не отставание, а осоз-
нанный выбор. Там, где важна проверя-
емость и ответственность, понятность
часто оказывается важнее максималь-
ной эффективности.
Такой ИИ редко заметен пользовате-
лю. Он не выглядит умным и не привле-
кает внимания. Однако он определяет,
какие события доходят до человека,
какие решения принимаются автомати-
чески, а где требуется вмешательство.
В этом смысле искусственный интел-
лект давно стал частью цифровой ин-
фраструктуры — не как разум, а как
механизм отбора и фильтрации.
Неизвестный художник. Портрет Ады Кинг, графини Лавлейс.
Ок. 1840 г. Музей науки, Лондон.
Ада Лавлейс (1815-1852) — английская математик, автор первых
известных алгоритмов для механической вычислительной маши-
ны Бэббиджа, одна из ключевых фигур в истории программиро-
вания и предтеча идей вычислительного интеллекта
Неизвестный автор. Портрет Джорджа Буля.
«Иллюстрированные лондонские новости», 21 января 1865 г.
Джордж Буль (1815-1864) — английский математик и логик,
автор булевой алгебры — основы цифровой логики, без которой
невозможно представить компьютеры и искусственный интеллект
ЭПОХА БОЛЬШИХ
ЯЗЫКОВЫХ МОДЕЛЕЙ
Пределы моего языка
означают пределы моего мира.
Людвиг Витгенштейн
Когда ИИ научился не просто обрабатывать, а понимать
человеческий язык, взаимодействие с техникой перешло
на новый уровень. Текст стал универсальным интерфейсом:
благодаря ему можно вести диалог, ставить задачи, писать
код, управлять сложными системами. Эта особенность со-
временных систем искусственного интеллекта породила ил-
люзию подлинного мышления.
РАЗНЫЕ ПОДХОДЫ К СОЗДАНИЮ
ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Когда говорят об искусственном
интеллекте, часто кажется, что это
единая технология, которая со вре-
менем просто становится умнее.
В реальности развитие ИИ с самого
начала шло несколькими параллель-
ными путями. Каждое из направле-
ний предлагало свой ответ на во-
прос: что можно считать разумным
поведением машины?
Один из самых ранних подходов ис-
ходил из идеи, что интеллект — это
прежде всего способность учиться
на опыте и находить закономерности
в данных. На этой основе сформиро-
валось направление, которое сегод-
ня называют машинным обучением
(machine learning). Его истоки связа-
ны, например, с моделью перцептрона
Помимо обуче-
ния на примерах
и логических
правил существует
вероятностный
подход. В нем
система не дает
жесткого ответа,
а оценивает сте-
пень уверенности:
какой вариант
более вероятен
при имеющихся
данных.Такие
модели особенно
полезны в ситуа-
циях, где инфор-
мация неполная
или зашумленная
Отдельный класс
методов — обу-
чение с подкре-
плением. В нем
системе не пока-
зывают пра-
вильные ответы
заранее. Вместо
этого задают
цель и вводят
систему поощре-
ний и штрафов
за действия.
Алгоритм учится
на последствиях
собственных
решений. Такой
подход исполь-
зуют в играх,
управлении
и робототехнике,
но он требует
очень точной
формулировки
цели
Фрэнка Розенблатта. В этом подходе
системе показывают множество при-
меров, и она постепенно учится выяв-
лять статистические зависимости, ко-
торые помогают решать задачу.
Такие модели хорошо работают там,
где задача четко определена: распоз-
нать лицо, обнаружить объект на изо-
бражении, определить произнесенное
слово. Однако за пределами своей уз-
кой специализации они практически
бесполезны. Система, обученная раз-
личать кошек и собак, не становится
от этого ближе к пониманию языка или
логических связей. Она не понимает
суть задачи, она лишь выявляет стати-
стические различия между примерами.
Другой путь основывался на пред-
ставлении, что интеллект — это спо-
собность действовать и делать вы-
бор. Здесь главным было не описание
мира, а умение принимать решения, ве-
дущие к желаемому результату. Это на-
правление получило название «обуче-
ние с подкреплением» (reinforcement
learning) и обычно рассматривается как
один из подходов внутри машинного
обучения. Система пробует различ-
ные действия, получает вознагражде-
ние или штраф и постепенно учится вы-
бирать наиболее успешные варианты.
Такие модели показали высокую эф-
фективность в играх,управлении и оп-
тимизации процессов. Они способны
находить стратегии, до которых че-
ловек мог бы и не додуматься. Одна-
ко у них есть важное ограничение:
они, как правило, работают в строго
заданной среде. Если условия меня-
ются, модель часто приходится обу-
чать заново. Кроме того, такие системы
обычно не способны объяснить, почему
было выбрано то или иное действие.
Третий подход, долгое время считав-
шийся наиболее интеллектуальным,по-
нимал разум как способность рассу-
ждать по правилам. Это направление
известно как символический искус-
ственный интеллект и связано с име-
нами Джона Маккарти и Аллена Нью-
элла. В таких системах знания о мире
задавались явно — в виде фактов, пра-
вил и логических утверждений.
Проблема заключалась в том, что весь
этот здравый смысл приходилось про-
писывать вручную. Человек должен
был заранее объяснить машине, что та-
кое объект, какие между ними возмож-
ны отношения и какие выводы из этого
следуют. Это работало в очень узких,
формализованных областях, но пло-
хо переносилось на реальный мир, где
информация неполна, противоречива
и постоянно меняется. Любые неточно-
сти — ошибки в данных, неоднознач-
ные ситуации, непредвиденные обсто-
ятельства — быстро выводили такие
системы из строя.
Важно, что все эти подходы развива-
лись параллельно и долгое время поч-
ти не пересекались. У них были раз-
ные методы, цели и представления
об успехе. Многие исследователи счи-
тали, что универсальный искусствен-
ный интеллект невозможен в прин-
ципе — настолько разными казались
В реальных про -
дуктах редко ис-
пользуют только
один метод. Чаще
всего применя-
ют гибридные
решения. Напри-
мер, нейросеть
анализирует
текст письма,
а затем сраба-
тывают жесткие
правила безопас-
ности: не пере-
водить деньги
на новый счет без
подтверждения,
не передавать
персональные
данные. Такие
ограничения
делают систему
менее гибкой,
но более надеж-
ной
С инженерной
точки зрения
искусственный
интеллект — это
не отдельный
алгоритм, а це-
почка процессов.
Данные собира-
ют и очищают,
модели обучают
и проверяют,
результаты оце-
нивают, а затем
поддерживают
систему в рабо-
чем состоянии
годами. Поэтому
успех часто за-
висит не от уни-
кального алго-
ритма, а от того,
насколько хоро-
шо выстроена вся
инфраструктура
гокруг него
задачи распознавания, принятия ре-
шений и логического вывода.
Компании и лаборатории также де-
лали разные ставки. Одни фокусиро-
вались на создании надежных решений
для конкретных прикладных задач. Дру-
гие работали над совершенствованием
отдельных методов, наращивая объемы
данных или вычислительные мощности.
Лишь немногие ожидали, что когда-ни-
будь одна модель сможетуспешно справ-
ляться с таким разнообразием задач.
Здесь стоит подчеркнуть важный мо-
мент: большие языковые модели (боль-
шие языковые модели, или LLM) поя-
вились не как попытка объединить
все прежние подходы, а как разви-
тие отдельной идеи — работы с язы-
ком. Не с изображениями, действиями
или логическими правилами, а имен-
но с текстом — тем самым материа-
лом, в котором человечество веками
хранит знания, инструкции и сложные
рассуждения.
ПОЧЕМУ ЯЗЫК СТАЛ ОСНОВОЙ
НОВОГО ИИ
Чтобы понять значение больших язы-
ковых моделей, стоит начать с самого
понятия языковой модели. В своей ос-
нове это система, которая учится пред-
сказывать продолжение текста: поуже
имеющимся словам она оценивает, ка-
кие слова с наибольшей вероятностью
могут следовать дальше.
На первый взгляд такая задача мо-
жет показаться слишком примитивной,
чтобы иметь отношение к интеллекту.
Однако человеческий язык — не слу-
чайный набор слов. В текстах люди
фиксируют знания о мире, объясняют
причинно-следственные связи, форму-
лируют инструкции, ведут споры, стро-
ят рассуждения и пишут программы.
Обучаясь предсказывать текст, модель
неизбежно осваивает и эти структуры,
пусть не осознанно, а в виде статисти-
ческих закономерностей.
Языковые модели существова-
ли и раньше — первые такие систе-
мы появились еще во второй половине
XX века, а в практических приложени-
ях стали заметны с 1990-х годов. Их
использовали в автодополнении тек-
ста, машинном переводе и проверке ор-
фографии. Однако долгое время они
оставались сравнительно простыми:
работали с коротким контекстом, пло-
хо удерживали смысл протяженного
текста и быстро теряли точность, если
задача выходила за привычные рамки.
Перелом произошел, когда исследо-
ватели начали радикально наращивать
масштаб. Модели стали обучать на ко-
лоссальных объемах текста — книгах,
статьях, документации, диалогах. Одно-
временно рос и размер самих моделей:
в них появились миллиарды параме-
тров — чисел, определяющих реакцию
системы на разные языковые конструк-
ции. Это потребовало огромных вычис-
лительных ресурсов, но результат ока-
зался неожиданным.
Важно подчеркнуть: в модель не за-
кладывали знания о мире напрямую.
САМООБУЧЕНИЕ
БЕЗ УЧИТЕЛЯ
Язык удобен для
обучения моде-
лей тем, что в нем
уже содержится
готовая струк-
тура примеров.
В тексте всегда
есть естествен-
ная последова-
тельность: одно
слово следует
за другим.
Это позволяет
обучать модель
на задаче «пред-
сказать следу-
ющий фрагмент
текста», исполь-
зуя книги, статьи
и сайты без
ручной разметки.
Для изображений
или медицины так
не получается:
там правильные
ответы обычно
нужно задавать
^ручную
Один из интел-
лектуальных
предков языко-
вых моделей —
цепи Маркова,
предложенные
математиком Ан-
дреем Марковым
в начале XX века.
Их идея проста:
следующее со-
стояние системы
зависит от пре-
дыдущего. В язы-
ке это означает,
что следующее
слово зависит
от уже сказан-
ных. Современ-
ные модели ушли
далеко вперед,
но сама логика
предсказания
выросла из этой
математической
концепции
Ее не учили логике, физике или здра-
вому смыслу. Ее единственной задачей
по-прежнему было предсказание сле-
дующего фрагмента текста. Однако при
достижении определенного масштаба
эта задача перестала быть простой.
Чтобы корректно продолжить слож-
ный текст, модель должна была учиты-
вать контекст, стиль, ход рассуждений
и даже тип решаемой задачи.
В результате модели начали прояв-
лять поведение, внешне напоминающее
понимание. Они научились пересказы-
вать, объяснять, переводить, писать код
и отвечать на вопросы. При этом внутри
не происходило переключения между
разными режимами мышления, выпол-
нялась лишь одна операция — вероят-
ностное продолжение текста.
Ключевым оказалось то, что язык
стал универсальным носителем задач.
В текстовой форме можно описать поч-
ти все: бытовую ситуацию, математиче-
скую формулу, инструкцию, алгоритм.
В отличие от изображений или сигна-
лов управления, язык изначально об-
ладает высокой степенью абстракции.
Это позволило одной и той же моде-
ли работать с самыми разными зада-
чами, не меняя своей внутренней ар-
хитектуры.
В этом главное отличие языковых
моделей от других типов ИИ. Системы
распознавания учатся находить при-
знаки в данных. Системы управления
учатся выбирать действия в конкрет-
ной среде. Языковые модели работают
с обобщенным человеческим опытом,
запечатленным в текстах. Они не зна-
ют мир напрямую, но знают, как люди
его описывают, рассуждают о нем и ре-
шают проблемы.
Отсюда возникает эффект, удивляю-
щий многих: модель часто справляет-
ся с новой задачей без дополнитель-
ного обучения, достаточно просто
описать ее словами. Это явление назы-
вают обучением в контексте (in-context
learning): система выполняет новую за-
дачу за счет подсказки и примеров в те-
кущем тексте, не меняя своих параме-
тров.
Но важно не переоценивать такие си-
стемы. Языковая модель не проверяет
свои ответы на соответствие реально-
сти и не строит внутренней картины
мира. Она существует в пространстве
текста и вероятностей. Однако этого
оказалось достаточно, чтобы создать
инструмент, который выглядитунивер-
сальным и легко адаптируется к новым
запросам.
БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ
НА ПРАКТИКЕ: ОТ ИДЕИ К РАБОЧИМ
СИСТЕМАМ
Путь от теоретической концепции язы-
ковой модели к системам, которыми мы
пользуемся сегодня, оказался удиви-
тельно быстрым. Ключевые этапы уло-
жились примерно в одно десятиле-
тие — с конца 2010-х до начала 2020-х
годов. В этот период стало очевидно:
масштабирование языковых моделей
ведет не к постепенным улучшениям,
Перед обучением
текст разбива-
ется на токе-
ны — небольшие
фрагменты слов.
Для этого часто
используют ал-
горитм В РЕ (byte
pair encoding —
кодирование пар
байтов), который
объединяет часто
встречающиеся
сочетания букв
в устойчивые ча-
сти. В результате
модель опери-
рует не словами
целиком, а по-
вторяющимися
фрагментами, что
объясняет, поче-
му редкие имена
и малоизвестные
термины даются
ей сложнее
Чтобы языковая
модель стала
удобной для
общения, ее
дополнительно
обучают на при-
мерах диалогов
людей. Этот этап
называют fine-
tuning —«дона-
стройка». Модель
учат следовать
инструкциям,
отвечать по делу
и соблюдать
формат. Без этого
этапа система
может грамот-
но продолжать
текст, но плохо
понимать, чего
от нее хотят
в разговоре
а к качественным скачкам, открывая ра-
нее недоступные возможности.
Важной отправной точкой стал
2017 год, когда группа исследовате-
лей Google представила архитектуру
трансформера, которая была рассмо-
трена ранее.
Следующий шаг был связан уже
не столько с архитектурой, сколько
с масштабированием. В 2018-2019 го-
дах исследователи начали система-
тически увеличивать размер моделей
и объемы обучающих данных. Оказа-
лось, что с ростом числа параметров
модели начинают проявлять свойства,
которые никто специально не програм-
мировал: они лучше следуют инструк-
циям, точнее отвечают на вопросы, уве-
реннее удерживают контекст в длинных
текстах. Эти эффекты были не до кон-
ца объяснены, но оказались настолько
стабильными, что на них стали делать
серьезные ставки.
В начале 2020-х языковые модели
вышли за пределы академических ла-
бораторий. Переломным для массовой
аудитории стал запуск ChatGPT30 ноя-
бря 2022 года. Он наглядно показал, что
большая языковая модель может быть
не просто экспериментом, а удобным
и доступным инструментом. Ключевую
роль сыграл диалоговый формат: поль-
зователям не требовалось разбираться
в технических деталях — достаточно
было просто задавать вопросы на до-
ступном им языке.
Параллельно развивались и другие
направления. Появлялись языковые
модели, ориентированные не столько
на универсальный диалог с пользовате-
лем, сколько на прикладные задачи —
работу с кодом, анализ документов, ис-
пользование в инженерных и научных
проектах. Для обычного пользователя
такие системы могут выглядеть очень
похожими на популярные чат-модели,
однако различия проявляются на уров-
не того, как и для чего они использу-
ются. Например, модели семейства
DeepSeek развивались с упором на эф-
фективность вычислений и возмож-
ность встраивания в другие системы.
В таком подходе языковая модель рас-
сматривается не как самостоятельный
продукт, а как базовый компонент, во-
круг которого строятся более слож-
ные решения.
Со временем стало понятно, что раз-
личия между большими языковыми мо-
делями определяются не только их раз-
мером. Важную роль играют качество
данных для обучения, методы допол-
нительной настройки и цели,которые
ставили перед собой разработчики.
Одни команды делали ставку на закры-
тые сервисы с единым интерфейсом,
другие — на модели, которые можно
свободно встраивать в свои продук-
ты и дорабатывать под конкретные за-
дачи.
К середине 2020-х годов большие
языковые модели начали выполнять
новую, инфраструктурную роль. Они
стали универсальным промежуточным
слоем между человеком и сложными
цифровыми системами. Посредством
В прикладных
системах часто
используют при-
ем RAG (retrieval-
augmented
generation — «ге-
нерация с поис-
ковым дополне-
нием»). Сначала
система находит
нужные фрагмен-
ты в базе доку-
ментов, а затем
формирует ответ,
опираясь на них.
Это снижает риск
выдумок и по-
зволяет работать
с обног ляемой
информацией,
но окончатель-
ный текст все
равно создает
языковая модель
Качество язы-
ковых моделей
оценивают
с помощью
наборов те-
стов, а не одной
метрики. Отдель-
но проверяют
работу с логикой,
математикой,
кодом,инструк-
циями и длинны-
ми текстами. Это
связано с тем,
что улучшение
в одном навыке
может ухудшить
другой: модель
становится
разговорчивее,
но чаще ошибает-
ся в фактах, или
наоборот
речи стало возможно управлять по-
иском, анализировать данные, писать
и проверять код, готовить документы
и даже координировать работу других
алгоритмов. Языковая модель превра-
тилась в посредника между человече-
ским запросом и машинным исполне-
нием. При этом принцип их работы
остается прежним. Все эти системы
до сих пор основаны на статистиче-
ском предсказании текста.
Таким образом, языковые модели, де-
сятилетиями остававшиеся вспомога-
тельной технологией, за несколько лет
стали основой целого класса совре-
менных инструментов. Но этот успех
все еще не означает появления уни-
версального разума.
ИЛЛЮЗИЯ УНИВЕРСАЛЬНОСТИ: ГДЕ
ПРОХОДЯТ РЕАЛЬНЫЕ ГРАНИЦЫ
ЯЗЫКОВЫХ МОДЕЛЕЙ
Первые сомнения в универсальности
больших языковых моделей возникли
почти сразу после их широкого распро-
странения. Уже в 2022-2023 годах, ког-
да диалоговые системы стали массово
использоваться за пределами лабора-
торий, исследователи и пользователи
столкнулись с парадоксом: модели де-
монстрировали впечатляющую широту
возможностей, но при этом регулярно
и уверенно совершали ошибки.
Одним из первых на эту проблему пу-
блично указал Гэри Маркус, когнитив-
ный ученый и давний критик попыток
свести интеллект к чистой статистике.
Он отмечал, что языковые модели
успешно воспроизводят шаблоны рас-
суждений, но лишены способности
к моделированию мира: внутреннего
понимания причин, объектов и физи-
ческих ограничений реальности. Эти
замечания быстро нашли подтвержде-
ние на практике.
Данная проблема получила характер-
ное название «галлюцинации». Модель
могла уверенно ссылаться на несуще-
ствующие источники, искажать истори-
ческие факты или создавать правдопо-
добные, но ложные объяснения. Важно,
что это не следствие плохого обуче-
ния или ошибки в коде. Такое поведе-
ние вытекает из самой сути языковых
моделей: они оптимизированы для со-
гласованности текста, а не для провер-
ки истинности утверждений.
К 2023 году эта особенность ста-
ла предметом систематического изу-
чения. Исследования и практический
опыт показали, что даже с ростом мо-
делей и улучшением данных «галлю-
цинации» остаются заметной пробле-
мой. Модель может проявлять высокую
уверенность именно в тех случаях, ког-
да у нее нет достоверной информации.
Вместо признания незнания она про-
должает текст так, как это выглядит
статистически правдоподобно.
На этом фоне стало понятно: уни-
версальность больших языковых мо-
делей имеет вполне конкретные грани-
цы. Они эффективны там, где мир уже
представлен в текстовой форме: объ-
яснения, инструкции, дискуссии, код,
НЕ ВСЕ ЛОГИЧ-
НО, ЧТО ЗВУЧИТ
ЛОГИЧНО
Языковые моде-
ли — это системы
генерации текста,
а не проверки
истины. Их за-
дача — строить
связные и прав-
доподобные
ответы. Человеку
такой текст часто
кажется свиде-
тельством ре-
ального знания,
потому что мозг
склонен доверять
логично звуча-
щим объяснени-
ям. В результате
уверенный стиль
может маскиро-
вать отсутствие
надежной факти-
ческой опоры
Критическая сла-
бость языковых
моделей — ра-
бота с проверя-
емыми фактами:
точными датами,
редкими имена-
ми, конкретными
источниками. Мо-
дель не наблюда-
ет мир напрямую
и не имеет встро-
енного меха-
низма проверки
реальности. Поэ-
тому на практике
ее используют
как инструмент
рассуждения
и навигации
по теме, а не как
окончательный
источник истины
документация. Однако в задачах, тре-
бующих точных вычислений, строгой
верификации или работы с реальны-
ми данными, языковая модель склон-
на подменять точность правдоподоби-
ем. Это не дефект, а прямое следствие
способа ее обучения.
Важно подчеркнуть: разговор об огра-
ничениях не означает разочарования
в технологии. Напротив, он стал при-
знаком ее зрелости. Иллюзия универ-
сальности возникла именно потому,
что языковые модели оказались не-
ожиданно широкими в своих возмож-
ностях. Но лишь понимание их границ
позволило интегрировать их в реальные
процессы без завышенных ожиданий.
СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ
И РАЗВИЛКИ В РАЗВИТИИ ИИ
Все модели неверны, но некоторые из них полезны.
Джордж Бокс
Сегодня развитие искусственного интеллекта идет сра-
зу по нескольким, порой взаимоисключающим, путям. Одни
игроки ставят на гигантские универсальные модели, дру-
гие — на компактность и энергоэффективность. Где-то ал-
горитмы делают общедоступными, где-то засекречивают.
Выбор на этих развилках определяет не только технический
ландшафт завтрашнего дня, но и то, в чьих руках окажется
экономическая власть.
ОТ ОТДЕЛЬНЫХ МОДЕЛЕЙ —
К СИСТЕМАМ
Первые впечатляющие успехи боль-
ших языковых моделей породили фан-
тазии, будто достаточно умная модель
сможет сама справляться с самыми
разными задачами. Однако на прак-
тике оказалось, что даже самые мощ-
ные модели не приспособлены для ре-
шения проблем, выходящих за рамки
единичного запроса и ответа. Реаль-
ные рабочие процессы — будьте ана-
лиз данных, составление отчета или
разработка — почти всегда многоша-
говые. Они требуют сохранения про-
межуточных результатов, обращения
к внешним источникам и постоянно-
го учета контекста.
Этот разрыв между возможностями
модели и потребностями пользовате-
лей стал особенно очевиден в начале
В крупных
ИИ-продуктах
важен не только
сам алгоритм,
но и возмож-
ность понять, как
и почему система
пришла к кон-
кретному ответу.
Для этого сохра-
няются журналы
запросов, версии
моделей, исполь-
зуемые инструк-
ции и результаты
работы инстру-
ментов
Когда ИИ ста-
новится частью
рабочего процес-
са, появляется
отдельная зада-
ча — постоянная
проверка каче-
ства. Для этого
собирают набор
типовых запро-
сов и прогоняют
их после каждо-
го обновления
системы. Такой
подход называют
регрессионным
тестированием,
он нужен, чтобы
новые улучше-
ния не ломали
уже работающие
функции и пове-
дение системы
оставалось пред-
сказуемым
2020-х, когда LLM начали внедрять в ре-
альные продукты. Разработчики стол-
кнулись с парадоксом: модель могла
блестяще ответить на конкретный во-
прос, но теряла логику задачи, растяну-
той во времени. Например, при анализе
комплекса документов или написании
кода важно помнить, что уже было сде-
лано, какие решения приняты и какая
цель стоит впереди. Одиночная языко-
вая модель, лишенная долговременной
памяти и навыков планирования, каж-
дый раз все начинает с нуля.
Ответом стал качественный сдвиг
в архитектуре. Вместо одной модели-
универсала стали создавать системы,
где языковая модель является ядром,
но не единственным компонентом. Ее
начали окружать специализированны-
ми модулями, каждый из которых отве-
чает за свою задачу.
Таким образом, фокус сместился с во-
проса «Насколько умна наша модель?»
к вопросу «Какую надежную систему
мы можем построить вокруг нее?». На-
дежность здесь обеспечивается четким
разделением ответственности: языко-
вой модели доверяют работу с есте-
ственным языком и диалогом, а все кри-
тически важные действия — работа
с данными, вычисления, принятие ре-
шений — остаются за специализиро-
ванными контролируемыми компонен-
тами.
Этот архитектурный принцип опре-
делил новое направление развития.
Инженеры и исследователи переклю-
чились с бесконечного наращивания
параметров моделей на проектиро-
вание устойчивых систем, способных
выполнять сложные, многоэтапные
сценарии. Из этой парадигмы вырос
и современный интерес к агентным под-
ходам — созданию систем, где ИИ-ком-
поненты могут самостоятельно плани-
ровать последовательность действий,
координировать работу инструментов
и добиваться поставленных целей.
ЧТО СКРЫТО ЗА ИНТЕРФЕЙСОМ ЧАТА
Когда пользователь открывает чат
и начинает диалог, может показать-
ся, что перед ним единая программа,
способная на все: отвечать на вопро-
сы, создавать тексты, генерировать
изображения или работать с кодом.
На деле современный чат-бот — это
сложная архитектура из взаимосвязан-
ных компонентов, где языковая модель
играет центральную, но не исчерпыва-
ющую роль.
Над языковой моделью работает слой
управления диалогом. Он хранит исто-
рию общения, решает, какой контекст
передавать модели, ограничивает дли-
ну ответов и следит за соблюдением
правил. Здесь формируется ощущение
связного разговора: система отбирает
релевантные фрагменты предыдущих
реплик и использует их для построе-
ния ответа.
Важную функцию выполняют также
подключенные инструменты. Если поль-
зователь просит выполнить расчет, со-
здать картинку или проанализировать
У любого чата
есть предел того,
сколько текста он
способен учиты-
вать одновремен-
но. Этот предел
называют кон-
текстным окном.
Если диалог ста-
новится слишком
длинным,ранние
сообщения либо
кратко переска-
зываются, либо
вовсе перестают
учитываться. По-
этому ощущение
«памяти» всег-
да ограничено
текущим объемом
контекста
Помимо сообще-
ний пользова-
теля и ответов
системы внутри
чата существу-
ют служебные
инструкции. Они
задают стиль,
рамки допусти-
мого и правила
поведения моде-
ли. Пользователь
их не видит. Их
наличие часто
объясняет, поче-
му одинаковые
вопросы в разных
сервисах при-
водят к разным
ответам
данные, языковая модель не делает это-
го сама. Она формирует запрос и пере-
дает его специализированному модулю.
Например, генерацией изображений за-
нимается отдельная модель, обученная
на визуальных данных. Языковая мо-
дель лишь составляет текстовое опи-
сание и затем встраивает полученный
результат в свой ответ.
Аналогично устроена работа с кодом.
Модель может предложить алгоритм
или объяснить ошибку, но выполнение
и проверка происходят в изолирован-
ной среде. Результаты возвращают-
ся системе, после чего модель интер-
претирует их и формулирует итоговый
ответ для пользователя. Это разделе-
ние позволяет отделить рассуждения
о коде от его реального выполнения.
Для задач, требующих точных или
актуальных данных, система обраща-
ется к внешним источникам — поис-
ковым системам, базам документов,
внутренним хранилищам. Языковая мо-
дель не имеет к ним прямого доступа.
Она формирует запросы, а полученную
информацию использует как матери-
ал для ответа, не оценивая достовер-
ность источников.
Таким образом, современный чат-
ИИ представляет собой координирую-
щую платформу, где языковая модель
служит связующим звеном между раз-
личными компонентами. Она отвечает
за понимание запроса и формирование
ответа, а все действия, требующие точ-
ности, проверки или взаимодействия
с внешними системами, делегируются
специализированным модулям. Такое
разделение ролей делает архитекту-
ру гибкой и позволяет добавлять но-
вые функции без полного пересмотра
системы.
Этот подход объясняет, почему
чат-боты со временем обретают но-
вые возможности, оставаясь внешне
неизменными. Развивается не столько
ядро модели, сколько ее инструмен-
тальное окружение. Эта стратегия —
наращивание возможностей через ин-
теграцию, а не только через рост самой
модели — стала основным направлени-
ем эволюции сложных ИИ-систем в по-
следние годы.
АГЕНТСКИЕ СИСТЕМЫ:
ПОПЫТКА ПРЕВРАТИТЬ МОДЕЛЬ
В ИСПОЛНИТЕЛЯ
Современные чат-интерфейсы во мно-
гом уже напоминают простейшие агент-
ские системы. Они способны не только
отвечать на вопросы, но и обращаться
к внешним инструментам — искать дан-
ные, производить вычисления, работать
с файлами или создавать изображения.
Однако г; таких сценариях инициатива
почти всегда остается у пользователя.
Чатлишь реагирует на конкретный за-
прос и выполняет ровно то, о чем его
попросили, не пытаясь самостоятель-
но развивать или продвигать задачу.
Агентский подход меняет эту логи-
ку. Агенту указывают не на отдельное
действие, а на конечную цель. После
этого система сама определяет, какие
Важную роль
играет и инфра-
структура эко-
номии ресурсов.
Если множество
пользователей
задают похожие
вопросы, система
может повторно
использовать
результаты
вычислений или
готовые фрагмен-
ты ответов. Это
снижает нагруз-
ку и ускоряет
отклик, но иногда
приводит к за-
метной разнице
во времени
ответа между
запросами
При работе
агентов клю-
чевым принци-
пом считается
минимальный
набор полномо-
чий. Агенту дают
доступ только
к тем действи-
ям, без которых
задача не реша-
ется. Например,
разрешают чи-
тать документы,
но запрещают
удалять файлы
или отправлять
сообщения. Это
снижает риск се-
рьезных ошибок
даже при сбоях
в логике
шаги необходимы, в какой последова-
тельности их выполнять и когда зада-
чу можно считать завершенной. Вместо
единичного запроса выстраивается це-
почка взаимосвязанных действий, под-
чиненных общей цели. Если чат — это
продвинутый собеседник с доступом
к инструментам, то агент — это попыт-
ка создать исполнителя, который дей-
ствует в заданных рамках и под контро-
лем, но без необходимости постоянных
указаний со стороны человека.
Стоит отметить, что за этим эффектом
не стоит появление самостоятельного
разума. Почти всегда речь идет о более
сложной системе, построенной вокруг
языковой модели. Сама модель по-преж-
нему работает только с текстом: она чи-
тает инструкции, формулирует планы
и объясняет свои действия. Все осталь-
ное — поиск данных, вычисления, работа
с файлами или внешними сервисами —
выполняется отдельными, подключенны-
ми к системе инструментами.
Упрощенно агентскую систему можно
представить как связку из трех ключе-
вых компонентов:
1. Языковая модель, которая решает,
что делать дальше, на основе кон-
текста и поставленной цели.
2. Набор инструментов, которые вы-
полняют конкретные действия: ищут
информацию, производят расчеты.
3. Управляющий слой, который контро-
лирует процесс: ограничивает чис-
ло шагов, проверяет промежуточные
результаты и решает, когда остано-
вить выполнение.
Таким образом, агент — это не уни-
версальный интеллект, а система при-
нятия решений, встроенная в заранее
определенный рабочий контур.
На практике быстро выяснилось, что
построить устойчивого агента — труд-
ная задача. Система может зациклить-
ся, начать повторять одни и те же
действия или тратить ресурсы на бес-
полезные попытки. Особенно ярко это
проявляется в работе со сложными сре-
дами, например неб-интерфейсами или
корпоративными системами, неболь-
шие ошибки на каждом шаге накапли-
ваются, и в итоге агент терпит неудачу
не из-за одного сбоя, а из-за цепочки
мелких промахов.
Поэтому в реальных продуктах аген-
там почти никогда не предоставля-
ют полную свободу. Их работу жест-
ко ограничивают: заранее определяют
набор доступных инструментов, макси-
мальное число шагов и четкие критерии
успешного завершения. Если система
выходит за установленные рамки, про-
цесс просто прерывается. Это не не-
достаток, а необходимая инженерная
мера: без подобных ограничений агент
становится непредсказуемым, ресур-
созатратным и несущим потенциаль-
ные риски.
Отдельная проблема связана с безо-
пасностью. Как только агент получает
возможность выполнять действия, воз-
никает риск, что его можно направить
по ложному пути через данные, с ко-
торыми он работает. Например, скры-
тая инструкция может быть размещена
Для агентных
систем важно,
чтобы действия
можно было
безопасно повто-
рять. Если из-за
сбоя одна и та же
команда выпол-
нится дважды,
последствия
не должны быть
разрушитель-
ными. Поэтому
практикуют
подходы вро-
де создания
черновиков
и обязательного
подтверждения,
а не немедлен-
ного выполнения
необратимых
операций
Надежные агенты
почти всегда ра-
ботают по циклу:
предложение
шага, выполне-
ние и проверка
результата. Про-
верка может быть
автоматической
или основанной
на правилах.
Такой цикл
важнее сложных
рассуждений —
он позволяет
ловить ошибки
на раннем этапе
и не давать им
накапливаться
в документе, на веб-странице или в по-
лученном письме. Для модели это вы-
глядит как обычный текст, который она
может воспринять как команду. Поэ-
тому современные агентские системы
проектируют с допущением, что они мо-
гут ошибаться: опасные операции тре-
буют дополнительного подтверждения,
а доступ к критически важным инстру-
ментам строго регламентирован.
Со временем фокус разработчиков
сместился от эффектных демонстра-
ций к решению прикладных задач. Ста-
ло очевидно, что без общих стандартов
и унифицированных подходов такие
системы трудно поддерживать и мас-
штабировать. Поэтому в последние
годы все больше усилий уходит на со-
здание единых способов подключе-
ния инструментов, описания поведе-
ния агентов и контроля их работы.Это
признак того, что направление пере-
росло стадию эксперимента и посте-
пенно оформляется в полноценную ин-
женерную дисциплину.
Если посмотреть, где агентский под-
ход уже приносит практическую поль-
зу, картина становится ясной. Он наи-
более эффективен там, где:
• среда ограничена и хорошо фор-
мализована (например, внутренняя
CRM-система или база документов);
• набор возможных действий невелик
и четко определен;
• окончательный контроль и ответ-
ственность остаются за человеком
или за строгими правилами валида-
ции.
В таких условиях агенты помогают
анализировать документы, проводить
рутинный поиск информации, ассисти-
ровать в разработке и автоматизиро-
вать повторяющиеся операции с дан-
ными. Они не заменяют специалиста,
но берут на себя часть его рутинной
нагрузки.
БОЛЬШИЕ ИЛИ ЭФФЕКТИВНЫЕ:
СПОР О МАСШТАБЕ
После впечатляющих успехов гигант-
ских языковых моделей в начале 2020-х
в индустрии почти сразу возник зако-
номерный вопрос: действительно ли
прогресс возможен лишь через беско-
нечное увеличение масштаба или этот
путь не единственный? Долгое время
ответ казался очевидным: больше па-
раметров, больше данных — больше
вычислений. Однако к середине деся-
тилетия в этом консенсусе начали по-
являться трещины.
Причина была прозаична и связана
с экономикой. Обучение и эксплуата-
ция с^ерхкрупных моделей требуют ко-
лоссальных вычислительных ресурсов,
сложной инфраструктуры и постоян-
ных затрат. Это делает их доступными
лишь для узкого круга пользователей
и превращает в дорогие универсаль-
ные платформы. На этом фоне все
заметнее стал проявляться альтер-
нативный подход: не гнаться за мак-
симальными размерами, а стремиться
к высокой эффективности при умерен-
ных затратах.
Эффективность
модели — это
не только ее раз-
мер. Существуют
приемы, позво-
ляющие снизить
стоимость работы
без радикального
ухудшения каче-
ства. Например,
квантизация
(quantization)
уменьшает
точность чисел
в вычислениях,
что сокращает
потребление па-
мяти и ускоряет
работу модели
Другой подход —
ДИСТИЛЛЯЦИЯ
(distillation).
Большую модель
используют как
«учителя», обу-
чая меньшую вос-
производить ее
ответы. В резуль-
тате получается
более компактная
система, которую
проще и дешевле
использовать
в массовых сер-
висах
Одним из самых показательных при-
меров этого сдвига стала линейка мо-
делей DeepSeek, активно развивавша-
яся в 2024-2025 годах. Эти модели
не претендовали на абсолютное ли-
дерство по всем мыслимым тестам,
но наглядно продемонстрировали
важный принцип: благодаря тщатель-
но продуманной архитектуре, каче-
ственному отбору данных и сосре-
доточении на практических задачах
можно достичь результатов, сопоста-
вимых с флагманскими решениями,
при значительно меньших издержках.
Для рынка это стало сигналом: доро-
же не всегда означает умнее.
Эффект DeepSeek имел не столько тех-
нический, сколько стратегический ха-
рактер. Эта разработка показала, что
модели, оптимизированные по затра-
там, могут быть конкурентоспособны-
ми, особенно в прикладных сценариях,
где критически важны скорость откли-
ка, стоимость эксплуатации и возмож-
ность адаптации под конкретные нуж-
ды. Для компаний и разработчиков
это расширило пространство выбора:
теперь вместо одной универсальной
модели можно рассматривать целый
спектр решений, каждое из которых оп-
тимально для своих задач.
При этом речь не идет о победе одно-
го подхода над другим. Крупные моде-
ли сохраняют преимущество в универ-
сальности и способности справляться
с редкими и нестандартными запро-
сами. Эффективные модели выигры-
вают в устойчивости, экономичности
и легкости внедрения. На практике все
чаще применяется комбинированная
стратегия: мощная модель использу-
ется как интеллектуальное ядро для
сложных задач, а более легкие и оп-
тимизированные модели обслужива-
ют повседневные операции.
Сегодня становится очевидно, что
простой рост масштаба — не гаран-
тия качественного прорыва. Улучше-
ния обходятся все дороже, а отдача —
все менее предсказуема. Поэтому спор
«больше или эффективнее» транс-
формировался из чисто техническо-
го в стратегический. Он ставит вопрос
не о том, какая модель лучше в абсо-
люте, а о том, какие задачи мы решаем,
какие ресурсы готовы вложить и какой
баланс между мощностью и экономич-
ностью является оптимальным для ка-
ждой конкретной цели.
ОТКРЫТЫЕ И ЗАКРЫТЫЕ МОДЕЛИ:
НЕ ИДЕОЛОГИЯ, А СТРАТЕГИЯ
С ростом возможностей языкоьых мо-
делей вопрос их открытости выступает
не спором о принципах, а прагматиче-
ским выбором стратегии. Уже в начале
2020-х годов оформились два различ-
ных подхода, каждый со своими силь-
ными сторонами и ограничениями.
Закрытые модели развивались в пер-
вую очередь как сервисы. К ним от-
носятся GPT-4 и его наследники
от OpenAI, Claude от Anthropic и Gemini
от Google. Их общая черта — пользова-
тель получает доступ к возможностям
Есть и архитек-
турные реше-
ния, такие как
«смесь экспер-
тов» (mixture of
experts). Внутри
подобной модели
существует не-
сколько специ-
ализированных
подсистем,
но для каждого
запроса акти-
вируется лишь
часть из них.
Это позволяет
расширять воз-
можности модели
без пропорцио-
нального роста
вычислительных
затрат
ЧТО ЗНАЧИТ
«ОТКРЫТАЯ
МОДЕЛЬ»
НА САМОМ ДЕЛЕ
Когда говорят,
что модель от-
крытая, чаще все-
го имеют в виду,
что разработчики
выложили ее
веса. Веса — это
огромный набор
чисел, которые
определяют, как
модель реагирует
на текст: какие
слова считать
связанными,
какие ответы ве-
роятнее. Проще
говоря, это па-
мять и привычки
модели. При этом
сами данные,
на которых ее
обучали, и про-
цесс обучения
могут оставаться
закрытыми. По-
этому открытая
модель не всегда
означает полную
прозрачность
модели через API или веб-интерфейс,
но не имеет доступа к ее внутренне-
му устройству или деталям обучения.
Такой подход позволяет разработчи-
кам централизованно управлять каче-
ством ответов, выпускать обновления
и обеспечивать безопасность. Он также
дает возможность поддерживать слож-
ную инфраструктуру, необходимую для
работы гигантских моделей. Цена это-
го удобства для пользователя — зави-
симость от поставщика услуг и огра-
ниченные возможности для глубокой
адаптации под специфические нужды.
Параллельно, особенно с 2023-
2024 годов, набрало силу движение
в сторону открытых моделей. В этом
случае публикуются архитектура и вес
модели — по сути, ее память, выражен-
ная в миллиардах чисел, которые за-
дают, как модель реагирует на разные
входные данные. Это позволяет запу-
скать ее локально, изучать и дообучать
под свои задачи. Среди заметных при-
меров — французская линейка Mistral,
модели Falcon, а также открытые вер-
сии DeepSeek. Эти проекты показали,
что даже без эксклюзивного доступа
к гигантским ресурсам можно созда-
вать конкурентоспособные решения,
особенно если модель ориентирована
на эффективность и конкретные при-
кладные сценарии.
Разница между подходами отчетли-
во видна на практике. Закрытые моде-
ли чаще используют как универсальные
инструменты — для диалогов, создания
текстов, помощи в программировании.
Они удобны там, где критически важ-
ны стабильность и профессиональная
поддержка. Открытые модели выбира-
ют там, где требуется полный контроль
над данными, возможность локально-
го развертывания или строгое соответ-
ствие внутренним требованиям безо-
пасности. Например, компании могут
запускать такие модели в своей защи-
щенной инфраструктуре, не переда-
вая конфиденциальные данные -знеш-
ним сервисам.
Необходимо сказать, что открытость
не означает автоматически «лучше»,
а закрытость — «хуже». У открытых мо-
делей выше риски неконтролируемого
использования, сложнее централизо-
ванно выпускать исправления и обнов-
ления. У закрытых — выше операцион-
ные затраты и меньше прозрачности.
Поэтому к середине 2020-х нее боль-
ше организаций пришли к гибридной
стратегии: закрытые модели — для
внешних задач и массовых сервисов,
открытые — для внутренних систем,
пилотных проектов и сценариев,тре-
бующих глубокой кастомизации.
Таким образом, спор «открывать или
закрывать» давно перестал быть фило-
софским. Он стал инженерным и эконо-
мическим. Выбор сегодня определяется
не убеждениями, а конкретным кон-
текстом: доступными ресурсами, тре-
бованиями к безопасности, норматив-
ными ограничениями и теми задачами,
которые необходимо решить. Поэтому
оба направления продолжают актив-
но развиваться и, судя по всему, будут
Термин open
source («ПО
с открытым ис-
ходным кодом»)
часто исполь-
зуют неточно.
В классическом
смысле он озна-
чает, что любой
человек может
посмотреть код
программы,
изменить его
и использовать
дальше. В ИИ это
бывает редко:
чаще открывают
только часть
системы.Чтобы
понять реальные
ограничения,
полезно смотреть
описание моде-
ли — там обычно
пишут, что имен-
но можно делать,
а что запрещено
лицензией
сосуществовать еще долгое время, до-
полняя друг друга в общей экосистеме
искусственного интеллекта.
Современный ИИ
зависит не толь-
ко от идей,
но и от физи-
ческой инфра-
структуры.
Для обучения
моделей нужны
тысячи мощных
процессоров,
специальные
центры обра-
ботки данных
и стабильное
электроснаб-
жение. Поэтому
развитие ИИ
сегодня во мно-
гом определяется
теми, у кого есть
доступ к вычис-
лительным ресур-
сам, а не только
к талантливым
исследователям
ИИ КАК ИНДУСТРИЯ:
ИНФРАСТРУКТУРА РЕШАЕТ ВСЕ
К середине 2020-х годов прогресс
в области искусственного интеллекта
стал напрямую определяться состоя-
нием промышленной инфраструктуры.
Обучение и эксплуатация современ-
ных моделей требуют специализиро-
ванных вычислительных ускорителей,
а рынок таких чипов оказался крайне
концентрированным. Доминирующую
роль на нем играют графические уско-
рители NVIDIA, которые де-факто пре-
вратились в отраслевой стандарт для
тренировки больших моделей. Альтер-
нативные решения существуют, однако
пока применяются заметно реже и за-
частую требуют значительной адапта-
ции программного стека.
Это привело к ситуации, когда до-
ступ к вычислительным мощностям сам
по себе стал стратегическим ресур-
сом. Крупные корпорации и ведущие
исследовательские центры заключают
долгосрочные контракты на постав-
ки ускорителей, строят специализи-
рованные дата-центры и инвестируют
в заблаговременное резервирование
энергомощностей. Развитие ИИ все
больше начинает напоминать реали-
зацию крупного индустриального про-
екта, а не чисто исследовательскую
деятельность.
Энергопотребление выдвинулось
на роль еще одного ограничивающе-
го фактора. Современные центры об-
работки данных потребляют десятки
и сотни мегаватт, а вопросы эффек-
тивного охлаждения и гарантирован-
ного электроснабжения напрямую
определяют возможности для масшта-
бирования. Именно поэтому новые да-
та-центры все чаще размещают в не-
посредственной близости от крупных
электростанций или в регионах с из-
бытком дешевой и стабильной энер-
гии. Это уже влияет на географию раз-
вития ИИ, создавая неравные условия
для разных стран и регионов.
В результате фокус внимания раз-
работчиков закономерно сместился.
Вместо дискуссий о бесконечном росте
параметров моделей все чаще подни-
маются вопросы о сокращении вычис-
лительных затрат: оптимизации архи-
тектур, уменьшении размеров моделей
без потери качества и переносе части
вычислений на периферию, ближе к ко-
нечному пользователю. Этот прагматич-
ный интерес порожден не абстрактной
идеей эффективности, а совершенно
конкретными ограничениями: дефи-
цитом чипов, растущей стоимостью
электроэнергии и длительными сро-
ками строительства необходимой ин-
фраструктуры.
Даже охлажде-
ние стало важ-
ным фактором.
Большие серверы
сильно нагрева-
ются, и на их ох-
лаждение уходит
почти столько же
энергии, сколько
на сами вычис-
ления. По этой
причине ИИ-цен-
тры часто строят
рядом с источ-
никами дешевой
электроэнергии
или в холодных
регионах — гео-
графия снова
начинает влиять
на технологиче-
ский прогресс
Андрей Андреевич Марков (1856-1922). Фото ок. 1880 г.
Российский математик, создатель теории цепей Маркова — стоха-
стических процессов, описывающих последовательности случай-
ных событий, где каждый следующий шаг определяется текущим
состоянием. Эти идеи лежат ь основе моделей прогнозирования
и обучения в ИИ
Бертран Рассел (1872-1970). Фото 1907 г.
Британский философ и логик, один из создателей математиче-
ской логики XX века. Его работы о формализации мышления и ло-
гическом анализе языка стали теоретической основой для ал-
горитмов рассуждения и ранних исследований искусственного
интеллекта
ИИ: ПОМОЩНИК, А НЕ КОНКУРЕНТ
Истинная опасность не в том, что машины
начнут думать как люди, а в том, что люди
начнут думать как машины.
Норберт Винер
ИИ уже способен на многое из того, что недавно было ис-
ключительной прерогативой человека: анализировать, тво-
рить, решать рутинные задачи. Однако его природа остает-
ся природой сложного инструмента с жестко очерченными
границами. Главный вопрос сегодня не в противостоянии
человека и машины, а в том, как научить человека исполь-
зовать ИИ для усиления собственного интеллекта, а не для
делегирования ИИ критических решений.
У ИИ-ассистента
есть ограничение,
которое называ-
ют контекстным
окном. Это мак-
симальный объем
текста, который
он может «удер-
живать в голове»
за один раз: ваш
вопрос, преды-
дущие реплики,
документы.Если
информации
больше, часть ее
просто выпадает.
Поэтому четкие
и структуриро-
ванные запросы
работают лучше
длинных и запу-
танных
ЧТО ТАКОЕ СОВРЕМЕННЫЙ
ИИ-АССИСТЕНТ НА ПРАКТИКЕ
Главное, что нужно понимать о со-
временных ИИ-ассистентах вро-
де ChatGPT, — это принцип их рабо-
ты. Система не действует сама по себе
и не ведет пользователя. Она всегда
реагирует на запрос и работает стро-
го в рамках, которые этот запрос зада-
ет. Если цель, формат или ограничения
не указаны явно, система не станет ос-
мысленно их «додумывать» — она за-
полнит пробелы статистически веро-
ятными предположениями.
Отсюда вытекает ключевая особен-
ность: один и тот же ассистент может
быть как полезным инструментом, так
и источником путаницы — все зави-
сит от формулировки. Общие вопро-
сы порождают общие ответы. Нечет-
кие запросы ведут к усредненным
результатам. Это не ошибка системы,
а естественное поведение инструмен-
та, который пытается угадать намере-
ние пользователя по минимальному
сигналу.
Вторая важная черта — работа с кон-
текстом. Ассистент учитывает только
текст в пределах текущего чата. Если
диалог длится часами или днями, си-
стема будет опираться на предыду-
щие сообщения, пока они остаются
в ее окне контекста. Однако это окно
не бесконечно: по мере роста диало-
га ранние реплики постепенно пере-
стают учитываться. Поэтому важные
условия, цели и договоренности сто-
ит периодически повторять или крат-
ко резюмировать.
При этом контекст чата — не память
в человеческом смысле. Ассистент
не формирует устойчивого представ-
ления о пользователе, его предпочте-
ниях или прошлых решениях за пре-
делами конкретной беседы. Новый
чат начинается с чистого листа. Даже
внутри одного диалога информация
сохраняется, пока она явно присут-
ствует в доступной для модели части
переписки.
Третий практический аспект — от-
ношение к фактам. Ассистент по умол-
чанию не проверяет истинность
утверждений и не отличает факты
от правдоподобных формулировок так,
как это делает человек. Он стремится
выдать связный и убедительный текст,
даже если данных недостаточно или
вопрос допускает неоднозначность.
Во многих систе-
мах ассистент
не «знает все»,
а сначала ищет
информацию
в документах
или базе дан-
ных, а уже потом
формирует ответ.
Такой подход
называют «поиск
плюс генерация».
Это снижает
риск ошибок:
ответ строится
не из абстракт-
ных знаний,
а из конкретных
текстов, которые
можно проверить
Когда ассистент
считает, пишет
код или стро-
ит таблицы,он
обычно не делает
это «в голове».
Эти действия
выполняются
отдельными
программами —
калькуляторами,
интерпретатора-
ми, таблицами.
ИИ лишь форму-
лирует задачу
и анализирует
результат. Поэ-
тому он полезен
как координа-
тор, но не за-
меняет сами
инструменты
Поэтому уверенный тон ответа не га-
рантирует его точности. На практике
ИИ лучше всего использовать для соз-
дания структуры, подбора формули-
ровок и генерации гипотез, но не как
окончательный источник истины.
Наконец, важно помнить, что асси-
стент всегда работает в рамках зара-
нее заданных правил и ограничений. Он
может отказываться от ответов, смяг-
чать формулировки или избегать пря-
мых инструкций, например в вопросах,
связанных с персональными данными,
авторским правом или потенциально
опасными темами. Это не сбой, а часть
встроенных механизмов безопасности
продукта.
В итоге современный ИИ-ассистент —
это инструмент совместной работы. Он
ускоряет рутину, помогает формулиро-
вать мысли и исследовать варианты,
но не берет на себя ответственность
за результат. Пользователь остается
ключевой фигурой: именно он задает
рамки, удерживает цель и решает, мож-
но ли доверять полученному ответу.
КАК ФОРМУЛИРОВАТЬ ЗАПРОСЫ,
ЧТОБЫ ИИ БЫЛ ПОЛЕЗЕН
Большинство сложностей при рабо-
те с ИИ проистекают не из ограниче-
ний модели, а из нечетко поставленной
задачи. Ассистент не считывает кон-
текст по умолчанию и не строит дога-
док о ваших скрытых намерениях — он
работает исключительно с тем, что явно
сформулировано в запросе. Поэтому
качество ответа почти напрямую за-
висит от точности и ясности постанов-
ки вопроса.
Во-первых, формулировать запрос
через конкретную цель. Общие фразы
вроде «напиши текст» или «расскажи
о чем-нибудь» ведут к расплывчатым
и малополезным результатам. Гораз-
до эффективнее сразу обозначить, для
чего именно нужен ответ: например,
«подготовь черновик письма клиенту
с объяснением задержки» или «сфор-
мулируй краткое описание проекта для
презентации». Четкая цель сразу зада-
ет направление и резко снижает веро-
ятность получения слишком абстракт-
ного или нерелевантного ответа.
Во-вторых, поскольку ассистент
не знает вашей аудитории, стилисти-
ческих предпочтений или условий ис-
пользования результата, эти параме-
тры стоит указывать явно. Для текста
это может быть тон (деловой, разговор-
ный, нейтральный), объем и уровень
детализации. Для кода — язык про-
граммирования, окружение и требова-
ния к качеству. Даже простое уточне-
ние вроде «объясни для человека без
технического образования» или «опи-
ши в виде коротких тезисов» способно
кардинально изменить итоговый ответ.
В-третьих, не пытаться решить слож-
ную, многосоставную задачу одним за-
просом. Если цель включает несколько
этапов, эффективнее вести последо-
вательный диалог: сначала запросить
общий план или список подходов, за-
тем детализировать отдельные пункты,
ПРОСТОЙ РАБО-
ЧИЙ ПРИНЦИП
Хороший запрос
почти всегда
отвечает на четы-
ре вопроса:что
нужно сделать,
на основе чего,
в каком виде
и с какими
ограничениями.
Например: «На-
пиши короткое
письмо клиенту
о переносе сро-
ков. Основание:
задержка по-
ставки. Формат:
6-8 предложе-
ний, нейтраль-
ный тон. Без
юридических
обещаний». Такая
конкретика резко
повышает каче-
ство ответа
ИИ плохо пони-
мает абстрактные
пожелания вроде
«сделай лучше».
Зато хорошо
реагирует на из-
меримые крите-
рии: «сократи
текст на треть»,
«оставь три
пункта», «убери
сложные сло-
ва». Чем яснее
вы описываете
резул ьгат, тем
меньше модель
«додумывает
за вас»
а после — доработать итоговый вари-
ант. Такой пошаговый режим позволя-
етудерживать логику задачи и вовремя
корректировать направление, вместо
того чтобы получить единый, но плохо
пригодный для использования ответ.
В-четвертых, следует явно указывать
формат результата. По умолчанию си-
стема выдает связный текст, однако
если вам нужен список, таблица, крат-
кое резюме или пошаговая инструкция,
это нужно прямо обозначить в запро-
се. Например: «ответь в виде списка
из пяти ключевых преимуществ» или
«сформулируй ‘’ыводы в одном абза-
це».
Отдельно стоит развивать навык точ-
ной коррекции. Если ответ оказал-
ся слишком общим, абстрактным или
ушел в сторону, полезнее не переписы-
вать запрос целиком, а дать конкрет-
ные указания по доработке: «слишком
обобщенно, приведи три конкрет-
ных примера», «сосредоточься только
на практических шагах», «убери вво-
дные рассуждения и оставь суть». Ас-
систент, как правило, хорошо реагиру-
ет на такие направляющие.
При этом важно постоянно помнить
о естественных ограничениях системы.
ИИ не имеет доступа к вашим внутрен-
ним данным, не знает скрытого кон-
текста и по умолчанию не проверяет
фактические утверждения на досто-
верность. Все, что существенно для за-
дачи, должно быть либо явно описано,
либо передано в виде текста или фай-
ла. Кроме того, ассистент не принимает
на себя ответственность за решения —
его ответы всегда стоит рассматривать
как черновики, варианты или отправ-
ные точки, а не в качестве окончатель-
ных и безошибочных выводов.
Хорошим ориентиром может служить
представление о том, что вы форму-
лируете задачу для внимательного,
но не осведомленного помощника. Чем
точнее и полнее вы объясните, что вам
нужно, в каком виде и для каких целей,
тем выше будет практическая ценность
результата. В этом смысле современный
ИИ — не источник готовых истин, а ин-
струмент, который усиливает и ускоря-
ет вашу работу, но только при условии,
что вы разговариваете с ним на языке
конкретных задач, а не смутных ожи-
даний.
КАК ИСПОЛЬЗОВАТЬ ИИ ДЛЯ
РАЗНЫХ ЗАДАЧ И НЕ ОШИБАТЬСЯ
В ГЛАВНОМ
Современные ИИ-системы действи-
тельно обладают широкими возмож-
ностями, но их практическая ценность
почти всегда определяется не масшта-
бом заявленных функций, а грамотным
выбором режима работы. В одном режи-
ме модель эффективна как инструмент
мышления: помогает разобрать аргу-
менты, выстроить логическую струк-
туру, сравнить альтернативы, выявить
противоречия и предложить возмож-
ные сценарии. В другом — от нее ожи-
дают точных фактов и справок. И здесь
возникает системное ограничение:
Полезная при-
вычка — просить
модель разделять
факты и рассуж-
дения. Например:
сначала перечис-
лить утвержде-
ния, которые
можно прове-
рить, а затем дать
объяснение. Это
особенно важно
в темах, где цена
ошибки высока:
так вы сразу ви-
дите, где нужно
сверяться с пер-
воисточниками
ДВА РЕЖИМА
РАБОТЫ, КО-
ТОРЫЕ ВАЖНО
НЕ ПУТАТЬ
ИИ особенно
полезен там, где
требуется мыш-
ление: улучшить
формулировку,
навести порядок
в тексте, срав-
нить варианты,
увидеть логиче-
ски слабые ме-
ста. Гораздо хуже
он подходит для
роли источника
истины. Прак-
тичный прием —
просить модель
явно разделять:
что она считает
надежным знани-
ем, а что требует
проверки по до-
кументам или
первоисточникам
языковая модель может уверенно про-
должать рассуждение даже при отсут-
ствии достоверных данных, подменяя
проверяемую информацию правдопо-
добными, но вымышленными утвержде-
ниями.
Из этого вытекает базовое правило.
В задачах, где важны логика, ясность
изложения и работа с формулировка-
ми, ИИ можно задействовать напря-
мую. Там же, где требуется установ-
ленная истина — точные даты, цифры,
юридические нормы, актуальные пра-
вила, — ИИ должен работать не как
первичный источник, а как помощник
в проверке. В таком режиме стоит за-
прашивать не готовые выводы, а эле-
менты, которые легко верифициро-
вать: точные названия организаций
и документов, ссылки на официальные
стандарты и реестры, имена авторов
исследований, годы публикаций, кор-
ректные формулировки терминов. Это
переводит работу из плоскости дове-
рия к сгенерированному тексту в пло-
скость проверки по первоисточникам,
что значительно снижает риск принять
красивое изложение за подтвержден-
ный факт.
Особенно важно различать встро-
енные знания модели и поиск в ин-
тернете. Знания модели подходят для
объяснения общих понятий, базовых
механизмов, исторического контекста
и устоявшихся фактов, не подвержен-
ных быстрым изменениям. Как только
вопрос затрагивает актуальность — по-
следние поправки в законодательстве,
свежие версии программ, новые прави-
ла сервисов, текущие цены или ново-
сти, — следует сразу ориентироваться
на поиск по первоисточникам, обра-
щая особое внимание на дату публика-
ции и тип ресурса. Даже при наличии
функции поиска надежность не гаран-
тирована автоматически: модель мо-
жет перепутать похожие страницы или
пересказать вторичную информацию.
Поэтому на практике хорошо зареко-
мендовал себя редакторский подход:
искать не просто URL, а конкретный до-
кумент и выпустившую его организа-
цию, а затем проверять информацию
в соответствующем разделе официаль-
ного сайта или репозитория.
Ситуация усложняется, когда ИИ под-
ключают к инструментам и наделяют
возможностью совершать действия:
анализировать документы,взаимодей-
ствовать с сервисами, исполнять код,
составлять письма или вносить правки
в файлы. В таком контуре языковая мо-
дель становится не просто источником
ответов, а компонентом системы при-
нятия решений. Это означает, что ее
нельзя рассматривать как безошибоч-
ного исполнителя. Надежность здесь
обеспечивается внешним контролем:
проверкой параметров, ограничени-
ем прав доступа, детальным легирова-
нием действий и четкими критерия-
ми остановки. Практика показывает,
что в подобных сценариях эффектив-
нее требовать от модели не свобод-
ный текст, а структурированные ответы
по заданному шаблону — это упрощает
Если вопрос за-
висит от актуаль-
ности — законы,
цены,правила
сервисов, версии
программ, — по-
лезно прямо
спрашивать,
на какие данные
и какого периода
опирается ответ.
Языковая модель
может звучать
уверенно даже
там, где информа-
ция устарела или
неполна. Такая
проверка заранее
экономит время
и снижает риск
ошибок
Рабочий способ
использовать
ИИ для провер-
ки — просить
не готовый ответ,
а маршрут поис-
ка. Например: где
обычно публи-
куют офици-
альные доку-
менты, в каких
разделах сайта
их искать, какие
формулировки
использовать.
В этом режиме
ИИ помогает
ориентироваться,
а не подменяет
собой источник
контроль и снижает вероятность про-
пустить ошибку.
У агентных сценариев есть и еще одна
уязвимость, о которой стоит говорить
открыто. Речь о внедрении вредонос-
ных инструкций (prompt injections') —
когда злонамеренные указания скры-
вают внутри данных: на веб-странице,
в документе или письме, так что модель
воспринимает их как команды. Совре-
менные рекомендации едины: чем боль-
ше возможностей для действий пре-
доставлено ИИ, тем строже должны
быть внешние ограничения. Принцип
наименьших привилегий, фильтрация
входных данных и обязательное под-
тверждение критически важных опера-
ций — это не излишняя осторожность,
а необходимая часть ответственной
практики.
РАБОТА С ТЕКСТАМИ: ЧТО ИИ
РЕАЛЬНО ДЕЛАЕТ ХОРОШО
На практике ИИ наиболее полезен
в задачах, где требуется не «создать
истину», а переработать, уточнить или
привести в порядок уже имеющийся
текст.
Одна из самых сильных сторон — ре-
дактирование и переформулирование.
ИИ эффективно меняет стиль, сокра-
щает объем, упрощает язык и устраня-
ет повторы. Например, черновик можно
быстро преобразовать в нейтральный
деловой текст, сделать более разговор-
ным или адаптировать для конкретной
аудитории. Ключевой принцип здесь:
исходный смысл задает человек, а мо-
дель работает над его формой. Чем точ-
нее обозначены цель и желаемый стиль,
тем ниже риск смысловых искажений.
Вторая устойчивая функция — струк-
турирование. ИИ полезен, когда нужно
организовать поток мыслей или разроз-
ненные фрагменты в логичную схему:
план статьи, список аргументов, оглав-
ление, последовательность шагов. Прак-
тично действовать в два этапа: снача-
ла запросить предлагаемую структуру,
затем последовательно дорабатывать
каждый ее пункт. Такой подход помога-
ет быстро систематизировать материал
и выявить пробелы в логике.
Хорошо работает и резюмирование.
ИИ способен сокращать длинные тек-
сты, выделять ключевые тезисы и фор-
мулировать краткие сводки. Это осо-
бенно ценно при работе с отчетами,
расшифровками интервью, стенограм-
мами встреч и объемной перепиской.
При этом важно помнить, что любое
резюме — это интерпретация, поэтому
в ответственных случаях стоит прове-
рять, не были ли опущены важные ню-
ансы, условия или оговорки.
Отдельного внимания заслуживает
адаптация текста для разных аудито-
рий. Один и тот же материал можно пе-
реработать для специалиста, руково-
дителя или широкой публики, меняя
уровень терминологии и детализации.
ИИ успешно справляется с таким «пе-
реводом» между стилями, что упроща-
ет рабочую коммуникацию и подготов-
ку пояснительных материалов.
При редактиро-
вании важных
текстов — писем,
инструкций, до-
говоренностей —
лучше просить
ИИ не переписы-
вать все заново,
а работать как
редактор. По-
лезный формат:
отдельный список
изменений и по-
яснение, зачем
они сделаны.Это
позволяет сохра-
нить контроль
над смыслом
и избежать неза-
метных подмен
В целом при работе с текстами ИИ
стоит рассматривать как усилитель ва-
ших возможностей. Он берет на себя
рутинную часть, ускоряет редактирова-
ние и помогает привести мысли в поря-
док, но не заменяет ни ваше мышление,
ни вашу ответственность как автора.
ЧТО ТАКОЕ DIFF
И ЗАЧЕМ ОН
НУЖЕН
Diff — это на-
глядное срав-
нение версий
до и после:
какие строки
добавлены,
какие удалены,
какие изменены.
Даже без опыта
программирова-
ния такой формат
удобен: видно
каждую правку,
и по ней можно
задать вопрос
или отказаться
от сомнительного
изменения
КОД, ДАННЫЕ И АВТОМАТИЗАЦИЯ:
ГДЕ ИИ ЭКОНОМИТ ВРЕМЯ
В работе с кодом и данными искус-
ственный интеллект долгое время вос-
принимался сугубо как вспомогатель-
ный инструмент— нечто вроде умного
автодополнения или помощника для на-
писания отдельных фрагментов. Одна-
ко за последние годы это представле-
ние кардинально изменилось.
Если говорить простыми словами,
ИИ теперь все реже работает «строч-
ка за строчкой» и все чаще — на уров-
не целостной задачи. К примеру, ему
можно описать проблему в программе,
и он попытается самостоятельно опре-
делить, в каких именно файлах и моду-
лях требуется внесение правки, предло-
жит конкретные исправления и оформит
их как связный патч. Человеку при этом
не приходится писать все вручную — он
лишь оценивает предлагаемые измене-
ния и решает, насколько они соответ-
ствуют поставленной цели.
Этот подход оказывается особенно
ценным в работе с большими и лега-
си-проектами, где основное время раз-
работчика уходит не на написание но-
вого кода, а на поиск нужного места
в кодовой базе и понимание сложных
взаимосвязей между компонентами. ИИ
может взять на себя именно эту, пер-
воначальную аналитическую работу:
просканировать структуру проекта, об-
наружить релевантные участки и сфор-
мулировать вариант решения. Однако
важно четко осознавать его ограниче-
ние: модель не знает внутренних дого-
воренностей и специфики бизнес-логи-
ки конкретной команды, а потому все
ее предложения требуют обязательной
экспертной проверки.
Тот же самый принцип эффективно
работает и при создании небольших
программ и сценариев автоматизации.
ИИ достаточно уверенно справляется
с написанием простых скриптов, на-
пример для пакетной обработки фай-
лов, преобразования табличных дан-
ных, очистки массивов информации или
выполнения рутинных операций. В по-
добных сценариях он часто выдает ра-
бочий результат довольно быстро, при
условии, что ему четко описали, что
служит входом и что ожидается на вы-
ходе. Но как только скрипт начинает
затрагивать критически важные дан-
ные или производственные процессы,
без тщательной ручной проверки уже
не обойтись.
Отдельный и весьма полезный сце-
нарий применения — это работа с та-
блицами и системными логами, то есть
служебными записями о работе при-
ложений и инфраструктуры. ИИ мож-
но попросить помочь разобраться
в массиве таких данных: обнаружить
При работе
с таблицами
ИИ полезен
как помощник
по выдвижению
гипотез. Он
может подска-
зать, где искать
ошибки: необыч-
ные значения,
пропуски, повто-
ряющиеся сбои.
Но итоговые
выводы всегда
стоит проверять
вручную: модель
не видит данные
так же строго, как
человек с каль-
кулятором или
формулой
Если ИИ пишет
скрипт или
делает автома-
тизацию, стоит
сразу просить
предусмотреть
сбои: пустые
файлы, неожи-
данные форматы,
отсутствующие
столбцы. Глав-
ная ценность
здесь не сам код,
а то, что типич-
ные проблемы
продумываются
заранее, до того
как система сло-
мается в работе
повторяющиеся ошибки, выявить ано-
малии или предложить возможные при-
чины сбоев. Важно подчеркнуть, что
в этом случае ИИ не выполняет диагно-
стику проблемы, а лишь помогает инже-
неру быстрее сформулировать рабочую
гипотезу, которую затем необходимо
проверить традиционными методами.
Когда ИИ предлагает изменения
в коде, результат обычно представляет-
ся в виде наглядного списка правок: что
именно было добавлено, удалено или
изменено в каждом файле. В профес-
сиональной среде такой вывод называ-
ется diff (от англ, difference — разли-
чие), но по сути — это просто удобное
сравнение состояний «было» и «ста-
ло». Подобный формат удобен тем,что
человек может быстро охватить взгля-
дом все предлагаемые модификации
и оценить их потенциальное влияние,
не погружаясь в детальный построч-
ный анализ.
Современные инструменты разработ-
ки как раз и заточены под эту парадиг-
му: ИИ функционирует в изолирован-
ной, безопасной среде, где его действия
не влияют напрямую на рабочую си-
стему. Он лишь предлагает изменения,
но никогда не применяет их автомати-
чески. Финальное решение — прини-
мать правки или отклонить их — всег-
да остается за человеком. Этот принцип
критически важен, поскольку даже не-
значительная ошибка в коде может при-
вести к серьезным операционным или
финансовым последствиям.
ОГРАНИЧЕНИЯ И ПРАВИЛА:ЧТО ИИ
ДЕЛАТЬ НЕ БУДЕТ
Современные ИИ-системы действи-
тельно умеют многое, но далеко не все,
что может прийти в голову пользовате-
лю. Значительная часть отказов и на-
рочито осторожных формулировок
в ответах — это не следствие техни-
ческих сбоев или странностей модели,
а прямой результат правовых, этиче-
ских и репутационных рамок, в кото-
рых такие системы обязаны функци-
онировать.
Один из самых заметных блоков огра-
ничений связан с вопросами лицензий
и авторского права. ИИ не должен до-
словно воспроизводить защищенные
авторским правом тексты или по за-
просу дописывать книги, статьи и сце-
нарии. Даже если модель в процессе
обучения видела подобные тексты, она
не имеет права выдавать их целиком.
Поэтому вместо прямых цитат система
часто предлагает пересказ, обобщение
или вовсе отказывается выполнять за-
прос — таков способ избежать наруше-
ния авторских прав.
Отдельная и критически важная зона
ограничений — это область профес-
сиональных советов, где цена ошибки
чрезвычайно высока. Речь идет не толь-
ко о явно незаконном или оскорбитель-
ном контенте, но и о персонализиро-
ванных рекомендациях в сферах, где
по закону требуется лицензирован-
ный специалист. Прежде всего это ме-
дицина, юриспруденция, финансовые
консультации и вопросы, напрямую
ПОЧЕМУ
ИИ ИНОГДА
УКЛОНЯЕТСЯ
ОТ ОТВЕТА
Отказ или обоб-
щенный ответ
часто связан
не с возможно-
стями модели,
а с правилами
и ответственно-
стью. ИИ не дол-
жен выдавать
персональные
медицинские
диагнозы, юриди-
ческие стратегии
под конкретное
дело или ав-
томатические
решения, влия-
ющие на жизнь
человека. В таких
случаях система
ограничивается
общими поясне-
ниями и сове-
тует обратиться
к специалисту
С авторским
правом ситуа-
ция проста: ИИ
может объяснить
смысл текста,
но не должен
воспроизводить
большие фраг-
менты защищен-
ных материалов
дословно.Если
нужен контент,
безопаснее про-
сить пересказ,
структуру, крат-
кое изложение
или пояснение
своими словами
влияющие на безопасность и благопо-
лучие человека. Именно по этой причи-
не ИИ часто отвечает общими и уклон-
чивыми фразами на запросы поставить
диагноз, разработать правовую страте-
гию или принять инвестиционное ре-
шение. Такие ответы кажутся осторож-
ными не потому, что модель не знает
ответа, а потому что автоматическое
принятие подобных решений без че-
ловеческого контроля несет неоправ-
данно высокие риски.
С этим же тесно связан блок огра-
ничений, касающихся работы с пер-
сональными данными, который се-
годня трактуется значительно шире,
чем просто запрет на использование
адресов и телефонов. Современные
регуляторные нормы запрещают при-
менять ИИ для классификации людей
по биометрическим признакам, сбора
и анализа баз фотографий, попыток
определить чувствительные атрибуты
личности или делать выводы об эмо-
циональном состоянии человека в та-
ких контекстах, как школа или рабо-
чее место. Также под строгим запретом
находятся системы социального ско-
ринга (social scoring) — любые попыт-
ки оценивать людей и их поведение
в баллах или рейтингах для принятия
административных или иных решений.
Эти ограничения напрямую отражают
подходы, закрепленные, в частности,
в европейском регламенте GDPR, и по-
степенно становятся глобальным стан-
дартом для крупных технологических
продуктов.
Близкая к предыдущей тема — ге-
нерация синтетических лиц и голосов.
Сегодня недопустимо использовать чу-
жой визуальный образ или голос без
явного согласия так, чтобы это вводи-
ло третьих лиц в заблуждение. Созда-
ние реалистичных видео- и аудиома-
териалов сопровождается жесткими
требованиями прозрачности: поль-
зователь должен однозначно пони-
мать, что перед ним синтетический,
а не подлинный контент. В ряде юрис-
дикций такие требования уже закре-
плены законодательно, что напрямую
влияет на то, как сервисы проектируют
предупреждающие маркеры, пометки
и ограничения на использование по-
добных функций.
Пользователей зачастую раздража-
ет, когда ИИ отказывается выполнить
запрос без детальных объяснений. По-
мимо общего принципа предосторож-
ности, здесь есть и сугубо практиче-
ская причина, о которой много говорят
специалисты по безопасности. Совре-
менные модели уязвимы к так назы-
ваемым скрытым инструкциям (prompt
injections), которые мы уже упомина-
ли. Именно из-за этой угрозы продукты
особенно жестко ограничивают погра-
ничные сценарии, когда ИИ подклю-
чен к внешним инструментам и может
не просто отвечать, но и совершать дей-
ствия: отправлять запросы, изменять
файлы или выполнять операции от име-
ни пользователя.
Наконец, важно понимать, что су-
ществующие ограничения касаются
Персональные
данные — это
не только теле-
фоны и адреса.
Ограничения ка-
саются и попыток
собирать базы
людей, связывать
человека с чув-
ствительными
признаками или
делать выво-
ды о личности
по внешности,
голосу или по-
ведению. Такие
запросы часто
блокируются
заранее
Отдельная зона
ограничений —
синтетические
лица и голоса.
Использовать
образ или голос
реального
человека без
согласия нельзя,
особенно если
это может ввести
в заблуждение.
Поэтому многие
сервисы требуют
янной маркиров-
ки синтетиче-
ского контента
и подтверждения
права на его
использование
не только формулировки ответов,
но и политики обращения с пользо-
вательскими данными. Поведение си-
стемы во многом зависит от режи-
ма приватности конкретного сервиса
и тарифного плана: в одних случаях
пользовательский ввод может исполь-
зоваться для дальнейшего улучшения
моделей, в других — по умолчанию пол-
ностью исключается из процессов до-
обучения. Этот аспект не всегда оче-
виден в ходе диалога, но он формирует
важную практическую рамку, опреде-
ляющую, какие задачи разумно до-
верять ИИ, а какие — категорически
не следует.
ВЗГЛЯД В БУДУЩЕЕ ИИ
Лучший способ предсказать
будущее — создать его.
Алан Кей
Контуры будущего ИИ определяются не в вакууме, а в кор-
поративных стратегиях, на рынке труда, в законах и этиче-
ских кодексах. Общество уже решает, где допустима пол-
ная автоматизация, а где необходим человеческий контроль.
От этого зависит, станет искусственный интеллект двигате-
лем прогресса или источником новых кризисов.
ЭКОНОМИКА И ЗАНЯТОСТЬ: ЧТО
НА САМОМ ДЕЛЕ ПОД УГРОЗОЙ
Разговор об ИИ и рынке труда ча-
сто колеблется между двумя край-
ностями: либо «машины отнимут все
профессии», либо «ничего принци-
пиально не изменится». Реальность
сложнее и неприятнее обеих версий.
Да, ИИ сегодня не заменяет профес-
сию целиком. Но это не означает, что
вытеснения никогда не будет — оно
просто происходит иначе, чем приня-
то представлять.
ИИ автоматизирует не профессии,
а наборы задач. Проблема в том, что
в ряде профессий именно эти задачи
и составляют основную часть повсед-
невной работы. Когда такая доля ста-
новится автоматизируемой, профес-
сия начинает «усыхать»: требуется
меньше людей, меняются требования
к входу, падает ценность типовых на-
выков. Это и есть вытеснение, просто
не одномоментное.
Экономисты все
чаще описыва-
ют влияние ИИ
не через исчезно-
вение профессий,
а через изме-
нение состава
работы внутри
них. В любой
должности есть
повторяющиеся
операции и есть
задачи, требу-
ющие суждения
и ответственно-
сти. ИИ быстрее
всего берет
на себя рутину,
а не всю работу
целиком, поэтому
профессии чаще
меняются, чем
исчезают
У использования
ИИ есть два эф-
фекта. Первый —
ускорение:
человек делает
ту же работу бы-
стрее, например
готовит черновик
отчета или пер-
вичный анализ
данных. Вто-
рой — замена:
отдельные опе-
рации перестают
существовать как
самостоятельная
работа. В сферах
с высокой ценой
ошибки — ме-
дицине, праве,
финансах —
обычно растет
значение про-
верки и личной
ответственности,
а не происходит
полное вытесне-
ние человека
Часто в этом контексте упоминают вра-
чей и юристов, и неслучайно. В медици-
не ИИ уже сейчас хорошо справляется
с анализом изображений, подготовкой за-
ключений, сортировкой случаев, первич-
ным сбором данных. Это не замена врача,
но серьезное сокращение времени на ру-
тинную часть работы. В результате систе-
ме здравоохранения требуется меньше
специалистов для обслуживания того же
объема пациентов, а требования к остав-
шимся растут: больше ответственности,
больше контроля, меньше пространства
для «механической» практики.
В юриспруденции ситуация похожая.
ИИ умеет искать судебную практику,
анализировать договоры,находить ри-
ски, готовить черновики документов.
Это напрямую бьет по тем ролям, кото-
рые раньше выполняли младшие юри-
сты и помощники. Вход в профессию
становится уже, а карьерная лестни-
ца — короче. Формально профессия
остается, но количество мест и траек-
тории внутри нее меняются.
Похожий процесс идет и в других об-
ластях: бухгалтерии,аналитике, пере-
воде, редактуре, службах поддержки.
Везде, где значительная часть работы
сводилась к обработке текста, данных
или типовых решений, ИИ снижает по-
требность в человеческом труде. Это
не всегда означает массовые увольне-
ния, но почти всегда знаменует давле-
ние на зарплаты и рост конкуренции.
При этом есть и обратная сторона.
ИИ создает новые роли и усиливает
старые: появляются задачи контроля,
интеграции, постановки целей, провер-
ки качества, работы с последствиями
решений. Но эти роли требуют более
высокого уровня подготовки и ответ-
ственности. Поэтому ИИ не просто
уничтожает рабочие места — он пере-
страивает рынок в пользу более квали-
фицированных и гибких специалистов.
Важно и то, что скорость изменений
может быть выше, чем способность об-
щества адаптироваться. Образование,
переквалификация и социальные инсти-
туты традиционно реагируют медленно.
Из-за этого переходный период может
быть болезненным: не все смогут или
захотят перейти на новые роли, и не все
рынки труда готовы их предложить.
ИИ действительно будет вытеснять
часть профессий и ролей, но это не ав-
томатический «конец труда», а слож-
ный и неравномерный сдвиг. Он создает
новые возможности, но одновремен-
но усиливает риски как для отдельных
людей, так и для экономики в целом.
ОБЩИЙ ИИ И СВЕРХИНТЕЛЛЕКТ:
ЧТО СКРЫВАЕТСЯ ЗА ГРОМКИМИ
СЛОВАМИ
Термины «общий искусственный ин-
теллект» и «сверхинтеллект» звучат
все чаще — в новостях, инвестицион-
ных презентациях и публичных дис-
куссиях. При этом за одними и теми же
словами разные люди нередко имеют
в виду совершенно разные вещи, из-
за чего разговор быстро уходит либо
в фантастику, либо в пустые споры.
Есть и менее оче-
видный риск —
усложнение
входа в профес-
сию. Раньше но-
вичкам поручали
простые задачи:
первичный поиск
информации, чер-
новые расчеты,
типовые тексты.
Если это делает
ИИ, стартовых
позиций стано-
вится меньше.
В результате
от начинающих
специалистов все
чаще ждут более
высокого уровня
первичной подго-
товки
Идею резкого
ускорения разви-
тия умных систем
сформулиро-
вал математик
И. Дж. Гуд еще
в 1960-х годах.
Он предположил,
что если система
сможет улучшать
собственные
методы,прогресс
может пойти
быстрее при-
вычных темпов.
Это не прогноз
дат и не обеща-
ние результата,
а теоретический
сценарий, помо-
гающий обсуж-
дать возможные
риски
Под общим искусственным интеллек-
том обычно понимают систему, которая
способна решать широкий круг задач
на уровне человека, переносить знания
между областями и самостоятельно ос-
ваивать новые виды деятельности. Под-
черкиваем: это не просто «очень мощная
модель» и не сумма отдельных навыков.
Речь идет о гибкости и универсальности,
которые позволяют системе действовать
вне заранее очерченных сценариев.
Современные ИИ-системы, включая са-
мые продвинутые языковые модели, к это-
му уровню не относятся. Они могут выгля-
деть универсальными, потому что умеют
работать с текстом, кодом, изображени-
ями и данными, но все эти способности
опираются на одну и ту же основу — рас-
познавание статистических закономерно-
стей в больших массивах данных. У таких
систем нет собственных целей, намере-
ний, понимания контекста в человеческом
смысле и опыта взаимодействия с миром
вне данных и инструкций. Они не хотят
ничего и не могут самостоятельно опре-
делить, что для них важно.
Понятие сверхинтеллекта идет еще даль-
ше. Под ним обычно понимают гипотети-
ческую систему, которая превосходит че-
ловека практически во всех когнитивных
областях и способна улучшать саму себя.
Эти сценарии активно обсуждаются не по-
тому, что они уже на горизонте, а потому что
потенциальные последствия такого разви-
тия слишком велики, чтобы их игнориро-
вать. Даже небольшая вероятность требует
внимания, если ставка — контроль над тех-
нологиями с огромной силой воздействия.
Однако здесь важно отделять научное
обсуждение от медийного хайпа. На се-
годняшний день нет ни теоретического
консенсуса, ни практических признаков
того, что существующие архитектуры на-
прямую ведут к общему ИИ или, тем бо-
лее, к сверхинтеллекту. Прогресс идет
быстро, но он по-прежнему опирается
на рост данных, вычислений и инженер-
ных улучшений, а не на принципиально
новое понимание разума.
Тем не менее разговоры об общем ис-
кусственном интеллекте и сверхинтел-
лекте оказывают реальное влияние. Они
формируют ожидания инвесторов, на-
правление исследований и подходы к ре-
гулированию. Опасность здесь двойная.
С одной стороны, чрезмерный оптимизм
может привести к переоценке возможно-
стей систем и опасным экспериментам.
С другой — апокалиптические сцена-
рии могут отвлекать внимание от более
приземленных, но уже существующих
рисков: ошибок, смещения ответствен-
ности, неравенства доступа и неконтро-
лируемого применения ИИ.
ЧЕЛОВЕК И ИИ: КАК ЖИТЬ
И РАБОТАТЬ В НОВОЙ РЕАЛЬНОСТИ
ИИ уже перестал быть эксперимен-
том и стал рабочим инструментом, по-
этому главный практический вопрос се-
годня не в том, заменит ли он человека,
а в том, кто и за что отвечает. Современ-
ные системы умеют предлагать вари-
анты, ускорять анализ и автоматизиро-
вать рутинные операции, но они не несут
Одна из клю-
чевых проблем
будущих мощных
систем связана
не с намерения-
ми, а с точностью
формулировок.
Машина может
идеально выпол-
нять заданную
цель, понимая
ее буквально,
а не так, как
подразумевал
человек. Поэтому
в современных
обсуждениях
все внимание
смещается к тому,
как правильно
задавать цели
и как ограничи-
вать действия
системы
Во многих се-
рьезных системах
ИИ не принимает
окончательных
решений. Он
помогает собрать
информацию,
предложить ва-
рианты или под-
светить риски,
но финальный
выбор остается
за человеком.
Такой подход
используют
там, где ошибка
может дорого
стоить: в медици-
не, кредитовании,
кадровых реше-
ниях, системах
безопасности
ответственности за свои действия. Лю-
бое решение, влияющее на людей, день-
ги, здоровье или безопасность, по-преж-
нему остается на стороне человека.
На уровне повседневной работы че-
ловеку нужно следовать такому пра-
вилу: ИИ — помощник, а не источник
окончательных решений. Его разумно
использовать для подготовки материа-
лов, сравнения сценариев, проверки ло-
гики, черновых расчетов и поиска сла-
бых мест. Но финальное утверждение,
подпись и ответственность нельзя де-
легировать. Там, где цена ошибки высо-
ка, человек должен понимать контекст,
ограничения и возможные последствия.
Из этого напрямую вытекает сдвиг
в навыках. Ценность работника сме-
щается от умения быстро производить
результат к умению управлять процес-
сом: формулировать задачу, задавать
рамки, проверять выводы и вовремя
останавливать автоматизацию. Рабо-
та с ИИ требует не доверия, а дисципли-
ны: уточняющих вопросов, повторной
проверки, разделения фактов и интер-
претаций, а иногда и осознанного от-
каза от использования ИИ там, где он
создает больше рисков, чем пользы.
Однако ответственность не может ле-
жать только на отдельных пользовате-
лях. Поэтому параллельно развивается
регулирование, которое фиксирует об-
щие границы допустимого. Его задача —
не затормозить развитие технологий,
а встроить ИИ в социальную и экономи-
ческую систему так, чтобы последствия
были управляемыми. Один из ключевых
принципов здесь — обязательное уча-
стие человека в критических решениях:
в медицине, образовании, найме, креди-
товании, безопасности.
Регуляторы все чаще требуют про-
зрачности: пользователи должны по-
нимать, когда имеют дело с ИИ, что
синтетический контент должен марки-
роваться, а автоматизированные си-
стемы — иметь понятные ограничения.
Отдельно выделяются высокорисковые
применения, для которых вводятся тре-
бования к тестированию, документации
и контролю. Это уже влияет на то, ка-
кие функции появляются в продуктах
и как именно они реализуются.
Важно и то, что правила касаются
не только ответов системы, но и об-
ращения с данными. Ограничивается
использование персональной инфор-
мации, вводятся жесткие рамки для
биометрии, запрещаются практики со-
циального скоринга, усиливается кон-
троль за тем, как данные собираются
и хранятся. В результате ИИ все чаще
проектируется не как «все умеющий
помощник», а как компонент системы
с заранее заданными рамками.
В итоге формируется новая рабочая
норма. ИИ не рассматривается как са-
мостоятельный субъект, принимающий
решения, а как часть цепочки, где роли
распределены: модель предлагает, че-
ловек проверяет, организация отвеча-
ет, а государство задает правила. Это
делаеттехнологии менее эффектными,
но более надежными и пригодными для
реального использования.
Чтобы ИИ был
полезным
и безопасным,
важны три вещи:
понятно, где он
используется;
есть процедуры
проверки его
работы; мож-
но разобрать
ошибки задним
числом. Поэто-
му в реальных
системах фик-
сируют запросы,
ответы и дей-
ствия, а также
то, кто утвердил
результат. Это по-
зволяет не только
искать виновных,
но и улучшать
саму систему
Марвин Минский (1927-2016). Американский ученый, один
из основателей исследований искусственного интеллекта.
Соосновагель Лаборатории ИИ MIT, автор ключевых идей о струк-
туре разума и книги «Общестзо разума», повлиявшей на развитие
когнитивных моделей и ИИ
Клод Шеннон (1916-2001). Американский математик и инже-
нер, создатель теории информации. Его работы заложили основы
цифровой связи, кодирования данных и всей современной вычис-
лительной техники, без которой невозможны компьютеры и ис-
кусственный интеллект
ЛИТЕРАТУРА
1. Бишоп К. М. Распознавание образов и машинное обуче-
ние. М.: Диалектика, 2020.
2. Винер Н. Кибернетика, или управление и связь в живот-
ном и машине. М.: Наука, 1983.
3. Гудфеллоу И., Бенджио И., Курвилль А. Глубокое обуче-
ние. М.: Диалектика, 2018.
4. Минский М. Сообщество разума. М.: URSS, 2018.
5. Нильссон Н. Дж. Искусственный интеллект. Методы по-
иска решений. М.: Мир, 1973.
6. Перл Дж., Маккензи Д. Думай почему? Причина и след-
ствие как ключ к мышлению. М.: Альпина нон-фикшн,
2020.
7. Рассел С., Норвиг П. Искусственный интеллект: совре-
менный подход. М.: Вильямс, 2016.
8. Саттон Р. С., Барто Э. Г. Обучение с подкреплением: вве-
дение. М.: Диалектика, 2021.
9. Уинстон П. X. Искусственный интеллект. М.: Мир, 1980.
10. Хасти Т., Тибширани Р., Фридман Дж. Основы статисти-
ческого обучения. М.: Диалектика, 2019.
Все права защищены Книга или любая ее часть не может быть
скопирована, воспроизведена в электронной или механической форме,
в виде фотокопии, записи в память ЭВМ, репродукции или каким-либо
иным способом, а также использована в любой информационной системе
без получения разрешения от издателя Копирование, воспроизведение
и иное использование книги или ее части без согласия издателя
является незаконным и влечет уголовную, административную
и Iражданскую ответст вечность.
Издание для досуга
ЭНЦИКЛОПЕДИЯ БЫСТРЫХ ЗНАНИЙ. ДЛЯ ТЕХ, КТО ХОЧЕТ ВСЕ УСПЕТЬ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Главный редактор Р. Фасхутдинов
Руководитель направления М Соболева
Ответственный редактор С Шевчук
Менеджер проекта С. Шевчук
Страна происхождения Российская Федерация
Шыгарушы ел: Ресей Федерациясы
ООО «Издательство «Эксмо-
123308, Россия, г Москва ул Зорге, д 1 стр 1 эт 20 *аб 2013 Тел.: 8 (495) 411 68 86
Home page www.eKsmo.ru t mail: info&eksmo.ru
0наруш1 «Издательство -Эксмо- ЖШК
123308, Ресеи Мнскеу кал асы, Зорге кешест- 1-уй, 1-куры лыс 20 кабал 2013-каб
Тел .8(495)411-68 66 Home page www.eksmo rv E-mail: into®eksmo ru
Тауаобелма -Эксмо-
Интернет магазин Awwoook24.ru
Интернет-магазин www.book24.kz
Интерне г-дукен www.oook24.kz
Импортер в Республику Казахстан ТОО -РДЦ-Алматы
кдзаксган Рет ||убликасына импорт тзушы «РДц Алматы- жШС
Дигтрибыотор и представитель -то пр, я-му прел чI тии на трсдукцию
в Республике Казахстан 1 ОО РДЦ-Алматы-
ГОО РДцАпмв1Ы. Алмагы ул. Домброискгло 3«а» литер Б, офис 1.
Дистрибьютор жане Казахстан Республикасында ентмге шагымдар
кабылдауженндепект РДЦ-Алматы- ЖШС
Алма- ы к. Домбровст-ий кош 3 -а-, ли гео Б офис 1
Тел 8(7771251-59-90/91/92 E-mail’ RDC-AIrnatyePeksmo kz
Сведении о подтверждении соответствия издания согласно законодательству РФ
о техническом регулировании можно получить на сайте Издательства -Эксмо»:
www.eksmc.ru certrtrcation
Техникалыкреттеу туралы РФ заннамасынасаи басылымнынсэйкеспгтн растау
туралы мал1меттерд| мына адрес бойынша алута болады: tTttp://eksmo.ru/certificabon,
Произведено в Российской Федера! ми
Ресеи Федерациясыпда enaipini ен
Сертификаттаута жатпайды
Дата изготовления / Подписано в печать 24,02 2026. Формат 84х 108’/зг.
Гарнитура -’OfficinaSans». Печать офсетная Усл. печ. л. 6,72
Тираж экз Заказ
Москва. ООО < Торговый Дом «Эксмо»
Адрес. 123308. г. Москва ул. 3opie, д.1, строение 1
Телефон. +7(495)411-50'74, E-mail: reception@eksmo-sale.ru
По вопросам приобретения книг «Эксмо» зарубежными оптовыми
покупателями обращаться в отдел зарубежных продаж ТД «Эксмо»
E-mail international@eksmo-sale. ru
International Sales, international wholesale customers should contact
Foreign Sales Department ot Trading House «Eksmo* tor their orders.
tnternational@eksmo-saie.ru
По вопросам заказа книг корпоративным клиентам, в том числе в специальном
оформлении, обращаться по тел : +7 (495) 411 -68-59, доб. 2151.
E-mail: borodkin.da@eksmo.ru
Оптовая торговля бумажно-беловыми
и канцелярскими товарами для школы и офиса «Канц-Эксмо-.
Компания «Канц-Эксмо» 142702 Московская обл.. Ленинский р-н, г. Видное-2.
Белокаменное ш., д. 1. а/я 5 Тел./факс: +7 (495) 745-28-87 (многоканальный)
e-mail kanc@eksmo-saie.ru, сайт: www.kanc-eksmo.ru
Филиал «Торгового Дома «Эксмо» в Нижнем Новгороде
Адрес 603094, г. Нижний Новгород, улица Карпинского, д. 29, бизнес-парк «Грин Плаза»
Телефон-+7 (831) 216-15-91 (92 93 94) E-mail reception@eksmonn.iu
Филиал ООО 'Издательство 'Эксмо» в г Санкт-Петербурге
Адрес. 192029, г Санкт-Петербург, пр. Обуховской обороны, д 84. лит. «Е»
Телефон.+7 (812) 365-46 03/04 E-mail seiver@szko.ru
Филиал ООО «Издательство «Эксмо» в г. Екатеринбурге
Адрес: 620024. г. Екатеринбург, ул. Новинская, д. 2щ
Телефон:+7 (343) 272 72-01 (62/03/04/05/0G/08)
Филиал ООО -Издательство «Эксмо» в г. Самаре
Адрес 443052. г Самара, пр-т Кирова, д 75/1. лит. • Е»
Телефон. +7 (846) 207-55-50 E-mail: nDC-saniara@maii.ru
Филиал ООО -Издательство «Эксмо» в г. Ростове-на-Дону
Адрес 344023. г. Ростов-на-Дону, ул. Страны Советов. 44Д
Телефон +7(863)303-62-10 E-mail info@rndeksmo.ru
Филиал ООО «Издательство «Эксмо» в г. Новосибирске
Адрес: 630015, г. Новосибирск, Комбинатский пер , д. 3
Телефон: +7(383) 289-91-42 E-mail, eksmo-nsk@yandex.ru
Обособленное подразделение в г. Хабаровске
Фактический адрес 680000 г Хабаровск, ул Фрунзе. 22. оф 703
Почтовый адрес 680020, г Хабаровск, А/Я 1006
Телефон (4212)910-120 910-211 E-mail eksmo-khv@maii.ru
Республика Беларусь: ООО «ЭКСМО ACT Си эндСи»
Центр оптово-розничных продаж Cash&Carry в г. Минске
Адрес 220014 Республика Беларусь, г Минск, проспект Жукова 44, пом 1 -17, ТЦ «Outleto»
Телефон. -375 17 251-40-23, +375 44 581-81-92
Режим работы: с 10.00 до 22.00 E-mail: exmoast@yandex.by
Казахстан: «РДЦ Алмат ы»
Адрес 050039, г. Алматы, ул. Домбровского. ЗА
Телефон: +7 (727) 251 58-12. 251 59 90 (91 92.99). Е mail RDC-Almaty@eksmo kz
Полный ассортимент продукции О< *О «Издательство «Эксмо» можно приобрести в книжных
магазинах «Читай-город» и заказать в интернет-магазине: www chitai-goiod.ru.
Телефон единой справочной службы 8 (8<:Э) 444-8-444 Звонок по России бесплатный
Интернет-магазин ООО «Издательство -Эксмо»
www. eksmo. ru
Розничная продажа книг с доставкой по всему миру.
Тел +7(495)745-89-14 E-mail: imarket@eksmo-sale.ru
Издательство «Эксмо» — универсальное
издательство №1 в России, является
одним из лидеров книжного рынка Европы
Хочешь стать
автором «Эксмо»»?
ЭКСМО
о eksmo ru COO eksmi
ЧИТАЙТЕ
И СЛУШАЙТЕ
в Литрес
ш
ЧИТАЙ
ГОРОД
eksmo.ru
Официальный
интернет-магазин
издательства «Эксмо»
ТЕРРИТОРИЯ
КНИЖНЫЙ МАГАЗИН
Официальная франшиза
издательства • Эксмо»
Мы используем искусственный интеллект для онолизо донных,
программирования, прокладывания маршрутов, создания изо-
бражений и автоматизации процессов - но при этом редко
понимаем, как он устроен, на что действительно способен
и где проходят границы его применения. Эта книга поможет
вам выстроить целостное представление об искусственном
интеллекте, о принципах его работы и логике мышления. Вы
разберетесь, как нейросети обучаются, как они распознают
изображения и речь, как алгоритмы анализируют поведение
и интересы пользователей. Вы узнаете, как формулировать
промпты, чтобы получить наилучший результат, а также какие
задачи стоит доверять ИИ, а какие - нет и почему.
• КАКИЕ НЕЙРОСЕТИ СУЩЕСТВУЮТ СЕЙЧАС И ЧЕМ ОНИ РАЗЛИЧАЮТСЯ
• КАК ЭФФЕКТИВНО ИСПОЛЬЗОВАТЬ ИИ ДЛЯ АВТОМАТИЗАЦИИ ВАШИХ
ПОВСЕДНЕВНЫХ ЗАДАЧ
• ПОЧЕМУ ТАК ВАЖНО УМЕТЬ СОСТАВЛЯТЬ ПРОМПТЫ
• ЧТО НАДО ЗНАТЬ О МИРЕ, ГДЕ ИИ СТАЛ ЧАСТЬЮ ПОВСЕДНЕВНОСТИ
ОБ ЭТОМ И МНОГОМ ДРУГОМ В КОМПАКТНОМ И СОДЕРЖАТЕЛЬНОМ СПРАВОЧНИКЕ
ДЛЯ ТЕХ, НТО ХОЧЕТ ВСЕ УСПЕТЬ.
Задача серии «Энциклопедия быстрых знаний» —
рассказать просто, коротко и увлекательно о сложном. Книги
послужат отличным источником базовых знаний и донесут
общее понимание основных терминов и ключевых моментов
в различных областях. Книги будут интересны читателям всех
возрастов, решившим расширить свои знания в той или иной
области и сделать это в быстрой и увлекательной форме.
ISBN 978-5-04-225558-8
1L БОМБОРА
ИЗДАТЕЛЬСТВО
БОМБОРА — лидер на рынке полезных и вдохновляющих книг
Мы любим книги и создаем их, чтобы вы могли творить, открывать
мир, пробовать новое, расти. Быть счастливыми Быть на волне.