Текст
                    ЭНЦИКЛОПЕДИЯ БЫСТРЫХ ЗНАНИЙ
ДЛЯ ТЕХ, КТО ХОЧЕТ ВСЕ УСПЕТЬ

11СКУССТВЕ1II1ЫЙ

I II1ТЕЛЛЕКТ

GPTjjalle

Grok Claude

Qwen DeepSeek

Mistral

DeepSeek Qwen

Midjourney
Gemini Dalle

GPT

LLaMA

ЧАТ-БОТЫ И НАВИГАТОРЫ
ПОЛЕЗНЫЕ ПРОМПТЫ
НОВЫЕ ВОЗМОЖНОСТИ ДЛЯ РАБОТЫ И САМОРАЗВИТИЯ
GPT, MISTRAL, DEEPSEEK

11СКУСС1 BEIII 11 >11 I III1ТЕЛЛЕКТ xDalle Grok Claude Qwen DeepSeek Mistral DeepSeek Qwen Midjourney Gemini Dalle GPT LLaMA БОМБОРА ИЗДАТЕЛЬСТВО M jckb3
УДК 004.8 ББК 32.81 И86 И86 Искусственный интеллект. — Москва : Эксмо, 2026. — 128 с.: ил. — (Энциклопедия быстрых знаний. Для тех, кто хочет все успеть). ISBN 978-5 04-225558 8 С тех пор как искусственный интеллект стал частью нашей по- вседневности, мы не перестаем рассуждать о его этике, мышлении, об уместности его применения в той или иной области и о многом другом. Эта книга поможет получить целостное представление об ИИ: как устроено его мышление, как он обучается, как анализиру- ет данные, строит прогнозы и почему ошибается. Вы разберетесь, с какими задачами ИИ справляется хорошо, а в чем он ограничен, и сможете использовать технологии эффективно и безопасно. УДК 004.8 ББК 32.81 ISBN 978-5-04-225558-8 © ИП Москаленко Н.В., текст и оформление, 2025 © Оформление. ООО «Издательство «Эксмо», 2026
СОДЕРЖАНИЕ На какие вопросы отвечает эта книга.........................4 Предисловие.................................................6 Глава I. Как все начиналось: от Лейбница до первых программ.8 Глава II. Взлеты и падения: 1960-1980-е....................22 Глава III. Наконец все заработало: 1990-2010-е.............34 Глава IV. ИИ в повседневности сегодня......................53 Глава V. Эпоха больших языковых моделей....................71 Глава VI. Современные направления и развилки в развитии ИИ.83 Глава VII. ИИ: помощник, а не конкурент...................100 Глава VIII. Взгляд в будущее ИИ ...........................117 Литература.................................................126
НА КАКИЕ ВОПРОСЫ ОТВЕЧАЕТ ЭТА КНИГА КАК ПОЯВИЛАСЬ ИДЕЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА? Она возникла из попыток формализовать человеческое мышление и представить рассуждение как последователь- ность операций. Глава I ПОЧЕМУ ПЕРВЫЕ УСПЕХИ ИИ БЫСТРО СМЕНЯЛИСЬ РАЗОЧАРОВАНИЕМ? Ранние системы хорошо справлялись с узкими задачами, но теряли работоспособность за пределами заранее опи- санных правил. Глава I ЧТО ПОРОДИЛО ОПТИМИЗМ 1960-Х ГОДОВ ВОКРУГ ИИ? Первые заметные успехи: программы для логических задач, игр и машинного перевода, [лава II КАКИЕ ИДЕИ ПЕРЕЖИЛИ СПАД И ОКАЗАЛИСЬ РЕШАЮЩИМИ ПОЗЖЕ? Ставка на обучение с помощью баз данных и постепенный от- каз от попыток описать мир жестким набором правил. Глава II ПОЧЕМУ РОСТ ОБЪЕМА ДАННЫХ СТАЛ ПЕРЕЛОМНЫМ МОМЕНТОМ? Он позволил моделям учиться на реальных примерах и сравнивать подходы на схожих задачах. Глава III ЧЕМ ГЛУБОКИЕ НЕЙРОСЕТИ ОТЛИЧАЮТСЯ ОТ ПРЕЖНИХ ПОДХОДОВ? Они сами формируют многоуровневые представления дан- ных, не полагаясь на заданные разработчиком или пользо- вателем признаки. Глава III ПОЧЕМУ РАСПОЗНАВАНИЕ РЕЧИ И ИЗОБРАЖЕНИЙ СТАЛО ВОЗМОЖНЫМ ПОЧТИ ОДНОВРЕМЕННО? Для этих задач одновременно сошлись данные, вычисли- тельные ресурсы и универсальные методы обучения. Глава IV
ЧТО ТАКОЕ БОЛЬШАЯ ЯЗЫКОВАЯ МОДЕЛЬ НА ПРАКТИКЕ? Это система, обученная продолжать текст и используемая как основа для диалога, анализа и помощи человеку. Глава I/ ПОЧЕМУ ТАКИЕ МОДЕЛИ КАЖУТСЯ УНИВЕРСАЛЬНЫМИ, НО ВСЕ ЖЕ ОШИБАЮТСЯ? Они хорошо создают связные ответы, но не всегда разли- чают проверенное знание и правдоподобное предположе- ние. Глава V ЧТО ТАКОЕ АГЕНТСКИЕ СИСТЕМЫ? Это ИИ, который не только отвечает на запросы, но и вы- полняет цепочки действий с помощью инструментов. Глава VI ПОЧЕМУ СПОРЯТ О РАЗМЕРАХ МОДЕЛЕЙ? Рост качества все чаще упирается в стоимость вычисле- ний, и параллельно развивается путь повышения эффек- тивности. Глава VI КАК ИИ РЕАЛЬНО ПОМОГАЕТ ЧЕЛОВЕКУ В РАБОТЕ? Как инструмент для структурирования мыслей, создания черновиков, поиска вариантов и анализа — при обязатель- ной проверке результата. Глава VII ПОЧЕМУ ИИ ИНОГДА УКЛОНЯЕТСЯ ОТ ОТВЕТА? Из-за требований безопасности, правовых ограничений и высокой цены возможной ошибки. Глава VII КАК ИИ ВЛИЯЕТ НА ЗАНЯТОСТЬ И ЭКОНОМИКУ? Он меняет содержание профессий и ценность навыков, а не просто вытесняет людей. Глава VIII ЧТО ПОНИМАЮТ ПОД ОБЩИМ ИИ И СВЕРХИНТЕЛЛЕКТОМ? Это разные гипотезы о будущем, которые не стоит смеши- вать с возможностями нынешних систем. Глава VIII КАК ЧЕЛОВЕКУ ВЫСТРАИВАТЬ ОТНОШЕНИЯ С ИИ? Понимать границы автоматизации, сохранять контроль и брать ответственность за ключевые решения. Глава VIII
НЕ ПЕРВЫЙ БУМ ИИ Интерес к ис- кусственному интеллекту уже переживал волны подъ- ема. В 1956 году на Дартмутской конференции исследователи полагали, что ключевые задачи ИИ будут решены в течение одного поколения. Ре- альность оказа- лась сложнее: не хватило ни вы- числительных ресурсов, ни по- нимания природы мышления ПРЕДИСЛОВИЕ Искусственный интеллект за корот- кое время стал частью повседневной жизни. Он участвует в работе с инфор- мацией, текстами и данными, исполь- зуется в программировании, применя- ется для создания изображений, дает рекомендации и может помочь автома- тизировать различные процессы. При этом для многих он остается техноло- гией с размытыми границами: не всегда понятно, как именно он устроен, на что реально способен и где проходят пре- делы его применения. На сегодняшний день ИИ все чаще воспринимается как универсальный помощник, но его поведение нередко оказывается неоднозначным. Он мо- жет быть полезным инструментом для анализа данных и подготовки реше- ний, но при этом уверенно ошибаться, подменять проверяемую информацию правдоподобными объяснениями и тре- бовать внешнего контроля. По мере того как такие системы встраиваются в рабочие процессы, становится важ- ным понимать, в каких режимах они ра- ботают надежно, а где их использова- ние связано с рисками. К этому добавляется более широкий контекст. ИИ влияет на рынок труда, организацию работы и распределе- ние ответственности. Он развивает- ся внутри правовых и социальных ра- мок, которые постепенно формируются и начинают напрямую влиять на то, ка- кие технологии появляются и как они
применяются, поэтому вопросы регули- рования, прозрачности и контроля ста- новятся не отвлеченной теорией, а ча- стью его практического использования. Эта книга поможет выстроить целост- ное и трезвое представление об искус- ственном интеллекте как о реальной технологии, расскажет, как он разви- вался, как работает сегодня и какие ограничения в нем заложены, чтобы читатель мог осознанно применять ИИ в работе и жизни, понимая не только его возможности, но и собственную от- ветственность, связанную с его исполь- зованием. Уже в 1960-х ИИ обсуждали далеко за преде- лами инженерных лабораторий. Герберт Саймон и Норберт Винер писали о том, как автомати- зация меняет труд, управле- ние и принятие решений. С са- мого начала ИИ рассматривали не только как технологию, но и как источ- ник социальных сдвигов
КАК ВСЕ НАЧИНАЛОСЬ: ОТ ЛЕЙБНИЦА ДО ПЕРВЫХ ПРОГРАММ Мы видим лишь малую часть возможного, неизменно переоценивая краткосрочные последствия и недооценивая долгосрочные. Алан Тьюринг История искусственного интеллекта началась задолго до появления компьютеров — с попыток понять, можно ли описать человеческую мысль как строгий алгоритм, подоб- ный математическому доказательству. Еще в XVII веке фи- лософы и математики мечтали свести рассуждение к после- довательности незыблемых правил. Из этой, казалось бы, чисто теоретической идеи родилась мысль о машине, спо- собной мыслить. Абстрактные искания тех лет заложили фундамент для сегодняшнего ИИ. ДВОИЧНЫЙ код ЛЕЙБНИЦА Значение Лейб- ница не огра- ничивается его арифмометром и философскими работами. Уже в XVII веке он предложил дво- ичную систему счисления — способ представ- лять любые числа с помощью нулей и единиц ИДЕЯ МАШИНЫ, КОТОРАЯ УМЕЕТ ДУМАТЬ Услышав фразу «искусственный ин- теллект», легко решить, что речь идет о явлении недавнего прошлого, возник- шем на волне технологического подъе- ма последних лет. Однако история этой идеи гораздо старше. Еще в 1666 году двадцатилетний немецкий философ Готфрид Вильгельм Лейбниц предло- жил концепцию «универсальной ха- рактеристики» — системы символов и правил, призванной выражать чело- веческие рассуждения в виде последо- вательности строгих логических шагов. Он стремился создать универсальный
язык мышления, в котором любые выво- ды получались бы по незыблемым пра- вилам, подобно арифметическим опе- рациям. Чтобы продемонстрировать, что ум- ственные операции действительно под- даются разложению на механические действия, Лейбниц сконструировал свой арифмометр. Внутри аппарата на- ходился так называемый ступенчатый цилиндр, или «колесо Лейбница», — вал с зубцами разной длины. Когда оператор вращал ручку, цилиндр, за- девая шестеренки, управлял их поло- жением, заставляя машину выполнять сложение, вычитание, умножение или деление. Таким образом, вычисление превращалось в набор чисто механиче- ских движений, где каждое положение цилиндра соответствовало конкретно- му шагу рассуждения. Для научной мысли XVII века это было почти немыслимым прорывом. Лейбниц наглядно показал, что опе- рация, которую мы выполняем в уме, может быть реализована устройством из металла. Эта идея стала отправной точкой на долгом пути к созданию бу- дущих вычислительных машин. Спустя почти три столетия, в 1936 году, Алан Тьюринг совершил следующий важнейший шаг. В своей фундамен- тальной работе «О вычислимых чис- лах» он представил абстрактную модель вычисления — «машину Тью- ринга». Это гипотетическое устройство состояло из бесконечной ленты, счи- тывающей головки, и набора правил, «Колесо Лейб- ница» важно не столько как конкрет- ный механизм, сколько как идея. Один и тот же узел выполнял разные действия в зависимости от положения деталей. По сути, это ранний про- образ принципа программируе- мости: поведе- ние устройства определяется настройкой, а не его физиче- ской формой
Почему первые ламповые компьютеры были крайне ненадежны: • электронные лам- пы перегревались и быстро выходи- ли из строя; • контакты и пай- ка разрушались из-за высокой температуры; • замена ламп часто нарушала работу всей схемы; • питание и охлаж- дение требовали сложной и гро- моздкой инфра- структуры определяющих действия на каждом этапе: считать символ, изменить его, передвинуть ленту. Конструкция была намеренно простой, почти аскетичной, но именно в этой простоте заключал- ся ее глубокий смысл: Тьюринг стре- мился свести идею вычисления к мак- симально ясной схеме, чтобы понять, что вообще можно считать алгоритмом. Его модель позволила формально опи- сать любой пошаговый процесс и дока- зала, что машина, следующая строгим правилам, способна выполнить любую вычислительную процедуру вне зави- симости от ее сложности или предмет- ной области. Примерно в те же годы в США аспи- рант Клод Шеннон работал над диссер- тацией, которой впоследствии суждено было стать одной из самых влиятель- ных работ XX века. В 1937 году он про- демонстрировал, что булеву алгебру — формальную логику с операциями «И», «ИЛИ», «НЕ» — можно воплотить в виде обычных электрических цепей. Резуль- таты этой работы были опубликованы в 1938 году. Замкнутый контакт в та- кой цепи соответствовал логической «истине», а разомкнутый — «лжи». Не- сколько контактов, соединенных опре- деленным образом, могли выполнять логические операции столь же строго, как и математическое выражение. Ины- ми словами, простая цепь из реле не- ожиданно обрела способность делать выводы — не в человеческом, разуме- ется, смысле, но как безупречное сле- дование формальным правилам логики.
До открытия Шеннона логика, схемо- техника и электричество существова- ли в разных, почти не пересекающихся мирах. Математики оперировали сим- волами, инженеры работали с прово- дами, а компьютеры в современном понимании еще не были изобретены. Ученый же показал, что все эти обла- сти можно объединить: построив схе- му из реле, ее можно заставить авто- матически решать логические задачи. А если логические задачи можно вы- разить в виде вычислений, значит, воз- можно создать машину, выполняющую любые операции над числами — тре- буется лишь правильно соединить кон- такты. По сути, Шеннон заложил теоре- тический фундамент того, что сегодня именуется цифровой схемотехникой. Благодаря его прозрению стало по- нятно, как конструировать универ- сальные электронные «мозги» — устройства, выполняющие операции не потому, что их физически так на- строили, а потому, что сама логика ра- боты изначально ^строена в структуру их схем. Без этой революционной ра- боты невозможно представить ни одно вычислительное устройство: от первых транзисторных калькуляторов до мощ- нейших чипов в смартфонах. Во время Второй мировой войны те- оретические построения наконец ма- териализовались в работающих маши- нах. Британский «Колосс» взламывал немецкие шифры, созданные на маши- не «Лоренц», а американский ENIAC рассчитывал траектории снарядов. Эти Когда Алан Тьюринг говорил об алгоритмах, он подчеркивал принципиаль- ный момент: это не догадка и не интуиция, а строгая после- довательность шагов, выполняе- мых механически. Алгоритм не тре- бует понимания смысла, поэтому его может испол- нять не человек, а машина
Работы Клода Шеннона сделали логические опе- рации удобными для инженеров. Он показал, что логические «И», «ИЛИ», «НЕ» можно реализо- вать с помощью стандартных электрических элементов и зара- нее рассчитывать поведение схем. Проектирование вычислитель- ных устройств перестало быть экспериментом и стало инженер- ным расчетом устройства занимали целые помеще- ния: один только ENIAC весил 30 тонн, потреблял 174 кВт электроэнергии и содержал 17 468 ламп, которые по- стоянно перегорали. Программирова- ние напоминало тяжелую инженерную работу: приходилось вручную пере- ставлять сотни кабелей, менять пе- реключатели и непрерывно следить, чтобы оборудование выдерживало на- грузку. В этот момент возник вопрос, зву- чавший в то время почти дерзко: если машина умеет вычислять, способна ли она к рассуждению? Если она работа- ет со знаками по заданным правилам, может ли ее поведение хотя бы внеш- не напоминать мышление? На фоне этих дискуссий Джон фон Нейман из- ложил принципы архитектуры, кото- рые впоследствии стали прочно ассо- циироваться с его именем. Они были зафиксированы в документе «Первый проект отчета о EDVAC», опубликован- ном 30 июня 1945 года. Главная идея заключалась в следующем: программа должна храниться в памяти машины, так же как и данные, а не задаваться путем ручной коммутации переклю- чателей и кабелей. Такой подход оз- начал, что машине можно было дать новую задачу простым изменением содержимого ее памяти, без физиче- ской перестройки «железа». Это по- зволило компьютеру выполнять лю- бые алгоритмы, для которых хватало ресурсов, и, по сути, заложило ос- нову универсальной вычислительной
машины. Так компьютеры перестали быть однозадачными устройствами и превратились в гибкие инструмен- ты, способные имитировать все бо- лее сложные формы обработки ин- формации. К 1950 году основные элементы буду- щего ИИ уже существовали в виде те- орий и работающих прототипов: фор- мальная теория вычислений (Тьюринг), логическая основа (Шеннон), физиче- ские машины (ENIAC) и революцион- ная архитектура (фон Нейман). Фун- дамент для искусственного интеллекта был практически собран. Ученые уже понимали, что вычисления можно формализовать, логику — воплотить в электрических схемах, а програм- мы — хранить в памяти машины. Од- нако все это по-прежнему вращалось вокруг чисел, цепей и математических моделей. Не хватало постановки глав- ного вопроса: если машина способна выполнять любые инструкции, насколь- ко далеко может простираться ее по- ведение? Может ли машина не просто считывать, а вести себя таким обра- зом, чтобы хотя бы отдаленно напоми- нать человека? Этот вопрос впервые четко сформули- ровал все тот же Алан Тьюринг, на сеи раз выступив не как математик, иссле- дующий пределы алгоритмов, а как мыслитель, пытающийся определить границы самого понятия «мышление». Его идея, удивительно простая и одно- временно радикальная, стала отправ- ной точкой в истории ИИ. Идея хране- ния программы в памяти сделала вычислительные машины уни- версальными, но принесла и но- вые уязвимости. Программа стала таким же объек- том, как данные: ее можно копи- ровать, изменять и повреждать. Из этой особен- ности позже выросли многие проблемы безо- пасности, с кото- рыми цифровой мир сталкивается до сих пор
Когда Алан Тьюринг пред- ложил свой тест в 1950 году, его меньше всего интересовало, думает ли маши- на на самом деле. Он сознательно уводил разговор от философских определений со- знания и предла- гал практический критерий:если в ограниченном диалоге человек не может отли- чить ответы ма- шины от ответов другого человека, вопрос о мыш- лении теряет прежний смысл ТЕСТ ТЬЮРИНГА: МАШИНА ПРИТВОРЯЕТСЯ ЧЕЛОВЕКОМ В 1950 году в философском журна- ле Mind вышла статья Алана Тьюринга под названием «Вычислительные маши- ны и разум». В ней он поставил вопрос, который в то время звучал вызывающе: может ли машина думать? Однако вме- сто того чтобы увязнуть в бесконечных спорах о значении слова «думать», Тью- ринг предложил заменить этот фило- софский диспут наглядным практиче- ским испытанием. В его основе лежала простая игровая ситуация. Представим, писал Тьюринг, что человек ведет переписку с двумя собеседниками, один из которых явля- ется машиной, а другой — человеком. Оба отвечают текстовыми сообщения- ми, и по внешним признакам их невоз- можно отличить. Если в ходе такого ди- алога машина сможет вести беседу так убедительно, что наблюдатель не смо- жет определить, кто из участников яв- ляется человеком, значит, с точки зре- ния поведения она успешно имитирует разум. Неважно, какие процессы про- исходят внутри ее схем, — зажно лишь то, как это выглядит снаружи. Эта концепция получила название те- ста Тьюринга. Она кардинально перевер- нула представления об интеллекте. Если поведение машины становится неотличи- мым от поведения человека, то в практи- ческом смысле спор о настоящем мышле- нии теряет содержательность. Критики немедленно возразили: а что, если машина лишь искусно имитирует
ответы, не понимая их смысла? Тьюринг отвечал на это спокойно и метко: «А от- куда мы вообще знаем, что другой чело- век что-либо понимает? Мы также можем судить об этом лишь по его внешнему по- ведению». Его подход не отрицал мыш- ление как внутренний процесс, но на- стойчиво указывал на то, что для науки и инженерии наблюдаемое поведение имеет приоритет над неуловимой скры- той сущностью. ТестТьюринга стал первым формаль- ным критерием того, что позднее на- зовут искусственным интеллектом. Он дал исследователям ясную и конкрет- ную цель — создать программу, спо- собную поддерживать осмысленный человеческий диалог. И хотя сегод- ня очевидно, что тест не охватывает всех аспектов разума, он на десятиле- тия нперед определил магистральное направление исследований — от ран- них примитивных чат-ботов до совре- менных сложных языковых моделей. Статья Тьюринга сделала обсуждение мыслящих машин предметом серьез- ного научного и инженерного разго- вора, а не просто философским пара- доксом. Исследователи увидели, что интеллектуальное поведение можно декомпозировать и рассматривать как совокупность технических задач. Од- нако у каждого из пионеров области было свое собственное представление о том, что именно следует считать раз- умом и каким путем к нему следовать. Чтобы прийти к взаимопониманию и определить контуры новой дисциплины, Любопытно, что сам Тьюринг считал обман не недостатком, а естест венной частью теста. Ма- шина не обязана быть честной или глубокомыслен- ной — она долж- на быть убеди- тельной. В этом смысле тест Тьюринга с само- го начала прове- рял не интеллект как таковой, а способность воспроизводить человеческий стиль общения
ПОЧЕМУ ЗАКРЕПИЛОСЬ НАЗВАНИЕ «ИС- КУССТВЕННЫЙ ИНТЕЛЛЕКТ» В середине 1950-х новую область пытались обозначить раз- ными словами: «кибернетика», «теория автома- тов», «обработка информации». Название «искус- ственный интел- лект» оказалось наиболее удоб- ным: под него помещались и ло- гические модели мышления, и ин- женерные идеи про обучение, и эксперименты с языком.Термин был достаточно широким, чтобы не связывать направление с одной конкрет- ной школой или методом ведущим исследователям необходимо было собраться вместе и договориться об общих целях. Такой возможностью и стала знаковая конференция в Дарт- муте летом 1956 года. Именно там роди- лось название новой науки — «искус- ственный интеллект». НОВАЯ НАУКА ПОЛУЧАЕТ ИМЯ Летом 1956 года в Дартмутском кол- ледже, в тихом университетском кам- пусе на северо-востоке США, собра- лась небольшая группа ученых, которые прежде работали порознь, хотя и инте- ресовались смежными вопросами. Ини- циатором этой встречи выступил мо- лодой математик Джон Маккарти. Он полагал, что настал подходящий мо- мент обсудить идеи о мыслящих маши- нах не в отдельных статьях и перепи- ске, а в ходе личного общения за одним столом. Заодно он предложил назва- ние, которое закрепилось мгновенно и навсегда: artificial intelligence — «ис- кусственный интеллект». Организато- рами этого семинара, помимо Маккар- ти, были также Марвин Минский, Клод Шеннон и Натаниэль Рочестер. Эти исследователи верили, что за два летних месяца интенсивной совместной работы можно добиться значимых ре- зультатов. В середине 1950-х годон та- кой оптимизм не казался чрезмерным: компьютеры развивались стремитель- ными темпами, и представлялось, что, если собрать вместе людей с различ- ным опытом, они смогут выработать
общее видение того, как научить ма- шину рассуждать или хотя бы учиться на конкретных примерах. В Дартмут приехали ученые, придер- живающиеся разных подходов. Клод Шеннон, автор теории информации, интересовался тем, как машины могут манипулировать логическими струк- турами. Аллен Ньюэлл и Герберт Сай- мон были создателями одной из первых программ, умеющих выводить матема- тические доказательства. Сам Джон Маккарти в будущем станет автором языка LISP, который превратится в ос- новной инструмент символического ИИ. Дискуссии оказались напряженными, но продуктивными: участникам при- ходилось заново формулировать, что именно следует считать мышлением и какая часть этого процесса подда- ется формализации. Одни видели раз- ум как последовательность логических выводов. Другие — как поиск решений в сложных, неоднозначных ситуациях. Третьи — как способность к обучению и адаптации. К единому ответу тогда так и не пришли, однако стало очевид- но, что рассуждения можно описывать с помощью символов и операций над ними, а значит, есть теоретическая воз- можность передать эту функцию ма- шине. За то лето никто, разумеется, не со- здал «интеллект» в готовом виде, но произошло нечто более фундамен- тальное: оформилось научное сооб- щество и родилась новая область зна- ния, у которой появились собственные Дартмутскую встречу заду- мывали не как конференцию с докладами, а как рабочую сессию. Участ- ники собирались не выступать, а вместе разби- рать конкретные задачи: как научить машину решать голово- ломки, строить планы,учиться на примерах, объяснять соб- ственные шаги. Такой формат был важен: он сразу задавал ИИ как область практического исследования, а не как набор абстрактных рассуждений
Дартмут дал области еще одну важную вещь — внешнюю оформленность. Когда у направ- ления появля- ется устойчивое название и круг исследователей, с ним проще работать инсти- туционально: открывать лабо- ратории, полу- чать финансиро- вание, запускать курсы,собирать команды. Ис- кусственный интеллект стал восприниматься не как разроз- ненные идеи, а как целостное научное поле, с которым можно иметь дело исследовательские вопросы, методы и, что важно, имя. Участники разъеха- лись по своим университетам, но уже со знанием того, что они работают над единой грандиозной задачей — понять, что именно делает поведение разум- ным и как можно приблизить к этому машину. Дело сдвинулось с мертвой точки. И чтобы проверить на практике, на что способны существующие компьютеры, исследователи начали активно соз- давать программы, которые должны были имитировать хотя бы простейшие формы рассуждения — играть в шаш- ки, решать логические головоломки, искать решения, перебирая возмож- ные шаги. ПЕРВЫЕ ПРОГРАММЫ ПРОБУЮТ РАССУЖДАТЬ После Дартмутской конференции разговоры о возможностях ИИ окон- чательно вышли за рамки чистой тео- рии. Чтобы понять реальные границы возможного, требовались наглядные примеры, пусть небольшие, но такие, которые хотя бы отдаленно напомина- ли человеческое рассуждение. Одной из самых первых и знаковых программ стала Logic Theorist («Логи- ческий теоретик»), созданная Алле- ном Ньюэллом и Гербертом Саймоном в 1956 году. Она автоматически выво- дила доказательства некоторых тео- рем из Principia Mathematica — мону- ментального труда Альфреда Норта
Уайтхеда и Бертрана Рассела. Програм- ма методом перебора подбирала цепоч- ки логических шагов и тем самым де- монстрировала способность не просто выполнять вычисления по заданному алгоритму, а активно искать путь к ре- шению. Ньюэлл и Саймон даже утвер- ждали, что в одном из случаев програм- ма нашла более изящное и лаконичное доказательство, чем приведенное у ав- торов оригинала. Этот случай вызвал споры, однако наглядно показал глав- ное: формальную, дедуктивную часть рассуждения действительно можно по- ручить машине. Позже те же исследователи создали программу General Problem Solver (GPS, «Универсальный решатель задач»), ко- торую представили в 1957 году. Она решала задачи, описанные в терми- нах перехода от начального состоя- ния к целевому. Задавались исходная ситуация, желаемая цель и набор до- пустимых действий; программа иска- ла последовательность шагов, которая связывала бы одно с другим. Работа- ла она медленно и лишь на предельно упрощенных моделях, но сам подход — представление решения как движения по «пространству состояний» — лег в основу множества будущих методов искусственного интеллекта. Параллельно начали появляться пер- вые игровые программы. Наиболее за- метной среди них стала программа для игры в шашки, разработанная Артуром Сэмюэлом. Изначально она использо- вала набор четко заданных правил для ЭВРИСТИКИ: КАК МАШИНЫ НАУЧИЛИСЬ СОКРАЩАТЬ ПОИСК Первые про- граммы быстро столкнулись с тем, что прямой перебор вариан- тов не работает: даже в шашках или при доказа- тельстве теорем число возможных ходов растет лавинообразно. Выходом стали эвристики — приближенные правила, которые не гарантируют лучший ответ, но позволяют отбрасывать явно бесперспектив- ные пути и дви- гаться к решению осмысленнее
Logic Theorist был устроен не как обычный вычислительный алгоритм. Он строил рас- суждение шаг за шагом, про- веряя, ведет ли выбранный путь к цели или захо- дит в тупик. Для своего времени это был важный сдвиг: программа не просто испол- няла инструк- ции, а ьыбирала следующий ход в рамках фор- мальных правил логики оценки позиций на доске. Затем Сэмю- эл усовершенствовал ее, добавив воз- можность корректировать оценочные параметры на основе анализа сыгран- ных партий. Программа перестала быть статичной: она действительно начала подстраиваться под стиль противника и улучшала свою игру от партии к пар- тии. По сути, это был один из первых в истории работающих примеров ма- шинного обучения на реальных данных. Разумеется, возможности всех этих программ были крайне ограниченны- ми. Они справлялись только с узкими, специально подготовленными задача- ми, требовали тщательной настройки и давали сбой при малейшем отклоне- нии от ожидаемых условий. Однако ка- ждая из них демонстрировала отдель- ную грань будущего ИИ. Logic Theorist показывала, что рассуждение можно представить как цепочку формальных преобразований. GPS иллюстрировала, что поиск решения аналогичен прокла- дыванию маршрута на карте. Програм- ма Сэмюэла доказывала, что машина мо- жетулучшать свои стратегии, опираясь на накопленный опыт. Исследователям той эпохи даже та- кие скромные результаты казались невероятными и создавали ощущение стремительного, неудержимого про- гресса. Возникала уверенность, что если машины уже умеют хоть немно- го рассуждать, планировать и учиться, то дальше — лишь дело техники: уве- личить объем памяти, повысить быст- родействие процессоров, и ключевая
проблема будет решена. Делались сме- лые, почти футуристические прогнозы о скором появлении автоматического перевода, полноценного диалога с ма- шиной и автоматического доказатель- ства сложнейших теорем. Но через несколько лет стало ясно, что эти ожидания были чрезмерно оп- тимистичными. Реальные, «простые» на первый взгляд задачи оказывались на порядки сложнее лабораторных демонстраций, а первые успехи были не рывком к универсальным мыслящим машинам, а лишь робкими эксперимен- тами, обозначившими начало долгого и тернистого пути. Работы Артура Сэмюэла с ша- шечной програм- мой добавили еще одну ключе- вую идею. Он по- казал, что часть знаний можно не задавать за- ранее, а получать из опыта. Про- грамма коррек- тировала оценку позиций на ос- нове сыгранных партий, постепен- но улучшая ка- чество решений. Это был ранний пример подхо- да, в котором система учится на собственных результатах, а не только сле- дует заданным разработчиком или пользовате- лем правилам
ВЗЛЕТЫ И ПАДЕНИЯ: 1960-1980-е В любой новой технологии мы поначалу переоцениваем ее возможности, а затем болезненно натыкаемся на ее пределы. Герберт Саймон Первые десятилетия активного развития ИИ стали эпохой головокружительных взлетое< и горьких разочарований. Каж- дый успех порождал уверенность, что разумные машины — вопрос ближайших лет, но за эйфорией следовала «зима» — спад интереса и финансирования. К концу 1950-х и в 1960-е годы развитие вы- числительной техники шло столь стреми- тельно, что это воспринималось как прямой путь к решению любых задач. Компьюте- ры становились быстрее и до- ступнее, и каза- лось: если вычис- ления ускоряются такими темпами, то и задачи мышления под- дадутся тому же подходу — шаг за шагом ЭПОХА БОЛЬШИХ ОЖИДАНИЙ: ПОЧЕМУ В 1960-е КАЗАЛОСЬ, ЧТО РАЗУМНЫЕ МАШИНЫ УЖЕ БЛИЗКО В начале 1960-х годов у исследовате- лей ИИ впервые появились программы, которые можно было демонстрировать не только узкому кругу коллег, но и ши- рокой публике. Эти впечатляющие по- казы создавали ощущение, что разум- ные машины — не отдаленная фантазия, а вопрос ближайшего будущего. Компью- тер, отвечающий на ^опросы или пони- мающий текстовые команды, восприни- мался уже не как простой вычислитель, а как нечто принципиально новое. Одним из самых знаковых проектов ста- ла программа SHRDLU, созданная в MIT Терри Виноградом в конце 1960-х. Она су- ществовала в крошечном искусственном мире, населенном кубиками, пирамидами и другими простыми объектами. Пользо- ватель мог написать команду вроде «пе- редвинь зеленый кубик», и программа, разобрав фразу, выполняла действие.
Если формулировка оказывалась дву- смысленной, SHRDLU задавала уточняю- щий вопрос. В границах этой минимали- стичной вселенной программа выглядела поразительно «сообразительной», по- рождая надежды, что достаточно лишь расширить ее мир, и она станет столь же уверенной в реальных условиях. Не меньший резонанс вызвала ELIZA Джозефа Вейценбаума, представлен- ная в 1966 году. Эта программа вела диалог в манере психотерапевта, ма- стерски перефразируя и уточняя ре- плики собеседника. За видимой глу- биной не стояло никакого настоящего понимания — лишь ловкая работа с ша- блонами. Однако людям, впервые уви- девшим интерактивный диалог с ма- шиной, это казалось ошеломляющим шагом к имитации настоящего общения. Параллельно развивались системы машинного перевода. Символическим рубежом стал Джорджтаунский экспе- римент 7 января 1954 года, где публи- ке продемонстрировали перевод более шестидесяти предложений с русского на английский. Сегодня очевидно, что примеры были тщательно подобраны, а сама система работала лишь в идеали- зированных условиях. Но тогда эффект был оглушительным: казалось, что если компьютеры уже справляются с просты- ми текстами, то путь к сложным открыт. Прогресс наблюдался и в создании программ, ищущих решения задач: они перебирали варианты, решали голо- воломки, выводили доказательства. У исследователей крепла уверенность: Оптимизм подпи- тывали нагляд- ные демонстра- ции: короткий диалог, аккурат- но подобранная задача, уверен- ный результат. В таком формате система произво- дила впечатление разумной,хотя за пределами подготовленного примера часто терялась. Возни- кало ощущение близкой побе- ды, тогда как речь шла лишь об удачной по- становке задачи
Важную роль играли и заказ- чики. Военные и государствен- ные структуры вкладывались в ИИ не из ака- демического интереса: им требовались пе- ревод, анализ со- общений, помощь в планировании. Когда ожидания по срокам и каче- ству не оправды- вались, разоча- рование быстро отражалось на приоритетах и финансирова- нии если алгоритм работает в лаборатор- ных условиях,то с ростом вычислитель- ной мощности его можно будет масшта- бировать на задачи любой сложности. Этому оптимизму способствовал и стремительный прогресс в «желе- зе». Компьютеры становились быстрее и доступнее, университеты получали оборудование, еще недавно стоившее миллионы. Возникало ощущение, что технические ограничения вот-вот па- дут. Раз развитие идет такими темпа- ми, значит, и интеллектуальные зада- чи вскоре будут решены. Однако и теперь у большинства про- грамм сохранялся общий фатальный изъян: они работали исключительно в заранее подготовленных, «стериль- ных» условиях. Мир SHRDLU был вы- строен и описан человеком до мело- чей. ELIZA действовала только в рамках своего сценария, а системы перевода не выдерживали малейшего отклоне- ния от учебных примеров. Проблема была не в плохих програм- мах, а в принципиальной невозможности свести бесконечное разнообразие реаль- ного мира к конечному набору правил. В 1960-е это понимали далеко не все. Казалось, стоит лишь подробнее описать мир — пополнить базы знаний, расши- рить словари, прописать связи — и си- стема начнет в нем ориентироваться. Ла- боратории активно занимались именно этим: создавали сложные онтологии и базы данных, которые должны были наделить машину пониманием в ограни- ченных предметных областях.
К концу десятилетия в научных отчетах и публичных выступлениях звучали сме- лые прогнозы. Будущее виделось ясным и близким. Но уже в начале 1970-х ста- ло очевидно, что ожидания были не со- размерны реальности. В неидеальных условиях программы мгновенно стал- кивались с тем, к чему их не готовили. Они терялись перед неоднозначностью, не справлялись с непредусмотренными ситуациями, зависали там, где человек действовал бы интуитивно. Проблему нельзя было решить простым наращи- ванием памяти или скорости: дело было не в мощности, а в том, что повседнев- ный мир оказался невыразимо сложнее любой формальной схемы. Именно в этот момент родилась идея кардинально сузить амбиции. Вместо погони за «общим» интеллектом было решено сосредоточиться на системах, глубоко разбирающихся в одной кон- кретной узкой области — медицине, геологии, диагностике неисправно- стей. Так началась эпоха экспертных систем, которым суждено было на не- сколько лет стать основным символом прогресса в ИИ. ЭКСПЕРТНЫЕ СИСТЕМЫ: ПЕРВЫЕ УСПЕШНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОГРАММЫ В середине 1970-х наиболее влиятель- ной системой стала MYCIN, разработан- ная в Стэнфорде. Эта программа помо- гала врачам диагностировать тяжелые бактериальные инфекции (бактериемию, Что в то время считалось дости- жимым в ближай- шем будущем: • машинный пере- вод для практи- ческого примене- ния; • программы-по- мощники для инженеров и вра- чей; • универсальные системы рассуж- дения; • быстрый переход от лабораторных прототипов к ра- бочим решениям
Экспертные си- стемы строились на правилах вида «ЕСЛИ... ТО...». Так специалисты формализовали типичные при- знаки и решения в своей области. В узких зада- чах этот подход работал: опыт удавалось зафик- сировать и вос- производить. Поэтому такие системы долго воспринимались как первый шаг к практическому искусственному интеллекту менингит) и подбирать антибиотики. MYCIN задавала врачу серию вопро- сов о симптомах, результатах анализов и факторах риска, после чего, используя базу из нескольких сотен правил, выдви- гала гипотезу о возбудителе и предлага- ла схему лечения. В испытаниях ее реко- мендации часто не уступали по качеству заключениям опытных специалистоЕ1. — для 1970-х это было настоящим чудом. Подход быстро распространился. Появились системы для диагности- ки неисправностей в механическом и электронном оборудовании, оценки перспективности геологических участ- ков, планирования химического синте- за. Экспертная система тех времен пред- ставляла собой базу знаний, состоящую из правил вида «ЕСЛИ (условие), ТО (за- ключение)». Считалось, что чем больше таких правил удастся «извлечь» из экс- пертов и формализовать, тем умнее и по- лезнее станет программа. Оптимизм был понятен: впервые в истории компьютеры давали сове- ты, имеющие реальную практическую ценность. Компании начали инвестиро- вать в разработку, в университетах рос- ли профильные лаборатории, а пресса говорила о «втором дыхании» искус- ственного интеллекта. Однако у этого подхода быстро проя- вились серьезные недостатки. Во-пер- вых, процесс сбора знаний оказался мучительно трудоемким. Программи- сты и инженеры часами интервьюиро- вали специалистов, пытаясь перенести их интуицию и опыт в тонкие цепочки
формальных правил. Любая ошибка или пропуск могли привести к сбою. Во-вторых, системы были чрезвычай- но хрупкими. Если ситуация хоть не- много выходила за рамки прописан- ных сценариев, программа терялась. Самое же главное — по мере роста базы правил система становилась все более громоздкой, противоречивой и требо- вала постоянного дорогостоящего об- служивания. Она прекрасно работала в узкой стабильной среде, но стоило лишь слегка сдвинуть границы — и ее полезность резко падала. Экспертные системы все же сыгра- ли ключевую роль в становлении ИИ: они доказали, что в четко определен- ных областях машина может быть очень эффективным помощником. Но они же с предельной ясностью указали на не- преодолимый предел подхода, основан- ного на составлении формальных правил. «ЗИМА» ИИ: СЕРЬЕЗНЫЕ РАЗОЧАРОВАНИЯ Проблемы стали явными, когда экс- пертные системы попытались интегри- ровать в реальные бизнес-процессы. В лабораторных условиях они функци- онировали безупречно, но в хаосе ре- альной работы любой неучтенный па- раметр мог вывести их из строя. Чем сложнее становились базы знаний, тем чаще возникали конфликты между пра- вилами, и инженеры тратили непро- порционально много времени на отлад- ку и поддержку. Стоимость владения Проблемы прояв- лялись довольно быстро. Знания приходилось извлекать у экс- пертов и вруч- ную переводить с набор правил. Любое уточнение усложняло систе- му, а поддержка со временем становилась все более трудоем- кой. Масшта- бировать такой подход оказалось значительно сложнее, чем предполагалось
УДАР ПО ФИНАН- СИРОВАНИЮ Отчет ALPAC 1966 года стал переломным моментом для машинного пере- вода. Комиссия пришла к выводу, что качество не растет, а за- траты и сроки не оправдывают ожиданий. После этого финанси- рование в США было заметно сокращено. Стало ясно: эффектные демонстрации еще не означают работоспособную технологию такими системами росла, а отдача сни- жалась, что привело к закрытию ряда громких и дорогих проектов. Это рез- ко охладило пыл инвесторов. Параллельно случился крах в другой многообещающей области — машинном переводе. После впечатляющей демон- страции 1954 года энтузиазм был высок, но стоило выйти за пределы учебных фраз, как системы начинали выдавать бессмысленные или комичные перево- ды. Они не справлялись с многозначно- стью слов, идиомами, грамматическими нюансами. Разрыв между рекламными обещаниями и жалкой реальностью стал настолько вопиющим, что в 1966 году специальный комитет ALPAC (Automatic Language Processing Advisory Committee) пришел к выводу: автоматический пере- вод ненадежен, непрактичен и не стоит государственного финансирования. По- следовало резкое сокращение поддерж- ки таких исследований в США. Похожая участь постигла и диало- говые системы. Пока разговор велся по заданному сценарию, все было хоро- шо. Но стоило пользователю отклонить- ся от темы или использовать неожи- данную формулировку, как программа выдавала абсурд. Спало окончательно ясно, что человеческий язык — это жи- вой, контекстно-зависимый организм, а не набор статичных шаблонов. В профессиональном сообществе на- растало разочарование. Если в 1960-е казалось, что до цели не хватает лишь нескольких деталей, то теперь прихо- дилось признать: выбранный путь ведет
в тупик. Чем сложнее и «человечнее» была задача, тем быстрее подход, ос- нованный на формальных правилах, ис- черпывал себя. Так наступила эпоха, известная как «зима искусственного интеллекта»,— период, когда рухнули ожидания, ис- сякло финансирование, лаборатории закрывались, а исследователи массо- во уходили в другие области. Истори- ки обычно выделяют две такие «зимы»: первую — в 1974-1980 годах, вто- рую — около 1987-1993 годов. Ранним предвестником холодов можно считать как раз отчет ALPAC 1966 года. В Великобритании сильным ударом стал пессимистический отчет Лайтхил- ла (1973). Для ИИ это было болезненно, потому что кризис ударил одновремен- но по всем основным фронтам. Однако работа не остановилась пол- ностью. Она просто ушла вглубь, сме- стившись от громких прикладных проектов к тихим фундаментальным исследованиям, не сулящим быстрой славы. В этой интеллектуальной тени вызревали идеи, которым через два де- сятилетия было суждено вывести ИИ на новый, на этот раз куда более устой- чивый, виток развития. ТИХАЯ РАБОТА В ТЕНИ: ИДЕИ, СТАВШИЕ ФУНДАМЕНТОМ БУДУЩЕГО Пока одни ученые хоронили большие проекты, другие упорно продолжали работу над теориями, казавшимися бес- перспективными в практическом плане. «Зима» ИИ была следствием нако- пившихся ограни- чений. Програм- мы машинного перевода плохо справлялись с реальными текстами, диало- говые системы ломались при отклонении от сценариев. Выяснилось, что пробле- ма не только в вычислитель- ной мощности: действительность слишком сложна для простых фор- мальных схем
ПЕРЕМЕНЧИВАЯ МОДА В 1970-1980-е годы нейросети вышли из моды, но не исчезли. Исследователи продолжали искать способы обучать много- слойные модели, хотя прогресс был медленным: не хватало дан- ных и вычисли- тельных ресур- сов. Эти работы редко привле- кали внимание, но сохраняли ключевые идеи Их исследования не попадали на пер- вые полосы, но именно они заложили основу для революции конца XX века. Одним из таких направлений были нейронные сети. В 1969 году Мар- вин Минский и Сеймур Паперт в книге «Перцептроны» математически дока- зали ключевые ограничения простей- шей однослойной сети (перцептрона). Такая сеть могла решать лишь задачи, где классы объектов линейно раздели- мы. Поскольку большинство реальных проблем требовало проведения слож- ных, нелинейных границ,многие сдела- ли вывод, что нейронные сети — тупи- ковая ветвь. Интерес к ним почти угас. Но небольшая группа энтузиастов продолжала верить в потенциал мно- гослойных сетей. Они интуитивно по- нимали, что каждый новый слой может выявить все более абстрактные и слож- ные закономерности в данных. Главной нерешенной проблемой оставалось об- учение таких структур. Прорывом стал алгоритм обратного распространения ошибки (backpropogatiori), детально опи- санный в 1986 году. Его идея была гени- альна в своей простоте: если сеть ошиб- лась, можно вычислить вклад каждого нейрона и каждой связи в эту ошибку и скорректировать их ровно настоль- ко, чтобы в следующий раз вероятность ошибки уменьшилась. Сегодня это осно- ва любого глубинного обучения (deep learning), но тогда метод казался вы- числительно неподъемным. Тем не ме- нее так был заложен краеугольный ка- мень для будущего развития.
Параллельно развивались вероят- ностные методы и байесовские модели. В отличие от жесткой логики эксперт- ных систем, эти подходы признавали мир неопределенным и учились рабо- тать с вероятностями, а не с бинарны- ми истинами. Это стало фундаментом статистического машинного обучения, способного извлекать знания из «за- шумленных» реальных данных. Не стояли на месте и алгоритмы по- иска, оптимизации и планирования. Разрабатывались более эффективные методы нахождения маршрутов, опти- мальных решений и последовательно- стей действий в сложных средах. Эта, казалось бы, сугубо техническая рабо- та позже легла в основу навигации ав- тономных роботов и интеллектуальных систем управления. Объединяющей чертой всех этих «теневых» направлений был отказ от парадигмы явного программирова- ния знаний. Вместо того чтобы вруч- ную прописывать правила, исследо- ватели искали способы, позволяющие системе самостоятельно находить за- кономерности через статистический анализ данных и итеративную кор- рекцию. Со стороны могло показаться, что ИИ погрузился в спячку. Но в тишине ла- бораторий формировался новый науч- ный и инженерный фундамент, который оказался достаточно прочным, чтобы через два десятилетия выдержать вес новой, уже не виртуальной, а самой что ни на есть реальной революции. Когда в 2000-х и 2010-х появи- лись большие наборы данных и выросли вычис- лительные воз- можности, преж- ние наработки сразу оказались востребованы. Вместо пред- варительного задания правил стало возможно обучать системы на примерах. Прорыв выгля- дел внезапным, но на самом деле опирался на дол- гую незаметную подготовку
К. Б. Франке. Портрет Готфрида Вильгельма Лейбница. Ок. 1695 г. Музей герцога Антона Ульриха, Брауншвейг. Г. В. Лейбниц (1646-1716) — немецкий ученый и философ, зало- живший основы формальной логики и двоичной системы счисле- ния, важных для вычислений и искусственного интеллекта
Чарльз Бэббидж (1791-1871). Фото ок. I860 г. Английский математик и изобретатель, автор проекта анали- тической машины, ставшей концептуальной предшественни- цей программируемых компьютеров и современных идей ис- кусственного интеллекта
НАКОНЕЦ ВСЕ ЗАРАБОТАЛО: 1990-2010-е Когда метод наконец начинает работать, он кажется очевидным. До этого момента он выглядит невозможным. Джеффри Хинтон Долгое время ИИ оставался прекрасной теорией с блестя- щим будущим и весьма скромными практическими достиже- ниями. Ситуация изменилась кардинально, когда сошлисьтри ключевых фактора: появились огромные массивы данных, вычислительная мощность стала доступной, а ученые раз- работали эффективные инженерные методы обучения мо- делей. Тогда ИИ превратился из академической дисципли- ны в технологию, приносящую осязаемую пользу. ДАННЫЕ КАК ОГРАНИЧЕНИЕ К концу 1990-х стало ясно, что трудности ИИ связаны не толь- ко с алгорит- мами. Даже простые методы показывали лучший резуль- тат, если обуча- лись на большем объеме данных. И вместо вопроса «как рассуждать» на первый план вышел вопрос «на чем учиться» КОГДА ДАННЫХ СТАЛО СЛИШКОМ МНОГО До 1990-х годов данные были скорее дефицитным ресурсом, чем доступным сырьем. Компьютеры работали с не- большими наборами текстов и изобра- жений, которые исследователи зачастую собирали и подготавливали вручную. Примеры в учебниках по ИИ той поры нередко казались слишком упрощен- ными — не потому, что ученым нрави- лись «игрушечные» задачи, а потому что других вариантов просто не существо- вало. Для нейросетей же отсутствие больших размеченных наборов приме- ров становилось почти приговором: что- бы чему-то по-настоящему научиться, им были необходимы тысячи, а в идеа- ле — миллионы разнообразных случаев.
Интернет изменил все. Если в начале он напоминал некую цифровую библио- теку — коллекцию страниц, которые кто- то публиковал, а кто-то просматривал, то в начале 2000-х он стремительно пре- вратился в гигантское пространство, где фиксировалось почти каждое действие человека. Поисковые системы начали со- бирать и хранить миллиарды запросов. Электронная почта, форумы и блоги ста- ли копить живую, естественную речь. Со- циальные сети принесли с собой лавину фотографий, коротких сообщений, лай- ков и репостов. А смартфоны добавили к этому потоку данные о передвижении, координаты, временные метки и бесчис- ленные снимки всего подряд — от до- машних питомцев до уличных сцен. Каж- дое действие, которое раньше исчезало без следа, теперь стало оставлять чет- кий цифровой отпечаток: что человек написал, что увидел, что сфотографи- ровал, какой выбор сделал, куда пошел, на что кликнул. Для языковых моделей ценным ока- залось не столько содержание частных переписок, а то, как люди в массе сво- ей формулируют собственные мысли: какие слова ставят рядом, как строят фразы, как переключаются между тема- ми. Для рекомендательных алгоритмов ключевой стала история персонального выбора: что пользователь посмотрел, что пролистал, на чем остановился. Для компьютерного зрения — милли- оны разномастных «сырых» снимков, сделанных в самых разных, далеких от идеала условиях: в темноте, на ярком Рост объемов данных был вызван не разви- тием ИИ, а рас- пространением интернета. Поис- ковые системы, электронная почта, цифровые архивы и корпо- ративные базы создали массивы текстов, изобра- жений и логов, которые раньше не существовали как единый мате- риал для анализа
Что изменилось с приходом боль- ших данных: • модели стали обучаться на больших массивах реальных данных, а не на вручную прописанных знаниях и исклю- чениях; • отдельные ошиб- ки перестали быть критичными при большом объ- еме данных; • улучшение каче- ства стало посте- пенным процес- сом, а не редкими прорывами солнце, на ходу, под случайным углом, с помехами. Важно было не только беспрецедент- ное количество, но и принципиаль- но новое разнообразие данных. Если раньше набор для обучения компьютер- ного зрения мог состоять из нескольких сотен аккуратных фотографий объек- та на однотонном фоне, то теперь по- явилась возможность собрать десятки миллионов реальных снимков — с ви- зуальным шумом, пальцем, попавшим в кадр, бликами, случайными прохожи- ми на заднем плане. Такая неидеальная, хаотичная среда оказалась для обуче- ния неизмеримо полезнее стерильных лабораторных условий: сеть училась распознавать объекты не по тому, как они выглядят в учебнике, а так, как они существуют в реальной жизни. Параллельно этому стихийному про- цессу стали появляться и большие от- крытые наборы данных, созданные специально для исследовательских целей. Самый известный и значимый из них — ImageNet, гигантская коллек- ция фотографий, размеченных по де- сяткам тысяч категорий. Его значение заключалось не только в огромном объ- еме, но и в создании общего стандар- та, возможности честно и объективно сравнивать методы разных научных групп. Теперь любой исследователь в любой точке мира мог проверить, как его модель справляется с одним и тем же, неизменным массивом реаль- ных изображений, а не с тщательно по- добранными примерами.
К середине 2000-х стало очевидно: объем и разнообразие доступных дан- ных выросли настолько, что прежние фундаментальные ограничения ИИ пе- рестали быть абсолютными. Нейросе- ти, которые еще десять лет назад не де- монстрировали ничего впечатляющего, теперь получили возможность учиться, причем очень быстро. Ежесекундно за- гружаемая в сеть информация служила отличным сырьем, на котором модели могли расти, усложняться и постепен- но приближаться к тому, что мы услов- но называем «пониманием». КАК ВИДЕОКАРТЫ ДЛЯ ИГР СТАЛИ «ДВИГАТЕЛЕМ» ИИ Во второй половине 2000-х годов у нейросетей появилась мощная тех- нологическая опора — практически неограниченные вычислительные ре- сурсы. И источник этой мощи оказал- ся неожиданным: им стали игровые ви- деокарты, созданные для рендеринга красивой трехмерной графики в играх, а не для сложных научных расчетов. Чтобы понять, почему они так иде- ально подошли для задач ИИ, необхо- димо взглянуть на механизм их функ- ционирования. Графический процессор (GPU) — это специализированный чип, состоящий из множества (сотен и ты- сяч) относительно простых вычисли- тельных ядер, способных одновременно и массово выполнять простые ариф- метические операции. Такая парал- лельная архитектура была необходима Видеокарты создавались для обработки графики в ком- пьютерных играх, но их архитекту- ра неожиданно подошла для обучения нейро- сетей. Возмож- ность выполнять тысячи однотип- ных операций параллельно оказалась именно тем, что нужно для работы с ма- трицами и пара- метрами моделей
В середине 2000-х годов исследователи начали исполь- зовать GPU для научных расче- тов. Это не было заранее сплани- рованным шагом: индустрия раз- влечений факти- чески заложила вычислительную основу будущего прогресса в ИИ в играх: чтобы рассчитать цвет, свет, тень и текстуру для каждого из мил- лионов пикселей на экране, требуются колоссальные объемы однотипных вы- числений, выполняемых одновременно. Оказалось, что процесс обучения ней- росетей устроен очень похожим обра- зом. Он представляет собой выполне- ние гигантского объема однотипных математических действий: перемно- жения и сложения матриц, вычисле- ния производных. Это не интеллекту- альная, а чисто механическая работа, которую крайне выгодно выполнять па- раллельно, задействуя тысячи ядер од- новременно. Центральные процессоры (CPU), яв- ляющиеся основой обычных компью- теров, прекрасно справляются с раз- нообразными последовательными задачами, требующими сложного вет- вления логики, но для массовых па- раллельных вычислений они слишком медлительны и неэффективны. GPU же выполняли такие операции на порядок быстрее, и, что критически важно, не- сколько видеокарт можно было относи- тельно легко объединить в общую вы- числительную систему. Ситуация качественно изменилась, когда компания Nvidia представила программно-аппаратную архитектуру параллельных вычислений CUDA, кото- рая существенно упростила использо- вание вычислительных мощностей ви- деокарт для задач общего назначения. Теперь программист мог написать про- грамму, которая заставляла видеокарту
считывать не игровую графику, а мате- матические матрицы и градиенты, не- обходимые для обучения нейросети. Этот технологический прорыв со- впал по времени со взрывным ростом объемов данных. У ученых впервые в истории появилась реальная воз- можность обучать сложные модели не на сотнях или тысячах, а на милли- онах и миллиардах примеров — и де- лать это не за месяцы, а за дни или даже часы. Там, где кластеру из тра- диционных CPU требовалась неделя, система из нескольких GPU справля- лась за несколько часов. Позже появились и специализирован- ные ускорители для ИИ, и серверные решения с десятками GPU, и облачные платформы для их аренды. Однако пе- реломным моментом стал сам переход от парадигмы последовательной обра- ботки к массовому параллелизму, реа- лизованному в доступном потребитель- ском «железе». Существенную роль сыграла и про- стая рыночная логика: суперкомпью- теры строят редко и стоят они дорого, а мощные игровые видеокарты выпу- скаются миллионами штук ежегодно, и с каждым новым поколением они становятся доступнее и мощнее. Бла- годаря этому исследователи по все- му миру получили в свое распоряже- ние огромную вычислительную мощь, не дожидаясь очереди на уникальное оборудование в национальных центрах и не выпрашивая отдельные многомил- лионные гранты на вычисления. Переход на ви- деокарты резко сократил время экспериментов. Задачи, которые раньше счита- лись слишком дорогими или медленными, стали выпол- няться в рабочем режиме. Это из- менило сам стиль исследований: вместо долгих теоретических споров пояьились быстрые итера- ции и проверка идей на практике
Рост вычисли- тельной мощно- сти сам по себе не сделал ИИ умнее. Он лишь позволил ис- пользовать более крупные модели и больше данных. Повышение каче- ства стало след- ствием масштаба, а не появления принципиально новых концепций Такое уникальное сочетание — мас- совая доступность, архитектура,зато- ченная под параллельные операции, и относительно простая среда програм- мирования — сделало видеокарты иде- альным, хотя и неожиданным, двигате- лем для революции в ИИ. Созданные для развлечений, они оказались на- много полезнее — быстрым, эффек- тивным и экономичным способом об- работки гигантских объемов простых вычислений. Когда данные стали измеряться в тера- байтах и петабайтах,а вычислительная мощность видеокарт — в терафлопсах, нейросети наконец получили ту сре- ду, где их можно было обучать по-на- стоящему, на полную мощность. Оста- вался последний, но столь же важный элемент — алгоритмические идеи и ар- хитектуры, способные эффективно ис- пользовать эти новые возможности. ГЛУБОКИЕ СЕТИ: ЧТО ИЗМЕНИЛОСЬ ПО СРАВНЕНИЮ СО СТАРЫМИ МОДЕЛЯМИ Первые нейросетевые модели сере- дины XX века, такие как перцептрон, были устроены предельно просто: один входной слои, принимающий данные, и один выходной, выдающий ответ. Та- кая модель могла решать лишь элемен- тарные, линейно разделимые задачи. Однако для решения реальных про- блем, например распознавания руко- писной цифры на фото, идентифика- ции животного или понимания смысла
фразы, требуются гораздо более слож- ные, нелинейные и многоуровневые за- висимости. Идея многослойных, или глубоких се- тей, где несколько последовательных слоев нейронов преобразуют информа- цию шаг за шагом, возникла в научном сообществе довольно рано. Исследова- тели понимали интуитивно: если пер- вый слой может выделять простейшие признаки (например, границы или углы на изображении), то следующий слой может собрать из этих признаков бо- лее сложные формы (линии, дуги, тек- стуры), а последующие слои — соста- вить из этих форм целые объекты или даже сцены. С каждым таким слоем мо- дель переводила исходные сырые дан- ные на новый, более высокий уровень абстракции. Однако долгое время эта идея оста- валась преимущественно теоретиче- ской возможностью. Главной практи- ческой проблемой было эффективное обучение таких глубоких сетей. Мно- гослойная модель содержит огромное, подчас астрономическое количество внутренних параметров — небольших числовых коэффициентов (весов), ко- торые и определяют ее поведение. Если хотя бы часть этих параметров настроена неправильно, итоговый ре- зультат работы всей сети оказывается бессмысленным. Подобрать удачную комбинацию вручную, методом проб и ошибок, было совершенно невозмож- но — слишком велико пространство возможных вариантов. ПОЧЕМУ ГЛУ- БОКИЕ СЕТИ ОКАЗАЛИСЬ РЕШАЮЩИМИ Ранние нейросе- ти существовали уже несколько десятилетий, но обычно состояли из од- ного-двух слоев и быстро упи- рались в предел своих возмож- ностей. Перелом произошел, когда стало ясно: не- сколько уровней обработки под- ряд позволяют модели посте- пенно перехо- дить от простых деталей к слож- ным структурам, не опираясь на заранее за- данные правила и признаки
Идея многослой- ных нейросетей не была новой. О них писали еще в 1980-х, но тог- дашние ком- пьютеры просто не справлялись с объемом вы- числений. Такие модели считались теоретически интересными, но практически бесполезны- ми. Их «второе рождение» стало возможным толь- ко спустя деся- тилетия, когда вычислительные мощности вырос- ли многократно Метод послойного исправления оши- бок, известный как обратное распро- странение ошибки (JjackpropagatiorT), был впервые описан еще в 1974 году (и позже, в середине 1980-х, получил широкую известность и развитие). Он работает по следующему логическому принципу: 1. Сеть делает предсказание на осно- ве входных данных. 2. Это предсказание сравнивается с известным верным ответом, и вы- числяется величина ошибки. 3. Затем эта ошибка «распространяет- ся» назад по сети, от выходного слоя к входному, при этом вычисляется, насколько каждый конкретный па- раметр (вес) каждого нейрона по- влиял на итоговую ошибку. 4. Наконец все параметры корректиру- ются ровно настолько, чтобы в сле- дующий раз при тех же входных дан- ных результат стал чуть точнее. Таким образом, сеть учится постепен- но — через бесчисленные повторения и мелкие исправления. Идея была чрезвычайно перспектив- ной, но вычислительные мощности того времени не позволяли реализовать ее в полной мере для действительно глу- боких архитектур. Сеть с парой слоев и сотнями параметров — возможно. Но для глубоких архитектур с десят- ками слоев требовались уже миллио- ны параметров. На компьютерах 1980-х и 1990-х годов обучение таких моделей превращалось в практически бесконеч- ный процесс: модель могла неделями
работать на одном наборе данных, не достигая сколько-нибудь значимо- го или полезного результата. Все изменилось с появлением двух внешних факторов — мощных парал- лельных видеокарт (GPU) и большо- го объема разнообразных данных. Как уже было сказано ранее, GPU по- зволяли выполнять миллионы и милли- арды однотипных операций, необходи- мых для обратного распространения, параллельно, что идеально подходи- ло для математики глубоких сетей, а огромное количество разнородных данных предоставляли не синтетиче- ские, а реалистичные примеры, на ко- торых сеть могла учиться распознавать сложные образы и связи. И то, что еще недавно считалось ту- пиковым направлением, неожиданно заработало с ошеломляющей эффек- тивностью. Глубокие сети начали де- монстрировать возможности, абсолютно недоступные прежним «мелким» моде- лям. Главное принципиальное отличие заключалось в том, что они перестали зависеть от признаков, заранее приду- манных и выделенных человеком. Рань- ше разработчик или исследователь сам должен был решить, что является важ- ным признаком для задачи: например, угол наклона линий для распознавания цифр или расстояние между глазами для детекции лиц. Машина получала эти го- товые «инженерные» признаки на вход и могла лишь их комбинировать. Глубокие сети поступили принци- пиально иначе. Они научились самосто- Долгое время главной пробле- мой оставалось обучение. При увеличении числа слоев сеть переставала кор- ректно обновлять свои параме- тры, и обучение фактически ломалось. Новые методы настрой- ки и обучения позволили ста- бильно работать с моделями, состоящими из десятков уров- ней, что ранее считалось почти недостижимым
Глубокие сети изменили и роль человека в раз- работке. Вме- сто того чтобы описывать, какие именно признаки важны, иссле- дователь задает общую структуру, а модель сама выстраивает внутренние представле- ния — от про- стых элементов к более сложным и абстрактным уровням описа- ния ятельно вычислять иерархию призна- ков, наиболее полезных для решения конкретной задачи. Например, в слу- чае сверточной сети для распознава- ния изображений: • первый слой отмечает простейшие перепады яркости, то есть контуры и края; • второй слой, анализируя комбина- ции этих контуров, выделяет более сложные формы: линии, углы, изги- бы, пятна; • третий слой комбинирует эти формы в части узнаваемых объектов: ухо, ко- лесо, крыло, окно; • четвертый и последующие слои со- бирают части в целые объекты: кош- ку, автомобиль, здание; • самые глубокие слои могут анализи- ровать контекст, в котором эти объ- екты встречаются. Это не умозрительная теория — имен- но так и работают современные сети, что неоднократно подтверждалось экс- периментами по визуализации их вну- тренних, скрытых слоев. Глубина при- дала моделям принципиально новую способность к постепенному понима- нию — не в философском, а в сугубо практическом статистическом смысле: каждый слой добавляет свой уровень абстракции, и в итоге сеть начинает улавливать сложные закономерности, которые человек-наблюдатель может даже не осознавать или не замечать. Еще одно важнейшее отличие — практически неограниченная мас- штабируемость. Если ранние методы
машинного обучения хорошо работа- ли на сотнях или тысячах примеров, то глубокие сети не только справляют- ся с миллионами и миллиардами при- меров, но и их качество продолжает расти по мере увеличения объема дан- ных и вычислительных ресурсов. Чем богаче и разнообразнее опыт, тем точ- нее и устойчивее становится модель. Это резко контрастирует с парадигмой экспертных систем 1970-1980-х годов, когда добавление каждого нового пра- вила лишь усложняло систему, замед- ляло ее работу и увеличивало число внутренних противоречий. В итоге глубокие сети стали тем не- достающим звеном, которое позволи- ло эффективно и с синергией исполь- зовать оба компонента: большой объем данных и мощные параллельные вычис- ления. Данные предоставили возмож- ность собрать достаточный опыт, GPU сделали обработку этого опыта воз- можной за разумное время, а глубина архитектуры позволила машине извле- кать из данных сложные иерархиче- ские закономерности, а не просто за- поминать поверхностные шаблоны. Без этой триады — данных, GPU и глубоких сетей — современный ИИ в том виде, в каком мы его знаем, не смог бы воз- никнуть. НЕЙРОСЕТИ НАУЧИЛИСЬ ВИДЕТЬ, СЛЫШАТЬ И РАЗБИРАТЬ ТЕКСТ Когда глубокие сети в целом до- казали свою эффективность, перед Глубокие сети не понимают мир в челове- ческом смысле. Они научились лучше улавливать сложные связи в данных и делать более точные прогнозы.Это не философский прорыв, а ин- женерный, и он сделал современ- ные ИИ-системы практичными и массово приме- нимыми
Компьютерное зрение долго считалось почти недостижимой задачей. Про- рыв произошел, когда изображе- ния перестали воспринимать как сцены с объек- тами, а начали обрабатывать как числовые массивы. Нейро- сеть шаг за шагом училась выделять контуры, формы и устойчивые ви- зуальные струк- туры без явных инструкций исследователями встала новая мас- штабная задача — адаптировать общую идею глубины и обучения к радикально разным типам данных. Изображение — это двумерная сетка пикселей, облада- ющая пространственной локальностью (близкие пиксели связаны). Речь — это одномерная волна, превращенная в по- следовательность чисел, где важен вре- менной контекст. Текст — это цепочка слов или символов, где смысл зачастую зависит от связей между элементами, иногда отстоящими далеко друг от дру- га в предложении. Для эффективной работы с таким разнообразием стали появляться и бурно развиваться специ- ализированные архитектуры нейрон- ных сетей. Хотя внешне и математиче- ски они различаются, все они следуют одному общему принципу глубокого обучения: шаг за шагом, слой за сло- ем извлекать из данных иерархиче- ские закономерности, которые чело- век схватывает интуитивно. Прорыв в анализе изображений со- вершили сверточные нейронные сети (Convolutional Neural Networks, CNN). Их ключевая архитектурная идея — использование небольших одинако- вых фильтров (ядер свертки), которые «скользят» по всему входному изобра- жению и локально выделяют повторя- ющиеся паттерны. Сначала такие филь- тры в процессе обучения сами учатся замечать простейшие элементы: грани- цы, углы, цветные пятна. Затем из ак- тиваций простых элементов на следую- щем слое составляются более сложные
формы — линии, дуги, простые тексту- ры. На следующих уровнях сеть уже распознает части объектов: глаз жи- вотного, колесо автомобиля, дверную ручку. В конце концов на самых глубо- ких слоях формируется целостный, ос- мысленный образ: кошка, машина, че- ловеческое лицо. Такая иерархическая обработка позволила машине вперЕ-ые видеть не просто как набор отдельных пикселей, а как структурированную сцену со смыслом, и сделала возмож- ным надежное распознавание объектов на реальных, зашумленных фотографи- ях, с плохим освещением, сложным фо- ном и артефактами. Обработка речи и других времен- ных последовательностей долгое вре- мя требовала другого подхода. Здесь ключевым был учет порядка и контек- ста. Для таких задач изначально ши- роко применялись рекуррентные ней- ронные сети (Recurrent Neural Networks, RNN), в частности их усовершенство- ванные варианты вроде LSTM (Long Short-Term Memory). Они обрабатыва- ли сигнал строго по порядку, шаг за ша- гом, сохраняя в своей внутренней памя- ти информацию о предыдущих шагах. Это позволяло улавливать зависимости во времени: например, согласовывать слова в предложении, учитывать инто- национный контур речи или предска- зывать следующее значение в финан- совом ряде. Однако у таких сетей был серьезный недостаток: с ростом длины анализируемой последовательности им становилось все сложнее удерживать Речь и музыка перестали рас- сматриваться как особые сигналы, требующие уни- кальных мето- дов. Их начали представлять в виде чисел и обрабатывать теми же алгорит- мами, что и изо- бражения. Это резко упростило распознавание речи и анализ аудиопотоком
Ключевым вы- водом стало то, что текст, звук и изображение можно описывать единым матема- тическим языком. Различие между ними оказалось не принципи- альным, а тех- ническим. Это понимание подго- товило почву для систем, которые работают сразу с несколькими типами данных и корректно использовать контекст из далекого прошлого — они начина- ли «забывать» то, что было в начале. Это ограничивало качество распозна- вания длинной связной речи и созда- вало проблемы в машинном переводе больших текстов. Подлинный перелом произошел с по- явлением в 2017 году архитектуры «трансформер» (Transformer). Ее глав- ное и революционное новшество — ме- ханизм внимания (attention), в част- ности самовнимания (self-attention). В отличие от рекуррентных сетей, трансформер не обязан идти по тек- сту или последовательности строго по порядку. Вместо этого он имеет воз- можность одновременно (параллель- но) анализировать все элементы по- следовательности (например, все слова в предложении) и вычислять, насколь- ко определенный элемент важен для понимания каждого следующего эле- мента. Трансформеры решили сразу две ключевые проблемы предыдущих архи- тектур. Во-первых, они оказались иде- ально масштабируемыми на гигантских объемах текстовых данных: чем боль- ше и разнообразнее текстовая база для обучения, тем более тонкие и точные семантические связи они могут выяв- лять. Во-вторых, их архитектура лег- ко масштабируется технически: можно практически безгранично увеличивать число слоев (глубину) и параметров (ширину) модели, и ее качество при этом продолжает предсказуемо расти.
Трансформеры легли в основу всех со- временных гигантских языковых моде- лей, таких как GPT и BERT. ПЕРВЫЕ НАСТОЯЩИЕ УСПЕХИ Когда глубокие сети и их специализи- рованные архитектуры освоили рабо- ту с разными типами данных, их первые серьезные достижения начали прояв- ляться не столько на страницах науч- ных журналов, сколько в повседневной цифровой практике миллионов пользо- вателей. Многие люди даже не догады- вались, что в их карманных телефонах, веб-браузерах и домашних устройствах работают сложные нейросетевые моде- ли. Так ИИ окончательно перестал быть академическим экспериментом и пре- вратился в массовый рабочий инстру- мент. Одной из первых и самых заметных областей, где этот переход стал очеви- ден для всех, был машинный перевод. До начала 2010-х годов он в основном строился на комбинации ручных линг- вистических правил и статистических методов: системы сопоставляли слова и фразы по заранее составленным сло- варям и сложным статистическим алго- ритмам, но результат часто распадался, как только исходный текст хоть немно- го отклонялся от привычных шаблонов. Переводы получались механическими, неприменимыми в повседневной жизни, а иногда и просто курьезными. Ситуация изменилась радикально, ког- да крупные технологические компании, Глаьным отли- чием глубоких сетей стало количество уровней обра- ботки. Каждый следующий слой работает не с сы- рыми данными, а с результатами предыдущего анализа.Это по- зволяет системе постепенно пе- реходить от про- стых элементов к более слож- ным — от линий к формам, от зву- ков к словам
Ранние ней- росети часто ломались при малейших изме- нениях входных данных. Глубокие архитектуры оказались устой- чивее: они лучше справляются с шумом, иска- жениями и вари- ативностью, что особенно важно для работы с ре- альными, а не ла- бораторными данными и в первую очередь Google, начали вне- дрять нейросетевые модели перевода в своих публичных сервисах. В 2016 году IT-гигант представил систему Google Neural Machine Translation (GNMT) и ини- циировал поэтапный, но быстрый пе- реход всего сервиса «Google Перевод- чик» с прежних статистических методов на новую нейросетевую архитектуру. Разница для пользователей стала за- метна практически сразу: перевод це- лых предложений и абзацев зазвучал гораздо естественнее и грамотнее, мно- гозначные слова стали намного точнее попадать в контекст, практически исчез- ли грубые грамматические ошибки, ха- рактерные для старых систем. Параллельно, примерно в те же годы, произошел качественный прорыв в об- ласти распознавания речи. Ранние го- лосовые интерфейсы, .строенные в телефоны или автоответчики, были вежливыми, но на практике почти бес- полезными. Они понимали только уз- кий, заранее заученный набор жестких команд и «ломались» на любом неожи- данном слове или акценте. Глубокие сети, обученные на огромных архивах реальных аудиозаписей человеческой речи, впервые позволили системе вос- принимать речь не как набор изоли- рованных команд,а как непрерывный поток живых, вариативных звуков, из которого нужно в реальном време- ни извлекать смысл. Когда компании вроде Apple (Siri), Google (Google Assistant) и Amazon (Alexa) внедрили такие модели в свои
голосовые помощники, последние пе- рестали быть просто технологической игрушкой. Они научились с приемлемой точностью распознавать разные акцен- ты и диалекты, различать созвучные слова, понимать смысл относительно длинных и свободных фраз-запросов. До идеала, разумеется, было еще да- леко, но впервые в истории появилась возможность общаться с электронным устройством почти так же, как с чело- веком, — пусть и на самом простом, бы- товом уровне. В компьютерном зрении перелом- ный момент наступил после знако- вого конкурса ImageNet Large Scale Visual Recognition Challenge (ILSVRC). В 2012 году победу в этом соревнова- нии с огромным отрывом одержала глу- бокая сверточная сеть AlexNet, разра- ботанная Алексом Крижевским, Ильей Суцкевером и их коллегами под руко- водством Джеффри Хинтона. Это был не просто новый рекорд точности, а на- стоящий сдвиг парадигмы в научном со- обществе: стало окончательно ясно, что глубокие нейросетевые архитектуры способны решать задачи распознава- ния объектов на фотографиях с точно- стью, которая прежде считалась недо- стижимой для машин в принципе. Практическое применение таких мо- делей нашлось почти мгновенно. Ал- горитмы автоматической сортировки фотографий в галереях смартфонов по лицам друзей и членов семьи, функ- ции «умного» поиска по фото, систе- мы автоматической фокусировки камер Распростра- ненный упрек в адрес глубо- ких сетей — их «непрозрач- ность». Однако на практике эго означало не от- сутствие логики, а сложность ее описания просты- ми правилами. Вместо цепочек условий систе- ма использует распределенные представления, которые трудно перевести на че- ловеческий язык
Глубокие сети не были одним открытием. Это результат накопления идей, экспериментов и инженерных решений, кото- рые по отдель- ности выглядели скромно, но вме- сте радикально изменили воз- можности машин- ного обучения на главном объекте в кадре, технологии распознавания предметов на снимках в социальных сетях для предложения тегов — все это стало доступным и мас- совым. В некоторых узких, но показа- тельных задачах, например в точном определении пород собак по фотогра- фии, некоторые модели стали справ- ляться даже лучше, чем среднестати- стический человек-неспециалист. Одновременно с этим незаметно для многих происходила и тихая револю- ция в рекомендательных системах. Они не всегда были «чистыми» глубо- кими нейросетями в современном по- нимании, но с середины 2010-х нача- ли активно впитывать идеи и методы глубокого обучения. Персонализиро- ванные потоки видео на YouTube, филь- мов на Netflix, музыки на Spotify, то- варов в интернет-магазинах и статей в новостных лентах стали настраивать- ся под вкусы конкретного пользователя с невиданной ранее точностью. Люди начали замечать, что сервис будто бы «понимает» их скрытые предпочтения и интересы. На деле, конечно, алгоритм просто научился на гигантском масси- ве данных (выборах, кликах, времени просмотра, отказах) выявлять сложные, неочевидные паттерны и корреляции. Но потребительский эффект был впе- чатляющим: впервые ИИ начал напря- мую и ежедневно влиять на то, что мы смотрим, читаем, слушаем и покупаем.
ИИ В ПОВСЕДНЕВНОСТИ СЕГОДНЯ Технологии обретают подлинную значимость, лишь когда растворяются в повседневности, становясь невидимыми. Марк Вейзер Современный искусственный интеллект редко предстает в образе футуристического робота. Чаще он невидим, встро- ен в привычные сервисы: незаметно фильтрует спам, реко- мендует фильмы, распознает речь, оптимизирует маршруты. Его сила — в этой повсеместной и неприметной работе. Ме- няя обыденные процессы шаг за шагом, ИИ становится циф- ровой инфраструктурой нашей жизни. ОН ВАС ПОНИМАЕТ: КАК КОМПЬЮТЕР НАУЧИЛСЯ СЛЫШАТЬ И РАЗГОВАРИВАТЬ В начале 2000-х возможность пого- ворить с компьютером выглядела ско- рее забавной диковинкой. Системы распознавания речи существовали, но работали лишь в идеальных усло- виях: требовали четких команд, огра- ниченного словаря и полной тишины. Любое отклонение — акцент, фоно- вый шум, пауза — приводило к сбою. Поэтому голосовое управление дол- го оставалось лабораторным экспе- риментом и почти не проникало в по- вседневность. Перелом наступил, когда распоз- навание речи перестали строить по жестким правилам и позволили ИИ учиться на огромных массивах реаль- ных записей. Вместо того чтобы про- граммировать, как должно звучать Качество распозна- вания речи обычно измеряют показа- телем WER — долей ошибок в расшиф- рованном тексте. Он показывает, сколько слов си- стема перепугала, пропустила или вставила лишними. Такой способ оцен- ки удобен тем, что позволяет срав- нивать разные ал- горитмы на одном и том же наборе записей и видеть реальный прогресс, а не субъективное ощущение «вроде стало лучше»
Одной из самых сложных за- дач для систем распознавания речи долгое время оставалась работа в шумной обстановке. Ког- да вокруг говорят сразу несколько человек, слышны музыка или эхо, алгоритму трудно отделить нужный голос от фона. На практике это означает, что качество микро- фона и условия записи иногда влияют на ре- зультат сильнее, чем сложность самой модели слово, машине стали показывать мил- лионы примеров живой речи: быстрой и медленной, с запинками, по телефону, в машине, на улице. Нейросеть училась находить устойчивые закономерности в этом хаосе — не в идеализированной, а реальной человеческой речи. Современные системы не «слышат» слова напрямую. Они работают с не- прерывным звуковым потоком, который разбивается на миллисекундные фраг- менты. Сеть анализирует, как меняют- ся характеристики звука во времени, и сопоставляет эти паттерны с вероят- ными фонемами. Затем другая модель превращает последовательность зву- ков в слова, учитывая контекст. Если фразу можно понять двояко, систе- ма выбирает вариант, который лучше вписывается в смысл целого предло- жения. Качество распознавания резко выросло, когда к акустическим моде- лям добавились языковые — те, кото- рые знают, какие слова обычно сто- ят рядом. На практике это знакомо каждому, кто пользовался Siri или «Алисой». Ког- да вы говорите «поставь будильник на семь», система сначала превраща- ет звук в текст, затем распознает наме- рение и только после этого выполняет действие. Сам разговор здесь вторичен: машине не нужно понимать фразу как человек, ей достаточно правильно ин- терпретировать команду. Сегодня распознавание речи ста- ло вездесущей инфраструктурой. Оно работает в автоматических субтитрах,
в голосовой диктовке на смартфонах, в расшифровке интервью и подкастов. В кол-центрах система анализирует звонок, чтобы направить его нужному оператору; в медицине — превращает речь врача в текстовую запись; в юрис- пруденции — автоматически фиксиру- ет судебные заседания. Во всех этих случаях ИИ не ведет диалог, а выпол- няет за кадром рутинную работу, эко- номя людям время и силы. Следующим шагом стало поддержа- ние связного диалога. Ранние чат-бо- ты выглядели убедительно лишь в ко- ротких демонстрациях: они отвечали на отдельные реплики, но теряли нить разговора при первом же уточняющем вопросе. Современные системы устроены ина- че. Например, боты поддержки банков или магазинов ведут многошаговый диа- лог. Если пользователь пишет «Не могу войти в аккаунт», бот уточняет пробле- му — пароль или код подтверждения, — запоминает ответ и на следующем шаге предлагает подходящую инструкцию. Более универсальные диалоговые си- стемы также учитывают контекст бесе- ды, что создает ощущение живого раз- говора, а не обмена командами. Важно, однако, не путать связность с подлинным пониманием. Чат-бот не осознает существования обсуж- даемых объектов в реальном мире и не проверяет факты так, как это де- лает человек. Он лишь выбирает ответ, который статистически лучше всего со- ответствует контексту. Поэтому такие Многие по при- вычке обращают- ся к голосовым помощникам короткими, те- леграфными фразами: «погода завтра Москва», «таймер две минуты». Это наследие ранних систем, которые понимали только жестко заданные команды. Даже когда технологии стали гибче, эта манера общения у пользователей сохранилась и до сих пор влияет на то, как люди разговари- вают с машинами
Автоматические субтитры стали одной из самых незаметных, но значимых областей приме- нения распозна- гания речи. Они помогают людям с нарушениями слуха, тем, кто изучает язык, и всем, кто смо- трит видео без звука. При этом задача не сво- дится к простому распознаванию слов:системе важно правильно передавать пау- зы, имена и гра- ницы смысловых блоков, иначе текст становится трудночитаемым системы могут звучать убедительно, но при этом ошибаться или «додумы- вать» детали, особенно в областях, где обучающие данные были неполными или противоречивыми. Тем не менее этого уровня понима- ния оказалось достаточно для мно- жества практических задач. Там, где раньше требовался человек, теперь часто хватает системы, которая умеет слушать, распознавать и реагировать. И хотя диалог с машиной все еще от- личается от человеческого общения, для многих бытовых и деловых сце- нариев его возможностей более чем достаточно. ОН ВАС ЗНАЕТ: КАК ИИ УЧИТСЯ ПОНИМАТЬ ВАШИ ИНТЕРЕСЫ Многим знакомо ощущение, что ин- тернет «вас знает». Музыкальный сер- вис предлагает песню, которую хочется дослушать до конца. Стриминговый сер- вис подсказывает сериал, на который не жаль потратить вечер. Интернет-ма- газин показывает товар, который вы как раз собирались искать. За этим эф- фектом стоит не интуиция и не умение подслушивать мысли, а точная и праг- матичная математика. Современные рекомендательные си- стемы почти никогда не работают с лич- ностью человека напрямую. Им необя- зательно знать наш возраст, профессию или убеждения. Вместо этого они вни- мательно наблюдают за поведением: что вы выбираете, что игнорируете,
на чем задерживаете взгляд, к чему воз- вращаетесь. Каждое такое действие — небольшой сигнал. Сам по себе он поч- ти ничего не значит, но в массе эти сигналы складываются в устойчивый паттерн. На языке данных это описывают как вектор интересов — условный цифро- вой профиль пользователя, представ- ленный набором чисел. Каждое число отражает склонность к определенно- му типу контента или поведению. Сам человек этот вектор не видит, но имен- но с ним работают алгоритмы. Пока вы слушаете музыку, смотрите фильм или листаете ленту, система постоянно его корректирует: одни значения усилива- ются, другие ослабевают. Хороший пример — «Яндекс Музы- ка». Сервис не пытается понять вкус через жанры или ярлыки вроде «рок» или «поп». Он анализирует последо- вательности: какие треки люди слу- шают подряд, какие пропускают, какие добавляют в избранное. Если поведе- ние многих пользователей статистиче- ски схоже, система делает вывод, что их вкусы близки, даже если сами они описали бы их совершенно по-разному. Благодаря этому рекомендации часто кажутся неожиданными, но при этом точно попадают в настроение. Похожий принцип работает в он- лайн-кинотеатрах. Алгоритм учиты- вает не только то, что вы включили, но и как вы смотрите: досмотрели ли серию до конца, поставили ли на па- узу, вернулись ли позже. Эти детали В основе боль- шинства реко- мендательных систем лежит ме- тод, называемый коллаборативной фильтрацией. Его логика проста: система не пыта- ется понять чело- века напрямую, а сравнивает его поведение с по- ведением других пользователей. Если в прошлом их выборы совпа- дали, с высокой вероятностью со- впадут и будущие предпочтения
Чтобы выявить интересы пользо- вателя, система анализирует не отдельное действие, а их совокупность. Обычно учитыва- ются: • что пользователь досматривает или дочитывает до конца; • где он прекраща- ет просмотр; • к каким материа- лам возвращается повторно; • по каким эле- ментам кликает, но быстро уходит; • что сохраняет «на потом», но так и не открывает. Из этих сигна- лов со временем складывается устойчивая модель предпо- чтений часто важнее явных оценок. В резуль- тате система учится различать не про- сто «нравится / не нравится», а более тонкие предпочтения: любите ли вы не- торопливые сюжеты, терпите ли длин- ные диалоги, бросаете ли сериалы по- сле первой серии. В социальных сетях, например «ВКон- такте», механика рекомендаций строит- ся на схожей логике. В «умном» режиме лента формируется не в хронологи- ческом порядке, а на основе вероят- ности, что конкретный пост удержит наше внимание. Алгоритм оценивает реакцию на первые несколько запи- сей и на лету корректирует дальней- шую выдачу. Поэтому лента постоянно обновляется и никогда не бывает оди- наковой у двух разных людей. Интересно, что те же подходы при- меняются и в сервисных чатах. Чат-бот поддержки в банке или магазине может учитывать историю обращений. Если пользователь часто спрашивает о до- ставке или платежах, система начина- ет предлагать соответствующие сце- нарии в первую очередь. По сути, это тоже рекомендация — только не кон- тента, а следующего шага в диалоге. Важно понимать границы таких си- стем. Они не понимают интересы в че- ловеческом смысле и не делают вы- водов вроде «этому человеку важно то-то». Алгоритм работает проще: он оценивает вероятность, что следую- щий объект — будь то песня, фильм или товар — окажется релевантным, основываясь на прошлых действиях.
Если поведение меняется, меняется и модель. Поэтому рекомендации мо- гут быть как удивительно точными, так и ошибочными. Именно это делает их одновремен- но эффективными и неоднозначными. С одной стороны, они экономят вре- мя и предлагают действительно инте- ресное. С другой — могут усиливать случайные интересы или постепен- но сужать «информационную диету» пользователя. В научной литературе это называют эффектом обратной свя- зи: модель влияет на поведение чело- века, а поведение человека укрепля- ет модель. Тем не менее с технологической точки зрения это был огромный шаг вперед. Вместо жестких правил и категорий ИИ научился работать с вероятностями, на- блюдениями и постоянной адаптаци- ей. Он не знает человека как личность, но умеет достаточно точно предсказы- вать его следующий выбор. И этого по- зволило рекомендательным алгоритмам стать одной из самых массовых и вли- ятельных форм искусственного интел- лекта в нашей повседневной жизни. ОН ВАС ВИДИТ: КАК ИИ РАСПОЗНАЕТ ИЗОБРАЖЕНИЕ Когда говорят, что компьютер «узнает лицо» или «видит объект», легко прове- сти аналогию с человеческим зрением. На деле процесс устроен принципиаль- но иначе — ив этом различии заключа- ется суть компьютерного зрения. В 2006 году ком- пания Netflix объ- явила открытый конкурс Netflix Prize для инже- неров и исследо- вателей со всего мира. Участникам предложили улучшить алго- ритм рекомен- даций на основе обезличенных данных о про- смотрах. Конкурс показал: замет- ный рост каче- ства достигается не отдельным приемом, а соче- танием несколь- ких моделей и подходов
В компьютерном зрении известна проблема так называемых состязательных примеров. Это изображения, б которые внесе- ны едва заметные для человека изменения, заставляющие систему ошибать- ся. Такие случаи показывают, что модель опирает- ся на признаки, не совпадающие с человеческим восприятием Для человека изображение поч- ти мгновенно наполняется смыслом: «лицо», «автомобиль», «дерево». Для машины картинка — изначально просто таблица чисел, где каждая ячейка хра- нит значение яркости и цвета. Ни пред- метов, ни сцен, ни смысла в этих цифрах нет. Задача системы — научиться пре- вращать этот числовой массив в струк- турированное описание. Ключевое понятие здесь — вектор признаков (векторное представление, embedding). Это длинный набор чисел, который нейросеть вычисляет для каж- дого изображения. В нем закодирова- ны визуальные характеристики: формы, текстуры, пропорции, взаимное рас- положение элементов. Это не словес- ное описание и не мысленный образ, а уникальный математический отпеча- ток картинки. Векторы признаков система и срав- нивает. Когда смартфон разблокиру- ется по лицу, он не решает логическую задачу «вы это или нет». Он вычисля- ет, насколько вектор текущего изобра- жения близок к вектору, сохраненному при настройке. Если они достаточно похожи — доступ открывается. Поэто- му распознавание всегда работает как оценка сходства, а не как точное иден- тифицирование. Отсюда следует важный вывод: си- стема никогда не бывает абсолютно уверена. Она оперирует вероятностя- ми. В любой такой технологии зада- ется порог — насколько похожими должны быть векторы, чтобы считать
их совпадением. Слишком строгий по- рог — и система будет часто не узна- вать владельца. Слишком мягкий — начнет принимать чужих за своих. Это не ошибка, а фундаментальный компро- мисс, и настройка порога зависит от за- дачи: разный баланс требуется для раз- блокировки телефона, прохода в офис или контроля в аэропорту. Другая ключевая идея — инвариант- ность, то есть устойчивость к измене- ниям. Хорошая система должна узна- вать объект независимо от ракурса, освещения, мимики или частичного пе- рекрытия. Для человека это естествен- но; для машины — сложная проблема. Нейросети решают ее не через прави- ла, а через обучение на разнообразных примерах. Если в имеющихся данных объект встречался в разных условиях, сеть учится игнорировать несуществен- ные изменения и выделять устойчивые признаки. Но если каких-то ситуаций в обучающей выборке не было, имен- но в них система и будет ошибаться. Отсюда возникает важное ограниче- ние: компьютер видит не мир как таковой, а те паттерны, которые извлек из загру- женных для обучения материалов. Если модель училась на определенном типе изображений, она переносит эти шабло- ны на реальность. Это не предвзятость в человеческом смысле, а прямое след- ствие статистического подхода. Существуют и более тонкие эффек- ты. Например, системы могут реагиро- вать на изменения, почти незаметные для человека: легкий сдвиг пикселей, Большинство систем компью- терного зрения обучаются на размеченных наборах данных. Люди заранее просматривают изображения и указывают, где находится нужный объект. Создание таких наборов — тру- доемкий и до- рогой процесс, а ошибки в раз- метке напрямую влияют на то, чему именно нау- чится модель
На практике компьютерное зрение чаще всего применяют в задачах контро- ля: поиск дефек- тов, проверка качества сборки, анализ повторяю- щихся операций. Здесь важна не универсаль- ность, а надеж- ность — способ- ность стабильно работать в строго заданных усло- виях и давать воспроизводи- мый результат добавление шума или едва уловимые искажения способны значительно из- менить вектор признаков и привести к ошибке. Это показывает, что нейро- сеть воспринимает не целостный образ, а те структуры, которые значимы для ее внутренней математической модели. При этом было бы неверно считать компьютерное зрение в целом несо- вершенным. В четко заданных услови- ях такие системы превосходят челове- ка: они могут без устали анализировать видео, замечать минимальные отклоне- ния, сравнивать тысячи изображений одновременно. Поэтому технологии ши- роко используются в промышленности, медицине, логистике и безопасности — там, где важны масштаб, скорость и не- изменность критериев. Главное — понимать, что компьютер не видит мир так, как мы. Он опериру- ет абстрактными числовыми представ- лениями, лишь косвенно связанными с тем, что человек называет объекта- ми или лицами. Поэтому компьютерное зрение одновременно поражает свои- ми возможностями и иногда допускает неожиданные, почти непредсказуемые ошибки. Эта двойственность — не вре- менный недостаток, а фундаментальная особенность подхода. ОН ВАС ВЕДЕТ: КАК ИИ ОРИЕНТИРУЕТСЯ В ПРОСТРАНСТВЕ Когда навигатор прокладывает марш- рут или автомобиль автоматически дер- жит полосу, кажется, будто машина
просто следует заложенным инструк- циям. На самом деле за этим стоит одна из сложнейших задач для искусствен- ного интеллекта — принятие решений в физическом мире, где информация всегда неполна, а любая ошибка может иметь серьезные последствия. В отличие от распознавания речи или изображений, здесь недостаточно пра- вильно интерпретировать данные. Си- стема должна выбрать действие и сде- лать это своевременно. Ошибка в слове приводит к неверному ответу, ошибка в движении — к аварии. Поэтому зада- чи навигации и управления считаются одними из самых требовательных к на- дежности ИИ. С научной точки зрения это область планирования и управления. Система должна постоянно отвечать на три клю- чевых вопроса: где я нахожусь, что про- исходит вокруг и какое действие сей- час наиболее безопасно и эффективно. Ни на один из них нетточного ответа — все решается на основе вероятностных оценок и приближений. Возьмем нагигаторы. Современные программы давно перестали быть про- сто электронными картами. Они стро- ят прогнозы движения, анализируя скорость потока, пробки, время су- ток, день недели и множество других факторов. Для каждого участка до- роги оценивается не одно значение времени, а диапазон возможных вари- антов. В результате маршрут выбира- ется не самый короткий, а тот, который с наибольшей вероятностью приведет КАК МАШИНА ОРИЕНТИРУЕТСЯ БЕЗ КАРТЫ В робототех- нике широко используется подход SLAM — одновременные локализация и построение карты.Система определяет свое положение и по- степенно строит карту окружаю- щего простран- ства. Это необ- ходимо там, где невозможно по- лагаться на GPS'. внутри зданий, в тоннелях или плотной город- ской застройке
При построении маршрута си- стема учитывает не только рассто- яние, но и допол- нительные факто- ры: вероятность задержек, слож- ные перекрестки, резкие маневры. Каждому участку пути присваива- ется «стоимость», и итоговый марш- рут выбирается наиболее надеж- ный, а не просто самый короткий к цели быстрее и без непредвиденных задержек. При этом прогноз постоянно обнов- ляется. Как только ситуация меняет- ся — авария, резкое замедление потока движения, перекрытие, — система пере- сматривает свою модель дороги и пред- лагает новое решение. Это непрерывный процесс принятия решений в условиях неполной и изменчивой информации. В беспилотных автомобилях та же ло- гика работает на гораздо более слож- ном уровне. Машина получает данные от нескольких типов датчиков: камер, радаров и лидаров. Каждый из них по-своему несовершенен: камеры чув- ствительны к освещению, радары дают грубую информацию о форме, а ли- дары — приборы, которые сканиру- ют пространство с помощью лазерных импульсов и строят точную трехмерную картину окружения, — точны, но до- роги и требовательны к вычислениям. Чтобы получить целостную картину, система объединяет показания разных сенсоров — этот процесс называется слиянием данных. Но даже после это- го остается неопределенность: объ- ект может быть пешеходом, велосипе- дистом или просто тенью, а расстояние до него известно лишь с погрешностью. Затем начинается этап принятия ре- шений. Алгоритм рассматривает воз- можные действия: ускориться, замед- литься, перестроиться, остановиться. Для каждого варианта оценивается ве- роятность различных исходов и свя- занный с ними риск. Цель — выбрать
действие, которое минимизирует ве- роятность опасных последствий. Это не интуиция и не набор жестких пра- вил, а расчет ожидаемого результата. Здесь проявляется фундаментальное ограничение подобных систем. Они хо- рошо работают в типичных ситуаци- ях — движение по полосе, остановка на светофоре, стандартные маненры. Но реальный мир полон редких собы- тий: неожиданное поведение пешехо- да, нестандартная разметка, времен- ные дорожные работы.Такие ситуации труднее всего описать данными и ал- горитмами. Если система не сталкива- лась с подобным сценарием при обу- чении, ее реакция становится менее предсказуемой. Поэтому современные решения в об- ласти автономного вождения — это не полноценные автопилоты, а асси- стенты. Они берут на себя часть на- грузки, но требуют постоянного кон- троля со стороны человека. И это не временный недостаток технологии, а следствие того, что неопределенность в физическом мире принципиально не- устранима. Похожие подходы применяются и в других областях. Дроны достав- ки, складские роботы, автоматические погрузчики — все они решают одну и ту же задачу: двигаться в простран- стве, избегать столкновений и дости- гать цели. И везде применяется один и тот же принцип — вероятностное представление мира и осторожное пла- нирование действий. Даже базовые на- вигационные за- дачи разбивают- ся на множество этапов: распозна- вание разметки, отделение теней от линий,учет по- годных условий, сопоставление данных с разных датчиков. Поэто- му такие системы проектируются с резервирова- нием: если один источник инфор- мации дает сбой, управление опи- рается на другие
Во многих при- кладных задачах ИИ не принимает окончательное решение, а по- могает сосредо- точить внимание специалистов. Например, ан- тифрод-система может не блоки- ровать платеж автоматически, а отправлять его на ручную проверку. В этом случае алго- ритм сортирует поток операций по степени риска, чтобы специа- листы тратили время прежде всего на самые подозрительные случаи ОН РАБОТАЕТ ЗА КУЛИСАМИ: ИИ КАК СИСТЕМА ОТБОРА И ПРИОРИТИЗАЦИИ Далеко не весь искусственный ин- теллект создан для прямого взаимо- действия с человеком. Значительная часть ИИ действует там, где нет ни ди- алога, ни изображений, ни «умного по- ведения» в привычном понимании.Его задача — не понимать пользователя, а помогать сложным системам справ- ляться с огромными потоками событий, данных и решений. Современные цифровые сервисы по- стоянно сталкиваются с одной пробле- мой: информации и операций слишком много, чтобы обрабатывать их вруч- ную. Поэтому ИИ все чаще используется как инструмент отбора и упорядочива- ния. Поисковые системы решают, какие страницы показать первыми. Почто- вые сервисы определяют, какое пись- мо важно, а какое — спам. Финансовые платформы оценивают, какую транзак- цию провести автоматически, а какую проверить дополнительно. Во всех этих случаях ИИ не понимает смысл, а оце- нивает приоритет. С научной точки зрения такие задачи относятся к классификации и ранжи- рованию. Система получает объект — будь то письмо, запрос, транзакция или сообщение — и должна либо отнести его к определенной категории, либо определить его место в очереди. Гра- ницы между категориями почти всегда размыты: письмо может быть похоже на спам, но не быть им; операция может
выглядеть необычно, но оказаться за- конной. Поэтому решения принимают- ся не по жестким правилам, а на осно- ве вероятностей. Здесь действует тот же принцип ком- промисса между разными типами оши- бок, о котором уже говорилось рань- ше: любая система отбора вынуждена выбирать между излишней строгостью и чрезмерной мягкостью, и потому ее пороги всегда настраиваются под кон- кретные риски и задачи — будь то по- чта, финансовый мониторинг или мо- дерация контента. Особое место занимает задача об- наружения аномалий. Здесь ИИ ищет не конкретный шаблон, а то, что вы- бивается из обычной картины. В бан- ковских системах это могут быть нетипичные транзакции, в промышлен- ности — нестандартные показания дат- чиков, в сетях — подозрительная ак- тивность. Системе не нужно знать, что именно произошло. Ее цель — указать на отклонение и привлечь внимание человека. Важно, что в таких системах ИИ ча- сто работаете крайне редкими событи- ями. Большинство операций нормаль- ны, а интерес представляют единичные исключения. Это делает задачу особен- но сложной: система должна быть чув- ствительна к отклонениям, но не реаги- ровать на обычные колебания. Поэтому подобные решения требуют постоянной тонкой настройки и контроля. Еще одна особенность «закулисно- го» ИИ — трудность объяснения его Системы отбора сталкиваются с проблемой редких событий. Мошеннические операции или опасные ошиб- ки составляют малую долю данных, и модель может выгля- деть успешной по формальным метрикам,но при этом пропускать именно то, ради чего она создана. Поэтому на прак- тике отдельно анализируют пропуски и лож- ные срабатыва- ния, а не только общую точность
Даже хорошо на- строенная систе- ма со временем теряет качество. Поведение поль- зователей меня- ется, появляются новые схемы злоупотреблений, язык и контексты обновляются. Это явление назы- вают дрейфом данных. Чтобы ИИ оставался полезным, его регулярно про- веряют на но- вых примерах и переобучают с учетом свежей информации решений. Модель может уверенно пометить событие как рискованное, но не дать понятное человеку обосно- вание. Это называют проблемой интер- претируемости: чем сложнее модель, тем труднее понять, какие именно при- знаки повлияли на результат. Из-за этого во многих областях со- знательно используют более простые алгоритмы, даже если они несколько менее точны. Это не отставание, а осоз- нанный выбор. Там, где важна проверя- емость и ответственность, понятность часто оказывается важнее максималь- ной эффективности. Такой ИИ редко заметен пользовате- лю. Он не выглядит умным и не привле- кает внимания. Однако он определяет, какие события доходят до человека, какие решения принимаются автомати- чески, а где требуется вмешательство. В этом смысле искусственный интел- лект давно стал частью цифровой ин- фраструктуры — не как разум, а как механизм отбора и фильтрации.
Неизвестный художник. Портрет Ады Кинг, графини Лавлейс. Ок. 1840 г. Музей науки, Лондон. Ада Лавлейс (1815-1852) — английская математик, автор первых известных алгоритмов для механической вычислительной маши- ны Бэббиджа, одна из ключевых фигур в истории программиро- вания и предтеча идей вычислительного интеллекта
Неизвестный автор. Портрет Джорджа Буля. «Иллюстрированные лондонские новости», 21 января 1865 г. Джордж Буль (1815-1864) — английский математик и логик, автор булевой алгебры — основы цифровой логики, без которой невозможно представить компьютеры и искусственный интеллект
ЭПОХА БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ Пределы моего языка означают пределы моего мира. Людвиг Витгенштейн Когда ИИ научился не просто обрабатывать, а понимать человеческий язык, взаимодействие с техникой перешло на новый уровень. Текст стал универсальным интерфейсом: благодаря ему можно вести диалог, ставить задачи, писать код, управлять сложными системами. Эта особенность со- временных систем искусственного интеллекта породила ил- люзию подлинного мышления. РАЗНЫЕ ПОДХОДЫ К СОЗДАНИЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Когда говорят об искусственном интеллекте, часто кажется, что это единая технология, которая со вре- менем просто становится умнее. В реальности развитие ИИ с самого начала шло несколькими параллель- ными путями. Каждое из направле- ний предлагало свой ответ на во- прос: что можно считать разумным поведением машины? Один из самых ранних подходов ис- ходил из идеи, что интеллект — это прежде всего способность учиться на опыте и находить закономерности в данных. На этой основе сформиро- валось направление, которое сегод- ня называют машинным обучением (machine learning). Его истоки связа- ны, например, с моделью перцептрона Помимо обуче- ния на примерах и логических правил существует вероятностный подход. В нем система не дает жесткого ответа, а оценивает сте- пень уверенности: какой вариант более вероятен при имеющихся данных.Такие модели особенно полезны в ситуа- циях, где инфор- мация неполная или зашумленная
Отдельный класс методов — обу- чение с подкре- плением. В нем системе не пока- зывают пра- вильные ответы заранее. Вместо этого задают цель и вводят систему поощре- ний и штрафов за действия. Алгоритм учится на последствиях собственных решений. Такой подход исполь- зуют в играх, управлении и робототехнике, но он требует очень точной формулировки цели Фрэнка Розенблатта. В этом подходе системе показывают множество при- меров, и она постепенно учится выяв- лять статистические зависимости, ко- торые помогают решать задачу. Такие модели хорошо работают там, где задача четко определена: распоз- нать лицо, обнаружить объект на изо- бражении, определить произнесенное слово. Однако за пределами своей уз- кой специализации они практически бесполезны. Система, обученная раз- личать кошек и собак, не становится от этого ближе к пониманию языка или логических связей. Она не понимает суть задачи, она лишь выявляет стати- стические различия между примерами. Другой путь основывался на пред- ставлении, что интеллект — это спо- собность действовать и делать вы- бор. Здесь главным было не описание мира, а умение принимать решения, ве- дущие к желаемому результату. Это на- правление получило название «обуче- ние с подкреплением» (reinforcement learning) и обычно рассматривается как один из подходов внутри машинного обучения. Система пробует различ- ные действия, получает вознагражде- ние или штраф и постепенно учится вы- бирать наиболее успешные варианты. Такие модели показали высокую эф- фективность в играх,управлении и оп- тимизации процессов. Они способны находить стратегии, до которых че- ловек мог бы и не додуматься. Одна- ко у них есть важное ограничение: они, как правило, работают в строго
заданной среде. Если условия меня- ются, модель часто приходится обу- чать заново. Кроме того, такие системы обычно не способны объяснить, почему было выбрано то или иное действие. Третий подход, долгое время считав- шийся наиболее интеллектуальным,по- нимал разум как способность рассу- ждать по правилам. Это направление известно как символический искус- ственный интеллект и связано с име- нами Джона Маккарти и Аллена Нью- элла. В таких системах знания о мире задавались явно — в виде фактов, пра- вил и логических утверждений. Проблема заключалась в том, что весь этот здравый смысл приходилось про- писывать вручную. Человек должен был заранее объяснить машине, что та- кое объект, какие между ними возмож- ны отношения и какие выводы из этого следуют. Это работало в очень узких, формализованных областях, но пло- хо переносилось на реальный мир, где информация неполна, противоречива и постоянно меняется. Любые неточно- сти — ошибки в данных, неоднознач- ные ситуации, непредвиденные обсто- ятельства — быстро выводили такие системы из строя. Важно, что все эти подходы развива- лись параллельно и долгое время поч- ти не пересекались. У них были раз- ные методы, цели и представления об успехе. Многие исследователи счи- тали, что универсальный искусствен- ный интеллект невозможен в прин- ципе — настолько разными казались В реальных про - дуктах редко ис- пользуют только один метод. Чаще всего применя- ют гибридные решения. Напри- мер, нейросеть анализирует текст письма, а затем сраба- тывают жесткие правила безопас- ности: не пере- водить деньги на новый счет без подтверждения, не передавать персональные данные. Такие ограничения делают систему менее гибкой, но более надеж- ной
С инженерной точки зрения искусственный интеллект — это не отдельный алгоритм, а це- почка процессов. Данные собира- ют и очищают, модели обучают и проверяют, результаты оце- нивают, а затем поддерживают систему в рабо- чем состоянии годами. Поэтому успех часто за- висит не от уни- кального алго- ритма, а от того, насколько хоро- шо выстроена вся инфраструктура гокруг него задачи распознавания, принятия ре- шений и логического вывода. Компании и лаборатории также де- лали разные ставки. Одни фокусиро- вались на создании надежных решений для конкретных прикладных задач. Дру- гие работали над совершенствованием отдельных методов, наращивая объемы данных или вычислительные мощности. Лишь немногие ожидали, что когда-ни- будь одна модель сможетуспешно справ- ляться с таким разнообразием задач. Здесь стоит подчеркнуть важный мо- мент: большие языковые модели (боль- шие языковые модели, или LLM) поя- вились не как попытка объединить все прежние подходы, а как разви- тие отдельной идеи — работы с язы- ком. Не с изображениями, действиями или логическими правилами, а имен- но с текстом — тем самым материа- лом, в котором человечество веками хранит знания, инструкции и сложные рассуждения. ПОЧЕМУ ЯЗЫК СТАЛ ОСНОВОЙ НОВОГО ИИ Чтобы понять значение больших язы- ковых моделей, стоит начать с самого понятия языковой модели. В своей ос- нове это система, которая учится пред- сказывать продолжение текста: поуже имеющимся словам она оценивает, ка- кие слова с наибольшей вероятностью могут следовать дальше. На первый взгляд такая задача мо- жет показаться слишком примитивной,
чтобы иметь отношение к интеллекту. Однако человеческий язык — не слу- чайный набор слов. В текстах люди фиксируют знания о мире, объясняют причинно-следственные связи, форму- лируют инструкции, ведут споры, стро- ят рассуждения и пишут программы. Обучаясь предсказывать текст, модель неизбежно осваивает и эти структуры, пусть не осознанно, а в виде статисти- ческих закономерностей. Языковые модели существова- ли и раньше — первые такие систе- мы появились еще во второй половине XX века, а в практических приложени- ях стали заметны с 1990-х годов. Их использовали в автодополнении тек- ста, машинном переводе и проверке ор- фографии. Однако долгое время они оставались сравнительно простыми: работали с коротким контекстом, пло- хо удерживали смысл протяженного текста и быстро теряли точность, если задача выходила за привычные рамки. Перелом произошел, когда исследо- ватели начали радикально наращивать масштаб. Модели стали обучать на ко- лоссальных объемах текста — книгах, статьях, документации, диалогах. Одно- временно рос и размер самих моделей: в них появились миллиарды параме- тров — чисел, определяющих реакцию системы на разные языковые конструк- ции. Это потребовало огромных вычис- лительных ресурсов, но результат ока- зался неожиданным. Важно подчеркнуть: в модель не за- кладывали знания о мире напрямую. САМООБУЧЕНИЕ БЕЗ УЧИТЕЛЯ Язык удобен для обучения моде- лей тем, что в нем уже содержится готовая струк- тура примеров. В тексте всегда есть естествен- ная последова- тельность: одно слово следует за другим. Это позволяет обучать модель на задаче «пред- сказать следу- ющий фрагмент текста», исполь- зуя книги, статьи и сайты без ручной разметки. Для изображений или медицины так не получается: там правильные ответы обычно нужно задавать ^ручную
Один из интел- лектуальных предков языко- вых моделей — цепи Маркова, предложенные математиком Ан- дреем Марковым в начале XX века. Их идея проста: следующее со- стояние системы зависит от пре- дыдущего. В язы- ке это означает, что следующее слово зависит от уже сказан- ных. Современ- ные модели ушли далеко вперед, но сама логика предсказания выросла из этой математической концепции Ее не учили логике, физике или здра- вому смыслу. Ее единственной задачей по-прежнему было предсказание сле- дующего фрагмента текста. Однако при достижении определенного масштаба эта задача перестала быть простой. Чтобы корректно продолжить слож- ный текст, модель должна была учиты- вать контекст, стиль, ход рассуждений и даже тип решаемой задачи. В результате модели начали прояв- лять поведение, внешне напоминающее понимание. Они научились пересказы- вать, объяснять, переводить, писать код и отвечать на вопросы. При этом внутри не происходило переключения между разными режимами мышления, выпол- нялась лишь одна операция — вероят- ностное продолжение текста. Ключевым оказалось то, что язык стал универсальным носителем задач. В текстовой форме можно описать поч- ти все: бытовую ситуацию, математиче- скую формулу, инструкцию, алгоритм. В отличие от изображений или сигна- лов управления, язык изначально об- ладает высокой степенью абстракции. Это позволило одной и той же моде- ли работать с самыми разными зада- чами, не меняя своей внутренней ар- хитектуры. В этом главное отличие языковых моделей от других типов ИИ. Системы распознавания учатся находить при- знаки в данных. Системы управления учатся выбирать действия в конкрет- ной среде. Языковые модели работают с обобщенным человеческим опытом,
запечатленным в текстах. Они не зна- ют мир напрямую, но знают, как люди его описывают, рассуждают о нем и ре- шают проблемы. Отсюда возникает эффект, удивляю- щий многих: модель часто справляет- ся с новой задачей без дополнитель- ного обучения, достаточно просто описать ее словами. Это явление назы- вают обучением в контексте (in-context learning): система выполняет новую за- дачу за счет подсказки и примеров в те- кущем тексте, не меняя своих параме- тров. Но важно не переоценивать такие си- стемы. Языковая модель не проверяет свои ответы на соответствие реально- сти и не строит внутренней картины мира. Она существует в пространстве текста и вероятностей. Однако этого оказалось достаточно, чтобы создать инструмент, который выглядитунивер- сальным и легко адаптируется к новым запросам. БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ НА ПРАКТИКЕ: ОТ ИДЕИ К РАБОЧИМ СИСТЕМАМ Путь от теоретической концепции язы- ковой модели к системам, которыми мы пользуемся сегодня, оказался удиви- тельно быстрым. Ключевые этапы уло- жились примерно в одно десятиле- тие — с конца 2010-х до начала 2020-х годов. В этот период стало очевидно: масштабирование языковых моделей ведет не к постепенным улучшениям, Перед обучением текст разбива- ется на токе- ны — небольшие фрагменты слов. Для этого часто используют ал- горитм В РЕ (byte pair encoding — кодирование пар байтов), который объединяет часто встречающиеся сочетания букв в устойчивые ча- сти. В результате модель опери- рует не словами целиком, а по- вторяющимися фрагментами, что объясняет, поче- му редкие имена и малоизвестные термины даются ей сложнее
Чтобы языковая модель стала удобной для общения, ее дополнительно обучают на при- мерах диалогов людей. Этот этап называют fine- tuning —«дона- стройка». Модель учат следовать инструкциям, отвечать по делу и соблюдать формат. Без этого этапа система может грамот- но продолжать текст, но плохо понимать, чего от нее хотят в разговоре а к качественным скачкам, открывая ра- нее недоступные возможности. Важной отправной точкой стал 2017 год, когда группа исследовате- лей Google представила архитектуру трансформера, которая была рассмо- трена ранее. Следующий шаг был связан уже не столько с архитектурой, сколько с масштабированием. В 2018-2019 го- дах исследователи начали система- тически увеличивать размер моделей и объемы обучающих данных. Оказа- лось, что с ростом числа параметров модели начинают проявлять свойства, которые никто специально не програм- мировал: они лучше следуют инструк- циям, точнее отвечают на вопросы, уве- реннее удерживают контекст в длинных текстах. Эти эффекты были не до кон- ца объяснены, но оказались настолько стабильными, что на них стали делать серьезные ставки. В начале 2020-х языковые модели вышли за пределы академических ла- бораторий. Переломным для массовой аудитории стал запуск ChatGPT30 ноя- бря 2022 года. Он наглядно показал, что большая языковая модель может быть не просто экспериментом, а удобным и доступным инструментом. Ключевую роль сыграл диалоговый формат: поль- зователям не требовалось разбираться в технических деталях — достаточно было просто задавать вопросы на до- ступном им языке. Параллельно развивались и другие направления. Появлялись языковые
модели, ориентированные не столько на универсальный диалог с пользовате- лем, сколько на прикладные задачи — работу с кодом, анализ документов, ис- пользование в инженерных и научных проектах. Для обычного пользователя такие системы могут выглядеть очень похожими на популярные чат-модели, однако различия проявляются на уров- не того, как и для чего они использу- ются. Например, модели семейства DeepSeek развивались с упором на эф- фективность вычислений и возмож- ность встраивания в другие системы. В таком подходе языковая модель рас- сматривается не как самостоятельный продукт, а как базовый компонент, во- круг которого строятся более слож- ные решения. Со временем стало понятно, что раз- личия между большими языковыми мо- делями определяются не только их раз- мером. Важную роль играют качество данных для обучения, методы допол- нительной настройки и цели,которые ставили перед собой разработчики. Одни команды делали ставку на закры- тые сервисы с единым интерфейсом, другие — на модели, которые можно свободно встраивать в свои продук- ты и дорабатывать под конкретные за- дачи. К середине 2020-х годов большие языковые модели начали выполнять новую, инфраструктурную роль. Они стали универсальным промежуточным слоем между человеком и сложными цифровыми системами. Посредством В прикладных системах часто используют при- ем RAG (retrieval- augmented generation — «ге- нерация с поис- ковым дополне- нием»). Сначала система находит нужные фрагмен- ты в базе доку- ментов, а затем формирует ответ, опираясь на них. Это снижает риск выдумок и по- зволяет работать с обног ляемой информацией, но окончатель- ный текст все равно создает языковая модель
Качество язы- ковых моделей оценивают с помощью наборов те- стов, а не одной метрики. Отдель- но проверяют работу с логикой, математикой, кодом,инструк- циями и длинны- ми текстами. Это связано с тем, что улучшение в одном навыке может ухудшить другой: модель становится разговорчивее, но чаще ошибает- ся в фактах, или наоборот речи стало возможно управлять по- иском, анализировать данные, писать и проверять код, готовить документы и даже координировать работу других алгоритмов. Языковая модель превра- тилась в посредника между человече- ским запросом и машинным исполне- нием. При этом принцип их работы остается прежним. Все эти системы до сих пор основаны на статистиче- ском предсказании текста. Таким образом, языковые модели, де- сятилетиями остававшиеся вспомога- тельной технологией, за несколько лет стали основой целого класса совре- менных инструментов. Но этот успех все еще не означает появления уни- версального разума. ИЛЛЮЗИЯ УНИВЕРСАЛЬНОСТИ: ГДЕ ПРОХОДЯТ РЕАЛЬНЫЕ ГРАНИЦЫ ЯЗЫКОВЫХ МОДЕЛЕЙ Первые сомнения в универсальности больших языковых моделей возникли почти сразу после их широкого распро- странения. Уже в 2022-2023 годах, ког- да диалоговые системы стали массово использоваться за пределами лабора- торий, исследователи и пользователи столкнулись с парадоксом: модели де- монстрировали впечатляющую широту возможностей, но при этом регулярно и уверенно совершали ошибки. Одним из первых на эту проблему пу- блично указал Гэри Маркус, когнитив- ный ученый и давний критик попыток свести интеллект к чистой статистике.
Он отмечал, что языковые модели успешно воспроизводят шаблоны рас- суждений, но лишены способности к моделированию мира: внутреннего понимания причин, объектов и физи- ческих ограничений реальности. Эти замечания быстро нашли подтвержде- ние на практике. Данная проблема получила характер- ное название «галлюцинации». Модель могла уверенно ссылаться на несуще- ствующие источники, искажать истори- ческие факты или создавать правдопо- добные, но ложные объяснения. Важно, что это не следствие плохого обуче- ния или ошибки в коде. Такое поведе- ние вытекает из самой сути языковых моделей: они оптимизированы для со- гласованности текста, а не для провер- ки истинности утверждений. К 2023 году эта особенность ста- ла предметом систематического изу- чения. Исследования и практический опыт показали, что даже с ростом мо- делей и улучшением данных «галлю- цинации» остаются заметной пробле- мой. Модель может проявлять высокую уверенность именно в тех случаях, ког- да у нее нет достоверной информации. Вместо признания незнания она про- должает текст так, как это выглядит статистически правдоподобно. На этом фоне стало понятно: уни- версальность больших языковых мо- делей имеет вполне конкретные грани- цы. Они эффективны там, где мир уже представлен в текстовой форме: объ- яснения, инструкции, дискуссии, код, НЕ ВСЕ ЛОГИЧ- НО, ЧТО ЗВУЧИТ ЛОГИЧНО Языковые моде- ли — это системы генерации текста, а не проверки истины. Их за- дача — строить связные и прав- доподобные ответы. Человеку такой текст часто кажется свиде- тельством ре- ального знания, потому что мозг склонен доверять логично звуча- щим объяснени- ям. В результате уверенный стиль может маскиро- вать отсутствие надежной факти- ческой опоры
Критическая сла- бость языковых моделей — ра- бота с проверя- емыми фактами: точными датами, редкими имена- ми, конкретными источниками. Мо- дель не наблюда- ет мир напрямую и не имеет встро- енного меха- низма проверки реальности. Поэ- тому на практике ее используют как инструмент рассуждения и навигации по теме, а не как окончательный источник истины документация. Однако в задачах, тре- бующих точных вычислений, строгой верификации или работы с реальны- ми данными, языковая модель склон- на подменять точность правдоподоби- ем. Это не дефект, а прямое следствие способа ее обучения. Важно подчеркнуть: разговор об огра- ничениях не означает разочарования в технологии. Напротив, он стал при- знаком ее зрелости. Иллюзия универ- сальности возникла именно потому, что языковые модели оказались не- ожиданно широкими в своих возмож- ностях. Но лишь понимание их границ позволило интегрировать их в реальные процессы без завышенных ожиданий.
СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ И РАЗВИЛКИ В РАЗВИТИИ ИИ Все модели неверны, но некоторые из них полезны. Джордж Бокс Сегодня развитие искусственного интеллекта идет сра- зу по нескольким, порой взаимоисключающим, путям. Одни игроки ставят на гигантские универсальные модели, дру- гие — на компактность и энергоэффективность. Где-то ал- горитмы делают общедоступными, где-то засекречивают. Выбор на этих развилках определяет не только технический ландшафт завтрашнего дня, но и то, в чьих руках окажется экономическая власть. ОТ ОТДЕЛЬНЫХ МОДЕЛЕЙ — К СИСТЕМАМ Первые впечатляющие успехи боль- ших языковых моделей породили фан- тазии, будто достаточно умная модель сможет сама справляться с самыми разными задачами. Однако на прак- тике оказалось, что даже самые мощ- ные модели не приспособлены для ре- шения проблем, выходящих за рамки единичного запроса и ответа. Реаль- ные рабочие процессы — будьте ана- лиз данных, составление отчета или разработка — почти всегда многоша- говые. Они требуют сохранения про- межуточных результатов, обращения к внешним источникам и постоянно- го учета контекста. Этот разрыв между возможностями модели и потребностями пользовате- лей стал особенно очевиден в начале В крупных ИИ-продуктах важен не только сам алгоритм, но и возмож- ность понять, как и почему система пришла к кон- кретному ответу. Для этого сохра- няются журналы запросов, версии моделей, исполь- зуемые инструк- ции и результаты работы инстру- ментов
Когда ИИ ста- новится частью рабочего процес- са, появляется отдельная зада- ча — постоянная проверка каче- ства. Для этого собирают набор типовых запро- сов и прогоняют их после каждо- го обновления системы. Такой подход называют регрессионным тестированием, он нужен, чтобы новые улучше- ния не ломали уже работающие функции и пове- дение системы оставалось пред- сказуемым 2020-х, когда LLM начали внедрять в ре- альные продукты. Разработчики стол- кнулись с парадоксом: модель могла блестяще ответить на конкретный во- прос, но теряла логику задачи, растяну- той во времени. Например, при анализе комплекса документов или написании кода важно помнить, что уже было сде- лано, какие решения приняты и какая цель стоит впереди. Одиночная языко- вая модель, лишенная долговременной памяти и навыков планирования, каж- дый раз все начинает с нуля. Ответом стал качественный сдвиг в архитектуре. Вместо одной модели- универсала стали создавать системы, где языковая модель является ядром, но не единственным компонентом. Ее начали окружать специализированны- ми модулями, каждый из которых отве- чает за свою задачу. Таким образом, фокус сместился с во- проса «Насколько умна наша модель?» к вопросу «Какую надежную систему мы можем построить вокруг нее?». На- дежность здесь обеспечивается четким разделением ответственности: языко- вой модели доверяют работу с есте- ственным языком и диалогом, а все кри- тически важные действия — работа с данными, вычисления, принятие ре- шений — остаются за специализиро- ванными контролируемыми компонен- тами. Этот архитектурный принцип опре- делил новое направление развития. Инженеры и исследователи переклю- чились с бесконечного наращивания
параметров моделей на проектиро- вание устойчивых систем, способных выполнять сложные, многоэтапные сценарии. Из этой парадигмы вырос и современный интерес к агентным под- ходам — созданию систем, где ИИ-ком- поненты могут самостоятельно плани- ровать последовательность действий, координировать работу инструментов и добиваться поставленных целей. ЧТО СКРЫТО ЗА ИНТЕРФЕЙСОМ ЧАТА Когда пользователь открывает чат и начинает диалог, может показать- ся, что перед ним единая программа, способная на все: отвечать на вопро- сы, создавать тексты, генерировать изображения или работать с кодом. На деле современный чат-бот — это сложная архитектура из взаимосвязан- ных компонентов, где языковая модель играет центральную, но не исчерпыва- ющую роль. Над языковой моделью работает слой управления диалогом. Он хранит исто- рию общения, решает, какой контекст передавать модели, ограничивает дли- ну ответов и следит за соблюдением правил. Здесь формируется ощущение связного разговора: система отбирает релевантные фрагменты предыдущих реплик и использует их для построе- ния ответа. Важную функцию выполняют также подключенные инструменты. Если поль- зователь просит выполнить расчет, со- здать картинку или проанализировать У любого чата есть предел того, сколько текста он способен учиты- вать одновремен- но. Этот предел называют кон- текстным окном. Если диалог ста- новится слишком длинным,ранние сообщения либо кратко переска- зываются, либо вовсе перестают учитываться. По- этому ощущение «памяти» всег- да ограничено текущим объемом контекста
Помимо сообще- ний пользова- теля и ответов системы внутри чата существу- ют служебные инструкции. Они задают стиль, рамки допусти- мого и правила поведения моде- ли. Пользователь их не видит. Их наличие часто объясняет, поче- му одинаковые вопросы в разных сервисах при- водят к разным ответам данные, языковая модель не делает это- го сама. Она формирует запрос и пере- дает его специализированному модулю. Например, генерацией изображений за- нимается отдельная модель, обученная на визуальных данных. Языковая мо- дель лишь составляет текстовое опи- сание и затем встраивает полученный результат в свой ответ. Аналогично устроена работа с кодом. Модель может предложить алгоритм или объяснить ошибку, но выполнение и проверка происходят в изолирован- ной среде. Результаты возвращают- ся системе, после чего модель интер- претирует их и формулирует итоговый ответ для пользователя. Это разделе- ние позволяет отделить рассуждения о коде от его реального выполнения. Для задач, требующих точных или актуальных данных, система обраща- ется к внешним источникам — поис- ковым системам, базам документов, внутренним хранилищам. Языковая мо- дель не имеет к ним прямого доступа. Она формирует запросы, а полученную информацию использует как матери- ал для ответа, не оценивая достовер- ность источников. Таким образом, современный чат- ИИ представляет собой координирую- щую платформу, где языковая модель служит связующим звеном между раз- личными компонентами. Она отвечает за понимание запроса и формирование ответа, а все действия, требующие точ- ности, проверки или взаимодействия с внешними системами, делегируются
специализированным модулям. Такое разделение ролей делает архитекту- ру гибкой и позволяет добавлять но- вые функции без полного пересмотра системы. Этот подход объясняет, почему чат-боты со временем обретают но- вые возможности, оставаясь внешне неизменными. Развивается не столько ядро модели, сколько ее инструмен- тальное окружение. Эта стратегия — наращивание возможностей через ин- теграцию, а не только через рост самой модели — стала основным направлени- ем эволюции сложных ИИ-систем в по- следние годы. АГЕНТСКИЕ СИСТЕМЫ: ПОПЫТКА ПРЕВРАТИТЬ МОДЕЛЬ В ИСПОЛНИТЕЛЯ Современные чат-интерфейсы во мно- гом уже напоминают простейшие агент- ские системы. Они способны не только отвечать на вопросы, но и обращаться к внешним инструментам — искать дан- ные, производить вычисления, работать с файлами или создавать изображения. Однако г; таких сценариях инициатива почти всегда остается у пользователя. Чатлишь реагирует на конкретный за- прос и выполняет ровно то, о чем его попросили, не пытаясь самостоятель- но развивать или продвигать задачу. Агентский подход меняет эту логи- ку. Агенту указывают не на отдельное действие, а на конечную цель. После этого система сама определяет, какие Важную роль играет и инфра- структура эко- номии ресурсов. Если множество пользователей задают похожие вопросы, система может повторно использовать результаты вычислений или готовые фрагмен- ты ответов. Это снижает нагруз- ку и ускоряет отклик, но иногда приводит к за- метной разнице во времени ответа между запросами
При работе агентов клю- чевым принци- пом считается минимальный набор полномо- чий. Агенту дают доступ только к тем действи- ям, без которых задача не реша- ется. Например, разрешают чи- тать документы, но запрещают удалять файлы или отправлять сообщения. Это снижает риск се- рьезных ошибок даже при сбоях в логике шаги необходимы, в какой последова- тельности их выполнять и когда зада- чу можно считать завершенной. Вместо единичного запроса выстраивается це- почка взаимосвязанных действий, под- чиненных общей цели. Если чат — это продвинутый собеседник с доступом к инструментам, то агент — это попыт- ка создать исполнителя, который дей- ствует в заданных рамках и под контро- лем, но без необходимости постоянных указаний со стороны человека. Стоит отметить, что за этим эффектом не стоит появление самостоятельного разума. Почти всегда речь идет о более сложной системе, построенной вокруг языковой модели. Сама модель по-преж- нему работает только с текстом: она чи- тает инструкции, формулирует планы и объясняет свои действия. Все осталь- ное — поиск данных, вычисления, работа с файлами или внешними сервисами — выполняется отдельными, подключенны- ми к системе инструментами. Упрощенно агентскую систему можно представить как связку из трех ключе- вых компонентов: 1. Языковая модель, которая решает, что делать дальше, на основе кон- текста и поставленной цели. 2. Набор инструментов, которые вы- полняют конкретные действия: ищут информацию, производят расчеты. 3. Управляющий слой, который контро- лирует процесс: ограничивает чис- ло шагов, проверяет промежуточные результаты и решает, когда остано- вить выполнение.
Таким образом, агент — это не уни- версальный интеллект, а система при- нятия решений, встроенная в заранее определенный рабочий контур. На практике быстро выяснилось, что построить устойчивого агента — труд- ная задача. Система может зациклить- ся, начать повторять одни и те же действия или тратить ресурсы на бес- полезные попытки. Особенно ярко это проявляется в работе со сложными сре- дами, например неб-интерфейсами или корпоративными системами, неболь- шие ошибки на каждом шаге накапли- ваются, и в итоге агент терпит неудачу не из-за одного сбоя, а из-за цепочки мелких промахов. Поэтому в реальных продуктах аген- там почти никогда не предоставля- ют полную свободу. Их работу жест- ко ограничивают: заранее определяют набор доступных инструментов, макси- мальное число шагов и четкие критерии успешного завершения. Если система выходит за установленные рамки, про- цесс просто прерывается. Это не не- достаток, а необходимая инженерная мера: без подобных ограничений агент становится непредсказуемым, ресур- созатратным и несущим потенциаль- ные риски. Отдельная проблема связана с безо- пасностью. Как только агент получает возможность выполнять действия, воз- никает риск, что его можно направить по ложному пути через данные, с ко- торыми он работает. Например, скры- тая инструкция может быть размещена Для агентных систем важно, чтобы действия можно было безопасно повто- рять. Если из-за сбоя одна и та же команда выпол- нится дважды, последствия не должны быть разрушитель- ными. Поэтому практикуют подходы вро- де создания черновиков и обязательного подтверждения, а не немедлен- ного выполнения необратимых операций
Надежные агенты почти всегда ра- ботают по циклу: предложение шага, выполне- ние и проверка результата. Про- верка может быть автоматической или основанной на правилах. Такой цикл важнее сложных рассуждений — он позволяет ловить ошибки на раннем этапе и не давать им накапливаться в документе, на веб-странице или в по- лученном письме. Для модели это вы- глядит как обычный текст, который она может воспринять как команду. Поэ- тому современные агентские системы проектируют с допущением, что они мо- гут ошибаться: опасные операции тре- буют дополнительного подтверждения, а доступ к критически важным инстру- ментам строго регламентирован. Со временем фокус разработчиков сместился от эффектных демонстра- ций к решению прикладных задач. Ста- ло очевидно, что без общих стандартов и унифицированных подходов такие системы трудно поддерживать и мас- штабировать. Поэтому в последние годы все больше усилий уходит на со- здание единых способов подключе- ния инструментов, описания поведе- ния агентов и контроля их работы.Это признак того, что направление пере- росло стадию эксперимента и посте- пенно оформляется в полноценную ин- женерную дисциплину. Если посмотреть, где агентский под- ход уже приносит практическую поль- зу, картина становится ясной. Он наи- более эффективен там, где: • среда ограничена и хорошо фор- мализована (например, внутренняя CRM-система или база документов); • набор возможных действий невелик и четко определен; • окончательный контроль и ответ- ственность остаются за человеком или за строгими правилами валида- ции.
В таких условиях агенты помогают анализировать документы, проводить рутинный поиск информации, ассисти- ровать в разработке и автоматизиро- вать повторяющиеся операции с дан- ными. Они не заменяют специалиста, но берут на себя часть его рутинной нагрузки. БОЛЬШИЕ ИЛИ ЭФФЕКТИВНЫЕ: СПОР О МАСШТАБЕ После впечатляющих успехов гигант- ских языковых моделей в начале 2020-х в индустрии почти сразу возник зако- номерный вопрос: действительно ли прогресс возможен лишь через беско- нечное увеличение масштаба или этот путь не единственный? Долгое время ответ казался очевидным: больше па- раметров, больше данных — больше вычислений. Однако к середине деся- тилетия в этом консенсусе начали по- являться трещины. Причина была прозаична и связана с экономикой. Обучение и эксплуата- ция с^ерхкрупных моделей требуют ко- лоссальных вычислительных ресурсов, сложной инфраструктуры и постоян- ных затрат. Это делает их доступными лишь для узкого круга пользователей и превращает в дорогие универсаль- ные платформы. На этом фоне все заметнее стал проявляться альтер- нативный подход: не гнаться за мак- симальными размерами, а стремиться к высокой эффективности при умерен- ных затратах. Эффективность модели — это не только ее раз- мер. Существуют приемы, позво- ляющие снизить стоимость работы без радикального ухудшения каче- ства. Например, квантизация (quantization) уменьшает точность чисел в вычислениях, что сокращает потребление па- мяти и ускоряет работу модели
Другой подход — ДИСТИЛЛЯЦИЯ (distillation). Большую модель используют как «учителя», обу- чая меньшую вос- производить ее ответы. В резуль- тате получается более компактная система, которую проще и дешевле использовать в массовых сер- висах Одним из самых показательных при- меров этого сдвига стала линейка мо- делей DeepSeek, активно развивавша- яся в 2024-2025 годах. Эти модели не претендовали на абсолютное ли- дерство по всем мыслимым тестам, но наглядно продемонстрировали важный принцип: благодаря тщатель- но продуманной архитектуре, каче- ственному отбору данных и сосре- доточении на практических задачах можно достичь результатов, сопоста- вимых с флагманскими решениями, при значительно меньших издержках. Для рынка это стало сигналом: доро- же не всегда означает умнее. Эффект DeepSeek имел не столько тех- нический, сколько стратегический ха- рактер. Эта разработка показала, что модели, оптимизированные по затра- там, могут быть конкурентоспособны- ми, особенно в прикладных сценариях, где критически важны скорость откли- ка, стоимость эксплуатации и возмож- ность адаптации под конкретные нуж- ды. Для компаний и разработчиков это расширило пространство выбора: теперь вместо одной универсальной модели можно рассматривать целый спектр решений, каждое из которых оп- тимально для своих задач. При этом речь не идет о победе одно- го подхода над другим. Крупные моде- ли сохраняют преимущество в универ- сальности и способности справляться с редкими и нестандартными запро- сами. Эффективные модели выигры- вают в устойчивости, экономичности
и легкости внедрения. На практике все чаще применяется комбинированная стратегия: мощная модель использу- ется как интеллектуальное ядро для сложных задач, а более легкие и оп- тимизированные модели обслужива- ют повседневные операции. Сегодня становится очевидно, что простой рост масштаба — не гаран- тия качественного прорыва. Улучше- ния обходятся все дороже, а отдача — все менее предсказуема. Поэтому спор «больше или эффективнее» транс- формировался из чисто техническо- го в стратегический. Он ставит вопрос не о том, какая модель лучше в абсо- люте, а о том, какие задачи мы решаем, какие ресурсы готовы вложить и какой баланс между мощностью и экономич- ностью является оптимальным для ка- ждой конкретной цели. ОТКРЫТЫЕ И ЗАКРЫТЫЕ МОДЕЛИ: НЕ ИДЕОЛОГИЯ, А СТРАТЕГИЯ С ростом возможностей языкоьых мо- делей вопрос их открытости выступает не спором о принципах, а прагматиче- ским выбором стратегии. Уже в начале 2020-х годов оформились два различ- ных подхода, каждый со своими силь- ными сторонами и ограничениями. Закрытые модели развивались в пер- вую очередь как сервисы. К ним от- носятся GPT-4 и его наследники от OpenAI, Claude от Anthropic и Gemini от Google. Их общая черта — пользова- тель получает доступ к возможностям Есть и архитек- турные реше- ния, такие как «смесь экспер- тов» (mixture of experts). Внутри подобной модели существует не- сколько специ- ализированных подсистем, но для каждого запроса акти- вируется лишь часть из них. Это позволяет расширять воз- можности модели без пропорцио- нального роста вычислительных затрат
ЧТО ЗНАЧИТ «ОТКРЫТАЯ МОДЕЛЬ» НА САМОМ ДЕЛЕ Когда говорят, что модель от- крытая, чаще все- го имеют в виду, что разработчики выложили ее веса. Веса — это огромный набор чисел, которые определяют, как модель реагирует на текст: какие слова считать связанными, какие ответы ве- роятнее. Проще говоря, это па- мять и привычки модели. При этом сами данные, на которых ее обучали, и про- цесс обучения могут оставаться закрытыми. По- этому открытая модель не всегда означает полную прозрачность модели через API или веб-интерфейс, но не имеет доступа к ее внутренне- му устройству или деталям обучения. Такой подход позволяет разработчи- кам централизованно управлять каче- ством ответов, выпускать обновления и обеспечивать безопасность. Он также дает возможность поддерживать слож- ную инфраструктуру, необходимую для работы гигантских моделей. Цена это- го удобства для пользователя — зави- симость от поставщика услуг и огра- ниченные возможности для глубокой адаптации под специфические нужды. Параллельно, особенно с 2023- 2024 годов, набрало силу движение в сторону открытых моделей. В этом случае публикуются архитектура и вес модели — по сути, ее память, выражен- ная в миллиардах чисел, которые за- дают, как модель реагирует на разные входные данные. Это позволяет запу- скать ее локально, изучать и дообучать под свои задачи. Среди заметных при- меров — французская линейка Mistral, модели Falcon, а также открытые вер- сии DeepSeek. Эти проекты показали, что даже без эксклюзивного доступа к гигантским ресурсам можно созда- вать конкурентоспособные решения, особенно если модель ориентирована на эффективность и конкретные при- кладные сценарии. Разница между подходами отчетли- во видна на практике. Закрытые моде- ли чаще используют как универсальные инструменты — для диалогов, создания текстов, помощи в программировании.
Они удобны там, где критически важ- ны стабильность и профессиональная поддержка. Открытые модели выбира- ют там, где требуется полный контроль над данными, возможность локально- го развертывания или строгое соответ- ствие внутренним требованиям безо- пасности. Например, компании могут запускать такие модели в своей защи- щенной инфраструктуре, не переда- вая конфиденциальные данные -знеш- ним сервисам. Необходимо сказать, что открытость не означает автоматически «лучше», а закрытость — «хуже». У открытых мо- делей выше риски неконтролируемого использования, сложнее централизо- ванно выпускать исправления и обнов- ления. У закрытых — выше операцион- ные затраты и меньше прозрачности. Поэтому к середине 2020-х нее боль- ше организаций пришли к гибридной стратегии: закрытые модели — для внешних задач и массовых сервисов, открытые — для внутренних систем, пилотных проектов и сценариев,тре- бующих глубокой кастомизации. Таким образом, спор «открывать или закрывать» давно перестал быть фило- софским. Он стал инженерным и эконо- мическим. Выбор сегодня определяется не убеждениями, а конкретным кон- текстом: доступными ресурсами, тре- бованиями к безопасности, норматив- ными ограничениями и теми задачами, которые необходимо решить. Поэтому оба направления продолжают актив- но развиваться и, судя по всему, будут Термин open source («ПО с открытым ис- ходным кодом») часто исполь- зуют неточно. В классическом смысле он озна- чает, что любой человек может посмотреть код программы, изменить его и использовать дальше. В ИИ это бывает редко: чаще открывают только часть системы.Чтобы понять реальные ограничения, полезно смотреть описание моде- ли — там обычно пишут, что имен- но можно делать, а что запрещено лицензией
сосуществовать еще долгое время, до- полняя друг друга в общей экосистеме искусственного интеллекта. Современный ИИ зависит не толь- ко от идей, но и от физи- ческой инфра- структуры. Для обучения моделей нужны тысячи мощных процессоров, специальные центры обра- ботки данных и стабильное электроснаб- жение. Поэтому развитие ИИ сегодня во мно- гом определяется теми, у кого есть доступ к вычис- лительным ресур- сам, а не только к талантливым исследователям ИИ КАК ИНДУСТРИЯ: ИНФРАСТРУКТУРА РЕШАЕТ ВСЕ К середине 2020-х годов прогресс в области искусственного интеллекта стал напрямую определяться состоя- нием промышленной инфраструктуры. Обучение и эксплуатация современ- ных моделей требуют специализиро- ванных вычислительных ускорителей, а рынок таких чипов оказался крайне концентрированным. Доминирующую роль на нем играют графические уско- рители NVIDIA, которые де-факто пре- вратились в отраслевой стандарт для тренировки больших моделей. Альтер- нативные решения существуют, однако пока применяются заметно реже и за- частую требуют значительной адапта- ции программного стека. Это привело к ситуации, когда до- ступ к вычислительным мощностям сам по себе стал стратегическим ресур- сом. Крупные корпорации и ведущие исследовательские центры заключают долгосрочные контракты на постав- ки ускорителей, строят специализи- рованные дата-центры и инвестируют в заблаговременное резервирование энергомощностей. Развитие ИИ все больше начинает напоминать реали- зацию крупного индустриального про- екта, а не чисто исследовательскую деятельность.
Энергопотребление выдвинулось на роль еще одного ограничивающе- го фактора. Современные центры об- работки данных потребляют десятки и сотни мегаватт, а вопросы эффек- тивного охлаждения и гарантирован- ного электроснабжения напрямую определяют возможности для масшта- бирования. Именно поэтому новые да- та-центры все чаще размещают в не- посредственной близости от крупных электростанций или в регионах с из- бытком дешевой и стабильной энер- гии. Это уже влияет на географию раз- вития ИИ, создавая неравные условия для разных стран и регионов. В результате фокус внимания раз- работчиков закономерно сместился. Вместо дискуссий о бесконечном росте параметров моделей все чаще подни- маются вопросы о сокращении вычис- лительных затрат: оптимизации архи- тектур, уменьшении размеров моделей без потери качества и переносе части вычислений на периферию, ближе к ко- нечному пользователю. Этот прагматич- ный интерес порожден не абстрактной идеей эффективности, а совершенно конкретными ограничениями: дефи- цитом чипов, растущей стоимостью электроэнергии и длительными сро- ками строительства необходимой ин- фраструктуры. Даже охлажде- ние стало важ- ным фактором. Большие серверы сильно нагрева- ются, и на их ох- лаждение уходит почти столько же энергии, сколько на сами вычис- ления. По этой причине ИИ-цен- тры часто строят рядом с источ- никами дешевой электроэнергии или в холодных регионах — гео- графия снова начинает влиять на технологиче- ский прогресс
Андрей Андреевич Марков (1856-1922). Фото ок. 1880 г. Российский математик, создатель теории цепей Маркова — стоха- стических процессов, описывающих последовательности случай- ных событий, где каждый следующий шаг определяется текущим состоянием. Эти идеи лежат ь основе моделей прогнозирования и обучения в ИИ
Бертран Рассел (1872-1970). Фото 1907 г. Британский философ и логик, один из создателей математиче- ской логики XX века. Его работы о формализации мышления и ло- гическом анализе языка стали теоретической основой для ал- горитмов рассуждения и ранних исследований искусственного интеллекта
ИИ: ПОМОЩНИК, А НЕ КОНКУРЕНТ Истинная опасность не в том, что машины начнут думать как люди, а в том, что люди начнут думать как машины. Норберт Винер ИИ уже способен на многое из того, что недавно было ис- ключительной прерогативой человека: анализировать, тво- рить, решать рутинные задачи. Однако его природа остает- ся природой сложного инструмента с жестко очерченными границами. Главный вопрос сегодня не в противостоянии человека и машины, а в том, как научить человека исполь- зовать ИИ для усиления собственного интеллекта, а не для делегирования ИИ критических решений. У ИИ-ассистента есть ограничение, которое называ- ют контекстным окном. Это мак- симальный объем текста, который он может «удер- живать в голове» за один раз: ваш вопрос, преды- дущие реплики, документы.Если информации больше, часть ее просто выпадает. Поэтому четкие и структуриро- ванные запросы работают лучше длинных и запу- танных ЧТО ТАКОЕ СОВРЕМЕННЫЙ ИИ-АССИСТЕНТ НА ПРАКТИКЕ Главное, что нужно понимать о со- временных ИИ-ассистентах вро- де ChatGPT, — это принцип их рабо- ты. Система не действует сама по себе и не ведет пользователя. Она всегда реагирует на запрос и работает стро- го в рамках, которые этот запрос зада- ет. Если цель, формат или ограничения не указаны явно, система не станет ос- мысленно их «додумывать» — она за- полнит пробелы статистически веро- ятными предположениями. Отсюда вытекает ключевая особен- ность: один и тот же ассистент может быть как полезным инструментом, так и источником путаницы — все зави- сит от формулировки. Общие вопро- сы порождают общие ответы. Нечет- кие запросы ведут к усредненным
результатам. Это не ошибка системы, а естественное поведение инструмен- та, который пытается угадать намере- ние пользователя по минимальному сигналу. Вторая важная черта — работа с кон- текстом. Ассистент учитывает только текст в пределах текущего чата. Если диалог длится часами или днями, си- стема будет опираться на предыду- щие сообщения, пока они остаются в ее окне контекста. Однако это окно не бесконечно: по мере роста диало- га ранние реплики постепенно пере- стают учитываться. Поэтому важные условия, цели и договоренности сто- ит периодически повторять или крат- ко резюмировать. При этом контекст чата — не память в человеческом смысле. Ассистент не формирует устойчивого представ- ления о пользователе, его предпочте- ниях или прошлых решениях за пре- делами конкретной беседы. Новый чат начинается с чистого листа. Даже внутри одного диалога информация сохраняется, пока она явно присут- ствует в доступной для модели части переписки. Третий практический аспект — от- ношение к фактам. Ассистент по умол- чанию не проверяет истинность утверждений и не отличает факты от правдоподобных формулировок так, как это делает человек. Он стремится выдать связный и убедительный текст, даже если данных недостаточно или вопрос допускает неоднозначность. Во многих систе- мах ассистент не «знает все», а сначала ищет информацию в документах или базе дан- ных, а уже потом формирует ответ. Такой подход называют «поиск плюс генерация». Это снижает риск ошибок: ответ строится не из абстракт- ных знаний, а из конкретных текстов, которые можно проверить
Когда ассистент считает, пишет код или стро- ит таблицы,он обычно не делает это «в голове». Эти действия выполняются отдельными программами — калькуляторами, интерпретатора- ми, таблицами. ИИ лишь форму- лирует задачу и анализирует результат. Поэ- тому он полезен как координа- тор, но не за- меняет сами инструменты Поэтому уверенный тон ответа не га- рантирует его точности. На практике ИИ лучше всего использовать для соз- дания структуры, подбора формули- ровок и генерации гипотез, но не как окончательный источник истины. Наконец, важно помнить, что асси- стент всегда работает в рамках зара- нее заданных правил и ограничений. Он может отказываться от ответов, смяг- чать формулировки или избегать пря- мых инструкций, например в вопросах, связанных с персональными данными, авторским правом или потенциально опасными темами. Это не сбой, а часть встроенных механизмов безопасности продукта. В итоге современный ИИ-ассистент — это инструмент совместной работы. Он ускоряет рутину, помогает формулиро- вать мысли и исследовать варианты, но не берет на себя ответственность за результат. Пользователь остается ключевой фигурой: именно он задает рамки, удерживает цель и решает, мож- но ли доверять полученному ответу. КАК ФОРМУЛИРОВАТЬ ЗАПРОСЫ, ЧТОБЫ ИИ БЫЛ ПОЛЕЗЕН Большинство сложностей при рабо- те с ИИ проистекают не из ограниче- ний модели, а из нечетко поставленной задачи. Ассистент не считывает кон- текст по умолчанию и не строит дога- док о ваших скрытых намерениях — он работает исключительно с тем, что явно сформулировано в запросе. Поэтому
качество ответа почти напрямую за- висит от точности и ясности постанов- ки вопроса. Во-первых, формулировать запрос через конкретную цель. Общие фразы вроде «напиши текст» или «расскажи о чем-нибудь» ведут к расплывчатым и малополезным результатам. Гораз- до эффективнее сразу обозначить, для чего именно нужен ответ: например, «подготовь черновик письма клиенту с объяснением задержки» или «сфор- мулируй краткое описание проекта для презентации». Четкая цель сразу зада- ет направление и резко снижает веро- ятность получения слишком абстракт- ного или нерелевантного ответа. Во-вторых, поскольку ассистент не знает вашей аудитории, стилисти- ческих предпочтений или условий ис- пользования результата, эти параме- тры стоит указывать явно. Для текста это может быть тон (деловой, разговор- ный, нейтральный), объем и уровень детализации. Для кода — язык про- граммирования, окружение и требова- ния к качеству. Даже простое уточне- ние вроде «объясни для человека без технического образования» или «опи- ши в виде коротких тезисов» способно кардинально изменить итоговый ответ. В-третьих, не пытаться решить слож- ную, многосоставную задачу одним за- просом. Если цель включает несколько этапов, эффективнее вести последо- вательный диалог: сначала запросить общий план или список подходов, за- тем детализировать отдельные пункты, ПРОСТОЙ РАБО- ЧИЙ ПРИНЦИП Хороший запрос почти всегда отвечает на четы- ре вопроса:что нужно сделать, на основе чего, в каком виде и с какими ограничениями. Например: «На- пиши короткое письмо клиенту о переносе сро- ков. Основание: задержка по- ставки. Формат: 6-8 предложе- ний, нейтраль- ный тон. Без юридических обещаний». Такая конкретика резко повышает каче- ство ответа
ИИ плохо пони- мает абстрактные пожелания вроде «сделай лучше». Зато хорошо реагирует на из- меримые крите- рии: «сократи текст на треть», «оставь три пункта», «убери сложные сло- ва». Чем яснее вы описываете резул ьгат, тем меньше модель «додумывает за вас» а после — доработать итоговый вари- ант. Такой пошаговый режим позволя- етудерживать логику задачи и вовремя корректировать направление, вместо того чтобы получить единый, но плохо пригодный для использования ответ. В-четвертых, следует явно указывать формат результата. По умолчанию си- стема выдает связный текст, однако если вам нужен список, таблица, крат- кое резюме или пошаговая инструкция, это нужно прямо обозначить в запро- се. Например: «ответь в виде списка из пяти ключевых преимуществ» или «сформулируй ‘’ыводы в одном абза- це». Отдельно стоит развивать навык точ- ной коррекции. Если ответ оказал- ся слишком общим, абстрактным или ушел в сторону, полезнее не переписы- вать запрос целиком, а дать конкрет- ные указания по доработке: «слишком обобщенно, приведи три конкрет- ных примера», «сосредоточься только на практических шагах», «убери вво- дные рассуждения и оставь суть». Ас- систент, как правило, хорошо реагиру- ет на такие направляющие. При этом важно постоянно помнить о естественных ограничениях системы. ИИ не имеет доступа к вашим внутрен- ним данным, не знает скрытого кон- текста и по умолчанию не проверяет фактические утверждения на досто- верность. Все, что существенно для за- дачи, должно быть либо явно описано, либо передано в виде текста или фай- ла. Кроме того, ассистент не принимает
на себя ответственность за решения — его ответы всегда стоит рассматривать как черновики, варианты или отправ- ные точки, а не в качестве окончатель- ных и безошибочных выводов. Хорошим ориентиром может служить представление о том, что вы форму- лируете задачу для внимательного, но не осведомленного помощника. Чем точнее и полнее вы объясните, что вам нужно, в каком виде и для каких целей, тем выше будет практическая ценность результата. В этом смысле современный ИИ — не источник готовых истин, а ин- струмент, который усиливает и ускоря- ет вашу работу, но только при условии, что вы разговариваете с ним на языке конкретных задач, а не смутных ожи- даний. КАК ИСПОЛЬЗОВАТЬ ИИ ДЛЯ РАЗНЫХ ЗАДАЧ И НЕ ОШИБАТЬСЯ В ГЛАВНОМ Современные ИИ-системы действи- тельно обладают широкими возмож- ностями, но их практическая ценность почти всегда определяется не масшта- бом заявленных функций, а грамотным выбором режима работы. В одном режи- ме модель эффективна как инструмент мышления: помогает разобрать аргу- менты, выстроить логическую струк- туру, сравнить альтернативы, выявить противоречия и предложить возмож- ные сценарии. В другом — от нее ожи- дают точных фактов и справок. И здесь возникает системное ограничение: Полезная при- вычка — просить модель разделять факты и рассуж- дения. Например: сначала перечис- лить утвержде- ния, которые можно прове- рить, а затем дать объяснение. Это особенно важно в темах, где цена ошибки высока: так вы сразу ви- дите, где нужно сверяться с пер- воисточниками
ДВА РЕЖИМА РАБОТЫ, КО- ТОРЫЕ ВАЖНО НЕ ПУТАТЬ ИИ особенно полезен там, где требуется мыш- ление: улучшить формулировку, навести порядок в тексте, срав- нить варианты, увидеть логиче- ски слабые ме- ста. Гораздо хуже он подходит для роли источника истины. Прак- тичный прием — просить модель явно разделять: что она считает надежным знани- ем, а что требует проверки по до- кументам или первоисточникам языковая модель может уверенно про- должать рассуждение даже при отсут- ствии достоверных данных, подменяя проверяемую информацию правдопо- добными, но вымышленными утвержде- ниями. Из этого вытекает базовое правило. В задачах, где важны логика, ясность изложения и работа с формулировка- ми, ИИ можно задействовать напря- мую. Там же, где требуется установ- ленная истина — точные даты, цифры, юридические нормы, актуальные пра- вила, — ИИ должен работать не как первичный источник, а как помощник в проверке. В таком режиме стоит за- прашивать не готовые выводы, а эле- менты, которые легко верифициро- вать: точные названия организаций и документов, ссылки на официальные стандарты и реестры, имена авторов исследований, годы публикаций, кор- ректные формулировки терминов. Это переводит работу из плоскости дове- рия к сгенерированному тексту в пло- скость проверки по первоисточникам, что значительно снижает риск принять красивое изложение за подтвержден- ный факт. Особенно важно различать встро- енные знания модели и поиск в ин- тернете. Знания модели подходят для объяснения общих понятий, базовых механизмов, исторического контекста и устоявшихся фактов, не подвержен- ных быстрым изменениям. Как только вопрос затрагивает актуальность — по- следние поправки в законодательстве,
свежие версии программ, новые прави- ла сервисов, текущие цены или ново- сти, — следует сразу ориентироваться на поиск по первоисточникам, обра- щая особое внимание на дату публика- ции и тип ресурса. Даже при наличии функции поиска надежность не гаран- тирована автоматически: модель мо- жет перепутать похожие страницы или пересказать вторичную информацию. Поэтому на практике хорошо зареко- мендовал себя редакторский подход: искать не просто URL, а конкретный до- кумент и выпустившую его организа- цию, а затем проверять информацию в соответствующем разделе официаль- ного сайта или репозитория. Ситуация усложняется, когда ИИ под- ключают к инструментам и наделяют возможностью совершать действия: анализировать документы,взаимодей- ствовать с сервисами, исполнять код, составлять письма или вносить правки в файлы. В таком контуре языковая мо- дель становится не просто источником ответов, а компонентом системы при- нятия решений. Это означает, что ее нельзя рассматривать как безошибоч- ного исполнителя. Надежность здесь обеспечивается внешним контролем: проверкой параметров, ограничени- ем прав доступа, детальным легирова- нием действий и четкими критерия- ми остановки. Практика показывает, что в подобных сценариях эффектив- нее требовать от модели не свобод- ный текст, а структурированные ответы по заданному шаблону — это упрощает Если вопрос за- висит от актуаль- ности — законы, цены,правила сервисов, версии программ, — по- лезно прямо спрашивать, на какие данные и какого периода опирается ответ. Языковая модель может звучать уверенно даже там, где информа- ция устарела или неполна. Такая проверка заранее экономит время и снижает риск ошибок
Рабочий способ использовать ИИ для провер- ки — просить не готовый ответ, а маршрут поис- ка. Например: где обычно публи- куют офици- альные доку- менты, в каких разделах сайта их искать, какие формулировки использовать. В этом режиме ИИ помогает ориентироваться, а не подменяет собой источник контроль и снижает вероятность про- пустить ошибку. У агентных сценариев есть и еще одна уязвимость, о которой стоит говорить открыто. Речь о внедрении вредонос- ных инструкций (prompt injections') — когда злонамеренные указания скры- вают внутри данных: на веб-странице, в документе или письме, так что модель воспринимает их как команды. Совре- менные рекомендации едины: чем боль- ше возможностей для действий пре- доставлено ИИ, тем строже должны быть внешние ограничения. Принцип наименьших привилегий, фильтрация входных данных и обязательное под- тверждение критически важных опера- ций — это не излишняя осторожность, а необходимая часть ответственной практики. РАБОТА С ТЕКСТАМИ: ЧТО ИИ РЕАЛЬНО ДЕЛАЕТ ХОРОШО На практике ИИ наиболее полезен в задачах, где требуется не «создать истину», а переработать, уточнить или привести в порядок уже имеющийся текст. Одна из самых сильных сторон — ре- дактирование и переформулирование. ИИ эффективно меняет стиль, сокра- щает объем, упрощает язык и устраня- ет повторы. Например, черновик можно быстро преобразовать в нейтральный деловой текст, сделать более разговор- ным или адаптировать для конкретной аудитории. Ключевой принцип здесь:
исходный смысл задает человек, а мо- дель работает над его формой. Чем точ- нее обозначены цель и желаемый стиль, тем ниже риск смысловых искажений. Вторая устойчивая функция — струк- турирование. ИИ полезен, когда нужно организовать поток мыслей или разроз- ненные фрагменты в логичную схему: план статьи, список аргументов, оглав- ление, последовательность шагов. Прак- тично действовать в два этапа: снача- ла запросить предлагаемую структуру, затем последовательно дорабатывать каждый ее пункт. Такой подход помога- ет быстро систематизировать материал и выявить пробелы в логике. Хорошо работает и резюмирование. ИИ способен сокращать длинные тек- сты, выделять ключевые тезисы и фор- мулировать краткие сводки. Это осо- бенно ценно при работе с отчетами, расшифровками интервью, стенограм- мами встреч и объемной перепиской. При этом важно помнить, что любое резюме — это интерпретация, поэтому в ответственных случаях стоит прове- рять, не были ли опущены важные ню- ансы, условия или оговорки. Отдельного внимания заслуживает адаптация текста для разных аудито- рий. Один и тот же материал можно пе- реработать для специалиста, руково- дителя или широкой публики, меняя уровень терминологии и детализации. ИИ успешно справляется с таким «пе- реводом» между стилями, что упроща- ет рабочую коммуникацию и подготов- ку пояснительных материалов. При редактиро- вании важных текстов — писем, инструкций, до- говоренностей — лучше просить ИИ не переписы- вать все заново, а работать как редактор. По- лезный формат: отдельный список изменений и по- яснение, зачем они сделаны.Это позволяет сохра- нить контроль над смыслом и избежать неза- метных подмен
В целом при работе с текстами ИИ стоит рассматривать как усилитель ва- ших возможностей. Он берет на себя рутинную часть, ускоряет редактирова- ние и помогает привести мысли в поря- док, но не заменяет ни ваше мышление, ни вашу ответственность как автора. ЧТО ТАКОЕ DIFF И ЗАЧЕМ ОН НУЖЕН Diff — это на- глядное срав- нение версий до и после: какие строки добавлены, какие удалены, какие изменены. Даже без опыта программирова- ния такой формат удобен: видно каждую правку, и по ней можно задать вопрос или отказаться от сомнительного изменения КОД, ДАННЫЕ И АВТОМАТИЗАЦИЯ: ГДЕ ИИ ЭКОНОМИТ ВРЕМЯ В работе с кодом и данными искус- ственный интеллект долгое время вос- принимался сугубо как вспомогатель- ный инструмент— нечто вроде умного автодополнения или помощника для на- писания отдельных фрагментов. Одна- ко за последние годы это представле- ние кардинально изменилось. Если говорить простыми словами, ИИ теперь все реже работает «строч- ка за строчкой» и все чаще — на уров- не целостной задачи. К примеру, ему можно описать проблему в программе, и он попытается самостоятельно опре- делить, в каких именно файлах и моду- лях требуется внесение правки, предло- жит конкретные исправления и оформит их как связный патч. Человеку при этом не приходится писать все вручную — он лишь оценивает предлагаемые измене- ния и решает, насколько они соответ- ствуют поставленной цели. Этот подход оказывается особенно ценным в работе с большими и лега- си-проектами, где основное время раз- работчика уходит не на написание но- вого кода, а на поиск нужного места
в кодовой базе и понимание сложных взаимосвязей между компонентами. ИИ может взять на себя именно эту, пер- воначальную аналитическую работу: просканировать структуру проекта, об- наружить релевантные участки и сфор- мулировать вариант решения. Однако важно четко осознавать его ограниче- ние: модель не знает внутренних дого- воренностей и специфики бизнес-логи- ки конкретной команды, а потому все ее предложения требуют обязательной экспертной проверки. Тот же самый принцип эффективно работает и при создании небольших программ и сценариев автоматизации. ИИ достаточно уверенно справляется с написанием простых скриптов, на- пример для пакетной обработки фай- лов, преобразования табличных дан- ных, очистки массивов информации или выполнения рутинных операций. В по- добных сценариях он часто выдает ра- бочий результат довольно быстро, при условии, что ему четко описали, что служит входом и что ожидается на вы- ходе. Но как только скрипт начинает затрагивать критически важные дан- ные или производственные процессы, без тщательной ручной проверки уже не обойтись. Отдельный и весьма полезный сце- нарий применения — это работа с та- блицами и системными логами, то есть служебными записями о работе при- ложений и инфраструктуры. ИИ мож- но попросить помочь разобраться в массиве таких данных: обнаружить При работе с таблицами ИИ полезен как помощник по выдвижению гипотез. Он может подска- зать, где искать ошибки: необыч- ные значения, пропуски, повто- ряющиеся сбои. Но итоговые выводы всегда стоит проверять вручную: модель не видит данные так же строго, как человек с каль- кулятором или формулой
Если ИИ пишет скрипт или делает автома- тизацию, стоит сразу просить предусмотреть сбои: пустые файлы, неожи- данные форматы, отсутствующие столбцы. Глав- ная ценность здесь не сам код, а то, что типич- ные проблемы продумываются заранее, до того как система сло- мается в работе повторяющиеся ошибки, выявить ано- малии или предложить возможные при- чины сбоев. Важно подчеркнуть, что в этом случае ИИ не выполняет диагно- стику проблемы, а лишь помогает инже- неру быстрее сформулировать рабочую гипотезу, которую затем необходимо проверить традиционными методами. Когда ИИ предлагает изменения в коде, результат обычно представляет- ся в виде наглядного списка правок: что именно было добавлено, удалено или изменено в каждом файле. В профес- сиональной среде такой вывод называ- ется diff (от англ, difference — разли- чие), но по сути — это просто удобное сравнение состояний «было» и «ста- ло». Подобный формат удобен тем,что человек может быстро охватить взгля- дом все предлагаемые модификации и оценить их потенциальное влияние, не погружаясь в детальный построч- ный анализ. Современные инструменты разработ- ки как раз и заточены под эту парадиг- му: ИИ функционирует в изолирован- ной, безопасной среде, где его действия не влияют напрямую на рабочую си- стему. Он лишь предлагает изменения, но никогда не применяет их автомати- чески. Финальное решение — прини- мать правки или отклонить их — всег- да остается за человеком. Этот принцип критически важен, поскольку даже не- значительная ошибка в коде может при- вести к серьезным операционным или финансовым последствиям.
ОГРАНИЧЕНИЯ И ПРАВИЛА:ЧТО ИИ ДЕЛАТЬ НЕ БУДЕТ Современные ИИ-системы действи- тельно умеют многое, но далеко не все, что может прийти в голову пользовате- лю. Значительная часть отказов и на- рочито осторожных формулировок в ответах — это не следствие техни- ческих сбоев или странностей модели, а прямой результат правовых, этиче- ских и репутационных рамок, в кото- рых такие системы обязаны функци- онировать. Один из самых заметных блоков огра- ничений связан с вопросами лицензий и авторского права. ИИ не должен до- словно воспроизводить защищенные авторским правом тексты или по за- просу дописывать книги, статьи и сце- нарии. Даже если модель в процессе обучения видела подобные тексты, она не имеет права выдавать их целиком. Поэтому вместо прямых цитат система часто предлагает пересказ, обобщение или вовсе отказывается выполнять за- прос — таков способ избежать наруше- ния авторских прав. Отдельная и критически важная зона ограничений — это область профес- сиональных советов, где цена ошибки чрезвычайно высока. Речь идет не толь- ко о явно незаконном или оскорбитель- ном контенте, но и о персонализиро- ванных рекомендациях в сферах, где по закону требуется лицензирован- ный специалист. Прежде всего это ме- дицина, юриспруденция, финансовые консультации и вопросы, напрямую ПОЧЕМУ ИИ ИНОГДА УКЛОНЯЕТСЯ ОТ ОТВЕТА Отказ или обоб- щенный ответ часто связан не с возможно- стями модели, а с правилами и ответственно- стью. ИИ не дол- жен выдавать персональные медицинские диагнозы, юриди- ческие стратегии под конкретное дело или ав- томатические решения, влия- ющие на жизнь человека. В таких случаях система ограничивается общими поясне- ниями и сове- тует обратиться к специалисту
С авторским правом ситуа- ция проста: ИИ может объяснить смысл текста, но не должен воспроизводить большие фраг- менты защищен- ных материалов дословно.Если нужен контент, безопаснее про- сить пересказ, структуру, крат- кое изложение или пояснение своими словами влияющие на безопасность и благопо- лучие человека. Именно по этой причи- не ИИ часто отвечает общими и уклон- чивыми фразами на запросы поставить диагноз, разработать правовую страте- гию или принять инвестиционное ре- шение. Такие ответы кажутся осторож- ными не потому, что модель не знает ответа, а потому что автоматическое принятие подобных решений без че- ловеческого контроля несет неоправ- данно высокие риски. С этим же тесно связан блок огра- ничений, касающихся работы с пер- сональными данными, который се- годня трактуется значительно шире, чем просто запрет на использование адресов и телефонов. Современные регуляторные нормы запрещают при- менять ИИ для классификации людей по биометрическим признакам, сбора и анализа баз фотографий, попыток определить чувствительные атрибуты личности или делать выводы об эмо- циональном состоянии человека в та- ких контекстах, как школа или рабо- чее место. Также под строгим запретом находятся системы социального ско- ринга (social scoring) — любые попыт- ки оценивать людей и их поведение в баллах или рейтингах для принятия административных или иных решений. Эти ограничения напрямую отражают подходы, закрепленные, в частности, в европейском регламенте GDPR, и по- степенно становятся глобальным стан- дартом для крупных технологических продуктов.
Близкая к предыдущей тема — ге- нерация синтетических лиц и голосов. Сегодня недопустимо использовать чу- жой визуальный образ или голос без явного согласия так, чтобы это вводи- ло третьих лиц в заблуждение. Созда- ние реалистичных видео- и аудиома- териалов сопровождается жесткими требованиями прозрачности: поль- зователь должен однозначно пони- мать, что перед ним синтетический, а не подлинный контент. В ряде юрис- дикций такие требования уже закре- плены законодательно, что напрямую влияет на то, как сервисы проектируют предупреждающие маркеры, пометки и ограничения на использование по- добных функций. Пользователей зачастую раздража- ет, когда ИИ отказывается выполнить запрос без детальных объяснений. По- мимо общего принципа предосторож- ности, здесь есть и сугубо практиче- ская причина, о которой много говорят специалисты по безопасности. Совре- менные модели уязвимы к так назы- ваемым скрытым инструкциям (prompt injections), которые мы уже упомина- ли. Именно из-за этой угрозы продукты особенно жестко ограничивают погра- ничные сценарии, когда ИИ подклю- чен к внешним инструментам и может не просто отвечать, но и совершать дей- ствия: отправлять запросы, изменять файлы или выполнять операции от име- ни пользователя. Наконец, важно понимать, что су- ществующие ограничения касаются Персональные данные — это не только теле- фоны и адреса. Ограничения ка- саются и попыток собирать базы людей, связывать человека с чув- ствительными признаками или делать выво- ды о личности по внешности, голосу или по- ведению. Такие запросы часто блокируются заранее
Отдельная зона ограничений — синтетические лица и голоса. Использовать образ или голос реального человека без согласия нельзя, особенно если это может ввести в заблуждение. Поэтому многие сервисы требуют янной маркиров- ки синтетиче- ского контента и подтверждения права на его использование не только формулировки ответов, но и политики обращения с пользо- вательскими данными. Поведение си- стемы во многом зависит от режи- ма приватности конкретного сервиса и тарифного плана: в одних случаях пользовательский ввод может исполь- зоваться для дальнейшего улучшения моделей, в других — по умолчанию пол- ностью исключается из процессов до- обучения. Этот аспект не всегда оче- виден в ходе диалога, но он формирует важную практическую рамку, опреде- ляющую, какие задачи разумно до- верять ИИ, а какие — категорически не следует.
ВЗГЛЯД В БУДУЩЕЕ ИИ Лучший способ предсказать будущее — создать его. Алан Кей Контуры будущего ИИ определяются не в вакууме, а в кор- поративных стратегиях, на рынке труда, в законах и этиче- ских кодексах. Общество уже решает, где допустима пол- ная автоматизация, а где необходим человеческий контроль. От этого зависит, станет искусственный интеллект двигате- лем прогресса или источником новых кризисов. ЭКОНОМИКА И ЗАНЯТОСТЬ: ЧТО НА САМОМ ДЕЛЕ ПОД УГРОЗОЙ Разговор об ИИ и рынке труда ча- сто колеблется между двумя край- ностями: либо «машины отнимут все профессии», либо «ничего принци- пиально не изменится». Реальность сложнее и неприятнее обеих версий. Да, ИИ сегодня не заменяет профес- сию целиком. Но это не означает, что вытеснения никогда не будет — оно просто происходит иначе, чем приня- то представлять. ИИ автоматизирует не профессии, а наборы задач. Проблема в том, что в ряде профессий именно эти задачи и составляют основную часть повсед- невной работы. Когда такая доля ста- новится автоматизируемой, профес- сия начинает «усыхать»: требуется меньше людей, меняются требования к входу, падает ценность типовых на- выков. Это и есть вытеснение, просто не одномоментное. Экономисты все чаще описыва- ют влияние ИИ не через исчезно- вение профессий, а через изме- нение состава работы внутри них. В любой должности есть повторяющиеся операции и есть задачи, требу- ющие суждения и ответственно- сти. ИИ быстрее всего берет на себя рутину, а не всю работу целиком, поэтому профессии чаще меняются, чем исчезают
У использования ИИ есть два эф- фекта. Первый — ускорение: человек делает ту же работу бы- стрее, например готовит черновик отчета или пер- вичный анализ данных. Вто- рой — замена: отдельные опе- рации перестают существовать как самостоятельная работа. В сферах с высокой ценой ошибки — ме- дицине, праве, финансах — обычно растет значение про- верки и личной ответственности, а не происходит полное вытесне- ние человека Часто в этом контексте упоминают вра- чей и юристов, и неслучайно. В медици- не ИИ уже сейчас хорошо справляется с анализом изображений, подготовкой за- ключений, сортировкой случаев, первич- ным сбором данных. Это не замена врача, но серьезное сокращение времени на ру- тинную часть работы. В результате систе- ме здравоохранения требуется меньше специалистов для обслуживания того же объема пациентов, а требования к остав- шимся растут: больше ответственности, больше контроля, меньше пространства для «механической» практики. В юриспруденции ситуация похожая. ИИ умеет искать судебную практику, анализировать договоры,находить ри- ски, готовить черновики документов. Это напрямую бьет по тем ролям, кото- рые раньше выполняли младшие юри- сты и помощники. Вход в профессию становится уже, а карьерная лестни- ца — короче. Формально профессия остается, но количество мест и траек- тории внутри нее меняются. Похожий процесс идет и в других об- ластях: бухгалтерии,аналитике, пере- воде, редактуре, службах поддержки. Везде, где значительная часть работы сводилась к обработке текста, данных или типовых решений, ИИ снижает по- требность в человеческом труде. Это не всегда означает массовые увольне- ния, но почти всегда знаменует давле- ние на зарплаты и рост конкуренции. При этом есть и обратная сторона. ИИ создает новые роли и усиливает старые: появляются задачи контроля,
интеграции, постановки целей, провер- ки качества, работы с последствиями решений. Но эти роли требуют более высокого уровня подготовки и ответ- ственности. Поэтому ИИ не просто уничтожает рабочие места — он пере- страивает рынок в пользу более квали- фицированных и гибких специалистов. Важно и то, что скорость изменений может быть выше, чем способность об- щества адаптироваться. Образование, переквалификация и социальные инсти- туты традиционно реагируют медленно. Из-за этого переходный период может быть болезненным: не все смогут или захотят перейти на новые роли, и не все рынки труда готовы их предложить. ИИ действительно будет вытеснять часть профессий и ролей, но это не ав- томатический «конец труда», а слож- ный и неравномерный сдвиг. Он создает новые возможности, но одновремен- но усиливает риски как для отдельных людей, так и для экономики в целом. ОБЩИЙ ИИ И СВЕРХИНТЕЛЛЕКТ: ЧТО СКРЫВАЕТСЯ ЗА ГРОМКИМИ СЛОВАМИ Термины «общий искусственный ин- теллект» и «сверхинтеллект» звучат все чаще — в новостях, инвестицион- ных презентациях и публичных дис- куссиях. При этом за одними и теми же словами разные люди нередко имеют в виду совершенно разные вещи, из- за чего разговор быстро уходит либо в фантастику, либо в пустые споры. Есть и менее оче- видный риск — усложнение входа в профес- сию. Раньше но- вичкам поручали простые задачи: первичный поиск информации, чер- новые расчеты, типовые тексты. Если это делает ИИ, стартовых позиций стано- вится меньше. В результате от начинающих специалистов все чаще ждут более высокого уровня первичной подго- товки
Идею резкого ускорения разви- тия умных систем сформулиро- вал математик И. Дж. Гуд еще в 1960-х годах. Он предположил, что если система сможет улучшать собственные методы,прогресс может пойти быстрее при- вычных темпов. Это не прогноз дат и не обеща- ние результата, а теоретический сценарий, помо- гающий обсуж- дать возможные риски Под общим искусственным интеллек- том обычно понимают систему, которая способна решать широкий круг задач на уровне человека, переносить знания между областями и самостоятельно ос- ваивать новые виды деятельности. Под- черкиваем: это не просто «очень мощная модель» и не сумма отдельных навыков. Речь идет о гибкости и универсальности, которые позволяют системе действовать вне заранее очерченных сценариев. Современные ИИ-системы, включая са- мые продвинутые языковые модели, к это- му уровню не относятся. Они могут выгля- деть универсальными, потому что умеют работать с текстом, кодом, изображени- ями и данными, но все эти способности опираются на одну и ту же основу — рас- познавание статистических закономерно- стей в больших массивах данных. У таких систем нет собственных целей, намере- ний, понимания контекста в человеческом смысле и опыта взаимодействия с миром вне данных и инструкций. Они не хотят ничего и не могут самостоятельно опре- делить, что для них важно. Понятие сверхинтеллекта идет еще даль- ше. Под ним обычно понимают гипотети- ческую систему, которая превосходит че- ловека практически во всех когнитивных областях и способна улучшать саму себя. Эти сценарии активно обсуждаются не по- тому, что они уже на горизонте, а потому что потенциальные последствия такого разви- тия слишком велики, чтобы их игнориро- вать. Даже небольшая вероятность требует внимания, если ставка — контроль над тех- нологиями с огромной силой воздействия.
Однако здесь важно отделять научное обсуждение от медийного хайпа. На се- годняшний день нет ни теоретического консенсуса, ни практических признаков того, что существующие архитектуры на- прямую ведут к общему ИИ или, тем бо- лее, к сверхинтеллекту. Прогресс идет быстро, но он по-прежнему опирается на рост данных, вычислений и инженер- ных улучшений, а не на принципиально новое понимание разума. Тем не менее разговоры об общем ис- кусственном интеллекте и сверхинтел- лекте оказывают реальное влияние. Они формируют ожидания инвесторов, на- правление исследований и подходы к ре- гулированию. Опасность здесь двойная. С одной стороны, чрезмерный оптимизм может привести к переоценке возможно- стей систем и опасным экспериментам. С другой — апокалиптические сцена- рии могут отвлекать внимание от более приземленных, но уже существующих рисков: ошибок, смещения ответствен- ности, неравенства доступа и неконтро- лируемого применения ИИ. ЧЕЛОВЕК И ИИ: КАК ЖИТЬ И РАБОТАТЬ В НОВОЙ РЕАЛЬНОСТИ ИИ уже перестал быть эксперимен- том и стал рабочим инструментом, по- этому главный практический вопрос се- годня не в том, заменит ли он человека, а в том, кто и за что отвечает. Современ- ные системы умеют предлагать вари- анты, ускорять анализ и автоматизиро- вать рутинные операции, но они не несут Одна из клю- чевых проблем будущих мощных систем связана не с намерения- ми, а с точностью формулировок. Машина может идеально выпол- нять заданную цель, понимая ее буквально, а не так, как подразумевал человек. Поэтому в современных обсуждениях все внимание смещается к тому, как правильно задавать цели и как ограничи- вать действия системы
Во многих се- рьезных системах ИИ не принимает окончательных решений. Он помогает собрать информацию, предложить ва- рианты или под- светить риски, но финальный выбор остается за человеком. Такой подход используют там, где ошибка может дорого стоить: в медици- не, кредитовании, кадровых реше- ниях, системах безопасности ответственности за свои действия. Лю- бое решение, влияющее на людей, день- ги, здоровье или безопасность, по-преж- нему остается на стороне человека. На уровне повседневной работы че- ловеку нужно следовать такому пра- вилу: ИИ — помощник, а не источник окончательных решений. Его разумно использовать для подготовки материа- лов, сравнения сценариев, проверки ло- гики, черновых расчетов и поиска сла- бых мест. Но финальное утверждение, подпись и ответственность нельзя де- легировать. Там, где цена ошибки высо- ка, человек должен понимать контекст, ограничения и возможные последствия. Из этого напрямую вытекает сдвиг в навыках. Ценность работника сме- щается от умения быстро производить результат к умению управлять процес- сом: формулировать задачу, задавать рамки, проверять выводы и вовремя останавливать автоматизацию. Рабо- та с ИИ требует не доверия, а дисципли- ны: уточняющих вопросов, повторной проверки, разделения фактов и интер- претаций, а иногда и осознанного от- каза от использования ИИ там, где он создает больше рисков, чем пользы. Однако ответственность не может ле- жать только на отдельных пользовате- лях. Поэтому параллельно развивается регулирование, которое фиксирует об- щие границы допустимого. Его задача — не затормозить развитие технологий, а встроить ИИ в социальную и экономи- ческую систему так, чтобы последствия были управляемыми. Один из ключевых
принципов здесь — обязательное уча- стие человека в критических решениях: в медицине, образовании, найме, креди- товании, безопасности. Регуляторы все чаще требуют про- зрачности: пользователи должны по- нимать, когда имеют дело с ИИ, что синтетический контент должен марки- роваться, а автоматизированные си- стемы — иметь понятные ограничения. Отдельно выделяются высокорисковые применения, для которых вводятся тре- бования к тестированию, документации и контролю. Это уже влияет на то, ка- кие функции появляются в продуктах и как именно они реализуются. Важно и то, что правила касаются не только ответов системы, но и об- ращения с данными. Ограничивается использование персональной инфор- мации, вводятся жесткие рамки для биометрии, запрещаются практики со- циального скоринга, усиливается кон- троль за тем, как данные собираются и хранятся. В результате ИИ все чаще проектируется не как «все умеющий помощник», а как компонент системы с заранее заданными рамками. В итоге формируется новая рабочая норма. ИИ не рассматривается как са- мостоятельный субъект, принимающий решения, а как часть цепочки, где роли распределены: модель предлагает, че- ловек проверяет, организация отвеча- ет, а государство задает правила. Это делаеттехнологии менее эффектными, но более надежными и пригодными для реального использования. Чтобы ИИ был полезным и безопасным, важны три вещи: понятно, где он используется; есть процедуры проверки его работы; мож- но разобрать ошибки задним числом. Поэто- му в реальных системах фик- сируют запросы, ответы и дей- ствия, а также то, кто утвердил результат. Это по- зволяет не только искать виновных, но и улучшать саму систему
Марвин Минский (1927-2016). Американский ученый, один из основателей исследований искусственного интеллекта. Соосновагель Лаборатории ИИ MIT, автор ключевых идей о струк- туре разума и книги «Общестзо разума», повлиявшей на развитие когнитивных моделей и ИИ
Клод Шеннон (1916-2001). Американский математик и инже- нер, создатель теории информации. Его работы заложили основы цифровой связи, кодирования данных и всей современной вычис- лительной техники, без которой невозможны компьютеры и ис- кусственный интеллект
ЛИТЕРАТУРА 1. Бишоп К. М. Распознавание образов и машинное обуче- ние. М.: Диалектика, 2020. 2. Винер Н. Кибернетика, или управление и связь в живот- ном и машине. М.: Наука, 1983. 3. Гудфеллоу И., Бенджио И., Курвилль А. Глубокое обуче- ние. М.: Диалектика, 2018. 4. Минский М. Сообщество разума. М.: URSS, 2018. 5. Нильссон Н. Дж. Искусственный интеллект. Методы по- иска решений. М.: Мир, 1973. 6. Перл Дж., Маккензи Д. Думай почему? Причина и след- ствие как ключ к мышлению. М.: Альпина нон-фикшн, 2020. 7. Рассел С., Норвиг П. Искусственный интеллект: совре- менный подход. М.: Вильямс, 2016. 8. Саттон Р. С., Барто Э. Г. Обучение с подкреплением: вве- дение. М.: Диалектика, 2021. 9. Уинстон П. X. Искусственный интеллект. М.: Мир, 1980. 10. Хасти Т., Тибширани Р., Фридман Дж. Основы статисти- ческого обучения. М.: Диалектика, 2019.
Все права защищены Книга или любая ее часть не может быть скопирована, воспроизведена в электронной или механической форме, в виде фотокопии, записи в память ЭВМ, репродукции или каким-либо иным способом, а также использована в любой информационной системе без получения разрешения от издателя Копирование, воспроизведение и иное использование книги или ее части без согласия издателя является незаконным и влечет уголовную, административную и Iражданскую ответст вечность. Издание для досуга ЭНЦИКЛОПЕДИЯ БЫСТРЫХ ЗНАНИЙ. ДЛЯ ТЕХ, КТО ХОЧЕТ ВСЕ УСПЕТЬ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ Главный редактор Р. Фасхутдинов Руководитель направления М Соболева Ответственный редактор С Шевчук Менеджер проекта С. Шевчук Страна происхождения Российская Федерация Шыгарушы ел: Ресей Федерациясы ООО «Издательство «Эксмо- 123308, Россия, г Москва ул Зорге, д 1 стр 1 эт 20 *аб 2013 Тел.: 8 (495) 411 68 86 Home page www.eKsmo.ru t mail: info&eksmo.ru 0наруш1 «Издательство -Эксмо- ЖШК 123308, Ресеи Мнскеу кал асы, Зорге кешест- 1-уй, 1-куры лыс 20 кабал 2013-каб Тел .8(495)411-68 66 Home page www.eksmo rv E-mail: into®eksmo ru Тауаобелма -Эксмо- Интернет магазин Awwoook24.ru Интернет-магазин www.book24.kz Интерне г-дукен www.oook24.kz Импортер в Республику Казахстан ТОО -РДЦ-Алматы кдзаксган Рет ||убликасына импорт тзушы «РДц Алматы- жШС Дигтрибыотор и представитель -то пр, я-му прел чI тии на трсдукцию в Республике Казахстан 1 ОО РДЦ-Алматы- ГОО РДцАпмв1Ы. Алмагы ул. Домброискгло 3«а» литер Б, офис 1. Дистрибьютор жане Казахстан Республикасында ентмге шагымдар кабылдауженндепект РДЦ-Алматы- ЖШС Алма- ы к. Домбровст-ий кош 3 -а-, ли гео Б офис 1 Тел 8(7771251-59-90/91/92 E-mail’ RDC-AIrnatyePeksmo kz Сведении о подтверждении соответствия издания согласно законодательству РФ о техническом регулировании можно получить на сайте Издательства -Эксмо»: www.eksmc.ru certrtrcation Техникалыкреттеу туралы РФ заннамасынасаи басылымнынсэйкеспгтн растау туралы мал1меттерд| мына адрес бойынша алута болады: tTttp://eksmo.ru/certificabon, Произведено в Российской Федера! ми Ресеи Федерациясыпда enaipini ен Сертификаттаута жатпайды Дата изготовления / Подписано в печать 24,02 2026. Формат 84х 108’/зг. Гарнитура -’OfficinaSans». Печать офсетная Усл. печ. л. 6,72 Тираж экз Заказ
Москва. ООО < Торговый Дом «Эксмо» Адрес. 123308. г. Москва ул. 3opie, д.1, строение 1 Телефон. +7(495)411-50'74, E-mail: reception@eksmo-sale.ru По вопросам приобретения книг «Эксмо» зарубежными оптовыми покупателями обращаться в отдел зарубежных продаж ТД «Эксмо» E-mail international@eksmo-sale. ru International Sales, international wholesale customers should contact Foreign Sales Department ot Trading House «Eksmo* tor their orders. tnternational@eksmo-saie.ru По вопросам заказа книг корпоративным клиентам, в том числе в специальном оформлении, обращаться по тел : +7 (495) 411 -68-59, доб. 2151. E-mail: borodkin.da@eksmo.ru Оптовая торговля бумажно-беловыми и канцелярскими товарами для школы и офиса «Канц-Эксмо-. Компания «Канц-Эксмо» 142702 Московская обл.. Ленинский р-н, г. Видное-2. Белокаменное ш., д. 1. а/я 5 Тел./факс: +7 (495) 745-28-87 (многоканальный) e-mail kanc@eksmo-saie.ru, сайт: www.kanc-eksmo.ru Филиал «Торгового Дома «Эксмо» в Нижнем Новгороде Адрес 603094, г. Нижний Новгород, улица Карпинского, д. 29, бизнес-парк «Грин Плаза» Телефон-+7 (831) 216-15-91 (92 93 94) E-mail reception@eksmonn.iu Филиал ООО 'Издательство 'Эксмо» в г Санкт-Петербурге Адрес. 192029, г Санкт-Петербург, пр. Обуховской обороны, д 84. лит. «Е» Телефон.+7 (812) 365-46 03/04 E-mail seiver@szko.ru Филиал ООО «Издательство «Эксмо» в г. Екатеринбурге Адрес: 620024. г. Екатеринбург, ул. Новинская, д. 2щ Телефон:+7 (343) 272 72-01 (62/03/04/05/0G/08) Филиал ООО -Издательство «Эксмо» в г. Самаре Адрес 443052. г Самара, пр-т Кирова, д 75/1. лит. • Е» Телефон. +7 (846) 207-55-50 E-mail: nDC-saniara@maii.ru Филиал ООО -Издательство «Эксмо» в г. Ростове-на-Дону Адрес 344023. г. Ростов-на-Дону, ул. Страны Советов. 44Д Телефон +7(863)303-62-10 E-mail info@rndeksmo.ru Филиал ООО «Издательство «Эксмо» в г. Новосибирске Адрес: 630015, г. Новосибирск, Комбинатский пер , д. 3 Телефон: +7(383) 289-91-42 E-mail, eksmo-nsk@yandex.ru Обособленное подразделение в г. Хабаровске Фактический адрес 680000 г Хабаровск, ул Фрунзе. 22. оф 703 Почтовый адрес 680020, г Хабаровск, А/Я 1006 Телефон (4212)910-120 910-211 E-mail eksmo-khv@maii.ru Республика Беларусь: ООО «ЭКСМО ACT Си эндСи» Центр оптово-розничных продаж Cash&Carry в г. Минске Адрес 220014 Республика Беларусь, г Минск, проспект Жукова 44, пом 1 -17, ТЦ «Outleto» Телефон. -375 17 251-40-23, +375 44 581-81-92 Режим работы: с 10.00 до 22.00 E-mail: exmoast@yandex.by Казахстан: «РДЦ Алмат ы» Адрес 050039, г. Алматы, ул. Домбровского. ЗА Телефон: +7 (727) 251 58-12. 251 59 90 (91 92.99). Е mail RDC-Almaty@eksmo kz Полный ассортимент продукции О< *О «Издательство «Эксмо» можно приобрести в книжных магазинах «Читай-город» и заказать в интернет-магазине: www chitai-goiod.ru. Телефон единой справочной службы 8 (8<:Э) 444-8-444 Звонок по России бесплатный Интернет-магазин ООО «Издательство -Эксмо» www. eksmo. ru Розничная продажа книг с доставкой по всему миру. Тел +7(495)745-89-14 E-mail: imarket@eksmo-sale.ru Издательство «Эксмо» — универсальное издательство №1 в России, является одним из лидеров книжного рынка Европы Хочешь стать автором «Эксмо»»? ЭКСМО о eksmo ru COO eksmi ЧИТАЙТЕ И СЛУШАЙТЕ в Литрес ш ЧИТАЙ ГОРОД eksmo.ru Официальный интернет-магазин издательства «Эксмо» ТЕРРИТОРИЯ КНИЖНЫЙ МАГАЗИН Официальная франшиза издательства • Эксмо»
Мы используем искусственный интеллект для онолизо донных, программирования, прокладывания маршрутов, создания изо- бражений и автоматизации процессов - но при этом редко понимаем, как он устроен, на что действительно способен и где проходят границы его применения. Эта книга поможет вам выстроить целостное представление об искусственном интеллекте, о принципах его работы и логике мышления. Вы разберетесь, как нейросети обучаются, как они распознают изображения и речь, как алгоритмы анализируют поведение и интересы пользователей. Вы узнаете, как формулировать промпты, чтобы получить наилучший результат, а также какие задачи стоит доверять ИИ, а какие - нет и почему. • КАКИЕ НЕЙРОСЕТИ СУЩЕСТВУЮТ СЕЙЧАС И ЧЕМ ОНИ РАЗЛИЧАЮТСЯ • КАК ЭФФЕКТИВНО ИСПОЛЬЗОВАТЬ ИИ ДЛЯ АВТОМАТИЗАЦИИ ВАШИХ ПОВСЕДНЕВНЫХ ЗАДАЧ • ПОЧЕМУ ТАК ВАЖНО УМЕТЬ СОСТАВЛЯТЬ ПРОМПТЫ • ЧТО НАДО ЗНАТЬ О МИРЕ, ГДЕ ИИ СТАЛ ЧАСТЬЮ ПОВСЕДНЕВНОСТИ ОБ ЭТОМ И МНОГОМ ДРУГОМ В КОМПАКТНОМ И СОДЕРЖАТЕЛЬНОМ СПРАВОЧНИКЕ ДЛЯ ТЕХ, НТО ХОЧЕТ ВСЕ УСПЕТЬ. Задача серии «Энциклопедия быстрых знаний» — рассказать просто, коротко и увлекательно о сложном. Книги послужат отличным источником базовых знаний и донесут общее понимание основных терминов и ключевых моментов в различных областях. Книги будут интересны читателям всех возрастов, решившим расширить свои знания в той или иной области и сделать это в быстрой и увлекательной форме. ISBN 978-5-04-225558-8 1L БОМБОРА ИЗДАТЕЛЬСТВО БОМБОРА — лидер на рынке полезных и вдохновляющих книг Мы любим книги и создаем их, чтобы вы могли творить, открывать мир, пробовать новое, расти. Быть счастливыми Быть на волне.