Рабочая память

⏱️ Примерное время: ~12 минут · 🎯 Урок 8 курса «Возможности и ограничения ИИ» · 🎬 видео

Чему вы научитесь

Примерное время: 30 минут

К концу этого урока вы сможете:

  • Объяснять контекстное окно как контейнер фиксированного размера и понимать, что это означает для длинных документов, длинных диалогов и памяти между сессиями
  • Распознавать «обрывистый» характер этого свойства в отличие от плавной деградации других свойств
  • Применять стратегии использования контекста как рычага: выносить важный материал в начало, дробить длинную работу на части, повторно поставлять критически важный контекст
  • Видеть в памяти, уплотнении (compaction), проектах/рабочих пространствах и более крупных окнах продуктовые функции, направленные на преодоление этого ограничения

Как контекстное окно влияет на результаты генеративного ИИ

(6 минут)

Всё, на что обращает внимание AI, находится внутри рабочего пространства фиксированного размера, которое называется контекстным окном. AI может обрабатывать то, что находится внутри него. Он не может обращаться к тому, что лежит за его пределами. Это ограничение имеет жёсткую границу — в отличие от других свойств: всё работает, пока не перестаёт работать.

Контекстное окно: рабочая память AI

Прежде чем читать дальше

Вы просите AI проверить контракт на 50 страниц. Насколько внимательно вам нужно проверять результат? Выберите точку на шкале и зафиксируйте свою догадку.

Выберите точку, затем зафиксируйте свою догадку. Урок откроется, как только вы это сделаете.

Проверьте свою интуицию

Зафиксируйте свою догадку выше, чтобы сравнить её с типичным расположением.

Настройте под себя

Ключевые выводы

  • Рабочая память — это тот факт, что у модели AI есть контекстное окно фиксированного размера, к которому она может обращаться. Зона возможностей: ваш материал комфортно помещается, сессия актуальна, вы поставляете релевантный контекст. Зона ограничений: очень длинные документы или диалоги, ожидание непрерывности между сессиями, погребение критически важной информации в середине длинного ввода. У этого свойства есть обрыв, а не плавный спуск. Тихое усечение (silent truncation) — характерный режим отказа, и вас не всегда об этом предупредят. Модель не учится на ваших исправлениях. Она реагирует только на то, что находится в контексте прямо сейчас. Функции памяти, уплотнение, проекты, более крупные окна и многоагентные рабочие процессы — всё это существует, чтобы отодвинуть этот обрыв дальше.
  • Зона возможностей: ваш материал комфортно помещается, сессия актуальна, вы поставляете релевантный контекст.
  • Зона ограничений: очень длинные документы или диалоги, ожидание непрерывности между сессиями, погребение критически важной информации в середине длинного ввода.
  • У этого свойства есть обрыв, а не плавный спуск. Тихое усечение — характерный режим отказа, и вас не всегда об этом предупредят.
  • Модель не учится на ваших исправлениях. Она реагирует только на то, что находится в контексте прямо сейчас.
  • Функции памяти, уплотнение, проекты, более крупные окна и многоагентные рабочие процессы — всё это существует, чтобы отодвинуть этот обрыв дальше.
  • Связь с 4D: Рабочая память — это то, на что воздействует Описание. Понимание того, как работает окно, подсказывает вам, как структурировать контекст, когда выносить важное в начало и когда начинать заново.

Упражнения

Упражнение: До и после

Зачем? Контекст — это рычаг. Одна и та же задача с правильно поставленным контекстом может превратиться из посредственного первого черновика во что-то по-настоящему полезное. Это упражнение делает данную мысль наглядной.

Выберите задачу из вашего списка из Урока 1, которая выигрывает от контекста, которым владеете только вы: руководство по стилю, прошлый пример хорошей работы, набор ограничений, специфичных для вашей роли или аудитории. Запишите в двух-трёх строках, как выглядит «хороший» результат для этой задачи, описав это достаточно ясно, чтобы посторонний человек мог его оценить.

Теперь проведите три пробы:

  • Проба 1: Холодный старт против контекста. Попросите выполнить вашу задачу с нулевым контекстом. Только голый запрос. Сохраните результат. Затем начните новый диалог и выполните ту же задачу, на этот раз сразу предоставив своё руководство по стилю, прошлый пример или ограничения. Сравните оба результата с вашим определением «хорошего». Измерьте разрыв.
  • Проба 2: Потеряно в середине. Возьмите документ подлиннее (или склейте вместе несколько абзацев справочного материала). Спрячьте одну конкретную важную инструкцию в его середине. Задайте вопрос, правильный ответ на который зависит от этой спрятанной инструкции. Заметил ли её AI? Теперь переместите эту инструкцию в самое начало и спросите снова. Сравните.
  • Проба 3: Чистый лист. Проведите короткий обмен сообщениями, в котором вы научите AI чему-то конкретному о вашем рабочем контексте или исправите его в чём-то, что он сделал неправильно. Затем откройте совершенно новый диалог и задайте вопрос, который предполагает, что AI помнит то, чему вы его научили. Понаблюдайте, как он начинает с нуля.

Вернитесь к своему списку задач и добавьте третью пометку: каким задачам нужен заранее настроенный постоянный контекст (проект, сохранённые инструкции, загруженные справочные документы), чтобы их вообще стоило запускать, а какие нормально работают вхолодную?

Дополнительная цель: Если у вашего инструмента есть функции памяти или проектов, настройте одну из них с контекстом из Пробы 1. Запустите задачу снова. Сравните усилия и качество с версией холодного старта.

Размышление над уроком

  • Насколько сильно вынос контекста в начало изменил качество результата? Был ли разрыв больше, чем вы ожидали?
  • Какой один элемент постоянного контекста вы настроите на этой неделе, чтобы перестать объяснять себя заново?

Что дальше

Последнее свойство: Управляемость (steerability). Насколько вы на самом деле контролируете ситуацию, когда даёте инструкции, и где этот контроль даёт сбой?

Обратная связь

По мере прохождения курса мы будем рады услышать от вас, как вы применяете концепции из курса в своей работе, а также любую обратную связь. Поделитесь своим отзывом здесь.

Благодарности и лицензия

Copyright 2026 Anthropic. Оригинальная работа, основанная на фреймворке AI Fluency, разработанном проф. Риком Дэйканом (Ringling College of Art and Design) и проф. Джозефом Феллером (University College Cork). Выпущено под лицензией CC BY-NC-SA 4.0.


*Адаптировано с русским переводом. Оригинал: © 2025 Anthropic. All rights reserved.*