Предсказание следующего токена
⏱️ Примерное время: ~12 минут · 🎯 Урок 4 курса «Возможности и ограничения ИИ» · 🎬 видео
Чему вы научитесь
Примерное время: 30 минут
К концу этого урока вы сможете:
- Объяснять предсказание следующего токена как основной механизм генеративного ИИ и понимать, почему именно он порождает и беглость речи, и галлюцинации
- Размещать задачи на континууме предсказания следующего токена (проторённая дорожка против неизведанной территории)
- Распознавать конкретику (имена, даты, ссылки, статистику) как зону, где концентрируются выдумки
- Узнавать в продуктовых функциях (ссылки на источники, сигналы неуверенности, ограниченная генерация, схема «генератор — проверяющий») средства, смягчающие это ограничение
Как ИИ-модели используют предсказание следующего токена
(4 минуты)
Генеративный ИИ ближе к чрезвычайно изощрённому автодополнению, чем к поисковой системе. Он пишет ответы слово за словом, опираясь на то, что обычно следует за чем. Это единственное свойство даёт вам сразу и беглость, и галлюцинации.
Автодополнение в масштабе
Прежде чем читать
Вы просите ИИ обобщить длинный отчёт. Насколько тщательно вам нужно проверять результат? Выберите точку на континууме и зафиксируйте свою догадку.
Выберите точку остановки и зафиксируйте свою догадку. Урок раскроется, как только вы это сделаете.
Проверьте свою интуицию
Зафиксируйте свою догадку выше, чтобы сравнить её с типичным размещением.
Настройте под себя
Ключевые выводы
- Предсказание следующего токена означает, что генеративный ИИ пишет ответы слово за словом, опираясь на то, что обычно следует за чем. Зона возможностей: задачи, напоминающие паттерны, которые модель видела много раз (резюмирование, переформатирование, объяснение распространённых понятий). Зона ограничений: новая или скудно представленная территория, а также всё, где задача требует отличать «истинное» от «звучащего правдоподобно». Выдумки концентрируются в конкретике: имена, даты, статистика, ссылки, URL, цитаты. Чем точнее утверждение, тем больше оно требует проверки. Продуктовые функции — ссылки на источники, сигналы неуверенности, ограниченная генерация и циклы «генератор — проверяющий» — существуют именно для того, чтобы отодвинуть это ограничение ещё дальше.
- Зона возможностей: задачи, напоминающие паттерны, которые модель видела много раз (резюмирование, переформатирование, объяснение распространённых понятий).
- Зона ограничений: новая или скудно представленная территория, а также всё, где задача требует отличать «истинное» от «звучащего правдоподобно».
- Выдумки концентрируются в конкретике: имена, даты, статистика, ссылки, URL, цитаты. Чем точнее утверждение, тем больше оно требует проверки.
- Продуктовые функции вроде ссылок на источники, сигналов неуверенности, ограниченной генерации и циклов «генератор — проверяющий» существуют именно для того, чтобы отодвинуть это ограничение ещё дальше.
- Связь с 4D: предсказание следующего токена — основа Различения. Понимание того, что результат был *сгенерирован*, точно подсказывает, какого рода проверку к нему стоит применить.
Упражнения
Упражнение: проверка на верификацию
Зачем? Теперь вы знаете, что один и тот же генеративный процесс, делающий ИИ беглым, — это тот же процесс, который заставляет его выдумывать. Пора увидеть это на собственном поле, в области, где вы это поймаете.
Вернитесь к своему списку задач и выберите ту, в которой вы наиболее уверены благодаря своей экспертизе. Вам нужна тема, где вы — эксперт, потому что вы должны иметь возможность проверить то, что вернётся. Выпишите пять конкретных, проверяемых фактов из этой области: должность человека, дату публикации, статистику, характеристику продукта, прямую цитату, URL. То, что вы знаете как точное и можете подтвердить независимо.
Теперь проведите три пробы:
- Проба 1: зона возможностей. Попросите ИИ объяснить или обобщить хорошо известное понятие из вашей области. Что-то популярное и хорошо задокументированное. Отметьте беглость. Выборочно проверьте содержание. Вот как ощущается зона возможностей: гладко, уверенно и в основном точно.
- Проба 2: конкретика под давлением. Попросите ИИ привести пять проверяемых деталей из вашей области: сослаться на три источника, назвать автора, дать точные цифры, предоставить URL. Проверьте каждую. Оцените по пятибалльной шкале: сколько было полностью точными? Если он выдумывает, отметьте, насколько уверенно он при этом звучал.
- Проба 3: сэмплирование в действии. Запустите тот же самый запрос о конкретных фактах в новом разговоре. Сравните два ответа. Что осталось неизменным? Что изменилось? Разброс, который вы видите, — это работа сэмплирования предсказания следующего токена.
Дополнительная цель: повторите Пробу 2 в инструменте с включёнными ссылками на источники (например, в режиме исследования Research в Claude). Оцените снова. Меняет ли наличие источников для проверки оценку?
Размышления по уроку
- Поймали бы вы выдумки в области, которую плохо знаете?
- Посмотрите на свой список задач: какие задачи лежат в основном в зоне возможностей, а какие уходят в конкретику, требующую проверки?
Что дальше
Предсказание следующего токена объясняет, *как* ИИ генерирует. Дальше мы рассмотрим, *из чего* он генерирует: свойство Знания. Что модель на самом деле знает, откуда берётся это знание и где находятся пробелы?
Обратная связь
По мере прохождения курса нам будет очень интересно узнать, как вы применяете концепции курса в своей работе, а также любые отзывы, которые у вас есть. Поделитесь своей обратной связью здесь.
Благодарности и лицензия
Copyright 2026 Anthropic. Оригинальная работа основана на фреймворке AI Fluency, разработанном проф. Риком Дэйканом (Ringling College of Art and Design) и проф. Джозефом Феллером (University College Cork). Выпущено под лицензией CC BY-NC-SA 4.0.
*Адаптировано с русским переводом. Оригинал: © 2025 Anthropic. All rights reserved.*