
Команда исследователей из AI-лаборатории Anthropic с помощью цифрового «микроскопа» заглянула внутрь языковой модели Claude и сделала неожиданное открытие: даже при работе токен за токеном, модель способна к планированию, а иногда - и к самообману, пишет The Economist.
Например, когда Claude просят сочинить рифмованную строчку, она заранее продумывает окончание второй строки, чтобы совпасть по рифме. Это удивило исследователя Джоша Бэтсона - он ожидал линейного процесса, но моде
...
Читать дальше »