Агент «рефлексивно устойчив» в некотором отношении, если сделав выбор создать агента-преемника или изменить свой собственный код, он создает только такого преемника, который в этом отношении думает также, как и создатель.
- В теории тайлинговых агентов удовлетворитель1 ожидаемой полезности рефлексивно последователен, поскольку он одобрил бы создание другого удовлетворителя ожидаемой полезности, но он не является рефлексивно устойчивым, поскольку он мог бы одобрить также и создание максимизатора ожидаемой полезности (т. к. ожидает, что последствия создания максимизатора удовлетворительны).
- Функция полезности, которая взвешивает только скрепки — «рефлексивно устойчива», поскольку максимизаторы скрепок пытаются строить только других максимизаторов скрепок.
Если вы сейчас думаете что-то (в каком-то отношении) и кажется неприемлемым не думать так (в этом отношении), то вы рефлексивно устойчивы (в этом отношении).
-
В оригинале “satisficer” — это агент, отличающийся от агента-максимизатора тем, что выбирает первое “достаточно хорошее” решение (преодолевшее некоторый порог полезности), а не ищет решение с максимальной полезностью — прим. пер. ↩