Рефлексивная устойчивость

Агент «рефлексивно устойчив» в некотором отношении, если сделав выбор создать агента-преемника или изменить свой собственный код, он создает только такого преемника, который в этом отношении думает также, как и создатель.

В теории тайлинговых агентов сатисфаизатор ожидаемой полезности рефлексивно последователен, поскольку он одобрил бы создание другого сатисфаизатора ожидаемой полезности, но он не является рефлексивно устойчивым, поскольку он мог бы одобрить также и создание максимизатора ожидаемой полезности (т. к. ожидает, что последствия создания максимизатора удовлетворительны).
Функция полезности, которая взвешивает только скрепки — «рефлексивно устойчива», поскольку максимизаторы скрепок пытаются строить только других максимизаторов скрепок.

Если вы сейчас думаете что-то (в каком-то отношении) и кажется неприемлемым не думать так (в этом отношении), то вы рефлексивно устойчивы (в этом отношении).

Связанное:

Reflectively consistent degree of freedom

When an instrumentally efficient, self-modifying AI can be like X or like X' in such a way that X wants to be X and X' wants to be X', that's a reflectively consistent degree of freedom.
- Humean degree of freedom
  
  A concept includes 'Humean degrees of freedom' when the intuitive borders of the human version of that concept depend on our values, making that concept less natural for AIs to learn.
- Value-laden
  
  Cure cancer, but avoid any bad side effects? Categorizing "bad side effects" requires knowing what's "bad". If an agent needs to load complex human goals to evaluate something, it's "value-laden".
Консеквенциалистские предпочтения по умолчанию рефлексивно устойчивы

Ганди не принял бы таблетку, вызывающую желание убивать людей, потому что знает, что в этом случае умерло бы больше людей. Максимизатор скрепок не хочет прекращать максимизировать скрепки.
Другое-зация (разыскивается: новое выражение для оптимизации)

Максимизация невозможна для ограниченных агентов, а сатисфаизация, похоже, недостаточна для них. Какой другой вид "изации" был бы хорош для реалистичных ограниченных агентов?

Оригинал: Reflective stability (читать на GreaterWrong)

Перевод: К. Кирдан (добавлены ссылки)

Arbital на русском

Рефлексивная устойчивость