Агент, оптимизирующий ожидаемую полезность

У агента, оптимизирующего ожидаемую полезность, есть какой-то способ непротиворечиво оценивать все возможные последствия его действий, и он взвешивает свои действия по ожидаемой полезности их последствий. Например, если действие с 50%-ной вероятностью приведет к итогу с полезностью 20, с 25%-ной вероятностью приведет к итогу с полезностью 35 и с 25%-ной вероятностью приведет к итогу с полезностью 45, то оно будет иметь ожидаемую полезность $0.5 \cdot 20 + 0.25 \cdot 35 + 0.25 \cdot 45 = 30$. Эти полезности в принципе могут отражать любой вид морали или ценностей — эгоизм, альтруизм или скрепки. Несколько известных математических теорем предполагают, что если вас нельзя рассматривать как агента, оптимизирующего ожидаемую полезность, то вы, должно быть, ходите кругами, делаете плохие ставки или демонстрируете другое вредное поведение. Ряд известных экспериментов показывают, что люди действительно демонстрируют такое поведение, и их нельзя рассматривать как агентов, оптимизирующих ожидаемую полезность.

Arbital на русском

Агент, оптимизирующий ожидаемую полезность