Arbital на русском

ОИИ, нацеленный на выполнение поручений

ОИИ, основанный на поручениях, — это ОИИ, предназначенный для выполнения серий исходящих от человека приказов, каждый из которых ограничен какими-то рамками — «удовлетворимый» в том смысле, что его можно выполнить с помощью ограниченного объема усилий и ресурсов (в отличие от целей, которые можно выполнять все более и более хорошо, прилагая все больше и больше усилий).

В типологии Бострома это называется «джинн». Он контрастирует с ОИИ-«сувереном», который действует автономно, преследуя долгосрочные цели в реальном мире.

Создание безопасного ОИИ-для-поручений может быть проще, чем создание безопасного суверена, по следующим причинам:

В сравнении с задачей создания суверена, попытка создать ОИИ-для-поручений может снизить уровень проблемы с «невозможно сложной» до «безумно сложной», сохраняя при этом достаточную мощность ИИ для выполнения действий решающего значения.

Очевидный недостаток ОИИ-для-поручений — это моральная угроза: он может искушать пользователей так, как не искушал бы суверен. Суверен несет моральную угрозу главным образом на этапе разработки, когда программисты и пользователи, возможно, еще не обладают особой относительной властью. Тогда как ОИИ-для-поручений несет в себе постоянную моральную угрозу, пока используется.

Элиезер Юдковский предположил, что люди сталкиваются со многими важными проблемами в согласовании ценностей только тогда, когда они размышляют о суверенах, но в то же время суверены могут быть невероятно сложными на практике. Он считает, что людям сначала лучше думать о суверенах и перечислять все связанные с ними проблемы, прежде чем переходить к ОИИ-для-поручений. Причина в том, что размышления об ОИИ-для-поручений могут окончиться преждевременно, в то время как размышления о суверенах с большей вероятностью приведут к формулированию полного списка проблем, которые затем можно было бы сравнить с теми или иными идеями ОИИ-для-поручений, чтобы увидеть, стали бы эти проблемы проще.

Есть три различных подтипа ОИИ-для-поручений:

Подзадачи

Задача создания безопасного джинна затрагивает множество подтем, таких как малое воздействие, умеренная оптимизация и консерватизм, а также многочисленные стандартные проблемы безопасности ОИИ, такие как рефлексивная устойчивость и безопасная идентификация подразумеваемых целей.

(См. здесь отдельную страницу об открытых проблемах безопасности ОИИ-для-поручений, которые могут быть уже готовы к исследованию.)

Некоторые дополнительные проблемы, помимо тех, которые описаны на странице выше:


Категории: Согласование ИИСтратегическая типология ОИИ
Оригинал: Task-directed AGI (читать на GreaterWrong)    Перевод: К. Кирдан

Материалы распространяются по лицензии CC BY 3.0