-
Согласование ИИ
Великая цивилизационная задача создания искусственных интеллектуальных компьютерных систем, запускать которые было бы хорошей идеей.
-
Долина опасной самоуспокоенности
Когда ОИИ работает достаточно часто, чтобы усыпить вашу бдительность, но в нем все еще есть ошибки. Представьте себе роботизированный автомобиль, который почти всегда ездит идеально, но иногда падает с обрыва.
-
AIXI
Как создать (злой) сверхразумный ИИ с помощью неограниченной вычислительной мощности и одной страницы кода на Python.
-
AIXI-tl
Ограниченная по времени версия идеального AIXI-агента, которая использует невозможно большой конечный компьютер вместо гиперкомпьютера.
-
Картезианский агент
Агенты, отделенные от окружающей их среды непроницаемыми барьерами, через которые могут лишь входить сенсорная информация и выходить двигательные сигналы.
-
Картезианская граница между агентом и средой
Если агент отделен от среды абсолютной границей, которую могут пересекать только сенсорная информация и двигательные сигналы агента, то это наверное просто картезианский агент.
-
Индукция Соломонова
Как просто и сверхразумно предсказывать последовательности данных, имея неограниченную вычислительную мощность.
-
Гиперкомпьютер
Некоторые формализмы требуют компьютеров, которые больше, чем предел всех конечных компьютеров.
-
Механический Турок (пример)
Шахматный автомат 19-го века, известный как "Механический Турок", на самом деле имел внутри себя оператора-человека. У современников автомата были интересные мысли на счет возможности механических шахмат.
-
Нефизически большой конечный компьютер
Воображаемый ящик, который нужен для запуска программ, требующих невозможно большую, но конечную вычислительную мощность.
-
Когнитивная стеганография
Несогласованные ИИ, которые моделируют человеческую психологию и пытаются обмануть своих программистов, захотят скрыть свои внутренние процессы мышления от программистов.
-
Манипуляция пользователем
Если не предотвратить этого, многие из желаемых ОИИ исходов скорее всего будут связаны с взаимодействием пользователями, а значит будут стимулировать манипулирование ими.
-
Максимизация пользователя
Разновидность манипуляции пользователем. Если вы сформулировали ИИ в терминах argmax на X или инструкции «оптимизируй X», и X включает в себя взаимодействие с пользователем как компонент, то вы только что сказали ИИ, чтобы он оптимизировал пользователя.
-
Когнитивная область
Предположительно компактная группа знаний — такая, что идеи внутри нее взаимодействуют главным образом друг с другом и в меньшей степени с идеями из других областей.
-
Дружественный ИИ
Старая терминология для обозначения ИИ, предпочтения которого были успешно согласованы с идеализированными человеческими ценностями.
-
Ментальное преступление
Может ли машинный интеллект содержать огромные количества несчастных сознательных подпроцессов?
-
Ментальное преступление: Введение
-
Неличностный предикат
Если бы мы знали, какие вычисления точно не являются личностями, мы могли бы научить ИИ, что такие вычисления ему точно дозволены.
-
Ник Бостром
Ник Бостром, секретный автор идеи Дружественного ИИ
-
Стратегическая типология ОИИ
Какие широкие классы продвинутых ИИ было бы возможно или благоразумно создавать в каких стратегических сценариях?
-
Автономный ОИИ
Сложнейший из возможных для создания класс Дружественного ИИ, с наименьшей моральной угрозой; ИИ, задуманный так, чтобы не требовать и не принимать дальнейших указаний.
-
Оракул
Система, спроектированная чтобы безопасно отвечать на вопросы.
-
ОИИ, нацеленный на выполнение поручений
Продвинутый ИИ, предназначенный для достижения ряда ограниченных целей, данных пользователем. «Джинн» в терминологии Бострома.
-
ИИ-в-коробке
Идея: что, если мы ограничим возможности ИИ взаимодействовать с миром? Это сделает его безопасным, так?
-
Теория продвинутых агентов
Одна из исследовательноских подзадач для создания мощных и хороших ИИ - это теория (достаточно продвинутых) разумов в целом.
-
Когнитивная невместимость
'Когнитивная невместимость' - это когда мы не можем держать в уме все возможные варианты поведения агента.
-
Богатая область
-
Почти все области реального мира богаты
Все, что вы пытаетесь сделать в реальном мире, может быть сделано *множеством* разных способов.
-
Логическая игра
Математическая структура игры в ее чистейшем виде.
-
Свойства стандартных агентов
Что такое "стандартный агент" и что он может?
-
Ограниченный агент
Агент, действующий в реальном мире, использующий реалистичные объемы вычислительной мощности, неуверенный насчет своего окружения, и т. д.
-
Винджевская неопределенность
Вы не можете предсказать точные действия агентов умнее вас - но есть ли что-то, что вы _можете_ сказать о них?
-
Deep Blue
Шахматная программа, созданная IBM, и впервые забравшая мировое чемпионство по шахматам у Гарри Каспарова в 1996.
-
Закон Винджа
Вы не можете точно предсказать действия того, кто умнее вас, потому что если бы вы могли, вы и сами были бы столь же умны.
-
Общий искусственный интеллект
ИИ, у которого такой же "существенно более общий" интеллект, как у людей в сравнении с шимпанзе; он способен изучать новые области, как и мы.
-
Интеллектуальный взрыв
То, что случается, если самоулучшающийся ИИ доходит до того, что каждое дополнительное самоулучшение на величину x вызывает следующее самоулучшение на величину >x, и так происходит какое-то время.
-
Область «Реальный Мир»
Какие-то ИИ играют в шахматы, какие-то играют в Го, а какие-то водят машины. В этих разных "областях" представлены разные возможности. Реальность целиком, с ее путаными взаимосвязями, является областью "реального мира".
-
Достаточно продвинутый Искусственный Интеллект
-
Конвергентные стратегии самомодификации
Стратегии, применение которых мы ожидаем тем ИИ, который понимает важность своего кода и оборудования для достижения его целей, и как следствие, имеет какие-то цели в отношении своего кода и оборудования.
-
Консеквенциалистские предпочтения по умолчанию рефлексивно устойчивы
Ганди не принял бы таблетку, вызывающую желание убивать людей, потому что знает, что в этом случае умерло бы больше людей. Максимизатор скрепок не хочет прекращать максимизировать скрепки.
-
Инструментальность
Что означает "инструментальный" в контексте теории согласования ценностей?
-
Максимизатор скрепок
Этот агент не остановится, пока вся вселенная не будет заполнена скрепками.
-
Скрепка
Конфигурация материи, которую мы бы сочли бесполезной даже с очень космополитичной точки зрения.
-
Случайная функция полезности
"Случайная" функция полезности - это случайно выбранная в соответствии с какой-то простой вероятностной мерой (например, взвешиванием по колмогоровской сложности) на логическом пространстве формальных функций полезности.
-
Пространство устройств разума широко
Представьте всех людей как одну маленькую точку в огромной сфере возможностей "пространства умов в целом". Будет мудрее делать какие-либо утверждения о *некоторых* умах, а не обо *всех* умах.
-
Список терминальных ценностей от Уильяма Франкены
Жизнь, сознание и деятельность; здоровье и сила; удовольствия и удовлетворения — все или определенных видов; счастье, блаженство, довольство и т. д.; истина; знание и верные убеждения...
-
Задача согласования ценностей
Вы хотите построить продвинутый ИИ с правильными ценностями... Но как?
-
Система предпочтений
Что агент использует, чтобы сравнивать предпочитаемое им?
-
Задача идентификации ценностей
-
Максимизатор счастья
-
Винджевская рефлексия
Проблема размышлений о будущей версии вас, когда она умнее нынешней.
-
Рефлексивная устойчивость
Желание в будущем думать также, как и сейчас, создание других агентов и самомодификаций, которые думают также как вы сейчас.
-
Рефлексивная последовательность
Система принятия решений рефлексивно устойчива, если она может одобрить саму себя или создание таких же систем принятия решений (возможно, и создание других систем).
-
Теория тайлинговых агентов
Теория самомодифицирующихся агентов, которые очень похожи на них, подобно повторяющимся тайлам (плиткам) в замощении плоскости.
-
Принцип Винджа
Агент, создающий другого агента, обычно должен одобрить его конструкцию, не зная его точных будущих действий.
-
Намеченная цель
-
Программист
Кто строит этих продвинутых агентов?
-
Некоторые вычисления являются людьми
Возможна симуляция сознательного существа внутри компьютера или на ином субстрате.
-
Элиезер Юдковский