при проигрывании этой игре я задался вопросом, как мог работать AI, управляющий любым детективы любой преступник.
Для ленивых людей цель игры проста:
Я могу думать эффективно о AI для преступника, что это было бы просто дерево минимакса, которое пытается выбрать перемещения, которые максимизируют количество перемещений, необходимых детективам для достижения его (это, кажется, хорошая метрика), но я не могу думать, что что-либо достаточно охлаждается для детективов, которые должны сотрудничать и попытаться предположить, где преступник может быть путем рассмотрения билетов, это использует.
Это только для забавы, но Вы теперь какие-либо классные идеи разработать что-то довольно умное?
Вы спросили, как смоделировать это, а не как решить это эффективно:
Это может быть легко моделируется как частично наблюдаемый марковский процесс принятия решений ( wiki link ). Это работает как для детективов, так и для преступников. POMDP - очень общая модель.
Мне нравится эта игра, и я думаю, что для детективов вы хотите смоделировать вероятность того, что преступник находится в каждом месте. Время от времени вы знаете точное местонахождение преступника, а затем можете принять во внимание следующие шаги, которые он делает, чтобы определить, в каких точках он может оказаться.
Когда у вас есть это, я не совсем уверен, как оптимизировать ходы детективов. Вы можете перемещать детективов, чтобы уменьшить набор возможностей, эффективно загоняя преступника в ловушку. Но я уверен, что есть еще какая-то стратегия более высокого уровня, необходимая для размещения билетов, а не для их исчерпания.
I ' Я могу представить, что какая-то реализация Монте-Карло будет отличным кандидатом для этого, т.е. моделирование тысяч комбинаций и выбор той, которая в большинстве случаев дает наилучший результат. Поскольку преступник должен быть видимым в течение 5 ходов, фактор ветвления должен оставаться под контролем, хотя MC также оказался очень хорошей техникой в играх с высоким коэффициентом ветвления, т. Е. Идти.
Чтобы наладить совместную работу детективов, вам нужно моделировать их как команду, а не как отдельных лиц. Minimax - по-прежнему хороший способ, но (к сожалению) ваш фактор ветвления будет стремительно расти.
Вместо того, чтобы проходить через всех детективов, делая то, что кажется лучшим для каждого, вместо этого для своей команды детективов вы прорабатываете каждую перестановку ходов, которые они могут сделать. Если командная работа помогает в этой игре, то минимакс будет благоприятствовать перестановкам, в которых детективы работают вместе.
Не уверен, что это будет практично, 5 детективов на 24 слоя - это слишком много, но было бы интересно попробовать, и в этом же суть, верно?