TicTacToe AI, принимающий неправильные решения

Question

TicTacToe AI, принимающий неправильные решения

Подробно остановиться на объяснении nosklo:

a = {}
b = ['some', 'list']
a[b] = 'some' # this won't work
a[tuple(b)] = 'some' # this will, same as a['some', 'list']

10

algorithm artificial-intelligence decision-tree tic-tac-toe

задан Jon Seigel 22 May 2010 в 23:36

4 ответа

Ваш существующий алгоритм хорош, за исключением того, что вы забываете одну вещь. Никогда не выбирайте путь, по которому ход другого игрока приводит к тому, что вы не можете, по крайней мере, сделать ничью.

Итак, в основном, отбросьте любую ветвь, где следующий ход игроков может привести к ситуации, в которой ничья может быть невозможна, а затем запустите существующий алгоритм. Это приводит к наивысшим шансам на победу над несовершенным противником, исключая при этом возможность проиграть.

8

ответ дан 3 December 2019 в 16:10

"Наивный" способ сделать это (для произвольной игры, в которой два игрока по очереди делают ход) состоит в том, чтобы рекурсивно пробовать каждый возможный ход, пока не получите доску, где один из победитель, затем вернитесь вверх по дереву, помечая узлы как «O побед», «X побед» или «ничья».

Каждый раз, когда вы делаете шаг вперед (один такой шаг обычно называется слоем), в зависимости от того, кто ход, предположим, что игрок выбирает тот ход, который лучше для него / нее. Поскольку вы двигаетесь от листьев и вверх, вы всегда будете знать оптимальные возможные результаты для каждого дочернего узла.

Подсчитывая число возможных выигрышных или проигрышных досок в поддереве, вы по существу предполагаете что каждый игрок всегда будет делать случайный ход. Как вы отметили, это будет не очень эффективно, если вы будете играть против умного игрока. Схема, которую я обрисовал выше, вместо этого предполагает, что противник всегда делает идеальный ход, пытаясь выиграть.

0

ответ дан 3 December 2019 в 16:10

Крестики-нолики могут быть решены с использованием жадного алгоритма и на самом деле не требует дерева решений.

Если вы хотите продолжать использовать ваш текущий алгоритм, делать то, что предлагает патрос, и минимизировать возможность проигрыша при каждом решении.

Если вы хотите более простой подход, пусть ИИ делает следующее каждый ход:

Завершите выигрышный крестик-нолик -Игрушка, если возможно.
Заблокируйте крестики-нолики противника, если возможно.

Оцените каждый квадрат на предмет его желательности, для каждого другого квадрата, взятого (ИИ) на линии, добавьте за это один балл желательности площадь. За каждую клетку, занятую противником, удаляйте одно очко желательности.

Например, если доска в настоящее время:

 _ | O | X 

 Если вы хотите продолжить использование вашего текущего алгоритма, делайте то, что предлагает патрос, и минимизируйте возможность проигрыша при каждом решении. 

 Если вы хотите более простой подход, пусть ИИ делает следующее каждый ход: 


 Завершить выигрышные крестики-нолики, если возможно. 
 Блокируйте противоположные крестики-нолики, если возможно. 
 Оцените каждый квадрат на предмет его желательности, для каждого другого квадрата, занятого (ИИ) на линии, добавьте один точка желательности для этого квадрата. За каждую клетку, занятую противником, удаляйте одно очко желательности. 

 Например, если доска в настоящее время: 

 _ | O | X 

 Если вы хотите продолжить использование вашего текущего алгоритма, делайте то, что предлагает патрос, и минимизируйте возможность проигрыша при каждом решении. 

 Если вы хотите более простой подход, пусть ИИ каждый ход делает следующее: 


 Завершить выигрышные крестики-нолики, если возможно. 
 Блокируйте противоположные крестики-нолики, если возможно. 
 Оцените каждый квадрат на предмет его желательности, для каждого другого квадрата, занятого (ИИ) на линии, добавьте один точка желательности для этого квадрата. За каждую клетку, занятую противником, удаляйте одно очко желательности. 

 Например, если доска в настоящее время: 

 _ | O | X 

 Заблокируйте крестики-нолики противника, если возможно. 
 Оцените каждый квадрат на предмет его желательности, для каждого другого квадрата, взятого (ИИ) на линии, добавьте одно очко желательности для этого квадрата. За каждую клетку, занятую противником, убирайте одну точку желательности. 

 Например, если доска в настоящее время: 

 _ | O | X 

 Заблокируйте крестики-нолики противника, если возможно. 
 Оцените каждый квадрат на предмет его желательности, для каждого другого квадрата, взятого (ИИ) на линии, добавьте одно очко желательности для этого квадрата. За каждую клетку, занятую противником, удаляйте одно очко желательности. 

 Например, если доска в настоящее время: 

 _ | O | X
_ | X | _
O | |


 Верхний левый угол имеет желательность 0 (1 для X в том же ряду и 1 для X на диагонали, но -1 для каждого из О). 
 Играйте на наиболее желательном площадь. Произвольный разрыв ничьей. 

 В примере, приведенном выше, ИИ выбрал бы середину правого квадрата, так как он имеет желаемое значение 2, что приведет к выигрышу на следующий ход. 
 Если игра только началась. , сыграйте в центральном квадрате, если центральный квадрат занят, выберите случайный угол. 
 Победа (или ничья). 


 Это был мой проект по Visual Basic для 10-го класса. Это невозможно превзойти и требует гораздо меньше памяти, чем хранение дерева решений.


                  
                     
                     4

                  
                  
                  
                     ответ дан                      3 December 2019 в 16:10 
                  
                  поделиться


         
               
          Другие вопросы по тегам:          
         algorithm artificial-intelligence decision-tree tic-tac-toe       
        Похожие вопросы:

        
          
                          129 
 Факториальные Алгоритмы на различных языках - 21 September 2014 15:40 
                            37 
 Потребность в предсказуемом случайном генераторе - 9 April 2016 18:25 
                            35 
 Гольф кода: тик палец ноги Tac - 14 March 2010 04:50 
                            35 
 Алгоритм, чтобы определить, содержит ли массив n … n+m? - 18 October 2011 09:22 
                            35 
 Лучше всего программируя базирующиеся [закрытые] игры - 22 May 2010 22:04 
                            33 
 Важные реверсивные пары leetcode time out [duplicate]  - 25 October 2014 10:12 
                            32 
 Что студентам нужно преподавать сначала при первом изучении сортировки алгоритмов? [закрытый] - 22 August 2013 20:48

score 14 · Accepted Answer

@echo off

set x=42
set y=5

set /a z = 100 * x / y

echo %z%

Команда set / a позволяет присвоить результат математического выражения переменной (при этом % вокруг переменной имена в этих выражениях не требуются). См. set /? для получения списка поддерживаемых операторов и подробностей.

Обратите внимание, что командные файлы Windows не поддерживают арифметику с плавающей запятой, поэтому, если результатом выражения является дробное число, только целая часть будут засчитаны. Например, 3/2 вычисляется как 1 и 2/3 как 0 .

org / wiki / Minimax