Програма Libratus, розроблена в Університеті Карнегі — Меллона, перемогла у 20-денному покерному турнірі.
Новий алгоритм зіграв 120 тисяч роздач в безлімітний техаський холдем і виграв фішок на суму понад 1,7 мільйона доларів, повідомляє New Scientist.
Розробники заявили, що алгоритм складається з трьох частин: ядра, на тренування якого пішло 15 мільйонів ядро-годин; модуля, який стежив за можливими помилками, які могли допустити суперники, і враховував у процесі гри цю інформацію. Третя частина Libratus відстежувала власні слабкі сторони ігри програми. Така система дозволила програмі як блефувати, так і розпізнавати блеф.
“Я прекрасно себе почуваю. Це було змаганням Давида проти Голіафа, і наш Libratus зумів кинути камінь”, – каже Томас Сандхольм, вчений з Університету Карнегі-Меллона, який був одним з творців ІІ. Незабаром команда Libratus планує опублікувати алгоритми свого ШІ у рецензованому журналі.
До речі, розробник не отримає ніяких грошей, а призовий фонд у 200 тисяч доларів буде поділений між чотирма живими гравцями в залежності від зайнятого місця.
НВ