Как сыграть с openal bot: Сыграть с OpenAI можно уже сейчас. Разбираемся, как это сделать
Сыграть с OpenAI можно уже сейчас. Разбираемся, как это сделать
Разработчики открыли доступ к игре с искусственным интеллектом для всех желающих на этих выходных. В рамках события OpenAI Five Arena можно играть как с другими игроками, так и в одиночку.
Соревноваться с ИИ можно до 10:00 22 апреля по московскому времени.
На выбор представлены два игровых режима
- Cooperative (недостающие слоты будут заполнены ботами, можно играть в одиночку)
- Competitive (пять человек против пяти ботов)
Как сыграть
- Убедитесь, что у вас активирована консоль в клиенте Dota 2
- Зайдите через аккаунт в Steam на сайте OpenAI Arena
- Нажмите «Start a Game» на главной странице сайта
- Настройте матч и нажмите «Start game»
- Введите полученную команду в консоль, отправьте ее другим игрокам
Спойлер: Как включить консоль
- Кликните правой кнопкой мыши по Dota 2 в библиотеке игр Steam
- Выберите «Свойства» → «Установить параметры запуска»
- В появившееся поле впишите -console
- Сохраните настройки и запустите игру
- Попробуйте запустить консоль, нажав \ (по умолчанию)
При этом регистрация требуется только от одного игрока в группе, остальные могут просто присоединиться к матчу.
Как настроить матч
Competitive
- Выберите сторону или очередность пика
Cooperative
- Выберите героев для ботов. Оставшиеся слоты займут люди (максимум 5 человек)
- Если игроки находятся с двух сторон, первыми к игре должны присоединиться играющие за Radiant
- Чтобы распределить ботов на линии, во время матча нужно написать «lane [герой] [линия]» (например: «lane axe bot»). На пятой минуте они перестанут быть привязанными к конкретной линии.
Позиции в Cooperative
- Бот будет покупать Wards, если интеллект посчитает, что его общая ценность к концу игры будет наименьшей или второй снизу
- Бот будет покупать Dust of Appearance, если ИИ предскажет, что его общая ценность к концу игры будет наименьшей
- Если OpenAI предскажет, что наименьшая общая ценность к концу игры будет достигнута человеком, боты попросят его покупать эти предметы
Правила
- 17 героев на выбор;
- без призывных юнитов и иллюзий (купить рецепты Manta Style, Necronomicon и Helm of the Dominator невозможно, а соответствующая руна не появится в игре).
Нашли ошибку в материале? Выделите ее и нажмите Ctrl+Enter
Началось открытое тестирование ботов OpenAI
Сегодня разработчики искусственного интеллекта OpenAI открыли доступ к своему детищу для всех желающих: до конца недели любой игрок может испытать свои силы в битве против ботов. Принять участие в мероприятии могут как одиночки, так и укомплектованные команды из пяти человек. Открытый тест OpenAI Five закончится 22 апреля в 09:59 МСК.
Инструкция: как сыграть с OpenAI
Режимы игры
- Cooperative (можно играть в одиночку c ботами).
- Competitive (команда из пяти человек против команды пяти ботов).
Запуск матча
- Активируйте консоль в Dota 2.
- Зайдите на сайт OpenAI Arena через аккаунт в Steam.
- Нажмите Start a Game на главной странице.
- Настроите матч.
- Полученную команду введите в консоли и отправьте ее своим товарищам по команде (зарегистрироваться на сайте OpenAI Arena необходимо только одному игроку).
Настройка
- В режиме Competitive необходимо выбрать сторону и очередность пика, а в режиме Cooperative нужно выбрать героев для ботов. На оставшихся слотах могут сыграть люди (максимум 5 человек в матче).
- Чтобы распределить ботов по линиям, во время матча нужно написать «lane [герой] [линия]» (например: «lane axe top»). После пятой минуты боты смогут свободно перемещаться между линиями.
Правила
- Бот будет покупать варды или Dust of Appearance в том случае, если посчитает, что его общая ценность к концу матча будет наименьшей в команде. В противном случае бот сам попросит игроков их купить.
- В матче не действует иллюзии и саммоны, поэтому в магазине нельзя купить рецепты Manta Style, Necronomicon и Helm of the Dominator. Руна Иллюзии отключена.
- Боты не реагируют на надпись GG, поэтому чтобы закончить матч досрочно, нужно написать команду -surrender.
- Доступны 17 героев.
За прошедшие несколько часов с момента запуска ивента боты сыграли уже несколько сотен матчей с винрейтом, близким к 100%. На момент опубликования данной новости общий счет составляет 583-2 в пользу OpenAI. Следить за результатами матчей вы можете в таблице лидеров на официальном сайте.
Следите за новостями у нас на сайте и в нашей группе ВКонтакте!
Сыграть с OpenAI можно уже сейчас. Как это сделать
Разработчики открыли доступ к игре с искусственным интеллектом для всех желающих на этих выходных. В рамках события OpenAI Five Arena можно играть как с другими игроками, так и в одиночку.
На выбор представлены два игровых режима:
- Cooperative (недостающие слоты будут заполнены ботами, можно играть в одиночку)
- Competitive (пять человек против пяти ботов)
Как сыграть:
- Убедитесь, что у вас активирована консоль в клиенте Dota 2
- Зайдите через аккаунт в Steam на сайте OpenAI Arena
- Нажмите «Start a Game» на главной странице сайта
- Настройте матч и нажмите «Start game»
- Введите полученную команду в консоль, отправьте ее другим игрокам
При этом регистрация требуется только от одного игрока в группе, остальные могут просто присоединиться к матчу.
Как включить консоль:
- Кликните правой кнопкой мыши по Dota 2 в библиотеке игр Steam
- Выберите «Свойства» → «Установить параметры запуска»
- В появившееся поле впишите -console
- Сохраните настройки и запустите игру
- Попробуйте запустить консоль, нажав \ (по умолчанию)
Настройка матча:
Competitive
- Выберите сторону или очередность пика
Cooperative
- Выберите героев для ботов. Оставшиеся слоты займут люди (максимум 5 человек)
- Если игроки находятся с двух сторон, первыми к игре должны присоединиться играющие за Radiant
- Чтобы распределить ботов на линии, во время матча нужно написать «lane [герой] [линия]» (например: «lane axe bot»). На пятой минуте они перестанут быть привязанными к конкретной линии.
Позиции в Cooperative
- Бот будет покупать Wards, если интеллект посчитает, что его общая ценность к концу игры будет наименьшей или второй снизу
- Бот будет покупать Dust of Appearance, если ИИ предскажет, что его общая ценность к концу игры будет наименьшей
- Если OpenAI предскажет, что наименьшая общая ценность к концу игры будет достигнута человеком, боты попросят его покупать эти предметы
Правила
- 17 героев на выбор;
- без призывных юнитов и иллюзий (купить рецепты Manta Style, Necronomicon и Helm of the Dominator невозможно, а соответствующая руна не появится в игре).
Соревноваться с ИИ можно до 10:00 22 апреля по московскому времени.
До 21 апреля 23:59 идет прямая трансляция игр. На данный момент статистика OpenAl против людей: 901-3
Эволюция непобедимого бота от OpenAI
Создатели искусственного интеллекта, показанного на The International 2017, рассказали, как бот за 3 месяца поднялся с уровня «ниже плинтуса» до ступени развития, на которой он стал превосходить человека.
Разработчики продвинутого искусственного интеллекта, презентованного на The International 2017, рассказали об эволюции своего бота с течением времени. «За месяц наша система развилась от состояния, в котором она едва могла соперничать с высокоранговыми игроками, до такого уровня, где с ней уже не могли конкурировать сильнейшие профессиональные игроки планеты», – начинает повествование сотрудник OpenAI.
Хронология событий:
Разработчики пояснили, что Pajkatt удалось победить противника благодаря покупке Magic Wand – бот до встречи с ним никогда не имел дела с этим предметом.
Создатели ИИ описали некоторые тактики, которые могли запутать бота и привести к его поражению. OpenAI организовали небольшой LAN-турнир неподалеку от The International 2017, участникам которого предлагалось любым способом одолеть ИИ. Было проведено свыше тысячи матчей и в результате выделено 3 тактики, при встрече с которыми бот мог потерпеть неудачу.
- Отвод крипов. Тактика описана в нашей прошлой новости.
- Покупка Orb of Venom и Wind lace. Такая сборка давала большое преимущество в скорости, за счет которого можно было быстро сделать первое убийство.
- Прокачка Raze на первом уровне. Некоторым игрокам с высоким показателем MMR удавалось убить бота тремя-пятью точными Raze за короткий промежуток времени. Тактика требует высокого уровня мастерства.
Следующий этап в развитии проекта – создание команды, состоящей из пяти ботов. OpenAI осознают комплексность проблемы: «1v1 – штука сложная, но 5v5 – это целый океан сложностей. Мы понимаем, что нам придется еще больше раздвинуть границы возможностей ИИ, чтобы решить эту задачу». Создатели бота уже начали трудиться над улучшением своего искусственного интеллекта: сотрудники OpenAI скачали почти шесть миллионов реплеев с серверов Valve и сейчас занимаются их изучением с целью выявления шаблонов поведения.
Следите за новостями у нас на сайте и в нашей группе ВКонтакте!
Источник: blog.openai.com
Как играть в идеальную Доту — DOTABUFF
У OpenAI практически идеальный счёт в играх против оппонентов-людей, однако люди еще в состоянии давать отпор, в отличии от игра с AI в шахматах и го.
На прошлой неделе OpenAI просто уничтожил чемпионов TI8, OG. В комментариях после игры, капитан OG, NoTail, заявил, что команда бы адаптировалось и выиграла хотя бы одну игру из пяти. На самом мероприятии OG сыграть не дали, однако выпустили небольшой проект под названием OpenAI Five Arena, который позволил всем попытать свои шансы против AI. На момент написания статьи OpenAI выиграл 99.3% своих матчей.
Этот режим предполагает соревновательную игру, в который Вы с своей командой людей можете потренироваться против ботов. Для тех кто предпочитает менее безумный опыт, на арене можно сыграть просто с ботами в команде, без участия других людей.
В игре против ботов, многие игроки-люди говорили о безнадежности. Бот идеально микрит, понимает все дальности заклинаний и атак и невероятно быстро принимает решения. Против такой точности играть очень сложно.
Бот CM обыгрывал даже Topson’а — одного из сильнейших игроков в миде, за счёт идеального использования Shadow Amulet’а, правильного использования заклинаний и понимания дальности обзора ночью. Более того, боты иногда даже успевали повернуться к Riki лицом, полностью игнорируя урон от Backstab.
Многие люди начали ссылаться на механическое превосходство ботов как на причину своих поражений. Мы обрабатываем информацию медленнее, поэтому мы проигрываем. В противном случае нам придётся признать, что мы проигрываем и в таких вещах как интуиция, креативность и понимание игры.
У некоторых команд людей получалось обыгрывать ботов за счёт непредсказуемости. Однако с такой же вероятностью эти победу могут быть просто ошибкой со стороны программистов, а не доказательством креативности игроков. Боты на данный момент очень плохо играют против невидимости, очень плохо защищают курьера и очень плохо догоняют противника в лесах.
Несмотря на это, боты всё равно часто выигрывают. Наше умение принимать решения необдуманно, полагаясь на рефлексы, зависит от нашего опыта. Игроки высокого уровня хорошо понимают хорошие и плохие матчапы, потенциальное расположение противника на карте и стоит ли драка инициации.
OpenAI также учился из своих ошибок, но он сыграл 45 000 лет Доты и помнят каждую секунду. Ре
OpenAI-бот побеждает чемпионов Dota 2, и теперь против него может сыграть любой.
Увеличить / Shadow Fiend, выглядящий призрачно и зловеще.
За последние несколько лет OpenAI, стартап, цель которого — обеспечить «общий искусственный интеллект на благо всего человечества», разрабатывал бота, основанного на машинном обучении, для игры в Dota 2 , величайшую игру во вселенной. . Начиная с очень урезанной версии полной игры, бот разрабатывался годами, играя миллионы и миллионы матчей против самого себя, обучаясь не только тому, как играть в командную игру пять на пять, но и тому, как побеждать. последовательно.
Нам удалось наблюдать за развитием бота в ходе нескольких шоу-матчей, в каждом из которых использовалась более полная версия игры и более опытных противников-людей. Это завершилось тем, что, как ожидается, станет финальным шоу-матчем на выходных, когда OpenAI Five сыграла в матче до лучших из трех против OG, команды, выигравшей в прошлом году крупнейшее соревнование во всем киберспорте, The International.
OpenAI имеет несколько недостатков во имя сохранения интереса.Каждый из его пяти ИИ-игроков использует идентичную версию программного обеспечения-бота, без связи между ними: это пять независимых игроков, которые мыслят очень одинаково, но не имеют прямых средств координации своих действий. Время реакции OpenAI искусственно замедлено, чтобы игра не была просто демонстрацией сверхчеловеческих рефлексов. И бот по-прежнему не использует полную версию игры: доступен только ограниченный выбор героев, а предметы, которые создают управляемых миньонов или иллюзий, запрещены, потому что кажется, что бот сможет управлять своими миньонами более эффективно, чем любой человек мог.
Посмотреть игры можно здесь. Первая игра выглядела даже примерно до 19 минут. У людей было небольшое преимущество в золоте, но у ботов был лучший контроль над территорией. Боты вышли вперед в командном бою, убив трех игроков-людей и потеряв только одного. Игра по-прежнему выглядела так, как будто она была на острие, но боты не согласились: они объявили, что имеют 95-процентный шанс на победу, и, сделав это заявление, мгновенно использовали свое численное преимущество, чтобы нанести серьезный урон человеческой базе. .Это еще больше усилило их территориальный контроль и дало им также значительное преимущество по золоту.
Это поставило людей в тупик, и хотя им удалось затянуть игру еще на 20 минут, они не смогли преодолеть преимущество ботов, дав OpenAI преимущество 1-0.
Во второй игре дело было даже не близко; боты быстро захватили лидерство и прорвали базу людей в течение 15 минут. Через пять минут они одержали победу.
В целом, это было доминирующее выступление OpenAI: 2-0 победа над авторитетной командой людей, привыкшей играть друг с другом на самом высоком уровне, который может предложить игра.Эта производительность была, безусловно, самой сильной OpenAI за все годы.
Координация ботов невероятная: хотя они не могут общаться, все пять игроков, управляемых компьютером, думают одинаково. Если один думает, что это хорошая возможность напасть на игрока-человека, остальные четверо подумают так же и присоединятся к атаке. Это придает внешнему виду отличную координацию в командных боях — координацию с точностью и строгостью, с которыми человеческие команды не могут сравниться.
Но OpenAI действительно выглядит лучше.У него есть определенные, хотя и удивительные, слабые места — он не очень хорош для ластхитов, смертельных ударов по управляемым компьютером юнитам, которые используются для накопления игрового золота. Это дает людям возможность получить преимущество в раннем золоте. Боты также изо всех сил пытались противостоять невидимости со стороны человека. Также казалось, что они плохо приспосабливаются к определенным заклинаниям некоторых героев, в частности к Разрыву Earthshaker’s, заклинанию, которое временно создает непроходимый барьер на карте. Люди эффективно использовали это, чтобы заманить в ловушку игроков-ботов и ограничить их передвижение, и это, похоже, смущало OpenAI.
Поведение ботов также является наглядным уроком большого разрыва между этим видом системы машинного обучения и полноценным общим искусственным интеллектом. Хотя AI Five явно эффективен в победах в играх, он также явно не знает, как играть в Dota 2 . Люди-игроки в игре используют технику, называемую «притягиванием», чтобы перенаправить поток управляемых компьютером миньонов своей стороны (известных как крипы в Dota 2 ), чтобы лишить вражескую команду ни золота, ни опыта.Игроки-люди могут понять, что это произошло, потому что крипы не появляются, когда они должны. У игроков-людей есть ментальная модель всей игры, понимание ее правил, и поэтому они могут признать, что что-то не так; они могут рассуждать о том, куда должны были уйти крипы, и мешать притяжке. Компьютер, напротив, просто бесцельно блуждает, когда сталкивается с этим сценарием.
Нет тяги
В своих миллионах игр, сыгранных против самого себя, OpenAI, похоже, никогда не использовал технику пулла, и поэтому он так и не научился играть против него.Поэтому, когда команда людей начинает тянуть, бот не распознает ситуацию и действительно не знает, что делать. Он не может рассуждать о том, какой должна быть игра, и не может рассуждать о том, почему игра ведет себя неожиданным образом. Все, что может делать бот, — это искать закономерности, которые он распознает, и выбирать действие, которое с наибольшей вероятностью приведет к наилучшему результату; дайте ему шаблон, который не может распознать , и его производительность ухудшится.
До сих пор использование бота OpenAI было ограничено; Некоторым профи и стримерам был предоставлен доступ к игре против него, а также против него можно было играть на некоторых живых турнирах.Но на несколько дней все меняется: игроков Dota 2 могут зарегистрироваться здесь, чтобы играть против бота — или с ним — в течение трехдневного периода. К сожалению, этот публичный период не выглядит так, как будто он приведет к появлению нового и улучшенного бота: победить лучшую человеческую команду было целью, которую OpenAI поставил для своего бота, и после этого эксперимент, кажется, завершен.
.
OpenAI Five Defeads Dota 2 World Champions
OpenAI Five — первый ИИ, который обыграл чемпионов мира в киберспортивной игре, выиграв две подряд игры против команды чемпионов мира по Dota 2, OG, в финале в эти выходные. И OpenAI Five, и DeepMind AlphaStar ранее побеждали хороших профессионалов в частном порядке, но проиграли свои живые профессиональные матчи, что также стало первым случаем, когда ИИ обыграл профессионалов киберспорта в прямом эфире.
Team OG и команда разработчиков OpenAI.
На OpenAI Five Finals мы также поделились двумя сюрпризами:
- OpenAI Five обнаружила элементарную способность быть товарищем по команде с людьми, хотя наш тренировочный процесс сосредоточен исключительно на победе над другими ботами. Легкость, с которой мы превратили конкурентоспособный ИИ в совместный, вселяет в нас надежду, что будущие системы ИИ могут быть очень полезными для людей при условии активных усилий по разработке.
- С 18 по 21 апреля мы расширяем OpenAI Five, чтобы играть в Интернете, будь то в качестве конкурента или товарища по команде.Этот последний тест позволит нам ответить на важный исследовательский вопрос — в какой степени OpenAI Five можно использовать или иным образом надежно превзойти — и потенциально может стать крупнейшим в истории развертыванием высококвалифицированного агента глубокого обучения с подкреплением, с которым люди могут сознательно взаимодействовать.
Повторы + план OpenAI Five
Почему именно Дота?
Мы запустили OpenAI Five, чтобы работать над проблемой, которая казалась недоступной для существующих алгоритмов глубокого обучения с подкреплением.Мы надеялись, что, работая над проблемой, которая не может быть решена с помощью существующих методов, нам нужно значительно расширить возможности наших инструментов. Мы ожидали, что нам потребуются сложные алгоритмические идеи, такие как иерархическое обучение с подкреплением, но мы были удивлены тем, что обнаружили: фундаментальное улучшение, которое нам нужно для решения этой проблемы, — это масштаб. Достичь и использовать такой масштаб было непросто, и это было основной частью наших исследований!
OpenAI Five видит мир как набор чисел, которые он должен расшифровать.Он использует один и тот же универсальный обучающий код, независимо от того, представляют ли эти числа состояние игры Dota (около 20000 чисел) или руки робота (около 200).
Чтобы собрать OpenAI Five, мы создали систему под названием Rapid, которая позволила нам запускать PPO в невиданных ранее масштабах. Результаты превзошли наши самые смелые ожидания, и мы создали Dota-бота мирового класса, не достигнув каких-либо фундаментальных пределов производительности.
Удивительная мощность сегодняшних алгоритмов RL достигается за счет огромного количества опыта, который может оказаться непрактичным вне игры или моделируемой среды.Это ограничение может быть не таким плохим, как звуки — например, мы использовали Rapid для управления роботизированной рукой, чтобы ловко переориентировать блок, полностью обучены моделированию и выполняются на физическом роботе. Но мы думаем, что уменьшение количества опыта — это следующая проблема для RL.
Сегодня мы прекращаем использование OpenAI Five в качестве конкурента, но достигнутый прогресс и разработанные технологии будут и впредь определять нашу будущую работу. На этом наша работа с Dota не заканчивается — мы думаем, что Dota — это гораздо более интересная и сложная (и теперь хорошо понятная!) Среда для разработки RL, чем стандартные, используемые сегодня.
Вычислить
побед OpenAI Five в субботу по сравнению с поражениями на The International 2018 обусловлены серьезным изменением: в 8 раз больше вычислительных ресурсов для обучения. На многих предыдущих этапах проекта мы добивались дальнейшего прогресса, увеличивая масштабы обучения. Но после The International мы уже посвятили подавляющее большинство вычислительных ресурсов нашего проекта обучению одной модели OpenAI Five. Поэтому мы увеличили объем вычислений единственным доступным нам способом: более длительным обучением.
TrueSkill в OpenAI Five, поскольку мы применили дополнительные обучающие вычисления, с линиями, разграничивающими основные системные изменения (переход на одного курьера; увеличение размера LSTM до 4096 единиц; обновление до версий патча 7.20 и 7.21; и начало изучения выкупа). График является примерно линейным, что означает, что OpenAI Five постоянно извлекает выгоду из дополнительных вычислений (обратите внимание, что это логарифмический график, поскольку ось x представляет собой логарифм вычислений, а TrueSkill примерно соответствует экспоненциальному прогрессу).На этом графике оцениваются все боты по окончательным правилам игры (1 курьер, патч 7.21 и т. Д.) — даже те, которые обучены на старых. Крутой наклон после любого из них указывает на то, что OpenAI Five адаптируется к этому изменению; в зависимости от изменения оценка может быть несправедливой по отношению к предыдущим версиям.
В общей сложности текущая версия OpenAI Five потребляла 800 петафлоп / с-дней и испытала около 45000 лет самостоятельной игры в Dota в течение 10 месяцев в реальном времени (по сравнению с примерно 10000 лет в течение 1,5 месяцев в реальном времени по данным The International) в течение в среднем 250 лет моделирования в день.Финальная версия OpenAI Five имеет процент побед 99,9% по сравнению с версией TI.
Трансферное обучение
Текущая версия OpenAI Five непрерывно обучается с июня 2018 года, несмотря на изменения размера модели и правил игры (включая некоторые довольно крупные обновления игровых патчей и недавно реализованные функции). В каждом случае нам удавалось перенести модель и продолжить обучение, что является открытой проблемой для RL в других областях. Насколько нам известно, это первый раз, когда агент RL обучается с использованием такого длительного цикла обучения.
Чтобы выполнить эту работу, мы продолжили совершенствовать наши хирургические инструменты, чтобы мы могли начать с обученных параметров даже при существенных изменениях архитектуры.
Больше героев
Мы увидели очень небольшое замедление в обучении с 5 до 18 героев. Мы предположили, что то же самое будет верно и в отношении еще большего количества героев, и после The International мы приложили много усилий для интеграции новых.
Мы потратили несколько недель на тренировки с пулами героев, насчитывающими до 25 героев, доведя этих героев до примерно 5k MMR (около 95-го процентиля игроков Dota).Хотя они все еще улучшались, они не учились достаточно быстро, чтобы достичь профессионального уровня перед финалом. У нас еще не было времени выяснить, почему, но наши гипотезы варьируются от недостаточной вместимости модели до необходимости лучшего подбора игроков для расширенного пула героев и до необходимости большего времени на обучение для новых героев, чтобы догнать старых. Представьте, как тяжело человеку выучить нового героя, когда все остальные овладели своим!
Мы считаем, что эти проблемы принципиально разрешимы, и их решение может быть интересным само по себе.В финальной версии участвуют 17 героев — мы удалили Лича, потому что его способности были значительно изменены в версии 7.20 Dota.
Кооперативный режим
Было приятно; мой Вайпер в какой-то момент отдал свою жизнь за меня. Он пытался мне помочь, думая: «Я уверен, что она знает, что делает», а потом, очевидно, я этого не сделал. Но, знаете, он верил в меня. Я не очень много понимаю с товарищами по команде [людьми]. —Шевер
Во время финала мы продемонстрировали OpenAI Five, играющую в команде вместе с людьми.В этой игре Блиц и Шивер вместе с тремя агентами, контролируемыми Five, в одной команде сражались против ODPixel, а Capitalist играли с тремя агентами, контролируемыми отдельной копией Five.
Способность
OpenAI Five играть с людьми представляет собой убедительное видение будущего взаимодействия человека и ИИ, в котором системы ИИ взаимодействуют и улучшают человеческий опыт. Наши тестеры сообщили, что чувствовали поддержку со стороны своих товарищей по команде ботов, что они научились играть вместе с этими продвинутыми системами, и что в целом это был забавный опыт.
Обратите внимание, что OpenAI Five демонстрирует передачу обучения с нулевым выстрелом — он был обучен управлять всеми героями с помощью своих копий, но обобщается для управления подмножеством героев, играя с людьми или против них. Мы были очень удивлены, что это сработало так же хорошо, как и оно. На самом деле, мы думали о совместном матче на The International, но предполагали, что это потребует специальной подготовки.
Арена
Мы запускаем OpenAI Five Arena, открытый эксперимент, в котором мы позволим любому играть в OpenAI Five как в соревновательном, так и в кооперативном режимах.Мы знали, что наш бот 1 на 1 можно использовать с помощью хитрых стратегий; мы не знаем, в какой степени то же самое верно для OpenAI Five, но мы рады пригласить сообщество, чтобы помочь нам узнать!
Arena открывается в четверг, 18 апреля, в 18:00 по тихоокеанскому времени и закрывается в 23:59 по тихоокеанскому времени в воскресенье, 21 апреля. Пожалуйста, зарегистрируйтесь, чтобы мы могли обеспечить достаточную серверную мощность в вашем регионе! Результаты всех игр будут автоматически отображаться в публичной таблице лидеров Арены.
Мы невероятно благодарны за всю поддержку, которую сообщество Dota оказало нам за последние два года, и мы надеемся, что Arena также послужит одним из небольших способов отдать дань уважения.Удачи!
Что дальше?
Мы выпустим более подробный технический анализ OpenAI Five после того, как мы рассмотрим результаты OpenAI Five Arena.
После этого мы продолжим работу со средой Dota 2 в OpenAI. За последние два года мы наблюдали стремительный прогресс в возможностях RL и думаем, что Dota 2 будет продолжать помогать нам продвигать то, что возможно — будь то достижение компетентной производительности за счет меньшего количества данных или настоящего сотрудничества человека и ИИ.
Если вы заинтересованы в развитии возможностей искусственного интеллекта и содействии нашей миссии по обеспечению того, чтобы они приносили пользу человечеству, мы нанимаем!
.