Android

Wat drijft de openai bot die dendi verslaat

Dota 2 Dendi vs OpenAI (Bot) - 1v1 - TI7

Dota 2 Dendi vs OpenAI (Bot) - 1v1 - TI7

Inhoudsopgave:

Anonim

Vorige week werd geschiedenis gecreëerd in de rijken van Dota 2 en AI. Bij The International werd Dendi, een van de beste spelers van het spel, genadeloos verslagen in een 1v1, door een bot, twee keer op rij. De bot in kwestie is gemaakt door OpenAI, een startup van Elon Musk.

Nu heb je misschien wat vragen. Wat is Dota? Wat is OpenAI? En waarom is dit zelfs belangrijk? Om te beginnen is Dota een gratis te spelen MOBA-game waarin je Heroes bestuurt en je doel is om de tegenstanders Ancient te vernietigen. Veel Dota-fans kunnen aanstoot nemen tot de laatste zin omdat er zoveel te Dota is dan ik heb samengevat.

De game is erg complex met een zeer steile leercurve. Ik was enige tijd geleden begonnen aan een missie om Dota te leren en het kostte me een week om een ​​eenvoudige How To- video te doorlopen, waarin ze de strategie van het spel uitlegden, wat wapens, spreuken, helden doen en hoe je kruipen mijnen. En dit maakt de hele strijd tussen AI en Dendi belangrijk omdat het illustreert hoe geavanceerd AI en ML zijn geworden. Dus laten we kijken wat die bot aandrijft en moeten we bang worden voor AI-opstand.

Rise Of The Planet Of The AI

AI Skynet worden is een discutabel probleem. Elon Musk gelooft dat als het niet onder controle wordt gehouden, er waarschijnlijk een Skynet- achtig scenario zal gebeuren. Anderzijds zegt Mark Zuckerberg dat AI onschadelijk is en geen Doomsday Scenario veroorzaakt. Elon Musk startte OpenAI met dit doel.

Om misbruik van AI en onderzoek naar AI te voorkomen dat zich niet tegen ons zal keren. En ik sta aan zijn zijde.

Maar dat is niet waar we het hier over hebben. Het hoofdonderwerp is om te weten wat de aandrijving van de OpenAI aandrijft. Om er een goed begrip van te krijgen, las ik enkele onderzoeksartikelen en blogs over dit onderwerp en nam ik ook contact op met mijn vriend Anmol Sharma, die onderzoek doet naar AI & ML.

Versterking leren

Dit is de naam van de technologie achter de Dota-bot van de OpenAI. Maar voordat we het gaan verdiepen, moeten we begrijpen hoe algemene AI, of specifiek AI in videogames werkt. AI is een zeer boardterm en bevat veel onderwerpen zoals Machine Learning, Deep Learning en Neural Networks om er maar een paar te noemen. Om AI grof te definiëren, kunnen we zeggen dat het het vermogen van een computer is om van informatie te leren en beslissingen te nemen op basis van zijn leerproces. Hoe meer het leert, hoe meer de juistheid van beslissingen toeneemt.

Waarin verschilt het van normale Bot's?

Bots in algemene videogames lijken misschien intelligent, maar het is geen echte vorm van AI. Bijna al deze bots in games zijn geprogrammeerd op basis van de set If..This..Then..That. Ze volgen gewoon de verklaringen en ondernemen actie op basis van de voorwaarden in de verklaring.

Hierboven heb ik een heel eenvoudig voorbeeld laten zien. Uitspraken in echte spellen zijn veel complexer met voorwaarden binnen voorwaarden. Hoe beter gedefinieerd en gedetailleerd deze uitspraken zijn, hoe meer de bot intelligent lijkt te zijn.

Beloningen en straffen

In AI-lingo staat wat we bot noemen een agent. Het doel is om de agent te laten leren wat we willen dat hij leert. De agent leert op dezelfde manier als uw hond leert, via beloningen en straffen. Wanneer de agent een fout maakt, wordt hij bestraft en telkens wanneer hij de juiste gok doet of het juiste antwoord geeft, wordt hij beloond. Via dit systeem leert de agent de acties te associëren die hij niet zou moeten doen om straf te vermijden en de actie (of soortgelijke acties) uit te voeren die beloningen opleveren.

Als je er goed over nadenkt, is het net alsof je beslissingen neemt op basis van bepaalde voorwaarden, net zoals algoritmen het doen. Zoals ik hierboven heb aangetoond, zal een game-bot, die een explosief vat tegenkomt, acties ondernemen volgens het algoritme. Algoritmen in AI zijn uiteraard enorm complex dan dit, waardoor het hele systeem intelligent is.

Naar onze OpenAI-bot, volgens de ontwikkelaars, leerde het de hele game in tijd van 2 weken. Gedurende de hele tijd van 2 weken was het 24 × 7 online en speelde het tegen een kopie van zichzelf. Dat is een opmerkelijke mijlpaal gezien de complexiteit van het spel en het feit dat het Dendi kon verslaan.

Waarom zijn er nog geen auto's zonder bestuurder?

Dit was een van de eerste vragen die in me opkwam toen ik over dit hele evenement hoorde. Als een bot zo'n spel kan leren en zichzelf kan trainen om topspelers te verslaan, waarom bemannen we dan nog steeds het wiel? En dit was dezelfde vraag die ik op mijn vriend, de heer Anmol Sharma, heb geschoten, die ook onderzoek heeft gedaan naar autorijden zonder auto's. Dit is wat hij te zeggen had.

In een spel, dat is ontwikkeld door een mens, is het aantal variabelen minder. Bovendien, als de agent (bot) een fout maakt, is de ergste straf een rond verlies. In de echte wereld is een fout de dood.

Hoewel Dota een complexe game is, zijn de mogelijke combinaties van bewegingen, spreuken en tactieken, hoewel nog steeds absurd groot, nog steeds beperkt. En fouten zijn toegestaan ​​zonder echte straf. Maar in het geval van een auto-agent zonder bestuurder, kunnen fouten leiden tot gevaarlijke ongevallen en zelfs de dood.

In de echte wereld is het aantal variabelen dat de agent moet controleren eindeloos en zijn er situaties die zich voordoen als gevolg van deze variabelen, zoals een andere auto die plotseling van rijstrook verandert, voetgangers springen voor de auto, ook eindeloos. Bovendien, zoals Jeremy Clarkson het uitdrukte, zullen ze morele en ethische beslissingen moeten nemen wanneer ze aan de vooravond staan ​​van een onmiddellijk ongeluk (hoewel zijn theorie niet geldig is).

De toekomst

We weten al dat door de mens bestuurde robot intrinsieke operaties uitvoert. De volgende sprong is AI-bestuurde robots die het uitvoeren. En dit is alleen op medisch gebied. AI zal in veel gebieden de komende tien jaar zeker de dominante nieuwe technologie zijn. Maar AI kan ook worden misbruikt voor snode doeleinden zoals DDoS-aanvallen, Ransomware Bots en het hacken van andere pc's of systemen van bedrijven.

Wat Dota en andere spellen betreft, kunnen we verwachten dat dergelijke intelligente bots ook worden gemaakt voor andere spellen, tegen wie spelers kunnen trainen om nog beter te presteren. En had ik al gezegd dat OpenAI volgend jaar een 5v5 gaat doen op International? Dus ik ga mijn Dota-vaardigheden opfrissen om op zijn minst de ingebouwde dumber bots te verslaan. Goddelijke Rapier hier kom ik!