Likes Likes:  1
Pagina 4 di 7 PrimaPrima 1234567 UltimaUltima
Risultati da 61 a 80 di 124

Discussione: Poker bot battle (NLHE HU BOT vs top del mondo)

  1. #61
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Leggendo il "nuovo" thread di 2+2 (l'ultimo linkato quello serio), dove scrive anche uno dei tizi della CMU, pare che le mani siano mirror cioè la stessa mano (hole cards di entrambi + runout) viene giocata una volta dal bot e una volta dagli umani, col bot che chiaramente "non lo sa", ma questo in sostanza riduce infinito la varianza.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  2. #62
    Monkey Tilt L'avatar di ilgrandezuma
    Registrato il
    Jan 2013
    Località
    Torino
    Posts
    1,138
    Likes (Given)
    2
    Likes (Received)
    1

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    Leggendo il "nuovo" thread di 2+2 (l'ultimo linkato quello serio), dove scrive anche uno dei tizi della CMU, pare che le mani siano mirror cioè la stessa mano (hole cards di entrambi + runout) viene giocata una volta dal bot e una volta dagli umani, col bot che chiaramente "non lo sa", ma questo in sostanza riduce infinito la varianza.
    esatto, la cosa figa infatti è vedere gli spot più sick, quelli dove magari umano overbetta 2x pot e cpu invece shova 6x pot lol
    - "Stavo bilanciando il mio tilting range"

    - "Quest' anno l' albero di natale lo faccio con CREV"

  3. #63
    Calling Station L'avatar di coldfireman
    Registrato il
    Dec 2012
    Posts
    114
    Likes (Given)
    1
    Likes (Received)
    1

    Predefinito

    Se non sbaglio era già così nella scorsa sfida no?!
    Comunque guardando risultati parziali è altamente probabile che questa volta gli umani vadano al tappeto!

  4. #64
    Monkey Tilt L'avatar di ilgrandezuma
    Registrato il
    Jan 2013
    Località
    Torino
    Posts
    1,138
    Likes (Given)
    2
    Likes (Received)
    1

    Predefinito

    Citazione Originariamente Scritto da coldfireman Visualizza Messaggio
    Se non sbaglio era già così nella scorsa sfida no?!
    Comunque guardando risultati parziali è altamente probabile che questa volta gli umani vadano al tappeto!
    ma gia la scorsa volta il bot era molto solido, solo che impazziva sulle bet da 1bb, infatti tutto il team ha cominciato ad usarla, mentre il bot ovviamente non poteva essere modificato nel corso della sfida
    - "Stavo bilanciando il mio tilting range"

    - "Quest' anno l' albero di natale lo faccio con CREV"

  5. #65
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da ilgrandezuma Visualizza Messaggio
    ma gia la scorsa volta il bot era molto solido, solo che impazziva sulle bet da 1bb, infatti tutto il team ha cominciato ad usarla, mentre il bot ovviamente non poteva essere modificato nel corso della sfida
    Mi pare che delle modifiche le facessero in corso , la gestione della minbet non sono riusciti a modificarla perchè era un elemento molto profondo dell'architettura, cioè il fatto che il bot considerasse le bet tra x e y come la stessa cosa (bucketing) per semplificare la complessità, era tipo alla base del sistema.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  6. #66
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da coldfireman Visualizza Messaggio
    Se non sbaglio era già così nella scorsa sfida no?!
    Comunque guardando risultati parziali è altamente probabile che questa volta gli umani vadano al tappeto!
    Sì ho scoperto di sì, a sto punto non so se l'ho missato anche l'altra volta, o se lo avevo completamente scordato.

    Fattostà che tra equity chop allin, mirror hands, e l'AIVAC o come si chiama il loro nuovo poker-ev, su 120k mani si dovrebbe avere chiarezza di chi ha vinto in senso pokeristico ovvero di chi ha giocato meglio.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  7. #67
    Monkey Tilt L'avatar di ilgrandezuma
    Registrato il
    Jan 2013
    Località
    Torino
    Posts
    1,138
    Likes (Given)
    2
    Likes (Received)
    1

    Predefinito

    Ce da dire che questa volta non ce neanche Doug Polk che mi sembra fosse stato not close il migliore vs Claudico

    Inviato dal mio X9070 utilizzando Tapatalk
    - "Stavo bilanciando il mio tilting range"

    - "Quest' anno l' albero di natale lo faccio con CREV"

  8. #68
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Gizmodo con un articolo decente sulla sfida

    Why It Matters That Human Poker Pros Are Getting Trounced By an AI

    Pare che il bot cambi + spesso di quel che avevamo capito

    But Sandholm says these day-to-day changes are not surprising, given that the Bridges computer is performing calculations to sharpen the AI’s strategy. Libratus’ evolution over the course of the tournament has been discouraging for the human players. “The first couple of days, we had high hopes,” said Chou. “But every time we find a weakness, it learns from us and the weakness disappears the next day.”

    Quindi c'è anche un aspetto di auto-apprendimento in corso anche se

    The Libratus-Bridges collaboration is fueled by tremendous computing power (Bridges has access to 15 million core hours of computation and 2.5 petabytes of data) and the wondrous, adaptive powers of machine learning. Libratus is obviously going to alter its behavior over time, learning from its opponents and its own successes and mistakes. At a qualitative level, Libratus won’t be the same AI going into the tournament as it will be going out. It’s also worth pointing out that the human players have been sharing notes and tips with each other, hunting for any weaknesses in the machine’s gameplay.

    Qui mi sa che hanno capito male, non aggiusta sugli oppo ma è probabile che in sostanza + gioca, con massiccio potere di calcolo dietro, + converge verso GTO.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  9. #69
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    AMA (una sorta di the well a durata limitata) su reddit per 2 dei giocatori della sfida tutt'ora in corso

    https://www.reddit.com/r/IAmA/commen...ers_currently/

    Rispondono anche alcuni ricercatori riguardo dettagli del bot, molto interessante.

    ...

    First they came for the chess players, and I did not speak out - because I was not a chess player.
    Then they came for the go players, and I did not speak out - because I was not a go player.
    Then they came for the poker players...
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  10. #70
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    How excited are you guys to go crush some regular human opponents after trying to grind it out against Skynet? More seriously: how has your strategy improved from facing an opponent like Libratus? Are you gonna start overbetting more frequently you think?

    answer

    Jason: Once you face Libratus, there's nothing worse any human could ever do to you. Every human is going to seem like a walk in the park.
    Jason + Dong: We are definitely going to start overbetting more frequently. It takes a lot of studying to figure out the right way to do it though. The moment you're somewhat imbalanced there (bluffing too much, or bluffing too little) then you're making a huge mistake.

    ///

    1) I've seen the bot turn very strong hands into bluffs in spots that I wouldn't really think it would as well just jam with nothing and no real relevant blockers. Do you think that the bot has been trying to exploit the humans in spots where it believes that the human range is capped or do you just think it's playing GTO and remaining balanced?

    answer

    1) Dong: The bot doesn't give a shit about its range being capped. Second, I think it just picks a frequency and categorizes its checks and bets into different sizes. Jason: I think it's very rarely not taking blockers into account. It seems to always take blockers into account in every situation.

    ///

    What would you say is the bots strongest game? Preflop, postflop, turn or river?

    answer

    2) Dong: Turn.

    ///

    Do you guys think that if you had a year to review the hand histories, that you could beat this current version of the AI?? Or at least come close?

    answer

    Jason: I think if we had infinite time to study and play on any schedule we wanted, we could get closer. But I don't think we could beat it.

    ///

    How often does the bot donk lead?

    answer

    (researchers) about 14%

    ///

    What's the bots xr frequency f/t/r? [checkraise]

    answer

    Dong: Around 9, 8, and 12.

    ///

    Is the bot doing much leading on any streets in single raised, 3b, or 4b pots?

    Jason: The bot is leading on basically any street in any type of pot. It's quite unusual to deal with.

    ///

    How do your red line and blue lines look verse bot?

    Jason: Overall, we're slightly losing in red line and mostly losing in blue line.

    ///

    Dong: The bot isn't particularly aggressively. But when it is, it is with massive sizes and very difficult situations. So the stats are misleading... they make it look pretty passive. But that's because when it does bet, it bets huge (and also sometimes mixes in small sizes). I think the bot just gets off on that.

    ...

    Dong: Biggest difference is that most human poker players do what Libratus does, betting with multiple bet sizes, but humans only have one or two usually. Libratus mixes in a bunch, maybe 10 or 15, and even mixes in situations that I thought didn't make sense before this competition started. It would be way too complicated for a human to do this sort of thing correctly.


    ...

    Noam: The standard for research is No Limit Texas Hold'em. However, none of the techniques are specific to poker (or Texas Hold'em) so it would be pretty easy to make a Pot Limit Omaha bot using the same approach.


    /// ///

    Riassunto veloce: bot mostruosamente forte. Non ha mai range cappato. Checkraisa su tutte le street un sacco. Overbetta + spesso degli umani. Bilancia le overbet con size anche + piccole del "normale" ogni tanto.
    I top reg hunlhe hanno + problemi a voltare "corretto" (linea blu) che a bet/foldare / tentare steal con le frequenze adeguate (contro il bot perdono + di blu che di rossa). Ipotesi: non checkano abbastanza value al turn.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  11. #71
    Monkey Tilt L'avatar di banditos
    Registrato il
    Feb 2011
    Località
    hijack
    Posts
    1,194
    Likes (Given)
    171
    Likes (Received)
    431

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio

    Riassunto veloce: bot mostruosamente forte. Non ha mai range cappato. Checkraisa su tutte le street un sacco. Overbetta + spesso degli umani. Bilancia le overbet con size anche + piccole del "normale" ogni tanto.
    I top reg hunlhe hanno + problemi a voltare "corretto" (linea blu) che a bet/foldare / tentare steal con le frequenze adeguate (contro il bot perdono + di blu che di rossa). Ipotesi: non checkano abbastanza value al turn.
    in realtà da quel che ho visto e da quello che ho capito dai commenti del team human non è che c/r tantissimo su tutte le street come hai scritto(infatti mi sembra abbiano detto che craisava 9/8/12 che è non è"tantissimo" imo) bensì il problema maggiore è stato affrontare una sequenza impressionante di overbet flop, turn , river e non parliamo di overbet 1,5x pot o 2x pot, questo bettava anche 5x pot tranquillamente, le size di raise erano mooooolto corpose e turnava in bluff sd in specifici spot. Senza contare quando leadava flop o turn o river sia in srp che in 3b pot.

  12. #72
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da banditos Visualizza Messaggio
    in realtà da quel che ho visto e da quello che ho capito dai commenti del team human non è che c/r tantissimo su tutte le street come hai scritto(infatti mi sembra abbiano detto che craisava 9/8/12 che è non è"tantissimo" imo) bensì il problema maggiore è stato affrontare una sequenza impressionante di overbet flop, turn , river e non parliamo di overbet 1,5x pot o 2x pot, questo bettava anche 5x pot tranquillamente, le size di raise erano mooooolto corpose e turnava in bluff sd in specifici spot. Senza contare quando leadava flop o turn o river sia in srp che in 3b pot.
    Ho scritto checkraise "un sacco", quelle stat mi paiono ben + alte di quello che ricordo fossero anche tra top reg quando giocavo io.

    Sì betta out anche circa 15% (l'ho riportato negli highlights delle risposte), avrei dovuto mettere anche quello nel riassunto.

    Notare che le overbet strane che sorprendono di cui parliamo sono tipicamente in spot dove una street è stata checkata. Cioè in quelli dove lui ha mixato dentro dei check di valore (la cosa che, sempre imo, gli umani fanno evidentemente meno di quanto sia ottimale), anche in position.

    Non è tanto che apre, te calli, lui fa due terzi due terzi 2x, è + che fa check , check, 4x, oppure halfcall, check check, 3x , sia su river che complicano molto sia su river "anonimi", ovviamente non spesso ma un numero sufficiente di volte da farti dire "wtf".
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  13. #73
    Calling Station
    Registrato il
    Aug 2012
    Posts
    140
    Likes (Given)
    18
    Likes (Received)
    16

    Predefinito

    13bb/100 per Libratus attualmente. Considerando che vs Claudico l'anno scorso gli Humans hanno vinto per 8bb/100, se non ricordo male, non oso immaginare che risultati si possano ottenere l'anno prossimo qualora si tenesse una nuova sfida. La tecnologia sta avanzando con un ritmo assurdo.

  14. #74
    Antonius L'avatar di conilmionome
    Registrato il
    Oct 2010
    Posts
    2,481
    Likes (Given)
    201
    Likes (Received)
    134

    Predefinito

    Morale della favola, quanto tempo diamo ancora al poker online dopo questa batosta?
    Ora è proprio finita ho paura..
    Se sei incerto o titubante tira un 5 oppure un fante

  15. #75
    Calling Station
    Registrato il
    Aug 2012
    Posts
    140
    Likes (Given)
    18
    Likes (Received)
    16

    Predefinito

    Citazione Originariamente Scritto da conilmionome Visualizza Messaggio
    Morale della favola, quanto tempo diamo ancora al poker online dopo questa batosta?
    Ora è proprio finita ho paura..
    Dipende da come si vede il bicchiere...

    Ovviamente c'è il lato negativo ( molto negativo) riguardante lo stato dell' a.i., quindi di conseguenza se le pokerroom non riusciranno a limitare la presenza dei bot, questi in poco tempo crusheranno tutti i livelli decretando la fine del poker online.

    Di positivo però possiamo trarre che ci sono ancora edge enormi da prendere se anche i migliori giocatori al mondo sono lontani anni luce dal giocare una strategia unexploitable.

  16. #76
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da conilmionome Visualizza Messaggio
    Morale della favola, quanto tempo diamo ancora al poker online dopo questa batosta?
    Ora è proprio finita ho paura..
    Se leggi bene l'AMA c'è qualche indicazione a caldo. Il 6max "sembra + lontano", e comunque la specifica resa di libratus dipende anche dal fatto che runnava su un "supercomputer", anche se pare che runnato da desktop performerebbe comunque "abbastanza bene".

    Inoltre tanka spesso + di quanto una normale timebank consentirebbe.

    Per ultimo, per ora, non tutto è banalmente replicabile da un buon botter, nel senso che non tutti i passaggi sono chiari esattamente anche per gli addetti ai lavori, per ricostruire un clone di libratus.

    /Fine visione rosea

    D'altro canto se DOMANI uno dei ricercatori di quel gruppo trova una somma anche non enorme (imo meno di mezzo milione) può arrivare (sempre imo) a una resa del 90-95% di quella di libratus (quindi bho, 3-4bb/100 sopra il top reg?) hu, e forse non "troppo peggio" 6max, insomma volendo potrebbe killare il poker online anche dentro i limiti di timebank, già da ora.

    In sostanza è strano che ci sia ancora un pò di action senza bot fort a limiti dove puoi farti "degli stipendi al mese"i, non il contrario.

    Ma magari ancora per anni sarà così, credo dipenda dalle scelte di poche persone che non possiamo prevedere.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  17. #77
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da Simone9124 Visualizza Messaggio
    Dipende da come si vede il bicchiere...

    Ovviamente c'è il lato negativo ( molto negativo) riguardante lo stato dell' a.i., quindi di conseguenza se le pokerroom non riusciranno a limitare la presenza dei bot, questi in poco tempo crusheranno tutti i livelli decretando la fine del poker online.

    Di positivo però possiamo trarre che ci sono ancora edge enormi da prendere se anche i migliori giocatori al mondo sono lontani anni luce dal giocare una strategia unexploitable.
    Credo che le poker room possano fare ZERO, cioè oggettivamente veramente niente, per evitare l'uso di bot avanzati a chi è disposto a farlo runnare con supervisione umana. SE hai le skill per scrivere quel bot hai le skill per aggirare qualunque controllo possibile da parte della room senza problemi proprio.

    Le room possono fare cose che impediscono a botter "amatoriali" di applicare con banalità un bot straforte scritto da altri quello sì.
    ///

    Riguardo "l'edge che si può prendere" non è detto. Non pare umanamente fattibile il mixare 10-15 bet size con le proporzioni giuste per esempio.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  18. #78
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Posts
    19,347
    Likes (Given)
    521
    Likes (Received)
    8331

    Predefinito

    Citazione Originariamente Scritto da Simone9124 Visualizza Messaggio
    13bb/100 per Libratus attualmente. Considerando che vs Claudico l'anno scorso gli Humans hanno vinto per 8bb/100, se non ricordo male, non oso immaginare che risultati si possano ottenere l'anno prossimo qualora si tenesse una nuova sfida. La tecnologia sta avanzando con un ritmo assurdo.
    L'avanzamento è rapido MA non è mele con mele. Ovvero qui CMU ha usato il breakthrough di DeepMind in buona parte, ovvero ha usato il risultato di qualcuno che ci ha messo centinaia di milioni.

    Voglio dire che lo strappo è stato che qualcuno da fuori rispetto alla ricerca per le AI di poker ha fatto qualcosa di davvero simile ed applicabile investendo un multiplo delle risorse mai investite per le poker AI fino a quel momento. Quindi non è tanto questione di aumento del tasso di sviluppo quanto del fatto che, lateralmente, è come se fossero arrivati molti + soldi a studiare quel problema.

    Per dire che IMO se si fossero spesi anche "solo" i soldi spesi per la ricerca sugli scacchi libratus lo avremmo avuto almeno 3 anni fa se non prima.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  19. #79
    Scandinavian LAG L'avatar di xplosive
    Registrato il
    Dec 2012
    Posts
    860
    Likes (Given)
    35
    Likes (Received)
    173

    Predefinito

    vorrei capire che edge abbia 100x a questo punto...

    comunque gli umani ormai disperati, stnano aprendo 6x da btn, quindi i result saranno un po' sfasati...

    se non sbaglio libratus runna su un pc molto performante, quindi prima che quella potenza di calcolo sia accessibile a tutti io direi almeno altri 3 o 4 anni(?) passeranno. per risolvere il giochino 6max io direi 1 anno al max (per superpc).

    insomma, se caragie mellon si rimangia la parola, l' online potrebbe finire molto presto..

    certo che uno che gioca in maniera stratosferica lo si nota abbastanza in fretta...
    For us to live any other way was nuts. Uh, to us, those goody-good people who worked shitty jobs for bum paychecks and took the subway to work every day, and worried about their bills, were dead. I mean they were suckers. They had no balls.

  20. #80
    Antonius L'avatar di conilmionome
    Registrato il
    Oct 2010
    Posts
    2,481
    Likes (Given)
    201
    Likes (Received)
    134

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio

    In sostanza è strano che ci sia ancora un pò di action senza bot fort a limiti dove puoi farti "degli stipendi al mese"i, non il contrario.

    Ma magari ancora per anni sarà così, credo dipenda dalle scelte di poche persone che non possiamo prevedere.

    Di bot che girano ce ne sono parecchi, pokerstars sembra l'unica room un po' salva ancora, almeno il .it.
    I bot che giravano stile miss, thanatos, django e varie repliche come lumacalumaca etc.. sembrano eliminati per sempre.
    Però sospetto che in hu molti nuovi e continui nick stranieri possano essere dei bot.
    Però, per dire, su ipoker non è così, ormai è infestato dai bot e quelli top non sono mica così male, tralaltro ogni tot mesi cambiano un po' il gioco e migliorano di volta in volta.
    Poi anche lo stesso pokersnowie implementando la mini size ( prima aveva praticamente solo 1/2pot, pot, 2pot, ora ha anche 1/4 pot) a mio avviso è sicuramente tosto e giocandoci un po' a due anni di distanza mi ha sopreso. Sopreso perchè effettivamente fa un po' di cose simili a libratus, cioè dal nulla overpotta oppure minisize donkando etc.. Ti mette di continuo in difficoltà ecco.
    Comunque libratus oggi fa 12bb/100 vs i toptop, immagina quanti ne stampa vs reg bravi/decenti/scarsi etc..
    Poi credo che per pownare il 95% dei reg basti anche un bot bilanciato con 4-5 size differenti al massimo invece di 10-15. Non credo ci voglia per forza il bot della nasa, cioè il vecchio bot che ha perso 8bb/100 vs Polk and co, già pownava quasi tutti.

    Di sicuro le poker room, come dici te, non so come riescano a fermare i bot seriamente. Te l'avevi previsto già 3-4 anni fa, in realtà ci è voluto più del previsto, ma ho paura che si siamo.
    Ultima modifica di conilmionome; 28-01-2017 alle 18:47
    Se sei incerto o titubante tira un 5 oppure un fante

Informazioni Discussione

Utenti che Stanno Visualizzando Questa Discussione

Ci sono attualmente 1 utenti che stanno visualizzando questa discussione. (0 utenti e 1 ospiti)

Segnalibri

Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •