- AI FTW
- Posts
- EUREKA! AI som trener roboter - Hva kan gå galt?
EUREKA! AI som trener roboter - Hva kan gå galt?
Nvidia (som lager alt av AI chips) har publisert noe forskning på hvordan vi kan lære opp roboter

Eureka: Et Gjennombrudd i Robotlæring!
I en setning: ChatGPT lærer roboter å bevege seg. Ikke skummelt i det hele tatt 😬
Som du sikkert kan forestille deg kan det være vanskelig å lære roboter å utføre kompliserte oppgaver som å spinne en penn. Takket være et nytt verktøy kalt Eureka, kan dette snart endres!
Hovedpunkter:
Eureka bruker kraften fra avanserte språkmodeller, litt som super-smarte digitale hjerner, for å undervise roboter bedre og raskere.
Den supersmarte digitale hjernen trenger ikke spesifikke instruksjoner. I stedet finner den ut den beste måten å belønne roboter på for å oppmuntre dem til å lære nye ferdigheter.
Når den ble testet på 29 forskjellige robotdesign og oppgaver, var Eureka bedre enn menneskelige “trenere” 83% av tiden 🤯
Dette verktøyet kan også lære direkte fra vår tilbakemelding, noe som gjør robotopplæring tryggere og mer effektiv.
Den store seieren? Ved hjelp av Eureka har en digital robot-hånd for første gang lært å spinne en penn akkurat som et menneske!
Ok, så hva betyr det egentlig?
Den store skrekken, (eller den hellige gral, alt etter hvordan du ser det) er maskiner som trener seg selv. Det noen refererer til som Super AGI (AGI = Artificial General Intelligence) er når maskinene kan forbedre seg selv.
Vi kan jo også forbedre oss selv, men det tar gjerne åresvis å lære seg en ny motorisk eller kognitiv evne. Og når vi gjør det så kan vi bare jobbe med den hardvaren og den softwaren vi er skapt med. Vi kan ikke faktisk skrive om våre interne modeller. Det er lixm derfor politikere og sånne folk fortsetter å kjøre karriærene sin i bakken, år etter år, fordi hver gang de ser et par solbriller de vil ha, så overstyres frontallappen av amygdalan (roughly speaking). Vi er på godt og vondt bundet til våre fysiske legmer, som er hårløse apekatter på to ben. Vi er et stenkast unna savannen.
Men det er ikke maskinene. En maskin kan lære 500 år med intens kung-fu på 1 time. Den vil kunne oppgradere sine egne interne modeller. Den vil kunne designe sine egne chips (eller tilsvarende).. listen bare fortsetter.
Det å trene agenter til å utføre bevegelser er ikke nytt. Det har de holdt på med en god stund allerede. (du burde følge Two Minute Papers)
Det nye i Eureka er at nå bruker vi kraften fra GPT-4 til å trene modellene.
Og det blir kjempemoro når du får stater som Dubai som synes at robot-politi er veien å gå 🤖:

RT2D2
Google har vært inne på noe av det samme. Tenkte å skrive litt om det senere, men for deg som er keen kan du lese mer her: