AI FTW
Posts
EUREKA! AI som trener roboter - Hva kan gå galt?

EUREKA! AI som trener roboter - Hva kan gå galt?

Nvidia (som lager alt av AI chips) har publisert noe forskning på hvordan vi kan lære opp roboter

Michael Birkeland
October 24, 2023

Eureka: Et Gjennombrudd i Robotlæring!

Eureka | Human-Level Reward Design via Coding Large Language Models

Les/Se denne siden for full dybde 🧠

eureka-research.github.io

I en setning: ChatGPT lærer roboter å bevege seg. Ikke skummelt i det hele tatt 😬

Som du sikkert kan forestille deg kan det være vanskelig å lære roboter å utføre kompliserte oppgaver som å spinne en penn. Takket være et nytt verktøy kalt Eureka, kan dette snart endres!

Hovedpunkter:

Eureka bruker kraften fra avanserte språkmodeller, litt som super-smarte digitale hjerner, for å undervise roboter bedre og raskere.
Den supersmarte digitale hjernen trenger ikke spesifikke instruksjoner. I stedet finner den ut den beste måten å belønne roboter på for å oppmuntre dem til å lære nye ferdigheter.
Når den ble testet på 29 forskjellige robotdesign og oppgaver, var Eureka bedre enn menneskelige “trenere” 83% av tiden 🤯
Dette verktøyet kan også lære direkte fra vår tilbakemelding, noe som gjør robotopplæring tryggere og mer effektiv.
Den store seieren? Ved hjelp av Eureka har en digital robot-hånd for første gang lært å spinne en penn akkurat som et menneske!

Ok, så hva betyr det egentlig?

Den store skrekken, (eller den hellige gral, alt etter hvordan du ser det) er maskiner som trener seg selv. Det noen refererer til som Super AGI (AGI = Artificial General Intelligence) er når maskinene kan forbedre seg selv.

Vi kan jo også forbedre oss selv, men det tar gjerne åresvis å lære seg en ny motorisk eller kognitiv evne. Og når vi gjør det så kan vi bare jobbe med den hardvaren og den softwaren vi er skapt med. Vi kan ikke faktisk skrive om våre interne modeller. Det er lixm derfor politikere og sånne folk fortsetter å kjøre karriærene sin i bakken, år etter år, fordi hver gang de ser et par solbriller de vil ha, så overstyres frontallappen av amygdalan (roughly speaking). Vi er på godt og vondt bundet til våre fysiske legmer, som er hårløse apekatter på to ben. Vi er et stenkast unna savannen.

Men det er ikke maskinene. En maskin kan lære 500 år med intens kung-fu på 1 time. Den vil kunne oppgradere sine egne interne modeller. Den vil kunne designe sine egne chips (eller tilsvarende).. listen bare fortsetter.

Det å trene agenter til å utføre bevegelser er ikke nytt. Det har de holdt på med en god stund allerede. (du burde følge Two Minute Papers)

Det nye i Eureka er at nå bruker vi kraften fra GPT-4 til å trene modellene.

Og det blir kjempemoro når du får stater som Dubai som synes at robot-politi er veien å gå 🤖:

Dubai Police Boost Residential Security with Self-Driving Patrols Equipped

mediaoffice.ae/en/news/2023/October/16-10/Dubai-Police-Boost-Residential

RT2_D2

Google har vært inne på noe av det samme. Tenkte å skrive litt om det senere, men for deg som er keen kan du lese mer her:

RT-2: New model translates vision and language into action

Tenk på Robotic Transformer 2, eller RT-2, som en super-smart robot-hjerne. Den er designet for å lære fra online data og robotaktiviteter, og deretter bruke den kunnskapen til å styre roboter mer effektivt.

www.deepmind.com/blog/rt-2-new-model-translates-vision-and-language-into-action