Mens Alle Poster Om Claude 4, Bruger Jeg Gemini Flash
Alle taler om Claude 4 og nye model-releases. Jeg brugte i mellemtiden denne aften på at eksperimentere med Google Gemini Flash.
Jeg valgte den næsten ved et uheld. Skulle bruge Pro, men jeg greb Flash i stedet. Normalt ville jeg skifte tilbage, men jeg besluttede at lade den koge i et par timer.
Her er hvad der chokerede mig: det brakker ikke ting. Alle mine guardrails, memory banks, og systeminstruktioner, jeg har bygget, virker faktisk med Flash. De seneste tre timer har jeg været ved at kode et helt admin-interface oven på en MobilePayment API i min løsning. Flash gjorde ikke væsentligt større fejl end de dyre modeller, og det var dramatisk hurtigere.
Nu jeg er forvirret på den bedst mulige måde.
Modellen er 20 gange billigere og noticeligt hurtigere, men outputkvaliteten har ikke lidt. Det bryder min hele mentale model omkring AI-assisteret udvikling. Jeg har driftet på antagelsen om, at du går dyrt først og accepterer langsommere iterationer som prisen på kvalitet.
Ikke længere, tilsyneladende.
Spørgsmålet, det højer, er større end bare besparelser. Hvis Gemini Flash kan håndtere mine komplekse vibe coding-projekter med samme pålidelighed som Sonnet eller Gemini Pro, så måske hele tilgangen skal gentænkes. Måske jeg har været ved at overbenyttelse evne, jeg ikke faktisk har brug for.
Eller måske mine guardrails er bare så gode til at kompensere for en mindre dygtig model.
Jeg kommer til at give Flash fuld adgang denne weekend og faktisk push det hårdt. Ikke skifte tilbage endnu. Lad os se, om det holder sig under rigtig tryk, eller hvis jeg rammer en væg til sidst.
Konsekvenserne, hvis det virker: min omkostning per prompt falder dramatisk, iterationer accelererer væsentligt, og jeg skal helt genoverveje min udgift på model-valg.
Er det ikke sjovt, når det, du troede du forstod, pludselig ikke er lige så simpelt, som du troede?
