Avevo un Raspberry Pi5 in ufficio che non faceva niente. Lo avevo preso perché mi piaceva il concetto di averlo lì e costava poco.
Poi con tutto il cinema dell'AI mi è venuto in mente: ma se gli do delle orecchie? Ho preso un microfono USB da venti euro e ho iniziato a registrare le conversazioni d'ufficio in tempo reale — chunk da 30 secondi, trascritti con Whisper{:target="_blank"} e mandati a un server dove Claude Code può leggerli. Gli posso chiedere "hai sentito cosa dice il cliente? puoi fare una piccola demo al volo?" e lui è già lì a montarla. Non sempre perfetta, ma la cosa funziona molto bene.
Il test
La domanda per testare il limite è stata: ma posso fare tutto nel Pi5? A/B test subito. Ho fatto girare i due modelli in parallelo sullo stesso audio per una giornata intera.
| | 🥧 Pi5 (tiny) | 🖥️ Efesto (medium) | |---|---|---| | Dove | Verbania, sulla scrivania | Norimberga, datacenter | | CPU | ARM Cortex-A76 | x86_64 | | Parametri | 39M | 769M | | Tempo per 30s | ~2s | ~4s | | Ping | 0ms (è lì) | 17ms | | Cucina | Spaghetti | Würstel |
Nonostante l'autarchia totale e il vantaggio del ping a zero, non è andata bene per il Pi5. Anzi, è andata malissimo in un modo talmente divertente che ho deciso di pubblicare i risultati. A voi la top 20.
I risultati
| # | Tiny (Pi5) | Medium (Server) | Contesto | |---|---|---|---| | 1 | il vocchio risultore buonese | il vaporizzatore per iniziare | elettrodomestici | | 2 | a cateone per le matta | le catene per le moto | codice della strada | | 3 | poter la patente di scosta | la patente scaduta | quiz patente | | 4 | l'orbitazione comporta al falso | la loro relazione comporta falso | quiz patente | | 5 | signare affegnato prena | il segnale raffigurato preannuncia | segnaletica | | 6 | sta compranessantità da mio padre | sta comprando i sanitari da mio padre | sconti dal suocero | | 7 | non ci sono più brillo | non ci sono più brioche | crisi del caffè | | 8 | il caffè di la facca gare | il caffè di là fa cagare | escalation caffè | | 9 | la sriscia avvianta trasversare | la striscia bianca trasversale | quiz patente | | 10 | perfeggi all'estit | cafferino all'ospedito | visita ospedaliera | | 11 | la ricicletta, molto retta | la bicicletta, motoretta | mezzi di trasporto | | 12 | io devo fare un'essa giù del conclèo | vado a farmi fare il massaggio del compleo | relax | | 13 | ti fa un minissito fuori avere | ti fa un mini sito forever | spiegazione tecnica | | 14 | solo da dispositivi di qualı al piano | solo dai dispositivi di quella VPN | configurazione rete | | 15 | una di piene, so che sono di piene | una DPM, hai usato una DPM? | disaster recovery | | 16 | con l'imbro e stare giudano | quando sei in coda, ancora davanti | precedenze | | 17 | fuori sullo autostatico | semafori sull'autostrada | infrastrutture | | 18 | una volta che è il cavolo in troppo | una volta che stiamo dentro | organizzazione | | 19 | e se solico perché la notica | vero senso unico perché se no | codice strada | | 20 | che fa più distruttamente | ha fatto discretamente ridere | meta-commento |
Perché
Non è colpa del tiny poverino. Ho messo a confronto un modello da 39 milioni di parametri addestrato su un centinaio di lingue — l'italiano rappresenta l'unghia del mignolo dei dati di training, e da quello che ho capito quando non sa cosa sta sentendo inventa una lingua.
Il medium ha venti volte più parametri, quindi circa 800 milioni, e becca praticamente tutto. Anche con l'audio sporco di un ufficio dove parlano in tre contemporaneamente lo leggi e capisci cosa stava succedendo.
E quindi bon, al prossimo esperimento!