← Indice documentazione Fondamenti › Architettura

myclaw

Architettura — Introduzione

Versione 1.0 — 21 aprile 2026
Riferimento: myclaw v0.0.1 (design phase)
Formato HTML self-contained — stampabile PDF

Pubblico: Roberto, chi vuole capire in 20 minuti cosa si sta per costruire.

Stato: solo documentazione. Nessuna riga di codice ancora scritta. Questo documento fissa il "cosa" e il "perché"; la microprogettazione di ogni componente vivrà in docs/architecture/*.html.

Indice

Cos'è myclaw?
Perché non bastano openclaw o zeroclaw
Idea chiave: i quattro strati
Il flusso di una richiesta
L'interfaccia LLM, il pattern provider-agnostic
I tre livelli di autonomia
Il DM pairing
Il workspace: file markdown invece di codice
Struttura del repository
Cosa NON è myclaw
Roadmap & approfondimenti

1. Cos'è myclaw?

myclaw è un maggiordomo digitale per casa: un assistente AI che vive su un computer di famiglia, parla attraverso i canali che già usi (terminale, Telegram, in futuro WhatsApp o voce), esegue azioni reali (leggere file, lanciare comandi, consultare il web) ma chiede il permesso prima di fare qualcosa di serio.

L'analogia del maggiordomo è utile. Un buon maggiordomo:

vive nella tua casa (local-first: gira sul tuo PC, non in cloud);
ha le chiavi di certe stanze ma non di tutte (sandbox: può toccare il workspace, non /etc né ~/.ssh);
esegue compiti di routine da solo (cron, notifiche);
per decisioni importanti chiede conferma (approval gating);
apre la porta solo a chi riconosce o a chi mostra un invito (DM pairing);
tiene un registro di tutto ciò che fa (audit log).

Tecnicamente è un processo Python ≥ 3.11 che gira a /opt/myclaw/, composto da quattro strati (gateway, policy, sandbox, workspace/tool). Ogni servizio AI (LLM, STT, TTS, embedding, speaker-ID) viene consumato tramite un'interfaccia astratta — myclaw è provider-agnostic per costruzione. Nel caso specifico dell'ambiente dell'autore l'interfaccia è realizzata da suprastructure, un package sibling preesistente; in un altro ambiente potrebbe essere realizzata da qualunque adapter equivalente.

Obiettivi espliciti

Obiettivo	Cosa significa concretamente
Local-first	Gira sul PC di casa. Nessun dato obbligatoriamente in cloud. Il cloud è solo opzionale (es. LLM provider remoti, tunnel).
Sicuro di default	Bind su `127.0.0.1`, autonomy `Supervised`, sandbox obbligatoria, path forbidden, approvazione per azioni rischiose.
Multi-canale	Stessa "mente", interfacce diverse: CLI, Telegram, poi Signal, voce, web dashboard.
Open-ended	Nuovi tool e canali senza riscrivere il core: basta conformarsi a un Protocol.
Senza lock-in	Il layer AI è dietro un'interfaccia astratta: cambiare Claude con Ollama = una riga di configurazione, senza toccare il codice. Nell'ambiente dell'autore il pattern è implementato da `suprastructure`.

2. Perché non bastano openclaw o zeroclaw

Entrambi sono progetti eccellenti e sono stati la fonte di ispirazione primaria. Entrambi però hanno tare che li rendono non-pronti per l'uso domestico qui sul mio PC:

Progetto	Punti forti	Limiti per il mio caso
openclaw TypeScript, Node 24+	Gateway-first design, 20+ canali, sandbox pluggable (Docker/SSH/OpenShell), skills registry, routing multi-agente	Stack Node estraneo ai miei progetti, default più permissivi, sandbox orientate al cloud
zeroclaw Rust 2024	Footprint minimo, livelli di autonomia, sandbox a strati (Landlock+Bubblewrap), DM pairing, auth criptato, 129+ test di sicurezza	Rust reintroduce uno stack separato; riscrive da zero il layer LLM/STT/TTS che io ho già risolto con un'interfaccia astratta e una sua implementazione (nel mio caso `suprastructure`)

La decisione: prendere i pattern migliori di entrambi (gateway-first di openclaw, autonomy+pairing+sandbox-a-strati di zeroclaw) e reimplementarli in Python, dove:

posso riusare l'implementazione di interfaccia LLM che ho già pronta in casa (nel mio caso suprastructure) invece di riscriverla;
myclaw è coerente con gli altri sibling agents dell'ambiente (un solo linguaggio, convenzioni condivise);
posso alzare i default di sicurezza per il contesto domestico senza combattere contro convenzioni cloud-native.

3. Idea chiave: i quattro strati

myclaw è un cipolla: l'esterno parla con il mondo, l'interno esegue. Ogni strato fidandosi solo dello strato più interno, e concedendo meno privilegi man mano che si va verso il centro.

Figura 1 — I quattro strati di myclaw. Ogni richiesta attraversa tutti e quattro, in ordine, prima di produrre un effetto.

Strato 1 — Gateway

Un singolo processo FastAPI che espone HTTP/WebSocket/SSE su 127.0.0.1:42618. Riceve messaggi dai canali, gestisce le sessioni, smista webhook, pianifica cron job. È l'unico punto di contatto con il mondo. Non esegue mai direttamente comandi sensibili.

Strato 2 — Policy

Il filtro di legalità. Dato un evento ("utente X chiede di fare Y"), risponde: permesso, negato o permesso solo dopo approvazione. Applica il livello di autonomia (vedi cap. 6), i rate-limit, i cost-cap (quanto spendere in LLM al giorno), le forbidden paths e lo stato del pairing (cap. 7).

Strato 3 — Sandbox

Quando la policy dice "sì", l'azione non viene comunque eseguita a mano libera. Per i tool che toccano filesystem o shell si entra in bubblewrap (o systemd-run con hardening) con un profilo scelto dal livello di autonomia. Niente subprocess.run diretto, mai. Docker è un'opzione futura per il modo più strict.

Strato 4 — Workspace & Tool

Dentro la sandbox, il tool fa il suo lavoro: leggere un file dal workspace (/opt/myclaw/workspace/), chiamare un LLM via registry.get(LLMProvider) di suprastructure, scrivere una riga nell'audit log. Il workspace è la "casa" dell'agente: ci vivono i suoi file markdown di personalità e memoria (cap. 8).

4. Il flusso di una richiesta

Seguiamo un esempio concreto. Sei in giardino, scrivi da Telegram: "dimmi cosa c'è nel log di stasera".

Figura 2 — Flusso di una richiesta "lettura log" da Telegram. Ogni passaggio di corsia significa attraversare uno strato. L'audit log (step 9) è implicito in ogni esecuzione.

5. L'interfaccia LLM, il pattern provider-agnostic

myclaw non parla mai direttamente con Claude, OpenAI, Ollama o qualunque altro fornitore di modelli linguistici. Parla con un'interfaccia astratta (tipicamente un typing.Protocol) che il registro risolve a runtime in un'implementazione concreta. Lo stesso vale per STT, TTS, embedding, speaker ID. È il pattern che rende myclaw provider-agnostic: chi scrive myclaw non deve sapere quale modello girerà davvero, e chi amministra l'ambiente può cambiarlo con una riga di configurazione.

Nel diagramma che segue, myclaw è un consumer tra i possibili altri: un assistente domotico per voce e controllo casa, ulteriori bot specializzati su domini ristretti. Tutti condividono la stessa astrazione. Nessuno riscrive il layer AI: lo usa.

typing.Protocol + registry + implementazioni swappabili LLM STT TTS Embedding Speaker ID Model Registry Backend (intercambiabili via config) Claude / Anthropic OpenAI llama.cpp / Ollama faster-whisper Piper xtts-rocm … Cambiare backend = una riga di YAML. Nessun consumer se ne accorge.

Figura 3 — Il pattern provider-agnostic. myclaw è un consumer fra altri possibili (qui un assistente domotico e un bot specializzato a titolo esemplificativo). Tutti parlano con la stessa interfaccia astratta; l'implementazione concreta (nel caso dell'autore, suprastructure) resta intercambiabile.

Il vantaggio concreto: un nuovo modello (es. Claude 4.7 quando sarà disponibile) si configura una volta sola nell'implementazione dell'interfaccia e tutti i consumer lo ereditano simultaneamente — myclaw compreso. Nessun codice da rifare, nessun deploy da coordinare.

6. I tre livelli di autonomia

Concetto ripreso e adattato da zeroclaw. Ogni sessione gira a un livello di autonomia dichiarato. Il livello determina quanto myclaw può fare prima di dover chiedere conferma.

Livello	Default per	Cosa può fare senza chiedere	Cosa richiede approvazione
ReadOnly	Primi collegamenti, ospiti	Leggere file nel workspace, chiamare LLM, fare web search	Ogni scrittura, ogni comando shell, ogni invio messaggio esterno
Supervised default	Uso quotidiano	Quanto sopra + scrittura nel workspace, comandi della shell allowlist	Scrittura fuori dal workspace, comandi non-allowlist, cost > soglia, invio verso terzi
Full	Sessioni amministrative esplicite	Quasi tutto dentro il dominio di casa	Azioni toccando forbidden paths (`/etc`, `~/.ssh`, ...): sempre negate, non approvabili

Forbidden paths sono hard-coded nel codice, non configurabili via YAML. Anche Full non passa. Lista minima: /etc, /root, ~/.ssh, ~/.aws, ~/.config/claude, /var/backups, cartelle di altri progetti in /opt/ diverse da myclaw.

Il livello può essere alzato temporaneamente con un comando esplicito (myclaw session --level full --for 10m), loggato e a scadenza automatica.

7. Il DM pairing

Un canale come Telegram è inerentemente multi-utente: chiunque conosca l'handle del bot può scrivergli. Il pairing è il meccanismo che distingue un familiare da un estraneo.

~/.ssh/id_rsa" → forbidden path, nega subito, non chiede nemmeno

Figura 4 — Sequenza di pairing di un nuovo utente su Telegram. Finché Roberto non approva, il nuovo sender non può fare nulla. Anche dopo, resta al livello più basso (ReadOnly) di default.

Pairing vs login. Il pairing identifica un canale+sender, non una persona fisica. Se lo stesso familiare ti scrive sia da Telegram che da Signal, sono due pairing separati. Ciascuno con il proprio livello di autonomia.

8. Il workspace: file markdown invece di codice

La "personalità" di myclaw non è in un file Python. È nel workspace/, in cinque file markdown che Roberto può editare quando vuole senza restart. L'idea viene da openclaw/zeroclaw ed è azzeccata: la configurazione comportamentale è testo leggibile, non una struttura dati sepolta.

File	Contenuto
`IDENTITY.md`	Chi è l'agente: nome, tono, lingua preferita, stile di risposta. Es: "sei un maggiordomo formale ma asciutto, rispondi in italiano".
`USER.md`	Chi è l'utente principale: Roberto, abitudini, fuso orario, preferenze, vincoli.
`MEMORY.md`	Fatti long-term accumulati: "la password del router è in Bitwarden", "il cane si chiama X", "ogni domenica chiama la zia".
`AGENTS.md`	Regole di orchestrazione: quando delegare a un sub-agente, come i canali mappano a livelli di autonomia.
`SOUL.md`	Principi operativi di alto livello: "non mentire mai sulle azioni fatte", "se in dubbio, chiedi", "local-first".

Questi file sono iniettati nel prompt di sistema a ogni chiamata LLM (con opportuno caching per non consumare token). Editarli è il modo primario di "riprogrammare" myclaw.

L'audit log vive in workspace/.audit/ come JSONL append-only: una riga per ogni tool call, con timestamp, sender, azione, esito, costo stimato.

9. Struttura del repository

Figura 5 — Layout del repository. Stessa filosofia di suprastructure: docs accanto alla root, src/ contiene il package, systemd/ il service file, config/ i defaults.

10. Cosa NON è myclaw

Scope discipline. La lista di ciò che non facciamo è importante quanto la lista di ciò che facciamo. Ogni tentazione di aggiungere un elemento di questa lista va respinta.

Non è un framework generalista. openclaw punta a essere piattaforma; myclaw è un agente per una casa. Se serve un altro agente con regole diverse, se ne fa un'altra istanza, non si astrae.
Non è un hub di servizi AI. I servizi AI stanno dietro un'interfaccia astratta, fornita da un adapter esterno (nel mio caso suprastructure). Se manca un servizio, lo si aggiunge là, non qui.
Non supporta 20+ canali al day one. Si parte con 2 (CLI + Telegram). Signal, WhatsApp, voce arrivano quando servono davvero.
Non è un cloud agent. Gira a casa. Accesso remoto solo via tunnel esplicito (Tailscale/Cloudflare), opt-in.
Non è un sostituto di un sistema di domotica. Per il controllo vocale e la domotica ci sarà un assistente domotico dedicato (tipicamente già presente: nel mio ambiente lo è). myclaw può chiedergli, non duplicarlo.
Non è un framework agentico generico (langchain, llamaindex, crewai, ...). Quelle librerie possono essere usate dentro un Tool, mai come sostituto dell'architettura.
Non è un IDE né un dev assistant. Non scrive codice in altri progetti per conto dell'utente: al massimo ne analizza con tool read-only. Per lavorare sul codice esiste già Claude Code.

11. Roadmap & approfondimenti

La roadmap è volutamente piccola. Passo uno alla volta, con il documento di microprogettazione che precede il codice.

Fase	Obiettivo	Gate
0 (ora)	Questo documento + survival kit	Roberto approva l'architettura d'insieme
1	Scheletro repo + gateway "hello world" + CLI channel + shell tool sandboxato	`gateway.html`, `channel.html`, `tool.html`, `sandbox.html` scritti e approvati
2	Policy engine + workspace markdown + audit log	`policy.html`, `workspace.html`, `observability.html`
3	Telegram channel + DM pairing	`pairing.html` + piano di contenimento danni
4	Memory persistente + provider failover via suprastructure	`memory.html`; suprastructure ≥ v0.4 se serve
5+	Canale voce (riusa STT/TTS di supra), tunnel opzionale, web dashboard minimale	valutato caso per caso

Continua a leggere

estensione · 30 min

Neuroni, Sinapsi e Memoria v1.1

L'estensione naturale: come un agente costruisce attuatori nuovi quando quelli esistenti falliscono, con legge darwiniana di selezione.

pratico · 10 min

Survival Kit — cosa potrò fare

Stesso sistema, visto dall'utente. Cosa potrai farci il giorno 1, con dialoghi-tipo e comandi.

razionale · 15 min

Letteratura & Adattamenti

Il razionale dietro le scelte: 30+ riferimenti da Voyager a CoALA, mappati contro ogni decisione di design.

microprogettazione

Indice componenti

I documenti di microprogettazione (gateway, policy, sandbox, tool, ...) — cresce progressivamente.

home

← Indice documentazione

Torna all'elenco di tutti i documenti e alle loro relazioni.

Versioning del documento. Questo è il v1. Modifiche non-marginali incrementano il numero; il file precedente resta accessibile per tracciare l'evoluzione del pensiero architetturale.

myclaw — Architettura: Introduzione v1.0 — 2026-04-21
Ispirato a openclaw e zeroclaw, costruito sopra suprastructure.