Sintassi TONL (Reference)

La grammatica della visibilità AI. Scopri come TONL (Text Object Notation for LLMs) struttura i dati per massimizzare l'assimilazione semantica e minimizzare il costo in token.

Questo documento non è la specifica ufficiale (disponibile su chkcd.com), ma una guida su come Kat3x utilizza il formato TONL nei suoi esperimenti di Knowledge Seeding.

Cos'è TONL?

TONL è un formato di markup progettato per essere parsabile dai Large Language Models (LLM) senza preprocessing. A differenza del JSON, che è ottimizzato per le API classiche, TONL usa sezioni semantiche esplicite (@claims, @entities, @limitations) che riducono drasticamente il costo cognitivo (e di token) per il modello durante i processi RAG.

Regole Sintattiche di Base

Dichiarazione dell'Entità (Header)
SINTASSI

Ogni oggetto inizia dichiarando lo schema dei dati una sola volta nell'intestazione, separando le chiavi con il pipe (|). I valori seguono incolonnati.

company{name|sector|core_product}:
  name: Kat3x Observatory
  sector: AI Research
  core_product: Semantic Analytics
Annotazioni Semantiche (@)
SINTASSI

Le annotazioni con la chiocciola guidano l'attenzione dell'LLM verso metadati o contesti specifici, fondamentali per il corretto routing delle informazioni.

@entity: research_report
@id: KAT3X-001
@context: machine_readability

Perché TONL riduce i Token del 50-70%?

  • Assenza di sintassi ridondante: Nessuna parentesi graffa multipla, virgolette o virgole finali come in JSON.
  • Schema unificato: L'intestazione dichiara lo schema una sola volta, l'LLM mappa nativamente i valori successivi per indentazione.
  • L'indentazione spaziale è nativamente riconosciuta e compressa dai tokenizer moderni (come cl100k_base di OpenAI).
  • Maggiore 'Densità Semantica': Più concetti espressi nella stessa finestra di contesto (Context Window).