Intelcomercial · Formación en IA
Concepto clave · Tokens

La IA no lee palabras: lee tokens

Un token es la unidad mínima en la que un modelo de lenguaje «trocea» tu texto para entenderlo y responder. Es la verdadera moneda de la IA: cada token que entra y sale tiene un coste. Escribe abajo y observa, en vivo, cómo se parte tu texto.

Material interactivo para el aula · aplicable a Claude (Opus · Sonnet · Haiku) y a cualquier modelo moderno.

Token = unidad de esfuerzo

Piensa en los tokens como la gasolina del motor. Cada palabra que el modelo lee y cada palabra que escribe consume tokens. Mensajes pequeños gastan poco; documentos enormes, muchísimo.

🔤

Un token ≠ una palabra

A veces un token es una palabra entera; otras, solo un trozo. Las palabras largas o raras —y los acentos y la ñ— se parten en varios tokens. Por eso «importa cómo escribes», no solo cuánto.

🪟

La ventana de contexto

Cada conversación tiene un presupuesto de tokens. Cuando se llena, el modelo empieza a «olvidar» lo primero que se dijo para no salirse del límite. Eso es el famoso «se me olvidó».

Simulador de tokens

Escribe o pega cualquier texto. Cada recuadro de color es un token. Cambia el modelo y el tamaño de la ventana de contexto para ver cómo afecta.

🧪 Tu texto, tokenizado en vivo

consumo equilibrado
0
Caracteres
0
Palabras
0
Tokens (aprox.)
0
Tokens / palabra
Cada recuadro = 1 token

🪟 Ventana de contexto (demostración)

Baja el tamaño de la ventana para simular un presupuesto pequeño. Si tu texto lo supera, el modelo «olvidaría» los tokens más antiguos (en gris).

120
Cabe holgadamente en la ventana.

El mismo mensaje, dos formas

La eficiencia se nota: una petición clara y concisa cuesta menos tokens que una vaga y enrevesada. Edita ambas cajas y compara.

VERSIÓN CONCISA
Tokens: 0
VERSIÓN ENREVESADA
Tokens: 0

Cómo gastar menos tokens (y rendir más)

Todo se reduce a una pregunta: ¿cómo evito malgastar tokens? Estas son las palancas principales.

Ajusta el modelo a la tarea

Para lo ligero, un modelo eficiente (Haiku/Sonnet); reserva el más potente (Opus) para lo difícil. No lleves un Ferrari a comprar el pan.

Sé específico a la primera

Di qué quieres, para quién y con qué detalle. Las peticiones vagas generan respuestas vagas y rondas de aclaración que cuestan tokens.

Agrupa tus preguntas

Varias preguntas en un solo mensaje gastan mucho menos que ir una a una, porque cada turno relee toda la conversación previa.

Empieza un chat nuevo

Al cambiar de tema, abre una conversación limpia. Así no pagas por arrastrar todo lo anterior, que el modelo relee en cada mensaje.

Nota honesta (importante para el aula). Este es un simulador educativo aproximado. Los modelos reales usan tokenizadores entrenados (tipo BPE) y Claude no publica el suyo exacto, así que el número de tokens aquí es orientativo, no exacto. Lo que sí es fiel es el principio: las palabras largas o raras, los acentos, la ñ, los emojis y los símbolos se trocean en más tokens; y cada token cuenta. Para un recuento exacto se usa el contador oficial de cada proveedor.