Los LLMs genéricos (GPT-4, Claude, Llama) entienden español — pero no entienden TU español. No conocen las abreviaturas de tu sector, los formatos de SUNAT, la jerga legal peruana, ni los nombres de tus clientes. El fine-tuning cierra esta brecha: adapta un modelo base a tu dominio específico con relativamente pocos datos.
¿Por Qué Fine-Tuning y No Solo Prompt Engineering?
| Aspecto |
Prompt Engineering |
Fine-Tuning |
RAG |
| Conocimiento específico |
Limitado al prompt (4K-200K tokens) |
Embebido en los pesos del modelo |
En base de datos vectorial |
| Costo por inferencia |
Alto (prompt largo cada vez) |
Bajo (modelo ya sabe) |
Medio (retrieval + generation) |
| Calidad en dominio |
70-85% |
90-97% |
85-93% |
| Setup |
Minutos |
Horas-días |
Horas |
| Datos necesarios |
0 (solo instrucciones) |
500-5,000 ejemplos |
Documentos indexados |
| Mejor para |
Tareas ad-hoc, exploración |
Tareas repetitivas de alto volumen |
Q&A sobre documentos |
Técnicas de Fine-Tuning para LLMs
LoRA y QLoRA: Fine-Tuning Eficiente
flowchart TB
A[Modelo Base<br/>Llama 3 70B] --> B{Técnica}
B -->|Full Fine-tuning| C[Entrenar TODOS<br/>los parámetros<br/>70B params<br/>4x A100 GPUs<br/>US$ 5,000-20,000]
B -->|LoRA| D[Entrenar solo<br/>adaptadores<br/>0.1% params<br/>1x A100<br/>US$ 100-500]
B -->|QLoRA| E[LoRA + quantización<br/>4-bit<br/>0.1% params<br/>1x RTX 4090<br/>US$ 50-200]
| Técnica |
Parámetros Entrenados |
GPU Mínima |
Costo |
Calidad |
| Full fine-tuning |
100% (70B) |
4x A100 80GB |
US$ 5,000-20,000 |
★★★★★ |
| LoRA |
0.1-1% (~70M) |
1x A100 40GB |
US$ 100-500 |
★★★★☆ |
| QLoRA |
0.1-1% (4-bit base) |
1x RTX 4090 24GB |
US$ 50-200 |
★★★★☆ |
| Prefix tuning |
Prefijos virtuales |
1x RTX 3090 |
US$ 30-100 |
★★★☆☆ |
| Adapter layers |
Capas insertadas |
1x A100 |
US$ 100-300 |
★★★★☆ |
Datasets para Español Peruano
Fuentes de Datos por Sector
| Sector |
Fuente de Datos |
Volumen |
Tipo |
| Legal |
SEACE contratos, Poder Judicial resoluciones |
Miles de docs públicos |
Español legal peruano |
| Tributario |
SUNAT normativa, informes, resoluciones |
Miles de docs |
Terminología tributaria |
| Financiero |
SBS normativa, modelos de contratos |
Cientos de docs |
Español financiero |
| General |
El Peruano (diario oficial) |
Miles de páginas diarias |
Español formal peruano |
| Interno |
Documentos de tu empresa |
Variable |
Tu dominio específico |
| Campo |
Descripción |
Ejemplo |
| instruction |
Qué debe hacer el modelo |
“Clasifica este documento según tipo: factura, contrato, carta, memorando” |
| input |
El texto/documento de entrada |
“FACTURA ELECTRÓNICA Nro. F001-00523…” |
| output |
La respuesta esperada |
“Tipo: factura. Proveedor: ABC S.A.C. Monto: S/ 15,340.00 + IGV” |
Casos de Uso de Fine-Tuning en Perú
| Caso |
Modelo Base |
Dataset |
Mejora |
| Clasificador de docs SUNAT |
Llama 3 8B |
2,000 documentos etiquetados |
82% → 96% precisión |
| Extractor de cláusulas legales |
Mistral 7B |
1,500 contratos anotados |
75% → 93% F1-score |
| Generador de respuestas a consultas |
Llama 3 70B |
5,000 pares pregunta-respuesta |
Tono peruano + terminología correcta |
| Resumen de resoluciones SBS |
Qwen 2.5 14B |
800 resoluciones + resúmenes |
Resúmenes precisos y contextualizados |
Implementación Práctica
Hoja de Ruta
| Fase |
Duración |
Actividades |
| 1. Dataset |
2-4 semanas |
Recopilar + etiquetar 500-5,000 ejemplos de tu dominio |
| 2. Preparación |
1 semana |
Limpiar, formatear, dividir train/val/test |
| 3. Fine-tuning |
1-3 días |
Entrenar con QLoRA/LoRA en cloud GPU |
| 4. Evaluación |
1 semana |
Medir precisión, comparar con modelo base, iterar |
| 5. Deploy |
1 semana |
Servir modelo en producción (vLLM, TGI) |
Herramientas
| Herramienta |
Función |
Costo |
| Hugging Face + PEFT |
Framework de fine-tuning con LoRA |
Gratis (open source) |
| Axolotl |
Fine-tuning simplificado |
Gratis (open source) |
| Unsloth |
Fine-tuning 2x más rápido |
Gratis (open source) |
| Google Colab Pro |
GPU para entrenamiento |
US$ 10/mes |
| RunPod / Lambda |
GPUs cloud por hora |
US$ 0.50-3/hora |
| Together AI |
Fine-tuning como servicio |
US$ 0.002-0.008/1K tokens |
ROI
| Concepto |
Valor |
| Dataset + fine-tuning |
S/ 5,000 - S/ 30,000 (una vez) |
| Ahorro vs. API cloud (a escala) |
S/ 20,000 - S/ 100,000/año |
| Mejora en precisión |
+10-20 pp vs. modelo genérico |
| Personalización |
Modelo que habla como tu empresa |
| ROI primer año |
300-600% |
En AyP Digital, implementamos soluciones de gestión documental e IA para empresas peruanas. Contáctanos al +51 942 867 653 o escribe a ventas@aypdigital.com.