La preservación digital a largo plazo constituye uno de los desafíos más críticos de la era digital. Mientras que documentos en papel bien conservados pueden durar siglos, los documentos digitales enfrentan amenazas como obsolescencia tecnológica, degradación de medios y pérdida de metadatos esenciales.
El Desafío de la Preservación Digital
Diferencias con Preservación Tradicional
Documentos físicos:
- Degradación gradual y predecible
- Legibilidad directa (solo requiere luz)
- Independientes de tecnología
- Duración: 100-500 años con cuidado adecuado
Documentos digitales:
- Degradación abrupta (funciona o no funciona)
- Requiere hardware y software específico
- Dependientes de tecnología cambiante
- Duración sin gestión: 5-10 años antes de obsolescencia
Amenazas a la Preservación Digital
1. Obsolescencia de formatos:
Ejemplos históricos:
- WordPerfect 5.1 (1990s): Hoy prácticamente ilegible
- Lotus 1-2-3 (1980s-1990s): Requiere software especializado
- Floppy disks 5.25”: Hardware ya no disponible comercialmente
Lección: Formatos propietarios y poco adoptados tienen alto riesgo de obsolescencia.
2. Degradación de medios:
| Medio de Almacenamiento | Vida Útil Estimada | Factores de Degradación |
|---|---|---|
| CD-R/DVD-R (calidad alta) | 10-25 años | Exposición a luz, humedad |
| Discos duros (HDD) | 3-5 años en uso, 10-20 almacenado | Partes mecánicas, golpes |
| SSD (Estado sólido) | 5-10 años | Retención de carga eléctrica |
| Cintas magnéticas (LTO) | 15-30 años | Temperatura, humedad |
| Cloud storage | Indefinido* | Continuidad del proveedor |
*Asumiendo migración continua por el proveedor.
3. Pérdida de metadatos:
Sin metadatos adecuados, un archivo digital puede volverse ininteligible:
- ¿Quién creó el documento?
- ¿Cuándo fue creado?
- ¿Qué software fue usado?
- ¿Cuál es el contexto del documento?
Estándares Internacionales de Preservación
ISO 14721: OAIS (Open Archival Information System)
Modelo de referencia para sistemas de archivo digital a largo plazo.
Componentes clave del modelo OAIS:
- Ingestión:
- Recepción de documentos
- Generación de paquete de información de envío (SIP)
- Control de calidad
- Almacenamiento archivístico:
- Conversión a paquete de información de archivo (AIP)
- Almacenamiento seguro y redundante
- Verificación periódica de integridad
- Gestión de datos:
- Metadatos descriptivos
- Metadatos de preservación
- Esquemas de clasificación
- Administración:
- Políticas de preservación
- Planificación de migraciones
- Gestión de riesgos
- Planificación de preservación:
- Monitoreo de obsolescencia
- Desarrollo de estrategias de migración
- Actualización de estándares
- Acceso:
- Generación de paquete de información de difusión (DIP)
- Control de acceso
- Generación de copias de trabajo
ISO 19005: PDF/A (PDF for Archive)
Estándar específico para preservación de documentos PDF.
Versiones de PDF/A:
PDF/A-1 (basado en PDF 1.4):
- ✅ Todos los contenidos autocontenidos (fonts, imágenes embebidas)
- ✅ No permite JavaScript ni contenido ejecutable
- ✅ Metadatos XMP obligatorios
- Uso: Documentos finales sin necesidad de edición
PDF/A-2 (basado en PDF 1.7):
- ✅ Soporta capas (layers)
- ✅ Permite adjuntos PDF/A
- ✅ Compresión JPEG2000
- Uso: Documentos complejos con múltiples componentes
PDF/A-3 (basado en PDF 1.7):
- ✅ Permite adjuntos en cualquier formato (XML, Excel, etc.)
- ✅ Útil para factura electrónica (PDF/A-3 + XML)
- Uso: Documentos con datos estructurados asociados
Niveles de conformidad:
- Nivel A (Accesible): Cumple requisitos de accesibilidad (tagged PDF)
- Nivel B (Básico): Representación visual garantizada
- Nivel U (Unicode): Texto con mapeo Unicode completo
Recomendación para archivos del Estado peruano: PDF/A-2b o PDF/A-3b para mayoría de documentos.
Formatos Recomendados por Tipo de Contenido
Documentos de Texto
Formato de preservación: PDF/A-2b o PDF/A-3b
Razones:
- ✅ Estándar ISO internacional
- ✅ Ampliamente soportado
- ✅ Apariencia visual preservada
- ✅ Contenido searchable con OCR embebido
Metadatos mínimos obligatorios:
<metadata>
<titulo>Resolución Administrativa N° 0123-2025-XXX</titulo>
<autor>Entidad emisora</autor>
<fecha_creacion>2025-02-01</fecha_creacion>
<clasificacion>Público / Reservado / Confidencial</clasificacion>
<serie_documental>Resoluciones Administrativas</serie_documental>
<plazo_conservacion>Permanente / 10 años</plazo_conservacion>
</metadata>
Imágenes
Formato de preservación: TIFF sin compresión o con LZW
Razones:
- ✅ Sin pérdida de calidad
- ✅ Estándar abierto
- ✅ Amplio soporte de software
- ✅ Metadatos EXIF/IPTC
Configuración recomendada:
- Resolución: 300-600 DPI (documentos), 600-1200 DPI (fotografías/planos)
- Profundidad de color: 24-bit color o 8-bit escala de grises
- Compresión: Sin compresión (preferido) o LZW (aceptable)
Alternativa moderna: JPEG2000 (ISO 15444)
- Compresión sin pérdida o con pérdida controlada
- Metadatos extensivos
- Menor adopción que TIFF (considerar riesgo)
Audio
Formato de preservación: WAV (PCM sin compresión) o FLAC
Configuración WAV:
- Sample rate: 48 kHz (mínimo), 96 kHz (ideal para archivo histórico)
- Bit depth: 24-bit
- Canales: Mono o estéreo según original
Alternativa FLAC:
- Compresión sin pérdida (reduce tamaño 40-60%)
- Código abierto
- Amplio soporte
Video
Formato contenedor: Matroska (MKV)
Códecs de video: FFV1 (sin pérdida) o H.264/H.265 (alta calidad)
Códecs de audio: PCM o FLAC
Razones:
- ✅ MKV es código abierto y extensible
- ✅ FFV1 garantiza preservación sin pérdida
- ✅ Metadatos robustos
Desafío: Archivos de video requieren gran espacio de almacenamiento.
Ejemplo: 1 hora de video 1080p en FFV1 = ~50-80 GB
Estrategias de Preservación
1. Migración de Formatos
Concepto: Convertir periódicamente documentos a formatos actuales y soportados.
Ejemplo:
Word 6.0 (1993) → Word 97 → Word 2007 (.docx) → PDF/A-2
Ventajas:
- Documentos siempre accesibles
- Aprovecha software moderno
Desventajas:
- Riesgo de pérdida de fidelidad en cada conversión
- Costo de migración periódica
- Requiere validación de resultados
Mejores prácticas:
- Validar cada conversión (comparación visual/textual)
- Mantener original como respaldo
- Documentar todas las migraciones en metadatos
2. Emulación
Concepto: Preservar software original y emular hardware/sistema operativo obsoleto.
Ejemplo: Mantener emulador de MS-DOS para acceder a documentos WordPerfect 5.1
Ventajas:
- Fidelidad perfecta al original
- No requiere migración
Desventajas:
- Complejidad técnica alta
- Dependencia de emuladores (que también pueden volverse obsoletos)
- Difícil de escalar
Uso recomendado: Solo para documentos de valor histórico excepcional donde la fidelidad absoluta es crítica.
3. Normalización
Concepto: Convertir todos los documentos a formato estándar al momento de ingestión.
Ejemplo en archivo estatal:
Todo documento recibido se convierte a PDF/A-2b inmediatamente:
- Word, Excel → PDF/A
- JPEG, PNG → TIFF o PDF/A con imagen embebida
- Emails → PDF/A (mensaje + adjuntos)
Ventajas:
- Un solo formato a preservar
- Simplifica gestión a largo plazo
- Reduce costos de almacenamiento múltiple
Desventajas:
- Pérdida de funcionalidad (fórmulas Excel, macros, etc.)
- Requiere procesamiento inicial
Solución híbrida: Preservar original + versión normalizada para documentos complejos.
4. Almacenamiento Redundante (3-2-1)
Regla 3-2-1:
- 3 copias de cada documento
- En 2 medios diferentes (ej: disco duro + cinta magnética)
- 1 copia offsite (fuera de las instalaciones)
Implementación moderna:
Opción 1: On-premise + Cloud
- 2 copias en servidores locales (redundancia RAID)
- 1 copia en cloud (AWS S3 Glacier, Google Cloud Archive)
Opción 2: Multi-cloud
- 2 copias en clouds diferentes (AWS + Google)
- 1 copia en disco offline (cinta LTO)
Costo estimado de almacenamiento cloud (2025):
| Proveedor | Servicio | Costo por TB/mes |
|---|---|---|
| AWS | S3 Glacier Deep Archive | USD 0.99 |
| Google Cloud | Archive Storage | USD 1.20 |
| Microsoft Azure | Archive Storage | USD 0.99 |
Para 10 TB de archivo: USD 10-12/mes (copia única)
5. Verificación de Integridad
Hash criptográfico (checksum) garantiza que archivo no ha sido alterado.
Algoritmos recomendados:
- SHA-256 (estándar actual)
- SHA-512 (mayor seguridad)
Proceso:
- Al momento de ingestión:
sha256sum documento.pdf > documento.pdf.sha256 # Resultado: a3f5d8e9c2b1... documento.pdf - Verificación periódica (ej: trimestral):
sha256sum -c documento.pdf.sha256 # Resultado: documento.pdf: OK - Si hash no coincide: Archivo corrupto → restaurar desde backup
Automatización:
Sistemas de gestión documental modernos calculan y verifican hashes automáticamente.
Metadatos de Preservación
PREMIS (Preservation Metadata: Implementation Strategies)
Estándar internacional para metadatos de preservación digital.
Categorías de metadatos PREMIS:
1. Entidades:
- Objeto: El documento digital en sí
- Evento: Acciones realizadas sobre el objeto (creación, migración, verificación)
- Agente: Persona, organización o software responsable
- Derechos: Licencias, restricciones de acceso
2. Elementos descriptivos:
<premis>
<object>
<objectIdentifier>
<objectIdentifierType>UUID</objectIdentifierType>
<objectIdentifierValue>f81d4fae-7dec-11d0-a765-00a0c91e6bf6</objectIdentifierValue>
</objectIdentifier>
<objectCharacteristics>
<format>
<formatDesignation>
<formatName>PDF/A-2b</formatName>
<formatVersion>2.0</formatVersion>
</formatDesignation>
</format>
<size>2048576</size> <!-- bytes -->
<fixity>
<messageDigestAlgorithm>SHA-256</messageDigestAlgorithm>
<messageDigest>a3f5d8e9c2b1...</messageDigest>
</fixity>
</objectCharacteristics>
</object>
<event>
<eventType>migration</eventType>
<eventDateTime>2025-02-01T14:30:00</eventDateTime>
<eventOutcome>success</eventOutcome>
<eventDetail>Migrated from Word 2007 (.docx) to PDF/A-2b</eventDetail>
</event>
<rights>
<rightsStatement>
<rightsStatementIdentifier>
<rightsStatementIdentifierType>local</rightsStatementIdentifierType>
<rightsStatementIdentifierValue>RS-2025-001</rightsStatementIdentifierValue>
</rightsStatementIdentifier>
<copyrightInformation>
<copyrightStatus>copyrighted</copyrightStatus>
<copyrightJurisdiction>Perú</copyrightJurisdiction>
<copyrightStatusDeterminationDate>2025</copyrightStatusDeterminationDate>
</copyrightInformation>
</rightsStatement>
</rights>
</premis>
Políticas de Retención y Disposición
Tablas de Retención Documental
Según normativa peruana (Ley N° 25323 - Sistema Nacional de Archivos):
Categorías de plazos:
- Permanente: Valor histórico, legal o administrativo indefinido
- Ejemplo: Leyes, decretos, resoluciones fundacionales
- Temporal largo (10-30 años):
- Ejemplo: Contratos, expedientes de personal, registros financieros
- Temporal medio (5-10 años):
- Ejemplo: Correspondencia administrativa, informes anuales
- Temporal corto (1-5 años):
- Ejemplo: Comunicaciones rutinarias, borradores
Disposición final:
Al cumplirse plazo de retención:
- Transferencia a archivo histórico (documentos permanentes)
- Eliminación segura (documentos temporales sin valor)
Eliminación Segura de Documentos Digitales
Importante: Simplemente borrar archivo NO es suficiente para eliminación segura.
Métodos de eliminación:
1. Sobrescritura múltiple:
# Estándar DoD 5220.22-M (3 pasadas)
shred -vfz -n 3 documento_a_eliminar.pdf
2. Destrucción física de medio:
- Trituración de discos duros
- Desmagnetización de cintas
3. Eliminación verificada en cloud:
- Solicitar certificado de eliminación al proveedor
- Verificar cumplimiento de SLA de eliminación
Documentación obligatoria:
- Acta de eliminación firmada por comité evaluador
- Lista de documentos eliminados con metadatos
- Método de eliminación usado
Recomendaciones para Archivos del Estado Peruano
Marco Normativo Aplicable
- Ley N° 25323: Sistema Nacional de Archivos
- Ley N° 29733: Protección de Datos Personales
- Decreto Legislativo N° 1412: Ley de Gobierno Digital
- DS N° 029-2021-PCM: Reglamento de Gobierno Digital
Plan de Preservación Digital (Estructura Recomendada)
1. Diagnóstico Inicial (1-2 meses):
- Inventario de acervo digital existente
- Identificación de formatos obsoletos
- Evaluación de infraestructura actual
2. Definición de Políticas (1 mes):
- Formatos de preservación por tipo de documento
- Plazos de retención por serie documental
- Niveles de acceso y seguridad
3. Implementación de Infraestructura (3-6 meses):
- Selección de sistema de gestión documental compatible con OAIS
- Configuración de almacenamiento redundante 3-2-1
- Implementación de procesos de verificación de integridad
4. Migración de Archivos (6-24 meses según volumen):
- Priorización por valor y riesgo
- Conversión a formatos de preservación
- Generación de metadatos PREMIS
5. Operación y Mantenimiento (continuo):
- Monitoreo de integridad trimestral
- Actualización de formatos (cada 3-5 años)
- Auditorías de preservación anuales
Presupuesto Referencial
Entidad mediana (50,000 expedientes, 500 GB documentos):
| Componente | Costo Inicial | Costo Anual |
|---|---|---|
| Software gestión documental | USD 30,000 | USD 6,000 (20% mantenimiento) |
| Almacenamiento (on-premise 5TB) | USD 10,000 | USD 2,000 (ampliación) |
| Almacenamiento cloud (backup 1TB) | - | USD 360 (S3 Glacier) |
| Servicios profesionales | USD 40,000 | - |
| Capacitación personal | USD 8,000 | USD 2,000 (actualización) |
| Total | USD 88,000 | USD 10,360 |
ROI esperado: Evitar pérdida de información invaluable + cumplimiento normativo.
Conclusión
La preservación digital a largo plazo requiere un enfoque sistemático que combine:
✅ Estándares internacionales (ISO 14721, PDF/A) ✅ Infraestructura robusta (almacenamiento redundante) ✅ Políticas claras (retención, migración) ✅ Metadatos completos (PREMIS) ✅ Monitoreo continuo (integridad, obsolescencia)
Para archivos del Estado peruano, la preservación digital no es opcional:
- Ley de Transparencia requiere acceso permanente a información pública
- Patrimonio documental de la nación debe protegerse para futuras generaciones
- Continuidad institucional depende de preservar memoria organizacional
La inversión en preservación digital (USD 80,000-150,000 inicial para entidad mediana) es menor que el costo de reconstruir información perdida o enfrentar sanciones por incumplimiento normativo.
En AyP Digital diseñamos e implementamos estrategias completas de preservación digital:
- Auditoría de acervo digital y evaluación de riesgos
- Diseño de políticas de preservación alineadas a ISO 14721
- Implementación de infraestructura OAIS
- Migración de archivos a formatos de preservación (PDF/A)
- Capacitación de personal en gestión de archivo digital
- Acompañamiento continuo en cumplimiento normativo
¿Necesita asegurar la preservación de su patrimonio documental digital? Contáctenos para un diagnóstico especializado.