Captura de Datos

Software ePaper

Seguridad

Ver todos los servicios
Destacado

ePaper

Gestión documental en la nube. Accede desde cualquier lugar.

Conocer más
Gestión Documental

10 Errores Comunes al Digitalizar Documentos y Cómo Evitarlos

Evita los errores más frecuentes en proyectos de digitalización documental: resolución, metadatos, formatos, OCR, seguridad y gestión del cambio.

Valeria Castañeda
14 min de lectura
Compartir:
Este artículo fue escrito en español. Use el botón para traducirlo automáticamente.

Puntos Clave

  • La resolución correcta es 300 DPI para texto y 600 DPI para gráficos detallados — no más, no menos
  • Escanear sin OCR crea PDFs de imagen que nadie puede buscar — siempre aplique reconocimiento de texto
  • Digitalizar sin indexar por metadatos es reemplazar un caos físico por un caos digital
  • El formato PDF/A es el estándar para archivado a largo plazo — evite JPEG para documentos de texto

Por qué fracasan los proyectos de digitalización

Digitalizar documentos parece sencillo: escanear, guardar y listo. Sin embargo, la realidad es otra. Muchas organizaciones invierten tiempo y presupuesto en proyectos de digitalización que terminan generando más problemas de los que resuelven: archivos imposibles de encontrar, documentos ilegibles, incumplimientos normativos y equipos frustrados que vuelven a depender del papel.

La diferencia entre un proyecto de digitalización exitoso y uno que fracasa no está en la tecnología —los escáneres y el software actual son más que capaces—, sino en la planificación, los procesos y las decisiones técnicas que se toman antes, durante y después de escanear el primer documento.

En nuestra experiencia trabajando con empresas e instituciones en Perú, hemos identificado 10 errores que se repiten una y otra vez. Lo positivo es que todos son evitables si se conocen de antemano. Esta guía recorre cada uno con detalle práctico: qué sale mal, qué consecuencias tiene y, lo más importante, cómo hacerlo bien desde el inicio.

Si estás planificando un proyecto de digitalización —o si ya iniciaste uno y algo no está funcionando—, esta lista te ahorrará tiempo, dinero y dolores de cabeza.

Lo que encontrarás en este artículo:

  1. Errores técnicos (resolución, formatos, OCR)
  2. Errores de organización (metadatos, taxonomía, depuración)
  3. Errores normativos y de cumplimiento (conservación, protección de datos)
  4. Errores de gestión (capacitación, seguridad, respaldo)
  5. Un checklist completo para evaluar tu proyecto antes de comenzar

Vamos al primero.


Error 1: Elegir la resolución incorrecta

❌ El error

Uno de los primeros parámetros que se configuran al escanear es la resolución, medida en DPI (dots per inch o puntos por pulgada). El error más frecuente es irse a los extremos: escanear todo a 150 DPI “para ahorrar espacio” o configurar 1200 DPI “para que salga perfecto”.

Con una resolución demasiado baja, el texto se vuelve borroso y el reconocimiento óptico de caracteres (OCR) falla, generando documentos digitales que no se pueden buscar ni leer cómodamente. Con una resolución excesiva, cada página ocupa entre 5 y 20 veces más espacio del necesario, los tiempos de escaneo se multiplican y el almacenamiento se agota mucho antes de lo previsto.

✅ La solución

La resolución debe ajustarse al tipo de documento, no ser un valor único para todo el proyecto. El estándar ampliamente aceptado en la industria de gestión documental es:

Tipo de documento Resolución recomendada Justificación
Documentos de texto estándar (contratos, oficios, facturas) 300 DPI Óptimo para legibilidad y OCR preciso
Formularios con texto pequeño o campos densos 300–400 DPI Asegura captura de campos de letra reducida
Planos de ingeniería y arquitectura 400–600 DPI Preserva líneas finas y anotaciones a escala
Fotografías e imágenes a color con detalle 600 DPI Captura gradientes y detalles gráficos
Documentos históricos o deteriorados 600 DPI Permite restauración y análisis posterior
Documentos para uso temporal o consulta rápida 200 DPI Aceptable si no se requiere OCR ni archivo a largo plazo

Tamaños de archivo aproximados por resolución (página A4 a color):

Resolución Tamaño por página (TIFF) Tamaño por página (PDF comprimido)
150 DPI ~2 MB ~150 KB
200 DPI ~4 MB ~250 KB
300 DPI ~8 MB ~400 KB
600 DPI ~32 MB ~1.5 MB

Estos valores son aproximados y varían según el contenido de la página, pero ilustran por qué escanear todo a 600 DPI sin necesidad puede multiplicar por 4 el almacenamiento respecto a 300 DPI.

Consejo práctico: Antes de escanear miles de páginas, haz una prueba con 20–30 documentos representativos a diferentes resoluciones. Verifica que el OCR funciona correctamente y que el tamaño de archivo es manejable. Esa prueba piloto de una hora puede ahorrarte semanas de retrabajo.


Error 2: No indexar ni etiquetar los documentos

❌ El error

El segundo error más común es tratar la digitalización como un proceso puramente físico: escanear página tras página sin asignar metadatos (datos descriptivos que identifican cada documento). El resultado es un repositorio digital donde encontrar un documento específico es igual de difícil —o más— que buscarlo en un archivero físico.

Es frecuente ver carpetas con miles de archivos nombrados como IMG_0001.pdf, scan_20260302.pdf o documento_final_v2_DEFINITIVO.pdf. Sin metadatos, la única forma de encontrar algo es abrir archivo por archivo, lo cual anula la principal ventaja de la digitalización: la búsqueda rápida.

✅ La solución

Cada documento digitalizado debe contar con un conjunto mínimo de metadatos que permitan su identificación, clasificación y recuperación. Define un esquema de metadatos antes de comenzar el escaneo:

Metadatos mínimos recomendados:

  • Tipo de documento (factura, contrato, expediente, oficio, etc.)
  • Fecha del documento (no la fecha de escaneo, sino la fecha original)
  • Área o departamento que generó o recibió el documento
  • Número de referencia (número de factura, de expediente, de contrato)
  • Nombre o razón social de la persona o empresa relacionada
  • Estado (vigente, vencido, archivado)

Metadatos complementarios según el sector:

Sector Metadatos adicionales sugeridos
Legal Número de expediente, juzgado, partes involucradas
Contable / Financiero RUC del proveedor/cliente, monto, serie y correlativo
Recursos Humanos DNI del colaborador, tipo de trámite, periodo
Salud Número de historia clínica, CIE-10, médico tratante
Construcción e ingeniería Código de proyecto, versión del plano, especialidad

Consejo práctico: Invierte tiempo en definir tu esquema de metadatos antes de escanear el primer documento. Si trabajas con un proveedor de digitalización, exige que la indexación sea parte del servicio, no un paso opcional. Un documento sin metadatos es un documento perdido.


Error 3: Usar formatos de archivo inadecuados

❌ El error

Guardar documentos escaneados en formato JPEG es uno de los errores técnicos más extendidos. JPEG es un formato diseñado para fotografías que utiliza compresión con pérdida: cada vez que se abre y se guarda, la calidad se degrada ligeramente. Para documentos de texto, esto significa bordes de letras borrosos, artefactos visuales y problemas serios con el OCR.

Otro error frecuente es usar PDF estándar cuando se requiere conservación a largo plazo. Un PDF convencional puede contener elementos dependientes de software específico (fuentes no embebidas, enlaces externos, scripts) que podrían no funcionar correctamente en 5, 10 o 20 años.

✅ La solución

Elige el formato en función del propósito del documento:

Formato Uso recomendado Ventajas Limitaciones
PDF/A (ISO 19005) Archivado a largo plazo, documentos legales, expedientes Autocontenido, fuentes embebidas, sin dependencias externas Archivo más grande que PDF estándar
PDF (con OCR) Documentos de trabajo, consulta frecuente Texto buscable, buena compatibilidad No garantiza preservación a largo plazo
TIFF (sin compresión o LZW) Imágenes de alta fidelidad, documentos históricos, másters de archivo Sin pérdida de calidad, estándar en archivística Archivos grandes, menos práctico para compartir
PNG Imágenes con texto sobre fondo uniforme, capturas Sin pérdida, buena para gráficos No soporta múltiples páginas
JPEG Solo para fotografías donde el texto no es relevante Archivos pequeños Compresión con pérdida, inadecuado para texto

Formato recomendado para la mayoría de proyectos: PDF/A-2b como formato de archivo y PDF con OCR como formato de consulta.

La Norma Técnica Peruana NTP 392.030-2 sobre microformas digitales establece que los documentos con valor legal deben almacenarse en formatos que garanticen su integridad y legibilidad a lo largo del tiempo. PDF/A cumple con este requisito, mientras que JPEG no.

Consejo práctico: Si tu escáner solo genera JPEG o TIFF, utiliza software de posprocesamiento para convertir a PDF/A con OCR embebido. Es un paso adicional, pero marca la diferencia entre un archivo digital confiable y uno problemático.


Error 4: Omitir el reconocimiento óptico de caracteres (OCR)

❌ El error

Escanear un documento sin aplicar OCR genera un PDF que, visualmente, se ve igual que el original. Pero internamente es solo una imagen: no se puede seleccionar texto, no se puede buscar por palabras clave, no se puede copiar un párrafo. Es como tener una fotografía del documento en lugar del documento mismo.

Cuando una organización tiene miles de PDFs sin OCR, la búsqueda de información se vuelve manual: alguien tiene que abrir documentos uno por uno para encontrar lo que necesita. Esto elimina casi por completo la ventaja de haber digitalizado.

✅ La solución

Aplica OCR a todo documento de texto durante o inmediatamente después del escaneo. El OCR convierte la imagen de cada página en texto buscable que se superpone como una capa invisible sobre la imagen original, preservando la apariencia del documento mientras habilita la búsqueda.

Consideraciones para un OCR efectivo:

  1. Resolución mínima de 300 DPI — Por debajo de esta resolución, la tasa de error del OCR aumenta significativamente
  2. Documentos rectos y sin inclinación — La mayoría de software OCR incluye corrección automática (deskew), pero es mejor minimizar la inclinación desde el escaneo
  3. Idioma correcto configurado — Asegúrate de que el motor OCR esté configurado para español (y para el segundo idioma si hay documentos bilingües)
  4. Verificación de calidad — Revisa una muestra de documentos procesados para verificar la precisión del OCR, especialmente en documentos con tipografías antiguas, formularios manuscritos o calidad de impresión deficiente

Niveles de OCR:

Nivel Descripción Cuándo usarlo
OCR básico Reconocimiento de texto impreso estándar Documentos de oficina, correspondencia, facturas recientes
OCR avanzado Reconocimiento de texto en documentos de baja calidad, múltiples columnas, tablas Documentos antiguos, formularios, periódicos
ICR (Intelligent Character Recognition) Reconocimiento de escritura manuscrita Formularios llenados a mano, anotaciones, prescripciones médicas
OMR (Optical Mark Recognition) Reconocimiento de marcas (checks, burbujas) Encuestas, exámenes de opción múltiple, formularios de votación

Consejo práctico: El OCR no es perfecto y nunca lo será al 100%. Para documentos críticos (contratos, documentos legales, historias clínicas), implementa un proceso de verificación humana donde un operador revisa y corrige los resultados del OCR. La combinación de OCR automatizado + revisión humana es el estándar en proyectos de digitalización profesional.


Error 5: No planificar la estructura de carpetas y taxonomía

❌ El error

Sin una estructura definida, los documentos digitalizados terminan en un “cajón digital” desordenado: carpetas con nombres ambiguos, subcarpetas dentro de subcarpetas sin lógica clara, documentos duplicados en múltiples ubicaciones y criterios de organización que cambian según quién escanea ese día.

Esto suele ocurrir cuando el proyecto se inicia sin un plan de clasificación y cada operador crea su propia lógica de organización. Al cabo de unas semanas, nadie entiende la estructura y encontrar un documento requiere conocer en qué carpeta lo guardó una persona específica.

✅ La solución

Define una taxonomía documental antes de iniciar el escaneo. Una taxonomía es, en esencia, un sistema de clasificación jerárquico que establece cómo se organizan los documentos de la organización.

Principios para una buena estructura:

  1. Consistente — Las mismas reglas aplican para todos los documentos, sin excepciones
  2. Escalable — Debe funcionar igual de bien con 1,000 documentos que con 100,000
  3. Intuitiva — Cualquier persona de la organización debería poder encontrar un documento sin capacitación especial
  4. Basada en funciones, no en personas — Organizar por área funcional, no por el nombre del colaborador que gestiona los documentos

Ejemplo de estructura por área funcional:

📁 Documentos Digitalizados/
├── 📁 Administración y Finanzas/
│   ├── 📁 Facturas Emitidas/
│   │   ├── 📁 2025/
│   │   └── 📁 2026/
│   ├── 📁 Facturas Recibidas/
│   ├── 📁 Contratos con Proveedores/
│   └── 📁 Estados Financieros/
├── 📁 Recursos Humanos/
│   ├── 📁 Expedientes de Personal/
│   ├── 📁 Planillas/
│   └── 📁 Capacitaciones/
├── 📁 Legal/
│   ├── 📁 Contratos Comerciales/
│   ├── 📁 Poderes y Escrituras/
│   └── 📁 Expedientes Judiciales/
└── 📁 Operaciones/
    ├── 📁 Órdenes de Servicio/
    ├── 📁 Guías de Remisión/
    └── 📁 Informes Técnicos/

Convención de nombres de archivo recomendada:

[TIPO]_[REFERENCIA]_[FECHA]_[DESCRIPCION-BREVE].pdf

Ejemplos:
FAC_E001-00234_20260215_servicios-consultoria.pdf
CONT_2026-089_20260110_proveedor-logistica.pdf
EXP_RRHH-1547_20260301_garcia-lopez-maria.pdf

Errores comunes al definir la estructura:

  • Demasiados niveles de profundidad — Más de 4–5 niveles hace que la navegación sea difícil. Si tu ruta es Administracion/Finanzas/Proveedores/Nacional/Lima/2026/Enero/Facturas/, es señal de que estás sobre-clasificando.
  • Mezclar criterios en un mismo nivel — Una carpeta no debería contener subcarpetas organizadas por año junto a subcarpetas organizadas por tipo de documento. Elige un criterio por nivel.
  • Nombres con caracteres especiales — Evita tildes, eñes, espacios y caracteres como #, &, % en los nombres de carpetas y archivos. Aunque muchos sistemas los soportan, generan problemas frecuentes al migrar entre plataformas, compartir por correo o integrar con APIs.

Consejo práctico: Documenta tu taxonomía en un manual breve (2–3 páginas) que incluya la estructura de carpetas, convenciones de nombres, metadatos requeridos y ejemplos. Compártelo con todo el equipo antes de que empiece el escaneo. Modificar la estructura después de escanear miles de documentos es costoso y propenso a errores.


Error 6: Ignorar la normativa de conservación documental

❌ El error

Uno de los errores con consecuencias legales más graves es destruir los documentos físicos originales inmediatamente después de digitalizarlos, sin verificar si la normativa permite hacerlo. En Perú, múltiples leyes y normas establecen plazos obligatorios de conservación de documentos en su formato original.

Otro escenario frecuente es el opuesto: conservar todo indefinidamente “por si acaso”, lo que genera costos de almacenamiento (físico y digital) innecesarios y complica el cumplimiento de la Ley N° 29733, Ley de Protección de Datos Personales, que establece que los datos personales no deben conservarse más allá del tiempo necesario para la finalidad por la que fueron recopilados.

✅ La solución

Conoce y cumple los plazos de conservación aplicables a tu sector. A continuación, una referencia general de los principales marcos normativos en Perú:

Plazos de conservación de documentos comunes en Perú:

Tipo de documento Plazo de conservación Base legal
Comprobantes de pago (facturas, boletas, notas de crédito) 5 años desde la emisión o el ejercicio en que se usó el crédito fiscal Código Tributario, Art. 43; Ley del IGV
Libros y registros contables 5 años desde la fecha de vencimiento de la declaración Código Tributario, Art. 43; Resolución de Superintendencia N° 234-2006/SUNAT
Planillas de remuneraciones 5 años después del cese del trabajador D.S. 001-98-TR
Contratos de trabajo 5 años después del cese de la relación laboral Ley de Productividad y Competitividad Laboral
Historias clínicas 15 años desde la última atención (5 en archivo activo, 10 en archivo pasivo) NTS N° 139-MINSA/2018/DGAIN
Documentos notariales Conservación permanente Ley del Notariado (D.L. 1049)
Expedientes judiciales Según tabla de retención del Poder Judicial Resoluciones Administrativas del Poder Judicial

Requisitos para que un documento digital tenga valor legal equivalente al original:

La NTP 392.030-2 (Norma Técnica Peruana sobre microformas digitales) establece los requisitos para que una microforma digital —un documento digitalizado con garantías de integridad— pueda sustituir al documento original:

  1. Fedatario juramentado que certifique la fidelidad del proceso de digitalización
  2. Firma digital del fedatario en cada lote o documento
  3. Sello de tiempo que acredite la fecha de digitalización
  4. Uso de formatos estándar que garanticen preservación
  5. Almacenamiento seguro con controles de integridad

Si el proceso de digitalización no cumple estos requisitos, el documento digital es una copia y no sustituye al original. En ese caso, debes conservar el documento físico durante el plazo legalmente establecido.

Consejo práctico: Antes de destruir cualquier documento físico, consulta con el área legal de tu organización y, si es necesario, con un fedatario juramentado. El costo de una consulta legal es insignificante comparado con las sanciones por destrucción indebida de documentos. Recuerda que la SUNAT puede requerir documentación hasta 5 años después del ejercicio fiscal correspondiente.


Error 7: No capacitar al equipo

❌ El error

Comprar el mejor escáner del mercado, implementar un gestor documental de última generación y definir procesos impecables en papel… para luego descubrir que el equipo sigue escaneando a resoluciones arbitrarias, guardando archivos sin metadatos y nombrando documentos como scan001.pdf.

La falta de capacitación es un error silencioso: no se manifiesta inmediatamente, pero se acumula. Cada documento mal escaneado, mal nombrado o sin indexar se convierte en un problema futuro. Y cuando son miles de documentos, corregir el problema implica reprocesar todo desde el inicio.

Este error no afecta solo a los operadores de escaneo. También impacta a los usuarios finales que deben consultar los documentos digitalizados. Si no saben cómo buscar, cómo usar los filtros del sistema de gestión documental o cómo interpretar la estructura de carpetas, terminarán quejándose de que “era más fácil con el papel” — y tendrán razón, porque nadie les enseñó a usar la nueva herramienta.

✅ La solución

Incluye la capacitación como una fase formal del proyecto, no como algo que se resuelve “sobre la marcha”. El entrenamiento debe cubrir tanto los aspectos técnicos como los procedimentales.

Plan de capacitación recomendado:

Módulo Contenido Duración sugerida Audiencia
1. Fundamentos Por qué se digitaliza, beneficios, objetivos del proyecto 1 hora Todo el equipo
2. Operación del escáner Configuración de resolución, alimentación de documentos, resolución de atascos 2–3 horas Operadores de escaneo
3. Indexación y metadatos Esquema de metadatos, convenciones de nombres, clasificación 2 horas Operadores e indexadores
4. Control de calidad Verificación de OCR, detección de páginas faltantes, revisión de metadatos 1–2 horas Supervisores de calidad
5. Uso del sistema de gestión documental Búsqueda, consulta, flujos de trabajo, permisos 2 horas Usuarios finales
6. Normativa y seguridad Conservación documental, protección de datos, procedimientos de respaldo 1 hora Todo el equipo

Consideraciones adicionales:

  • Documenta los procedimientos en guías visuales paso a paso que el equipo pueda consultar durante el trabajo
  • Designa un responsable (líder del proyecto o coordinador de digitalización) que resuelva dudas en tiempo real durante las primeras semanas
  • Realiza auditorías periódicas de calidad durante el primer mes para detectar desviaciones tempranamente y reforzar la capacitación donde sea necesario

Consejo práctico: Las primeras dos semanas del proyecto son críticas. Supervisa de cerca el trabajo del equipo, revisa muestras de documentos procesados y corrige errores inmediatamente. Un error detectado y corregido en la primera semana evita que se repita en miles de documentos.


Error 8: Digitalizar sin limpiar primero el archivo físico

❌ El error

Escanear todo lo que hay en el archivo físico sin discriminar es como mudarse a una casa nueva llevando la basura de la anterior. Documentos duplicados, versiones obsoletas, borradores que nunca se formalizaron, fotocopias de documentos que ya existen en otro lugar, papeles que ya cumplieron su periodo de retención y deberían haberse destruido hace años.

El resultado: un archivo digital inflado con documentos innecesarios que consume almacenamiento, dificulta las búsquedas y genera confusión cuando aparecen múltiples versiones del mismo documento.

✅ La solución

Antes de encender el escáner, realiza un proceso de depuración y preparación del archivo físico:

Fase 1 — Inventario y diagnóstico (1–2 semanas según volumen):

  1. Identifica las series documentales que existen (facturas, contratos, expedientes, correspondencia, etc.)
  2. Estima el volumen por serie (cantidad de cajas, metros lineales, número aproximado de documentos)
  3. Evalúa el estado de conservación (documentos en buen estado, deteriorados, dañados)
  4. Determina cuáles tienen valor vigente y cuáles han cumplido su periodo de retención

Fase 2 — Depuración:

  • Eliminar duplicados — Copias múltiples del mismo documento
  • Retirar documentos sin valor — Borradores, notas internas obsoletas, documentos informativos temporales
  • Destruir documentos que cumplieron su periodo de retención — Con acta de destrucción, conforme a normativa
  • Separar documentos en mal estado que requieran tratamiento especial antes del escaneo (limpieza, aplanado, restauración básica)

Fase 3 — Preparación física:

  • Retirar clips, grapas y elementos metálicos
  • Reparar rasgaduras con cinta libre de ácido
  • Ordenar las páginas en el sentido correcto
  • Separar documentos pegados

Criterios de depuración por tipo de documento:

Tipo de documento ¿Digitalizar? Acción con el original
Documentos vigentes con valor legal o fiscal Sí, prioritario Conservar original hasta cumplir plazo de retención
Documentos vigentes de consulta frecuente Conservar o destruir según política interna
Documentos que cumplieron su periodo de retención No, eliminar Destruir con acta (triturado para documentos confidenciales)
Duplicados y fotocopias No, eliminar Reciclar
Borradores y versiones no definitivas No, salvo excepciones Eliminar
Documentos históricos o patrimoniales Sí, con tratamiento especial Conservar indefinidamente en condiciones controladas

Consejo práctico: La depuración típicamente reduce el volumen del archivo entre un 15% y un 30%. Si vas a digitalizar 100 cajas, podrías terminar escaneando 70–85 cajas. Esa reducción se traduce directamente en menos tiempo de escaneo, menos almacenamiento digital y un repositorio más limpio y útil.


Error 9: Descuidar la seguridad y los permisos de acceso

❌ El error

Digitalizar documentos y colocarlos en una carpeta compartida donde todos los colaboradores tienen acceso completo es un problema de seguridad serio. No todos los documentos deben ser visibles para toda la organización: expedientes de personal, información financiera, datos de clientes, historias clínicas, contratos comerciales con cláusulas de confidencialidad… cada tipo de documento tiene un nivel de sensibilidad diferente.

El riesgo no es solo la filtración intencional de información. Es más común la exposición accidental: un colaborador que abre un documento que no debería ver, que modifica sin querer un archivo, o que lo elimina por error. Sin controles de acceso ni registros de auditoría, estos incidentes pasan desapercibidos.

Además, en el contexto de la Ley N° 29733, Ley de Protección de Datos Personales, las organizaciones que tratan datos personales están obligadas a implementar medidas de seguridad técnicas que garanticen la confidencialidad, integridad y disponibilidad de la información.

✅ La solución

Implementa un modelo de control de acceso basado en roles (RBAC), donde cada usuario accede únicamente a los documentos que necesita para su función:

Principios de seguridad para documentos digitalizados:

  1. Mínimo privilegio — Cada usuario tiene acceso solo a lo estrictamente necesario para su trabajo
  2. Segregación de funciones — Quien escanea no debería poder eliminar; quien consulta no debería poder modificar
  3. Registro de auditoría — Toda acción (consulta, descarga, modificación, eliminación) queda registrada con usuario, fecha y hora
  4. Cifrado — Los documentos sensibles deben almacenarse cifrados, tanto en reposo como en tránsito

Matriz de permisos sugerida:

Rol Visualizar Descargar Editar metadatos Eliminar Administrar permisos
Operador de escaneo ✓ (sus lotes) ✓ (sus lotes)
Usuario de consulta ✓ (su área) ✓ (su área)
Supervisor de área ✓ (su área) ✓ (su área) ✓ (su área)
Administrador documental ✓ (todo) ✓ (todo) ✓ (todo) ✓ (con aprobación)
Auditor ✓ (todo, solo lectura) ✓ (registros)

Medidas adicionales obligatorias (Ley 29733):

  • Designar un responsable de tratamiento de datos personales
  • Inscribir los bancos de datos personales ante la Autoridad Nacional de Protección de Datos Personales
  • Implementar medidas de seguridad según el nivel de tratamiento (básico, simple, intermedio, complejo o crítico, conforme al Reglamento de la Ley 29733, D.S. 003-2013-JUS)
  • Informar a los titulares de los datos sobre el tratamiento que se realizará

Consejo práctico: Si usas un gestor documental, configura los permisos antes de subir el primer documento. Es mucho más difícil (y riesgoso) restringir acceso después de que la información ya fue compartida. Si trabajas con carpetas compartidas en red, al menos implementa permisos por carpeta a nivel de Active Directory o equivalente.


Error 10: No tener un plan de respaldo y continuidad

❌ El error

Invertir semanas o meses digitalizando un archivo completo y almacenar todo en un único servidor, disco duro o cuenta de almacenamiento en la nube sin un plan de respaldo. Un fallo de hardware, un ataque de ransomware, un error humano que borra una carpeta o un desastre natural pueden eliminar todo el trabajo de digitalización en cuestión de minutos.

Este error se agrava cuando la organización ya destruyó los documentos físicos originales confiando en que la versión digital era suficiente. Sin originales y sin respaldo, la pérdida es irreversible.

✅ La solución

Implementa una estrategia de respaldo siguiendo la regla 3-2-1, un estándar de la industria ampliamente recomendado por profesionales de TI y gestión documental:

  • 3 copias de cada documento (el original digital + 2 respaldos)
  • 2 tipos de medio diferentes (por ejemplo, servidor local + almacenamiento en la nube)
  • 1 copia fuera del sitio (en otra ubicación física o en un servicio de nube en una región geográfica diferente)

Estrategia de respaldo según el tamaño del archivo:

Volumen del archivo Estrategia recomendada Frecuencia de respaldo
Pequeño (< 100 GB) Nube principal + disco externo + segunda cuenta de nube Diario (incremental), semanal (completo)
Mediano (100 GB – 1 TB) Servidor local + nube empresarial + NAS en segunda sede Diario (incremental), semanal (completo)
Grande (> 1 TB) SAN/NAS primario + replicación a sitio alterno + nube para archivos críticos Continuo (replicación), diario (nube)

Componentes de un plan de continuidad para documentos digitales:

  1. Inventario de activos — Lista completa de dónde se almacena cada tipo de documento
  2. RPO (Recovery Point Objective) — ¿Cuántos datos puedes permitirte perder? Define la frecuencia de respaldo en función de esto
  3. RTO (Recovery Time Objective) — ¿En cuánto tiempo necesitas restaurar el acceso? Define la velocidad de recuperación requerida
  4. Pruebas de restauración — Al menos una vez por trimestre, practica la restauración de documentos desde el respaldo para verificar que funciona
  5. Documentación del procedimiento — Instrucciones paso a paso para que cualquier persona del equipo de TI pueda ejecutar la restauración
  6. Protección contra ransomware — Respaldos inmutables (que no pueden ser modificados ni eliminados durante un periodo definido)

Errores frecuentes en la estrategia de respaldo:

  • Respaldar en el mismo servidor — Si el servidor falla, pierdes original y respaldo al mismo tiempo
  • Respaldar sin cifrar — El respaldo contiene la misma información sensible que el original; si alguien accede al respaldo, accede a todo
  • No versionar los respaldos — Si un archivo se corrompe y se respalda corrupto, necesitas una versión anterior para restaurar
  • Confiar en que “la nube no falla” — Los proveedores de nube también tienen incidentes. La nube es parte de la estrategia, no la estrategia completa
  • No tener un responsable asignado — Si nadie es responsable del respaldo, nadie verifica que funcione

Consejo práctico: Un respaldo que nunca se ha probado no es un respaldo; es una esperanza. Programa pruebas trimestrales de restauración y documenta los resultados. La primera vez que intentes restaurar, probablemente descubrirás que algo falta o no funciona como esperabas. Es mejor descubrirlo en una prueba controlada que durante una emergencia real.


Conclusión

Los proyectos de digitalización de documentos pueden transformar radicalmente la eficiencia de una organización, pero solo si se ejecutan con planificación y criterio técnico. Los 10 errores que hemos recorrido no son teóricos: los hemos visto repetirse en organizaciones de todos los tamaños y sectores.

La buena noticia es que todos son prevenibles. La mayoría se evitan con algo que cuesta menos que cualquier escáner: planificación antes de empezar.

Si miramos los 10 errores en perspectiva, se agrupan en tres grandes categorías:

  • Errores técnicos (resolución, formatos, OCR) — Se resuelven estableciendo estándares claros desde el inicio
  • Errores de organización (metadatos, taxonomía, depuración) — Se resuelven con planificación y documentación
  • Errores de gestión (normativa, capacitación, seguridad, respaldo) — Se resuelven con procesos, roles definidos y supervisión

Ninguno requiere tecnología sofisticada ni presupuestos extraordinarios. Lo que sí requieren es dedicar tiempo a la planificación antes de encender el escáner.

Resumen: los 10 errores y su solución en una línea

# Error Solución clave
1 Resolución incorrecta 300 DPI para texto, 600 DPI para gráficos detallados
2 Sin metadatos ni indexación Definir esquema de metadatos antes de escanear
3 Formatos inadecuados PDF/A para archivado, PDF con OCR para consulta
4 Sin OCR Aplicar OCR a todo documento de texto, verificar precisión
5 Sin estructura de carpetas Diseñar taxonomía por área funcional, documentarla
6 Ignorar normativa de conservación Conocer plazos legales, consultar área legal antes de destruir
7 Sin capacitación Incluir entrenamiento como fase formal del proyecto
8 Sin depuración previa Limpiar archivo físico antes de digitalizar
9 Sin seguridad ni permisos Implementar control de acceso basado en roles (RBAC)
10 Sin plan de respaldo Aplicar regla 3-2-1, probar restauración trimestralmente

Checklist antes de iniciar tu proyecto de digitalización

Antes de escanear el primer documento, verifica que puedes marcar cada uno de estos puntos:

Planificación y preparación:

  • Definí los objetivos del proyecto (¿qué problema resuelve la digitalización?)
  • Realicé un inventario del archivo físico (series, volumen, estado)
  • Depuré el archivo: eliminé duplicados, obsoletos y documentos sin valor
  • Preparé físicamente los documentos (quitar grapas, reparar rasgaduras, ordenar)

Estándares técnicos:

  • Establecí la resolución de escaneo por tipo de documento (mínimo 300 DPI para texto)
  • Seleccioné los formatos de archivo adecuados (PDF/A para archivado, PDF con OCR para consulta)
  • Configuré el OCR con el idioma correcto y verifiqué su precisión
  • Definí una convención de nombres de archivo consistente

Organización y metadatos:

  • Diseñé la estructura de carpetas y taxonomía
  • Definí el esquema de metadatos mínimos por tipo de documento
  • Documenté la taxonomía y convenciones en un manual breve

Cumplimiento normativo:

  • Identifiqué los plazos de conservación aplicables a cada serie documental
  • Consulté con el área legal sobre los requisitos para destrucción de originales
  • Verifiqué el cumplimiento de la Ley 29733 (Protección de Datos Personales) si aplica
  • Consideré los requisitos de la NTP 392.030-2 si necesito valor legal de las copias digitales

Equipo y capacitación:

  • Capacité a los operadores de escaneo en el equipo y los procedimientos
  • Capacité a los indexadores en el esquema de metadatos
  • Capacité a los usuarios finales en el uso del sistema de gestión documental
  • Designé un responsable del proyecto y un supervisor de calidad

Seguridad y respaldo:

  • Configuré los permisos de acceso por roles antes de subir documentos
  • Implementé la regla 3-2-1 de respaldo
  • Probé la restauración desde el respaldo al menos una vez
  • Documenté el plan de continuidad y lo comuniqué al equipo de TI

Un proyecto de digitalización bien planificado ahorra tiempo, reduce costos operativos, mejora el acceso a la información y permite cumplir con las exigencias normativas. Si estás por iniciar el tuyo y necesitas orientación o un equipo especializado que se encargue del proceso, en AyP Digital ayudamos a organizaciones en Perú a digitalizar sus archivos con estándares profesionales — desde la depuración y el escaneo hasta la indexación, el OCR y la entrega en el formato que necesitas.

Etiquetas

digitalización de documentos errores comunes mejores prácticas OCR metadatos gestión documental

Preguntas Frecuentes

Para documentos de texto estándar, 300 DPI ofrece el mejor balance entre calidad y tamaño de archivo. Use 600 DPI para documentos con gráficos detallados, texto pequeño o que requieran preservación a largo plazo. No supere los 600 DPI salvo para documentos históricos especiales.
PDF/A es el estándar recomendado para archivado a largo plazo porque garantiza que el documento se verá igual dentro de 10 o 20 años. Use TIFF sin compresión para preservación de máxima calidad. Evite JPEG para documentos de texto ya que pierde calidad con cada edición.
Sí, siempre. Sin OCR, un documento escaneado es solo una imagen — no se puede buscar, copiar texto ni indexar automáticamente. El OCR convierte la imagen en texto buscable y es esencial para cualquier sistema de gestión documental efectivo.
Depende de la normativa aplicable. En Perú, la NTP 392.030-2 permite la destrucción de originales tras la creación de microformas digitales certificadas. Sin embargo, verifique los plazos de retención específicos de SUNAT (5 años tributarios), SUNAFIL (laborales) y SBS (financieros) antes de destruir.