Volver al blog
Artículo

Anonimizar documentos: SaaS en la nube vs. procesamiento local

Las soluciones SaaS tradicionales suben tus datos a su servidor. Anoply los procesa en tu navegador. Comparativa real.

3 min lecturaJavier Ormo

Hay dos arquitecturas posibles para una herramienta de anonimización: procesar en el servidor del proveedor o procesar en el navegador del usuario. Anoply hace lo segundo. Te cuento por qué.

El modelo tradicional: sube y reza

La mayoría de SaaS de anonimización funcionan así:

  1. Subes el archivo a su servidor.
  2. Su backend lo procesa.
  3. Te devuelve el archivo limpio.

Esto significa que, durante unos segundos, tu documento con datos personales reales está en disco del proveedor. Aunque garanticen que lo borran tras procesar, durante ese rato es responsabilidad suya y, por extensión, responsabilidad tuya como controlador.

Implicaciones:

  • Necesitas un contrato de encargo del tratamiento firmado con el proveedor.
  • Si el proveedor está fuera del EEE, necesitas garantías de transferencia internacional.
  • Cualquier brecha de seguridad del proveedor te afecta directamente.
  • La promesa «borramos tu archivo» te exige confiar.

El modelo de Anoply: nunca sale del navegador

Anoply ejecuta toda la lógica en TypeScript dentro de tu navegador:

  • Parseo de Excel, PDF, Word, CSV y TXT con librerías que corren en cliente (SheetJS, pdf.js, mammoth, papaparse).
  • Detección de identificadores con regex + validadores con dígito de control (DNI mod-23, IBAN mod-97, CUIT mod-11, etc.).
  • Sustituciones aplicadas en cliente.
  • Cifrado del mapa de equivalencias con la Web Crypto API (AES-256-GCM, PBKDF2 600.000 iteraciones).

El servidor de Anoply solo ve:

  • Que existes (Clerk gestiona tu cuenta).
  • Cuántos documentos has procesado este mes (contador para el plan).
  • Metadatos técnicos: tipo de archivo y número de detecciones, nunca el contenido.

Resultado:

  • No firmas contrato de encargo del tratamiento por el archivo procesado, porque no llega a procesarse en servidor. (Sí firmas, eso sí, el ARCO sobre cuenta y email).
  • No hay transferencia internacional del contenido del archivo.
  • No te afecta una brecha de seguridad de Anoply en el contenido de tus documentos.

¿Y la limitación?

Procesar en navegador tiene un techo: archivos muy grandes (>10 MB en v1, eventualmente >50 MB) requieren más memoria del usuario. Para casos extremos —datasets de millones de filas— hay tooling especializado (Pandas en local, OpenRefine).

Para el 95% de casos de una asesoría, despacho o pyme —Excels de cientos o miles de filas, PDFs de informes, Words de contratos— el navegador moderno va sobrado.

Comparativa concreta

| Aspecto | SaaS clásico | Anoply (local) | |---|---|---| | Contenido del archivo en servidor del proveedor | Sí (temporalmente) | No, nunca | | Contrato de encargo necesario por el contenido | Sí | No | | Transferencia internacional del contenido | Frecuente | No | | Riesgo en caso de brecha del proveedor | Alto | Sólo metadatos | | Trazabilidad para el contador de plan | Centralizada | Server-side metadata | | Latencia | 1-5 s + red | 100-500 ms local |

Conclusión

Si tu prioridad es no firmar un encargo del tratamiento adicional ni preocuparte por dónde está físicamente tu archivo durante el proceso, una arquitectura cliente como la de Anoply es la opción cuerda. Si necesitas procesar volúmenes industriales o aplicar políticas centralizadas a varios usuarios, una solución enterprise con servidor dedicado puede tener sentido.

Anoply tiene su lugar y lo deja claro desde el día uno: tus datos no se anonimizan en nuestra nube, porque tus datos no entran en nuestra nube. Pruébalo en anoply.eu/anonymize.