Ir al contenido principal

AI Native QA Protocol

Tu IA genera código en 20 minutos. Nadie lo revisa.

Cuatro fases: reconocimiento, análisis con agentes personalizados, testing recursivo, automatización permanente. La infraestructura de verificación que tu stack necesita. Precio fijo. Todo es tuyo.

La crisis de calidad del vibe coding — en números

más hallazgos de los que los equipos sabían antes del engagement

Datos del Protocolo Academ-ia, 2026

92%

de codebases con IA tienen al menos una vulnerabilidad crítica

Sherlock Forensics, ene–abr 2026

45%

del código generado por IA falla pruebas de seguridad básicas

Veracode, 2026

35

CVEs atribuidos a código generado por IA solo en marzo 2026

Georgia Tech Vibe Security Radar, 2026

Las cuatro fases

No es una herramienta. No es un recurso. Una metodología de cuatro fases que construye infraestructura de verificación que tu equipo opera sin nosotros. Cada fase se apoya en la anterior.

Fase 1

Reconocimiento

Clonar, Inventariar, Mapear

Clonar el repo. Catalogar cada componente, servicio y punto de integración. Extraer requisitos del código, docs y una llamada de 30 minutos. Construir una matriz de trazabilidad: componentes mapeados a rutas mapeados a objetivos de cobertura. Este es el denominador que hace todo medible.

Fase 2

Análisis con Agentes

Análisis Estático + Screening de Seguridad

Agentes de IA personalizados construidos por contexto de proyecto — tu stack, tu dominio, tus criterios de aceptación. Cada agente pasa por su propio ciclo de desarrollo: diseñado, probado, validado antes de tocar código del cliente. Reportes SARIF, screening OWASP Top 10 y prompts de corrección que tu equipo alimenta a Cursor o Claude Code. La seguridad no es un pase separado — es el mismo análisis.

Fase 3

Testing Recursivo

La Capa Viviente

Una capa de tests que se mueve con el codebase. Cuando el código cambia — nuevo PR, nueva feature, refactor — la capa de tests lo detecta y se expande. Cada iteración encuentra cosas que la anterior no encontró porque el análisis tiene más contexto. La cobertura se acumula en vez de degradarse. Medida contra la matriz de trazabilidad, no asumida.

Fase 4

Automatización Permanente

Corre Sin Nosotros

Playwright para testing de flujos UI y regresión. Cloudflare Workers para monitoreo de endpoints, validación de datos y health checks. La integración CI lo une todo — análisis estático y seguridad en cada push, suites de tests ejecutan automáticamente. Contract testing previene quiebres entre servicios. Un feedback loop de producción significa que bugs que llegan a producción expanden la cobertura del siguiente ciclo.

El límite

Visible desde el día uno. Qué cubre el Protocolo y qué cubre tu equipo — sin ambigüedad, sin scope creep.

El Protocolo cubre

  • Inventario de componentes y matriz de trazabilidad
  • Análisis estático con agentes personalizados (construidos, probados, validados por proyecto)
  • Screening de seguridad (superficie OWASP Top 10)
  • Testing recursivo (los tests evolucionan con cada PR o push)
  • Automatización UI (Playwright), automatización de endpoints (Workers), integración CI
  • Validación de datos (determinística + scoring con IA)
  • Contract testing e integración
  • Prompts de corrección que el equipo puede ejecutar
  • Benchmarks de cobertura definidos por contexto de proyecto
  • Dashboards y reportes en la herramienta existente del equipo
  • Feedback loop de producción: issues en producción expanden cobertura del siguiente ciclo

Tu equipo cubre

  • Aplicar las correcciones — el Protocolo encuentra y prescribe; el equipo o su IA ejecuta
  • Decisiones de deployment a producción — el Protocolo provee señales de release, no autoridad de release
  • Correctitud de lógica de negocio — si los requisitos están mal, los tests pasan y el producto sigue mal
  • Testing exploratorio y edge cases fuera del inventario de componentes
  • Rutas móviles nativas no cubribles por automatización: Bluetooth, NFC, cámara, comportamiento específico de hardware

Cuatro formas de contratar

Precios transparentes. Alcance fijo. Todo lo que entregamos es tuyo.

Auditoría de Código

$3,000 – $6,000

2 semanas · Precio fijoFase 1 + Fase 2

Mapeamos tu codebase y corremos análisis con agentes personalizados. Sales sabiendo exactamente qué está roto, qué es inseguro y cómo corregirlo.

Qué recibes

  • Inventario de componentes y matriz de trazabilidad
  • Agentes de IA personalizados para el stack y contexto de tu proyecto
  • Reporte de análisis estático SARIF 2.1.0 (Crítico / Alto / Medio / Bajo / Info)
  • Screening de seguridad OWASP Top 10 en el mismo pase
  • Reporte legible en Markdown (calidad + seguridad unificados)
  • Prompt de corrección para Cursor o Claude Code
  • Walkthrough de 30 minutos con tu equipo

Ideal para

Founders que sospechan que su codebase construido con IA tiene problemas de calidad o seguridad pero no saben dónde.

Recomendado

Auditoría + Base QA

$6,000 – $9,000

3 semanas · Precio fijoFase 1 + Fase 2 + Setup Fase 3

Todo lo del Tier 1, más la capa de testing recursivo e infraestructura que tu equipo usará en adelante.

Qué recibes

  • Auditoría completa Tier 1 (inventario, agentes, análisis, prompts de corrección)
  • Capa de testing recursivo: casos de test iniciales que evolucionan con tu codebase
  • Dashboard: severidad, estado de triaje, progreso de cobertura contra matriz de trazabilidad
  • Hallazgos de seguridad tracked con categoría OWASP y prioridad de remediación
  • Documento de estrategia de calidad (PDF) adaptado a tu stack y cadencia
  • Run-book para transferir a QA junior — o para operar el sistema sin nosotros

Ideal para

Equipos listos para profesionalizar QA sin contratar un ingeniero full-time todavía.

Monitoreo Continuo

$1,500 – $3,000/mes

Continuo · Retainer low-touchFase 3 continua

El loop recursivo sigue corriendo. Cada push se analiza, la cobertura se acumula, el límite se expande.

Qué recibes

  • Análisis con agentes + screening de seguridad en cada push a main (integración CI)
  • Testing recursivo: cambios de código nuevos expanden cobertura automáticamente
  • Nuevos hallazgos en tu dashboard con prompts de corrección
  • Resumen mensual: hallazgos, tendencias de severidad, cambios en el límite de cobertura
  • Soporte y comunicación lunes a viernes, 9 AM – 6 PM CST

Ideal para

Equipos que completaron una auditoría y quieren cobertura que se acumula sin orquestación de sprint completa.

Orquestación de Sprint

$9,000+/mes

Retainer continuo · Cadencia de sprint de dos semanasLas 4 fases

El sistema completo desplegado y corriendo. Automatización Playwright, monitoreo Workers, integración CI, contract testing y feedback loop de producción.

Qué recibes

  • Todos los entregables Fase 1–3, mantenidos continuamente
  • Automatización UI con Playwright: suites de regresión, verificación de ruta crítica
  • Cloudflare Workers: monitoreo de endpoints, validación de datos, health checks
  • Contract testing e integración en pipeline CI
  • Feedback loop de producción: bugs en prod expanden cobertura del Protocolo en el siguiente ciclo
  • Reportes de dashboard mensuales para founders e inversionistas
  • Ejecución, soporte y comunicación lunes a viernes, 9 AM – 6 PM CST con deadlines predefinidos

Ideal para

Equipos que hacen deploy cada 1–2 semanas y necesitan un sistema de verificación que corra sin contratar full-time.

Cómo se ve la infraestructura

Dashboard de QA en vivo — desglose de severidad, estado de triaje y hallazgos por área de aceptación. Progreso de cobertura medido contra la matriz de trazabilidad.

IRATZÚ — QA Dashboard
Build RC-4.2.1

26

Total Findings

2

Crítico

9

Alto

11

Medio

Findings by Severity

Crítico
2
Alto
9
Medio
11
Bajo
3
Info
1

Findings by Area

Autenticación
5
Manejo de Datos
7
Seguridad API
4
Estado UI
6
Subida de Archivos
3
Notificaciones
1
Confirmado: 14Corregido: 7Por Verificar: 3Nuevo: 2
IDSeverityFindingStatus
CR-017CríticoPolítica RLS de Supabase en appointments permite acceso entre tenants vía claim JWT manipulado Corregido
CR-009AltoRace condition en flujo de reserva concurrente — dos usuarios reclaman el mismo horario cuando los requests llegan en ventana de 50ms Confirmado
CR-022AltoUpdate optimista en reprogramación persiste datetime obsoleto en estado local cuando la suscripción realtime de Supabase se reconecta Por Verificar
CR-004MedioCold start de edge function > 4s en primera invocación causa timeout silencioso en webhook de confirmación de pago — sin lógica de retry Corregido
CR-011MedioParseo de fecha client-side asume UTC pero Supabase retorna timestamptz en locale del usuario — desfase de un día para reservas cerca de medianoche Confirmado

Por qué las soluciones existentes no sirven

AI Testing SaaS

Mabl, Testsigma, Autonoma, QA Wolf

Qué hacen

Generan tests del codebase, se auto-reparan

Qué no hacen

Orquestar la función QA completa. El founder sigue operándolos.

AI Code Review

CodeRabbit, Qodo, Graphite

Qué hacen

Revisión AI pre-merge

Qué no hacen

Atrapar lo que pasa al merge. Sin verificación post-merge.

QA Enterprise

Tricentis Tosca, UFT One

Qué hacen

Gestión de tests enterprise ($100K–$300K/año)

Qué no hacen

Encajar en early-stage. Herramienta equivocada, precio equivocado, audiencia equivocada.

Agencias QA Outsource

DeviQA, Qxf2, Thaloz

Qué hacen

Venden horas offshore a $18–$30/hr

Qué no hacen

Traer metodología. Horas sin orquestación es ruido facturable.

QA Freelance

Upwork (mediana $15/hr)

Qué hacen

Trabajo commodity por proyecto

Qué no hacen

Construir infraestructura durable. Cada engagement empieza de cero.

QA In-House

Senior QA Engineer

Qué hacen

Cobertura a largo plazo ($130K/año + 3 meses de ramp)

Qué no hacen

Resolver el problema inmediato. No viable pre-Series A.

Nadie ofrece a startups AI-native una metodología QA de cuatro fases que combine inventario de componentes, análisis con agentes personalizados, testing recursivo y automatización permanente — todo en un solo servicio.

Cómo funciona

01

Agenda una llamada de descubrimiento de 30 minutos. Revisamos tu repositorio y confirmamos alcance.

02

Propuesta de precio fijo en 48 horas. Sin vueltas.

03

El engagement empieza dentro de 7 días de aceptar.

04

Recibes todos los artefactos. Documentados, transferibles, tuyos para siempre.

Preguntas frecuentes

Una metodología QA de cuatro fases para codebases construidos con herramientas de IA. Empieza con un inventario de componentes y matriz de trazabilidad, corre análisis estático a través de agentes de IA personalizados, construye una capa de testing recursivo que evoluciona con cada PR, y despliega automatización permanente (Playwright, Cloudflare Workers, CI) que corre sin participación continua. El límite entre lo que el Protocolo cubre y lo que el equipo cubre se define desde el día uno.

Mapear cada componente primero: visual, back-end e integración. Construir una matriz de trazabilidad. Correr análisis estático enfocado con agentes personalizados por proyecto. Construir casos de test que evolucionan con cada cambio de código. Automatizar rutas UI, validación de endpoints, checks de calidad de datos y contract tests. Medir cobertura contra benchmarks específicos del contexto.

El código generado por IA sigue patrones que el análisis estático captura bien: bugs de state management, gaps de auth, manejo de errores faltante, defaults inseguros. Agentes personalizados construidos por contexto de proyecto encuentran aproximadamente 4x más hallazgos de los que los equipos sabían. Los agentes pasan por su propio ciclo de desarrollo antes de revisar cualquier código.

Las categorías OWASP que más aparecen: gaps de autenticación, secretos expuestos, rutas de inyección (SQL, XSS, log injection), defaults inseguros, rate limiting faltante, credenciales hardcodeadas. 45% del código generado por IA falla pruebas de seguridad básicas (Veracode, 2026). 92% de codebases generados con IA contienen al menos una vulnerabilidad crítica (Sherlock Forensics, ene–abr 2026). El Protocolo hace screening de estos en el mismo pase que el análisis de calidad.

Solo si la capa de tests evoluciona con el código. Suites de tests estáticas se degradan cuando equipos asistidos por IA hacen deploy rápido. Testing recursivo significa que la cobertura se acumula en vez de degradarse. La cobertura se mide contra una matriz de trazabilidad, no se asume.

Herramientas como Mabl, CodeRabbit o QA Wolf generan tests o revisan código. El Protocolo orquesta cuándo y cómo esas capacidades corren a lo largo del ciclo de release completo: inventario de componentes, análisis con agentes, testing recursivo, automatización permanente y feedback loop de producción. La herramienta nunca es el problema; correr la herramienta dentro de un proceso diseñado sí lo es.

El Protocolo construye infraestructura de verificación. El equipo es dueño del código de producción, decisiones de deployment, correctitud de lógica de negocio y testing exploratorio fuera del inventario de componentes. Rutas móviles específicas de hardware (Bluetooth, NFC, cámara) se documentan como responsabilidad del equipo durante el inventario. El límite es visible y medible desde el día uno, y se expande con cada ciclo.

Sí — a través de un engagement de desarrollo separado. El Protocolo QA encuentra los problemas y te entrega prompts de corrección que tu equipo o su IA puede ejecutar. Si necesitás que los corrijamos directamente, lo definimos como un proyecto de desarrollo. Agendá una llamada para conversarlo.

Empieza con una Auditoría de Código

Si encontramos problemas importantes, acreditamos el costo de la auditoría contra cualquier engagement posterior.

Agenda tu auditoría
Auditoría de Código — AI Native QA Protocol · Academ-ia