O que está acontecendo
Processo de incidente de TI existe na maioria das empresas: sistema fora do ar, erro crítico, invasão. Processo de incidente de IA é diferente — e a maioria das empresas não tem.
Incidente de IA: sistema funcionando e tomando decisões erradas, modelo processando dados além do escopo autorizado, derivação significativa de comportamento esperado, dado de cliente enviado a endpoint externo não autorizado.
O processo de incidente de IA precisa definir: o que configura incidente, quem notifica quem, em qual prazo, o que acontece com o modelo enquanto o incidente é investigado (para ou continua?), e como se documenta o encerramento.
Por que isso é problema do CFO
Incidente de IA que envolve dados pessoais tem prazo regulatório de 72h para notificação à ANPD. Sem processo de incidente de IA, esse prazo não é cumprido — o que é infração autônoma.
Auditores de controles internos vão verificar se existe processo de incidente para sistemas de IA críticos. Ausência de processo é achado — independente de ter ocorrido incidente.
O modelo que continua rodando durante uma investigação de incidente pode agravar o dano. Sem processo que define suspend-first, a decisão fica para improvisação no momento crítico.
O que acontece quando isso vai para auditoria
O auditor vai perguntar: se o modelo de crédito começar a produzir resultados claramente incorretos, qual é o processo? Se a resposta for "abrimos um chamado de TI", você tem achado.
Para ISO 42001: processo de incidente de IA é requisito explícito. Para SOX em sistemas financeiros com ML: processo de incidente é parte do controle de operações.
O que fazer
- Adaptar o processo de incidente de TI existente — não criar do zero. Adicionar: critérios de severidade específicos para IA, decisão automática de suspend-first para incidentes críticos, notificação do AI Owner como primeiro passo
- Definir critérios de severidade para IA: drift acima de X%, decisão fora de parâmetro aceito, dado enviado a endpoint não autorizado, resultado impossível (output que não faz sentido no contexto do modelo)
- Incluir suspend-first como padrão para incidentes críticos: na dúvida, o modelo para. A decisão de reativar exige aprovação do AI Owner
- Documentar todo incidente — mesmo os resolvidos rapidamente. A ausência de registro histórico é, em si, achado de auditoria
- Testar o processo semestralmente: simular um incidente e verificar se o processo funciona sem improviso
"Quando o incidente acontece, você não tem tempo para criar o processo. O processo precisa existir antes — com responsáveis treinados e decisões pré-aprovadas."