Qual é o formato de preço — isto é uma avença, e a que fico preso?

Começa com uma auditoria de produção de scope fixo, para que nenhum dos lados se comprometa às cegas. O acordo contínuo é mensal, dimensionado à superfície real do sistema — funcionalidades, tráfego, nível de SLA — não um headcount que se aluga. É mês a mês depois da estabilização; sem compromisso anual para começar.

Com que rapidez acontecem as coisas, e qual é o vosso SLA?

A auditoria são dias. A instrumentação e a primeira baseline chegam nas primeiras semanas, por isso veem números reais cedo. Os SLAs são acordados à partida e ajustados ao que o sistema precisa — metas de resposta, de resolução e de uptime onde controlamos o suficiente do stack para nos comprometermos com uma.

O que é que não fazem?

Não reivindicamos uptime de partes do stack fora do nosso controlo, e dizemo-lo no SLA. Não corremos isto como uma fila de tickets com juniores. E se a auditoria concluir que a arquitetura não escala, dizemos-vos que precisa de uma reescrita em vez de faturar manutenção para sempre.

Em que é que isto difere dos vossos outros serviços?

Os outros serviços levam um sistema até produção. Suporte & Escala é o único cujo trabalho inteiro é depois do lançamento — manter um sistema ao vivo fiável, barato e atual. Dois sinais: é o único serviço que aceitamos sobre um sistema que não construímos, e mede-se em SLAs cumpridos e custo a descer, não em funcionalidades entregues.

01 / Serviços / Suporte & Escala

Mantenha o seu sistema de IA em produção aborrecido.

Já o entregaram. Agora tem de continuar a funcionar a 10x do tráfego, no modelo do próximo trimestre, sem um alerta às 2 da manhã. Isso é um trabalho diferente de o construir — e o que a maioria das equipas subfinancia.

Começar um projeto

02/O que recebem

Tudo o que precisam.Para se manter aborrecido.

Sem dashboards de vaidade. Sem qualidade assumida. Números reais, mudanças validadas e um piso de fiabilidade — para o sistema aguentar a 10x e a fatura parar de subir.

Um dashboard de telemetria que é vosso

Custo ao vivo, latência (p50/p95/p99), taxas de erro e de fallback por funcionalidade de IA. Deixam de adivinhar sobre o vosso próprio sistema.

Uma fatura de IA que para de subir

Custo por pedido e custo por resultado medidos e a descer — ou mantidos estáveis à medida que o volume cresce — com cada otimização documentada.

Qualidade medida, não assumida

Uma suite de evals que valida cada mudança de prompt e de modelo, mais scoring amostrado em produção, para que a deriva seja um número apanhado, não um email de cliente.

Upgrades de modelo que não vos partem

Quando um fornecedor descontinua ou lança, voltamos a correr os evals e fazemos a troca atrás de um flag — sem regressão de qualidade, sem correrias.

Um piso de fiabilidade

Fallbacks, retries, degradação controlada, um runbook de on-call e um postmortem depois de cada incidente. Menos alertas, recuperação mais rápida.

Margem provada antes de precisarem dela

Números de capacidade testados com carga e um plano de infraestrutura e quotas dimensionado para onde vão, para que o próximo 10x seja uma mudança de configuração, não uma reescrita.

p50/p95/p99

Latência medida por funcionalidade de IA

100%

Mudanças de prompt e modelo validadas por evals

Sénior

Sem juniores. Sem fila de tickets. Só engenheiros principais.

Dias

Tempo de auditoria; baseline nas primeiras semanas

Mensal

Revisão da telemetria, do que foi entregue e do próximo backlog

03/Como trabalhamos

Como trabalhamos.Auditado, depois operado.

Cinco passos de uma auditoria de produção a frio até um sistema que corre com cadência — com números reais antes de tocarmos seja no que for.

01 · AUDITAR

Auditoria de produção

Um engenheiro sénior revê o sistema ao vivo: o que está instrumentado, custo por pedido, perfil de latência, cobertura de evals, modos de falha, exposição a descontinuações. Recebem um documento de conclusões com riscos ordenados. Auditamos um sistema que não construímos.

02 · BASELINE

Instrumentar e fixar a baseline

Montamos a observabilidade e o harness de evals para haver números reais antes de mudarmos seja o que for. Não se pode reivindicar 40% de corte de custo sem a baseline. Isto chega em dias, não em semanas.

03 · ESTABILIZAR

Estabilizar

Fechamos os riscos ordenados da auditoria — fallbacks, retries, os gates de evals, o runbook, os ganhos óbvios de custo. O objetivo é estancar a hemorragia e tornar os incidentes raros e recuperáveis.

04 · OPERAR

Operar com cadência

A monitorização está ativa, os evals validam cada mudança, os upgrades de modelo são tratados à medida que chegam e uma revisão mensal mostra a telemetria, o que foi entregue e o próximo backlog. O SLA está em vigor.

05 · OTIMIZAR

Otimizar e manter pronto para escalar

Continuamos a baixar o custo por resultado, a segurar a latência à medida que o volume cresce e a testar com carga antes de eventos de crescimento conhecidos. Se quiserem trazer a operação para dentro, o handover faz parte do acordo.

04/Para quem é