RowSpeak Private Deployment: Benchmarks de Performance

Este documento fornece dados de referência de performance para RowSpeak Private Deployment em diferentes configurações de hardware e cenários de uso. Use-os para definir expectativas, planejar infraestrutura e validar seu deployment.

Resumo

Métrica	Valor
Latência de inferência (primeiro token)	< 100ms
Tempo de resposta médio completo	3–8 segundos
SLA de uptime	99.9%
Usuários simultâneos (config padrão)	50+
Vazamentos de dados	0 (por arquitetura)

Referência de Ambiente de Teste

Todos os benchmarks abaixo foram executados na seguinte configuração padrão, a menos que indicado otherwise.

Componente	Especificação
CPU	16-core Intel Xeon
RAM	64 GB DDR4
GPU	NVIDIA A10 (24 GB VRAM)
Armazenamento	1 TB NVMe SSD
OS	Ubuntu 22.04 LTS
Modelo	DeepSeek-V2 (local)
Rede	1 Gbps interno

Tempo de Resposta por Tipo de Tarefa

Benchmarks de Concorrência

Como o RowSpeak performa à medida que usuários simultâneos aumentam.

Performance por Configuração de Hardware

Configuração	Usuários Simultâneos	Tempo Médio	Tempo P95	Recomendado Para
Mínimo (8-core, 32GB, 16GB VRAM)	10–20	4.5s	9s	Equipes pequenas, piloto
Padrão (16-core, 64GB, 24GB VRAM)	50	3.5s	7s	Departamentos, 50–100 usuários
Enterprise (32-core, 128GB, 80GB VRAM)	100–200	2.8s	6s	Orgs grandes, alta concorrência
Cluster Enterprise (multi-nó)	500+	2.5s	5s	Rollout em toda a empresa

Comparação de Performance de Modelos

Diferentes modelos têm diferentes trade-offs de velocidade/qualidade. Aqui está como eles se comparam em tarefas padrão de análise de planilha.

Modelo	Tipo	Tempo Médio	Qualidade	Melhor Para
DeepSeek-V2	Código aberto	3.5s	Alta	Análise geral, chinês
Qwen2.5-72B	Código aberto	4.1s	Alta	Multilíngue, dados estruturados
GPT-4o	Código fechado (API)	2.8s	Muito alta	Raciocínio complexo, inglês
Claude 3.5 Sonnet	Código fechado (API)	3.2s	Muito alta	Documentos longos, saída matizada
Gemini 1.5 Pro	Código fechado (API)	3.0s	Alta	Multimídia, grande contexto

Tempos de resposta de modelos de código fechado dependem da latência da API do provedor e sua conexão de rede com seus endpoints.

Estabilidade e Uptime

RowSpeak Private Deployment é projetado para operação contínua.

Uptime alvo: 99.9% (menos de 9 horas de downtime por ano)
Degradaçãograceful: se a camada de modelo estiver temporariamente indisponível, a camada de aplicação continua servindo resultados em cache
Recuperação de reinício: recuperação completa do serviço em menos de 60 segundos após um reinício planejado
Estabilidade de memória: nenhum vazamento de memória observado em testes de operação contínua de 30 dias

Performance de Processamento de Arquivos

Tipo de Arquivo	Tamanho	Tempo de Processamento
CSV aba única	< 1 MB	< 1s
Excel multi-abas	5 MB	2–4s
Pasta Excel grande	50 MB	8–15s
PDF com tabelas	10 MB	5–10s
Lote (10 arquivos)	50 MB total	20–40s

Planejando Seu Deployment

Use a tabela de dimensionamento de hardware acima como ponto de partida. Para uma recomendação mais precisa baseada no tamanho da sua equipe, tipos de arquivo e padrões de uso, solicite o Pacote de Deployment que inclui uma planilha de dimensionamento.

Para uma demonstração de performance ao vivo usando seus próprios tipos de arquivo, agende uma demo.

Transforme arquivos em respostas, relatórios e dashboards.

De dados brutos a decisões de negócio prontas para uso.