RowSpeak Private Deployment: Visão Geral da Arquitetura Técnica
Este documento é escrito para arquitetos de TI, engenheiros de infraestrutura e revisores de segurança avaliando RowSpeak Private Deployment. Cobre componentes de sistema, padrões de deployment, requisitos de hardware e considerações de integração.
Arquitetura de Sistema
RowSpeak Private Deployment consiste em quatro camadas que são executadas inteiramente dentro do seu ambiente.
Ambientes de Deployment Suportados
| Ambiente | Suportado | Notas | |
|---|---|---|---|
| Servidor Linux bare metal | ✅ | Recomendado para performance máxima | |
| Docker (host único) | ✅ | Mais rápido para começar | |
| Docker Compose | ✅ | Configuração multi-serviço padrão | |
| Kubernetes | ✅ | Para alta disponibilidade e escalabilidade | |
| Nuvem privada (AWS VPC) | ✅ | Implantar na sua própria conta | |
| Nuvem privada (Azure VNet) | ✅ | Implantar na sua própria assinatura | |
| Nuvem privada (GCP VPC) | ✅ | Implantar no seu próprio projeto | |
| Air-gapped (sem internet) | ✅ | Requer pacote de deployment pré-bundled | |
| Windows Server | ⚠️ | Via Docker Desktop ou WSL2 |
Guia de Dimensionamento de Hardware
O hardware correto depende do tamanho da sua equipe, necessidades de concorrência e se você executa modelos de código aberto localmente.
Mínimo (até 20 usuários, uso leve)
|| Componente | Especificação | |---|---| || CPU | 8-core x86_64 | || RAM | 32 GB | || GPU | GPU NVIDIA com 16 GB VRAM (para modelo local) | || Armazenamento | 500 GB SSD | || OS | Ubuntu 22.04 LTS ou RHEL 8+ |
Padrão (até 100 usuários, uso regular)
|| Componente | Especificação | |---|---| || CPU | 16-core x86_64 | || RAM | 64 GB | || GPU | NVIDIA A10 ou RTX 4090 (24 GB VRAM) | || Armazenamento | 1 TB NVMe SSD | || OS | Ubuntu 22.04 LTS |
Enterprise (100+ usuários, alta concorrência)
|| Componente | Especificação | |---|---| || CPU | 32-core x86_64 (2 nós) | || RAM | 128 GB por nó | || GPU | NVIDIA A100 ou H100 (80 GB VRAM) | || Armazenamento | 2 TB NVMe SSD + NAS compartilhado | || Rede | 10 Gbps interno | || OS | Ubuntu 22.04 LTS com Kubernetes |
Se você usar modelos de código fechado via API (GPT, Claude, Gemini), os requisitos de GPU são significativamente reduzidos já que a inferência é executada externamente na sua chave API.
Requisitos de Rede
Entrada
- Porta 443 (HTTPS) de usuários internos para o servidor de app RowSpeak
- Porta 80 (HTTP, redirecionar para HTTPS) — opcional
Interno (entre componentes)
- Servidor de app para servidor de modelo: porta configurável (padrão 8080)
- Servidor de app para banco de dados: portas DB padrão (Postgres 5432, etc.)
- Servidor de app para banco de dados vetorial: configurável
Saída (internet)
- Não requerido para deployments com modelo de código aberto
- Apenas requerido se usando APIs de modelo de código fechado (GPT, Claude, Gemini) — apenas saída para os endpoints API respectivos
- Requerido para download inicial de pesos do modelo durante a configuração (pode ser feito em uma máquina separada e transferido)
Modelos Suportados
Código Aberto (executam localmente, não requerem internet)
|| Modelo | VRAM Necessária | Melhor Para | |---|---|---| || DeepSeek-V2 | 16–24 GB | Análise geral, chinês | || Qwen2.5 | 16 GB | Multilíngue, dados estruturados | || Kimi (Moonshot) | 16 GB | Contexto longo, análise de documentos |
Código Fechado (via sua própria chave API)
|| Modelo | Provedor | Notas | |---|---|---| || GPT-4o | OpenAI | Sua chave API, sua conta | || Claude 3.5 | Anthropic | Sua chave API, sua conta | || Gemini 1.5 Pro | Google | Sua chave API, sua conta |
Você pode misturar modelos entre fluxos de trabalho — por exemplo, usar código aberto para dados financeiros sensíveis e código fechado para tarefas de relatório não sensíveis.
Autenticação e Controle de Acesso
RowSpeak Private Deployment suporta:
- Contas de usuário locais — gerenciadas dentro do RowSpeak
- Integração SSO — SAML 2.0 e OIDC (solicite guia de configuração)
- LDAP / Active Directory — disponível no tier Enterprise
- Controle de acesso baseado em funções — funções Admin, Editor, Viewer
- Isolamento de espaço de trabalho — espaços de trabalho separados por equipe ou departamento
Logging de Auditoria
Todas as ações do usuário são registradas localmente:
- Uploads e exclusões de arquivos
- Consultas e respostas de IA
- Eventos de geração de relatório
- Eventos de login e logout
- Alterações de configuração de administrador
Logs são armazenados no seu ambiente e não são transmitidos ao RowSpeak. O formato de log é JSON, compatível com ferramentas SIEM padrão (Splunk, Elastic, etc.).
Atualização e Manutenção
RowSpeak lança atualizações como imagens Docker versionadas ou pacotes de deployment.
- Atualizações são aplicadas pela sua equipe de TI no seu cronograma
- Sem atualizações automáticas sem sua ação
- Notas de versão são fornecidas com cada versão
- Rollback é suportado revertendo para a versão de imagem anterior
Obtendo a Referência Técnica Completa
O Pacote de Deployment RowSpeak inclui:
- Arquiteturas de deployment de referência (PDF)
- Planilha de dimensionamento de hardware
- Matriz de compatibilidade de modelo
- Checklist de deployment
- Templates de diagrama de rede
Solicitar o Pacote de Deployment →
Para um walkthrough técnico ao vivo, agende uma demo e passaremos pela sua ambiente específica juntos.