RowSpeak Private Deployment: Visão Geral da Arquitetura Técnica
Este documento é escrito para arquitetos de TI, engenheiros de infraestrutura e revisores de segurança avaliando RowSpeak Private Deployment. Cobre componentes de sistema, padrões de deployment, requisitos de hardware e considerações de integração.
Arquitetura de Sistema
RowSpeak Private Deployment consiste em quatro camadas que são executadas inteiramente dentro do seu ambiente.
Ambientes de Deployment Suportados
| Ambiente | Suportado | Notas |
|---|---|---|
| Servidor Linux bare metal | ✅ | Recomendado para performance máxima |
| Docker (host único) | ✅ | Mais rápido para começar |
| Docker Compose | ✅ | Configuração multi-serviço padrão |
| Kubernetes | ✅ | Para alta disponibilidade e escalabilidade |
| Nuvem privada (AWS VPC) | ✅ | Implantar na sua própria conta |
| Nuvem privada (Azure VNet) | ✅ | Implantar na sua própria assinatura |
| Nuvem privada (GCP VPC) | ✅ | Implantar no seu próprio projeto |
| Air-gapped (sem internet) | ✅ | Requer pacote de deployment pré-bundled |
| Windows Server | ⚠️ | Via Docker Desktop ou WSL2 |
Guia de Dimensionamento de Hardware
O hardware correto depende do tamanho da sua equipe, necessidades de concorrência e se você executa modelos de código aberto localmente.
Mínimo (até 20 usuários, uso leve)
| Componente | Especificação |
|---|---|
| CPU | 8-core x86_64 |
| RAM | 32 GB |
| GPU | GPU NVIDIA com 16 GB VRAM (para modelo local) |
| Armazenamento | 500 GB SSD |
| OS | Ubuntu 22.04 LTS ou RHEL 8+ |
Padrão (até 100 usuários, uso regular)
| Componente | Especificação |
|---|---|
| CPU | 16-core x86_64 |
| RAM | 64 GB |
| GPU | NVIDIA A10 ou RTX 4090 (24 GB VRAM) |
| Armazenamento | 1 TB NVMe SSD |
| OS | Ubuntu 22.04 LTS |
Enterprise (100+ usuários, alta concorrência)
| Componente | Especificação |
|---|---|
| CPU | 32-core x86_64 (2 nós) |
| RAM | 128 GB por nó |
| GPU | NVIDIA A100 ou H100 (80 GB VRAM) |
| Armazenamento | 2 TB NVMe SSD + NAS compartilhado |
| Rede | 10 Gbps interno |
| OS | Ubuntu 22.04 LTS com Kubernetes |
Se você usar modelos de código fechado via API (GPT, Claude, Gemini), os requisitos de GPU são significativamente reduzidos já que a inferência é executada externamente na sua chave API.
Requisitos de Rede
Entrada
- Porta 443 (HTTPS) de usuários internos para o servidor de app RowSpeak
- Porta 80 (HTTP, redirecionar para HTTPS) — opcional
Interno (entre componentes)
- Servidor de app para servidor de modelo: porta configurável (padrão 8080)
- Servidor de app para banco de dados: portas DB padrão (Postgres 5432, etc.)
- Servidor de app para banco de dados vetorial: configurável
Saída (internet)
- Não requerido para deployments com modelo de código aberto
- Apenas requerido se usando APIs de modelo de código fechado (GPT, Claude, Gemini) — apenas saída para os endpoints API respectivos
- Requerido para download inicial de pesos do modelo durante a configuração (pode ser feito em uma máquina separada e transferido)
Modelos Suportados
Código Aberto (executam localmente, não requerem internet)
| Modelo | VRAM Necessária | Melhor Para |
|---|---|---|
| DeepSeek-V2 | 16–24 GB | Análise geral, chinês |
| Qwen2.5 | 16 GB | Multilíngue, dados estruturados |
| Kimi (Moonshot) | 16 GB | Contexto longo, análise de documentos |
Código Fechado (via sua própria chave API)
| Modelo | Provedor | Notas |
|---|---|---|
| GPT-4o | OpenAI | Sua chave API, sua conta |
| Claude 3.5 | Anthropic | Sua chave API, sua conta |
| Gemini 1.5 Pro | Sua chave API, sua conta |
Você pode misturar modelos entre fluxos de trabalho — por exemplo, usar código aberto para dados financeiros sensíveis e código fechado para tarefas de relatório não sensíveis.
Autenticação e Controle de Acesso
RowSpeak Private Deployment suporta:
- Contas de usuário locais — gerenciadas dentro do RowSpeak
- Integração SSO — SAML 2.0 e OIDC (solicite guia de configuração)
- LDAP / Active Directory — disponível no tier Enterprise
- Controle de acesso baseado em funções — funções Admin, Editor, Viewer
- Isolamento de espaço de trabalho — espaços de trabalho separados por equipe ou departamento
Logging de Auditoria
Todas as ações do usuário são registradas localmente:
- Uploads e exclusões de arquivos
- Consultas e respostas de IA
- Eventos de geração de relatório
- Eventos de login e logout
- Alterações de configuração de administrador
Logs são armazenados no seu ambiente e não são transmitidos ao RowSpeak. O formato de log é JSON, compatível com ferramentas SIEM padrão (Splunk, Elastic, etc.).
Atualização e Manutenção
RowSpeak lança atualizações como imagens Docker versionadas ou pacotes de deployment.
- Atualizações são aplicadas pela sua equipe de TI no seu cronograma
- Sem atualizações automáticas sem sua ação
- Notas de versão são fornecidas com cada versão
- Rollback é suportado revertendo para a versão de imagem anterior
Obtendo a Referência Técnica Completa
O Pacote de Deployment RowSpeak inclui:
- Arquiteturas de deployment de referência (PDF)
- Planilha de dimensionamento de hardware
- Matriz de compatibilidade de modelo
- Checklist de deployment
- Templates de diagrama de rede
Solicitar o Pacote de Deployment →
Para um walkthrough técnico ao vivo, agende uma demo e passaremos pela sua ambiente específica juntos.