RowSpeak Private Deployment: Visão Geral da Arquitetura Técnica

Este documento é escrito para arquitetos de TI, engenheiros de infraestrutura e revisores de segurança avaliando RowSpeak Private Deployment. Cobre componentes de sistema, padrões de deployment, requisitos de hardware e considerações de integração.


Arquitetura de Sistema

RowSpeak Private Deployment consiste em quatro camadas que são executadas inteiramente dentro do seu ambiente.

RowSpeak Private Deployment — Arquitetura de Sistema Camada 1 — Cliente Navegador Web PWA Desktop Cliente API REST Camada 2 — Servidor de Aplicação API Gateway Auth · Rate Limit Motor de Planilha Parse · Transform Gerador de Saída Gráficos · Relatórios Logger de Auditoria Acesso · Ações Camada 3 — Camada IA/Modelo Roteador de Modelo Selecionar por política Modelos de Código Aberto DeepSeek · Qwen · Kimi Código Fechado (opcional) GPT · Claude · Gemini Motor de Embedding Índice vetorial local Camada 4 — Camada de Dados Armazenamento de Arquivos DB Relacional DB Vetorial Logs de Auditoria

Ambientes de Deployment Suportados

Ambiente Suportado Notas
Servidor Linux bare metal Recomendado para performance máxima
Docker (host único) Mais rápido para começar
Docker Compose Configuração multi-serviço padrão
Kubernetes Para alta disponibilidade e escalabilidade
Nuvem privada (AWS VPC) Implantar na sua própria conta
Nuvem privada (Azure VNet) Implantar na sua própria assinatura
Nuvem privada (GCP VPC) Implantar no seu próprio projeto
Air-gapped (sem internet) Requer pacote de deployment pré-bundled
Windows Server ⚠️ Via Docker Desktop ou WSL2

Guia de Dimensionamento de Hardware

O hardware correto depende do tamanho da sua equipe, necessidades de concorrência e se você executa modelos de código aberto localmente.

Mínimo (até 20 usuários, uso leve)

Componente Especificação
CPU 8-core x86_64
RAM 32 GB
GPU GPU NVIDIA com 16 GB VRAM (para modelo local)
Armazenamento 500 GB SSD
OS Ubuntu 22.04 LTS ou RHEL 8+

Padrão (até 100 usuários, uso regular)

Componente Especificação
CPU 16-core x86_64
RAM 64 GB
GPU NVIDIA A10 ou RTX 4090 (24 GB VRAM)
Armazenamento 1 TB NVMe SSD
OS Ubuntu 22.04 LTS

Enterprise (100+ usuários, alta concorrência)

Componente Especificação
CPU 32-core x86_64 (2 nós)
RAM 128 GB por nó
GPU NVIDIA A100 ou H100 (80 GB VRAM)
Armazenamento 2 TB NVMe SSD + NAS compartilhado
Rede 10 Gbps interno
OS Ubuntu 22.04 LTS com Kubernetes

Se você usar modelos de código fechado via API (GPT, Claude, Gemini), os requisitos de GPU são significativamente reduzidos já que a inferência é executada externamente na sua chave API.


Requisitos de Rede

Entrada

  • Porta 443 (HTTPS) de usuários internos para o servidor de app RowSpeak
  • Porta 80 (HTTP, redirecionar para HTTPS) — opcional

Interno (entre componentes)

  • Servidor de app para servidor de modelo: porta configurável (padrão 8080)
  • Servidor de app para banco de dados: portas DB padrão (Postgres 5432, etc.)
  • Servidor de app para banco de dados vetorial: configurável

Saída (internet)

  • Não requerido para deployments com modelo de código aberto
  • Apenas requerido se usando APIs de modelo de código fechado (GPT, Claude, Gemini) — apenas saída para os endpoints API respectivos
  • Requerido para download inicial de pesos do modelo durante a configuração (pode ser feito em uma máquina separada e transferido)

Modelos Suportados

Código Aberto (executam localmente, não requerem internet)

Modelo VRAM Necessária Melhor Para
DeepSeek-V2 16–24 GB Análise geral, chinês
Qwen2.5 16 GB Multilíngue, dados estruturados
Kimi (Moonshot) 16 GB Contexto longo, análise de documentos

Código Fechado (via sua própria chave API)

Modelo Provedor Notas
GPT-4o OpenAI Sua chave API, sua conta
Claude 3.5 Anthropic Sua chave API, sua conta
Gemini 1.5 Pro Google Sua chave API, sua conta

Você pode misturar modelos entre fluxos de trabalho — por exemplo, usar código aberto para dados financeiros sensíveis e código fechado para tarefas de relatório não sensíveis.


Autenticação e Controle de Acesso

RowSpeak Private Deployment suporta:

  • Contas de usuário locais — gerenciadas dentro do RowSpeak
  • Integração SSO — SAML 2.0 e OIDC (solicite guia de configuração)
  • LDAP / Active Directory — disponível no tier Enterprise
  • Controle de acesso baseado em funções — funções Admin, Editor, Viewer
  • Isolamento de espaço de trabalho — espaços de trabalho separados por equipe ou departamento

Logging de Auditoria

Todas as ações do usuário são registradas localmente:

  • Uploads e exclusões de arquivos
  • Consultas e respostas de IA
  • Eventos de geração de relatório
  • Eventos de login e logout
  • Alterações de configuração de administrador

Logs são armazenados no seu ambiente e não são transmitidos ao RowSpeak. O formato de log é JSON, compatível com ferramentas SIEM padrão (Splunk, Elastic, etc.).


Atualização e Manutenção

RowSpeak lança atualizações como imagens Docker versionadas ou pacotes de deployment.

  • Atualizações são aplicadas pela sua equipe de TI no seu cronograma
  • Sem atualizações automáticas sem sua ação
  • Notas de versão são fornecidas com cada versão
  • Rollback é suportado revertendo para a versão de imagem anterior

Obtendo a Referência Técnica Completa

O Pacote de Deployment RowSpeak inclui:

  • Arquiteturas de deployment de referência (PDF)
  • Planilha de dimensionamento de hardware
  • Matriz de compatibilidade de modelo
  • Checklist de deployment
  • Templates de diagrama de rede

Solicitar o Pacote de Deployment →

Para um walkthrough técnico ao vivo, agende uma demo e passaremos pela sua ambiente específica juntos.