RowSpeak Private Deployment: Visão Geral da Arquitetura Técnica

Este documento é escrito para arquitetos de TI, engenheiros de infraestrutura e revisores de segurança avaliando RowSpeak Private Deployment. Cobre componentes de sistema, padrões de deployment, requisitos de hardware e considerações de integração.


Arquitetura de Sistema

RowSpeak Private Deployment consiste em quatro camadas que são executadas inteiramente dentro do seu ambiente.

RowSpeak Private Deployment — Arquitetura de Sistema Camada 1 — Cliente Navegador Web PWA Desktop Cliente API REST Camada 2 — Servidor de Aplicação API Gateway Auth · Rate Limit Motor de Planilha Parse · Transform Gerador de Saída Gráficos · Relatórios Logger de Auditoria Acesso · Ações Camada 3 — Camada IA/Modelo Roteador de Modelo Selecionar por política Modelos de Código Aberto DeepSeek · Qwen · Kimi Código Fechado (opcional) GPT · Claude · Gemini Motor de Embedding Índice vetorial local Camada 4 — Camada de Dados Armazenamento de Arquivos DB Relacional DB Vetorial Logs de Auditoria

Ambientes de Deployment Suportados

Ambiente Suportado Notas
Servidor Linux bare metal Recomendado para performance máxima
Docker (host único) Mais rápido para começar
Docker Compose Configuração multi-serviço padrão
Kubernetes Para alta disponibilidade e escalabilidade
Nuvem privada (AWS VPC) Implantar na sua própria conta
Nuvem privada (Azure VNet) Implantar na sua própria assinatura
Nuvem privada (GCP VPC) Implantar no seu próprio projeto
Air-gapped (sem internet) Requer pacote de deployment pré-bundled
Windows Server ⚠️ Via Docker Desktop ou WSL2

Guia de Dimensionamento de Hardware

O hardware correto depende do tamanho da sua equipe, necessidades de concorrência e se você executa modelos de código aberto localmente.

Mínimo (até 20 usuários, uso leve)

|| Componente | Especificação | |---|---| || CPU | 8-core x86_64 | || RAM | 32 GB | || GPU | GPU NVIDIA com 16 GB VRAM (para modelo local) | || Armazenamento | 500 GB SSD | || OS | Ubuntu 22.04 LTS ou RHEL 8+ |

Padrão (até 100 usuários, uso regular)

|| Componente | Especificação | |---|---| || CPU | 16-core x86_64 | || RAM | 64 GB | || GPU | NVIDIA A10 ou RTX 4090 (24 GB VRAM) | || Armazenamento | 1 TB NVMe SSD | || OS | Ubuntu 22.04 LTS |

Enterprise (100+ usuários, alta concorrência)

|| Componente | Especificação | |---|---| || CPU | 32-core x86_64 (2 nós) | || RAM | 128 GB por nó | || GPU | NVIDIA A100 ou H100 (80 GB VRAM) | || Armazenamento | 2 TB NVMe SSD + NAS compartilhado | || Rede | 10 Gbps interno | || OS | Ubuntu 22.04 LTS com Kubernetes |

Se você usar modelos de código fechado via API (GPT, Claude, Gemini), os requisitos de GPU são significativamente reduzidos já que a inferência é executada externamente na sua chave API.


Requisitos de Rede

Entrada

  • Porta 443 (HTTPS) de usuários internos para o servidor de app RowSpeak
  • Porta 80 (HTTP, redirecionar para HTTPS) — opcional

Interno (entre componentes)

  • Servidor de app para servidor de modelo: porta configurável (padrão 8080)
  • Servidor de app para banco de dados: portas DB padrão (Postgres 5432, etc.)
  • Servidor de app para banco de dados vetorial: configurável

Saída (internet)

  • Não requerido para deployments com modelo de código aberto
  • Apenas requerido se usando APIs de modelo de código fechado (GPT, Claude, Gemini) — apenas saída para os endpoints API respectivos
  • Requerido para download inicial de pesos do modelo durante a configuração (pode ser feito em uma máquina separada e transferido)

Modelos Suportados

Código Aberto (executam localmente, não requerem internet)

|| Modelo | VRAM Necessária | Melhor Para | |---|---|---| || DeepSeek-V2 | 16–24 GB | Análise geral, chinês | || Qwen2.5 | 16 GB | Multilíngue, dados estruturados | || Kimi (Moonshot) | 16 GB | Contexto longo, análise de documentos |

Código Fechado (via sua própria chave API)

|| Modelo | Provedor | Notas | |---|---|---| || GPT-4o | OpenAI | Sua chave API, sua conta | || Claude 3.5 | Anthropic | Sua chave API, sua conta | || Gemini 1.5 Pro | Google | Sua chave API, sua conta |

Você pode misturar modelos entre fluxos de trabalho — por exemplo, usar código aberto para dados financeiros sensíveis e código fechado para tarefas de relatório não sensíveis.


Autenticação e Controle de Acesso

RowSpeak Private Deployment suporta:

  • Contas de usuário locais — gerenciadas dentro do RowSpeak
  • Integração SSO — SAML 2.0 e OIDC (solicite guia de configuração)
  • LDAP / Active Directory — disponível no tier Enterprise
  • Controle de acesso baseado em funções — funções Admin, Editor, Viewer
  • Isolamento de espaço de trabalho — espaços de trabalho separados por equipe ou departamento

Logging de Auditoria

Todas as ações do usuário são registradas localmente:

  • Uploads e exclusões de arquivos
  • Consultas e respostas de IA
  • Eventos de geração de relatório
  • Eventos de login e logout
  • Alterações de configuração de administrador

Logs são armazenados no seu ambiente e não são transmitidos ao RowSpeak. O formato de log é JSON, compatível com ferramentas SIEM padrão (Splunk, Elastic, etc.).


Atualização e Manutenção

RowSpeak lança atualizações como imagens Docker versionadas ou pacotes de deployment.

  • Atualizações são aplicadas pela sua equipe de TI no seu cronograma
  • Sem atualizações automáticas sem sua ação
  • Notas de versão são fornecidas com cada versão
  • Rollback é suportado revertendo para a versão de imagem anterior

Obtendo a Referência Técnica Completa

O Pacote de Deployment RowSpeak inclui:

  • Arquiteturas de deployment de referência (PDF)
  • Planilha de dimensionamento de hardware
  • Matriz de compatibilidade de modelo
  • Checklist de deployment
  • Templates de diagrama de rede

Solicitar o Pacote de Deployment →

Para um walkthrough técnico ao vivo, agende uma demo e passaremos pela sua ambiente específica juntos.