RowSpeak Private Deployment: Visión General de Arquitectura Técnica
Este documento está escrito para arquitectos de TI, ingenieros de infraestructura y revisores de seguridad que evalúan RowSpeak Private Deployment. Cubre componentes del sistema, patrones de implementación, requisitos de hardware y consideraciones de integración.
Arquitectura del Sistema
RowSpeak Private Deployment consiste en cuatro capas que se ejecutan completamente dentro de su entorno.
Entornos de Implementación Soportados
| Entorno | Soportado | Notas | |
|---|---|---|---|
| Servidor Linux de metal desnudo | ✅ | Recomendado para máximo rendimiento | |
| Docker (host único) | ✅ | Más rápido para comenzar | |
| Docker Compose | ✅ | Configuración multi-servicio estándar | |
| Kubernetes | ✅ | Para alta disponibilidad y escala | |
| Nube privada (AWS VPC) | ✅ | Implementar en su propia cuenta | |
| Nube privada (Azure VNet) | ✅ | Implementar en su propia suscripción | |
| Nube privada (GCP VPC) | ✅ | Implementar en su propio proyecto | |
| Air-gapped (sin internet) | ✅ | Requiere paquete de implementación pre-empaquetado | |
| Windows Server | ⚠️ | A través de Docker Desktop o WSL2 |
Guía de Dimensionamiento de Hardware
El hardware correcto depende del tamaño de su equipo, necesidades de concurrencia y si ejecuta modelos de código abierto localmente.
Mínimo (hasta 20 usuarios, uso ligero)
|| Componente | Especificación | |---|---| || CPU | 8 núcleos x86_64 | || RAM | 32 GB | || GPU | GPU NVIDIA con 16 GB VRAM (para modelo local) | || Almacenamiento | 500 GB SSD | || SO | Ubuntu 22.04 LTS o RHEL 8+ |
Estándar (hasta 100 usuarios, uso regular)
|| Componente | Especificación | |---|---| || CPU | 16 núcleos x86_64 | || RAM | 64 GB | || GPU | NVIDIA A10 o RTX 4090 (24 GB VRAM) | || Almacenamiento | 1 TB NVMe SSD | || SO | Ubuntu 22.04 LTS |
Enterprise (100+ usuarios, alta concurrencia)
|| Componente | Especificación | |---|---| || CPU | 32 núcleos x86_64 (2 nodos) | || RAM | 128 GB por nodo | || GPU | NVIDIA A100 o H100 (80 GB VRAM) | || Almacenamiento | 2 TB NVMe SSD + NAS compartido | || Red | 10 Gbps interno | || SO | Ubuntu 22.04 LTS con Kubernetes |
Si usa modelos de código cerrado a través de API (GPT, Claude, Gemini), los requisitos de GPU se reducen significativamente ya que la inferencia se ejecuta externamente con su clave API.
Requisitos de Red
Entrada
- Puerto 443 (HTTPS) desde usuarios internos al servidor de aplicaciones RowSpeak
- Puerto 80 (HTTP, redirigir a HTTPS) — opcional
Interno (entre componentes)
- Servidor de aplicaciones a servidor de modelos: puerto configurable (predeterminado 8080)
- Servidor de aplicaciones a base de datos: puertos DB predeterminados (Postgres 5432, etc.)
- Servidor de aplicaciones a base de datos vectorial: configurable
Salida (internet)
- No requerido para implementaciones con modelo de código abierto
- Solo requerido si se usan APIs de modelo de código cerrado (GPT, Claude, Gemini) — solo salida a los endpoints API respectivos
- Requerido para descarga inicial de pesos del modelo durante la configuración (puede hacerse en una máquina separada y transferirse)
Modelos Soportados
Código Abierto (ejecutar localmente, no requiere internet)
|| Modelo | VRAM Requerida | Mejor Para | |---|---|---| || DeepSeek-V2 | 16–24 GB | Análisis general, chino | || Qwen2.5 | 16 GB | Multilingüe, datos estructurados | || Kimi (Moonshot) | 16 GB | Contexto largo, análisis de documentos |
Código Cerrado (a través de su propia clave API)
|| Modelo | Proveedor | Notas | |---|---|---| || GPT-4o | OpenAI | Su clave API, su cuenta | || Claude 3.5 | Anthropic | Su clave API, su cuenta | || Gemini 1.5 Pro | Google | Su clave API, su cuenta |
Puede mezclar modelos entre flujos de trabajo: por ejemplo, usar código abierto para datos financieros sensibles y código cerrado para tareas de informes no sensibles.
Autenticación y Control de Acceso
RowSpeak Private Deployment soporta:
- Cuentas de usuario locales — gestionadas dentro de RowSpeak
- Integración SSO — SAML 2.0 y OIDC (contáctenos para guía de configuración)
- LDAP / Active Directory — disponible en nivel Enterprise
- Control de acceso basado en roles — roles de Admin, Editor, Viewer
- Aislamiento de espacios de trabajo — espacios de trabajo separados por equipo o departamento
Registro de Auditoría
Todas las acciones de usuario se registran localmente:
- Cargas y eliminaciones de archivos
- Consultas y respuestas de IA
- Eventos de generación de informes
- Eventos de login y logout
- Cambios de configuración de administrador
Los registros se almacenan en su entorno y no se transmiten a RowSpeak. El formato de registro es JSON, compatible con herramientas SIEM estándar (Splunk, Elastic, etc.).
Actualización y Mantenimiento
RowSpeak lanza actualizaciones como imágenes Docker versionadas o paquetes de implementación.
- Las actualizaciones son aplicadas por su equipo de TI en su horario
- Sin actualizaciones automáticas sin su acción
- Las notas de versión se proporcionan con cada versión
- El retroceso se soporta revirtiendo a la versión de imagen anterior
Obtener la Referencia Técnica Completa
El Paquete de Implementación de RowSpeak incluye:
- Arquitecturas de implementación de referencia (PDF)
- Hoja de trabajo de dimensionamiento de hardware
- Matriz de compatibilidad de modelos
- Lista de verificación de implementación
- Plantillas de diagramas de red
Solicitar el Paquete de Implementación →
Para un recorrido técnico en vivo, reserve una demo y revisaremos su entorno espec��fico juntos.