RowSpeak Private Deployment: Visión General de Arquitectura Técnica

Este documento está escrito para arquitectos de TI, ingenieros de infraestructura y revisores de seguridad que evalúan RowSpeak Private Deployment. Cubre componentes del sistema, patrones de implementación, requisitos de hardware y consideraciones de integración.


Arquitectura del Sistema

RowSpeak Private Deployment consiste en cuatro capas que se ejecutan completamente dentro de su entorno.

RowSpeak Private Deployment — Arquitectura del Sistema Capa 1 — Cliente Navegador Web PWA de Escritorio Cliente API REST Capa 2 — Servidor de Aplicación Puerta de Enlace API Auth · Límite de Tasa Motor de Hoja de Cálculo Parsear · Transformar Generador de Salida Gráficos · Informes Registrador de Auditoría Acceso · Acciones Capa 3 — Capa IA/Modelo Enrutador de Modelos Seleccionar por política Modelos de Código Abierto DeepSeek · Qwen · Kimi Código Cerrado (opcional) GPT · Claude · Gemini Motor de Embeddings Índice vectorial local Capa 4 — Capa de Datos Almacenamiento de Archivos DB Relacional DB Vectorial Logs de Auditoría

Entornos de Implementación Soportados

Entorno Soportado Notas
Servidor Linux de metal desnudo Recomendado para máximo rendimiento
Docker (host único) Más rápido para comenzar
Docker Compose Configuración multi-servicio estándar
Kubernetes Para alta disponibilidad y escala
Nube privada (AWS VPC) Implementar en su propia cuenta
Nube privada (Azure VNet) Implementar en su propia suscripción
Nube privada (GCP VPC) Implementar en su propio proyecto
Air-gapped (sin internet) Requiere paquete de implementación pre-empaquetado
Windows Server ⚠️ A través de Docker Desktop o WSL2

Guía de Dimensionamiento de Hardware

El hardware correcto depende del tamaño de su equipo, necesidades de concurrencia y si ejecuta modelos de código abierto localmente.

Mínimo (hasta 20 usuarios, uso ligero)

|| Componente | Especificación | |---|---| || CPU | 8 núcleos x86_64 | || RAM | 32 GB | || GPU | GPU NVIDIA con 16 GB VRAM (para modelo local) | || Almacenamiento | 500 GB SSD | || SO | Ubuntu 22.04 LTS o RHEL 8+ |

Estándar (hasta 100 usuarios, uso regular)

|| Componente | Especificación | |---|---| || CPU | 16 núcleos x86_64 | || RAM | 64 GB | || GPU | NVIDIA A10 o RTX 4090 (24 GB VRAM) | || Almacenamiento | 1 TB NVMe SSD | || SO | Ubuntu 22.04 LTS |

Enterprise (100+ usuarios, alta concurrencia)

|| Componente | Especificación | |---|---| || CPU | 32 núcleos x86_64 (2 nodos) | || RAM | 128 GB por nodo | || GPU | NVIDIA A100 o H100 (80 GB VRAM) | || Almacenamiento | 2 TB NVMe SSD + NAS compartido | || Red | 10 Gbps interno | || SO | Ubuntu 22.04 LTS con Kubernetes |

Si usa modelos de código cerrado a través de API (GPT, Claude, Gemini), los requisitos de GPU se reducen significativamente ya que la inferencia se ejecuta externamente con su clave API.


Requisitos de Red

Entrada

  • Puerto 443 (HTTPS) desde usuarios internos al servidor de aplicaciones RowSpeak
  • Puerto 80 (HTTP, redirigir a HTTPS) — opcional

Interno (entre componentes)

  • Servidor de aplicaciones a servidor de modelos: puerto configurable (predeterminado 8080)
  • Servidor de aplicaciones a base de datos: puertos DB predeterminados (Postgres 5432, etc.)
  • Servidor de aplicaciones a base de datos vectorial: configurable

Salida (internet)

  • No requerido para implementaciones con modelo de código abierto
  • Solo requerido si se usan APIs de modelo de código cerrado (GPT, Claude, Gemini) — solo salida a los endpoints API respectivos
  • Requerido para descarga inicial de pesos del modelo durante la configuración (puede hacerse en una máquina separada y transferirse)

Modelos Soportados

Código Abierto (ejecutar localmente, no requiere internet)

|| Modelo | VRAM Requerida | Mejor Para | |---|---|---| || DeepSeek-V2 | 16–24 GB | Análisis general, chino | || Qwen2.5 | 16 GB | Multilingüe, datos estructurados | || Kimi (Moonshot) | 16 GB | Contexto largo, análisis de documentos |

Código Cerrado (a través de su propia clave API)

|| Modelo | Proveedor | Notas | |---|---|---| || GPT-4o | OpenAI | Su clave API, su cuenta | || Claude 3.5 | Anthropic | Su clave API, su cuenta | || Gemini 1.5 Pro | Google | Su clave API, su cuenta |

Puede mezclar modelos entre flujos de trabajo: por ejemplo, usar código abierto para datos financieros sensibles y código cerrado para tareas de informes no sensibles.


Autenticación y Control de Acceso

RowSpeak Private Deployment soporta:

  • Cuentas de usuario locales — gestionadas dentro de RowSpeak
  • Integración SSO — SAML 2.0 y OIDC (contáctenos para guía de configuración)
  • LDAP / Active Directory — disponible en nivel Enterprise
  • Control de acceso basado en roles — roles de Admin, Editor, Viewer
  • Aislamiento de espacios de trabajo — espacios de trabajo separados por equipo o departamento

Registro de Auditoría

Todas las acciones de usuario se registran localmente:

  • Cargas y eliminaciones de archivos
  • Consultas y respuestas de IA
  • Eventos de generación de informes
  • Eventos de login y logout
  • Cambios de configuración de administrador

Los registros se almacenan en su entorno y no se transmiten a RowSpeak. El formato de registro es JSON, compatible con herramientas SIEM estándar (Splunk, Elastic, etc.).


Actualización y Mantenimiento

RowSpeak lanza actualizaciones como imágenes Docker versionadas o paquetes de implementación.

  • Las actualizaciones son aplicadas por su equipo de TI en su horario
  • Sin actualizaciones automáticas sin su acción
  • Las notas de versión se proporcionan con cada versión
  • El retroceso se soporta revirtiendo a la versión de imagen anterior

Obtener la Referencia Técnica Completa

El Paquete de Implementación de RowSpeak incluye:

  • Arquitecturas de implementación de referencia (PDF)
  • Hoja de trabajo de dimensionamiento de hardware
  • Matriz de compatibilidad de modelos
  • Lista de verificación de implementación
  • Plantillas de diagramas de red

Solicitar el Paquete de Implementación →

Para un recorrido técnico en vivo, reserve una demo y revisaremos su entorno espec��fico juntos.