RowSpeak Private Deployment : Aperçu de l'Architecture Technique

Ce document est destiné aux architectes IT, ingénieurs infrastructure et réviseurs sécurité qui évaluent RowSpeak Private Deployment. Il couvre les composants système, les patterns de déploiement, les exigences matérielles et les considérations d'intégration.


Architecture Système

RowSpeak Private Deployment se compose de quatre couches qui s'exécutent entièrement dans votre environnement.

RowSpeak Private Deployment — Architecture Système Couche 1 — Client Navigateur Web PWA Bureau Client API REST Couche 2 — Serveur d'Application Passerelle API Auth · Limite de débit Moteur Feuille de Calcul Parser · Transformer Générateur de Sortie Graphiques · Rapports Journaliseur d'Audit Accès · Actions Couche 3 — Couche IA/Modèle Routeur de Modèle Sélectionner par politique Modèles Open Source DeepSeek · Qwen · Kimi Code Fermé (optionnel) GPT · Claude · Gemini Moteur d'Embeddings Index vectoriel local Couche 4 — Couche Données Stockage de Fichiers BD Relationnelle BD Vectorielle Journaux d'Audit

Environnements de Déploiement Pris en Charge

Environnement Pris en Charge Notes
Serveur Linux nu Recommandé pour performance maximale
Docker (hôte unique) Plus rapide pour démarrer
Docker Compose Configuration multi-services standard
Kubernetes Pour haute disponibilité et mise à l'échelle
Cloud privé (AWS VPC) Déployer dans votre propre compte
Cloud privé (Azure VNet) Déployer dans votre propre abonnement
Cloud privé (GCP VPC) Déployer dans votre propre projet
Air-gapped (sans internet) Nécessite un paquet de déploiement pré-bundlé
Windows Server ⚠️ Via Docker Desktop ou WSL2

Guide de Dimensionnement Matériel

Le bon matériel dépend de la taille de votre équipe, des besoins de concurrency et du fait que vous exécutiez ou non des modèles open source localement.

Minimum (jusqu'à 20 utilisateurs, utilisation légère)

|| Composant | Spécification | |---|---| || CPU | 8 cœurs x86_64 | || RAM | 32 Go | || GPU | GPU NVIDIA avec 16 Go VRAM (pour modèle local) | || Stockage | 500 Go SSD | || OS | Ubuntu 22.04 LTS ou RHEL 8+ |

Standard (jusqu'à 100 utilisateurs, utilisation régulière)

|| Composant | Spécification | |---|---| || CPU | 16 cœurs x86_64 | || RAM | 64 Go | || GPU | NVIDIA A10 ou RTX 4090 (24 Go VRAM) | || Stockage | 1 To NVMe SSD | || OS | Ubuntu 22.04 LTS |

Enterprise (100+ utilisateurs, haute concurrency)

|| Composant | Spécification | |---|---| || CPU | 32 cœurs x86_64 (2 nœuds) | || RAM | 128 Go par nœud | || GPU | NVIDIA A100 ou H100 (80 Go VRAM) | || Stockage | 2 To NVMe SSD + NAS partagé | || Réseau | 10 Gbps interne | || OS | Ubuntu 22.04 LTS avec Kubernetes |

Si vous utilisez des modèles à code fermé via API (GPT, Claude, Gemini), les exigences GPU sont considérablement réduites car l'inférence s'exécute en externe sur votre clé API.


Exigences Réseau

Entrant

  • Port 443 (HTTPS) des utilisateurs internes vers le serveur d'application RowSpeak
  • Port 80 (HTTP, redirection vers HTTPS) — optionnel

Interne (entre composants)

  • Serveur d'application vers serveur de modèle : port configurable (par défaut 8080)
  • Serveur d'application vers base de données : ports DB par défaut (Postgres 5432, etc.)
  • Serveur d'application vers base de données vectorielle : configurable

Sortant (internet)

  • Non requis pour les déploiements avec modèle open source
  • Requis uniquement si utilisation d'APIs de modèle à code fermé (GPT, Claude, Gemini) — sortant uniquement vers les endpoints API respectifs
  • Requis pour le téléchargement initial des poids du modèle pendant la configuration (peut être fait sur une machine séparée et transféré)

Modèles Pris en Charge

Open Source (s'exécutent localement, pas besoin d'internet)

|| Modèle | VRAM Requise | Meilleur Pour | |---|---|---| || DeepSeek-V2 | 16–24 Go | Analyse générale, chinois | || Qwen2.5 | 16 Go | Multilingue, données structurées | || Kimi (Moonshot) | 16 Go | Contexte long, analyse de documents |

À Code Fermé (via votre propre clé API)

|| Modèle | Fournisseur | Notes | |---|---|---| || GPT-4o | OpenAI | Votre clé API, votre compte | || Claude 3.5 | Anthropic | Votre clé API, votre compte | || Gemini 1.5 Pro | Google | Votre clé API, votre compte |

Vous pouvez mixer les modèles à travers les workflows : par exemple, utiliser open source pour les données financières sensibles et code fermé pour les tâches de rapport non sensibles.


Authentification et Contrôle d'Accès

RowSpeak Private Deployment prend en charge :

  • Comptes utilisateur locaux — gérés dans RowSpeak
  • Intégration SSO — SAML 2.0 et OIDC (contactez-nous pour le guide de configuration)
  • LDAP / Active Directory — disponible au niveau Enterprise
  • Contrôle d'accès basé sur les rôles — rôles Admin, Editor, Viewer
  • Isolation des espaces de travail — espaces de travail séparés par équipe ou département

Journalisation d'Audit

Toutes les actions utilisateur sont journalisées localement :

  • Téléchargements et suppressions de fichiers
  • Requêtes et réponses IA
  • Événements de génération de rapport
  • Événements de connexion et déconnexion
  • Modifications de configuration administrateur

Les journaux sont stockés dans votre environnement et ne sont pas transmis à RowSpeak. Le format de journal est JSON, compatible avec les outils SIEM standard (Splunk, Elastic, etc.).


Mise à Jour et Maintenance

RowSpeak publie les mises à jour sous forme d'images Docker versionnées ou de paquets de déploiement.

  • Les mises à jour sont appliquées par votre équipe IT selon votre calendrier
  • Pas de mises à jour automatiques sans votre action
  • Les notes de version sont fournies avec chaque version
  • Le retour arrière est pris en charge en revenant à la version d'image précédente

Obtenir la Référence Technique Complète

Le Paquet de Déploiement RowSpeak comprend :

  • Architectures de déploiement de référence (PDF)
  • Feuille de travail de dimensionnement matériel
  • Matrice de compatibilité des modèles
  • Liste de contrôle de déploiement
  • Modèles de diagrammes réseau

Demander le Paquet de Déploiement →

Pour une visite technique en direct, réservez une démo et nous examinerons ensemble votre environnement spécifique.