RowSpeak Private Deployment : Aperçu de l'Architecture Technique
Ce document est destiné aux architectes IT, ingénieurs infrastructure et réviseurs sécurité qui évaluent RowSpeak Private Deployment. Il couvre les composants système, les patterns de déploiement, les exigences matérielles et les considérations d'intégration.
Architecture Système
RowSpeak Private Deployment se compose de quatre couches qui s'exécutent entièrement dans votre environnement.
Environnements de Déploiement Pris en Charge
| Environnement | Pris en Charge | Notes | |
|---|---|---|---|
| Serveur Linux nu | ✅ | Recommandé pour performance maximale | |
| Docker (hôte unique) | ✅ | Plus rapide pour démarrer | |
| Docker Compose | ✅ | Configuration multi-services standard | |
| Kubernetes | ✅ | Pour haute disponibilité et mise à l'échelle | |
| Cloud privé (AWS VPC) | ✅ | Déployer dans votre propre compte | |
| Cloud privé (Azure VNet) | ✅ | Déployer dans votre propre abonnement | |
| Cloud privé (GCP VPC) | ✅ | Déployer dans votre propre projet | |
| Air-gapped (sans internet) | ✅ | Nécessite un paquet de déploiement pré-bundlé | |
| Windows Server | ⚠️ | Via Docker Desktop ou WSL2 |
Guide de Dimensionnement Matériel
Le bon matériel dépend de la taille de votre équipe, des besoins de concurrency et du fait que vous exécutiez ou non des modèles open source localement.
Minimum (jusqu'à 20 utilisateurs, utilisation légère)
|| Composant | Spécification | |---|---| || CPU | 8 cœurs x86_64 | || RAM | 32 Go | || GPU | GPU NVIDIA avec 16 Go VRAM (pour modèle local) | || Stockage | 500 Go SSD | || OS | Ubuntu 22.04 LTS ou RHEL 8+ |
Standard (jusqu'à 100 utilisateurs, utilisation régulière)
|| Composant | Spécification | |---|---| || CPU | 16 cœurs x86_64 | || RAM | 64 Go | || GPU | NVIDIA A10 ou RTX 4090 (24 Go VRAM) | || Stockage | 1 To NVMe SSD | || OS | Ubuntu 22.04 LTS |
Enterprise (100+ utilisateurs, haute concurrency)
|| Composant | Spécification | |---|---| || CPU | 32 cœurs x86_64 (2 nœuds) | || RAM | 128 Go par nœud | || GPU | NVIDIA A100 ou H100 (80 Go VRAM) | || Stockage | 2 To NVMe SSD + NAS partagé | || Réseau | 10 Gbps interne | || OS | Ubuntu 22.04 LTS avec Kubernetes |
Si vous utilisez des modèles à code fermé via API (GPT, Claude, Gemini), les exigences GPU sont considérablement réduites car l'inférence s'exécute en externe sur votre clé API.
Exigences Réseau
Entrant
- Port 443 (HTTPS) des utilisateurs internes vers le serveur d'application RowSpeak
- Port 80 (HTTP, redirection vers HTTPS) — optionnel
Interne (entre composants)
- Serveur d'application vers serveur de modèle : port configurable (par défaut 8080)
- Serveur d'application vers base de données : ports DB par défaut (Postgres 5432, etc.)
- Serveur d'application vers base de données vectorielle : configurable
Sortant (internet)
- Non requis pour les déploiements avec modèle open source
- Requis uniquement si utilisation d'APIs de modèle à code fermé (GPT, Claude, Gemini) — sortant uniquement vers les endpoints API respectifs
- Requis pour le téléchargement initial des poids du modèle pendant la configuration (peut être fait sur une machine séparée et transféré)
Modèles Pris en Charge
Open Source (s'exécutent localement, pas besoin d'internet)
|| Modèle | VRAM Requise | Meilleur Pour | |---|---|---| || DeepSeek-V2 | 16–24 Go | Analyse générale, chinois | || Qwen2.5 | 16 Go | Multilingue, données structurées | || Kimi (Moonshot) | 16 Go | Contexte long, analyse de documents |
À Code Fermé (via votre propre clé API)
|| Modèle | Fournisseur | Notes | |---|---|---| || GPT-4o | OpenAI | Votre clé API, votre compte | || Claude 3.5 | Anthropic | Votre clé API, votre compte | || Gemini 1.5 Pro | Google | Votre clé API, votre compte |
Vous pouvez mixer les modèles à travers les workflows : par exemple, utiliser open source pour les données financières sensibles et code fermé pour les tâches de rapport non sensibles.
Authentification et Contrôle d'Accès
RowSpeak Private Deployment prend en charge :
- Comptes utilisateur locaux — gérés dans RowSpeak
- Intégration SSO — SAML 2.0 et OIDC (contactez-nous pour le guide de configuration)
- LDAP / Active Directory — disponible au niveau Enterprise
- Contrôle d'accès basé sur les rôles — rôles Admin, Editor, Viewer
- Isolation des espaces de travail — espaces de travail séparés par équipe ou département
Journalisation d'Audit
Toutes les actions utilisateur sont journalisées localement :
- Téléchargements et suppressions de fichiers
- Requêtes et réponses IA
- Événements de génération de rapport
- Événements de connexion et déconnexion
- Modifications de configuration administrateur
Les journaux sont stockés dans votre environnement et ne sont pas transmis à RowSpeak. Le format de journal est JSON, compatible avec les outils SIEM standard (Splunk, Elastic, etc.).
Mise à Jour et Maintenance
RowSpeak publie les mises à jour sous forme d'images Docker versionnées ou de paquets de déploiement.
- Les mises à jour sont appliquées par votre équipe IT selon votre calendrier
- Pas de mises à jour automatiques sans votre action
- Les notes de version sont fournies avec chaque version
- Le retour arrière est pris en charge en revenant à la version d'image précédente
Obtenir la Référence Technique Complète
Le Paquet de Déploiement RowSpeak comprend :
- Architectures de déploiement de référence (PDF)
- Feuille de travail de dimensionnement matériel
- Matrice de compatibilité des modèles
- Liste de contrôle de déploiement
- Modèles de diagrammes réseau
Demander le Paquet de Déploiement →
Pour une visite technique en direct, réservez une démo et nous examinerons ensemble votre environnement spécifique.