RowSpeak Private Deployment : Benchmarks de Performance
Ce document fournit des données de performance de référence pour RowSpeak Private Deployment sur différentes configurations matérielles et scénarios d'utilisation. Utilisez-le pour fixer des attentes, planifier l'infrastructure et valider votre déploiement.
Résumé
| Métrique | Valeur | |
|---|---|---|
| Latence d'inférence (premier token) | < 100ms | |
| Temps de réponse moyen complet | 3–8 secondes | |
| SLA de disponibilité | 99,9% | |
| Utilisateurs simultanés (config standard) | 50+ | |
| Fuites de données | 0 (par architecture) |
Référence d'Environnement de Test
Tous les benchmarks ci-dessous ont été exécutés sur la configuration standard suivante sauf indication contraire.
|| Composant | Spécification | |---|---| || CPU | 16 cœurs Intel Xeon | || RAM | 64 Go DDR4 | || GPU | NVIDIA A10 (24 Go VRAM) | || Stockage | 1 To NVMe SSD | || OS | Ubuntu 22.04 LTS | || Modèle | DeepSeek-V2 (local) | || Réseau | 1 Gbps interne |
Temps de Réponse par Type de Tâche
Benchmarks de Concurrency
Comment RowSpeak se comporte à mesure que les utilisateurs simultanés augmentent.
Performance par Configuration Matérielle
| Configuration | Utilisateurs Simultanés | Temps Moyen | Temps P95 | Recommandé Pour | |
|---|---|---|---|---|---|
| Minimum (8 cœurs, 32Go, 16Go VRAM) | 10–20 | 4.5s | 9s | Petites équipes, pilote | |
| Standard (16 cœurs, 64Go, 24Go VRAM) | 50 | 3.5s | 7s | Départements, 50–100 utilisateurs | |
| Enterprise (32 cœurs, 128Go, 80Go VRAM) | 100–200 | 2.8s | 6s | Grandes orgs, haute concurrency | |
| Cluster Enterprise (multi-nœuds) | 500+ | 2.5s | 5s | Déploiement à l'échelle de l'entreprise |
Comparaison de Performance des Modèles
Différents modèles ont différents compromis vitesse/qualité. Voici comment ils se comparent sur les tâches standard d'analyse de feuilles de calcul.
| Modèle | Type | Temps Moyen | Qualité | Meilleur Pour | |
|---|---|---|---|---|---|
| DeepSeek-V2 | Open source | 3.5s | Haute | Analyse générale, chinois | |
| Qwen2.5-72B | Open source | 4.1s | Haute | Multilingue, données structurées | |
| GPT-4o | Code fermé (API) | 2.8s | Très haute | Raisonnement complexe, anglais | |
| Claude 3.5 Sonnet | Code fermé (API) | 3.2s | Très haute | Longs documents, sortie nuancée | |
| Gemini 1.5 Pro | Code fermé (API) | 3.0s | Haute | Multimédia, grand contexte |
Les temps de réponse des modèles à code fermé dépendent de la latence de l'API du fournisseur et de votre connexion réseau à leurs points de terminaison.
Stabilité et Disponibilité
RowSpeak Private Deployment est conçu pour un fonctionnement continu.
- Disponibilité cible : 99,9 % (moins de 9 heures de temps d'arrêt par an)
- Dégradation gracieuse : si la couche modèle est temporairement indisponible, la couche application continue de servir les résultats mis en cache
- Récupération après redémarrage : récupération complète du service en moins de 60 secondes après un redémarrage planifié
- Stabilité de la mémoire : aucune fuite de mémoire observée dans les tests de fonctionnement continu de 30 jours
Performance de Traitement de Fichiers
| Type de Fichier | Taille | Temps de Traitement | |
|---|---|---|---|
| CSV mono-feuille | < 1 Mo | < 1s | |
| Excel multi-feuilles | 5 Mo | 2–4s | |
| Classeur Excel volumineux | 50 Mo | 8–15s | |
| PDF avec tableaux | 10 Mo | 5–10s | |
| Lot (10 fichiers) | 50 Mo total | 20–40s |
Planifier Votre Déploiement
Utilisez le tableau de dimensionnement matériel ci-dessus comme point de départ. Pour une recommandation plus précise basée sur la taille de votre équipe, les types de fichiers et les modèles d'utilisation, demandez le Paquet de Déploiement qui comprend une feuille de travail de dimensionnement.
Pour une démonstration de performance en direct utilisant vos propres types de fichiers, réservez une démo.