RowSpeak Private Deployment : Benchmarks de Performance

Ce document fournit des données de performance de référence pour RowSpeak Private Deployment sur différentes configurations matérielles et scénarios d'utilisation. Utilisez-le pour fixer des attentes, planifier l'infrastructure et valider votre déploiement.


Résumé

Métrique Valeur
Latence d'inférence (premier token) < 100ms
Temps de réponse moyen complet 3–8 secondes
SLA de disponibilité 99,9%
Utilisateurs simultanés (config standard) 50+
Fuites de données 0 (par architecture)

Référence d'Environnement de Test

Tous les benchmarks ci-dessous ont été exécutés sur la configuration standard suivante sauf indication contraire.

|| Composant | Spécification | |---|---| || CPU | 16 cœurs Intel Xeon | || RAM | 64 Go DDR4 | || GPU | NVIDIA A10 (24 Go VRAM) | || Stockage | 1 To NVMe SSD | || OS | Ubuntu 22.04 LTS | || Modèle | DeepSeek-V2 (local) | || Réseau | 1 Gbps interne |


Temps de Réponse par Type de Tâche

Temps de Réponse Moyen par Type de Tâche (secondes) 0s 2s 4s 6s 8s 1.2s Requête Simple 3.5s Analyse de Feuille de Calcul 4.8s Génération de Graphiques 6.2s Synthèse de Rapport 7.8s Classeur à Feuilles Multiples Tâches Standard Génération de Sortie Classeurs Complexes

Benchmarks de Concurrency

Comment RowSpeak se comporte à mesure que les utilisateurs simultanés augmentent.

Temps de Réponse P95 vs. Utilisateurs Simultanés 0s 5s 10s 15s 20s 10 20 50 100 200 Utilisateurs Simultanés 3.2s 4.1s 6.8s 11.2s 18.5s 200+ utilisateurs : recommandé config cluster Enterprise

Performance par Configuration Matérielle

Configuration Utilisateurs Simultanés Temps Moyen Temps P95 Recommandé Pour
Minimum (8 cœurs, 32Go, 16Go VRAM) 10–20 4.5s 9s Petites équipes, pilote
Standard (16 cœurs, 64Go, 24Go VRAM) 50 3.5s 7s Départements, 50–100 utilisateurs
Enterprise (32 cœurs, 128Go, 80Go VRAM) 100–200 2.8s 6s Grandes orgs, haute concurrency
Cluster Enterprise (multi-nœuds) 500+ 2.5s 5s Déploiement à l'échelle de l'entreprise

Comparaison de Performance des Modèles

Différents modèles ont différents compromis vitesse/qualité. Voici comment ils se comparent sur les tâches standard d'analyse de feuilles de calcul.

Modèle Type Temps Moyen Qualité Meilleur Pour
DeepSeek-V2 Open source 3.5s Haute Analyse générale, chinois
Qwen2.5-72B Open source 4.1s Haute Multilingue, données structurées
GPT-4o Code fermé (API) 2.8s Très haute Raisonnement complexe, anglais
Claude 3.5 Sonnet Code fermé (API) 3.2s Très haute Longs documents, sortie nuancée
Gemini 1.5 Pro Code fermé (API) 3.0s Haute Multimédia, grand contexte

Les temps de réponse des modèles à code fermé dépendent de la latence de l'API du fournisseur et de votre connexion réseau à leurs points de terminaison.


Stabilité et Disponibilité

RowSpeak Private Deployment est conçu pour un fonctionnement continu.

  • Disponibilité cible : 99,9 % (moins de 9 heures de temps d'arrêt par an)
  • Dégradation gracieuse : si la couche modèle est temporairement indisponible, la couche application continue de servir les résultats mis en cache
  • Récupération après redémarrage : récupération complète du service en moins de 60 secondes après un redémarrage planifié
  • Stabilité de la mémoire : aucune fuite de mémoire observée dans les tests de fonctionnement continu de 30 jours

Performance de Traitement de Fichiers

Type de Fichier Taille Temps de Traitement
CSV mono-feuille < 1 Mo < 1s
Excel multi-feuilles 5 Mo 2–4s
Classeur Excel volumineux 50 Mo 8–15s
PDF avec tableaux 10 Mo 5–10s
Lot (10 fichiers) 50 Mo total 20–40s

Planifier Votre Déploiement

Utilisez le tableau de dimensionnement matériel ci-dessus comme point de départ. Pour une recommandation plus précise basée sur la taille de votre équipe, les types de fichiers et les modèles d'utilisation, demandez le Paquet de Déploiement qui comprend une feuille de travail de dimensionnement.

Pour une démonstration de performance en direct utilisant vos propres types de fichiers, réservez une démo.