RowSpeak Private Deployment : Benchmarks de Performance

Ce document fournit des données de performance de référence pour RowSpeak Private Deployment sur différentes configurations matérielles et scénarios d'utilisation. Utilisez-le pour fixer des attentes, planifier l'infrastructure et valider votre déploiement.

Résumé

Métrique	Valeur
Latence d'inférence (premier token)	< 100ms
Temps de réponse moyen complet	3–8 secondes
SLA de disponibilité	99,9%
Utilisateurs simultanés (config standard)	50+
Fuites de données	0 (par architecture)

Référence d'Environnement de Test

Tous les benchmarks ci-dessous ont été exécutés sur la configuration standard suivante sauf indication contraire.

Composant	Spécification
CPU	16 cœurs Intel Xeon
RAM	64 Go DDR4
GPU	NVIDIA A10 (24 Go VRAM)
Stockage	1 To NVMe SSD
OS	Ubuntu 22.04 LTS
Modèle	DeepSeek-V2 (local)
Réseau	1 Gbps interne

Temps de Réponse par Type de Tâche

Benchmarks de Concurrency

Comment RowSpeak se comporte à mesure que les utilisateurs simultanés augmentent.

Performance par Configuration Matérielle

Configuration	Utilisateurs Simultanés	Temps Moyen	Temps P95	Recommandé Pour
Minimum (8 cœurs, 32Go, 16Go VRAM)	10–20	4.5s	9s	Petites équipes, pilote
Standard (16 cœurs, 64Go, 24Go VRAM)	50	3.5s	7s	Départements, 50–100 utilisateurs
Enterprise (32 cœurs, 128Go, 80Go VRAM)	100–200	2.8s	6s	Grandes orgs, haute concurrency
Cluster Enterprise (multi-nœuds)	500+	2.5s	5s	Déploiement à l'échelle de l'entreprise

Comparaison de Performance des Modèles

Différents modèles ont différents compromis vitesse/qualité. Voici comment ils se comparent sur les tâches standard d'analyse de feuilles de calcul.

Modèle	Type	Temps Moyen	Qualité	Meilleur Pour
DeepSeek-V2	Open source	3.5s	Haute	Analyse générale, chinois
Qwen2.5-72B	Open source	4.1s	Haute	Multilingue, données structurées
GPT-4o	Code fermé (API)	2.8s	Très haute	Raisonnement complexe, anglais
Claude 3.5 Sonnet	Code fermé (API)	3.2s	Très haute	Longs documents, sortie nuancée
Gemini 1.5 Pro	Code fermé (API)	3.0s	Haute	Multimédia, grand contexte

Les temps de réponse des modèles à code fermé dépendent de la latence de l'API du fournisseur et de votre connexion réseau à leurs points de terminaison.

Stabilité et Disponibilité

RowSpeak Private Deployment est conçu pour un fonctionnement continu.

Disponibilité cible : 99,9 % (moins de 9 heures de temps d'arrêt par an)
Dégradation gracieuse : si la couche modèle est temporairement indisponible, la couche application continue de servir les résultats mis en cache
Récupération après redémarrage : récupération complète du service en moins de 60 secondes après un redémarrage planifié
Stabilité de la mémoire : aucune fuite de mémoire observée dans les tests de fonctionnement continu de 30 jours

Performance de Traitement de Fichiers

Type de Fichier	Taille	Temps de Traitement
CSV mono-feuille	< 1 Mo	< 1s
Excel multi-feuilles	5 Mo	2–4s
Classeur Excel volumineux	50 Mo	8–15s
PDF avec tableaux	10 Mo	5–10s
Lot (10 fichiers)	50 Mo total	20–40s

Planifier Votre Déploiement

Utilisez le tableau de dimensionnement matériel ci-dessus comme point de départ. Pour une recommandation plus précise basée sur la taille de votre équipe, les types de fichiers et les modèles d'utilisation, demandez le Paquet de Déploiement qui comprend une feuille de travail de dimensionnement.

Pour une démonstration de performance en direct utilisant vos propres types de fichiers, réservez une démo.

Transformez vos fichiers en réponses, rapports et tableaux de bord.

Des données brutes aux décisions métier prêtes à l’emploi.