RowSpeak Private Deployment: Leistungs-Benchmarks

Dieses Dokument enthält Referenz-Leistungsdaten für RowSpeak Private Deployment über verschiedene Hardware-Konfigurationen und Nutzungsszenarien. Verwenden Sie es, um Erwartungen zu setzen, Infrastruktur zu planen und Ihre Bereitstellung zu validieren.


Zusammenfassung

Metrik Wert
Inferenz-Latenz (Ersttoken) < 100ms
Durchschnittliche Gesamt-Antwortzeit 3–8 Sekunden
Uptime-SLA 99,9%
Gleichzeitige Benutzer (Standard-Konfiguration) 50+
Datenlecks 0 (durch Architektur)

Testumgebungs-Referenz

Alle nachfolgenden Benchmarks wurden auf der folgenden Standardkonfiguration ausgeführt, sofern nicht anders angegeben.

|| Komponente | Spezifikation | |---|---| || CPU | 16-Kern Intel Xeon | || RAM | 64 GB DDR4 | || GPU | NVIDIA A10 (24 GB VRAM) | || Speicher | 1 TB NVMe SSD | || OS | Ubuntu 22.04 LTS | || Modell | DeepSeek-V2 (lokal) | || Netzwerk | 1 Gbps intern |


Antwortzeit nach Aufgabenart

Durchschnittliche Antwortzeit nach Aufgabenart (Sekunden) 0s 2s 4s 6s 8s 1.2s Einfache Abfrage 3.5s Tabellenkalkulations- Analyse 4.8s Diagramm- Generierung 6.2s Berichts- Zusammenfassung 7.8s Multi-Blatt- Arbeitsbuch Standard-Aufgaben Ausgabegenerierung Komplexe Arbeitsbücher

Concurrency-Benchmarks

Wie sich RowSpeak verhält, wenn gleichzeitige Benutzer zunehmen.

P95 Antwortzeit vs. Gleichzeitige Benutzer 0s 5s 10s 15s 20s 10 20 50 100 200 Gleichzeitige Benutzer 3.2s 4.1s 6.8s 11.2s 18.5s 200+ Benutzer: empfehlen Enterprise-Cluster-Konfiguration

Leistung nach Hardware-Konfiguration

Konfiguration Gleichzeitige Benutzer Ø Antwort P95 Antwort Empfohlen für
Minimum (8-Kern, 32GB, 16GB VRAM) 10–20 4.5s 9s Kleine Teams, Pilot
Standard (16-Kern, 64GB, 24GB VRAM) 50 3.5s 7s Abteilungen, 50–100 Benutzer
Enterprise (32-Kern, 128GB, 80GB VRAM) 100–200 2.8s 6s Große Orgas, hohe Concurrency
Enterprise-Cluster (Multi-Node) 500+ 2.5s 5s Unternehmensweiter Rollout

Modellleistungsvergleich

Verschiedene Modelle haben unterschiedliche Geschwindigkeits-/Qualitäts-Tradeoffs. Hier ist der Vergleich bei Standard-Tabellenanalyseaufgaben.

Modell Typ Ø Antwort Qualität Am besten für
DeepSeek-V2 Open-Source 3.5s Hoch Allgemeine Analyse, Chinesisch
Qwen2.5-72B Open-Source 4.1s Hoch Mehrsprachig, strukturierte Daten
GPT-4o Closed-Source (API) 2.8s Sehr hoch Komplexes Reasoning, Englisch
Claude 3.5 Sonnet Closed-Source (API) 3.2s Sehr hoch Lange Dokumente, nuancierte Ausgabe
Gemini 1.5 Pro Closed-Source (API) 3.0s Hoch Multimeda, großer Kontext

Die Antwortzeiten von Closed-Source-Modellen hängen von der Provider-API-Latenz und Ihrer Netzwerkverbindung zu ihren Endpunkten ab.


Stabilität und Uptime

RowSpeak Private Deployment ist für kontinuierlichen Betrieb ausgelegt.

  • Ziel-Uptime: 99,9% (weniger als 9 Stunden Ausfallzeit pro Jahr)
  • Graceful Degradation: Wenn die Modellschicht temporär nicht verfügbar ist, wird die Anwendungsschicht weiterhin zwischengespeicherte Ergebnisse liefern
  • Restart Recovery: Vollständige Wiederherstellung in unter 60 Sekunden nach einem geplanten Neustart
  • Speicherstabilität: Keine Memory-Leaks in 30-Tage-Dauertests beobachtet

Dateiverarbeitungsleistung

Dateityp Dateigröße Verarbeitungszeit
Einzelblatt-CSV < 1 MB < 1s
Multi-Blatt-Excel 5 MB 2–4s
Große Excel-Arbeitsmappe 50 MB 8–15s
PDF mit Tabellen 10 MB 5–10s
Batch (10 Dateien) 50 MB gesamt 20–40s

Ihre Bereitstellung planen

Verwenden Sie die obige Hardware-Sizing-Tabelle als Ausgangspunkt. Für eine genauere Empfehlung basierend auf Ihrer Teamgröße, Dateitypen und Nutzungsmustern fordern Sie das Bereitstellungspaket an, das einen Sizing-Worksheet enthält.

Für eine Live-Leistungsdemo mit Ihren eigenen Dateitypen buchen Sie eine Demo.