RowSpeak Private Deployment:パフォーマンスベンチマーク
このドキュメントは、さまざまなハードウェア構成と使用シナリオにおける RowSpeak Private Deployment のリファレンスパフォーマンスデータを提供します。期待値を設定し、インフラを計画し、デプロイメントを検証するために使用してください。
サマリー
| メトリック | 値 | |
|---|---|---|
| 推論 latency(ファーストトークン) | < 100ms | |
| 平均完全レスポンス時間 | 3–8 秒 | |
| Uptime SLA | 99.9% | |
| コンカレントユーザー(標準構成) | 50+ | |
| データ漏洩 | 0(アーキテクチャによる) |
テスト環境リファレンス
以下のすべてのベンチマークは、特に明記されていない限り、以下の標準構成で実行されました。
| コンポーネント | 仕様 | |
|---|---|---|
| CPU | 16 コア Intel Xeon | |
| RAM | 64 GB DDR4 | |
| GPU | NVIDIA A10(24 GB VRAM) | |
| ストレージ | 1 TB NVMe SSD | |
| OS | Ubuntu 22.04 LTS | |
| モデル | DeepSeek-V2(ローカル) | |
| ネットワーク | 1 Gbps 内部 |
タスクタイプ別レスポンス時間
コンカレンシーベンチマーク
同時ユーザー数が増加した場合の RowSpeak のパフォーマンス。
ハードウェア構成別パフォーマンス
| 構成 | コンカレントユーザー | 平均レスポンス | P95 レスポンス | 推奨用途 | |
|---|---|---|---|---|---|
| 最小(8 コア、32GB、16GB VRAM) | 10–20 | 4.5s | 9s | 小規模チーム、パイロット | |
| 標準(16 コア、64GB、24GB VRAM) | 50 | 3.5s | 7s | 部門、50–100 ユーザー | |
| Enterprise���32 コア、128GB、80GB VRAM) | 100–200 | 2.8s | 6s | 大規模組織、高コンカレンシー | |
| Enterprise クラスター(マルチノード) | 500+ | 2.5s | 5s | 全社展開 |
モデルパフォーマンス比較
異なるモデルは異なる速度/品質トレードオフを持ちます。以下は標準スプレッドシート分析タスクでの比較です。
| モデル | タイプ | 平均レスポンス | 品質 | 最適用途 | |
|---|---|---|---|---|---|
| DeepSeek-V2 | オープンソース | 3.5s | 高 | 一般的な分析、中国語 | |
| Qwen2.5-72B | オープンソース | 4.1s | 高 | 多言語、構造化データ | |
| GPT-4o | クローズドソース(API) | 2.8s | 非常に高 | 複雑な推論、英語 | |
| Claude 3.5 Sonnet | クローズドソース(API) | 3.2s | 非常に高 | 長文書、繊細な出力 | |
| Gemini 1.5 Pro | クローズドソース(API) | 3.0s | 高 | マルチメディア、大規模コンテキスト |
クローズドソースモデルのレスポンス時間は、プロバイダーの API latency とそのエンドポイントへのネットワーク接続に依存します。
安定性と Uptime
RowSpeak Private Deployment は継続的な運用を想定して設計されています。
- Target uptime: 99.9%(年間 9 時間未満のダウンタイム)
- Graceful degradation: モデル層が一時的に利用できない場合、アプリケーション層はキャッシュされた結果の提供を継続
- Restart recovery: 計画された再起動後 60 秒以内に完全サービス回復
- Memory stability: 30 日間連続運用テストでメモリリークは観察されず
ファイル処理パフォーマンス
| ファイルタイプ | ファイルサイズ | 処理時間 | |
|---|---|---|---|
| 単一シート CSV | < 1 MB | < 1s | |
| マルチシート Excel | 5 MB | 2–4s | |
| 大規模 Excel ワークブック | 50 MB | 8–15s | |
| 表を含む PDF | 10 MB | 5–10s | |
| バッチ(10 ファイル) | 50 MB 合計 | 20–40s |
デプロイメントの計画
上記のハードウェアサイジング表を出発点として使用してください。チーム規模、ファイルタイプ、使用パターンに基づくより正確な推奨については、サイジングワークシートを含むデプロイメントパックをリクエストしてください。
あなた自身のファイルタイプを使用したライブパフォーマンスデモについては、デモを予約してください。