RowSpeak Private Deployment:パフォーマンスベンチマーク

このドキュメントは、さまざまなハードウェア構成と使用シナリオにおける RowSpeak Private Deployment のリファレンスパフォーマンスデータを提供します。期待値を設定し、インフラを計画し、デプロイメントを検証するために使用してください。


サマリー

メトリック
推論 latency(ファーストトークン) < 100ms
平均完全レスポンス時間 3–8 秒
Uptime SLA 99.9%
コンカレントユーザー(標準構成) 50+
データ漏洩 0(アーキテクチャによる)

テスト環境リファレンス

以下のすべてのベンチマークは、特に明記されていない限り、以下の標準構成で実行されました。

コンポーネント 仕様
CPU 16 コア Intel Xeon
RAM 64 GB DDR4
GPU NVIDIA A10(24 GB VRAM)
ストレージ 1 TB NVMe SSD
OS Ubuntu 22.04 LTS
モデル DeepSeek-V2(ローカル)
ネットワーク 1 Gbps 内部

タスクタイプ別レスポンス時間

タスクタイプ別平均レスポンス時間(秒) 0s 2s 4s 6s 8s 1.2s 単純 クエリ 3.5s スプレッドシート 分析 4.8s チャート 生成 6.2s レポート 要約 7.8s マルチシート ワークブック 標準タスク 出力生成 複雑なワークブック

コンカレンシーベンチマーク

同時ユーザー数が増加した場合の RowSpeak のパフォーマンス。

P95 レスポンス時間 vs. コンカレントユーザー 0s 5s 10s 15s 20s 10 20 50 100 200 同時ユーザー数 3.2s 4.1s 6.8s 11.2s 18.5s 200+ ユーザー:推奨 Enterprise クラスター構成

ハードウェア構成別パフォーマンス

構成 コンカレントユーザー 平均レスポンス P95 レスポンス 推奨用途
最小(8 コア、32GB、16GB VRAM) 10–20 4.5s 9s 小規模チーム、パイロット
標準(16 コア、64GB、24GB VRAM) 50 3.5s 7s 部門、50–100 ユーザー
Enterprise���32 コア、128GB、80GB VRAM) 100–200 2.8s 6s 大規模組織、高コンカレンシー
Enterprise クラスター(マルチノード) 500+ 2.5s 5s 全社展開

モデルパフォーマンス比較

異なるモデルは異なる速度/品質トレードオフを持ちます。以下は標準スプレッドシート分析タスクでの比較です。

モデル タイプ 平均レスポンス 品質 最適用途
DeepSeek-V2 オープンソース 3.5s 一般的な分析、中国語
Qwen2.5-72B オープンソース 4.1s 多言語、構造化データ
GPT-4o クローズドソース(API) 2.8s 非常に高 複雑な推論、英語
Claude 3.5 Sonnet クローズドソース(API) 3.2s 非常に高 長文書、繊細な出力
Gemini 1.5 Pro クローズドソース(API) 3.0s マルチメディア、大規模コンテキスト

クローズドソースモデルのレスポンス時間は、プロバイダーの API latency とそのエンドポイントへのネットワーク接続に依存します。


安定性と Uptime

RowSpeak Private Deployment は継続的な運用を想定して設計されています。

  • Target uptime: 99.9%(年間 9 時間未満のダウンタイム)
  • Graceful degradation: モデル層が一時的に利用できない場合、アプリケーション層はキャッシュされた結果の提供を継続
  • Restart recovery: 計画された再起動後 60 秒以内に完全サービス回復
  • Memory stability: 30 日間連続運用テストでメモリリークは観察されず

ファイル処理パフォーマンス

ファイルタイプ ファイルサイズ 処理時間
単一シート CSV < 1 MB < 1s
マルチシート Excel 5 MB 2–4s
大規模 Excel ワークブック 50 MB 8–15s
表を含む PDF 10 MB 5–10s
バッチ(10 ファイル) 50 MB 合計 20–40s

デプロイメントの計画

上記のハードウェアサイジング表を出発点として使用してください。チーム規模、ファイルタイプ、使用パターンに基づくより正確な推奨については、サイジングワークシートを含むデプロイメントパックをリクエストしてください。

あなた自身のファイルタイプを使用したライブパフォーマンスデモについては、デモを予約してください。