RowSpeak Private Deployment: 기술 아키텍처 개요
이 문서는 RowSpeak Private Deployment를 평가하는 IT 설계자, 인프라 엔지니어, 보안 검토자를 위해 작성되었습니다. 시스템 컴포넌트, 배포 패턴, 하드웨어 요구 사항, 통합 고려 사항을 다룹니다.
시스템 아키텍처
RowSpeak Private Deployment는 환경 내에서 완전히 실행되는 4개의 레이어로 구성됩니다.
지원되는 배포 환경
| 환경 | 지원됨 | 참고 | |
|---|---|---|---|
| 베어메탈 Linux 서버 | ✅ | 최대 성능에 권장 | |
| Docker (단일 호스트) | ✅ | 가장 빨리 시작 | |
| Docker Compose | ✅ | 표준 멀티서비스 설정 | |
| Kubernetes | ✅ | 고가용성 및 확장용 | |
| 프라이빗 클라우드 (AWS VPC) | ✅ | 자체 계정에 배포 | |
| 프라이빗 클라우드 (Azure VNet) | ✅ | 자체 구독에 배포 | |
| 프라이빗 클라우드 (GCP VPC) | ✅ | 자체 프로젝트에 배포 | |
| 에어갭 (인터넷 없음) | ✅ | 사전 번들된 배포 패키지 필요 | |
| Windows Server | ⚠️ | Docker Desktop 또는 WSL2를 통해 |
하드웨어 사이징 가이드
올바른 하드웨어는 팀 규모, 동시성 요구 사항, 로컬에서 오픈소스 모델을 실행하는지 여부에 따라 다릅니다.
최소 (최대 20명, 가벼운 사용)
|| 컴포넌트 | 사양 | |---|---| || CPU | 8코어 x86_64 | || RAM | 32 GB | || GPU | 로컬 모델용 NVIDIA GPU (16 GB VRAM) | || 스토리지 | 500 GB SSD | || OS | Ubuntu 22.04 LTS 또는 RHEL 8+ |
표준 (최대 100명, 일반 사용)
|| 컴포넌트 | 사양 | |---|---| || CPU | 16코어 x86_64 | || RAM | 64 GB | || GPU | NVIDIA A10 또는 RTX 4090 (24 GB VRAM) | || 스토리지 | 1 TB NVMe SSD | || OS | Ubuntu 22.04 LTS |
Enterprise (100+명, 높은 동시성)
|| 컴포넌트 | 사양 | |---|---| || CPU | 32코어 x86_64 (2 노드) | || RAM | 노드당 128 GB | || GPU | NVIDIA A100 또는 H100 (80 GB VRAM) | || 스토리지 | 2 TB NVMe SSD + 공유 NAS | || 네트워크 | 10 Gbps 내부 | || OS | Kubernetes가 포함된 Ubuntu 22.04 LTS |
API를 통해 폐쇄소스 모델(GPT, Claude, Gemini)을 사용하면 추론이 자체 API 키로 외부에서 실행되므로 GPU 요구 사항이 크게 줄어듭니다.
네트워크 요구 사항
인바운드
- 포트 443 (HTTPS): 내부 사용자에서 RowSpeak 앱 서버로
- 포트 80 (HTTP, HTTPS로 리디렉션) — 선택사항
내부 (컴포넌트 간)
- 앱 서버에서 모델 서버로: 구성 가능한 포트 (기본값 8080)
- 앱 서버에서 데이터베이스로: 기본 DB 포트 (Postgres 5432 등)
- 앱 서버에서 벡터 DB로: 구성 가능
아웃바운드 (인터넷)
- 오픈소스 모델 배포에 필요 없음
- 폐쇄소스 모델 API(GPT, Claude, Gemini) 사용 시에만 필요 — 각각의 API 엔드포인트로만 아웃바운드
- 설정 중 초기 모델 가중치 다운로드에 필요 (별도 머신에서 다운로드 후 전송 가능)
지원되는 모델
오픈소스 (로컬에서 실행, 인터넷 불필요)
|| 모델 | 필요 VRAM | 최적 용도 | |---|---|---| || DeepSeek-V2 | 16–24 GB | 일반 분석, 중국어 | || Qwen2.5 | 16 GB | 다국어, 구조화된 데이터 | || Kimi (Moonshot) | 16 GB | 긴 컨텍스트, 문서 분석 |
폐쇄소스 (자체 API 키 사용)
|| 모델 | 제공자 | 참고 | |---|---|---| || GPT-4o | OpenAI | 자체 API 키, 자체 계정 | || Claude 3.5 | Anthropic | 자체 API 키, 자체 계정 | || Gemini 1.5 Pro | Google | 자체 API 키, 자체 계정 |
워크플로우에서 모델을 혼합할 수 있습니다 — 예: 민감한 재무 데이터에는 오픈소스를, 민감이 아닌 보고 작업에는 폐쇄소스를 사용.
인증 및 접근 제어
RowSpeak Private Deployment는 다음을 지원합니다:
- 로컬 사용자 계정 — RowSpeak 내에서 관리
- SSO 통합 — SAML 2.0 및 OIDC (구성 가이드 요청)
- LDAP / Active Directory — Enterprise阶层에서利用 가능
- 역할 기반 접근 제어 — Admin, Editor, Viewer 역할
- 워크스페이스 격리 — 팀 또는 부서별 별도 워크스페이스
감사 로깅
모든 사용자 작업이 로컬에 기록됩니다:
- 파일 업로드 및 삭제
- AI 쿼리 및 응답
- 보고서 생성 이벤트
- 로그인 및 로그아웃 이벤트
- 관리자 구성 변경
로그는 환경에 저장되며 RowSpeak로 전송되지 않습니다. 로그 형식은 JSON으로, 표준 SIEM 도구(Splunk, Elastic 등)와 호환됩니다.
업데이트 및 유지보수
RowSpeak는 버전화된 Docker 이미지 또는 배포 패키지로 업데이트를 릴리스합니다.
- 업데이트는 자체 일정에 따라 IT 팀이 적용
- 자체 작업 없이는 자동 업데이트 없음
- 각 버전과 함께 릴리스 노트 제공
- 이전 이미지 버전으로 되돌려서 롤백 지원
전체 기술 참조 받기
RowSpeak 배포 패키지에는 다음이 포함됩니다:
- 참조 배포 아키텍처 (PDF)
- 하드웨어 사이징 워크시트
- 모델 호환성 매트릭스
- 배포 체크리스트
- 네트워크 다이어그램 템플릿
라이브 기술 워크스루는 데모 예약하고 특정 환경을 함께 검토하세요.