프라이빗 배포를 위한 올바른 AI 모델 선택
RowSpeak Private Deployment에서 가장 중요한 결정 중 하나는 어떤 AI 모델을 사용할지입니다. 올바른 선택은 조직의 개인정보 보호 요구 사항, 인프라, 성능 필요, 내부 정책에 따라 다릅니다.
이 가이드는 옵션을 안내하고 결정을 돕습니다.
두 가지 경로
결정 프레임워크
선택을 빠르게 좁히는 데 사용합니다.
다음의 경우 오픈소스를 선택하세요:
- 데이터가 어떤 상황에서도 네트워크를 벗어나지 않아야 함
- 에어갭 환경에 배포 중
- 데이터 거시에 대한 규제 또는 규정 준수 요구 사항이 있음
- 서드파티 API 가용성에 대한 의존을 피하고 싶음
- 토큰당 가격 없이 예측 가능한 비용을 원함
다음의 경우 폐쇄소스를 선택하세요:
- 데이터 민감도가 외부 API 호출을 허용함(자체 계정 사용)
- 복잡한推理 작업에 가능한 가장 높은 출력 품질을 원함
- GPU 인프라를 사용할 수 없음
- 모델 설정 없이 빠르게 시작하고 싶음
- GPU 하드웨어에 투자하기 전에 파일럿을 실행 중
둘 다 결합하세요:
- 다른 워크플로우에 다른 민감도 수준이 있음
- 민감한 데이터에는 오픈소스를, 민감이 아닌 작업에는 폐쇄소스를 원함
- 하나가利用不可한 경우 폴백 모델을 원함
RowSpeak는 동일한 배포 내에서 다른 워크플로우를 다른 모델로 라우팅하는 것을 지원합니다.
오픈소스 모델 비교
|| 모델 | 파라미터 | 필요 VRAM | 언어 | 라이선스 | 최적 용도 | ||---|---|---|---|---|---|---| || Qwen3.5-397B-A17B | 397B (MoE, 17B 활성) | 64 GB | 201+ 언어 | Apache 2.0 | 최대 품질, 복잡한 분석 | || Qwen3.5-122B-A10B | 122B (MoE, 10B 활성) | 24–48 GB | 201+ 언어 | Apache 2.0 |高品质, 복잡한 작업 | || Qwen3.5-35B-A3B | 35B (MoE, 3B 활성) | 16 GB | 201+ 언어 | Apache 2.0 | 다국어, 일반 분석 | || DeepSeek V3 | 671B (MoE, 37B 활성) | 32–48 GB | EN, ZH, 다국어 | MIT | 수학推理, 코드 생성 | || Gemma 4-31B | 31B | 24 GB | 140 언어 | Apache 2.0 | 에이전트 워크플로우, 구조화된 출력 | || Qwen3.5-9B | 9B | 16 GB | 201+ 언어 | Apache 2.0 | 비용 효율적인 로컬 배포 |
모든 오픈소스 모델은 로컬에서 실행됩니다. 초기 설정 후 인터넷 연결이 필요하지 않습니다. 라이선스는 상업적 사용을 허용합니다.
폐쇄소스 모델 비교
|| 모델 | 제공자 | 컨텍스트 윈도우 | 최적 용도 | ||---|---|---|---| || GPT-5.4 | OpenAI | 1M 토큰 | 복잡한推理, 영어 우선 | || Claude Opus 4.6 | Anthropic | 1M 토큰 | 긴 문서, 미묘한 분석 | || Gemini 3.1 Pro | Google | 1M 토큰 | 매우 큰 파일, 혼합 콘텐츠 |
자체 API 키를 사용합니다. RowSpeak는 중개자로 작동하지 않습니다 — 데이터가 환경에서 직접 제공자로 이동합니다.
폐쇄소스 모델 사용 시 데이터에 발생하는 일
폐쇄소스 모델을 사용할 때 스프레드시트 데이터가 처리를 위해 해당 제공자의 API로 전송됩니다. 이것은 다음을 의미합니다:
- 제공자가 서비스 약관에 따라 데이터를 처리함
- OpenAI, Anthropic, Google과의 Enterprise API 계약에는 일반적으로 훈련 사용을 제한하는 데이터 처리 계약(DPA)이 포함됨
- 이 옵션을 활성화하기 전에 제공자의 데이터 처리 정책을 검토해야 합니다
- RowSpeak는 민감한 데이터에는 오픈소스 모델 사용을 권장합니다
최대 데이터 주권을 위해서는 오픈소스 모델을 사용하세요.
RowSpeak의 모델 라우팅
RowSpeak는 동일한 배포 내에서 다른 유스케이스에 다른 모델 구성을 지원하는 모델 라우팅을 지원합니다.
예시 구성:
워크플로우: 재무 보고서 → DeepSeek V3 (로컬, 민감한 데이터)
워크플로우: 마케팅 요약 → GPT-5.4 (API, 민감하지 않음)
워크플로우: 기본값 → Qwen3.5-35B (로컬, 일반 사용)
이것은 조직이 모든 유스케이스에 단일 선택을 강요하지 않고 데이터 민감도에 따라 각 워크플로우에 올바른 모델을 적용할 수 있게 합니다.
자주 묻는 질문
배포 후 모델을 전환할 수 있나요? 예. 모델 선택은 구성 변경이지 재배치가 아닙니다. IT 팀은 가동 중지 시간 없이 모델 라우팅 구성을 업데이트할 수 있습니다.
모델 가중치를 직접 다운로드해야 하나요? 아니요. RowSpeak 배포 패키지는 모델 취득에 대한 안내를 포함합니다. 에어갭 환경의 경우 배포 전에 모델 가중치를 사전 로드하기 위한 지침을 제공합니다.
이 목록에 없는 모델을 사용하고 싶으면 어떻게 하나요? 문의하세요. RowSpeak의 모델 레이어는 확장 가능하도록 설계되었습니다. 특정 모델 요구 사항이 있으면 호환성에 대해 논의할 수 있습니다.
미세 조정 또는 사용자 정의 모델을 사용할 수 있나요? 이것은 Enterprise階層에서利用 가능합니다. 요구 사항에 대해 문의하세요.
결정을 돕는 데 필요한가요?
데모 예약하면 환경, 데이터 민감도, 성능 요구 사항에 올바른 모델 전략을 매핑하는 것을 도와드립니다.
모델 레이어가 시스템의 나머지와 어떻게 통합되는지에 대한 자세한 내용은 기술 아키텍처 문서도 검토할 수 있습니다.