Escolhendo o Modelo de IA Certo para Seu Deployment Privado

Uma das decisões mais importantes em um RowSpeak Private Deployment é qual modelo de IA usar. A escolha correta depende dos requisitos de privacidade da sua organização, infraestrutura, necessidades de performance e política interna.

Este guia orienta você pelas opções e ajuda você a decidir.


Os Dois Caminhos

Modelos de Código Aberto vs. Código Fechado Modelos de Código Aberto Executam inteiramente dentro do seu ambiente Exemplos: Qwen3.5 · DeepSeek V3 · Gemma 4 Manipulação de dados: ✅ Dados nunca saem da sua rede ✅ Sem chamadas API externas ✅ Compatível com air-gapped Requisitos: Servidor GPU (16–64 GB VRAM) Modelos de Código Fechado Via sua própria chave API Exemplos: GPT-5.4 · Claude Opus 4.6 · Gemini 3.1 Pro Manipulação de dados: ⚠️ Dados enviados para API do provedor ⚠️ Sujeito às políticas do provedor ✅ Sua chave API, sua conta Requisitos: Chave API + acesso à internet de saída

Framework de Decisão

Use isso para reduzir rapidamente sua escolha.

Escolha código aberto se:

  • Seus dados não podem sair da sua rede sob nenhuma circunstância
  • Você está implantando em um ambiente air-gapped
  • Você tem requisitos regulatórios ou de conformidade sobre residência de dados
  • Você quer evitar dependência da disponibilidade de API de terceiros
  • Você quer custos previsíveis sem preços por token

Escolha código fechado se:

  • A sensibilidade dos seus dados permite chamadas API externas (com sua própria conta)
  • Você quer a mais alta qualidade de saída possível para tarefas complexas de raciocínio
  • Você não tem infraestrutura GPU disponível
  • Você quer começar rapidamente sem configuração de modelo
  • Você está executando um piloto antes de se comprometer com hardware GPU

Combine ambos se:

  • Diferentes fluxos de trabalho têm diferentes níveis de sensibilidade
  • Você quer código aberto para dados sensíveis e código fechado para tarefas não sensíveis
  • Você quer um modelo fallback se um não estiver disponível

RowSpeak suporta roteamento de diferentes fluxos de trabalho para diferentes modelos dentro do mesmo deployment.


Comparação de Modelos de Código Aberto

|| Modelo | Parâmetros | VRAM Necessária | Idiomas | Licença | Melhor Para | ||---|---|---|---|---|---|---| || Qwen3.5-397B-A17B | 397B (MoE, 17B ativo) | 64 GB | 201+ idiomas | Apache 2.0 | Máxima qualidade, análise complexa | || Qwen3.5-122B-A10B | 122B (MoE, 10B ativo) | 24–48 GB | 201+ idiomas | Apache 2.0 | Alta qualidade, tarefas complexas | || Qwen3.5-35B-A3B | 35B (MoE, 3B ativo) | 16 GB | 201+ idiomas | Apache 2.0 | Multilíngue, análise geral | || DeepSeek V3 | 671B (MoE, 37B ativo) | 32–48 GB | EN, ZH, multilíngue | MIT | Raciocínio matemático, geração de código | || Gemma 4-31B | 31B | 24 GB | 140 idiomas | Apache 2.0 | Fluxos de trabalho agents, saída estruturada | || Qwen3.5-9B | 9B | 16 GB | 201+ idiomas | Apache 2.0 | Deployment local econômico |

Todos os modelos de código aberto executam localmente. Nenhuma conexão com internet necessária após a configuração inicial. Licenças permitem uso comercial.


Comparação de Modelos de Código Fechado

|| Modelo | Provedor | Janela de Contexto | Melhor Para | ||---|---|---|---| || GPT-5.4 | OpenAI | 1M tokens | Raciocínio complexo, inglês primeiro | || Claude Opus 4.6 | Anthropic | 1M tokens | Documentos longos, análise matizada | || Gemini 3.1 Pro | Google | 1M tokens | Arquivos muito grandes, conteúdo misto |

Você usa sua própria chave API. RowSpeak não atua como intermediário — seus dados vão diretamente do seu ambiente para o provedor.


O que Acontece com Seus Dados com Modelos de Código Fechado

Quando você usa um modelo de código fechado, seus dados de planilha são enviados para a API desse provedor para processamento. Isso significa:

  • O provedor processa seus dados de acordo com seus termos de serviço
  • Acordos de API empresarial com OpenAI, Anthropic e Google tipicamente incluem acordos de processamento de dados (DPAs) que restringem uso para treinamento
  • Você deve revisar as políticas de manipulação de dados do provedor antes de habilitar esta opção
  • RowSpeak recomenda usar modelos de código fechado apenas para dados não sensíveis, ou após revisar e aceitar os termos de dados empresariais do provedor

Para máxima soberania de dados, use modelos de código aberto.


Roteamento de Modelos no RowSpeak

RowSpeak suporta configurar diferentes modelos para diferentes casos de uso dentro do mesmo deployment.

Configuração de exemplo:

Fluxo de trabalho: Relatórios financeiros → DeepSeek V3 (local, dados sensíveis)
Fluxo de trabalho: Resumos de marketing → GPT-5.4 (API, não sensível)
Fluxo de trabalho: Padrão → Qwen3.5-35B (local, uso geral)

Isso permite que sua organização aplique o modelo certo a cada fluxo de trabalho baseado na sensibilidade dos dados, sem forçar uma única escolha em todos os casos de uso.


Perguntas Frequentes

Posso trocar modelos após o deployment? Sim. A seleção de modelo é uma mudança de configuração, não um re-deployment. Sua equipe de TI pode atualizar a configuração de roteamento de modelo sem downtime.

Precisamos baixar os pesos do modelo nós mesmos? Não. O pacote de deployment RowSpeak inclui orientação sobre aquisição de modelos. Para ambientes air-gapped, fornecemos instruções para pré-carregar os pesos do modelo antes do deployment.

E se eu quiser usar um modelo que não está nesta lista? Entre em contato conosco. A camada de modelo do RowSpeak é projetada para ser extensível. Se você tem um requisito específico de modelo, podemos discutir compatibilidade.

Posso usar um modelo fine-tuned ou personalizado? Isso está disponível no tier Enterprise. Entre em contato conosco para discutir seus requisitos.


Precisa de Ajuda para Decidir?

Agende uma demo e ajudaremos você a mapear a estratégia de modelo certa para seu ambiente, sensibilidade de dados e requisitos de performance.

Você também pode revisar o documento de arquitetura técnica para mais detalhes sobre como a camada de modelo se integra com o resto do sistema.