Escolhendo o Modelo de IA Certo para Seu Deployment Privado

Uma das decisões mais importantes em um RowSpeak Private Deployment é qual modelo de IA usar. A escolha correta depende dos requisitos de privacidade da sua organização, infraestrutura, necessidades de performance e política interna.

Este guia orienta você pelas opções e ajuda você a decidir.

Os Dois Caminhos

Framework de Decisão

Use isso para reduzir rapidamente sua escolha.

Escolha código aberto se:

Seus dados não podem sair da sua rede sob nenhuma circunstância
Você está implantando em um ambiente air-gapped
Você tem requisitos regulatórios ou de conformidade sobre residência de dados
Você quer evitar dependência da disponibilidade de API de terceiros
Você quer custos previsíveis sem preços por token

Escolha código fechado se:

A sensibilidade dos seus dados permite chamadas API externas (com sua própria conta)
Você quer a mais alta qualidade de saída possível para tarefas complexas de raciocínio
Você não tem infraestrutura GPU disponível
Você quer começar rapidamente sem configuração de modelo
Você está executando um piloto antes de se comprometer com hardware GPU

Combine ambos se:

Diferentes fluxos de trabalho têm diferentes níveis de sensibilidade
Você quer código aberto para dados sensíveis e código fechado para tarefas não sensíveis
Você quer um modelo fallback se um não estiver disponível

RowSpeak suporta roteamento de diferentes fluxos de trabalho para diferentes modelos dentro do mesmo deployment.

Comparação de Modelos de Código Aberto

Modelo	Parâmetros	VRAM Necessária	Idiomas	Licença	Melhor Para
Qwen3.5-397B-A17B	397B (MoE, 17B ativo)	64 GB	201+ idiomas	Apache 2.0	Máxima qualidade, análise complexa
Qwen3.5-122B-A10B	122B (MoE, 10B ativo)	24–48 GB	201+ idiomas	Apache 2.0	Alta qualidade, tarefas complexas
Qwen3.5-35B-A3B	35B (MoE, 3B ativo)	16 GB	201+ idiomas	Apache 2.0	Multilíngue, análise geral
DeepSeek V3	671B (MoE, 37B ativo)	32–48 GB	EN, ZH, multilíngue	MIT	Raciocínio matemático, geração de código
Gemma 4-31B	31B	24 GB	140 idiomas	Apache 2.0	Fluxos de trabalho agents, saída estruturada
Qwen3.5-9B	9B	16 GB	201+ idiomas	Apache 2.0	Deployment local econômico

Todos os modelos de código aberto executam localmente. Nenhuma conexão com internet necessária após a configuração inicial. Licenças permitem uso comercial.

Comparação de Modelos de Código Fechado

Modelo	Provedor	Janela de Contexto	Melhor Para
GPT-5.4	OpenAI	1M tokens	Raciocínio complexo, inglês primeiro
Claude Opus 4.6	Anthropic	1M tokens	Documentos longos, análise matizada
Gemini 3.1 Pro	Google	1M tokens	Arquivos muito grandes, conteúdo misto

Você usa sua própria chave API. RowSpeak não atua como intermediário — seus dados vão diretamente do seu ambiente para o provedor.

O que Acontece com Seus Dados com Modelos de Código Fechado

Quando você usa um modelo de código fechado, seus dados de planilha são enviados para a API desse provedor para processamento. Isso significa:

O provedor processa seus dados de acordo com seus termos de serviço
Acordos de API empresarial com OpenAI, Anthropic e Google tipicamente incluem acordos de processamento de dados (DPAs) que restringem uso para treinamento
Você deve revisar as políticas de manipulação de dados do provedor antes de habilitar esta opção
RowSpeak recomenda usar modelos de código fechado apenas para dados não sensíveis, ou após revisar e aceitar os termos de dados empresariais do provedor

Para máxima soberania de dados, use modelos de código aberto.

Roteamento de Modelos no RowSpeak

RowSpeak suporta configurar diferentes modelos para diferentes casos de uso dentro do mesmo deployment.

Configuração de exemplo:

Fluxo de trabalho: Relatórios financeiros → DeepSeek V3 (local, dados sensíveis)
Fluxo de trabalho: Resumos de marketing → GPT-5.4 (API, não sensível)
Fluxo de trabalho: Padrão → Qwen3.5-35B (local, uso geral)

Isso permite que sua organização aplique o modelo certo a cada fluxo de trabalho baseado na sensibilidade dos dados, sem forçar uma única escolha em todos os casos de uso.

Perguntas Frequentes

Posso trocar modelos após o deployment? Sim. A seleção de modelo é uma mudança de configuração, não um re-deployment. Sua equipe de TI pode atualizar a configuração de roteamento de modelo sem downtime.

Precisamos baixar os pesos do modelo nós mesmos? Não. O pacote de deployment RowSpeak inclui orientação sobre aquisição de modelos. Para ambientes air-gapped, fornecemos instruções para pré-carregar os pesos do modelo antes do deployment.

E se eu quiser usar um modelo que não está nesta lista? Entre em contato conosco. A camada de modelo do RowSpeak é projetada para ser extensível. Se você tem um requisito específico de modelo, podemos discutir compatibilidade.

Posso usar um modelo fine-tuned ou personalizado? Isso está disponível no tier Enterprise. Entre em contato conosco para discutir seus requisitos.

Precisa de Ajuda para Decidir?

Agende uma demo e ajudaremos você a mapear a estratégia de modelo certa para seu ambiente, sensibilidade de dados e requisitos de performance.

Você também pode revisar o documento de arquitetura técnica para mais detalhes sobre como a camada de modelo se integra com o resto do sistema.

Transforme arquivos em respostas, relatórios e dashboards.

De dados brutos a decisões de negócio prontas para uso.