Elegir el Modelo de IA Correcto para Su Implementación Privada
Una de las decisiones más importantes en una RowSpeak Private Deployment es qué modelo de IA usar. La elección correcta depende de los requisitos de privacidad de su organización, infraestructura, necesidades de rendimiento y política interna.
Esta guía le guía a través de las opciones y le ayuda a decidir.
Los Dos Caminos
Marco de Decisión
Úselo para reducir rápidamente su elección.
Elija código abierto si:
- Sus datos no pueden salir de su red bajo ninguna circunstancia
- Está implementando en un entorno air-gapped
- Tiene requisitos regulatorios o de cumplimiento sobre residencia de datos
- Quiere evitar la dependencia de la disponibilidad de API de terceros
- Quiere costos predecibles sin precios por token
Elija código cerrado si:
- La sensibilidad de sus datos permite llamadas API externas (con su propia cuenta)
- Quiere la máxima calidad de salida posible para tareas de razonamiento complejas
- No tiene infraestructura GPU disponible
- Quiere comenzar rápidamente sin configuración de modelo
- Está ejecutando un piloto antes de comprometerse con hardware GPU
Combine ambos si:
- Diferentes flujos de trabajo tienen diferentes niveles de sensibilidad
- Quiere código abierto para datos sensibles y código cerrado para tareas no sensibles
- Quiere un modelo de respaldo si uno no está disponible
RowSpeak soporta enrutamiento de diferentes flujos de trabajo a diferentes modelos dentro de la misma implementación.
Comparación de Modelos de Código Abierto
|| Modelo | Parámetros | VRAM Requerida | Idiomas | Licencia | Mejor Para | ||---|---|---|---|---|---|---| || Qwen3.5-397B-A17B | 397B (MoE, 17B activo) | 64 GB | 201+ idiomas | Apache 2.0 | Máxima calidad, análisis complejo | || Qwen3.5-122B-A10B | 122B (MoE, 10B activo) | 24–48 GB | 201+ idiomas | Apache 2.0 | Alta calidad, tareas complejas | || Qwen3.5-35B-A3B | 35B (MoE, 3B activo) | 16 GB | 201+ idiomas | Apache 2.0 | Multilingüe, análisis general | || DeepSeek V3 | 671B (MoE, 37B activo) | 32–48 GB | EN, ZH, multilingüe | MIT | Razonamiento matemático, generación de código | || Gemma 4-31B | 31B | 24 GB | 140 idiomas | Apache 2.0 | Flujos de trabajo agents, salida estructurada | || Qwen3.5-9B | 9B | 16 GB | 201+ idiomas | Apache 2.0 | Implementación local rentable |
Todos los modelos de código abierto se ejecutan localmente. No se requiere conexión a Internet después de la configuración inicial. Las licencias permiten uso comercial.
Comparación de Modelos de Código Cerrado
|| Modelo | Proveedor | Ventana de Contexto | Mejor Para | ||---|---|---|---| || GPT-5.4 | OpenAI | 1M tokens | Razonamiento complejo, inglés primero | || Claude Opus 4.6 | Anthropic | 1M tokens | Documentos largos, análisis matizado | || Gemini 3.1 Pro | Google | 1M tokens | Archivos muy grandes, contenido mixto |
Usa su propia clave API. RowSpeak no actúa como intermediario: sus datos van directamente de su entorno al proveedor.
Qué Pasa con Sus Datos con Modelos de Código Cerrado
Cuando usa un modelo de código cerrado, sus datos de hoja de cálculo se envían a la API de ese proveedor para procesamiento. Esto significa:
- El proveedor procesa sus datos según sus términos de servicio
- Los acuerdos de API empresarial con OpenAI, Anthropic y Google típicamente incluyen acuerdos de procesamiento de datos (DPA) que restringen el uso para entrenamiento
- Debe revisar las políticas de manejo de datos del proveedor antes de habilitar esta opción
- RowSpeak recomienda usar modelos de código cerrado solo para datos no sensibles, o después de revisar y aceptar los términos de datos empresariales del proveedor
Para máxima soberanía de datos, use modelos de código abierto.
Enrutamiento de Modelos en RowSpeak
RowSpeak soporta configurar diferentes modelos para diferentes casos de uso dentro de la misma implementación.
Configuración de ejemplo:
Flujo de trabajo: Informes financieros → DeepSeek V3 (local, datos sensibles)
Flujo de trabajo: Resúmenes de marketing → GPT-5.4 (API, no sensible)
Flujo de trabajo: Predeterminado → Qwen3.5-35B (local, uso general)
Esto permite a su organización aplicar el modelo correcto a cada flujo de trabajo basado en la sensibilidad de datos, sin forzar una sola elección en todos los casos de uso.
Preguntas Frecuentes
¿Puedo cambiar modelos después de la implementación? Sí. La selección de modelo es un cambio de configuración, no una re-implementación. Su equipo de TI puede actualizar la configuración de enrutamiento de modelos sin tiempo de inactividad.
¿Necesitamos descargar los pesos del modelo nosotros mismos? No. El Paquete de Implementación de RowSpeak incluye guía sobre adquisición de modelos. Para entornos air-gapped, proporcionamos instrucciones para precargar los pesos del modelo antes de la implementación.
¿Qué pasa si quiero usar un modelo que no está en esta lista? Contáctenos. La capa de modelos de RowSpeak está diseñada para ser extensible. Si tiene un requisito de modelo específico, podemos discutir la compatibilidad.
¿Puedo usar un modelo fine-tuned o personalizado? Esto está disponible en el nivel Enterprise. Contáctenos para discutir sus requisitos.
¿Necesita Ayuda para Decidir?
Reserve una demo y le ayudaremos a mapear la estrategia de modelos correcta a su entorno, sensibilidad de datos y requisitos de rendimiento.
También puede revisar el documento de arquitectura técnica para más detalles sobre cómo la capa de modelos se integra con el resto del sistema.