Elegir el Modelo de IA Correcto para Su Implementación Privada

Una de las decisiones más importantes en una RowSpeak Private Deployment es qué modelo de IA usar. La elección correcta depende de los requisitos de privacidad de su organización, infraestructura, necesidades de rendimiento y política interna.

Esta guía le guía a través de las opciones y le ayuda a decidir.


Los Dos Caminos

Modelos de Código Abierto vs. Código Cerrado Modelos de Código Abierto Se ejecutan completamente dentro de su entorno Ejemplos: Qwen3.5 · DeepSeek V3 · Gemma 4 Manejo de datos: ✅ Los datos nunca salen de su red ✅ Sin llamadas API externas ✅ Compatible con air-gapped Requisitos: Servidor GPU (16–64 GB VRAM) Modelos de Código Cerrado A través de su propia clave API Ejemplos: GPT-5.4 · Claude Opus 4.6 · Gemini 3.1 Pro Manejo de datos: ⚠️ Datos enviados a API del proveedor ⚠️ Sujeto a políticas del proveedor ✅ Su clave API, su cuenta Requisitos: Clave API + acceso a internet saliente

Marco de Decisión

Úselo para reducir rápidamente su elección.

Elija código abierto si:

  • Sus datos no pueden salir de su red bajo ninguna circunstancia
  • Está implementando en un entorno air-gapped
  • Tiene requisitos regulatorios o de cumplimiento sobre residencia de datos
  • Quiere evitar la dependencia de la disponibilidad de API de terceros
  • Quiere costos predecibles sin precios por token

Elija código cerrado si:

  • La sensibilidad de sus datos permite llamadas API externas (con su propia cuenta)
  • Quiere la máxima calidad de salida posible para tareas de razonamiento complejas
  • No tiene infraestructura GPU disponible
  • Quiere comenzar rápidamente sin configuración de modelo
  • Está ejecutando un piloto antes de comprometerse con hardware GPU

Combine ambos si:

  • Diferentes flujos de trabajo tienen diferentes niveles de sensibilidad
  • Quiere código abierto para datos sensibles y código cerrado para tareas no sensibles
  • Quiere un modelo de respaldo si uno no está disponible

RowSpeak soporta enrutamiento de diferentes flujos de trabajo a diferentes modelos dentro de la misma implementación.


Comparación de Modelos de Código Abierto

|| Modelo | Parámetros | VRAM Requerida | Idiomas | Licencia | Mejor Para | ||---|---|---|---|---|---|---| || Qwen3.5-397B-A17B | 397B (MoE, 17B activo) | 64 GB | 201+ idiomas | Apache 2.0 | Máxima calidad, análisis complejo | || Qwen3.5-122B-A10B | 122B (MoE, 10B activo) | 24–48 GB | 201+ idiomas | Apache 2.0 | Alta calidad, tareas complejas | || Qwen3.5-35B-A3B | 35B (MoE, 3B activo) | 16 GB | 201+ idiomas | Apache 2.0 | Multilingüe, análisis general | || DeepSeek V3 | 671B (MoE, 37B activo) | 32–48 GB | EN, ZH, multilingüe | MIT | Razonamiento matemático, generación de código | || Gemma 4-31B | 31B | 24 GB | 140 idiomas | Apache 2.0 | Flujos de trabajo agents, salida estructurada | || Qwen3.5-9B | 9B | 16 GB | 201+ idiomas | Apache 2.0 | Implementación local rentable |

Todos los modelos de código abierto se ejecutan localmente. No se requiere conexión a Internet después de la configuración inicial. Las licencias permiten uso comercial.


Comparación de Modelos de Código Cerrado

|| Modelo | Proveedor | Ventana de Contexto | Mejor Para | ||---|---|---|---| || GPT-5.4 | OpenAI | 1M tokens | Razonamiento complejo, inglés primero | || Claude Opus 4.6 | Anthropic | 1M tokens | Documentos largos, análisis matizado | || Gemini 3.1 Pro | Google | 1M tokens | Archivos muy grandes, contenido mixto |

Usa su propia clave API. RowSpeak no actúa como intermediario: sus datos van directamente de su entorno al proveedor.


Qué Pasa con Sus Datos con Modelos de Código Cerrado

Cuando usa un modelo de código cerrado, sus datos de hoja de cálculo se envían a la API de ese proveedor para procesamiento. Esto significa:

  • El proveedor procesa sus datos según sus términos de servicio
  • Los acuerdos de API empresarial con OpenAI, Anthropic y Google típicamente incluyen acuerdos de procesamiento de datos (DPA) que restringen el uso para entrenamiento
  • Debe revisar las políticas de manejo de datos del proveedor antes de habilitar esta opción
  • RowSpeak recomienda usar modelos de código cerrado solo para datos no sensibles, o después de revisar y aceptar los términos de datos empresariales del proveedor

Para máxima soberanía de datos, use modelos de código abierto.


Enrutamiento de Modelos en RowSpeak

RowSpeak soporta configurar diferentes modelos para diferentes casos de uso dentro de la misma implementación.

Configuración de ejemplo:

Flujo de trabajo: Informes financieros → DeepSeek V3 (local, datos sensibles)
Flujo de trabajo: Resúmenes de marketing → GPT-5.4 (API, no sensible)
Flujo de trabajo: Predeterminado → Qwen3.5-35B (local, uso general)

Esto permite a su organización aplicar el modelo correcto a cada flujo de trabajo basado en la sensibilidad de datos, sin forzar una sola elección en todos los casos de uso.


Preguntas Frecuentes

¿Puedo cambiar modelos después de la implementación? Sí. La selección de modelo es un cambio de configuración, no una re-implementación. Su equipo de TI puede actualizar la configuración de enrutamiento de modelos sin tiempo de inactividad.

¿Necesitamos descargar los pesos del modelo nosotros mismos? No. El Paquete de Implementación de RowSpeak incluye guía sobre adquisición de modelos. Para entornos air-gapped, proporcionamos instrucciones para precargar los pesos del modelo antes de la implementación.

¿Qué pasa si quiero usar un modelo que no está en esta lista? Contáctenos. La capa de modelos de RowSpeak está diseñada para ser extensible. Si tiene un requisito de modelo específico, podemos discutir la compatibilidad.

¿Puedo usar un modelo fine-tuned o personalizado? Esto está disponible en el nivel Enterprise. Contáctenos para discutir sus requisitos.


¿Necesita Ayuda para Decidir?

Reserve una demo y le ayudaremos a mapear la estrategia de modelos correcta a su entorno, sensibilidad de datos y requisitos de rendimiento.

También puede revisar el documento de arquitectura técnica para más detalles sobre cómo la capa de modelos se integra con el resto del sistema.