Omnio

Omnio es el primer modelo de AI multimodal que comprende profundamente las conversaciones y el comportamiento humano a través del audio. Identifica a los hablantes, roles, emociones, sentimientos y estilos de habla, junto con sonidos y señales no verbales, ofreciendo una percepción auditiva sin igual.

Omnio

Descripción del producto

Omnio es el primer modelo de AI multimodal que comprende de manera integral tanto las conversaciones como el comportamiento humano a través del audio. Se destaca en la identificación de los hablantes, sus roles y las sutilezas de las interacciones, incluyendo emociones, sentimientos y estilos de habla. Omnio procesa señales de audio directamente, lo que permite una comprensión profunda del entorno auditivo. También admite una variedad de tareas específicas de la industria e integra flujos de trabajo empresariales para un impacto en el mundo real.

Funcionalidades principales

  • Comprende profundamente el audio y las conversaciones.
  • Identifica a los hablantes, roles, emociones y estilos de habla.
  • Reconoce sonidos y señales no verbales.
  • Rinde al mismo nivel que los principales modelos de AI de texto como GPT-4.

Casos de uso

  • Salud: Crear documentación médica.

Precio

  • La API de Omnio ofrece $5.00 en créditos gratis.
  • Tokens de entrada de texto: $2.00 por 1M
  • Tokens de salida de texto: $5.00 por 1M
  • Tokens de entrada de audio: $50.00 por 1M tokens
  • Tokens de salida de audio: $10.00 por 1M