Al igual que la última década fue todo sobre el móvil, la próxima década de Internet se centrará en el audio. Desde búsqueda por voz dictar a Asistentes de IA, el teclado eventualmente será reemplazado por nuestras voces. Lo que es una buena noticia para nuestras muñecas.

Sin embargo, el reconocimiento de voz para dictados y transcripciones sigue siendo muy impredecible. El líder de la industria es Continuar, y Google y Apple tienen una buena función de dictado integrada en Google Docs y Mac OS respectivamente. Pero en general, el reconocimiento de voz puede equivocarse mucho más que bien, especialmente si tiene un acento inusual.

Es por eso Nutria está haciendo olas. Es un servicio de transcripción de audio que realmente funciona y funciona muy bien. Aún mejor, no todas sus mejores ofertas están bloqueadas detrás de planes profesionales.

¿Qué es la nutria?

Cuando tenga un archivo de audio de una o más personas hablando, es posible que desee una versión escrita de esas conversaciones. ¿Quizás los desea para subtítulos de YouTube o quizás desea subirlos en línea con fines de SEO? ¿O quizás eres un estudiante con una grabación de audio de una conferencia y quieres una versión escrita?

Cualesquiera que sean sus circunstancias, existen muchas razones por las que es posible que desee utilizar un servicio de transcripción de audio. Pero hasta ahora, las opciones de inteligencia artificial eran notoriamente malas, y las empresas que se ofrecían a hacerlo por ti cobraban cantidades obscenas de dinero.

Pero ahora Otter está aquí para hacer que la transcripción sea asequible y esté disponible para todos. Es una máquina en línea impulsada por inteligencia artificial que tomará su archivo de audio y escupirá una versión escrita en muy poco tiempo. El tiempo exacto dependerá de la longitud de su archivo de audio, obviamente.

Antes de empezar … Cosas a tener en cuenta sobre la nutria

El servicio de transcripción de audio de Otter no será 100% perfecto porque:

  1. La gente tartamudea y cambia de dirección a mitad de una frase. Esto no suena tan mal cuando estás escuchando. Pero cuando lo ve por escrito, parece caótico.
  2. Otter a veces tiene problemas con la puntuación si la persona habla rápido y una oración se encuentra con otra. Entonces podría perderse el punto final.
  3. Si la persona tiene cierto acento, Otter puede malinterpretar un poco. De ahí el beneficio de la lista de vocabulario personalizada en el plan Pro.
  4. Algunas palabras se escribirán mal. Por ejemplo, la empresa Lyft puede estar mal escrita como ‘Lift’.

Registrarse en el servicio de transcripción de audio de Otter

El plan gratuito le ofrece 600 minutos de transcripción gratuita cada mes. Para los usuarios ocasionales, esto es más que suficiente. Sin embargo, si elige actualizar al plan Pro ($ 9,99 al mes o $ 99,99 al año), los beneficios son sorprendentes.

Esos 600 minutos se disparan hasta 6.000 minutos al mes, además de exportar las transcripciones a varios formatos de archivo (como PDF y DOCX), listas de vocabulario personalizadas (para mejorar la precisión de las transcripciones), sincronización de Dropbox y mucho más.

Pero para probar el servicio de transcripción de audio, 600 minutos es más de lo que necesitará. Ir el sitio web de Otter y regístrate. Puede crear una cuenta o registrarse con su cuenta de Google o Facebook.

Luego, en la configuración de la cuenta, puede conectar la cuenta a Google o Microsoft para traer su calendario y contactos. los Enfocar La integración es un buen toque: una vez que haya realizado una llamada de Zoom, el audio se enviará inmediatamente a Otter para su transcripción.

Cómo hacer tu primera transcripción con Otter

Para este artículo, usaré un archivo MP3 de un podcast que descargué. Pero también puede grabar a alguien hablando directamente en el sitio web de Otter y se transcribirá de esa manera.

  • Vaya a la página del panel principal y haga clic en importar audio / video en el lado derecho.
  • Aparecerá una ventana de carga donde puede navegar hasta la ubicación del archivo en su computadora, o arrastrarlo y soltarlo con su mouse o trackpad. Una vez que el archivo esté allí, comenzará a cargarse.
  • Cuando veas el Éxito estado, haga clic en Hecho y lo verá ‘procesando’.
  • Ahora es cuestión de esperar. Para este archivo de una hora, la transcripción de audio tomó 30 minutos. Siempre recibe una notificación por correo electrónico cuando la transcripción está lista. Para que pueda cargar el archivo de audio, iniciar el proceso, luego apagar todo y marcharse. Otter te avisará cuando esté listo.

La transcripción terminada

  • Cuando le digan que la transcripción está lista, regrese al sitio y haga clic en él en la página del tablero. Ahora lo verá, junto con útiles palabras clave y etiquetas. También puede crear un enlace para compartir para que otros lo vean.
  • Sin embargo, como dije, no será perfecto, por lo que verá errores de inmediato. Pero estos se pueden solucionar fácilmente haciendo clic en el azul EDITAR botón.
  • Ahora siga adelante y corrija los errores tipográficos en el sitio web de Otter y recuerde guardar todo.
  • Ahora es el momento de exportar el archivo. Haga clic en los tres puntos verticales y elija Exportar texto.
  • La versión gratuita solo le brinda versiones de archivos de texto o copia al portapapeles, junto con varias otras opciones, que no deben cambiarse, a menos que sea realmente necesario.

Lo bueno de Otter es su velocidad, así como el hecho de que su IA es lo suficientemente inteligente como para separar los diferentes altavoces en el audio. Son las pequeñas cosas las que cuentan.

Por Jason