Extracción de frases clave
Contenidos
En un mundo conectado virtualmente, mantener la concentración en el trabajo o la educación es muy importante. Los estudios sugieren que muchas personas pierden la concentración en las reuniones virtuales en vivo o en las sesiones de las aulas virtuales después de aproximadamente 20 minutos. Por ello, muchas reuniones y aulas virtuales se graban para que la persona pueda verlas más tarde.
Podría ayudar si estas grabaciones pudieran ser analizadas, y se generara un informe detallado de la reunión o clase utilizando inteligencia artificial (IA). Este patrón de código explica cómo hacerlo. Dada una grabación de vídeo de la reunión o clase virtual, se explica cómo extraer el audio de un archivo de vídeo utilizando la biblioteca de código abierto FFmpeg, transcribir el audio para obtener notas dictadas por el hablante con modelos de lenguaje y acústica a texto entrenados a medida, y generar un informe de comprensión del lenguaje natural que consiste en la categoría, los conceptos, la emoción, las entidades, las palabras clave, el sentimiento, las frases más positivas y las nubes de palabras utilizando un tiempo de ejecución de Python Flask.
Extracción de verbos y frases verbales (SpaCy y Python)
Tengo un flujo/archivo de vídeo (o audio, creo que no es importante) que no contiene subtítulos. Pero tiene un discurso limpio en inglés. ¿Es posible detectar y extraer palabras de él. No necesito una precisión del 100%.
Si trabajas regularmente con el “dueño” de la voz, puedo recomendar Dragon de Nuance, que ofrece un reconocimiento de voz a texto muy preciso y con muy pocos errores, pero necesita cierta “calibración” para una voz específica.
También hay un reconocimiento de voz incorporado en Adobe Premiere que debería ser la forma más fácil de hacer subtítulos, ya que se integra en el flujo de trabajo de vídeo completo y permite el ajuste casi automático de la sincronización. Puedes encontrar un buen tutorial aquí.
Utilizamos un servicio en línea para hacer nuestros subtítulos. No es gratuito, pero es bastante barato, teniendo en cuenta la cantidad de trabajo que ahorra; desde luego, es más barato que pagar a personal de postproducción para que lo haga. Hay muchas empresas que ofrecen este servicio, con variaciones que van desde la transcripción completamente automática hasta la transcripción completamente humana. Por lo general, se quiere algún tipo de intervención humana porque las máquinas aún no hacen las cosas al 100%.
Extracción de voz de un vídeo con Python
Cloud Video Intelligence permite a los usuarios extraer información procesable de los archivos de vídeo sin necesidad de tener conocimientos de aprendizaje automático o visión artificial. A partir de nuestra biblioteca masiva de 20.000 etiquetas, analiza automáticamente el contenido de vídeo para identificar qué entidades hay en su contenido de vídeo y cuándo aparecen. Cloud Video Intelligence mejora con el tiempo a medida que se introducen nuevos conceptos y se mejora la precisión.
Automation Anywhere Bot Security es el primer marco de seguridad de bots del sector de RPA. En colaboración con expertos en ciberseguridad, Bot Security abarca cuatro (4) niveles progresivos de designación de seguridad.
Tutorial de PNL 5 – Extracción de frases de texto basada en reglas
Para empezar, abra Power BI Desktop y cargue el archivo de valores separados por comas (CSV) FabrikamComments.csv que descargó en Requisitos previos. Este archivo representa un día de actividad hipotética en el foro de soporte de una pequeña empresa ficticia.
Aparece el cuadro de diálogo Abrir. Navegue a su carpeta de Descargas, o a la carpeta donde descargó el archivo FabrikamComments.csv. Haga clic en FabrikamComments.csv y luego en el botón Abrir. Aparecerá el diálogo de importación de CSV.
Los datos de muestra contienen una columna de asunto y una columna de comentarios. Con la función Combinar columnas de Power BI Desktop, puede extraer frases clave de los datos de estas dos columnas, en lugar de sólo la columna de comentarios.
Ahora seleccione las columnas de asunto y comentario en la tabla. Es posible que tenga que desplazarse horizontalmente para ver estas columnas. Primero haga clic en la cabecera de la columna de asunto, luego mantenga pulsada la tecla Control y haga clic en la cabecera de la columna de comentarios.
También puede considerar la posibilidad de filtrar los mensajes en blanco mediante el filtro Eliminar vacíos, o eliminar los caracteres no imprimibles mediante la transformación Limpiar. Si sus datos contienen una columna como la columna spamscore en el archivo de muestra, puede omitir los comentarios “spam” utilizando un Filtro numérico.